dask.dataframe.DataFrame.sem

dask.dataframe.DataFrame.sem¶

DataFrame.sem(axis=None, skipna=True, ddof=1, split_every=False, numeric_only=None)¶

返回请求轴上的无偏标准误差。

此文档字符串是从 pandas.core.frame.DataFrame.sem 复制而来的。

Dask 版本可能存在一些不一致性。

默认情况下按 N-1 归一化。这可以通过使用 ddof 参数来更改。

参数

轴{索引 (0), 列 (1)}: 对于 Series，此参数未使用，默认值为 0。

警告

DataFrame.sem 在 axis=None 时的行为已被弃用，在未来的版本中，这将同时对两个轴进行缩减并返回一个标量。要保留旧的行为，请传递 axis=0（或不传递 axis）。
skipnabool, 默认 True: 排除NA/空值。如果整行/整列都是NA，结果将是NA。
ddofint, 默认值为 1: 自由度增量。计算中使用的除数是 N - ddof，其中 N 表示元素的数量。
仅数值bool, 默认 False: 仅包含浮点数、整数、布尔类型的列。对 Series 尚未实现。

返回

序列或数据框（如果指定了级别）

示例

>>> s = pd.Series([1, 2, 3])  
>>> s.sem().round(6)  
0.57735

使用一个 DataFrame

>>> df = pd.DataFrame({'a': [1, 2], 'b': [2, 3]}, index=['tiger', 'zebra'])  
>>> df  
       a   b
tiger  1   2
zebra  2   3
>>> df.sem()  
a   0.5
b   0.5
dtype: float64

使用 axis=1

>>> df.sem(axis=1)  
tiger   0.5
zebra   0.5
dtype: float64

在这种情况下，应将 numeric_only 设置为 True 以避免出现错误。

>>> df = pd.DataFrame({'a': [1, 2], 'b': ['T', 'Z']},  
...                   index=['tiger', 'zebra'])
>>> df.sem(numeric_only=True)  
a   0.5
dtype: float64

dask.dataframe.DataFrame.select_dtypes

dask.dataframe.DataFrame.set_index