dask.dataframe.DataFrame.sem

dask.dataframe.DataFrame.sem

DataFrame.sem(axis=None, skipna=True, ddof=1, split_every=False, numeric_only=None)

返回请求轴上的无偏标准误差。

此文档字符串是从 pandas.core.frame.DataFrame.sem 复制而来的。

Dask 版本可能存在一些不一致性。

默认情况下按 N-1 归一化。这可以通过使用 ddof 参数来更改。

参数
{索引 (0), 列 (1)}

对于 Series,此参数未使用,默认值为 0。

警告

DataFrame.sem 在 axis=None 时的行为已被弃用,在未来的版本中,这将同时对两个轴进行缩减并返回一个标量。要保留旧的行为,请传递 axis=0(或不传递 axis)。

skipnabool, 默认 True

排除NA/空值。如果整行/整列都是NA,结果将是NA。

ddofint, 默认值为 1

自由度增量。计算中使用的除数是 N - ddof,其中 N 表示元素的数量。

仅数值bool, 默认 False

仅包含浮点数、整数、布尔类型的列。对 Series 尚未实现。

返回
序列或数据框(如果指定了级别)

示例

>>> s = pd.Series([1, 2, 3])  
>>> s.sem().round(6)  
0.57735

使用一个 DataFrame

>>> df = pd.DataFrame({'a': [1, 2], 'b': [2, 3]}, index=['tiger', 'zebra'])  
>>> df  
       a   b
tiger  1   2
zebra  2   3
>>> df.sem()  
a   0.5
b   0.5
dtype: float64

使用 axis=1

>>> df.sem(axis=1)  
tiger   0.5
zebra   0.5
dtype: float64

在这种情况下,应将 numeric_only 设置为 True 以避免出现错误。

>>> df = pd.DataFrame({'a': [1, 2], 'b': ['T', 'Z']},  
...                   index=['tiger', 'zebra'])
>>> df.sem(numeric_only=True)  
a   0.5
dtype: float64