dask.dataframe.DataFrame.sem
dask.dataframe.DataFrame.sem¶
- DataFrame.sem(axis=None, skipna=True, ddof=1, split_every=False, numeric_only=None)¶
返回请求轴上的无偏标准误差。
此文档字符串是从 pandas.core.frame.DataFrame.sem 复制而来的。
Dask 版本可能存在一些不一致性。
默认情况下按 N-1 归一化。这可以通过使用 ddof 参数来更改。
- 参数
- 轴{索引 (0), 列 (1)}
对于 Series,此参数未使用,默认值为 0。
警告
DataFrame.sem 在
axis=None
时的行为已被弃用,在未来的版本中,这将同时对两个轴进行缩减并返回一个标量。要保留旧的行为,请传递 axis=0(或不传递 axis)。- skipnabool, 默认 True
排除NA/空值。如果整行/整列都是NA,结果将是NA。
- ddofint, 默认值为 1
自由度增量。计算中使用的除数是 N - ddof,其中 N 表示元素的数量。
- 仅数值bool, 默认 False
仅包含浮点数、整数、布尔类型的列。对 Series 尚未实现。
- 返回
- 序列或数据框(如果指定了级别)
示例
>>> s = pd.Series([1, 2, 3]) >>> s.sem().round(6) 0.57735
使用一个 DataFrame
>>> df = pd.DataFrame({'a': [1, 2], 'b': [2, 3]}, index=['tiger', 'zebra']) >>> df a b tiger 1 2 zebra 2 3 >>> df.sem() a 0.5 b 0.5 dtype: float64
使用 axis=1
>>> df.sem(axis=1) tiger 0.5 zebra 0.5 dtype: float64
在这种情况下,应将 numeric_only 设置为 True 以避免出现错误。
>>> df = pd.DataFrame({'a': [1, 2], 'b': ['T', 'Z']}, ... index=['tiger', 'zebra']) >>> df.sem(numeric_only=True) a 0.5 dtype: float64