dask_expr._collection.DataFrame.std
dask_expr._collection.DataFrame.std¶
- DataFrame.std(axis=0, skipna=True, ddof=1, numeric_only=False, split_every=False, **kwargs)¶
返回请求轴上的样本标准差。
此文档字符串是从 pandas.core.frame.DataFrame.std 复制而来的。
Dask 版本可能存在一些不一致性。
默认情况下按 N-1 归一化。这可以通过使用 ddof 参数来更改。
- 参数
- 轴{索引 (0), 列 (1)}
对于 Series,此参数未使用,默认值为 0。
警告
使用
axis=None
的 DataFrame.std 行为已被弃用,在未来的版本中,这将减少两个轴并返回一个标量。要保留旧的行为,请传递 axis=0(或不传递 axis)。- skipnabool, 默认 True
排除NA/空值。如果整行/整列都是NA,结果将是NA。
- ddofint, 默认值为 1
自由度增量。计算中使用的除数是 N - ddof,其中 N 表示元素的数量。
- 仅数值bool, 默认 False
仅包含浮点数、整数、布尔类型的列。对 Series 尚未实现。
- 返回
- 序列或数据框(如果指定了级别)
注释
要获得与 numpy.std 相同的行为,请使用 ddof=0`(而不是默认的 `ddof=1)
示例
>>> df = pd.DataFrame({'person_id': [0, 1, 2, 3], ... 'age': [21, 25, 62, 43], ... 'height': [1.61, 1.87, 1.49, 2.01]} ... ).set_index('person_id') >>> df age height person_id 0 21 1.61 1 25 1.87 2 62 1.49 3 43 2.01
列的标准偏差可以如下找到:
>>> df.std() age 18.786076 height 0.237417 dtype: float64
或者,可以设置 ddof=0 以通过 N 而不是 N-1 进行归一化:
>>> df.std(ddof=0) age 16.269219 height 0.205609 dtype: float64