numpy.nanstd#
- numpy.nanstd(a, axis=None, dtype=None, out=None, ddof=0, keepdims=<no value>, *, where=<no value>, mean=<no value>, correction=<no value>)[源代码]#
计算指定轴上的标准差,同时忽略 NaNs.
返回非NaN数组元素的标准差,这是分布扩散程度的一种度量.默认情况下,标准差是为展平的数组计算的,否则在指定的轴上计算.
对于所有-NaN 切片或自由度为零的切片,返回 NaN 并引发 RuntimeWarning.
在 1.8.0 版本加入.
- 参数:
- aarray_like
计算非NaN值的标准差.
- axis{int, int 的元组, None}, 可选
计算标准差的轴或轴.默认是计算展平数组的标准差.
- dtypedtype,可选
用于计算标准差的类型.对于整数类型的数组,默认是 float64,对于浮点类型的数组,它与数组类型相同.
- outndarray, 可选
要在其中放置结果的替代输出数组.它必须具有与预期输出相同的形状,但如果需要,将转换计算值的类型.
- ddof{int, float}, 可选
表示自由度的Delta值.计算中使用的除数是
N - ddof
,其中N
表示非NaN元素的数量.默认情况下 ddof 为零.- keepdimsbool, 可选
如果设置为 True,被减少的轴将作为尺寸为1的维度保留在结果中.使用此选项,结果将正确地与原始 a 广播.
如果这个值不是默认值,它将按原样传递给子类的相关函数.如果这些函数没有 keepdims kwarg,将引发 RuntimeError.
- where类数组的布尔值,可选
包含在标准偏差中的元素.详见
reduce
.在 1.22.0 版本加入.
- mean类似数组, 可选
提供防止其重新计算的方法.均值应具有与使用
keepdims=True
计算时相同的形状.用于计算均值的轴应与调用此标准差函数时使用的轴相同.在 1.26.0 版本加入.
- correction{int, float}, 可选
ddof
参数的 Array API 兼容名称.它们中只能同时提供一个.在 2.0.0 版本加入.
- 返回:
- standard_deviationndarray,见上面的 dtype 参数.
如果 out 是 None,返回一个包含标准差的新数组,否则返回对输出数组的引用.如果 ddof 大于等于一个切片中非 NaN 元素的数量,或者切片仅包含 NaNs,则该切片的结果为 NaN.
备注
标准差是均值的平方偏差的平均值的平方根:
std = sqrt(mean(abs(x - x.mean())**2))
.平均平方偏差通常计算为
x.sum() / N
,其中N = len(x)
.然而,如果指定了 ddof,则使用除数N - ddof
代替.在标准统计实践中,``ddof=1`` 提供了无限总体方差的无偏估计量.``ddof=0`` 提供了正态分布变量方差的最大似然估计.此函数中计算的标准偏差是估计方差的平方根,因此即使使用ddof=1
,它也不是标准偏差本身的无偏估计.注意,对于复数,`std` 在平方之前取绝对值,因此结果总是实数且非负.
对于浮点输入,*std* 使用与输入相同的精度进行计算.根据输入数据的不同,这可能导致结果不准确,特别是对于 float32(见下面的示例).使用
dtype
关键字指定更高精度的累加器可以缓解这个问题.示例
>>> import numpy as np >>> a = np.array([[1, np.nan], [3, 4]]) >>> np.nanstd(a) 1.247219128924647 >>> np.nanstd(a, axis=0) array([1., 0.]) >>> np.nanstd(a, axis=1) array([0., 0.5]) # may vary