numpy.nanvar#
- numpy.nanvar(a, axis=None, dtype=None, out=None, ddof=0, keepdims=<no value>, *, where=<no value>, mean=<no value>, correction=<no value>)[源代码]#
计算指定轴上的方差,同时忽略 NaNs.
返回数组元素的方差,这是分布扩散程度的一个度量.默认情况下,方差是为展平的数组计算的,否则在指定的轴上计算.
对于所有-NaN切片或自由度为零的切片,返回NaN并引发`RuntimeWarning`.
在 1.8.0 版本加入.
- 参数:
- aarray_like
包含所需方差的数字的数组.如果 a 不是数组,则尝试进行转换.
- axis{int, tuple of int, None}, 可选
计算方差的轴或轴.默认是计算展平数组的方差.
- dtype数据类型, 可选
计算方差时使用的类型.对于整数类型的数组,默认值为
float64
;对于浮点类型的数组,它与数组类型相同.- outndarray, 可选
要在其中放置结果的备用输出数组.它必须具有与预期输出相同的形状,但如果需要,类型会被转换.
- ddof{int, float}, 可选
“自由度增量”:计算中使用的除数是
N - ddof
,其中N
表示非 NaN 元素的数量.默认情况下 ddof 为零.- keepdims布尔值, 可选
如果设置为 True,被减少的轴将作为尺寸为1的维度保留在结果中.使用此选项,结果将正确地与原始 a 进行广播.
- where类数组的布尔值,可选
要在方差中包含的元素.详情请参见
reduce
.在 1.22.0 版本加入.
- meanarray_like, 可选
提供防止其重新计算的方法.均值应具有与使用
keepdims=True
计算时相同的形状.用于计算均值的轴应与在此 var 函数调用中使用的轴相同.在 1.26.0 版本加入.
- correction{int, float}, 可选
ddof
参数的 Array API 兼容名称.它们中只能同时提供一个.在 2.0.0 版本加入.
- 返回:
- variancendarray,见上面的dtype参数
如果 out 是 None,返回一个包含方差的新数组,否则返回对输出数组的引用.如果 ddof 大于等于一个切片中非 NaN 元素的数量,或者切片仅包含 NaNs,则该切片的返回结果为 NaN.
备注
方差是均值的平方偏差的平均值,即
var = mean(abs(x - x.mean())**2)
.均值通常计算为
x.sum() / N
,其中N = len(x)
.然而,如果指定了 ddof,则使用除数N - ddof
.在标准的统计实践中,``ddof=1`` 提供了对假设无限总体方差的无偏估计.``ddof=0`` 提供了对正态分布变量方差的最大似然估计.请注意,对于复数,绝对值在平方之前被取,因此结果总是实数且非负.
对于浮点输入,方差是使用与输入相同的精度计算的.根据输入数据的不同,这可能导致结果不准确,特别是对于 float32`(见下面的示例).使用 ``dtype` 关键字指定更高精度的累加器可以缓解这个问题.
为了使这个函数在 ndarray 的子类上工作,它们必须使用 keepdims 关键字参数定义
sum
.示例
>>> import numpy as np >>> a = np.array([[1, np.nan], [3, 4]]) >>> np.nanvar(a) 1.5555555555555554 >>> np.nanvar(a, axis=0) array([1., 0.]) >>> np.nanvar(a, axis=1) array([0., 0.25]) # may vary