numpy.nanvar#

numpy.nanvar(a, axis=None, dtype=None, out=None, ddof=0, keepdims=<no value>, *, where=<no value>, mean=<no value>, correction=<no value>)[源代码]#

计算指定轴上的方差,同时忽略 NaNs.

返回数组元素的方差,这是分布扩散程度的一个度量.默认情况下,方差是为展平的数组计算的,否则在指定的轴上计算.

对于所有-NaN切片或自由度为零的切片,返回NaN并引发`RuntimeWarning`.

在 1.8.0 版本加入.

参数:

aarray_like: 包含所需方差的数字的数组.如果 a 不是数组,则尝试进行转换.
axis{int, tuple of int, None}, 可选: 计算方差的轴或轴.默认是计算展平数组的方差.
dtype数据类型, 可选: 计算方差时使用的类型.对于整数类型的数组,默认值为 float64;对于浮点类型的数组,它与数组类型相同.
outndarray, 可选: 要在其中放置结果的备用输出数组.它必须具有与预期输出相同的形状,但如果需要,类型会被转换.
ddof{int, float}, 可选: “自由度增量”:计算中使用的除数是 N - ddof,其中 N 表示非 NaN 元素的数量.默认情况下 ddof 为零.
keepdims布尔值, 可选: 如果设置为 True,被减少的轴将作为尺寸为1的维度保留在结果中.使用此选项,结果将正确地与原始 a 进行广播.
where类数组的布尔值,可选: 要在方差中包含的元素.详情请参见 reduce.

在 1.22.0 版本加入.
meanarray_like, 可选: 提供防止其重新计算的方法.均值应具有与使用 keepdims=True 计算时相同的形状.用于计算均值的轴应与在此 var 函数调用中使用的轴相同.

在 1.26.0 版本加入.
correction{int, float}, 可选: ddof 参数的 Array API 兼容名称.它们中只能同时提供一个.

在 2.0.0 版本加入.

返回:

variancendarray,见上面的dtype参数: 如果 out 是 None,返回一个包含方差的新数组,否则返回对输出数组的引用.如果 ddof 大于等于一个切片中非 NaN 元素的数量,或者切片仅包含 NaNs,则该切片的返回结果为 NaN.

参见

std: 标准差
mean: 平均
var: 在不忽略 NaNs 的情况下计算方差
nanstd, nanmean
输出类型确定

备注

方差是均值的平方偏差的平均值,即 var = mean(abs(x - x.mean())**2).

均值通常计算为 x.sum() / N,其中 N = len(x).然而,如果指定了 ddof,则使用除数 N - ddof.在标准的统计实践中,``ddof=1`` 提供了对假设无限总体方差的无偏估计.``ddof=0`` 提供了对正态分布变量方差的最大似然估计.

请注意,对于复数,绝对值在平方之前被取,因此结果总是实数且非负.

对于浮点输入,方差是使用与输入相同的精度计算的.根据输入数据的不同,这可能导致结果不准确,特别是对于 float32`（见下面的示例）.使用 ``dtype` 关键字指定更高精度的累加器可以缓解这个问题.

为了使这个函数在 ndarray 的子类上工作,它们必须使用 keepdims 关键字参数定义 sum.

示例

>>> import numpy as np
>>> a = np.array([[1, np.nan], [3, 4]])
>>> np.nanvar(a)
1.5555555555555554
>>> np.nanvar(a, axis=0)
array([1.,  0.])
>>> np.nanvar(a, axis=1)
array([0.,  0.25])  # may vary