scipy.stats.

pmean#

scipy.stats.pmean(a, p, *, axis=0, dtype=None, weights=None, nan_policy='propagate', keepdims=False)[源代码][源代码]#

计算沿指定轴的加权幂平均值。

数组 \(a_i\) 与权重 \(w_i\) 相关的加权幂均值为:

\[\left( \frac{ \sum_{i=1}^n w_i a_i^p }{ \sum_{i=1}^n w_i } \right)^{ 1 / p } \, ,\]

并且,在同等权重下,它给出:

\[\left( \frac{ 1 }{ n } \sum_{i=1}^n a_i^p \right)^{ 1 / p } \, .\]

p=0 时,它返回几何平均值。

这种均值也称为广义均值或Hölder均值,不应与Kolmogorov广义均值(也称为拟算术均值或广义f-均值)混淆 [3]

参数:
aarray_like

输入数组、掩码数组或可转换为数组的对象。

pint 或 float

指数。

int 或 None, 默认值: 0

如果是一个整数,表示输入数据中要计算统计量的轴。输入数据的每个轴切片(例如行)的统计量将出现在输出的相应元素中。如果为 None,则在计算统计量之前会将输入数据展平。

dtypedtype, 可选

返回的数组类型以及累加器中元素相加的类型。如果未指定 dtype,则默认为 a 的 dtype,除非 a 具有精度低于默认平台整数的整数 dtype。在这种情况下,使用默认平台整数。

权重类似数组, 可选

权重数组可以是1-D的(在这种情况下,其长度必须与`a`沿给定`轴`的大小相同),或者是与`a`相同形状的数组。默认值为None,表示每个值的权重为1.0。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入的 NaN。

  • propagate: 如果在计算统计量的轴切片(例如行)中存在 NaN,则输出的相应条目将为 NaN。

  • omit: 在执行计算时,NaN 将被省略。如果在计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。

  • raise: 如果存在 NaN,将引发 ValueError

keepdimsbool, 默认值: False

如果设置为True,被减少的轴将作为尺寸为1的维度保留在结果中。通过此选项,结果将正确地与输入数组进行广播。

返回:
pmean : ndarray, 见上文的 dtype 参数。ndarray, 参见

输出数组,包含幂均值。

参见

numpy.average

加权平均

gmean

几何平均数

hmean

调和平均数

注释

幂均值是根据输入数组的单个维度计算的,默认情况下为 axis=0,如果 axis=None,则为数组中的所有值。整数输入使用 float64 中间值和返回值。

Added in version 1.9.

从 SciPy 1.9 开始,np.matrix 输入(不推荐用于新代码)在计算执行前被转换为 np.ndarray。在这种情况下,输出将是一个标量或适当形状的 np.ndarray,而不是一个 2D 的 np.matrix。同样,虽然掩码数组的掩码元素被忽略,但输出将是一个标量或 np.ndarray,而不是一个 mask=False 的掩码数组。

参考文献

[1]

“广义均值”,维基百科https://en.wikipedia.org/wiki/Generalized_mean

[2]

Norris, N., “广义均值函数的凸性性质”, 《数理统计年鉴》, 第8卷, 第118-120页, 1937年

[3]

Bullen, P.S., 《均值及其不等式手册》, 2003

示例

>>> from scipy.stats import pmean, hmean, gmean
>>> pmean([1, 4], 1.3)
2.639372938300652
>>> pmean([1, 2, 3, 4, 5, 6, 7], 1.3)
4.157111214492084
>>> pmean([1, 4, 7], -2, weights=[3, 1, 3])
1.4969684896631954

对于 p=-1,幂平均等于调和平均:

>>> pmean([1, 4, 7], -1, weights=[3, 1, 3])
1.9029126213592233
>>> hmean([1, 4, 7], weights=[3, 1, 3])
1.9029126213592233

对于 p=0,幂平均定义为几何平均:

>>> pmean([1, 4, 7], 0, weights=[3, 1, 3])
2.80668351922014
>>> gmean([1, 4, 7], weights=[3, 1, 3])
2.80668351922014