scipy.stats.

描述#

scipy.stats.describe(a, axis=0, ddof=1, bias=True, nan_policy='propagate')[源代码][源代码]#

计算传递数组的几个描述性统计数据。

参数:
aarray_like

输入数据。

int 或 None, 可选

计算统计数据的轴。默认值为 0。如果为 None,则在整个数组 a 上计算。

ddofint, 可选

Delta 自由度(仅用于方差)。默认值为 1。

偏见bool, 可选

如果为 False,则偏度和峰度的计算会针对统计偏差进行修正。

nan_policy{‘propagate’, ‘raise’, ‘omit’}, 可选

定义当输入包含 nan 时的处理方式。以下选项可用(默认是 ‘propagate’):

  • ‘propagate’: 返回 nan

  • ‘raise’: 抛出一个错误

  • ‘omit’: 执行计算时忽略 nan 值

返回:
nobsint 或 int 的 ndarray

观察次数(沿 axis 的数据长度)。当选择 ‘omit’ 作为 nan_policy 时,沿每个轴切片的计数是单独进行的。

minmax: ndarrays 或 floats 的元组

沿给定轴的 a 的最小值和最大值。

平均ndarray 或 float

沿给定轴的 a 的算术平均值。

方差ndarray 或 float

沿给定轴的 a 的无偏方差;分母是观测数减一。

偏度ndarray 或 float

沿着给定轴的 a 的偏度,基于分母等于观测数(即无自由度修正)的矩计算。

峰度ndarray 或 float

沿给定轴的 a 的峰度(Fisher)。峰度被归一化,因此对于正态分布,其值为零。没有使用自由度。

参见

skew, kurtosis

示例

>>> import numpy as np
>>> from scipy import stats
>>> a = np.arange(10)
>>> stats.describe(a)
DescribeResult(nobs=10, minmax=(0, 9), mean=4.5,
               variance=9.166666666666666, skewness=0.0,
               kurtosis=-1.2242424242424244)
>>> b = [[1, 2], [3, 4]]
>>> stats.describe(b)
DescribeResult(nobs=2, minmax=(array([1, 2]), array([3, 4])),
               mean=array([2., 3.]), variance=array([2., 2.]),
               skewness=array([0., 0.]), kurtosis=array([-2., -2.]))