scipy.stats.

cumfreq#

scipy.stats.cumfreq(a, numbins=10, defaultreallimits=None, weights=None)[源代码][源代码]#

返回一个累积频率直方图,使用直方图函数。

累积直方图是一种映射,它计算所有到指定区间为止的区间内的累积观察次数。

参数:
aarray_like

输入数组。

numbinsint, 可选

用于直方图的箱数。默认值为10。

defaultreallimits元组 (下限, 上限), 可选

直方图范围的下限和上限。如果没有给出值,则使用比 a 中的值范围稍大的范围。具体来说 (a.min() - s, a.max() + s),其中 s = (1/2)(a.max() - a.min()) / (numbins - 1)

权重类似数组, 可选

a 中每个值的权重。默认是 None,表示每个值的权重为 1.0。

返回:
cumcountndarray

累积频率的分箱值。

下限浮动

下真实极限

binsize浮动

每个箱子的宽度。

额外积分整数

额外积分。

示例

>>> import numpy as np
>>> import matplotlib.pyplot as plt
>>> from scipy import stats
>>> rng = np.random.default_rng()
>>> x = [1, 4, 2, 1, 3, 1]
>>> res = stats.cumfreq(x, numbins=4, defaultreallimits=(1.5, 5))
>>> res.cumcount
array([ 1.,  2.,  3.,  3.])
>>> res.extrapoints
3

创建一个包含1000个随机值的正态分布

>>> samples = stats.norm.rvs(size=1000, random_state=rng)

计算累积频率

>>> res = stats.cumfreq(samples, numbins=25)

计算 x 的值域

>>> x = res.lowerlimit + np.linspace(0, res.binsize*res.cumcount.size,
...                                  res.cumcount.size)

绘制直方图和累积直方图

>>> fig = plt.figure(figsize=(10, 4))
>>> ax1 = fig.add_subplot(1, 2, 1)
>>> ax2 = fig.add_subplot(1, 2, 2)
>>> ax1.hist(samples, bins=25)
>>> ax1.set_title('Histogram')
>>> ax2.bar(x, res.cumcount, width=res.binsize)
>>> ax2.set_title('Cumulative histogram')
>>> ax2.set_xlim([x.min(), x.max()])
>>> plt.show()
../../_images/scipy-stats-cumfreq-1.png