scipy.stats.
cumfreq#
- scipy.stats.cumfreq(a, numbins=10, defaultreallimits=None, weights=None)[源代码][源代码]#
返回一个累积频率直方图,使用直方图函数。
累积直方图是一种映射,它计算所有到指定区间为止的区间内的累积观察次数。
- 参数:
- aarray_like
输入数组。
- numbinsint, 可选
用于直方图的箱数。默认值为10。
- defaultreallimits元组 (下限, 上限), 可选
直方图范围的下限和上限。如果没有给出值,则使用比 a 中的值范围稍大的范围。具体来说
(a.min() - s, a.max() + s)
,其中s = (1/2)(a.max() - a.min()) / (numbins - 1)
。- 权重类似数组, 可选
a 中每个值的权重。默认是 None,表示每个值的权重为 1.0。
- 返回:
- cumcountndarray
累积频率的分箱值。
- 下限浮动
下真实极限
- binsize浮动
每个箱子的宽度。
- 额外积分整数
额外积分。
示例
>>> import numpy as np >>> import matplotlib.pyplot as plt >>> from scipy import stats >>> rng = np.random.default_rng() >>> x = [1, 4, 2, 1, 3, 1] >>> res = stats.cumfreq(x, numbins=4, defaultreallimits=(1.5, 5)) >>> res.cumcount array([ 1., 2., 3., 3.]) >>> res.extrapoints 3
创建一个包含1000个随机值的正态分布
>>> samples = stats.norm.rvs(size=1000, random_state=rng)
计算累积频率
>>> res = stats.cumfreq(samples, numbins=25)
计算 x 的值域
>>> x = res.lowerlimit + np.linspace(0, res.binsize*res.cumcount.size, ... res.cumcount.size)
绘制直方图和累积直方图
>>> fig = plt.figure(figsize=(10, 4)) >>> ax1 = fig.add_subplot(1, 2, 1) >>> ax2 = fig.add_subplot(1, 2, 2) >>> ax1.hist(samples, bins=25) >>> ax1.set_title('Histogram') >>> ax2.bar(x, res.cumcount, width=res.binsize) >>> ax2.set_title('Cumulative histogram') >>> ax2.set_xlim([x.min(), x.max()])
>>> plt.show()