numpy.random.Generator.chisquare#
方法
- random.Generator.chisquare(df, size=None)#
从卡方分布中抽取样本.
当 df 个独立的随机变量,每个都具有标准正态分布(均值0,方差1),被平方并求和时,得到的分布是卡方分布(见注释).这种分布常用于假设检验.
- 参数:
- df浮点数或浮点数的类数组对象
自由度的数量,必须大于0.
- size整数或整数的元组,可选
输出形状.如果给定的形状是,例如,``(m, n, k)``,那么会抽取
m * n * k
个样本.如果大小是None``(默认),如果 ``df
是标量,则返回单个值.否则,会抽取np.array(df).size
个样本.
- 返回:
- outndarray 或标量
从参数化的卡方分布中抽取样本.
- 引发:
- ValueError
当 df <= 0 或当给定不适当的 size (例如
size=-1
)时.
备注
通过将 df 个独立的标准正态分布随机变量的平方和得到的变量:
\[Q = \sum_{i=0}^{\mathtt{df}} X^2_i\]是卡方分布的,记作
\[ \begin{align}\begin{aligned}Q \sim \chi^2_k.\\Q 服从 \chi^2_k 分布.\end{aligned}\end{align} \]卡方分布的概率密度函数是
\[p(x) = \frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2},\]其中 \(\Gamma\) 是伽玛函数,
\[\Gamma(x) = \int_0^{-\infty} t^{x - 1} e^{-t} dt.\]参考文献
[1]NIST “工程统计手册” https://www.itl.nist.gov/div898/handbook/eda/section3/eda3666.htm
示例
>>> rng = np.random.default_rng() >>> rng.chisquare(2,4) array([ 1.89920014, 9.00867716, 3.13710533, 5.62318272]) # random
具有20个自由度的卡方随机变量的分布如下所示:
>>> import matplotlib.pyplot as plt >>> import scipy.stats as stats >>> s = rng.chisquare(20, 10000) >>> count, bins, _ = plt.hist(s, 30, density=True) >>> x = np.linspace(0, 60, 1000) >>> plt.plot(x, stats.chi2.pdf(x, df=20)) >>> plt.xlim([0, 60]) >>> plt.show()