poisson_means_test#
- scipy.stats.poisson_means_test(k1, n1, k2, n2, *, diff=0, alternative='two-sided')[源代码][源代码]#
执行泊松均值检验,即所谓的“E检验”。
这是一个对零假设的检验,该假设认为两个泊松分布的均值之差为 diff。样本作为在测量间隔(例如时间、空间、观测次数)内观察到的事件数 k1 和 k2 提供,间隔大小分别为 n1 和 n2。
- 参数:
- k1整数
从分布1观察到的事件数量。
- n1: float
来自分布1的样本大小。
- k2整数
从分布2观察到的事件数量。
- n2浮动
从分布2中抽取的样本大小。
- 差异float, 默认=0
样本分布之间假设的均值差异。
- 替代方案{‘双侧’, ‘小于’, ‘大于’}, 可选
定义备择假设。以下选项可用(默认是’双侧’):
‘双侧’: 分布均值之间的差异不等于 diff
‘less’: 分布均值之间的差异小于 diff
‘greater’: 分布均值之间的差异大于 diff
- 返回:
- 统计浮动
检验统计量(见 [1] 方程 3.3)。
- p值浮动
在零假设下,达到如此极端的检验统计量值的概率。
注释
设:
\[X_1 \sim \mbox{泊松}(\mathtt{n1}\lambda_1)\]是一个与…无关的随机变量
\[X_2 \sim \mbox{Poisson}(\mathtt{n2}\lambda_2)\]并设
k1
和k2
分别为 \(X_1\) 和 \(X_2\) 的观测值。然后poisson_means_test
使用大小分别为n1
和n2
的样本中的观测事件数k1
和k2
来检验原假设\[H_0: \lambda_1 - \lambda_2 = \mathtt{diff}\]E-test 的一个优点是它在小样本量下具有良好的功效,这可以降低采样成本 [1]。它已被评估并确定比可比的 C-test 更有功效,有时被称为泊松精确检验。
参考文献
[2]Przyborowski, J., & Wilenski, H. (1940). 泊松级数样本测试结果的同质性:以测试菟丝子对三叶草种子的影响为例。生物计量学, 31(3/4), 313-323.
示例
假设一个园丁希望测试他们从种子公司购买的苜蓿种子袋中菟丝子(杂草)种子的数量。已经确定苜蓿中菟丝子种子的数量遵循泊松分布。
从袋中抽取一个100克的样品,在运送给园丁之前进行分析。分析发现样品中不含菟丝子种子;即 k1 为 0。然而,到达后,园丁从袋中再次抽取一个100克的样品。这次,样品中发现三粒菟丝子种子;即 k2 为 3。园丁想知道这种差异是否显著,而非偶然。零假设是两个样品之间的差异仅仅是由于偶然,或者 \(\lambda_1 - \lambda_2 = \mathtt{diff}\) 其中 \(\mathtt{diff} = 0\)。备择假设是差异并非由于偶然,或者 \(\lambda_1 - \lambda_2 \ne 0\)。园丁选择5%的显著性水平来拒绝零假设,以支持备择假设 [2]。
>>> import scipy.stats as stats >>> res = stats.poisson_means_test(0, 100, 3, 100) >>> res.statistic, res.pvalue (-1.7320508075688772, 0.08837900929018157)
p值为0.088,表明在零假设下观察到测试统计量值的概率接近9%。这超过了5%,因此园丁不拒绝零假设,因为在此水平上差异不能被视为显著。