scipy.stats.

poisson_means_test#

scipy.stats.poisson_means_test(k1, n1, k2, n2, *, diff=0, alternative='two-sided')[源代码][源代码]#

执行泊松均值检验,即所谓的“E检验”。

这是一个对零假设的检验,该假设认为两个泊松分布的均值之差为 diff。样本作为在测量间隔(例如时间、空间、观测次数)内观察到的事件数 k1k2 提供,间隔大小分别为 n1n2

参数:
k1整数

从分布1观察到的事件数量。

n1: float

来自分布1的样本大小。

k2整数

从分布2观察到的事件数量。

n2浮动

从分布2中抽取的样本大小。

差异float, 默认=0

样本分布之间假设的均值差异。

替代方案{‘双侧’, ‘小于’, ‘大于’}, 可选

定义备择假设。以下选项可用(默认是’双侧’):

  • ‘双侧’: 分布均值之间的差异不等于 diff

  • ‘less’: 分布均值之间的差异小于 diff

  • ‘greater’: 分布均值之间的差异大于 diff

返回:
统计浮动

检验统计量(见 [1] 方程 3.3)。

p值浮动

在零假设下,达到如此极端的检验统计量值的概率。

注释

设:

\[X_1 \sim \mbox{泊松}(\mathtt{n1}\lambda_1)\]

是一个与…无关的随机变量

\[X_2 \sim \mbox{Poisson}(\mathtt{n2}\lambda_2)\]

并设 k1k2 分别为 \(X_1\)\(X_2\) 的观测值。然后 poisson_means_test 使用大小分别为 n1n2 的样本中的观测事件数 k1k2 来检验原假设

\[H_0: \lambda_1 - \lambda_2 = \mathtt{diff}\]

E-test 的一个优点是它在小样本量下具有良好的功效,这可以降低采样成本 [1]。它已被评估并确定比可比的 C-test 更有功效,有时被称为泊松精确检验。

参考文献

[1] (1,2)

Krishnamoorthy, K., & Thomson, J. (2004). 一种更强大的比较两个泊松均值的检验方法。统计规划与推断杂志, 119(1), 23-35.

[2]

Przyborowski, J., & Wilenski, H. (1940). 泊松级数样本测试结果的同质性:以测试菟丝子对三叶草种子的影响为例。生物计量学, 31(3/4), 313-323.

示例

假设一个园丁希望测试他们从种子公司购买的苜蓿种子袋中菟丝子(杂草)种子的数量。已经确定苜蓿中菟丝子种子的数量遵循泊松分布。

从袋中抽取一个100克的样品,在运送给园丁之前进行分析。分析发现样品中不含菟丝子种子;即 k1 为 0。然而,到达后,园丁从袋中再次抽取一个100克的样品。这次,样品中发现三粒菟丝子种子;即 k2 为 3。园丁想知道这种差异是否显著,而非偶然。零假设是两个样品之间的差异仅仅是由于偶然,或者 \(\lambda_1 - \lambda_2 = \mathtt{diff}\) 其中 \(\mathtt{diff} = 0\)。备择假设是差异并非由于偶然,或者 \(\lambda_1 - \lambda_2 \ne 0\)。园丁选择5%的显著性水平来拒绝零假设,以支持备择假设 [2]

>>> import scipy.stats as stats
>>> res = stats.poisson_means_test(0, 100, 3, 100)
>>> res.statistic, res.pvalue
(-1.7320508075688772, 0.08837900929018157)

p值为0.088,表明在零假设下观察到测试统计量值的概率接近9%。这超过了5%,因此园丁不拒绝零假设,因为在此水平上差异不能被视为显著。