numpy.random.Generator.negative_binomial#

方法

random.Generator.negative_binomial(n, p, size=None)#

从负二项分布中抽取样本.

样本是从具有指定参数的负二项分布中抽取的,`n` 次成功和 p 次成功概率,其中 n > 0 且 p 在区间 (0, 1] 内.

参数:
n浮点数或浮点数的类数组对象

分布的参数,> 0.

p浮点数或浮点数的类数组对象

分布的参数.必须满足 0 < p <= 1.

size整数或整数的元组,可选

输出形状.如果给定的形状是,例如,``(m, n, k)``,那么会抽取 m * n * k 个样本.如果大小是 None``(默认),当 ``np 都是标量时,返回一个单一值.否则,会抽取 np.broadcast(n, p).size 个样本.

返回:
outndarray 或标量

从参数化的负二项分布中抽取样本,其中每个样本等于 N,即在达到总共 n 次成功之前发生的失败次数.

备注

负二项分布的概率质量函数是

\[P(N;n,p) = \frac{\Gamma(N+n)}{N!\Gamma(n)}p^{n}(1-p)^{N},\]

其中 \(n\) 是成功的次数,:math:p 是成功的概率,:math:N+n 是试验的次数,:math:Gamma 是伽玛函数.当 \(n\) 是整数时,:math:frac{Gamma(N+n)}{N!Gamma(n)} = binom{N+n-1}{N},这是在概率质量函数中更常见的形式.负二项分布给出了在最后一次试验成功的情况下,N次失败的概率.

如果一个人反复掷骰子直到第三次出现”1”,那么在第三次”1”出现之前出现的非”1”数的概率分布是负二项分布.

因为此方法内部调用 Generator.poisson 并使用一个中间随机值,当 \(n\)\(p\) 的选择导致采样的中间分布的均值 + 10 倍标准差超过 Generator.poisson 方法的最大可接受值时,会引发 ValueError.这种情况发生在 \(p\) 太低(每次成功发生很多次失败)和 \(n\) 太大(允许很多次成功)时.因此,:math:n\(p\) 的值必须满足以下约束:

\[n\frac{1-p}{p}+10n\sqrt{n}\frac{1-p}{p}<2^{63}-1-10\sqrt{2^{63}-1},\]

方程的左侧是来自内部用作泊松样本的 \(lam\) 参数的伽马分布样本的导出均值 + 10 倍标准差,方程的右侧是 Generator.poisson\(lam\) 的最大值约束.

参考文献

[1]

Weisstein, Eric W. “负二项分布.” 来自 MathWorld–A Wolfram 网络资源. https://mathworld.wolfram.com/NegativeBinomialDistribution.html

[2]

Wikipedia, “负二项分布”, https://en.wikipedia.org/wiki/Negative_binomial_distribution

示例

从分布中抽取样本:

一个现实世界的例子.一家公司钻探野猫油勘探井,每口井的成功概率估计为0.1.每口井连续成功的概率是多少,即钻探5口井后、6口井后等单次成功的概率是多少?

>>> rng = np.random.default_rng()
>>> s = rng.negative_binomial(1, 0.1, 100000)
>>> for i in range(1, 11): 
...    probability = sum(s<i) / 100000.
...    print(i, "wells drilled, probability of one success =", probability)