numpy.random.Generator.negative_binomial#
方法
- random.Generator.negative_binomial(n, p, size=None)#
从负二项分布中抽取样本.
样本是从具有指定参数的负二项分布中抽取的,`n` 次成功和 p 次成功概率,其中 n > 0 且 p 在区间 (0, 1] 内.
- 参数:
- n浮点数或浮点数的类数组对象
分布的参数,> 0.
- p浮点数或浮点数的类数组对象
分布的参数.必须满足 0 < p <= 1.
- size整数或整数的元组,可选
输出形状.如果给定的形状是,例如,``(m, n, k)``,那么会抽取
m * n * k
个样本.如果大小是None``(默认),当 ``n
和p
都是标量时,返回一个单一值.否则,会抽取np.broadcast(n, p).size
个样本.
- 返回:
- outndarray 或标量
从参数化的负二项分布中抽取样本,其中每个样本等于 N,即在达到总共 n 次成功之前发生的失败次数.
备注
负二项分布的概率质量函数是
\[P(N;n,p) = \frac{\Gamma(N+n)}{N!\Gamma(n)}p^{n}(1-p)^{N},\]其中 \(n\) 是成功的次数,:math:p 是成功的概率,:math:N+n 是试验的次数,:math:Gamma 是伽玛函数.当 \(n\) 是整数时,:math:frac{Gamma(N+n)}{N!Gamma(n)} = binom{N+n-1}{N},这是在概率质量函数中更常见的形式.负二项分布给出了在最后一次试验成功的情况下,N次失败的概率.
如果一个人反复掷骰子直到第三次出现”1”,那么在第三次”1”出现之前出现的非”1”数的概率分布是负二项分布.
因为此方法内部调用
Generator.poisson
并使用一个中间随机值,当 \(n\) 和 \(p\) 的选择导致采样的中间分布的均值 + 10 倍标准差超过Generator.poisson
方法的最大可接受值时,会引发 ValueError.这种情况发生在 \(p\) 太低(每次成功发生很多次失败)和 \(n\) 太大(允许很多次成功)时.因此,:math:n 和 \(p\) 的值必须满足以下约束:\[n\frac{1-p}{p}+10n\sqrt{n}\frac{1-p}{p}<2^{63}-1-10\sqrt{2^{63}-1},\]方程的左侧是来自内部用作泊松样本的 \(lam\) 参数的伽马分布样本的导出均值 + 10 倍标准差,方程的右侧是
Generator.poisson
中 \(lam\) 的最大值约束.参考文献
[1]Weisstein, Eric W. “负二项分布.” 来自 MathWorld–A Wolfram 网络资源. https://mathworld.wolfram.com/NegativeBinomialDistribution.html
[2]Wikipedia, “负二项分布”, https://en.wikipedia.org/wiki/Negative_binomial_distribution
示例
从分布中抽取样本:
一个现实世界的例子.一家公司钻探野猫油勘探井,每口井的成功概率估计为0.1.每口井连续成功的概率是多少,即钻探5口井后、6口井后等单次成功的概率是多少?
>>> rng = np.random.default_rng() >>> s = rng.negative_binomial(1, 0.1, 100000) >>> for i in range(1, 11): ... probability = sum(s<i) / 100000. ... print(i, "wells drilled, probability of one success =", probability)