dask.array.random.负二项分布
dask.array.random.负二项分布¶
- dask.array.random.negative_binomial(*args, **kwargs)¶
从负二项分布中抽取样本。
此文档字符串是从 numpy.random.mtrand.RandomState.negative_binomial 复制的。
Dask 版本可能存在一些不一致性。
样本是从具有指定参数的负二项分布中抽取的,n 次成功和 p 成功概率,其中 n > 0 且 p 在区间 [0, 1] 内。
备注
新代码应使用 ~numpy.random.Generator 实例的 ~numpy.random.Generator.negative_binomial 方法;请参阅 Quick start。
- 参数
- n浮点数或浮点数的类数组对象
分布的参数,> 0。
- p浮点数或浮点数的类数组对象
分布的参数,>= 0 且 <= 1。
- 大小int 或 int 的元组,可选
输出形状。如果给定的形状是,例如,
(m, n, k)
,那么会抽取m * n * k
个样本。如果 size 是None``(默认),当 ``n
和p
都是标量时,返回一个单一值。否则,会抽取np.broadcast(n, p).size
个样本。
- 返回
- 出ndarray 或标量
从参数化的负二项分布中抽取样本,其中每个样本等于 N,即在达到总共 n 次成功之前发生的失败次数。
警告
此函数返回 C-long 数据类型,在 Windows 上是 32 位,在其他 64 位平台上是 64 位(在 32 位平台上是 32 位)。自 NumPy 2.0 起,NumPy 的默认整数在 32 位平台上是 32 位,在 64 位平台上是 64 位。
参见
random.Generator.negative_binomial
应用于新代码。
注释
负二项分布的概率质量函数是
\[P(N;n,p) = \frac{\Gamma(N+n)}{N!\Gamma(n)}p^{n}(1-p)^{N},\]其中 \(n\) 是成功的次数,\(p\) 是成功的概率,\(N+n\) 是试验的总次数,\(\Gamma\) 是伽马函数。当 \(n\) 为整数时,\(\frac{\Gamma(N+n)}{N!\Gamma(n)} = \binom{N+n-1}{N}\),这是该项在概率质量函数中更常见的形式。负二项分布给出了在最后一次试验成功的情况下,给定 n 次成功时 N 次失败的概率。
如果一个人反复掷骰子,直到第三次出现“1”,那么在第三次“1”出现之前出现的非“1”的次数的概率分布是负二项分布。
参考文献
- 1
Weisstein, Eric W. “负二项分布。” 来自 MathWorld–A Wolfram 网络资源。 https://mathworld.wolfram.com/NegativeBinomialDistribution.html
- 2
Wikipedia, “负二项分布”, https://en.wikipedia.org/wiki/Negative_binomial_distribution
示例
从分布中抽取样本:
一个现实世界的例子。一家公司钻探野猫石油勘探井,每口井的成功概率估计为0.1。每口井连续成功的概率是多少,即钻探5口井后、6口井后等,单次成功的概率是多少?
>>> s = np.random.negative_binomial(1, 0.1, 100000) >>> for i in range(1, 11): ... probability = sum(s<i) / 100000. ... print(i, "wells drilled, probability of one success =", probability)