numpy.random.binomial#
- random.binomial(n, p, size=None)#
从二项分布中抽取样本.
样本是从具有指定参数的二项分布中抽取的,n 次试验和 p 次成功概率,其中 n 是一个 >= 0 的整数,p 在区间 [0,1] 内.(n 可以作为浮点数输入,但在使用时会被截断为整数)
- 参数:
- n整数或整数的类数组对象
分布的参数,>= 0.也接受浮点数,但它们将被截断为整数.
- p浮点数或浮点数的类数组对象
分布的参数,>= 0 且 <= 1.
- size整数或整数的元组,可选
输出形状.如果给定的形状是,例如,``(m, n, k)``,那么会抽取
m * n * k
个样本.如果大小是None``(默认),当 ``n
和p
都是标量时,返回一个单一值.否则,会抽取np.broadcast(n, p).size
个样本.
- 返回:
- outndarray 或标量
从参数化的二项分布中抽取样本,其中每个样本等于n次试验中的成功次数.
参见
scipy.stats.binom
概率密度函数、分布或累积密度函数等.
random.Generator.binomial
应该用于新代码.
备注
二项分布的概率密度为
\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]其中 \(n\) 是试验次数,:math:p 是成功的概率,:math:N 是成功的次数.
在通过使用随机样本估计总体中比例的标准误差时,除非 p*n <=5,其中 p = 总体比例估计值,n = 样本数量,否则正态分布效果良好,在这种情况下应改用二项分布.例如,一个15人的样本显示4人是左撇子,11人是右撇子.那么 p = 4/15 = 27%.0.27*15 = 4,所以在这种情况下应使用二项分布.
参考文献
[1]Dalgaard, Peter, “Introductory Statistics with R”, Springer-Verlag, 2002.
[2]Glantz, Stanton A. “生物统计学入门.”, McGraw-Hill, 第五版, 2002.
[3]Lentner, Marvin, “Elementary Applied Statistics”, Bogden and Quigley, 1972.
[4]Weisstein, Eric W. “二项分布.” 来自 MathWorld–A Wolfram 网络资源. https://mathworld.wolfram.com/BinomialDistribution.html
[5]Wikipedia, “二项分布”, https://en.wikipedia.org/wiki/Binomial_distribution
示例
从分布中抽取样本:
>>> n, p = 10, .5 # number of trials, probability of each trial >>> s = np.random.binomial(n, p, 1000) # result of flipping a coin 10 times, tested 1000 times.
一个现实世界的例子.一家公司钻探了9个野猫油勘探井,每个井的成功估计概率为0.1.所有九个井都失败了.这种情况发生的概率是多少?
让我们进行20,000次模型试验,并计算产生零正面结果的次数.
>>> sum(np.random.binomial(9, 0.1, 20000) == 0)/20000. # answer = 0.38885, or 38%.