numpy.random.Generator.binomial#

方法

random.Generator.binomial(n, p, size=None)#

从二项分布中抽取样本.

样本是从具有指定参数的二项分布中抽取的,n 次试验和 p 次成功概率,其中 n 是一个 >= 0 的整数,p 在区间 [0,1] 内.（n 可以作为浮点数输入,但在使用时会被截断为整数）

参数:

n整数或整数的类数组: 分布的参数,>= 0.也接受浮点数,但它们将被截断为整数.
p浮点数或浮点数的类数组对象: 分布的参数,>= 0 且 <= 1.
size整数或整数的元组,可选: 输出形状.如果给定的形状是,例如,``(m, n, k)``,那么会抽取 m * n * k 个样本.如果大小是 None``（默认）,当 ``n 和 p 都是标量时,返回一个单一值.否则,会抽取 np.broadcast(n, p).size 个样本.

返回:

outndarray 或标量: 从参数化的二项分布中抽取样本,其中每个样本等于n次试验中的成功次数.

参见

scipy.stats.binom: 概率密度函数、分布或累积密度函数等.

备注

二项分布的概率密度为

\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]

其中 \(n\) 是试验次数,:math:p 是成功的概率,而 \(N\) 是成功的次数.

在通过使用随机样本估计总体中比例的标准误差时,除非 p*n <= 5,其中 p = 总体比例估计值,n = 样本数量,否则正态分布效果良好,在这种情况下应改用二项分布.例如,一个15人的样本显示4人是左撇子,11人是右撇子.那么 p = 4/15 = 27%.0.27*15 = 4,所以在这种情况下应使用二项分布.

参考文献

[1]

Dalgaard, Peter, “Introductory Statistics with R”, Springer-Verlag, 2002.

[2]

Glantz, Stanton A. “生物统计学入门.”, McGraw-Hill, 第五版, 2002.

[3]

Lentner, Marvin, “Elementary Applied Statistics”, Bogden and Quigley, 1972.

[4]

Weisstein, Eric W. “二项分布.” 来自 MathWorld–A Wolfram 网络资源. https://mathworld.wolfram.com/BinomialDistribution.html

[5]

Wikipedia, “二项分布”, https://en.wikipedia.org/wiki/Binomial_distribution

示例

从分布中抽取样本:

>>> rng = np.random.default_rng()
>>> n, p, size = 10, .5, 10000
>>> s = rng.binomial(n, p, 10000)

假设一家公司钻探了9口野猫油井勘探井,每口井的成功估计概率为 p=0.1.所有九口井都失败了.这种情况发生的概率是多少?

在 size = 20,000 次试验中,这种情况发生的概率平均为:

>>> n, p, size = 9, 0.1, 20000
>>> np.sum(rng.binomial(n=n, p=p, size=size) == 0)/size
0.39015  # may vary

以下可以用来可视化一个样本,其中 n=100,``p=0.4`` 以及相应的概率密度函数:

>>> import matplotlib.pyplot as plt
>>> from scipy.stats import binom
>>> n, p, size = 100, 0.4, 10000
>>> sample = rng.binomial(n, p, size=size)
>>> count, bins, _ = plt.hist(sample, 30, density=True)
>>> x = np.arange(n)
>>> y = binom.pmf(x, n, p)
>>> plt.plot(x, y, linewidth=2, color='r')

../../../_images/numpy-random-Generator-binomial-1.png