dask.array.random.binomial

dask.array.random.binomial¶

dask.array.random.binomial(*args, **kwargs)¶

从二项分布中抽取样本。

此文档字符串是从 numpy.random.mtrand.RandomState.binomial 复制的。

Dask 版本可能存在一些不一致性。

样本是从具有指定参数的二项分布中抽取的，n 次试验和 p 次成功概率，其中 n 是一个大于等于 0 的整数，p 在区间 [0,1] 内。（n 可以作为浮点数输入，但在使用时会被截断为整数）

备注

新代码应使用 ~numpy.random.Generator 实例的 ~numpy.random.Generator.binomial 方法；请参阅 Quick start。

参数

nint 或 int 类型的类数组对象: 分布的参数，>= 0。也接受浮点数，但它们将被截断为整数。
p浮点数或浮点数的类数组对象: 分布的参数，>= 0 且 <= 1。
大小int 或 int 的元组，可选: 输出形状。如果给定的形状是，例如，(m, n, k)，那么会抽取 m * n * k 个样本。如果 size 是 None``（默认），当 ``n 和 p 都是标量时，返回一个单一值。否则，会抽取 np.broadcast(n, p).size 个样本。

返回

出ndarray 或标量: 从参数化的二项分布中抽取样本，其中每个样本等于n次试验中的成功次数。

参见

scipy.stats.binom: 概率密度函数、分布或累积密度函数等。
random.Generator.binomial: 应用于新代码。

注释

二项分布的概率密度为

\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]

其中 \(n\) 是试验次数，\(p\) 是成功的概率，而 \(N\) 是成功的次数。

当使用随机样本估计总体比例的标准误差时，除非 p*n <= 5，其中 p = 总体比例估计值，n = 样本数量，否则正态分布效果良好，在这种情况下应使用二项分布。例如，一个包含 15 人的样本显示 4 人是左撇子，11 人是右撇子。那么 p = 4/15 = 27%。0.27*15 = 4，因此在这种情况下应使用二项分布。

参考文献

1: Dalgaard, Peter, 《R语言统计入门》, Springer-Verlag, 2002.
2: Glantz, Stanton A. “生物统计学入门。”, McGraw-Hill, 第五版, 2002.
3: Lentner, Marvin, “基础应用统计学”, Bogden and Quigley, 1972.
4: Weisstein, Eric W. “二项分布。” 来自 MathWorld–A Wolfram Web 资源。 https://mathworld.wolfram.com/BinomialDistribution.html
5: 维基百科，“二项分布”，https://en.wikipedia.org/wiki/Binomial_distribution

示例

从分布中抽取样本：

>>> n, p = 10, .5  # number of trials, probability of each trial  
>>> s = np.random.binomial(n, p, 1000)  
# result of flipping a coin 10 times, tested 1000 times.

一个现实世界的例子。一家公司钻探了9口野猫式石油勘探井，每口井的成功概率估计为0.1。所有九口井都失败了。这种情况发生的概率是多少？

让我们对模型进行20,000次试验，并统计产生零次正面结果的次数。

>>> sum(np.random.binomial(9, 0.1, 20000) == 0)/20000.  
# answer = 0.38885, or 38%.

dask.array.random.beta

dask.array.random.chisquare