dask.array.random.exponential
dask.array.random.exponential¶
- dask.array.random.exponential(*args, **kwargs)¶
从指数分布中抽取样本。
此文档字符串是从 numpy.random.mtrand.RandomState.exponential 复制的。
Dask 版本可能存在一些不一致性。
其概率密度函数是
\[f(x; \frac{1}{\beta}) = \frac{1}{\beta} \exp(-\frac{x}{\beta}),\]对于
x > 0
且在其他地方为 0。\(\beta\) 是尺度参数,它是速率参数 \(\lambda = 1/\beta\) 的倒数。速率参数是指数分布的另一种广泛使用的参数化方式 [3]。指数分布是几何分布的连续模拟。它描述了许多常见情况,例如在多次降雨中测量的雨滴大小 [1],或访问维基百科页面请求之间的时间 [2]。
备注
新代码应使用 ~numpy.random.Generator 实例的 ~numpy.random.Generator.exponential 方法;请参阅 Quick start。
- 参数
- 比例浮点数或浮点数的类数组对象
尺度参数,\(\beta = 1/\lambda\)。必须为非负数。
- 大小int 或 int 的元组,可选
输出形状。如果给定的形状是,例如,
(m, n, k)
,那么会抽取m * n * k
个样本。如果大小是None``(默认),当 ``scale
是标量时,返回一个单一值。否则,会抽取np.array(scale).size
个样本。
- 返回
- 出ndarray 或标量
从参数化的指数分布中抽取样本。
参见
random.Generator.exponential
应用于新代码。
参考文献
- 1
Peyton Z. Peebles Jr., “概率、随机变量和随机信号原理”, 第4版, 2001年, 第57页。
- 2
Wikipedia, “泊松过程”, https://en.wikipedia.org/wiki/Poisson_process
- 3
Wikipedia, “指数分布”, https://en.wikipedia.org/wiki/Exponential_distribution
示例
一个现实世界的例子:假设一家公司有10000名客户支持代理,客户电话之间的平均时间是4分钟。
>>> n = 10000 >>> time_between_calls = np.random.default_rng().exponential(scale=4, size=n)
在接下来的4到5分钟内,客户打电话的概率是多少?
>>> x = ((time_between_calls < 5).sum())/n >>> y = ((time_between_calls < 4).sum())/n >>> x-y 0.08 # may vary