dask.array.random.gumbel

dask.array.random.gumbel¶

dask.array.random.gumbel(*args, **kwargs)¶

从Gumbel分布中抽取样本。

此文档字符串是从 numpy.random.mtrand.RandomState.gumbel 复制的。

Dask 版本可能存在一些不一致性。

从具有指定位置和尺度的Gumbel分布中抽取样本。有关Gumbel分布的更多信息，请参见下面的注释和参考文献。

备注

新代码应使用 ~numpy.random.Generator 实例的 ~numpy.random.Generator.gumbel 方法；请参阅 Quick start。

参数

loc浮点数或浮点数数组，可选: 分布模式的位置。默认值为 0。
比例浮点数或浮点数数组，可选: 分布的尺度参数。默认值为1。必须为非负数。
大小int 或 int 的元组，可选: 输出形状。如果给定的形状是，例如，(m, n, k)，那么会抽取 m * n * k 个样本。如果大小是 None``（默认），当 ``loc 和 scale 都是标量时，返回一个单一值。否则，会抽取 np.broadcast(loc, scale).size 个样本。

返回

出ndarray 或标量: 从参数化的Gumbel分布中抽取样本。

参见

scipy.stats.gumbel_l
scipy.stats.gumbel_r
scipy.stats.genextreme
weibull
random.Generator.gumbel: 应用于新代码。

注释

Gumbel（或最小极值（SEV）或最小极值类型I）分布是用于建模极值问题的一类广义极值（GEV）分布中的一种。Gumbel 是极值类型I分布的一个特例，适用于具有“指数型”尾部的分布中的最大值。

Gumbel 分布的概率密度为

\[p(x) = \frac{e^{-(x - \mu)/ \beta}}{\beta} e^{ -e^{-(x - \mu)/ \beta}},\]

其中，\(\mu\) 是众数，一个位置参数，而 \(\beta\) 是尺度参数。

Gumbel（以德国数学家Emil Julius Gumbel命名）在早期的水文学文献中被广泛使用，用于模拟洪水事件的发生。它还被用于模拟最大风速和降雨率。它是一种“肥尾”分布——尾部事件的概率比使用高斯分布时要大，因此百年一遇的洪水事件发生的频率比预期要高。最初，洪水被建模为高斯过程，这低估了极端事件的频率。

它是极值分布类之一，广义极值分布（GEV），还包括威布尔和弗雷歇分布。

该函数的均值为 \(\mu + 0.57721\beta\)，方差为 \(\frac{\pi^2}{6}\beta^2\)。

参考文献

1: Gumbel, E. J., 《极值统计学》, 纽约: 哥伦比亚大学出版社, 1958.
2: Reiss, R.-D. 和 Thomas, M., “保险、金融、水文学及其他领域的极值统计分析,” 巴塞尔: Birkhauser Verlag, 2001.

示例

从分布中抽取样本：

>>> mu, beta = 0, 0.1 # location and scale  
>>> s = np.random.gumbel(mu, beta, 1000)  

显示样本的直方图，以及概率密度函数：

>>> import matplotlib.pyplot as plt  
>>> count, bins, ignored = plt.hist(s, 30, density=True)  
>>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta)  
...          * np.exp( -np.exp( -(bins - mu) /beta) ),
...          linewidth=2, color='r')
>>> plt.show()  

展示极值分布如何从高斯过程中产生，并与高斯分布进行比较：

>>> means = []  
>>> maxima = []  
>>> for i in range(0,1000) :  
...    a = np.random.normal(mu, beta, 1000)
...    means.append(a.mean())
...    maxima.append(a.max())
>>> count, bins, ignored = plt.hist(maxima, 30, density=True)  
>>> beta = np.std(maxima) * np.sqrt(6) / np.pi  
>>> mu = np.mean(maxima) - 0.57721*beta  
>>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta)  
...          * np.exp(-np.exp(-(bins - mu)/beta)),
...          linewidth=2, color='r')
>>> plt.plot(bins, 1/(beta * np.sqrt(2 * np.pi))  
...          * np.exp(-(bins - mu)**2 / (2 * beta**2)),
...          linewidth=2, color='g')
>>> plt.show()  

dask.array.random.geometric

dask.array.random.超几何