numpy.random.Generator.gumbel#
方法
- random.Generator.gumbel(loc=0.0, scale=1.0, size=None)#
从Gumbel分布中抽取样本.
从具有指定位置和尺度的Gumbel分布中抽取样本.有关Gumbel分布的更多信息,请参见下面的注释和参考文献.
- 参数:
- loc浮点数或浮点数的类数组对象,可选
分布模式的位置.默认值为0.
- scale浮点数或浮点数的类数组对象,可选
分布的尺度参数.默认为1.必须为非负数.
- sizeint 或 int 的元组,可选
输出形状.如果给定的形状是,例如,``(m, n, k)``,那么会抽取
m * n * k
个样本.如果大小是None``(默认),当 ``loc
和scale
都是标量时,返回一个单一值.否则,会抽取np.broadcast(loc, scale).size
个样本.
- 返回:
- outndarray 或标量
从参数化的Gumbel分布中抽取样本.
备注
Gumbel(或最小极值 (SEV) 或最小极值类型 I)分布是用于建模极值问题的一类广义极值 (GEV) 分布之一.Gumbel 是极值类型 I 分布的一个特例,适用于具有”类指数”尾部的分布中的最大值.
Gumbel 分布的概率密度为
\[p(x) = \frac{e^{-(x - \mu)/ \beta}}{\beta} e^{ -e^{-(x - \mu)/\beta}},\]其中 \(\mu\) 是众数,一个位置参数,而 \(\beta\) 是尺度参数.
Gumbel(以德国数学家 Emil Julius Gumbel 命名)在早期的水文学文献中被广泛使用,用于模拟洪水事件的发生.它还被用于模拟最大风速和降雨率.它是一个”肥尾”分布——分布尾部的概率事件比使用高斯分布时要大,因此100年一遇的洪水发生频率比预期更高.洪水最初被建模为高斯过程,这低估了极端事件的频率.
它是极值分布类之一,广义极值(GEV)分布,还包括 Weibull 和 Frechet.
该函数具有均值 \(\mu + 0.57721\beta\) 和方差 \(\frac{\pi^2}{6}\beta^2\).
参考文献
[1]Gumbel, E. J., “Statistics of Extremes,” New York: Columbia University Press, 1958.
[2]Reiss, R.-D. 和 Thomas, M., “保险、金融、水文学及其他领域的极值统计分析,” Basel: Birkhauser Verlag, 2001.
示例
从分布中抽取样本:
>>> rng = np.random.default_rng() >>> mu, beta = 0, 0.1 # location and scale >>> s = rng.gumbel(mu, beta, 1000)
显示样本的直方图,以及概率密度函数:
>>> import matplotlib.pyplot as plt >>> count, bins, _ = plt.hist(s, 30, density=True) >>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta) ... * np.exp( -np.exp( -(bins - mu) /beta) ), ... linewidth=2, color='r') >>> plt.show()
展示一个极值分布如何从高斯过程中产生并与高斯分布进行比较:
>>> means = [] >>> maxima = [] >>> for i in range(0,1000) : ... a = rng.normal(mu, beta, 1000) ... means.append(a.mean()) ... maxima.append(a.max()) >>> count, bins, _ = plt.hist(maxima, 30, density=True) >>> beta = np.std(maxima) * np.sqrt(6) / np.pi >>> mu = np.mean(maxima) - 0.57721*beta >>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta) ... * np.exp(-np.exp(-(bins - mu)/beta)), ... linewidth=2, color='r') >>> plt.plot(bins, 1/(beta * np.sqrt(2 * np.pi)) ... * np.exp(-(bins - mu)**2 / (2 * beta**2)), ... linewidth=2, color='g') >>> plt.show()