scipy.stats.qmc.

Sobol#

class scipy.stats.qmc.Sobol(d, *, scramble=True, bits=None, seed=None, optimization=None)[源代码][源代码]#

用于生成(打乱的)Sobol序列的引擎。

Sobol’ 序列是低差异的准随机数。可以通过两种方法绘制点:

  • random_base2: 安全地绘制 \(n=2^m\) 个点。此方法保证了序列的平衡特性。

  • random: 从序列中随机抽取任意数量的点。见下文警告。

参数:
d整数

序列的维度。最大维度为21201。

打乱bool, 可选

如果为 True,则使用 LMS+shift 扰码。否则,不进行扰码。默认值为 True。

int, 可选

生成器的位数。控制可以生成的最大点数,即 2**bits。最大值为 64。它并不对应于返回类型,返回类型始终为 np.float64,以防止点重复。默认值为 None,为了向后兼容,对应于 30。

Added in version 1.9.0.

优化{None, “random-cd”, “lloyd”}, 可选

是否使用优化方案来提高采样后的质量。请注意,这是一个后处理步骤,不保证样本的所有属性都将被保留。默认值为 None。

  • random-cd: 坐标随机排列以降低中心差异。基于中心差异的最佳样本不断更新。与使用其他差异度量相比,基于中心差异的采样在2D和3D子投影方面表现出更好的空间填充鲁棒性。

  • lloyd: 使用改进的Lloyd-Max算法扰动样本。该过程收敛于等间距的样本。

Added in version 1.10.0.

种子 : {None, int, numpy.random.Generator}, 可选{None, int,}

如果 seed 是 int 或 None,将使用 np.random.default_rng(seed) 创建一个新的 numpy.random.Generator。如果 seed 已经是 Generator 实例,则使用提供的实例。

方法

fast_forward(n)

将序列快进 n 个位置。

integers(l_bounds, *[, u_bounds, n, ...])

l_bounds`(包含)到 `u_bounds`(不包含)之间抽取 `n 个整数,或者如果 endpoint=True,则从 `l_bounds`(包含)到 `u_bounds`(包含)之间抽取。

random([n, workers])

在半开区间 [0, 1) 中绘制 n

random_base2(m)

从 Sobol' 序列中绘制点。

reset()

将引擎重置为基础状态。

注释

Sobol’ 序列 [1]\([0,1)^{d}\) 中提供了 \(n=2^m\) 个低差异点。对它们进行扰动 [3] 使它们适合于奇异积分,提供了误差估计的手段,并可以提高它们的收敛速度。实现的扰动策略是先进行左线性矩阵扰动(LMS),然后进行数字随机移位(LMS+shift) [2]

有许多版本的 Sobol’ 序列取决于它们的 ‘方向数’。此代码使用来自 [4] 的方向数。因此,最大维度数为 21201。方向数已预先计算,搜索标准为 6,并可在 https://web.maths.unsw.edu.au/~fkuo/sobol/ 获取。

警告

Sobol’ 序列是一种求积规则,如果使用的样本大小不是 2 的幂,或者跳过第一个点,或者对序列进行稀疏处理,它们就会失去平衡属性 [5]

如果 \(n=2^m\) 个点不够,那么应该取 \(2^M\) 个点,其中 \(M>m\)。在打乱时,独立重复次数 R 不必是 2 的幂。

Sobol’ 序列生成到一定数量的位数 \(B\) 。在生成 \(2^B\) 个点之后,序列将重复。因此,会引发一个错误。位数可以通过参数 bits 来控制。

参考文献

[1]

I. M. Sobol’, “The distribution of points in a cube and the accurate evaluation of integrals.” Zh. Vychisl. Mat. i Mat. Phys., 7:784-802, 1967.

[2]

J. Matousek, “On the L2-discrepancy for anchored boxes.” J. of Complexity 14, 527-556, 1998.

[3]

Art B. Owen, “Scrambling Sobol and Niederreiter-Xing points.” Journal of Complexity, 14(4):466-489, December 1998.

[4]

S. Joe and F. Y. Kuo, “Constructing sobol sequences with better two-dimensional projections.” SIAM Journal on Scientific Computing, 30(5):2635-2654, 2008.

[5]

Art B. Owen, “On dropping the first Sobol’ point.” arXiv:2008.08051, 2020.

示例

从Sobol’的低差异序列生成样本。

>>> from scipy.stats import qmc
>>> sampler = qmc.Sobol(d=2, scramble=False)
>>> sample = sampler.random_base2(m=3)
>>> sample
array([[0.   , 0.   ],
       [0.5  , 0.5  ],
       [0.75 , 0.25 ],
       [0.25 , 0.75 ],
       [0.375, 0.375],
       [0.875, 0.875],
       [0.625, 0.125],
       [0.125, 0.625]])

使用差异准则计算样本的质量。

>>> qmc.discrepancy(sample)
0.013882107204860938

要继续现有设计,可以通过再次调用 random_base2 获得额外点数。或者,您可以跳过一些点数,例如:

>>> _ = sampler.reset()
>>> _ = sampler.fast_forward(4)
>>> sample_continued = sampler.random_base2(m=2)
>>> sample_continued
array([[0.375, 0.375],
       [0.875, 0.875],
       [0.625, 0.125],
       [0.125, 0.625]])

最后,样本可以缩放到边界。

>>> l_bounds = [0, 2]
>>> u_bounds = [10, 5]
>>> qmc.scale(sample_continued, l_bounds, u_bounds)
array([[3.75 , 3.125],
       [8.75 , 4.625],
       [6.25 , 2.375],
       [1.25 , 3.875]])