Matern#

class sklearn.gaussian_process.kernels.Matern(length_scale=1.0, length_scale_bounds=(1e-05, 100000.0), nu=1.5)#

Matern 核函数。

Matern 核函数的类是 RBF 的泛化。它有一个额外的参数 :math:`

u` ,该参数控制结果函数的平滑度。:math:` u` 越小,近似函数越不平滑。当 :math:` u ightarrowinfty` 时,该核函数等价于 RBF 核函数。当 :math:` u = 1/2` 时,Matern 核函数变为绝对指数核函数。重要的中间值是 :math:` u=1.5` (一次可微函数)和 :math:` u=2.5` (二次可微函数)。

给定的核函数为:

\[k(x_i, x_j) = \frac{1}{\Gamma(\nu)2^{\nu-1}}\Bigg( \frac{\sqrt{2\nu}}{l} d(x_i , x_j ) \Bigg)^\nu K_\nu\Bigg( \frac{\sqrt{2\nu}}{l} d(x_i , x_j )\Bigg)\]

其中 \(d(\cdot,\cdot)\) 是欧氏距离, \(K_{\nu}(\cdot)\) 是修正的贝塞尔函数, \(\Gamma(\cdot)\) 是伽玛函数。 关于不同版本的Matern核的详细信息,请参见[Rc15b4675c755-1]_, Chapter 4, Section 4.2。

更多信息请阅读 用户指南

Added in version 0.18.

Parameters:
length_scalefloat or ndarray of shape (n_features,), default=1.0

核函数的长度尺度。如果是一个浮点数,则使用各向同性核函数。如果是一个数组,则使用各向异性核函数,其中每个维度的l定义了相应特征维度的长度尺度。

length_scale_bounds一对大于等于0的浮点数或”fixed”,默认值为(1e-5, 1e5)

‘length_scale’的下限和上限。 如果设置为”fixed”,在超参数调整期间 ‘length_scale’ 不能被改变。

nu浮点数,默认值为1.5

控制学习函数平滑度的参数 nu。 nu 越小,逼近函数越不平滑。 对于 nu=inf,核函数等同于RBF核,对于 nu=0.5,则等同于绝对指数核。重要的中间值是 nu=1.5(一次可微函数)和nu=2.5(二次可微函数)。 注意,nu的值不在 [0.5, 1.5, 2.5, inf] 范围内会导致较高的计算成本 (大约高出10倍),因为它们需要计算修正贝塞尔函数的值。 此外,与l不同,nu保持固定为其初始值而不进行优化。

Examples

>>> from sklearn.datasets import load_iris
>>> from sklearn.gaussian_process import GaussianProcessClassifier
>>> from sklearn.gaussian_process.kernels import Matern
>>> X, y = load_iris(return_X_y=True)
>>> kernel = 1.0 * Matern(length_scale=1.0, nu=1.5)
>>> gpc = GaussianProcessClassifier(kernel=kernel,
...         random_state=0).fit(X, y)
>>> gpc.score(X, y)
0.9866...
>>> gpc.predict_proba(X[:2,:])
array([[0.8513..., 0.0368..., 0.1117...],
        [0.8086..., 0.0693..., 0.1220...]])
__call__(X, Y=None, eval_gradient=False)#

返回核函数 k(X, Y) 及其梯度(可选)。

Parameters:
Xndarray,形状为 (n_samples_X, n_features)

返回核函数 k(X, Y) 的左参数

Yndarray,形状为 (n_samples_Y, n_features),默认=None

返回核函数 k(X, Y) 的右参数。如果为 None,则计算 k(X, X)。

eval_gradientbool,默认=False

确定是否计算关于核函数超参数对数的梯度。 仅在 Y 为 None 时支持。

Returns:
Kndarray,形状为 (n_samples_X, n_samples_Y)

核函数 k(X, Y)

K_gradientndarray,形状为 (n_samples_X, n_samples_X, n_dims),可选

核函数 k(X, X) 关于其超参数对数的梯度。仅在 eval_gradient 为 True 时返回。

property bounds#

返回对theta进行对数变换后的边界。

Returns:
boundsndarray of shape (n_dims, 2)

核函数超参数theta的对数变换边界

clone_with_theta(theta)#

返回具有给定超参数 theta 的自身克隆。

Parameters:
thetandarray of shape (n_dims,)

超参数

diag(X)#

返回核 k(X, X) 的对角线。

此方法的结果与 np.diag(self(X)) 相同;然而, 它可以更高效地进行评估,因为只评估对角线。

Parameters:
Xndarray of shape (n_samples_X, n_features)

返回核 k(X, Y) 的左参数

Returns:
K_diagndarray of shape (n_samples_X,)

核 k(X, X) 的对角线

get_params(deep=True)#

获取此内核的参数。

Parameters:
deepbool, 默认=True

如果为True,将返回此估计器及其包含的作为估计器的子对象的参数。

Returns:
paramsdict

参数名称映射到它们的值。

property hyperparameters#

返回所有超参数规范的列表。

is_stationary()#

返回内核是否是平稳的。

property n_dims#

返回内核的非固定超参数的数量。

property requires_vector_input#

返回内核是否定义在固定长度的特征向量或通用对象上。默认为True以保持向后兼容性。

set_params(**params)#

设置此内核的参数。

该方法适用于简单内核和嵌套内核。后者具有形式为 <component>__<parameter> 的参数,因此可以更新嵌套对象的每个组件。

Returns:
self
property theta#

返回非固定超参数的(扁平化、对数变换后的)值。

注意,theta通常是内核超参数的对数变换值,因为这种搜索空间的表示更适合超参数搜索,例如长度尺度等超参数自然存在于对数尺度上。

Returns:
thetandarray of shape (n_dims,)

内核的非固定、对数变换后的超参数