orthogonal_mp_gram#

sklearn.linear_model.orthogonal_mp_gram(Gram, Xy, *, n_nonzero_coefs=None, tol=None, norms_squared=None, copy_Gram=True, copy_Xy=True, return_path=False, return_n_iter=False)#

Gram 正交匹配追踪 (OMP).

仅使用 Gram 矩阵 X.T * X 和乘积 X.T * y 解决 n_targets 个正交匹配追踪问题。

更多信息请参阅 用户指南

Parameters:
Gram形状为 (n_features, n_features) 的类数组

输入数据的 Gram 矩阵: X.T * X

Xy形状为 (n_features,) 或 (n_features, n_targets) 的类数组

输入目标乘以 XX.T * y

n_nonzero_coefsint, 默认=None

期望的解中非零项的数量。如果为 None (默认),此值设置为 n_features 的 10%。

tolfloat, 默认=None

残差的最大平方范数。如果非 None ,则覆盖 n_nonzero_coefs

norms_squared形状为 (n_targets,) 的类数组, 默认=None

y 行的 L2 范数平方。如果 tol 非 None,则需要此参数。

copy_Grambool, 默认=True

算法是否必须复制 Gram 矩阵。只有当 Gram 矩阵已经是 Fortran 顺序时, False 值才有帮助,否则仍然会进行复制。

copy_Xybool, 默认=True

算法是否必须复制协方差向量 Xy 。如果为 False ,可能会被覆盖。

return_pathbool, 默认=False

是否返回前向路径上非零系数的每个值。用于交叉验证时很有用。

return_n_iterbool, 默认=False

是否返回迭代次数。

Returns:
coef形状为 (n_features,) 或 (n_features, n_targets) 的 ndarray

OMP 解的系数。如果 return_path=True ,这包含整个系数路径。在这种情况下,其形状为 (n_features, n_features)(n_features, n_targets, n_features) ,并且遍历最后一个轴会按活动特征的递增顺序生成系数。

n_iterslist 或 int

每个目标的活动特征数量。仅当 return_n_iter 设置为 True 时返回。

See also

OrthogonalMatchingPursuit

正交匹配追踪模型 (OMP)。

orthogonal_mp

解决 n_targets 个正交匹配追踪问题。

lars_path

使用 LARS 算法计算最小角回归或 Lasso 路径。

sklearn.decomposition.sparse_encode

通用稀疏编码。 结果的每一列是 Lasso 问题的解。

Notes

正交匹配追踪由 G. Mallat, Z. Zhang 提出,匹配追踪与时频字典,IEEE 信号处理 Transactions,第 41 卷,第 12 期(1993 年 12 月),第 3397-3415 页。 (https://www.di.ens.fr/~mallat/papiers/MallatPursuit93.pdf)

此实现基于 Rubinstein, R., Zibulevsky, M. 和 Elad, M.,使用批量正交匹配追踪高效实现 K-SVD 算法技术报告 - CS Technion,2008 年 4 月。 https://www.cs.technion.ac.il/~ronrubin/Publications/KSVD-OMP-v2.pdf

Examples

>>> from sklearn.datasets import make_regression
>>> from sklearn.linear_model import orthogonal_mp_gram
>>> X, y = make_regression(noise=4, random_state=0)
>>> coef = orthogonal_mp_gram(X.T @ X, X.T @ y)
>>> coef.shape
(100,)
>>> X[:1,] @ coef
array([-78.68...])