orthogonal_mp_gram#
- sklearn.linear_model.orthogonal_mp_gram(Gram, Xy, *, n_nonzero_coefs=None, tol=None, norms_squared=None, copy_Gram=True, copy_Xy=True, return_path=False, return_n_iter=False)#
Gram 正交匹配追踪 (OMP).
仅使用 Gram 矩阵
X.T * X
和乘积X.T * y
解决 n_targets 个正交匹配追踪问题。更多信息请参阅 用户指南 。
- Parameters:
- Gram形状为 (n_features, n_features) 的类数组
输入数据的 Gram 矩阵:
X.T * X
。- Xy形状为 (n_features,) 或 (n_features, n_targets) 的类数组
输入目标乘以
X
:X.T * y
。- n_nonzero_coefsint, 默认=None
期望的解中非零项的数量。如果为
None
(默认),此值设置为 n_features 的 10%。- tolfloat, 默认=None
残差的最大平方范数。如果非
None
,则覆盖n_nonzero_coefs
。- norms_squared形状为 (n_targets,) 的类数组, 默认=None
y
行的 L2 范数平方。如果tol
非 None,则需要此参数。- copy_Grambool, 默认=True
算法是否必须复制 Gram 矩阵。只有当 Gram 矩阵已经是 Fortran 顺序时,
False
值才有帮助,否则仍然会进行复制。- copy_Xybool, 默认=True
算法是否必须复制协方差向量
Xy
。如果为False
,可能会被覆盖。- return_pathbool, 默认=False
是否返回前向路径上非零系数的每个值。用于交叉验证时很有用。
- return_n_iterbool, 默认=False
是否返回迭代次数。
- Returns:
- coef形状为 (n_features,) 或 (n_features, n_targets) 的 ndarray
OMP 解的系数。如果
return_path=True
,这包含整个系数路径。在这种情况下,其形状为(n_features, n_features)
或(n_features, n_targets, n_features)
,并且遍历最后一个轴会按活动特征的递增顺序生成系数。- n_iterslist 或 int
每个目标的活动特征数量。仅当
return_n_iter
设置为 True 时返回。
See also
OrthogonalMatchingPursuit
正交匹配追踪模型 (OMP)。
orthogonal_mp
解决 n_targets 个正交匹配追踪问题。
lars_path
使用 LARS 算法计算最小角回归或 Lasso 路径。
sklearn.decomposition.sparse_encode
通用稀疏编码。 结果的每一列是 Lasso 问题的解。
Notes
正交匹配追踪由 G. Mallat, Z. Zhang 提出,匹配追踪与时频字典,IEEE 信号处理 Transactions,第 41 卷,第 12 期(1993 年 12 月),第 3397-3415 页。 (https://www.di.ens.fr/~mallat/papiers/MallatPursuit93.pdf)
此实现基于 Rubinstein, R., Zibulevsky, M. 和 Elad, M.,使用批量正交匹配追踪高效实现 K-SVD 算法技术报告 - CS Technion,2008 年 4 月。 https://www.cs.technion.ac.il/~ronrubin/Publications/KSVD-OMP-v2.pdf
Examples
>>> from sklearn.datasets import make_regression >>> from sklearn.linear_model import orthogonal_mp_gram >>> X, y = make_regression(noise=4, random_state=0) >>> coef = orthogonal_mp_gram(X.T @ X, X.T @ y) >>> coef.shape (100,) >>> X[:1,] @ coef array([-78.68...])