sklearn.random_projection#

随机投影变换器。

随机投影是一种简单且计算效率高的方法,通过以可控的精度损失(作为额外的方差)换取更快的处理时间和更小的模型大小,来降低数据的维度。

随机投影矩阵的维度和分布受到控制,以保持数据集中任意两个样本之间的成对距离。

随机投影效率背后的主要理论结果是 Johnson-Lindenstrauss引理(引用自维基百科)

在数学中,Johnson-Lindenstrauss引理是关于从高维空间到低维欧几里得空间低失真嵌入点的结果。该引理表明,高维空间中的一小部分点可以嵌入到维度低得多的空间中,使得点之间的距离几乎保持不变。用于嵌入的映射至少是Lipschitz的,甚至可以被视为正交投影。

User guide. See the 随机投影 section for further details.

GaussianRandomProjection

通过高斯随机投影降低维度。

SparseRandomProjection

通过稀疏随机投影降低维度。

johnson_lindenstrauss_min_dim

找到一个“安全”的随机投影组件数量。