scipy.spatial.

procrustes#

scipy.spatial.procrustes(data1, data2)[源代码][源代码]#

Procrustes 分析，用于两组数据相似性检验的方法。

每个输入矩阵是一组点或向量（矩阵的行）。空间的维度是每个矩阵的列数。给定两个大小相同的矩阵，procrustes 标准化两者使得：

\(tr(AA^{T}) = 1\).
两组点都以原点为中心。

Procrustes（[1]，[2]）随后将最优变换应用于第二个矩阵（包括缩放/膨胀、旋转和反射），以最小化 \(M^{2}=\sum(data1-data2)^{2}\)，即两个输入数据集之间点对点差异的平方和。

此函数并非设计用于处理具有不同数据点数量（行数）的数据集。如果两个数据集具有不同的维度（列数不同），只需向较小的数据集添加零列即可。

参数:

数据1array_like: 矩阵，n 行表示 k（列）空间中的点 data1 是参考数据，标准化后，data2 的数据将被转换以适应 data1 中的模式（必须有 >1 个唯一点）。
数据2array_like: k 空间中的 n 行数据拟合到 data1。必须与 data1 具有相同的形状 ``(numrows, numcols)``（必须有 >1 个唯一点）。

返回:

mtx1array_like: data1 的标准化版本。
mtx2array_like: 最适合 data1 的 data2 的方向。居中，但不一定是 \(tr(AA^{T}) = 1\)。
差异浮动: \(M^{2}\) 如上所定义。

Raises:

ValueError: 如果输入数组不是二维的。如果输入数组的形状不同。如果输入数组有零列或零行。

参见

scipy.linalg.orthogonal_procrustes
scipy.spatial.distance.directed_hausdorff: 两个数据集的另一个相似性测试

注释

这种差异不应取决于输入矩阵的顺序，但输出矩阵会，因为只有第一个输出矩阵保证被缩放，使得 \(tr(AA^{T}) = 1\)。
重复的数据点通常是可以的，重复一个数据点会增加它在Procrustes拟合中的影响。
差异性随着每个输入矩阵的点数而增加。

参考文献

[1]

Krzanowski, W. J. (2000). “多变量分析原理”。

[2]

Gower, J. C. (1975). “广义普罗克鲁斯忒斯分析”.

示例

>>> import numpy as np
>>> from scipy.spatial import procrustes

矩阵 b 是 a 的旋转、平移、缩放和镜像版本：

>>> a = np.array([[1, 3], [1, 2], [1, 1], [2, 1]], 'd')
>>> b = np.array([[4, -2], [4, -4], [4, -6], [2, -6]], 'd')
>>> mtx1, mtx2, disparity = procrustes(a, b)
>>> round(disparity)
0.0