scipy.cluster.hierarchy.

is_valid_im#

scipy.cluster.hierarchy.is_valid_im(R, warning=False, throw=False, name=None)[源代码][源代码]#

如果传入的不一致矩阵有效,则返回 True。

它必须是一个 \(n\) 乘 4 的双精度数组。标准差 R[:,1] 必须是非负的。链接计数 R[:,2] 必须是正的且不大于 \(n-1\)

参数:
Rndarray

用于检查有效性的不一致矩阵。

警告bool, 可选

当为 True 时,如果传递的链接矩阵无效,则会发出 Python 警告。

抛出bool, 可选

当为 True 时,如果传递的链接矩阵无效,则抛出 Python 异常。

名称str, 可选

此字符串指的是无效链接矩阵的变量名称。

返回:
b布尔

如果不一致矩阵有效,则为真。

参见

linkage

关于什么是连接矩阵的描述。

inconsistent

用于创建不一致矩阵。

示例

>>> from scipy.cluster.hierarchy import ward, inconsistent, is_valid_im
>>> from scipy.spatial.distance import pdist

给定一个数据集 X,我们可以应用聚类方法来获得一个链接矩阵 Zscipy.cluster.hierarchy.inconsistent 也可以用来获得与此聚类过程相关的不一致矩阵 R

>>> X = [[0, 0], [0, 1], [1, 0],
...      [0, 4], [0, 3], [1, 4],
...      [4, 0], [3, 0], [4, 1],
...      [4, 4], [3, 4], [4, 3]]
>>> Z = ward(pdist(X))
>>> R = inconsistent(Z)
>>> Z
array([[ 0.        ,  1.        ,  1.        ,  2.        ],
       [ 3.        ,  4.        ,  1.        ,  2.        ],
       [ 6.        ,  7.        ,  1.        ,  2.        ],
       [ 9.        , 10.        ,  1.        ,  2.        ],
       [ 2.        , 12.        ,  1.29099445,  3.        ],
       [ 5.        , 13.        ,  1.29099445,  3.        ],
       [ 8.        , 14.        ,  1.29099445,  3.        ],
       [11.        , 15.        ,  1.29099445,  3.        ],
       [16.        , 17.        ,  5.77350269,  6.        ],
       [18.        , 19.        ,  5.77350269,  6.        ],
       [20.        , 21.        ,  8.16496581, 12.        ]])
>>> R
array([[1.        , 0.        , 1.        , 0.        ],
       [1.        , 0.        , 1.        , 0.        ],
       [1.        , 0.        , 1.        , 0.        ],
       [1.        , 0.        , 1.        , 0.        ],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [2.78516386, 2.58797734, 3.        , 1.15470054],
       [2.78516386, 2.58797734, 3.        , 1.15470054],
       [6.57065706, 1.38071187, 3.        , 1.15470054]])

现在我们可以使用 scipy.cluster.hierarchy.is_valid_im 来验证 R 是否正确:

>>> is_valid_im(R)
True

然而,如果 R 构造错误(例如,其中一个标准差被设置为负值),那么检查将会失败:

>>> R[-1,1] = R[-1,1] * -1
>>> is_valid_im(R)
False