scipy.cluster.hierarchy.
is_valid_im#
- scipy.cluster.hierarchy.is_valid_im(R, warning=False, throw=False, name=None)[源代码][源代码]#
如果传入的不一致矩阵有效,则返回 True。
它必须是一个 \(n\) 乘 4 的双精度数组。标准差
R[:,1]必须是非负的。链接计数R[:,2]必须是正的且不大于 \(n-1\)。- 参数:
- Rndarray
用于检查有效性的不一致矩阵。
- 警告bool, 可选
当为 True 时,如果传递的链接矩阵无效,则会发出 Python 警告。
- 抛出bool, 可选
当为 True 时,如果传递的链接矩阵无效,则抛出 Python 异常。
- 名称str, 可选
此字符串指的是无效链接矩阵的变量名称。
- 返回:
- b布尔
如果不一致矩阵有效,则为真。
参见
linkage关于什么是连接矩阵的描述。
inconsistent用于创建不一致矩阵。
示例
>>> from scipy.cluster.hierarchy import ward, inconsistent, is_valid_im >>> from scipy.spatial.distance import pdist
给定一个数据集
X,我们可以应用聚类方法来获得一个链接矩阵Z。scipy.cluster.hierarchy.inconsistent也可以用来获得与此聚类过程相关的不一致矩阵R:>>> X = [[0, 0], [0, 1], [1, 0], ... [0, 4], [0, 3], [1, 4], ... [4, 0], [3, 0], [4, 1], ... [4, 4], [3, 4], [4, 3]]
>>> Z = ward(pdist(X)) >>> R = inconsistent(Z) >>> Z array([[ 0. , 1. , 1. , 2. ], [ 3. , 4. , 1. , 2. ], [ 6. , 7. , 1. , 2. ], [ 9. , 10. , 1. , 2. ], [ 2. , 12. , 1.29099445, 3. ], [ 5. , 13. , 1.29099445, 3. ], [ 8. , 14. , 1.29099445, 3. ], [11. , 15. , 1.29099445, 3. ], [16. , 17. , 5.77350269, 6. ], [18. , 19. , 5.77350269, 6. ], [20. , 21. , 8.16496581, 12. ]]) >>> R array([[1. , 0. , 1. , 0. ], [1. , 0. , 1. , 0. ], [1. , 0. , 1. , 0. ], [1. , 0. , 1. , 0. ], [1.14549722, 0.20576415, 2. , 0.70710678], [1.14549722, 0.20576415, 2. , 0.70710678], [1.14549722, 0.20576415, 2. , 0.70710678], [1.14549722, 0.20576415, 2. , 0.70710678], [2.78516386, 2.58797734, 3. , 1.15470054], [2.78516386, 2.58797734, 3. , 1.15470054], [6.57065706, 1.38071187, 3. , 1.15470054]])
现在我们可以使用
scipy.cluster.hierarchy.is_valid_im来验证R是否正确:>>> is_valid_im(R) True
然而,如果
R构造错误(例如,其中一个标准差被设置为负值),那么检查将会失败:>>> R[-1,1] = R[-1,1] * -1 >>> is_valid_im(R) False