completeness_score#

sklearn.metrics.completeness_score(labels_true, labels_pred)#

计算给定真实标签的聚类标签完整性度量。

如果给定类的所有数据点都是同一簇的元素,则聚类结果满足完整性。

该度量独立于标签的绝对值:类或簇标签值的排列不会以任何方式改变分数值。

该度量不是对称的:切换 label_truelabel_pred 将返回 homogeneity_score ,通常会有所不同。

更多信息请参阅 用户指南

Parameters:
labels_truearray-like of shape (n_samples,)

用作参考的真实类标签。

labels_predarray-like of shape (n_samples,)

要评估的聚类标签。

Returns:
completenessfloat

分数在 0.0 和 1.0 之间。1.0 表示完全完整的标签。

See also

homogeneity_score

聚类标签的同质性度量。

v_measure_score

V-Measure(带有算术平均选项的 NMI)。

References

Examples

完美的标签是完全的:

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

非完美的标签,将所有类成员分配到相同的簇中,仍然是完整的:

>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999...

如果类成员分布在不同的簇中,则分配不能是完整的:

>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0