rand_score#

sklearn.metrics.rand_score(labels_true, labels_pred)#

Rand指数。

Rand指数通过考虑所有样本对并计算在预测和真实聚类中分配到相同或不同簇中的对数来计算两个聚类之间的相似性度量[Rbedd61930922-1]_ [2]

原始RI分数[Rbedd61930922-3]_为:

RI = (一致对的数量) / (对的数量)

用户指南 中阅读更多内容。

Parameters:
labels_truearray-like of shape (n_samples,), dtype=integral

用作参考的真实类标签。

labels_predarray-like of shape (n_samples,), dtype=integral

要评估的聚类标签。

Returns:
RIfloat

介于0.0和1.0之间的相似性分数,1.0表示完全匹配。

See also

adjusted_rand_score

调整后的Rand指数。

adjusted_mutual_info_score

调整后的互信息。

References

Examples

完全匹配的标签具有1的分数

>>> from sklearn.metrics.cluster import rand_score
>>> rand_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

将所有类成员分配到相同簇的标签是完整的,但可能并不总是纯粹的,因此会受到惩罚:

>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1])
0.83...