coverage_error#

sklearn.metrics.coverage_error(y_true, y_score, *, sample_weight=None)#

覆盖错误度量。

计算我们需通过排名分数覆盖所有真实标签的距离。最佳值等于每个样本中 y_true 中标签的平均数量。

y_scores 中的并列情况通过给出最大等级来解决,该等级将被分配给所有并列值。

注意:我们实现的得分比Tsoumakas等人在2010年提供的得分大1。这扩展了处理实例没有真实标签的退化情况。

用户指南 中了解更多信息。

Parameters:
y_truearray-like of shape (n_samples, n_labels)

二进制指示格式的真实二进制标签。

y_scorearray-like of shape (n_samples, n_labels)

目标分数,可以是正类的概率估计、置信值或未阈值化的决策度量 (如某些分类器的 “decision_function” 返回的值)。

sample_weightarray-like of shape (n_samples,), default=None

样本权重。

Returns:
coverage_errorfloat

覆盖误差。

References

[1]

Tsoumakas, G., Katakis, I., & Vlahavas, I. (2010). Mining multi-label data. In Data mining and knowledge discovery handbook (pp. 667-685). Springer US.

Examples

>>> from sklearn.metrics import coverage_error
>>> y_true = [[1, 0, 0], [0, 1, 1]]
>>> y_score = [[1, 0, 0], [0, 1, 1]]
>>> coverage_error(y_true, y_score)
1.5