coverage_error#
- sklearn.metrics.coverage_error(y_true, y_score, *, sample_weight=None)#
覆盖错误度量。
计算我们需通过排名分数覆盖所有真实标签的距离。最佳值等于每个样本中
y_true
中标签的平均数量。y_scores
中的并列情况通过给出最大等级来解决,该等级将被分配给所有并列值。注意:我们实现的得分比Tsoumakas等人在2010年提供的得分大1。这扩展了处理实例没有真实标签的退化情况。
在 用户指南 中了解更多信息。
- Parameters:
- y_truearray-like of shape (n_samples, n_labels)
二进制指示格式的真实二进制标签。
- y_scorearray-like of shape (n_samples, n_labels)
目标分数,可以是正类的概率估计、置信值或未阈值化的决策度量 (如某些分类器的 “decision_function” 返回的值)。
- sample_weightarray-like of shape (n_samples,), default=None
样本权重。
- Returns:
- coverage_errorfloat
覆盖误差。
References
[1]Tsoumakas, G., Katakis, I., & Vlahavas, I. (2010). Mining multi-label data. In Data mining and knowledge discovery handbook (pp. 667-685). Springer US.
Examples
>>> from sklearn.metrics import coverage_error >>> y_true = [[1, 0, 0], [0, 1, 1]] >>> y_score = [[1, 0, 0], [0, 1, 1]] >>> coverage_error(y_true, y_score) 1.5