sklearn.metrics#

评分函数、性能指标、成对指标和距离计算。

User guide. See the 度量和评分:量化预测质量 and 成对度量、亲和力和核函数 sections for further details.

Model selection interface#

User guide. See the scoring_parameter section for further details.

check_scoring

确定用户选项的评分器。

get_scorer

获取字符串形式的评分器。

get_scorer_names

获取所有可用评分器的名称。

make_scorer

创建一个从性能指标或损失函数生成的评分器。

Classification metrics#

User guide. See the 分类指标 section for further details.

accuracy_score

准确性分类得分。

auc

计算使用梯形法则的曲线下面积(AUC)。

average_precision_score

计算预测分数的平均精度(AP)。

balanced_accuracy_score

计算平衡准确率。

brier_score_loss

计算Brier分数损失。

class_likelihood_ratios

计算二分类的正负似然比。

classification_report

构建一个文本报告,展示主要的分类指标。

cohen_kappa_score

计算Cohen's kappa:一种衡量标注者之间一致性的统计量。

confusion_matrix

计算混淆矩阵以评估分类的准确性。

d2_log_loss_score

\(D^2\) 评分函数,解释的对数损失分数。

dcg_score

计算折损累计增益。

det_curve

计算不同概率阈值下的错误率。

f1_score

计算F1分数,也称为平衡F-分数或F-度量。

fbeta_score

计算 F-beta 分数。

hamming_loss

计算平均汉明损失。

hinge_loss

平均铰链损失(非正则化)。

jaccard_score

Jaccard相似系数得分。

log_loss

Log loss,又称逻辑损失或交叉熵损失。

matthews_corrcoef

计算 Matthews 相关系数(MCC)。

multilabel_confusion_matrix

计算每个类别或样本的混淆矩阵。

ndcg_score

计算归一化折损累积增益。

precision_recall_curve

计算不同概率阈值下的精确率-召回率对。

precision_recall_fscore_support

计算每个类别的精确度、召回率、F-度量和支持度。

precision_score

计算精确度。

recall_score

计算召回率。

roc_auc_score

计算从预测分数得到的受试者工作特征曲线(ROC AUC)下的面积。

roc_curve

计算接收者操作特征(ROC)。

top_k_accuracy_score

Top-k 准确率分类得分。

zero_one_loss

零一分类损失。

Regression metrics#

User guide. See the 回归度量 section for further details.

d2_absolute_error_score

\(D^2\) 回归评分函数,解释的绝对误差分数。

d2_pinball_score

\(D^2\) 回归评分函数,解释了分位数损失的比例。

d2_tweedie_score

\(D^2\) 回归评分函数,解释的 Tweedie 偏差的比例。

explained_variance_score

方差解释回归评分函数。

max_error

max_error 指标计算最大残差误差。

mean_absolute_error

平均绝对误差回归损失。

mean_absolute_percentage_error

平均绝对百分比误差(MAPE)回归损失。

mean_gamma_deviance

均值伽玛偏差回归损失。

mean_pinball_loss

Pinball损失用于分位数回归。

mean_poisson_deviance

均值泊松偏差回归损失。

mean_squared_error

均方误差回归损失。

mean_squared_log_error

均方对数误差回归损失。

mean_tweedie_deviance

均值 Tweedie 偏差回归损失。

median_absolute_error

中位绝对误差回归损失。

r2_score

\(R^2\) (决定系数)回归得分函数。

root_mean_squared_error

均方根误差回归损失。

root_mean_squared_log_error

均方对数误差回归损失。

Multilabel ranking metrics#

User guide. See the 多标签排序指标 section for further details.

coverage_error

覆盖错误度量。

label_ranking_average_precision_score

计算基于排名的平均精度。

label_ranking_loss

计算排序损失度量。

Clustering metrics#

评估聚类分析结果的度量标准。

  • 监督评估使用每个样本的地面实况类值。

  • 无监督评估不使用地面实况,而是衡量模型本身的“质量”。

User guide. See the clustering_evaluation section for further details.

adjusted_mutual_info_score

调整两个聚类的互信息。

adjusted_rand_score

Rand指数的随机调整。

calinski_harabasz_score

计算 Calinski 和 Harabasz 分数。

cluster.contingency_matrix

构建一个描述标签之间关系的列联矩阵。

cluster.pair_confusion_matrix

由两个聚类产生的对混淆矩阵。

completeness_score

计算给定真实标签的聚类标签完整性度量。

davies_bouldin_score

计算Davies-Bouldin得分。

fowlkes_mallows_score

测量一组点的两个聚类之间的相似性。

homogeneity_completeness_v_measure

计算同质性、完整性和V-Measure分数。

homogeneity_score

同质性度量给定真实标签的聚类标签。

mutual_info_score

互信息在两个聚类之间的相似性度量。

normalized_mutual_info_score

标准化两个聚类之间的互信息。

rand_score

Rand指数。

silhouette_samples

计算每个样本的轮廓系数。

silhouette_score

计算所有样本的平均轮廓系数。

v_measure_score

V-measure 聚类标签给定一个真实标签。

Biclustering metrics#

User guide. See the 双聚类评估 section for further details.

consensus_score

两个双聚类集的相似性。

Distance metrics#

DistanceMetric

统一接口,用于快速距离度量函数。

Pairwise metrics#

度量成对距离和样本集的亲和性。

User guide. See the 成对度量、亲和力和核函数 section for further details.

pairwise.additive_chi2_kernel

计算观测值 X 和 Y 之间的加性卡方核。

pairwise.chi2_kernel

计算X和Y之间的指数卡方核。

pairwise.cosine_distances

计算X和Y中样本之间的余弦距离。

pairwise.cosine_similarity

计算X和Y中样本之间的余弦相似度。

pairwise.distance_metrics

有效的成对距离度量。

pairwise.euclidean_distances

计算向量数组X和Y中每一对之间的距离矩阵。

pairwise.haversine_distances

计算样本X和Y之间的Haversine距离。

pairwise.kernel_metrics

有效的成对核函数度量。

pairwise.laplacian_kernel

计算X和Y之间的拉普拉斯核。

pairwise.linear_kernel

计算X和Y之间的线性核。

pairwise.manhattan_distances

计算X和Y中向量之间的L1距离。

pairwise.nan_euclidean_distances

计算在存在缺失值的情况下的欧几里得距离。

pairwise.paired_cosine_distances

计算X和Y之间的配对余弦距离。

pairwise.paired_distances

计算X和Y之间的配对距离。

pairwise.paired_euclidean_distances

计算X和Y之间的配对欧几里得距离。

pairwise.paired_manhattan_distances

计算X和Y之间的配对L1距离。

pairwise.pairwise_kernels

计算数组 X 和可选数组 Y 之间的核。

pairwise.polynomial_kernel

计算X和Y之间的多项式核。

pairwise.rbf_kernel

计算X和Y之间的rbf(高斯)核。

pairwise.sigmoid_kernel

计算X和Y之间的Sigmoid核。

pairwise_distances

计算从向量数组X和可选的Y的距离矩阵。

pairwise_distances_argmin

计算一个点和一组点之间的最小距离。

pairwise_distances_argmin_min

计算一个点和一组点之间的最小距离。

pairwise_distances_chunked

生成一个分块的距离矩阵,可选的归约操作。

Plotting#

User guide. See the 可视化 section for further details.

ConfusionMatrixDisplay

混淆矩阵可视化。

DetCurveDisplay

DET曲线可视化。

PrecisionRecallDisplay

精确召回率可视化。

PredictionErrorDisplay

预测回归模型的误差可视化。

RocCurveDisplay

ROC曲线可视化。