sklearn.model_selection#

工具用于模型选择,例如交叉验证和超参数调整。

User guide. See the 交叉验证:评估估计器性能, 调整估计器的超参数, and 学习曲线 sections for further details.

Splitters#

GroupKFold

K-fold迭代器变体,具有不重叠的组。

GroupShuffleSplit

Shuffle-Group(s)-Out 交叉验证迭代器。

KFold

K-Fold交叉验证器。

LeaveOneGroupOut

Leave One Group Out 交叉验证器。

LeaveOneOut

Leave-One-Out 交叉验证器。

LeavePGroupsOut

Leave P Group(s) Out交叉验证器。

LeavePOut

Leave-P-Out交叉验证器。

PredefinedSplit

预定义的分割交叉验证器。

RepeatedKFold

Repeated K-Fold 交叉验证器。

RepeatedStratifiedKFold

重复分层K折交叉验证器。

ShuffleSplit

随机排列交叉验证器。

StratifiedGroupKFold

分层K折迭代器变种,具有不重叠的组。

StratifiedKFold

分层K折交叉验证器。

StratifiedShuffleSplit

分层随机分割交叉验证器。

TimeSeriesSplit

时间序列交叉验证器。

check_cv

输入检查工具,用于构建交叉验证器。

train_test_split

将数组或矩阵拆分为随机的训练和测试子集。

Hyper-parameter optimizers#

GridSearchCV

穷举搜索估计器的指定参数值。

HalvingGridSearchCV

搜索指定的参数值,使用连续减半的方法。

HalvingRandomSearchCV

随机搜索超参数。

ParameterGrid

网格参数,每个参数有离散的数值。

ParameterSampler

生成器在给定分布中采样参数。

RandomizedSearchCV

随机搜索超参数。

Post-fit model tuning#

FixedThresholdClassifier

二元分类器,手动设置决策阈值。

TunedThresholdClassifierCV

分类器,使用交叉验证后调决策阈值。

Model validation#

cross_val_predict

生成每个输入数据点的交叉验证估计。

cross_val_score

评估通过交叉验证的得分。

cross_validate

评估指标通过交叉验证并记录拟合/评分时间。

learning_curve

学习曲线。

permutation_test_score

评估通过排列验证分数的显著性。

validation_curve

验证曲线。

Visualization#

LearningCurveDisplay

学习曲线可视化。

ValidationCurveDisplay

验证曲线可视化。