Examples#

This is the gallery of examples that showcase how scikit-learn can be used. Some examples demonstrate the use of the API in general and some demonstrate specific applications in tutorial form. Also check out our user guide for more detailed illustrations.

Release Highlights#

These examples illustrate the main features of the releases of scikit-learn.

scikit-learn 1.5 版本发布亮点

scikit-learn 1.5 版本发布亮点

scikit-learn 1.4 版本发布亮点

scikit-learn 1.4 版本发布亮点

scikit-learn 1.3 版本发布亮点

scikit-learn 1.3 版本发布亮点

scikit-learn 1.2 版本发布亮点

scikit-learn 1.2 版本发布亮点

scikit-learn 1.1 版本发布亮点

scikit-learn 1.1 版本发布亮点

scikit-learn 1.0 版本发布亮点

scikit-learn 1.0 版本发布亮点

scikit-learn 0.24 版本发布亮点

scikit-learn 0.24 版本发布亮点

scikit-learn 0.23 版本发布亮点

scikit-learn 0.23 版本发布亮点

scikit-learn 0.22 版本发布亮点

scikit-learn 0.22 版本发布亮点

Biclustering#

Examples concerning biclustering techniques.

一个谱双聚类算法的演示

一个谱双聚类算法的演示

使用谱协同聚类算法对文档进行双聚类

使用谱协同聚类算法对文档进行双聚类

谱聚类算法演示

谱聚类算法演示

Calibration#

Examples illustrating the calibration of predicted probabilities of classifiers.

3类分类的概率校准

3类分类的概率校准

分类器校准比较

分类器校准比较

分类器的概率校准

分类器的概率校准

概率校准曲线

概率校准曲线

Classification#

General examples about classification algorithms.

分类器比较

分类器比较

用于分类的普通、Ledoit-Wolf 和 OAS 线性判别分析

用于分类的普通、Ledoit-Wolf 和 OAS 线性判别分析

线性判别分析和二次判别分析的协方差椭球体

线性判别分析和二次判别分析的协方差椭球体

绘制分类概率

绘制分类概率

识别手写数字

识别手写数字

Clustering#

Examples concerning the sklearn.cluster module.

DBSCAN聚类算法演示

DBSCAN聚类算法演示

HDBSCAN聚类算法演示

HDBSCAN聚类算法演示

K-Means 和 MiniBatchKMeans 聚类算法的比较

K-Means 和 MiniBatchKMeans 聚类算法的比较

K-Means++ 初始化示例

K-Means++ 初始化示例

K-means 聚类

K-means 聚类

OPTICS聚类算法示例

OPTICS聚类算法示例

k-means 假设的演示

k-means 假设的演示

k-means 初始化影响的经验评估

k-means 初始化影响的经验评估

二分 K-Means 和常规 K-Means 性能比较

二分 K-Means 和常规 K-Means 性能比较

二维嵌入数字的各种凝聚聚类

二维嵌入数字的各种凝聚聚类

亲和传播聚类算法示例

亲和传播聚类算法示例

使用K均值的颜色量化

使用K均值的颜色量化

使用不同度量的凝聚聚类

使用不同度量的凝聚聚类

使用轮廓分析选择KMeans聚类的簇数

使用轮廓分析选择KMeans聚类的簇数

在玩具数据集上比较不同的聚类算法

在玩具数据集上比较不同的聚类算法

在线学习人脸部件的字典

在线学习人脸部件的字典

均值漂移聚类算法示例

均值漂移聚类算法示例

对比不同层次聚类方法在玩具数据集上的表现

对比不同层次聚类方法在玩具数据集上的表现

将希腊硬币的图片分割成多个区域

将希腊硬币的图片分割成多个区域

层次聚类:结构化 vs 非结构化 Ward

层次聚类:结构化 vs 非结构化 Ward

带有和不带有结构的凝聚聚类

带有和不带有结构的凝聚聚类

归纳聚类

归纳聚类

手写数字数据上的K-Means聚类演示

手写数字数据上的K-Means聚类演示

比较 BIRCH 和 MiniBatchKMeans

比较 BIRCH 和 MiniBatchKMeans

特征聚合

特征聚合

特征聚合与单变量选择

特征聚合与单变量选择

用于图像分割的谱聚类

用于图像分割的谱聚类

矢量量化示例

矢量量化示例

硬币图像的结构化Ward层次聚类演示

硬币图像的结构化Ward层次聚类演示

绘制层次聚类树状图

绘制层次聚类树状图

聚类性能评估中的机会调整

聚类性能评估中的机会调整

Covariance estimation#

Examples concerning the sklearn.covariance module.

Ledoit-Wolf 与 OAS 估计

Ledoit-Wolf 与 OAS 估计

收缩协方差估计:LedoitWolf vs OAS 和最大似然

收缩协方差估计:LedoitWolf vs OAS 和最大似然

稀疏逆协方差估计

稀疏逆协方差估计

稳健与经验协方差估计

稳健与经验协方差估计

稳健的协方差估计和马氏距离的相关性

稳健的协方差估计和马氏距离的相关性

Cross decomposition#

Examples concerning the sklearn.cross_decomposition module.

主成分回归与偏最小二乘回归

主成分回归与偏最小二乘回归

比较交叉分解方法

比较交叉分解方法

Dataset examples#

Examples concerning the sklearn.datasets module.

数字数据集

数字数据集

绘制随机生成的分类数据集

绘制随机生成的分类数据集

绘制随机生成的多标签数据集

绘制随机生成的多标签数据集

鸢尾花数据集

鸢尾花数据集

Decision Trees#

Examples concerning the sklearn.tree module.

决策树回归

决策树回归

多输出决策树回归

多输出决策树回归

理解决策树结构

理解决策树结构

绘制在鸢尾花数据集上训练的决策树的决策边界

绘制在鸢尾花数据集上训练的决策树的决策边界

通过代价复杂度剪枝对决策树进行后剪枝

通过代价复杂度剪枝对决策树进行后剪枝

Decomposition#

Examples concerning the sklearn.decomposition module.

LDA和PCA在鸢尾花数据集上的二维投影比较

LDA和PCA在鸢尾花数据集上的二维投影比较

sphx_glr_auto_examples_decomposition_plot_ica_vs_pca.py

二维点云上的快速独立成分分析

人脸数据集分解

人脸数据集分解

使用FastICA进行盲源分离

使用FastICA进行盲源分离

使用字典学习进行图像去噪

使用字典学习进行图像去噪

使用概率PCA和因子分析(FA)进行模型选择

使用概率PCA和因子分析(FA)进行模型选择

使用预先计算的字典进行稀疏编码

使用预先计算的字典进行稀疏编码

使用鸢尾花数据集的PCA示例

使用鸢尾花数据集的PCA示例

因子分析(带旋转)以可视化模式

因子分析(带旋转)以可视化模式

增量PCA

增量PCA

核主成分分析

核主成分分析

Developing Estimators#

Examples concerning the development of Custom Estimator.

__sklearn_is_fitted__ 作为开发者 API

__sklearn_is_fitted__ 作为开发者 API

Ensemble methods#

Examples concerning the sklearn.ensemble module.

AdaBoost 决策树回归

AdaBoost 决策树回归

IsolationForest 示例

IsolationForest 示例

二分类AdaBoost

二分类AdaBoost

使用堆叠方法结合预测器

使用堆叠方法结合预测器

使用完全随机树的哈希特征变换

使用完全随机树的哈希特征变换

使用并行树森林评估像素重要性

使用并行树森林评估像素重要性

使用树的森林评估特征重要性

使用树的森林评估特征重要性

使用树集成进行特征转换

使用树集成进行特征转换

单一估计器与袋装法:偏差-方差分解

单一估计器与袋装法:偏差-方差分解

单调约束

单调约束

多类AdaBoost决策树

多类AdaBoost决策树

梯度提升中的提前停止

梯度提升中的提前停止

梯度提升中的类别特征支持

梯度提升中的类别特征支持

梯度提升回归

梯度提升回归

梯度提升回归的预测区间

梯度提升回归的预测区间

sphx_glr_auto_examples_ensemble_plot_gradient_boosting_regularization.py

梯度提升正则化

梯度提升袋外估计

梯度提升袋外估计

比较随机森林和多输出元估计器

比较随机森林和多输出元估计器

比较随机森林和直方图梯度提升模型

比较随机森林和直方图梯度提升模型

直方图梯度提升树的特性

直方图梯度提升树的特性

绘制VotingClassifier的决策边界

绘制VotingClassifier的决策边界

绘制个体和投票回归预测

绘制个体和投票回归预测

绘制由VotingClassifier计算的类别概率

绘制由VotingClassifier计算的类别概率

绘制鸢尾花数据集上树集成的决策边界

绘制鸢尾花数据集上树集成的决策边界

随机森林的袋外误差

随机森林的袋外误差

Examples based on real world datasets#

Applications to real world problems with some medium sized datasets or interactive user interface.

使用核PCA进行图像去噪

使用核PCA进行图像去噪

使用特征脸和支持向量机进行人脸识别的示例

使用特征脸和支持向量机进行人脸识别的示例

使用非负矩阵分解和潜在狄利克雷分配进行主题提取

使用非负矩阵分解和潜在狄利克雷分配进行主题提取

压缩感知:具有L1先验(Lasso)的断层扫描重建

压缩感知:具有L1先验(Lasso)的断层扫描重建

可视化股票市场结构

可视化股票市场结构

文本文档的外存分类

文本文档的外存分类

时间序列预测的滞后特征

时间序列预测的滞后特征

时间相关特征工程

时间相关特征工程

模型复杂度影响

模型复杂度影响

物种分布建模

物种分布建模

真实数据集上的异常值检测

真实数据集上的异常值检测

维基百科主特征向量

维基百科主特征向量

预测延迟

预测延迟

Feature Selection#

Examples concerning the sklearn.feature_selection module.

ANOVA SVM 管道

ANOVA SVM 管道

F检验和互信息的比较

F检验和互信息的比较

单变量特征选择

单变量特征选择

基于模型和顺序特征选择

基于模型和顺序特征选择

带交叉验证的递归特征消除

带交叉验证的递归特征消除

递归特征消除

递归特征消除

Gaussian Mixture Models#

Examples concerning the sklearn.mixture module.

GMM 初始化方法

GMM 初始化方法

GMM 协方差

GMM 协方差

变分贝叶斯高斯混合模型的浓度先验类型分析

变分贝叶斯高斯混合模型的浓度先验类型分析

高斯混合模型椭圆体

高斯混合模型椭圆体

高斯混合模型正弦曲线

高斯混合模型正弦曲线

高斯混合模型的密度估计

高斯混合模型的密度估计

高斯混合模型选择

高斯混合模型选择

Gaussian Process for Machine Learning#

Examples concerning the sklearn.gaussian_process module.

不同核函数下高斯过程的先验和后验示例

不同核函数下高斯过程的先验和后验示例

使用高斯过程回归(GPR)对莫纳罗亚数据集的CO2水平进行预测

使用高斯过程回归(GPR)对莫纳罗亚数据集的CO2水平进行预测

在 XOR 数据集上展示高斯过程分类 (GPC)

在 XOR 数据集上展示高斯过程分类 (GPC)

基于高斯过程分类(GPC)的鸢尾花数据集

基于高斯过程分类(GPC)的鸢尾花数据集

核岭回归和高斯过程回归的比较

核岭回归和高斯过程回归的比较

离散数据结构上的高斯过程

离散数据结构上的高斯过程

高斯过程分类 (GPC) 的概率预测

高斯过程分类 (GPC) 的概率预测

高斯过程分类 (GPC) 的等概率线

高斯过程分类 (GPC) 的等概率线

高斯过程回归 (GPR) 估计数据噪声水平的能力

高斯过程回归 (GPR) 估计数据噪声水平的能力

高斯过程回归:基础入门示例

高斯过程回归:基础入门示例

Generalized Linear Models#

Examples concerning the sklearn.linear_model module.

20类新闻组数据集上的多分类稀疏逻辑回归

20类新闻组数据集上的多分类稀疏逻辑回归

L1-正则化路径的逻辑回归

L1-正则化路径的逻辑回归

L1惩罚和逻辑回归中的稀疏性

L1惩罚和逻辑回归中的稀疏性

L2 正则化对岭回归系数的影响

L2 正则化对岭回归系数的影响

Lasso 和弹性网络

Lasso 和弹性网络

Lasso模型选择:AIC-BIC / 交叉验证

Lasso模型选择:AIC-BIC / 交叉验证

SGD:惩罚

SGD:惩罚

SGD:最大间隔分离超平面

SGD:最大间隔分离超平面

Theil-Sen 回归

Theil-Sen 回归

Tweedie回归在保险理赔中的应用

Tweedie回归在保险理赔中的应用

使用LARS的Lasso路径

使用LARS的Lasso路径

使用RANSAC进行稳健的线性模型估计

使用RANSAC进行稳健的线性模型估计

使用多项逻辑回归和L1正则化进行MNIST分类

使用多项逻辑回归和L1正则化进行MNIST分类

使用贝叶斯岭回归进行曲线拟合

使用贝叶斯岭回归进行曲线拟合

使用预计算的Gram矩阵和加权样本拟合弹性网络

使用预计算的Gram矩阵和加权样本拟合弹性网络

分位数回归

分位数回归

单类支持向量机与使用随机梯度下降的单类支持向量机

单类支持向量机与使用随机梯度下降的单类支持向量机

在鸢尾花数据集上绘制多类SGD

在鸢尾花数据集上绘制多类SGD

基于L1的稀疏信号模型

基于L1的稀疏信号模型

多任务Lasso的联合特征选择

多任务Lasso的联合特征选择

多项式和样条插值

多项式和样条插值

带有强异常值的数据集上的Huber回归与岭回归对比

带有强异常值的数据集上的Huber回归与岭回归对比

普通最小二乘法和岭回归方差

普通最小二乘法和岭回归方差

正交匹配追踪

正交匹配追踪

比较各种在线求解器

比较各种在线求解器

比较线性贝叶斯回归器

比较线性贝叶斯回归器

泊松回归和非正态损失

泊松回归和非正态损失

稀疏性示例:仅拟合特征1和特征2

稀疏性示例:仅拟合特征1和特征2

稠密数据和稀疏数据上的Lasso回归

稠密数据和稀疏数据上的Lasso回归

稳健线性估计拟合

稳健线性估计拟合

线性回归示例

线性回归示例

绘制多项式和一对其余逻辑回归

绘制多项式和一对其余逻辑回归

绘制岭回归系数与正则化参数的关系

绘制岭回归系数与正则化参数的关系

通过信息准则进行Lasso模型选择

通过信息准则进行Lasso模型选择

逻辑函数

逻辑函数

逻辑回归三分类器

逻辑回归三分类器

随机梯度下降的早停

随机梯度下降的早停

随机梯度下降:凸损失函数

随机梯度下降:凸损失函数

随机梯度下降:加权样本

随机梯度下降:加权样本

非负最小二乘法

非负最小二乘法

Inspection#

Examples related to the sklearn.inspection module.

具有多重共线性或相关特征的排列重要性

具有多重共线性或相关特征的排列重要性

机器学习在推断因果效应方面的失败

机器学习在推断因果效应方面的失败

线性模型系数解释中的常见陷阱

线性模型系数解释中的常见陷阱

置换重要性与随机森林特征重要性(MDI)对比

置换重要性与随机森林特征重要性(MDI)对比

部分依赖图和个体条件期望图

部分依赖图和个体条件期望图

Kernel Approximation#

Examples concerning the sklearn.kernel_approximation module.

通过多项式核近似实现可扩展学习

通过多项式核近似实现可扩展学习

Manifold learning#

Examples concerning the sklearn.manifold module.

t-SNE:不同困惑度值对形状的影响

t-SNE:不同困惑度值对形状的影响

多维尺度分析

多维尺度分析

手写数字的流形学习:局部线性嵌入,Isomap…

手写数字的流形学习:局部线性嵌入,Isomap...

流形学习方法的比较

流形学习方法的比较

球面上的流形学习方法

球面上的流形学习方法

瑞士卷和瑞士洞降维

瑞士卷和瑞士洞降维

Miscellaneous#

Miscellaneous and introductory examples for scikit-learn.

RBF核的显式特征映射近似

RBF核的显式特征映射近似

ROC 曲线与可视化 API

ROC 曲线与可视化 API

介绍 set_output API

介绍 set_output API

使用多输出估计器进行人脸补全

使用多输出估计器进行人脸补全

使用显示对象进行可视化

使用显示对象进行可视化

使用部分依赖的高级绘图

使用部分依赖的高级绘图

使用随机投影进行嵌入的Johnson-Lindenstrauss界限

使用随机投影进行嵌入的Johnson-Lindenstrauss界限

保序回归

保序回归

元数据路由

元数据路由

多标签分类

多标签分类

异常检测估计器的评估

异常检测估计器的评估

显示估计器和复杂的管道

显示估计器和复杂的管道

显示流水线

显示流水线

核岭回归和支持向量回归的比较

核岭回归和支持向量回归的比较

比较用于异常检测的算法在玩具数据集上的表现

比较用于异常检测的算法在玩具数据集上的表现

Missing Value Imputation#

Examples concerning the sklearn.impute module.

使用不同变体的迭代插补法填补缺失值

使用不同变体的迭代插补法填补缺失值

在构建估计器之前填补缺失值

在构建估计器之前填补缺失值

Model Selection#

Examples related to the sklearn.model_selection module.

交叉验证评分和GridSearchCV的多指标评估演示

交叉验证评分和GridSearchCV的多指标评估演示

使用网格搜索进行模型的统计比较

使用网格搜索进行模型的统计比较

后处理调整决策函数的截断点

后处理调整决策函数的截断点

在 scikit-learn 中可视化交叉验证行为

在 scikit-learn 中可视化交叉验证行为

多分类接收者操作特性(ROC)

多分类接收者操作特性(ROC)

嵌套与非嵌套交叉验证

嵌套与非嵌套交叉验证

平衡模型复杂性和交叉验证得分

平衡模型复杂性和交叉验证得分

接收者操作特性(ROC)与交叉验证

接收者操作特性(ROC)与交叉验证

文本特征提取和评估的示例管道

文本特征提取和评估的示例管道

检测错误权衡(DET)曲线

检测错误权衡(DET)曲线

欠拟合与过拟合

欠拟合与过拟合

混淆矩阵

混淆矩阵

类似然比率用于衡量分类性能

类似然比率用于衡量分类性能

精确率-召回率

精确率-召回率

绘制交叉验证预测

绘制交叉验证预测

绘制学习曲线和检查模型的可扩展性

绘制学习曲线和检查模型的可扩展性

绘制验证曲线

绘制验证曲线

网格搜索与交叉验证的自定义重拟合策略

网格搜索与交叉验证的自定义重拟合策略

网格搜索与逐步减半的比较

网格搜索与逐步减半的比较

训练误差与测试误差

训练误差与测试误差

调整决策阈值以适应成本敏感学习

调整决策阈值以适应成本敏感学习

sphx_glr_auto_examples_model_selection_plot_successive_halving_iterations.py

连续减半迭代

通过排列检验分类评分的显著性

通过排列检验分类评分的显著性

随机搜索与网格搜索在超参数估计中的比较

随机搜索与网格搜索在超参数估计中的比较

Multiclass methods#

Examples concerning the sklearn.multiclass module.

多类训练元估计器概述

多类训练元估计器概述

Multioutput methods#

Examples concerning the sklearn.multioutput module.

使用分类器链进行多标签分类

使用分类器链进行多标签分类

Nearest Neighbors#

Examples concerning the sklearn.neighbors module.

TSNE中的近似最近邻

TSNE中的近似最近邻

使用局部离群因子(LOF)进行新颖性检测

使用局部离群因子(LOF)进行新颖性检测

使用局部离群因子(LOF)进行离群点检测

使用局部离群因子(LOF)进行离群点检测

使用邻域成分分析进行降维

使用邻域成分分析进行降维

最近质心分类

最近质心分类

最近邻分类

最近邻分类

最近邻回归

最近邻回归

核密度估计

核密度估计

比较有无邻域成分分析的最近邻分类

比较有无邻域成分分析的最近邻分类

物种分布的核密度估计

物种分布的核密度估计

简单的一维核密度估计

简单的一维核密度估计

缓存最近邻

缓存最近邻

邻域成分分析示例

邻域成分分析示例

Neural Networks#

Examples concerning the sklearn.neural_network module.

MNIST上MLP权重的可视化

MNIST上MLP权重的可视化

多层感知器中的正则化变化

多层感知器中的正则化变化

对比MLPClassifier的随机学习策略

对比MLPClassifier的随机学习策略

用于数字分类的受限玻尔兹曼机特征

用于数字分类的受限玻尔兹曼机特征

Pipelines and composite estimators#

Examples of how to compose transformers and pipelines from other estimators. See the User Guide.

使用Pipeline和GridSearchCV选择降维方法

使用Pipeline和GridSearchCV选择降维方法

具有异构数据源的列转换器

具有异构数据源的列转换器

带有混合类型的列转换器

带有混合类型的列转换器

流水线:将PCA和逻辑回归连接起来

流水线:将PCA和逻辑回归连接起来

转换回归模型中的目标变量的效果

转换回归模型中的目标变量的效果

连接多种特征提取方法

连接多种特征提取方法

Preprocessing#

Examples concerning the sklearn.preprocessing module.

使用KBinsDiscretizer离散连续特征

使用KBinsDiscretizer离散连续特征

将数据映射到正态分布

将数据映射到正态分布

展示KBinsDiscretizer的不同策略

展示KBinsDiscretizer的不同策略

比较不同缩放器对含有异常值的数据的影响

比较不同缩放器对含有异常值的数据的影响

特征离散化

特征离散化

特征缩放的重要性

特征缩放的重要性

目标编码器与其他编码器的比较

目标编码器与其他编码器的比较

目标编码器的内部交叉拟合

目标编码器的内部交叉拟合

Semi Supervised Classification#

Examples concerning the sklearn.semi_supervised module.

半监督分类器与SVM在鸢尾花数据集上的决策边界

半监督分类器与SVM在鸢尾花数据集上的决策边界

文本数据集上的半监督分类

文本数据集上的半监督分类

标签传播学习复杂结构

标签传播学习复杂结构

标签传播数字主动学习

标签传播数字主动学习

标签传播数字:展示性能

标签传播数字:展示性能

阈值变化对自训练的影响

阈值变化对自训练的影响

Support Vector Machines#

Examples concerning the sklearn.svm module.

RBF SVM 参数

RBF SVM 参数

SVM 平局打破示例

SVM 平局打破示例

SVM 边界示例

SVM 边界示例

SVM-Anova:带有单变量特征选择的SVM

SVM-Anova:带有单变量特征选择的SVM

SVM:加权样本

SVM:加权样本

SVM:最大间隔分离超平面

SVM:最大间隔分离超平面

SVM:用于不平衡类别的分离超平面

SVM:用于不平衡类别的分离超平面

使用不同SVM核函数绘制分类边界

使用不同SVM核函数绘制分类边界

使用线性和非线性核的支持向量回归 (SVR)

使用线性和非线性核的支持向量回归 (SVR)

使用非线性核(RBF)的单类SVM

使用非线性核(RBF)的单类SVM

在 LinearSVC 中绘制支持向量

在 LinearSVC 中绘制支持向量

在鸢尾花数据集上绘制不同的SVM分类器

在鸢尾花数据集上绘制不同的SVM分类器

带有自定义核函数的SVM

带有自定义核函数的SVM

缩放SVC的正则化参数

缩放SVC的正则化参数

Tutorial exercises#

Exercises for the tutorials

sphx_glr_auto_examples_exercises_plot_iris_exercise.py

SVM 练习

数字分类练习

数字分类练习

糖尿病数据集上的交叉验证练习

糖尿病数据集上的交叉验证练习

Working with text documents#

Examples concerning the sklearn.feature_extraction.text module.

使用k-means聚类文本文档

使用k-means聚类文本文档

使用稀疏特征对文本文档进行分类

使用稀疏特征对文本文档进行分类

特征哈希器和字典向量化器比较

特征哈希器和字典向量化器比较

Gallery generated by Sphinx-Gallery