sklearn.datasets#
工具加载流行数据集和人工数据生成器。
User guide. See the 数据集加载工具 section for further details.
Loaders#
删除数据主目录缓存的所有内容。 |
|
将数据集以svmlight / libsvm文件格式转储。 |
|
加载20个新闻组数据集的文件名和数据(分类)。 |
|
加载并向量化20个新闻组数据集(分类)。 |
|
加载加利福尼亚住房数据集(回归)。 |
|
加载covertype数据集(分类)。 |
|
加载kddcup99数据集(分类)。 |
|
加载Labeled Faces in the Wild (LFW) pairs数据集(分类)。 |
|
加载Labeled Faces in the Wild (LFW)人物数据集(分类)。 |
|
加载来自AT&T的Olivetti人脸数据集(分类)。 |
|
从openml按名称或数据集ID获取数据集。 |
|
加载RCV1多标签数据集(分类)。 |
|
加载Phillips等人(2006年)的物种分布数据集的加载器。 |
|
返回scikit-learn数据目录的路径。 |
|
加载并返回乳腺癌威斯康星数据集(分类)。 |
|
加载并返回糖尿病数据集(回归)。 |
|
加载并返回数字数据集(分类)。 |
|
加载带有类别作为子文件夹名称的文本文件。 |
|
加载并返回鸢尾花数据集(分类)。 |
|
加载并返回物理锻炼Linnerud数据集。 |
|
加载单个样本图像的numpy数组。 |
|
加载用于图像处理的示例图像。 |
|
加载以svmlight / libsvm格式存储的数据集到稀疏CSR矩阵中。 |
|
从多个文件加载数据集,文件格式为SVMlight格式。 |
|
加载并返回葡萄酒数据集(分类)。 |
Sample generators#
生成一个用于双聚类的常量块对角结构数组。 |
|
生成用于聚类的各向同性高斯斑点。 |
|
生成一个用于双聚类的块状棋盘结构的数组。 |
|
创建一个包含较小圆的大圆在二维平面上。 |
|
生成一个随机的n类分类问题。 |
|
生成“Friedman #1”回归问题。 |
|
生成 "Friedman #2" 回归问题。 |
|
生成“Friedman #3”回归问题。 |
|
生成各向同性高斯和按分位数标记的样本。 |
|
生成用于Hastie等人在2009年提出的二分类数据,示例10.2。 |
|
生成一个主要为低秩矩阵,具有钟形奇异值。 |
|
制作两个交错的半圆。 |
|
生成一个随机的多标签分类问题。 |
|
生成一个随机回归问题。 |
|
生成一个S形曲线数据集。 |
|
生成一个由字典元素稀疏组合而成的信号。 |
|
生成一个稀疏的对称正定矩阵。 |
|
生成一个具有稀疏不相关设计的随机回归问题。 |
|
生成一个随机的对称正定矩阵。 |
|
生成一个瑞士卷数据集。 |