mlxtend version: 0.23.1

autompg_data

autompg_data()

汽车MPG数据集.

Returns

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/data/autompg_data/

boston_housing_data

boston_housing_data()

波士顿房价数据集.

来源:https://archive.ics.uci.edu/ml/datasets/Housing
样本数量:506

连续目标变量:MEDV
MEDV = 业主自住房屋的中位数价值(单位:千美元)

数据集属性:

- 1) CRIM      按城镇划分的每人犯罪率
- 2) ZN        住宅用地超过 25,000 平方英尺的比例
- 3) INDUS     城镇中非零售商业用地的比例
- 4) CHAS      查尔斯河虚拟变量(如果地块靠近河流则为 1;否则为 0)
- 5) NOX       一氧化氮浓度(每千万分之一)
- 6) RM        每个住宅的平均房间数
- 7) AGE       1940 年以前建造的自住单位比例
- 8) DIS       到五个波士顿就业中心的加权距离
- 9) RAD       径向高速公路的可达性指数
- 10) TAX      每 10,000 美元的全额物业税率
- 11) PTRATIO  按城镇划分的师生比例
- 12) B        1000(Bk - 0.63)^2,其中 Bk 是按城镇划分的黑人比例
- 13) LSTAT    人口中地位较低者的百分比

Returns

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/data/boston_housing_data/

iris_data

iris_data(version='uci')

鸢尾花数据集.

来源:https://archive.ics.uci.edu/ml/datasets/Iris
样本数量:150
类别标签:{0, 1, 2},分布:[50, 50, 50]
0 = setosa, 1 = versicolor, 2 = virginica.

数据集属性:

- 1) 萼片长度 [cm]
- 2) 萼片宽度 [cm]
- 3) 花瓣长度 [cm]
- 4) 花瓣宽度 [cm]

Parameters

Returns

Notes

Iris数据集(最初由Edgar Anderson收集) 在UCI的机器学习库中提供的版本与 R.A. Fisher [1] 原始论文中描述的Iris数据集不同. 确切地说,UCI机器学习库中的两个数据点(行号 34和37)与最初发布的Iris数据集不同.此外, Iris数据集的原始版本,可以通过 version='corrected' 加载, 与R中的版本相同.

[1] . A. Fisher (1936). "The use of multiple measurements in taxonomic
problems". Annals of Eugenics. 7 (2): 179–188

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/data/iris_data/

loadlocal_mnist

loadlocal_mnist(images_path, labels_path)

读取MNIST数据集的ubyte文件.

Parameters

Returns

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/data/loadlocal_mnist/

make_multiplexer_dataset

make_multiplexer_dataset(address_bits=2, sample_size=100, positive_class_ratio=0.5, shuffle=False, random_seed=None)

创建二进制n位多路复用器数据集的函数.

在mlxtend v0.9中新增

Parameters

Returns

Examples

有关使用示例,请参见 https://rasbt.github.io/mlxtend/user_guide/data/make_multiplexer_dataset

mnist_data

mnist_data()

5000个来自MNIST手写数字数据集的样本.

数据来源:https://yann.lecun.com/exdb/mnist/

Returns

Examples

有关使用示例,请参见 https://rasbt.github.io/mlxtend/user_guide/data/mnist_data/

three_blobs_data

three_blobs_data()

用于聚类的3个2D数据块的随机数据集.

Returns

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/data/three_blobs_data

wine_data

wine_data()

葡萄酒数据集.

来源:https://archive.ics.uci.edu/ml/datasets/Wine
样本数量:178
类别标签:{0, 1, 2},分布:[59, 71, 48]

数据集属性:

- 1) 酒精
- 2) 苹果酸
- 3) 灰分
- 4) 灰分的碱度
- 5) 镁
- 6) 总酚
- 7) 类黄酮
- 8) 非类黄酮酚
- 9) 原花青素
- 10) 颜色强度
- 11) 色调
- 12) 稀释葡萄酒的OD280/OD315
- 13) 脯氨酸

Returns

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/data/wine_data