wine_data: 一个用于分类的三类葡萄酒数据集
一个将Wine
数据集加载到NumPy数组中的函数。
> 从 mlxtend.data 导入 wine_data
概述
葡萄酒数据集用于分类。
样本数 | 178 |
特征 | 13 |
类别 | 3 |
数据集特征: | 多元 |
属性特征: | 整数, 实数 |
相关任务: | 分类 |
缺失值 | 无 |
列 | 属性 |
---|---|
1) | 类别标签 |
2) | 酒精含量 |
3) | 苹果酸 |
4) | 灰分 |
5) | 灰分的碱度 |
6) | 镁 |
7) | 总酚类 |
8) | 黄酮类 |
9) | 非黄酮类酚 |
10) | 原花青素 |
11) | 色彩强度 |
12) | 色调 |
13) | 稀释葡萄酒的OD280/OD315 |
14) | 脯氨酸 |
类别 | 样本数 |
---|---|
0 | 59 |
1 | 71 |
2 | 48 |
参考文献
- Forina, M. 等, PARVUS - 一个可扩展的数据探索、分类和相关性分析包。 药物和食品分析与技术研究所,Via Brigata Salerno, 16147 热那亚,意大利。
- 来源: https://archive.ics.uci.edu/ml/datasets/Wine
- Bache, K. & Lichman, M. (2013). UCI机器学习库. 加利福尼亚州尔湾: 加利福尼亚大学信息与计算机科学学院。
示例 1 - 数据集概述
from mlxtend.data import wine_data
X, y = wine_data()
print('Dimensions: %s x %s' % (X.shape[0], X.shape[1]))
print('\nHeader: %s' % ['alcohol', 'malic acid', 'ash', 'ash alcalinity',
'magnesium', 'total phenols', 'flavanoids',
'nonflavanoid phenols', 'proanthocyanins',
'color intensity', 'hue', 'OD280/OD315 of diluted wines',
'proline'])
print('1st row', X[0])
Dimensions: 178 x 13
Header: ['alcohol', 'malic acid', 'ash', 'ash alcalinity', 'magnesium', 'total phenols', 'flavanoids', 'nonflavanoid phenols', 'proanthocyanins', 'color intensity', 'hue', 'OD280/OD315 of diluted wines', 'proline']
1st row [ 1.42300000e+01 1.71000000e+00 2.43000000e+00 1.56000000e+01
1.27000000e+02 2.80000000e+00 3.06000000e+00 2.80000000e-01
2.29000000e+00 5.64000000e+00 1.04000000e+00 3.92000000e+00
1.06500000e+03]
import numpy as np
print('Classes: %s' % np.unique(y))
print('Class distribution: %s' % np.bincount(y))
Classes: [0 1 2]
Class distribution: [59 71 48]
API
wine_data()
Wine dataset.
-
Source
: https://archive.ics.uci.edu/ml/datasets/Wine -
Number of samples
: 178 -
Class labels
: {0, 1, 2}, distribution: [59, 71, 48]Dataset Attributes:
- 1) Alcohol
- 2) Malic acid
- 3) Ash
- 4) Alcalinity of ash
- 5) Magnesium
- 6) Total phenols
- 7) Flavanoids
- 8) Nonflavanoid phenols
- 9) Proanthocyanins
- 10) Color intensity
- 11) Hue
- 12) OD280/OD315 of diluted wines
- 13) Proline
Returns
-
X, y
: [n_samples, n_features], [n_class_labels]X is the feature matrix with 178 wine samples as rows and 13 feature columns. y is a 1-dimensional array of the 3 class labels 0, 1, 2
Examples
For usage examples, please see https://rasbt.github.io/mlxtend/user_guide/data/wine_data