wine_data: 一个用于分类的三类葡萄酒数据集

一个将Wine数据集加载到NumPy数组中的函数。

> 从 mlxtend.data 导入 wine_data

概述

葡萄酒数据集用于分类。

样本数 178
特征 13
类别 3
数据集特征: 多元
属性特征: 整数, 实数
相关任务: 分类
缺失值
属性
1) 类别标签
2) 酒精含量
3) 苹果酸
4) 灰分
5) 灰分的碱度
6)
7) 总酚类
8) 黄酮类
9) 非黄酮类酚
10) 原花青素
11) 色彩强度
12) 色调
13) 稀释葡萄酒的OD280/OD315
14) 脯氨酸
类别 样本数
0 59
1 71
2 48

参考文献

示例 1 - 数据集概述

from mlxtend.data import wine_data
X, y = wine_data()

print('Dimensions: %s x %s' % (X.shape[0], X.shape[1]))
print('\nHeader: %s' % ['alcohol', 'malic acid', 'ash', 'ash alcalinity',
                        'magnesium', 'total phenols', 'flavanoids',
                        'nonflavanoid phenols', 'proanthocyanins',
                        'color intensity', 'hue', 'OD280/OD315 of diluted wines',
                        'proline'])
print('1st row', X[0])

Dimensions: 178 x 13

Header: ['alcohol', 'malic acid', 'ash', 'ash alcalinity', 'magnesium', 'total phenols', 'flavanoids', 'nonflavanoid phenols', 'proanthocyanins', 'color intensity', 'hue', 'OD280/OD315 of diluted wines', 'proline']
1st row [  1.42300000e+01   1.71000000e+00   2.43000000e+00   1.56000000e+01
   1.27000000e+02   2.80000000e+00   3.06000000e+00   2.80000000e-01
   2.29000000e+00   5.64000000e+00   1.04000000e+00   3.92000000e+00
   1.06500000e+03]
import numpy as np
print('Classes: %s' % np.unique(y))
print('Class distribution: %s' % np.bincount(y))

Classes: [0 1 2]
Class distribution: [59 71 48]

API

wine_data()

Wine dataset.

Returns

Examples

For usage examples, please see https://rasbt.github.io/mlxtend/user_guide/data/wine_data