load_wine#
- sklearn.datasets.load_wine(*, return_X_y=False, as_frame=False)#
加载并返回葡萄酒数据集(分类)。
Added in version 0.18.
葡萄酒数据集是一个经典且非常简单的多类分类数据集。
从以下网址下载并修改UCI ML葡萄酒数据集数据集以适应标准格式: https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data
更多信息请参阅 用户指南 。
- Parameters:
- return_X_ybool, 默认=False
如果为True,返回
(数据, 目标)
而不是Bunch对象。 有关数据
和目标
对象的更多信息,请参见下文。- as_framebool, 默认=False
如果为True,数据是一个包含适当数据类型(数值型)列的pandas DataFrame。目标是一个 pandas DataFrame或Series,具体取决于目标列的数量。 如果
return_X_y
为True,则 (数据
,目标
) 将是如下面所述的pandas DataFrame或Series。Added in version 0.23.
- Returns:
- 数据
Bunch
类似字典的对象,具有以下属性。
- 数据{ndarray, dataframe} 形状为 (178, 13)
数据矩阵。如果
as_frame=True
,数据
将是一个pandas DataFrame。- 目标: {ndarray, Series} 形状为 (178,)
分类目标。如果
as_frame=True
,目标
将是一个pandas Series。- 特征名称: list
数据集列的名称。
- 目标名称: list
目标类别的名称。
- 框架: DataFrame 形状为 (178, 14)
仅在
as_frame=True
时存在。包含数据
和目标
的DataFrame。Added in version 0.23.
- DESCR: str
数据集的完整描述。
- (数据, 目标)如果
return_X_y
为True,则为tuple 默认情况下为两个ndarrays的tuple。第一个包含形状为 (178, 13) 的2D数组,每行代表一个样本,每列代表 特征。第二个形状为 (178,) 的数组包含目标样本。
- 数据
Examples
假设你对样本10、80和140感兴趣,并想知道它们的类别名称。
>>> from sklearn.datasets import load_wine >>> data = load_wine() >>> data.target[[10, 80, 140]] array([0, 1, 2]) >>> list(data.target_names) ['class_0', 'class_1', 'class_2']