load_iris#

sklearn.datasets.load_iris(*, return_X_y=False, as_frame=False)#

加载并返回鸢尾花数据集(分类)。

鸢尾花数据集是一个经典且非常简单的多类分类数据集。

更多信息请参阅 用户指南

Parameters:
return_X_ybool, 默认=False

如果为True,返回 (数据, 目标) 而不是一个Bunch对象。有关 数据目标 对象的更多信息,请参见下文。

Added in version 0.18.

as_framebool, 默认=False

如果为True,数据是一个包含适当数据类型(数值型)列的pandas DataFrame。目标是一个pandas DataFrame或Series,取决于目标列的数量。如果 return_X_y 为True,那么 ( 数据 , 目标 ) 将是如下面描述的pandas DataFrame或Series。

Added in version 0.23.

Returns:
dataBunch

字典类对象,具有以下属性。

data{ndarray, dataframe} 形状为 (150, 4)

数据矩阵。如果 as_frame=Truedata 将是一个pandas DataFrame。

target: {ndarray, Series} 形状为 (150,)

分类目标。如果 as_frame=Truetarget 将是一个pandas Series。

feature_names: list

数据集列的名称。

target_names: list

目标类别的名称。

frame: DataFrame 形状为 (150, 5)

仅当 as_frame=True 时存在。包含 datatarget 的DataFrame。

Added in version 0.23.

DESCR: str

数据集的完整描述。

filename: str

数据位置的路径。

Added in version 0.20.

(data, target)如果 return_X_y 为True,则为tuple

包含两个ndarray的元组。第一个包含形状为 (n_samples, n_features) 的2D数组,每行代表一个样本,每列代表特征。第二个ndarray形状为 (n_samples,),包含目标样本。

Added in version 0.18.

Notes

Changed in version 0.20: 根据Fisher的论文修复了两个错误的数据点。新版本与R中的相同,但与UCI机器学习库中的不同。

Examples

假设你对样本10、25和50感兴趣,并想知道它们的类别名称。

>>> from sklearn.datasets import load_iris
>>> data = load_iris()
>>> data.target[[10, 25, 50]]
array([0, 0, 1])
>>> list(data.target_names)
['setosa', 'versicolor', 'virginica']

有关如何使用鸢尾花数据集的更详细示例,请参见 鸢尾花数据集