load_iris#
- sklearn.datasets.load_iris(*, return_X_y=False, as_frame=False)#
加载并返回鸢尾花数据集(分类)。
鸢尾花数据集是一个经典且非常简单的多类分类数据集。
更多信息请参阅 用户指南 。
- Parameters:
- return_X_ybool, 默认=False
如果为True,返回
(数据, 目标)
而不是一个Bunch对象。有关数据
和目标
对象的更多信息,请参见下文。Added in version 0.18.
- as_framebool, 默认=False
如果为True,数据是一个包含适当数据类型(数值型)列的pandas DataFrame。目标是一个pandas DataFrame或Series,取决于目标列的数量。如果
return_X_y
为True,那么 (数据
,目标
) 将是如下面描述的pandas DataFrame或Series。Added in version 0.23.
- Returns:
- data
Bunch
字典类对象,具有以下属性。
- data{ndarray, dataframe} 形状为 (150, 4)
数据矩阵。如果
as_frame=True
,data
将是一个pandas DataFrame。- target: {ndarray, Series} 形状为 (150,)
分类目标。如果
as_frame=True
,target
将是一个pandas Series。- feature_names: list
数据集列的名称。
- target_names: list
目标类别的名称。
- frame: DataFrame 形状为 (150, 5)
仅当
as_frame=True
时存在。包含data
和target
的DataFrame。Added in version 0.23.
- DESCR: str
数据集的完整描述。
- filename: str
数据位置的路径。
Added in version 0.20.
- (data, target)如果
return_X_y
为True,则为tuple 包含两个ndarray的元组。第一个包含形状为 (n_samples, n_features) 的2D数组,每行代表一个样本,每列代表特征。第二个ndarray形状为 (n_samples,),包含目标样本。
Added in version 0.18.
- data
Notes
Changed in version 0.20: 根据Fisher的论文修复了两个错误的数据点。新版本与R中的相同,但与UCI机器学习库中的不同。
Examples
假设你对样本10、25和50感兴趣,并想知道它们的类别名称。
>>> from sklearn.datasets import load_iris >>> data = load_iris() >>> data.target[[10, 25, 50]] array([0, 0, 1]) >>> list(data.target_names) ['setosa', 'versicolor', 'virginica']
有关如何使用鸢尾花数据集的更详细示例,请参见 鸢尾花数据集 。
Gallery examples#
sphx_glr_auto_examples_exercises_plot_iris_exercise.py