load_diabetes#
- sklearn.datasets.load_diabetes(*, return_X_y=False, as_frame=False, scaled=True)#
加载并返回糖尿病数据集(回归)。
Note
每个特征的含义(即
feature_names
)可能不明确 (特别是对于ltg
),因为原始数据集的文档 没有明确说明。我们提供了在此研究领域中 似乎正确的信息。更多信息请参阅 用户指南 。
- Parameters:
- return_X_ybool, 默认=False
如果为 True,返回
(data, target)
而不是 Bunch 对象。 有关data
和target
对象的更多信息,请参见下文。Added in version 0.18.
- as_framebool, 默认=False
如果为 True,数据是一个包含适当数据类型(数值型)列的 pandas DataFrame。 目标是一个 pandas DataFrame 或 Series,具体取决于目标列的数量。 如果
return_X_y
为 True,则 (data
,target
) 将是如 下所述的 pandas DataFrame 或 Series。Added in version 0.23.
- scaledbool, 默认=True
如果为 True,特征变量通过均值中心化并按标准差乘以
n_samples
的平方根进行缩放。 如果为 False,返回特征变量的原始数据。Added in version 1.1.
- Returns:
- data
Bunch
类似字典的对象,具有以下属性。
- data{ndarray, dataframe} 形状为 (442, 10)
数据矩阵。如果
as_frame=True
,data
将是一个 pandas DataFrame。- target: {ndarray, Series} 形状为 (442,)
回归目标。如果
as_frame=True
,target
将是一个 pandas Series。- feature_names: list
数据集列的名称。
- frame: DataFrame 形状为 (442, 11)
仅在
as_frame=True
时存在。包含data
和target
的 DataFrame。Added in version 0.23.
- DESCR: str
数据集的完整描述。
- data_filename: str
数据位置的路径。
- target_filename: str
目标位置的路径。
- (data, target)tuple 如果
return_X_y
为 True 返回形状为 (n_samples, n_features) 的两个 ndarray 的元组 一个二维数组,每行表示一个样本,每列表示给定样本的特征和/或目标。
Added in version 0.18.
- data
Examples
>>> from sklearn.datasets import load_diabetes >>> diabetes = load_diabetes() >>> diabetes.target[:3] array([151., 75., 141.]) >>> diabetes.data.shape (442, 10)