load_diabetes#

sklearn.datasets.load_diabetes(*, return_X_y=False, as_frame=False, scaled=True)#

加载并返回糖尿病数据集(回归)。

Note

每个特征的含义(即 feature_names )可能不明确 (特别是对于 ltg ),因为原始数据集的文档 没有明确说明。我们提供了在此研究领域中 似乎正确的信息。

更多信息请参阅 用户指南

Parameters:
return_X_ybool, 默认=False

如果为 True,返回 (data, target) 而不是 Bunch 对象。 有关 datatarget 对象的更多信息,请参见下文。

Added in version 0.18.

as_framebool, 默认=False

如果为 True,数据是一个包含适当数据类型(数值型)列的 pandas DataFrame。 目标是一个 pandas DataFrame 或 Series,具体取决于目标列的数量。 如果 return_X_y 为 True,则 ( data , target ) 将是如 下所述的 pandas DataFrame 或 Series。

Added in version 0.23.

scaledbool, 默认=True

如果为 True,特征变量通过均值中心化并按标准差乘以 n_samples 的平方根进行缩放。 如果为 False,返回特征变量的原始数据。

Added in version 1.1.

Returns:
dataBunch

类似字典的对象,具有以下属性。

data{ndarray, dataframe} 形状为 (442, 10)

数据矩阵。如果 as_frame=Truedata 将是一个 pandas DataFrame。

target: {ndarray, Series} 形状为 (442,)

回归目标。如果 as_frame=Truetarget 将是一个 pandas Series。

feature_names: list

数据集列的名称。

frame: DataFrame 形状为 (442, 11)

仅在 as_frame=True 时存在。包含 datatarget 的 DataFrame。

Added in version 0.23.

DESCR: str

数据集的完整描述。

data_filename: str

数据位置的路径。

target_filename: str

目标位置的路径。

(data, target)tuple 如果 return_X_y 为 True

返回形状为 (n_samples, n_features) 的两个 ndarray 的元组 一个二维数组,每行表示一个样本,每列表示给定样本的特征和/或目标。

Added in version 0.18.

Examples

>>> from sklearn.datasets import load_diabetes
>>> diabetes = load_diabetes()
>>> diabetes.target[:3]
array([151.,  75., 141.])
>>> diabetes.data.shape
(442, 10)