load_digits#
- sklearn.datasets.load_digits(*, n_class=10, return_X_y=False, as_frame=False)#
加载并返回数字数据集(分类)。
每个数据点是一个8x8的数字图像。
这是UCI ML手写数字数据集测试集的副本 https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits
在 用户指南 中阅读更多信息。
- Parameters:
- n_classint, 默认=10
返回的类别数量。介于0和10之间。
- return_X_ybool, 默认=False
如果为True,返回
(数据, 目标)
而不是Bunch对象。 有关数据
和目标
对象的更多信息,请参见下文。Added in version 0.18.
- as_framebool, 默认=False
如果为True,数据是一个包含适当数据类型(数值)列的pandas DataFrame。 目标是一个pandas DataFrame或Series,取决于目标列的数量。 如果
return_X_y
为True,那么(数据
,目标
)将是如下面所述的pandas DataFrame或Series。Added in version 0.23.
- Returns:
- data
Bunch
类似字典的对象,具有以下属性。
- data{ndarray, dataframe} 形状为 (1797, 64)
展平的数据矩阵。如果
as_frame=True
,data
将是一个pandas DataFrame。- target: {ndarray, Series} 形状为 (1797,)
分类目标。如果
as_frame=True
,target
将是一个pandas Series。- feature_names: list
数据集列的名称。
- target_names: list
目标类别的名称。
Added in version 0.20.
- frame: DataFrame 形状为 (1797, 65)
仅当
as_frame=True
时存在。包含data
和target
的DataFrame。Added in version 0.23.
- images: {ndarray} 形状为 (1797, 8, 8)
原始图像数据。
- DESCR: str
数据集的完整描述。
- (data, target)tuple 如果
return_X_y
为 True 默认情况下为两个ndarray的元组。第一个包含形状为 (1797, 64) 的2D ndarray, 每行代表一个样本,每列代表特征。第二个形状为 (1797) 的ndarray包含目标样本。 如果
as_frame=True
,两个数组都是pandas对象,即X
是一个dataframe,y
是一个series。Added in version 0.18.
- data
Examples
加载数据并可视化图像:
>>> from sklearn.datasets import load_digits >>> digits = load_digits() >>> print(digits.data.shape) (1797, 64) >>> import matplotlib.pyplot as plt >>> plt.gray() >>> plt.matshow(digits.images[0]) <...> >>> plt.show()
Gallery examples#
使用随机投影进行嵌入的Johnson-Lindenstrauss界限