fetch_olivetti_faces#

sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)#

加载来自AT&T的Olivetti人脸数据集(分类)。

如果需要,下载它。

Classes

40

Samples total

400

Dimensionality

4096

Features

real, between 0 and 1

更多信息请参阅 用户指南

Parameters:
data_homestr or path-like, default=None

指定数据集的另一个下载和缓存文件夹。默认情况下,所有scikit-learn数据存储在’~/scikit_learn_data’子文件夹中。

shufflebool, default=False

如果为True,数据集的顺序会被打乱,以避免同一个人的图像被分组在一起。

random_stateint, RandomState instance or None, default=0

确定数据集洗牌的随机数生成。为多个函数调用提供可重复的输出,请传递一个int。 请参阅 术语

download_if_missingbool, default=True

如果为False,如果数据在本地不可用,则引发OSError,而不是尝试从源站点下载数据。

return_X_ybool, default=False

如果为True,返回 (data, target) 而不是 Bunch 对象。有关 datatarget 对象的更多信息,请参见下文。

Added in version 0.22.

n_retriesint, default=3

遇到HTTP错误时的重试次数。

Added in version 1.5.

delayfloat, default=1.0

重试之间的秒数。

Added in version 1.5.

Returns:
dataBunch

类似字典的对象,具有以下属性。

data: ndarray, shape (400, 4096)

每一行对应于原始大小为64 x 64像素的展开人脸图像。

imagesndarray, shape (400, 64, 64)

每一行是一个对应于数据集中40个主体之一的面部图像。

targetndarray, shape (400,)

与每个人脸图像相关的标签。 这些标签的范围是0-39,对应于主体ID。

DESCRstr

修改后的Olivetti人脸数据集的描述。

(data, target)tuple if return_X_y=True

包含上述 datatarget 对象的元组。

Added in version 0.22.

Examples

>>> from sklearn.datasets import fetch_olivetti_faces
>>> olivetti_faces = fetch_olivetti_faces()
>>> olivetti_faces.data.shape
(400, 4096)
>>> olivetti_faces.target.shape
(400,)
>>> olivetti_faces.images.shape
(400, 64, 64)