dask_ml.preprocessing.MinMaxScaler

dask_ml.preprocessing.MinMaxScaler

class dask_ml.preprocessing.MinMaxScaler(feature_range=(0, 1), *, copy=True, clip=False)[源代码]

通过将每个特征缩放到给定范围来转换特征。

该估计器对每个特征进行缩放和转换,使其在训练集上的范围为给定值,例如在零和一之间。

变换由以下给出:

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

其中 min, max = feature_range。

这种转换通常被用作零均值、单位方差缩放的替代方法。

MinMaxScaler 不会减少异常值的影响,但它会线性地将它们缩放到一个固定范围内,其中最大的数据点对应于最大值,最小的数据点对应于最小值。有关示例可视化,请参阅 比较 MinMaxScaler 与其他缩放器

更多信息请参阅 用户指南

参数
feature_rangetuple (最小值, 最大值), 默认=(0, 1)

转换后数据的期望范围。

复制bool, 默认=True

设置为 False 以执行就地行归一化并避免复制(如果输入已经是 numpy 数组)。

剪辑bool, 默认=False

设置为 True 以将保留数据的变换值裁剪到提供的 特征范围

0.24 新版功能.

属性
min_形状为 (n_features,) 的 ndarray

每个特征的最小值调整。等同于 min - X.min(axis=0) * self.scale_

scale_形状为 (n_features,) 的 ndarray

每个特征数据的相对缩放。等同于 (max - min) / (X.max(axis=0) - X.min(axis=0))

0.17 新版功能: scale_ 属性。

data_min_形状为 (n_features,) 的 ndarray

数据中每个特征的最小值

0.17 新版功能: data_min_

data_max_形状为 (n_features,) 的 ndarray

数据中每个特征的最大值

0.17 新版功能: data_max_

data_range_形状为 (n_features,) 的 ndarray

数据中观察到的每个特征范围 (data_max_ - data_min_)

0.17 新版功能: data_range_

n_features_in_整数

拟合 过程中看到的特征数量。

0.24 新版功能.

n_samples_seen_整数

估计器处理的样本数量。它将在新的 fit 调用时重置,但在 partial_fit 调用中递增。

feature_names_in_ : 形状为 (n_features_in_,) 的 ndarray形状为的 ndarray

拟合 过程中看到的特征名称。仅当 X 的所有特征名称均为字符串时定义。

1.0 新版功能.

参见

minmax_scale

不使用估计器API的等效功能。

注释

NaN 被视为缺失值:在拟合时被忽略,在转换时被保留。

示例

>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
[ 1. 18.]
>>> print(scaler.transform(data))
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[1.5 0. ]]

方法

fit(X[, y])

计算用于后续缩放的最小值和最大值。

fit_transform(X[, y])

拟合数据,然后进行转换。

get_feature_names_out([input_features])

获取转换后的输出特征名称。

get_metadata_routing()

获取此对象的元数据路由。

get_params([deep])

获取此估计器的参数。

inverse_transform(X[, y, copy])

根据 feature_range 撤销 X 的缩放。

partial_fit(X[, y])

在线计算 X 上的最小值和最大值以供后续缩放。

set_inverse_transform_request(*[, copy])

传递给 inverse_transform 方法的请求元数据。

set_output(*[, transform])

设置输出容器。

set_params(**params)

设置此估计器的参数。

set_transform_request(*[, copy])

传递给 transform 方法的请求元数据。

transform(X[, y, copy])

根据 feature_range 缩放 X 的特征。

__init__(feature_range=(0, 1), *, copy=True, clip=False)[源代码]