dask_ml.preprocessing.MinMaxScaler
dask_ml.preprocessing
.MinMaxScaler¶
- class dask_ml.preprocessing.MinMaxScaler(feature_range=(0, 1), *, copy=True, clip=False)[源代码]¶
通过将每个特征缩放到给定范围来转换特征。
该估计器对每个特征进行缩放和转换,使其在训练集上的范围为给定值,例如在零和一之间。
变换由以下给出:
X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0)) X_scaled = X_std * (max - min) + min
其中 min, max = feature_range。
这种转换通常被用作零均值、单位方差缩放的替代方法。
MinMaxScaler 不会减少异常值的影响,但它会线性地将它们缩放到一个固定范围内,其中最大的数据点对应于最大值,最小的数据点对应于最小值。有关示例可视化,请参阅 比较 MinMaxScaler 与其他缩放器。
更多信息请参阅 用户指南。
- 参数
- feature_rangetuple (最小值, 最大值), 默认=(0, 1)
转换后数据的期望范围。
- 复制bool, 默认=True
设置为 False 以执行就地行归一化并避免复制(如果输入已经是 numpy 数组)。
- 剪辑bool, 默认=False
设置为 True 以将保留数据的变换值裁剪到提供的 特征范围 。
0.24 新版功能.
- 属性
- min_形状为 (n_features,) 的 ndarray
每个特征的最小值调整。等同于
min - X.min(axis=0) * self.scale_
- scale_形状为 (n_features,) 的 ndarray
每个特征数据的相对缩放。等同于
(max - min) / (X.max(axis=0) - X.min(axis=0))
0.17 新版功能: scale_ 属性。
- data_min_形状为 (n_features,) 的 ndarray
数据中每个特征的最小值
0.17 新版功能: data_min_
- data_max_形状为 (n_features,) 的 ndarray
数据中每个特征的最大值
0.17 新版功能: data_max_
- data_range_形状为 (n_features,) 的 ndarray
数据中观察到的每个特征范围
(data_max_ - data_min_)
0.17 新版功能: data_range_
- n_features_in_整数
在 拟合 过程中看到的特征数量。
0.24 新版功能.
- n_samples_seen_整数
估计器处理的样本数量。它将在新的 fit 调用时重置,但在
partial_fit
调用中递增。- feature_names_in_ : 形状为 (n_features_in_,) 的 ndarray形状为的 ndarray
在 拟合 过程中看到的特征名称。仅当 X 的所有特征名称均为字符串时定义。
1.0 新版功能.
参见
minmax_scale
不使用估计器API的等效功能。
注释
NaN 被视为缺失值:在拟合时被忽略,在转换时被保留。
示例
>>> from sklearn.preprocessing import MinMaxScaler >>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] >>> scaler = MinMaxScaler() >>> print(scaler.fit(data)) MinMaxScaler() >>> print(scaler.data_max_) [ 1. 18.] >>> print(scaler.transform(data)) [[0. 0. ] [0.25 0.25] [0.5 0.5 ] [1. 1. ]] >>> print(scaler.transform([[2, 2]])) [[1.5 0. ]]
方法
fit
(X[, y])计算用于后续缩放的最小值和最大值。
fit_transform
(X[, y])拟合数据,然后进行转换。
get_feature_names_out
([input_features])获取转换后的输出特征名称。
get_metadata_routing
()获取此对象的元数据路由。
get_params
([deep])获取此估计器的参数。
inverse_transform
(X[, y, copy])根据 feature_range 撤销 X 的缩放。
partial_fit
(X[, y])在线计算 X 上的最小值和最大值以供后续缩放。
set_inverse_transform_request
(*[, copy])传递给
inverse_transform
方法的请求元数据。set_output
(*[, transform])设置输出容器。
set_params
(**params)设置此估计器的参数。
set_transform_request
(*[, copy])传递给
transform
方法的请求元数据。transform
(X[, y, copy])根据 feature_range 缩放 X 的特征。