MaxAbsScaler#
- class sklearn.preprocessing.MaxAbsScaler(*, copy=True)#
缩放每个特征以其最大绝对值。
该估计器单独缩放和转换每个特征,使得训练集中每个特征的最大绝对值将为1.0。它不会移动/中心化数据,因此不会破坏任何稀疏性。
该缩放器也可以应用于稀疏的CSR或CSC矩阵。
MaxAbsScaler
不会减少离群值的影响;它只会线性地将它们缩小。有关示例可视化,请参阅 Compare MaxAbsScaler with other scalers 。Added in version 0.17.
- Parameters:
- copybool, default=True
设置为False以就地缩放并避免复制(如果输入已经是numpy数组)。
- Attributes:
- scale_ndarray of shape (n_features,)
数据的每个特征相对缩放。
Added in version 0.17: scale_ 属性。
- max_abs_ndarray of shape (n_features,)
每个特征的最大绝对值。
- n_features_in_int
在 fit 期间看到的特征数量。
Added in version 0.24.
- feature_names_in_ndarray of shape (
n_features_in_
,) 在 fit 期间看到的特征名称。仅当
X
的特征名称均为字符串时定义。Added in version 1.0.
- n_samples_seen_int
估计器处理的样本数量。将在新的fit调用中重置,但在
partial_fit
调用中递增。
See also
maxabs_scale
等效函数,没有估计器API。
Notes
NaNs被视为缺失值:在fit中忽略,在transform中保持。
Examples
>>> from sklearn.preprocessing import MaxAbsScaler >>> X = [[ 1., -1., 2.], ... [ 2., 0., 0.], ... [ 0., 1., -1.]] >>> transformer = MaxAbsScaler().fit(X) >>> transformer MaxAbsScaler() >>> transformer.transform(X) array([[ 0.5, -1. , 1. ], [ 1. , 0. , 0. ], [ 0. , 1. , -0.5]])
- fit(X, y=None)#
计算用于后续缩放的最大绝对值。
- Parameters:
- X{array-like, sparse matrix},形状为 (n_samples, n_features)
用于计算沿特征轴缩放的每个特征的最小值和最大值的数据。
- yNone
忽略。
- Returns:
- selfobject
拟合的缩放器。
- fit_transform(X, y=None, **fit_params)#
拟合数据,然后进行转换。
将转换器拟合到
X
和y
,并带有可选参数fit_params
, 并返回X
的转换版本。- Parameters:
- X形状为 (n_samples, n_features) 的类数组
输入样本。
- y形状为 (n_samples,) 或 (n_samples, n_outputs) 的类数组, 默认=None
目标值(无监督转换为 None)。
- **fit_paramsdict
其他拟合参数。
- Returns:
- X_new形状为 (n_samples, n_features_new) 的 ndarray 数组
转换后的数组。
- get_feature_names_out(input_features=None)#
获取变换后的输出特征名称。
- Parameters:
- input_features字符串数组或None,默认=None
输入特征。
如果
input_features
是None
,则使用feature_names_in_
作为输入特征名称。如果feature_names_in_
未定义,则生成以下输入特征名称:["x0", "x1", ..., "x(n_features_in_ - 1)"]
。如果
input_features
是数组类型,则input_features
必须与feature_names_in_
匹配(如果feature_names_in_
已定义)。
- Returns:
- feature_names_out字符串对象的ndarray
与输入特征相同。
- get_metadata_routing()#
获取此对象的元数据路由。
请查看 用户指南 以了解路由机制的工作原理。
- Returns:
- routingMetadataRequest
MetadataRequest
封装的 路由信息。
- get_params(deep=True)#
获取此估计器的参数。
- Parameters:
- deepbool, 默认=True
如果为True,将返回此估计器和包含的子对象(也是估计器)的参数。
- Returns:
- paramsdict
参数名称映射到它们的值。
- inverse_transform(X)#
将数据缩放回原始表示。
- Parameters:
- X{array-like, sparse matrix},形状为 (n_samples, n_features)
应该转换回的数据。
- Returns:
- X_tr{ndarray, sparse matrix},形状为 (n_samples, n_features)
转换后的数组。
- partial_fit(X, y=None)#
在线计算X的最大绝对值以用于后续缩放。
所有X被作为一个批次处理。这适用于由于
n_samples
数量非常大或因为X是从连续流中读取而导致无法使用:meth:fit
的情况。- Parameters:
- X{array-like, sparse matrix} of shape (n_samples, n_features)
用于计算特征轴上后续缩放所需的均值和标准差的数据。
- yNone
忽略。
- Returns:
- selfobject
已拟合的缩放器。
- set_output(*, transform=None)#
设置输出容器。
请参阅 介绍 set_output API 以了解如何使用API的示例。
- Parameters:
- transform{“default”, “pandas”, “polars”}, 默认=None
配置
transform
和fit_transform
的输出。"default"
: 转换器的默认输出格式"pandas"
: DataFrame 输出"polars"
: Polars 输出None
: 转换配置不变
Added in version 1.4:
"polars"
选项已添加。
- Returns:
- self估计器实例
估计器实例。
- set_params(**params)#
设置此估计器的参数。
该方法适用于简单估计器以及嵌套对象(例如
Pipeline
)。后者具有形式为<component>__<parameter>
的参数,以便可以更新嵌套对象的每个组件。- Parameters:
- **paramsdict
估计器参数。
- Returns:
- selfestimator instance
估计器实例。
- transform(X)#
缩放数据。
- Parameters:
- X{array-like, sparse matrix},形状为 (n_samples, n_features)
应该缩放的数据。
- Returns:
- X_tr{ndarray, sparse matrix},形状为 (n_samples, n_features)
变换后的数组。