预处理器#

预处理器接口#

构造函数#

Preprocessor

实现了一个机器学习预处理操作。

Fit/Transform API#

fit

将此预处理器适配到数据集。

fit_transform

将此预处理器适配到数据集,然后转换数据集。

transform

转换给定的数据集。

transform_batch

转换单个批次的数据。

PreprocessorNotFittedException

当预处理器需要先拟合时引发的错误。

通用预处理器#

Concatenator

将数值列合并为一个 TensorDtype 类型的列。

SimpleImputer

用插补值替换缺失值。

分类编码器#

Categorizer

将列转换为 pd.CategoricalDtype

LabelEncoder

将标签编码为整数目标。

MultiHotEncoder

多热编码分类数据。

OneHotEncoder

独热编码 分类数据。

OrdinalEncoder

将列中的值编码为有序的整数值。

特征缩放器#

MaxAbsScaler

按其绝对最大值缩放每一列。

MinMaxScaler

按其范围缩放每一列。

Normalizer

将每个样本缩放到单位范数。

PowerTransformer

应用 幂变换 使您的数据更接近正态分布。

RobustScaler

使用分位数缩放和转换每一列。

StandardScaler

分别按其均值和标准差对每一列进行标准化和缩放。

K-Bins 离散器#

CustomKBinsDiscretizer

使用自定义的边界值将数据分箱到离散区间。

UniformKBinsDiscretizer

将数值分入等宽的离散区间(箱)。