分类编码#

Feature-engine 的分类编码器将变量的类别替换为估计的或任意的数字。

Feature-engine 编码器特性总结

Transformer

回归

分类

多类

描述

OneHotEncoder()

添加虚拟变量以表示每个类别

OrdinalEncoder()

√ 将类别替换为整数

CountFreuencyEncoder()

用它们的计数或频率替换类别

MeanEncoder()

x

用目标均值替换类别

WoEEncoder()

x

x

用证据的权重取代类别

DecisionTreeEncoder()

√ 用决策树的预测结果替换类别

RareLabelEncoder()

√ 将不频繁的类别合并为一个

Feature-engine 的分类编码器默认只编码类型为分类或对象的变量。从版本 1.1.0 开始,您可以选择将参数 ignore_format 设置为 True,以使转换器也接受数值变量作为输入。

其他分类编码库#

对于额外的分类编码转换,请访问开源包 Category encoders