分类编码#
Feature-engine 的分类编码器将变量的类别替换为估计的或任意的数字。
Feature-engine 编码器特性总结
Transformer |
回归 |
分类 |
多类 |
描述 |
---|---|---|---|---|
|
√ |
√ |
√ |
添加虚拟变量以表示每个类别 |
|
√ |
√ |
√ 将类别替换为整数 |
|
|
√ |
√ |
√ |
用它们的计数或频率替换类别 |
|
√ |
√ |
x |
用目标均值替换类别 |
|
x |
√ |
x |
用证据的权重取代类别 |
|
√ |
√ |
√ 用决策树的预测结果替换类别 |
|
|
√ |
√ |
√ 将不频繁的类别合并为一个 |
Feature-engine 的分类编码器默认只编码类型为分类或对象的变量。从版本 1.1.0 开始,您可以选择将参数 ignore_format
设置为 True,以使转换器也接受数值变量作为输入。
其他分类编码库#
对于额外的分类编码转换,请访问开源包 Category encoders。