离散化#

Feature-engine 的分箱转换器将连续变量转换为离散特征。通常,这是通过将变量值排序到连续区间中来实现的。

摘要

Transformer

功能性

EqualFrequencyDiscretiser()

将值排序到具有相似观测数量的区间中。

EqualWidthDiscretiser()

将值排序到等大小的区间中。

ArbitraryDiscretiser()

将值排序到用户预定义的区间中。

DecisionTreeDiscretiser()

用决策树的预测值替换,这些预测值是离散的。

GeometricWidthDiscretiser()

将变量排序到几何区间中。

离散化的额外转换器#

对于使用K-means进行离散化,请查看Scikit-learn的 KBinsDiscretizer