离散化#

Feature-engine 的变量离散化转换器将连续数值变量转换为离散变量。在等频和等宽转换器的情况下,离散变量将包含连续区间。决策树离散器将返回一个离散变量,从新特征取有限数量的值的意义上来说。

以下图示展示了离散化的过程:

../../_images/Discretisation.png

通过离散化,有时我们可以从一个原本偏斜的变量中获得更均匀的值分布。但这并不总是可能的。

离散化加编码

通常,在我们将数值连续变量离散化为离散区间后,我们希望将其处理为类别变量。这是一种常见做法。在整个用户指南中,我们指出了展示此功能的jupyter笔记本。

离散器