离散化#
Feature-engine 的变量离散化转换器将连续数值变量转换为离散变量。在等频和等宽转换器的情况下,离散变量将包含连续区间。决策树离散器将返回一个离散变量,从新特征取有限数量的值的意义上来说。
以下图示展示了离散化的过程:
通过离散化,有时我们可以从一个原本偏斜的变量中获得更均匀的值分布。但这并不总是可能的。
离散化加编码
通常,在我们将数值连续变量离散化为离散区间后,我们希望将其处理为类别变量。这是一种常见做法。在整个用户指南中,我们指出了展示此功能的jupyter笔记本。
离散器