ray.data.预处理器.PowerTransformer#

class ray.data.preprocessors.PowerTransformer(columns: List[str], power: float, method: str = 'yeo-johnson')[源代码]#

基类:Preprocessor

应用 幂变换 使您的数据更接近正态分布。

一些模型期望数据是正态分布的。通过使你的数据更接近高斯分布,你可能会提高模型的性能。

此预处理器支持以下转换:

Box-Cox 要求所有数据为正数。

警告

你需要手动指定变换的功率参数。如果选择了一个不好的值,变换可能无法正常工作。

参数:
  • columns – 要单独转换的列。

  • power – 一个决定数据如何转换的参数。从业者通常将 power 设置在 \(-2.5\)\(2.5\) 之间,尽管你可能需要尝试不同的值以找到一个效果良好的值。

  • method – 表示要应用的转换的字符串。支持 "yeo-johnson""box-cox"。如果选择 "box-cox",您的数据需要为正。默认为 "yeo-johnson"

PublicAPI (alpha): 此API处于alpha阶段,可能在稳定之前发生变化。

方法

deserialize

加载通过 self.serialize() 序列化的原始预处理器。

fit

将此预处理器适配到数据集。

fit_transform

将此预处理器适配到数据集,然后转换数据集。

preferred_batch_format

批处理格式提示上游生产者尝试生成最佳块格式。

serialize

返回此预处理器的字符串序列化表示。

transform

转换给定的数据集。

transform_batch

转换单个批次的数据。