ray.data.预处理器.PowerTransformer#
- class ray.data.preprocessors.PowerTransformer(columns: List[str], power: float, method: str = 'yeo-johnson')[源代码]#
基类:
Preprocessor
应用 幂变换 使您的数据更接近正态分布。
一些模型期望数据是正态分布的。通过使你的数据更接近高斯分布,你可能会提高模型的性能。
此预处理器支持以下转换:
Yeo-Johnson 变换
Box-Cox 变换
Box-Cox 要求所有数据为正数。
警告
你需要手动指定变换的功率参数。如果选择了一个不好的值,变换可能无法正常工作。
- 参数:
columns – 要单独转换的列。
power – 一个决定数据如何转换的参数。从业者通常将
power
设置在 \(-2.5\) 和 \(2.5\) 之间,尽管你可能需要尝试不同的值以找到一个效果良好的值。method – 表示要应用的转换的字符串。支持
"yeo-johnson"
和"box-cox"
。如果选择"box-cox"
,您的数据需要为正。默认为"yeo-johnson"
。
PublicAPI (alpha): 此API处于alpha阶段,可能在稳定之前发生变化。
方法
加载通过
self.serialize()
序列化的原始预处理器。将此预处理器适配到数据集。
将此预处理器适配到数据集,然后转换数据集。
批处理格式提示上游生产者尝试生成最佳块格式。
返回此预处理器的字符串序列化表示。
转换给定的数据集。
转换单个批次的数据。