版本 1.2.X#

版本 1.2.0#

部署日期:2022年1月4日

贡献者#

在这个重大版本中,我们添加了3个新的转换器,扩展了现有类的功能,增加了引用Feature-engine的信息,并通过新的外观、扩展的用户指南(包含示例)以及更多关于如何为项目做出贡献的详细信息来扩展文档。

非常感谢各位贡献者,使得这次大规模发布成为可能!

感谢评审者 Nicolas GalliChris Samiullah 对各种PR提供了有用的建议。

新的变压器#

  • DatetimeFeatures: 从日期时间变量中提取日期和时间特征 (Edoardo Argiolas)

  • DropHishPSIFeatures: 查找并删除高人口稳定性指数的特征 (gverbock)

  • 匹配变量:确保训练集中观察到的相同变量也存在于测试集中 (Thibault Blanc)

增强功能#

  • Winsorizer 现在可以添加二进制变量指示器来标记异常值 (David Cortes)

  • DropMissingData 现在允许基于缺失数据百分比删除行 (Kevin Kurek)

  • 分类编码器 现在可以在编码训练集中未见过的类别时发出警告或错误 (Morgan Sell)

  • ArbitraryDiscretiser 现在可以在值超出用户输入的限制时发出警告或错误 (Morgan Sell)

  • CombineWithReferenceFeatureMathematicalCombination 现在可以选择在特征创建后丢弃原始输入变量 (Edoardo Argiolas)

Bug 修复#

  • 所有 编码器 现在能够在自动搜索分类变量时排除被转换为对象或分类的日期时间变量 (Edoardo Argiolas)

  • 当用户向变量参数传递空列表时,所有转换器现在都会引发错误 (Edoardo Argiolas)

  • 当用户向变量参数传递单个变量时,所有转换器现在都会检查变量类型 (Edoardo Argiolas)

文档#

  • 我们将模板更改为 pydata (Soledad Galli)

  • 我们将关于转换器的信息分为用户指南和API (Soledad Galli)

  • API 文档展示了如何使用转换器 (Soledad Galli)

  • 用户指南通过大量的示例和使用时机与方法的提示扩展了API文档,介绍了如何使用转换器(Soledad Galli

  • 我们扩展了贡献部分,提供了大量关于如何做出贡献以及如何检查您的代码是否一流的细节 (Soledad Galli)

  • 你现在可以赞助 Feature-engine(Soledad Galli

  • 你现在可以在使用 Feature-engine 时引用我们的 JOSS 文章 (Soledad Galli)

  • 我们添加了许多关于如何使用新类 DropHighPSIFeatures 的示例 (gverbock)

  • 我们提供了如何使用新的 DatetimeFeatures 类提取日期和时间特征的各种示例 (Edoardo Argiolas)

  • 我们包含了如何使用新类 MatchVariables 的示例 (Thibault Blanc)

  • 我们添加了一个包含新 DatetimeFeatures 类演示的 Jupyter 笔记本 (Edoardo Argiolas)

  • 我们添加了一个包含新 DropHighPSIFeatures 类演示的 Jupyter 笔记本 (Soledad Galli)