版本 1.5.X#

版本 1.5.2#

部署日期:2022年11月21日

贡献者#

在此版本中,我们扩展了现有类和文档的功能。

新功能#

  • StringSimilarityEncoder 现在可以根据用户输入的关键词创建相似度变量 (Gleb Levitski)

  • WinsorizerOutlierTrimmer 现在会根据 capping_method 自动调整 fold 参数的值 (pxn39)

错误修复#

文档#

  • 将示例代码片段添加到分类编码API文档中 (Alfonso Tobar)

  • 将示例代码片段添加到插补模块API文档中 (Alfonso Tobar)

  • 将示例代码片段添加到离散化模块API文档中 (Alfonso Tobar)

  • 将示例代码片段添加到创建模块API文档中 (Alfonso Tobar)

  • 将示例代码片段添加到 datetime 模块 API 文档中 (Alfonso Tobar)

  • 更新用户指南文档以包含预测功能转换器(Soledad Galli

  • 更新用户指南文档,包含日期时间特征和周期性特征 (Soledad Galli)

  • 修复 README 中的徽章 (Gleb Levitski)

版本 1.5.0#

部署日期:2022年10月17日

贡献者#

在此版本中,我们修复了一个错误,该错误导致 get_feature_names_out 与 Scikit-learn 管道不兼容。

In addition, thanks to Gleb Levitski, we’ve got a new encoder to replace categories by string similarity variables. Gleb Levitski also made a number of code enhancements to various transformers across the library, making a lot of new functionality available.

最后,我们要感谢 Alfonso TobarDavid CortesMorgan Sell 为创建新的转换器、修复错误和扩展 Feature-engine 的功能所做的贡献。

非常感谢所有贡献者以及那些创建问题标记错误或请求新功能的人。

新的变压器#

  • StringSimilarityEncoder: 基于字符串相似度编码分类变量 (Gleb Levitski)

  • MatchCategories: 匹配训练集和测试集中的类别,当类型为 pandas 分类时 (David Cortes)

  • SelectByInformationValue: 根据信息值选择特征 (Morgan SellSoledad Galli)

新功能#

  • MeanEncoder 现在可以在编码过程中实现平滑处理,以应对高基数问题 (Gleb Levitski)

  • MeanEncoder 现在可以编码未见过的类别 (Gleb Levitski)

  • OrdinalEncoder 现在可以编码未见过的类别 (Soledad Galli)

  • CountFrequencyEncoder 现在可以编码未见过的类别 (David Cortes)

  • 所有异常值转换器现在可以根据MAD规则检测异常值 (Gleb Levitski)

  • DropHighPSIFeatures 中添加 PSI 阈值的自动计算 (Gleb Levitski)

  • 所有特征选择转换器现在都有 get_support() 方法 (Soledad Galli)

错误修复#

  • get_feature_names_out 现在与 Scikit-learn 管道中的所有转换器兼容 (Soledad Galli)

  • 编码器中的 inverse_transform 方法现在能够正确处理未见过的类别或引发未实现错误 (Soledad Galli)

  • 修复了 SklearnTransformerWrapperOneHotEncoderPolynomialFeatures 的输出 (Alfonso Tobar)

文档#

弃用#

  • 编码器中的参数 errors 现在被 unseen 取代 (Soledad Galli)

  • MathematicalCombinationCombineWithFeatureReferenceCyclicalTransformer 类已被移除 (Soledad Galli)

  • 我们将在版本1.5中弃用 PRatioEncoder,并将在版本1.6中移除它 (Soledad Galli)

代码改进#