Featuretools外部生态系统#

新的项目正在定期基于Featuretools构建,突显了自动化特征工程的重要性。在此页面上,我们列出了利用Featuretools的库、用例/演示和教程。如果您想添加一个项目,请联系我们或在`GitHub`_上提交拉取请求。

Note

我们自豪且兴奋地分享使用Featuretools的人们的成果,但我们无法认可或提供本页面上工具的支持。

#

MLBlocks#

  • MLBlocks是一个简单的框架,用于通过无缝组合来自任何Python库的工具,使用简单、通用和统一的接口来构建端到端的可调优机器学习管道。MLBlocks包含一个使用Featuretools的原语。

Cardea#

  • Cardea是一个基于FHIR数据模式的机器学习库。它使用了许多**automl**工具,包括Featuretools。

演示与用例#

预测客户终身价值#

  • 机器学习的一个常见用例是预测客户终身价值。本文通过使用Featuretools的过程,详细介绍了这一预测问题的重要性。

预测NHL季后赛比赛#

  • 许多 Kaggle 用户渴望使用 Featuretools 来提升他们的模型性能。在这篇博客文章中,一位 Kaggle 用户采用了一个来自国家冰球联盟比赛的数据集,并创建了一个模型来预测比赛是否为季后赛。

预测哥斯达黎加家庭的贫困状况#

  • 社会项目在确定援助对象时面临困难。使用哥斯达黎加家庭特征的数据集,这个 Kaggle 内核预测了家庭的贫困状况。

预测功能性阈值功率 (FTP)#

  • 这个笔记本和配套报告评估了使用机器学习预测自行车手 FTP 的方法,数据来自之前的训练课程。Featuretools 用于生成一组独立变量,这些变量捕捉了随时间变化的表现变化。

Note

更多由 Feature Labs 编写的演示,请参见 featuretools.com/demos

教程#

Python 中的自动化特征工程#

  • 本文提供了一个使用零售数据集进行 DFS 的逐步指南。

自动化特征工程实践指南#

  • 一个 深入 的教程,通过使用 Featuretools 预测“BigMart”未来的产品销售。

使用DFS进行自动化特征工程的介绍#

  • 本文展示了使用Featuretools在房屋贷款数据集上自动化特征工程的手动过程。

自动化特征工程工作坊#

  • 2017年数据夏季会议期间举办的自动化特征工程工作坊,使用Featuretools。

日文教程#

  • 一个Featuretools的教程,展示了与特征选择库`Boruta`_和超参数调优库`Optuna`_的集成。

使用Featuretools构建客户流失预测模型#

  • 一个视频教程,展示了如何使用Featuretools与`Spark`_、`XGBoost`_和`Google Cloud Platform`_一起构建客户流失预测模型。

俄文自动化特征工程工作坊#

  • 一个视频教程,展示了如何使用Featuretools预测申请人是否有能力偿还贷款。