Featuretools外部生态系统#
新的项目正在定期基于Featuretools构建,突显了自动化特征工程的重要性。在此页面上,我们列出了利用Featuretools的库、用例/演示和教程。如果您想添加一个项目,请联系我们或在`GitHub`_上提交拉取请求。
Note
我们自豪且兴奋地分享使用Featuretools的人们的成果,但我们无法认可或提供本页面上工具的支持。
库#
MLBlocks#
MLBlocks是一个简单的框架,用于通过无缝组合来自任何Python库的工具,使用简单、通用和统一的接口来构建端到端的可调优机器学习管道。MLBlocks包含一个使用Featuretools的原语。
Cardea#
Cardea是一个基于FHIR数据模式的机器学习库。它使用了许多**automl**工具,包括Featuretools。
演示与用例#
预测客户终身价值#
机器学习的一个常见用例是预测客户终身价值。本文通过使用Featuretools的过程,详细介绍了这一预测问题的重要性。
预测NHL季后赛比赛#
许多 Kaggle 用户渴望使用 Featuretools 来提升他们的模型性能。在这篇博客文章中,一位 Kaggle 用户采用了一个来自国家冰球联盟比赛的数据集,并创建了一个模型来预测比赛是否为季后赛。
预测哥斯达黎加家庭的贫困状况#
社会项目在确定援助对象时面临困难。使用哥斯达黎加家庭特征的数据集,这个 Kaggle 内核预测了家庭的贫困状况。
预测功能性阈值功率 (FTP)#
这个笔记本和配套报告评估了使用机器学习预测自行车手 FTP 的方法,数据来自之前的训练课程。Featuretools 用于生成一组独立变量,这些变量捕捉了随时间变化的表现变化。
Note
更多由 Feature Labs 编写的演示,请参见 featuretools.com/demos
教程#
Python 中的自动化特征工程#
本文提供了一个使用零售数据集进行 DFS 的逐步指南。
自动化特征工程实践指南#
一个 深入 的教程,通过使用 Featuretools 预测“BigMart”未来的产品销售。
使用DFS进行自动化特征工程的介绍#
本文展示了使用Featuretools在房屋贷款数据集上自动化特征工程的手动过程。
自动化特征工程工作坊#
2017年数据夏季会议期间举办的自动化特征工程工作坊,使用Featuretools。
日文教程#
一个Featuretools的教程,展示了与特征选择库`Boruta`_和超参数调优库`Optuna`_的集成。
使用Featuretools构建客户流失预测模型#
一个视频教程,展示了如何使用Featuretools与`Spark`_、`XGBoost`_和`Google Cloud Platform`_一起构建客户流失预测模型。
俄文自动化特征工程工作坊#
一个视频教程,展示了如何使用Featuretools预测申请人是否有能力偿还贷款。