欢迎来到 PyCaret
PyCaret 3.0-rc 现已推出。pip install --pre pycaret
来尝试。查看这个示例 Notebook。
PyCaret 是一个开源的、低代码的 Python 机器学习库,可以自动化机器学习工作流程。它是一个端到端的机器学习和模型管理工具,极大加快了实验周期,提高了工作效率。
与其他开源机器学习库相比,PyCaret 是一个替代性的低代码库,可以用几行代码替代数百行代码。这使得实验变得极其快速和高效。PyCaret 本质上是围绕几个机器学习库和框架(如 scikit-learn、XGBoost、LightGBM、CatBoost、spaCy、Optuna、Hyperopt、Ray 等)的 Python 封装。
PyCaret 的设计和简洁性受到了 Gartner 首次使用的公民数据科学家这一新兴角色的启发。公民数据科学家是能够执行简单和中等复杂分析任务的高级用户,这些任务以前需要更多的技术专长。
快速链接
⭐ 教程 | 查看我们的官方笔记本! |
---|---|
📋 示例 | 示例笔记本。 |
📙 博客 | 由贡献者撰写的教程和文章。 |
📚 API 参考 | PyCaret 的详细 API 文档 |
📺 视频教程 | 我们来自各种活动的视频教程。 |
📢 讨论 | 与社区和贡献者互动。 |
🛠️ 更新日志 | 变更和版本历史。 |
❓常见问题 | 常见问题 |
🌳 路线图 | PyCaret 的发展计划。 |
Ⓜ️ 聚会 | 加入我们的聚会用户组。 |
特点
PyCaret 是一个开源、低代码的 Python 机器学习库,旨在缩短 ML 实验中的假设到洞察的周期时间。它使数据科学家能够快速高效地执行端到端实验。与其他开源机器学习库相比,PyCaret 是一个替代性的低代码库,可以用几行代码执行复杂的机器学习任务。PyCaret 简单且易于使用。
PyCaret 适用于公民数据科学家
PyCaret 的设计和简洁性受到了公民数据科学家这一新兴角色的启发,这一术语首次被 Gartner 使用。公民数据科学家是能够执行简单和中等复杂分析任务的“高级用户”,这些任务以前需要更多的专业知识。经验丰富的数据科学家往往难以找到且昂贵,但公民数据科学家可以是弥补这一差距、解决商业环境中的数据科学挑战的有效途径。
PyCaret 部署能力
PyCaret 是一个准备好部署的 Python 库,这意味着在 ML 实验中执行的所有步骤都可以使用可复制且可保证用于生产的流水线来重现。可以将流水线保存为可在不同环境中传输的二进制文件格式。
PyCaret 与 BI 无缝集成
PyCaret 及其机器学习功能与支持 Python 的环境(如 Microsoft Power BI、Tableau、Alteryx 和 KNIME 等)无缝集成。这为这些 BI 平台的用户赋予了巨大的力量,他们现在可以轻松将 PyCaret 集成到其现有工作流程中,并轻松添加一层机器学习。
PyCaret 适用于:
- 希望提高生产力的经验丰富数据科学家。
- 偏好低代码机器学习解决方案的公民数据科 学家。
- 希望构建快速原型的数据科学专业人士。
- 数据科学和机器学习的学生和爱好者。
PyCaret 简介
分类
回归
聚类
异常检测
时间序列
PyCaret 新的时间序列模块 现已在 3.0-rc
版本中推出。保持了 PyCaret 的简单性,与现有 API 一致,并且功能齐全。包括统计测试、模型训练和选择(30+ 算法)、模型分析、自动超参数调整、实验记录、云端部署等功能。所有这些只需几行代码即可完成。如果您想尝试一下,请查看我们官方的快速入门笔记本。
要使用 PyCaret 的时间序列模块,您可以安装 PyCaret 3.0-rc
。
pip install --pre pycaret
核心团队
以下人员目前是 PyCaret 开发和维护的核心贡献者:
https://github.com/mfahadakbar
https://github.com/PabloJMoreno
为 PyCaret 做贡献! 如果您想为这个项目做贡献,请查看我们的贡献指南。