在 Google Kubernetes 上部署机器学习应用
在 Google Kubernetes Engine 上部署使用 Streamlit 和 PyCaret 构建的机器学习应用的逐步入门指南
作者:Moez Ali
回顾
在我们的上一篇文章中,我们演示了如何在云端开发一个使用 PyCaret 构建的机器学习流水线,并将训练好的模型部署为一个使用 Streamlit 开源框架构建的 Web 应用,并将其部署在 Heroku PaaS 上。如果你之前没有听说过 PyCaret,你可以阅读这篇公告了解更多信息。
在本教程中,我们将使用相同的机器学习流水线和 Streamlit 应用程序,并演示如何将它们容器化并部署到 Google Kubernetes Engine 上。
通过本教程,你将能够在 Google Kubernetes Engine 上构建和托管一个完全功能的容器化 Web 应用程序。这个 Web 应用程序可以用于使用训练好的机器学习模型生成在线预测(逐个预测)和批量预测(通过上传 CSV 文件)。最终的应用程序如下所示:
👉 本教程中你将学到什么
- 什么是容器,什么是 Docker,什么是 Kubernetes,以及什么是 Google Kubernetes Engine?
- 构建一个 Docker 镜像并将其上传到 Google Container Registry(GCR)。
- 在 GCP 上创建一个集群,并将一个机器学习应用程序部署为 Web 服务。
- 查看一个使用训练好的机器学习流水线实时预测新数据点的 Web 应用程序。
在过去,我们已经介绍了使用 Docker 进行容器化和在 Azure、GCP 和 AWS 等云平台上部署的内容。如果你对这些内容感兴趣,可以阅读以下教程:
- 使用 PyCaret 和 Streamlit 构建和部署机器学习 Web 应用程序
- 在 AWS Fargate 上部署机器学习流水线
- 在 Google Kubernetes Engine 上部署机器学习流水线
- 在 AWS Web 服务上部署机器学习流水线
- 在 Heroku PaaS 上构建和部署你的第一个机器学习 Web 应用程序
💻 本教程的工具箱
PyCaret
PyCaret 是一个开源的、低代码的 Python 机器学习库,用于训练和部署机器学习流水线和模型到生产环境中。可以使用 pip 轻松安装 PyCaret。
pip install pycaret
Streamlit
Streamlit 是一个开源的 Python 库,可以轻松构建漂亮的定制化机器学习和数据科学 Web 应用程序。可以使用 pip 轻松安装 Streamlit。
pip install streamlit
Google Cloud Platform
Google Cloud Platform(GCP)是由 Google 提供的一套云计算服务,运行在 Google 用于其终端用户产品(如 Google 搜索、Gmail 和 YouTube)的相同基础设施上。如果你还没有 GCP 的账号,你可以在这里注册。如果你是第一次注册,你将获得 1 年的免费信用额度。