在 Google Kubernetes 上部署机器学习应用

在 Google Kubernetes Engine 上部署使用 Streamlit 和 PyCaret 构建的机器学习应用的逐步入门指南

作者：Moez Ali

在 Google Kubernetes Engine 上部署使用 Streamlit 和 PyCaret 构建的机器学习应用的逐步入门指南

回顾

在我们的上一篇文章中，我们演示了如何在云端开发一个使用 PyCaret 构建的机器学习流水线，并将训练好的模型部署为一个使用 Streamlit 开源框架构建的 Web 应用，并将其部署在 Heroku PaaS 上。如果你之前没有听说过 PyCaret，你可以阅读这篇公告了解更多信息。

在本教程中，我们将使用相同的机器学习流水线和 Streamlit 应用程序，并演示如何将它们容器化并部署到 Google Kubernetes Engine 上。

通过本教程，你将能够在 Google Kubernetes Engine 上构建和托管一个完全功能的容器化 Web 应用程序。这个 Web 应用程序可以用于使用训练好的机器学习模型生成在线预测（逐个预测）和批量预测（通过上传 CSV 文件）。最终的应用程序如下所示：

最终应用程序（第 1 页）

👉 本教程中你将学到什么

什么是容器，什么是 Docker，什么是 Kubernetes，以及什么是 Google Kubernetes Engine？
构建一个 Docker 镜像并将其上传到 Google Container Registry（GCR）。
在 GCP 上创建一个集群，并将一个机器学习应用程序部署为 Web 服务。
查看一个使用训练好的机器学习流水线实时预测新数据点的 Web 应用程序。

在过去，我们已经介绍了使用 Docker 进行容器化和在 Azure、GCP 和 AWS 等云平台上部署的内容。如果你对这些内容感兴趣，可以阅读以下教程：

💻 本教程的工具箱

PyCaret

PyCaret 是一个开源的、低代码的 Python 机器学习库，用于训练和部署机器学习流水线和模型到生产环境中。可以使用 pip 轻松安装 PyCaret。

pip install pycaret

Streamlit

Streamlit 是一个开源的 Python 库，可以轻松构建漂亮的定制化机器学习和数据科学 Web 应用程序。可以使用 pip 轻松安装 Streamlit。

pip install streamlit

Google Cloud Platform

Google Cloud Platform（GCP）是由 Google 提供的一套云计算服务，运行在 Google 用于其终端用户产品（如 Google 搜索、Gmail 和 YouTube）的相同基础设施上。如果你还没有 GCP 的账号，你可以在这里注册。如果你是第一次注册，你将获得 1 年的免费信用额度。

让我们开始吧。

在我们进入 Kubernetes 之前，让我们先了解一下什么是容器以及为什么我们需要它？

你是否曾经遇到过这样的问题：你的代码在你的电脑上运行正常，但当你的朋友尝试运行完全相同的代码时，却无法正常工作？如果你的朋友重复了完全相同的步骤，他或她应该得到相同的结果，对吗？这个问题的答案是——环境。你朋友的环境与你的环境不同。

一个环境包括什么？→ 一个编程语言，比如 Python，以及在构建和测试应用程序时使用的所有库和依赖项的确切版本。如果我们能够创建一个可以转移到其他机器的环境（例如：您朋友的计算机或像谷歌云平台这样的云服务提供商），我们就可以在任何地方重现结果。因此，***容器 ***是一种软件类型，它将一个应用程序及其所有依赖项打包在一起，以便应用程序可以在一个计算环境中可靠地运行到另一个计算环境中。

那么 Docker 是什么？

**Docker ** 是一家提供软件（也称为 Docker）的公司，允许用户构建、运行和管理容器。虽然 Docker 的容器是最常见的，但还有其他不那么出名的 替代方案，比如LXD和LXC也提供容器解决方案。

现在您了解了容器和 Docker，让我们来了解一下 Kubernetes 是什么。

什么是 Kubernetes？

Kubernetes 是由谷歌于2014年开发的强大开源系统，用于管理容器化应用程序。简单来说，Kubernetes 是一个用于在机器集群上运行和协调容器化应用程序的系统。它是一个旨在完全管理容器化应用程序生命周期的平台。

照片由chuttersnap在Unsplash上提供

特点

✔️ **负载均衡：**自动在容器之间分配负载。

✔️ **扩展：**根据需求变化（如高峰时段、周末和假期）自动增加或减少容器。

✔️ **存储：**保持多个应用程序实例的存储一致。

✔️ 自愈自动重新启动失败的容器，并终止不响应您定义的健康检查的容器。

✔️ **自动部署 **您可以自动化 Kubernetes 来为您的部署创建新容器，删除现有容器，并将它们的所有资源转移到新容器。

如果已经有 Docker，为什么还需要 Kubernetes？

想象一种情景，您需要在多台机器上运行多个 Docker 容器，以支持一个企业级机器学习应用程序，在白天和黑夜有不同的工作负载。尽管听起来很简单，但手动完成这项工作是很费力的。

您需要在正确的时间启动正确的容器，找出它们如何相互通信，处理存储考虑事项，并处理失败的容器或硬件。Kubernetes 正在解决这个问题，通过允许大量容器和谐地协同工作，减少运营负担。

什么是 Google Kubernetes Engine？

Google Kubernetes Engine 是在谷歌云平台上实现的 谷歌开源 Kubernetes。简单！

GKE 的其他热门替代方案包括Amazon ECS和Microsoft Azure Kubernetes Service。

最后一次，您理解了吗？

**容器 **是一种软件类型，它将一个应用程序及其所有依赖项打包在一起，以便应用程序可以在一个计算环境中可靠地运行到另一个计算环境中。
**Docker **是用于构建和管理容器的软件。
**Kubernetes **是一个用于在集群环境中管理容器化应用程序的开源系统。
Google Kubernetes Engine 是在谷歌云平台上实现的开源 Kubernetes 框架。

在本教程中，我们将使用 Google Kubernetes Engine。为了跟随操作，您必须拥有一个谷歌云平台账户。点击这里免费注册。

设置业务背景

一家保险公司希望通过在患者入院时使用人口统计数据和基本患者健康风险指标更好地预测患者费用，从而改进现金流预测。

(数据来源)

目标

构建一个支持在线（逐个）以及批量预测的网络应用程序，使用经过训练的机器学习模型和流水线。

任务

使用 PyCaret 训练、验证和开发机器学习流水线。
构建一个前端网络应用程序，具有两个功能：（i）在线预测和（ii）批量预测。
创建一个 Dockerfile。
在 Google Kubernetes Engine 上部署网络应用程序。一旦部署，它将变为公开可用，并可以通过 Web URL 访问。

👉 任务1 — 模型训练和验证

在集成开发环境（IDE）或笔记本中，可以在本地机器或云上进行训练和模型验证。如果您以前没有使用过 PyCaret，请点击这里了解更多关于 PyCaret 的信息，或在我们的网站上查看入门教程。

在本教程中，我们进行了两个实验。第一个实验使用 PyCaret 的默认预处理设置进行。第二个实验有一些额外的预处理任务，如缩放和归一化、自动特征工程和将连续数据分成区间。查看第二个实验的设置代码：

# 实验2

from pycaret.regression import *

r2 = setup(data, target = 'charges', session_id = 123,
           normalize = True,
           polynomial_features = True, trigonometry_features = True,
           feature_interaction=True, 
           bin_numeric_features= ['age', 'bmi'])

两个实验的信息网格对比

只需要几行代码就能完成这个神奇的过程。请注意，在实验2中，经过转换的数据集有62个特征用于训练，而原始数据集只有6个特征。所有新特征都是在 PyCaret 中进行转换和自动特征工程的结果。

转换后数据集的列

PyCaret 中模型训练的示例代码：

# 模型训练和验证
lr = create_model('lr')

线性回归模型的10折交叉验证

请注意转换和自动特征工程的影响。R2 增加了10%，付出的努力很少。我们可以比较两个实验中线性回归模型的残差图，观察转换和特征工程对模型的异方差性的影响。

# 绘制训练模型的残差图
plot_model(lr, plot = 'residuals')

线性回归模型的残差图

机器学习是一个迭代的过程。迭代次数和使用的技术取决于任务的重要性以及如果预测错误会产生的影响。在医院的重症监护室中，用于预测患者结果的机器学习模型的严重性和影响远远超过用于预测客户流失的模型。

在本教程中，我们只进行了两次迭代，并且将第二个实验中的线性回归模型用于部署。然而，在这个阶段，模型仍然只是笔记本/IDE 中的一个对象。要将其保存为可以传输和被其他应用程序使用的文件，请执行以下代码：

# 保存转换管道和模型
save_model(lr, model_name = 'deployment_28042020')

当您在 PyCaret 中保存模型时，将基于在**setup() **函数中定义的配置创建整个转换管道。所有的相互依赖关系都会自动协调。查看存储在 'deployment_28042020' 变量中的管道和模型：

使用 PyCaret 创建的管道

我们已经完成了训练和模型选择。最终的机器学习管道和线性回归模型现在保存为 pickle 文件（deployment_28042020.pkl），将在 Web 应用程序中用于对新数据点生成预测。

👉 任务2 — 构建前端 Web 应用程序

现在我们的机器学习管道和模型已经准备好了，可以开始构建一个前端 Web 应用程序，用于对新数据点生成预测。该应用程序将通过 csv 文件上传支持“在线”和“批量”预测。让我们将应用程序代码分解为三个主要部分：

头部/布局

此部分导入库，加载训练好的模型，并创建一个基本布局，顶部有一个徽标，侧边栏有一个下拉菜单，用于在“在线”和“批量”预测之间切换。

app.py — 代码片段第1部分

在线预测

此部分处理初始应用程序函数，逐个进行在线预测。我们使用 streamlit 的小部件，如_数字输入、文本输入、下拉菜单和复选框_，收集用于训练模型的数据点，如年龄、性别、BMI、子女、吸烟者、地区。

app.py — 代码片段第2部分

批量预测

批量预测是该应用程序功能的第二层。在 streamlit 中使用的 file_uploader 小部件用于上传 csv 文件，然后调用 PyCaret 中的原生 **predict_model() **函数来生成预测结果，这些结果使用 streamlit 的 write() 函数显示。

app.py — 代码片段第 3 部分

如果您还记得上面任务 1 中，我们完成了一个线性回归模型，该模型是在从 6 个原始特征中提取的 62 个特征上训练的。Web 应用程序的前端有一个输入表单，只收集六个特征，即年龄、性别、BMI、子女、吸烟者、地区。

我们如何将这些新数据点的 6 个特征转换为用于训练模型的 62 个特征？我们不需要担心这一部分，因为 PyCaret 通过编排转换流水线来自动处理这一部分。当您对使用 PyCaret 训练的模型调用预测函数时，所有转换都会自动应用（按顺序），然后从训练模型生成预测结果。

**测试应用程序 **在将应用程序发布到 Heroku 之前的最后一步是在本地测试 Web 应用程序。打开 Anaconda Prompt 并导航到项目文件夹，执行以下代码：

streamlit run app.py

Streamlit 应用程序测试 — 在线预测

Streamlit 应用程序测试 — 批量预测

现在我们有了一个完全功能的 Web 应用程序，我们可以开始将应用程序容器化并部署到 Google Kubernetes Engine。

👉 任务 3 — 创建 Dockerfile

为了部署我们的应用程序，我们需要一个在运行时成为容器的 Docker 镜像。使用 Dockerfile 创建 Docker 镜像。Dockerfile 只是一个带有一组指令的文件。该项目的 Dockerfile 如下所示：

Dockerfile 的最后部分（从第 23 行开始）是特定于 Streamlit 的，通常不需要。Dockerfile 区分大小写，必须与其他项目文件一起放在项目文件夹中。

👉 任务 4 — 在 GKE 上部署 ML 流水线：

如果您想跟着操作，您需要从 GitHub 上 fork 这个仓库。

按照以下简单的 10 个步骤在 GKE 集群上部署应用程序。

步骤 1 — 在 GCP 控制台中创建新项目

登录到您的 GCP 控制台，然后转到管理资源

Google Cloud Platform 控制台 → 管理资源

点击 创建新项目

Google Cloud Platform 控制台 → 管理资源 → 创建新项目

步骤 2 — 导入项目代码

单击控制台窗口右上角的 **激活 Cloud Shell **按钮以打开 Cloud Shell。

Google Cloud Platform（项目信息页面）

在 Cloud Shell 中执行以下代码以克隆本教程中使用的 GitHub 仓库。

git clone [https://github.com/pycaret/pycaret-streamlit-google.git](https://github.com/pycaret/pycaret-streamlit-google.git)

步骤 3 — 设置项目 ID 环境变量

执行以下代码设置 PROJECT_ID 环境变量。

export PROJECT_ID=pycaret-streamlit-gcp

pycaret-streamlit-gcp 是我们在上面第 1 步中选择的项目名称。

步骤 4 — 构建 Docker 镜像

通过执行以下代码构建应用程序的 Docker 镜像并为上传打标签：

docker build -t gcr.io/${PROJECT_ID}/insurance-streamlit:v1 .

成功构建 Docker 镜像时返回的消息

您可以通过运行以下代码来检查可用的镜像：

docker images

步骤 5 — 上传容器镜像

验证 Container Registry（您只需要运行一次）：
```
gcloud auth configure-docker
```
执行以下代码将 Docker 镜像上传到 Google Container Registry：
```
docker push gcr.io/${PROJECT\_ID}/insurance-streamlit:v1
```

步骤 6 — 创建集群

现在容器已上传，您需要一个集群来运行容器。集群由一组 Compute Engine VM 实例组成，运行 Kubernetes。

为 gcloud 工具设置项目 ID 和 Compute Engine 区域选项：

gcloud config set project $PROJECT\_ID gcloud config set compute/zone **us-central1**

通过执行以下代码创建一个集群：

gcloud container clusters create streamlit-cluster --num-nodes=2

Google Cloud Platform → Kubernetes Engine → Clusters

步骤 7 — 部署应用程序

要在 GKE 集群上部署和管理应用程序，您必须与 Kubernetes 集群管理系统通信。执行以下命令以部署应用程序：

kubectl create deployment insurance-streamlit --image=gcr.io/${PROJECT_ID}/insurance-streamlit:v1

步骤 8 — 将应用程序暴露给互联网

默认情况下，在 GKE 上运行的容器无法从互联网访问，因为它们没有外部 IP 地址。执行以下代码将应用程序暴露给互联网：

kubectl expose deployment insurance-streamlit --type=LoadBalancer --port 80 --target-port 8501

步骤 9 — 检查服务

执行以下代码以获取服务的状态。EXTERNAL-IP 是您可以在浏览器中使用的网址，查看发布的应用程序。

kubectl get service

步骤 10 — 在网址上查看应用程序运行情况

App Published on https://34.70.49.248 — Page 1

App Published on https://34.70.49.248 — Page 2

注意：当本故事发布时，该应用程序将从公共地址中移除，以限制资源消耗。

此教程的 GitHub 存储库链接

Microsoft Azure 部署的 GitHub 存储库链接

Heroku 部署的 GitHub 存储库链接

PyCaret 2.0.0 即将发布！

我们收到了社区的大力支持和反馈。我们正在积极改进 PyCaret 并为下一个版本做准备。PyCaret 2.0.0 将更加强大和优秀。如果您想分享您的反馈并帮助我们进一步改进，可以在网站上填写此表格，或在我们的GitHub或LinkedIn页面上留言。

关注我们的LinkedIn，订阅我们的YouTube频道，了解更多关于 PyCaret 的内容。

想了解特定模块吗？

截至第一个版本 1.0.0，PyCaret 有以下模块可供使用。点击下面的链接查看 Python 中的文档和示例。

分类回归聚类异常检测自然语言处理关联规则挖掘

还可查看：

PyCaret 在 Notebook 中的入门教程：

分类回归聚类异常检测自然语言处理关联规则挖掘

想要贡献吗？

PyCaret 是一个开源项目。欢迎每个人贡献。如果您想贡献，请随时处理开放问题。我们接受带有单元测试的拉取请求，分支为 dev-1.0.1。

如果您喜欢 PyCaret，请在我们的GitHub 仓库上给我们 ⭐️。

Medium: https://medium.com/@moez_62905/

LinkedIn: https://www.linkedin.com/in/profile-moez/

Twitter: https://twitter.com/moezpycaretorg1

在 Google Kubernetes 上部署机器学习应用

在 Google Kubernetes Engine 上部署使用 Streamlit 和 PyCaret 构建的机器学习应用的逐步入门指南​

作者：Moez Ali​

回顾​

👉 本教程中你将学到什么​

💻 本教程的工具箱​

PyCaret​

Streamlit​

Google Cloud Platform​

让我们开始吧。​

什么是 Kubernetes？​

特点​

如果已经有 Docker，为什么还需要 Kubernetes？​

什么是 Google Kubernetes Engine？​

最后一次，您理解了吗？​

设置业务背景​

目标​

任务​

👉 任务1 — 模型训练和验证​

👉 任务2 — 构建前端 Web 应用程序​

头部/布局​

在线预测​

批量预测​

👉 任务 3 — 创建 Dockerfile​

👉 任务 4 — 在 GKE 上部署 ML 流水线：​

步骤 1 — 在 GCP 控制台中创建新项目​

步骤 2 — 导入项目代码​

步骤 3 — 设置项目 ID 环境变量​

步骤 4 — 构建 Docker 镜像​

步骤 5 — 上传容器镜像​

步骤 6 — 创建集群​

步骤 7 — 部署应用程序​

步骤 8 — 将应用程序暴露给互联网​

步骤 9 — 检查服务​

步骤 10 — 在网址上查看应用程序运行情况​

PyCaret 2.0.0 即将发布！​

想了解特定模块吗？​

还可查看：​

想要贡献吗？​

在 Google Kubernetes Engine 上部署使用 Streamlit 和 PyCaret 构建的机器学习应用的逐步入门指南

作者：Moez Ali

回顾

👉 本教程中你将学到什么

💻 本教程的工具箱

PyCaret

Streamlit

Google Cloud Platform

让我们开始吧。

什么是 Kubernetes？

特点

如果已经有 Docker，为什么还需要 Kubernetes？

什么是 Google Kubernetes Engine？

最后一次，您理解了吗？

设置业务背景

目标

任务

👉 任务1 — 模型训练和验证

👉 任务2 — 构建前端 Web 应用程序

头部/布局

在线预测

批量预测

👉 任务 3 — 创建 Dockerfile

👉 任务 4 — 在 GKE 上部署 ML 流水线：

步骤 1 — 在 GCP 控制台中创建新项目

步骤 2 — 导入项目代码

步骤 3 — 设置项目 ID 环境变量

步骤 4 — 构建 Docker 镜像

步骤 5 — 上传容器镜像

步骤 6 — 创建集群

步骤 7 — 部署应用程序

步骤 8 — 将应用程序暴露给互联网

步骤 9 — 检查服务

步骤 10 — 在网址上查看应用程序运行情况

PyCaret 2.0.0 即将发布！

想了解特定模块吗？

还可查看：

想要贡献吗？