如何运行教程

本简要指南将引导您了解运行这些教程的一些选项,并拥有一个可用于记录结果的跟踪服务器(以及为MLflow UI提供选项)。

本指南中主题的列表按复杂性升序排列,因此如果您正在寻找最快、最简单的方法来入门,请评估第一个选项。

Databricks

开始使用 MLflow 最简单的方法是使用 Databricks 提供的托管 MLflow 服务。这里有两个不同的选项,一个是如果你是 Databricks 客户,最快捷的方式,另一个是任何人都可以使用的,免费

Databricks 客户

如果您已经是 Databricks 的客户,您可以使用作为 Databricks 工作区一部分提供的 MLflow 服务。Databricks 上的 MLflow 是一个完全托管的服务,为企业客户提供额外的功能,提供可扩展且安全的 MLflow 托管部署。请注意,Databricks 内部的 MLflow API 与开源版本相同,因此您可以使用相同的代码在 Databricks 或您自己的基础设施上运行。

要了解如何从您的 Databricks 账户中开始使用 MLflow,请参阅以下适用于您的云提供商的相应链接:

Databricks 社区版

Databricks 社区版 (CE) 是 Databricks 平台的一个完全托管、由 Databricks 托管的版本。虽然 Databricks 平台的许多企业级功能在 CE 上不可用,但绝大多数 MLflow 功能都得到了支持(值得注意的是,您不能在 CE 上创建服务端点,因此不支持模型的部署)。

要开始使用 Databricks CE,请访问 Databricks 社区版页面 并按照那里的说明操作。大约需要 5 分钟即可开始,您将拥有一个(大部分)功能齐全的 Databricks 工作区,可用于记录您的教程实验、运行和工件。

一旦你登录到社区版,你将看到一个类似这样的登录页面:

Databricks CE 着陆页

Databricks CE 着陆页

要访问 MLflow UI,您可以通过点击左侧的“实验”链接(由实验室烧杯图标表示)导航到它。当您第一次在 CE 上访问 MLflow UI 时,您会看到以下内容:

Databricks CE MLflow UI

Databricks CE MLflow UI

关于在何处运行您的笔记本的决策

使用Databricks管理的MLflow实例,您有两种运行教程笔记本的选项:

Expand to learn about Importing Notebooks directly into CE

Once you're at the main page of CE, you can import any of the notebooks within this tutorial by navigating to the "Workspace" tab on the left.

Click that link to expand the file navigation pane. From there, navigate to Users/<you> and you can right click to bring up the "Import" option.

The below image shows what the import dialog should look like if you're going to directly import a notebook from the MLflow documentation website:

Databricks CE import Notebook from MLflow docs website

At this point, you can simply just run the tutorial.
Any calls to MLflow for creating experiments, initiating runs, logging metadata, and saving artifacts will be fully managed for you and your logging history will appear within the MLflow UI.


Expand to learn about Running Notebooks locally and using CE as a remote tracking server

In order to stay within the comfortable confines of your local machine and still have the use of the managed MLflow Tracking Server, you can simply add a call to mlflow.login() to your notebook. This will generate a prompt for you to enter your username and password that were defined when creating your account on CE.

Note: your username will be the email address that you used when signing up.


    import mlflow

    mlflow.login()
    

After the login process is done, you will simply have to set your MLflow Tracking URI to the instance that you just logged in to.
It's made fairly easy for you:


    mlflow.set_tracking_uri("databricks")
    

此时,你已经准备就绪!你可以在本地运行任何教程,它们将会记录到托管的 MLflow 跟踪服务器。

自管理的 MLflow

如果你有自己的托管 MLflow 服务器并希望使用它,你可以简单地将 MLflow 跟踪 URI 设置为指向你的服务器。如果有额外的配置或连接限制,请联系管理你的 MLflow 部署的团队以获取更多信息。

要直接设置 MLflow 跟踪 URI(假设你没有设置额外的安全验证),你只需在笔记本中执行以下操作:

mlflow.set_tracking_uri(
    "http://<your-mlflow-server>:<the port number that is configured to accept traffic>"
)

本地跟踪服务器