从 Azure Databricks 外部访问 MLflow 跟踪服务器

你可能希望从自己的应用程序或 MLflow CLI 登录到 MLflow 跟踪服务器。

本文介绍所需的配置步骤。 首先安装 MLflow 并配置凭据(步骤 1)。 然后,可以配置应用程序(步骤 2)或配置 MLflow CLI(步骤 3)。

有关如何启动和记录到开源跟踪服务器的信息,请参阅 MLflow 开源文档

步骤 1:配置环境

如果没有 Azure Databricks 帐户,可以 免费试用 Databricks

若要配置环境以访问 Azure Databricks 托管的 MLflow 跟踪服务器,

  1. 使用 pip install mlflow 安装 MLflow。

  2. 配置身份验证。 执行以下其中之一操作:

    • 生成REST API 令牌并使用databricks configure --token创建凭据文件。

    • 通过环境变量指定凭据:

      # Configure MLflow to communicate with a Databricks-hosted tracking server
      export MLFLOW_TRACKING_URI=databricks
      # Specify the workspace hostname and token
      export DATABRICKS_HOST="..."
      export DATABRICKS_TOKEN="..."
      

步骤 2:配置 MLflow 应用程序

将 MLflow 应用程序配置为通过设置跟踪 URI来登录到 Azure Databricks,或者如果在创建凭据文件时指定了配置文件名称,则使用databricks://<profileName>登录,databricks--profile。 例如,可以通过将 MLFLOW_TRACKING_URI 环境变量设置为“databricks”来实现此目的。

步骤 3:配置 MLflow CLI

将 MLflow CLI 配置为与 Azure Databricks 跟踪服务器与 MLFLOW_TRACKING_URI 环境变量通信。 例如,若要使用 CLI 和跟踪 URI databricks创建试验,请运行:

# Replace <your-username> with your Databricks username
export MLFLOW_TRACKING_URI=databricks
mlflow experiments create -n /Users/<your-username>/my-experiment