从 Azure Databricks 外部访问 MLflow 跟踪服务器

你可能希望从自己的应用程序或从 MLflow CLI 登录到 MLflow 跟踪服务器。

本文介绍了所需的配置步骤。 首先安装 MLflow 并配置凭据(步骤 1)。 然后,可以配置应用程序(步骤 2),也可以配置 MLflow CLI(步骤 3)。

有关如何启动并登录到开放源代码跟踪服务器的信息,请参阅开放源代码文档

步骤 1:配置环境

如果没有 Azure Databricks 帐户,则可以免费试用 Databricks

配置环境以访问 Azure Databricks 托管 MLflow 跟踪服务器:

  1. 使用 pip install mlflow 安装 MLflow。
  2. 配置身份验证。 执行以下操作之一:
    • 使用 databricks configure --token 生成 REST API 令牌 并创建凭据文件。

    • 通过环境变量指定凭据:

      # Configure MLflow to communicate with a Databricks-hosted tracking server
      export MLFLOW_TRACKING_URI=databricks
      # Specify the workspace hostname and token
      export DATABRICKS_HOST="..."
      export DATABRICKS_TOKEN="..."
      

步骤 2:配置 MLflow 应用程序

通过将跟踪 URI 设置databricksdatabricks://<profileName>(如果在创建凭据文件时通过 --profile 指定了配置文件名称),将 MLflow 应用程序配置为登录到 Azure Databricks。 例如,可以通过将 MLFLOW_TRACKING_URI 环境变量设置为“databricks”来实现此目的。

步骤 3:配置 MLflow CLI

配置 MLflow CLI 以使用 MLFLOW_TRACKING_URI 环境变量与 Azure Databricks 跟踪服务器进行通信。 例如,若要结合使用 CLI 和跟踪 URI databricks 来创建试验,请运行:

# Replace <your-username> with your Databricks username
export MLFLOW_TRACKING_URI=databricks
mlflow experiments create -n /Users/<your-username>/my-experiment