从 Azure Databricks 外部访问 MLflow 跟踪服务器
你可能希望从自己的应用程序或从 MLflow CLI 登录到 MLflow 跟踪服务器。
本文介绍了所需的配置步骤。 首先安装 MLflow 并配置凭据(步骤 1)。 然后,可以配置应用程序(步骤 2),也可以配置 MLflow CLI(步骤 3)。
有关如何启动并登录到开放源代码跟踪服务器的信息,请参阅开放源代码文档。
步骤 1:配置环境
如果没有 Azure Databricks 帐户,则可以免费试用 Databricks。
配置环境以访问 Azure Databricks 托管 MLflow 跟踪服务器:
- 使用
pip install mlflow
安装 MLflow。 - 配置身份验证。 执行以下操作之一:
使用
databricks configure --token
生成 REST API 令牌 并创建凭据文件。通过环境变量指定凭据:
# Configure MLflow to communicate with a Databricks-hosted tracking server export MLFLOW_TRACKING_URI=databricks # Specify the workspace hostname and token export DATABRICKS_HOST="..." export DATABRICKS_TOKEN="..."
步骤 2:配置 MLflow 应用程序
通过将跟踪 URI 设置为 databricks
或 databricks://<profileName>
(如果在创建凭据文件时通过 --profile
指定了配置文件名称),将 MLflow 应用程序配置为登录到 Azure Databricks。 例如,可以通过将 MLFLOW_TRACKING_URI
环境变量设置为“databricks”来实现此目的。
步骤 3:配置 MLflow CLI
配置 MLflow CLI 以使用 MLFLOW_TRACKING_URI
环境变量与 Azure Databricks 跟踪服务器进行通信。 例如,若要结合使用 CLI 和跟踪 URI databricks
来创建试验,请运行:
# Replace <your-username> with your Databricks username
export MLFLOW_TRACKING_URI=databricks
mlflow experiments create -n /Users/<your-username>/my-experiment