从 Azure Databricks 外部访问 MLflow 跟踪服务器
你可能希望从自己的应用程序或从 MLflow CLI 登录到 MLflow 跟踪服务器。
本文介绍了所需的配置步骤。 首先安装 MLflow 并配置凭据(步骤 1)。 然后,可以配置应用程序(步骤 2),也可以配置 MLflow CLI(步骤 3)。
有关如何启动并登录到开放源代码跟踪服务器的信息,请参阅开放源代码文档。
如果没有 Azure Databricks 帐户,则可以免费试用 Databricks。
配置环境以访问 Azure Databricks 托管 MLflow 跟踪服务器:
- 使用
pip install mlflow
安装 MLflow。 - 配置身份验证。 执行以下操作之一:
使用
databricks configure --token
生成 REST API 令牌 并创建凭据文件。通过环境变量指定凭据:
# Configure MLflow to communicate with a Databricks-hosted tracking server export MLFLOW_TRACKING_URI=databricks # Specify the workspace hostname and token export DATABRICKS_HOST="..." export DATABRICKS_TOKEN="..."
通过将跟踪 URI 设置为 databricks
或 databricks://<profileName>
(如果在创建凭据文件时通过 --profile
指定了配置文件名称),将 MLflow 应用程序配置为登录到 Azure Databricks。 例如,可以通过将 MLFLOW_TRACKING_URI
环境变量设置为“databricks”来实现此目的。
配置 MLflow CLI 以使用 MLFLOW_TRACKING_URI
环境变量与 Azure Databricks 跟踪服务器进行通信。 例如,若要结合使用 CLI 和跟踪 URI databricks
来创建试验,请运行:
# Replace <your-username> with your Databricks username
export MLFLOW_TRACKING_URI=databricks
mlflow experiments create -n /Users/<your-username>/my-experiment