在 Databricks 上部署的跟踪代理

本页演示如何在 Databricks 上部署 GenAI 应用程序，以便自动捕获生产跟踪。

有关在 Databricks 外部部署的应用，请参阅 Databricks 外部部署的跟踪代理。

MLflow 生产跟踪概述

使用代理框架进行部署（建议）

设置跟踪数据的存储位置：

接下来，在 Python 笔记本中，使用 MLflow 跟踪检测代理，并使用 Agent Framework 部署代理：

注释

如果要从存储在 Databricks Git 文件夹中的笔记本部署代理，则默认情况下，MLflow 3 实时跟踪不起作用。

若要启用实时跟踪，请先将试验设置为非 Git 关联的试验 mlflow.set_experiment() ，然后再运行 agents.deploy()。

此笔记本演示上述部署步骤。

如果无法使用代理框架，请改用自定义 CPU 模型服务部署代理。

首先，为跟踪设置存储位置：

接下来，在 Python 笔记本中，使用 MLflow 跟踪检测代理，并使用模型服务 UI 或 API 来部署代理：

将代理通过自动或手动跟踪工具记录为 MLflow 模型。
将模型部署到 CPU 服务。
预配具有 MLflow 试验访问权限的服务主体或个人访问令牌（PAT CAN_EDIT ）。
在 CPU 服务终结点页中，转到“编辑终结点”。对于要跟踪的每个已部署模型，请添加以下环境变量：
ENABLE_MLFLOW_TRACING=true
MLFLOW_EXPERIMENT_ID=<ID of the experiment you created>
如果预配了服务主体，请设置 DATABRICKS_CLIENT_ID 和 DATABRICKS_CLIENT_SECRET。如果预配了 PAT，请设置 DATABRICKS_HOST 和 DATABRICKS_TOKEN。

Databricks 会在部署过程中将跟踪记录到由 mlflow.set_experiment(...) 设置的 MLflow 实验中。追踪可实时在 MLflow UI 中查看。

跟踪被存储为工件，您可以指定自定义存储位置。例如，如果您创建一个工作区实验并将artifact_location设置为 Unity Catalog 卷，那么数据访问的跟踪将受到Unity Catalog 卷权限的管理。

将跟踪记录到 MLflow 试验后，可以选择使用生产监控（beta 版）将其长久存储在 Delta 表中。

生产监控在跟踪存储中的优点：