Databricks 上的开源 MLflow 与托管 MLflow

开源 MLflow 提供核心数据模型和 SDK,而 Databricks 上的托管 MLflow 则添加:

  • 适用于生产的可扩展性 - 高容量的跟踪引入以支持生产工作负载
  • 高级评估/监控 - 通过代理评估集成
  • 与 Lakehouse 集成 - 所有可用数据均为 Delta 表,可通过 Notebook、Databricks SQL 和 Databricks AI/BI 仪表板用于下游 BI 和分析用例。
  • 企业级治理 - 通过与 Unity Catalog 集成
  • 完全托管的主机托管 - 零基础设施管理

小窍门

数据始终是你的 - 核心数据模型和跟踪功能是完全开源的。 可以在任意位置导出和使用 MLflow 数据。

一目了然的关键差异

概述比较

功能 / 特点 开源 MLflow Databricks 上的管理的 MLflow
跟踪和可观测性
跟踪数据模型和应用程序接口
生产规模跟踪引入
生产监控
GenAI 评估与监控
评估数据模型和 API
人工反馈 UI 和 API
高质量、由研究支持的 LLM 评委
具有版本的评估数据集
企业就绪情况
Hosting 自主管理 完全受管理
企业治理(Unity Catalog)
与用于 AI/BI 和 SQL 的 Lakehouse 集成的数据
CI/CD 部署作业
LLM /MLOps
提示管理
试验跟踪
模型/应用版本管理

为什么选择托管 MLflow?

Databricks 上托管的 MLflow 扩展了开源 MLflow,提供了专为生产生成式 AI 应用设计的功能。

可缩放生产

  • 专为生产工作负荷设计的大量跟踪数据的引入能力,每秒处理数千个请求
  • 无需基础结构管理的自动缩放
  • 使用内置仪表板和警报进行生产监视

高级评估和监视

  • 代理评估集成 提供高质量的 LLM 评估、人工标记用户界面和版本化的评估数据集
  • 持续监视 自动评估生产过程
  • 质量仪表板 可视化趋势并识别问题

与 Lakehouse 和 Unity 目录集成

  • Lakehouse 集成 使所有跟踪、评估和监视数据都可用于下游工作流,使用 Databricks AI/BI 功能 创建自定义仪表板、分析和报告 GenAI 数据
  • Unity 目录治理 提供企业级安全性和访问控制

完全托管的托管托管

  • 零基础结构管理 - Databricks 处理所有托管、缩放和更新
  • 具有高可用性和自动备份的企业 SLA
  • 无缝升级到 最新的 MLflow 功能

后续步骤

  1. 创建试用 Databricks 帐户

  2. MLflow 已预安装并配置

  3. 按照 快速入门 指南开始。