开源 MLflow 提供核心数据模型和 SDK,而 Databricks 上的托管 MLflow 则添加:
- 适用于生产的可扩展性 - 高容量的跟踪引入以支持生产工作负载
- 高级评估/监控 - 通过代理评估集成
- 与 Lakehouse 集成 - 所有可用数据均为 Delta 表,可通过 Notebook、Databricks SQL 和 Databricks AI/BI 仪表板用于下游 BI 和分析用例。
- 企业级治理 - 通过与 Unity Catalog 集成
- 完全托管的主机托管 - 零基础设施管理
小窍门
数据始终是你的 - 核心数据模型和跟踪功能是完全开源的。 可以在任意位置导出和使用 MLflow 数据。
一目了然的关键差异
概述比较
功能 / 特点 | 开源 MLflow | Databricks 上的管理的 MLflow |
---|---|---|
跟踪和可观测性 | ||
跟踪数据模型和应用程序接口 | ✅ | ✅ |
生产规模跟踪引入 | ❌ | ✅ |
生产监控 | ❌ | ✅ |
GenAI 评估与监控 | ||
评估数据模型和 API | ✅ | ✅ |
人工反馈 UI 和 API | ❌ | ✅ |
高质量、由研究支持的 LLM 评委 | ❌ | ✅ |
具有版本的评估数据集 | ❌ | ✅ |
企业就绪情况 | ||
Hosting | 自主管理 | 完全受管理 |
企业治理(Unity Catalog) | ❌ | ✅ |
与用于 AI/BI 和 SQL 的 Lakehouse 集成的数据 | ❌ | ✅ |
CI/CD 部署作业 | ❌ | ✅ |
LLM /MLOps | ||
提示管理 | ✅ | ✅ |
试验跟踪 | ✅ | ✅ |
模型/应用版本管理 | ✅ | ✅ |
为什么选择托管 MLflow?
Databricks 上托管的 MLflow 扩展了开源 MLflow,提供了专为生产生成式 AI 应用设计的功能。
可缩放生产
- 专为生产工作负荷设计的大量跟踪数据的引入能力,每秒处理数千个请求
- 无需基础结构管理的自动缩放
- 使用内置仪表板和警报进行生产监视
高级评估和监视
- 代理评估集成 提供高质量的 LLM 评估、人工标记用户界面和版本化的评估数据集
- 持续监视 自动评估生产过程
- 质量仪表板 可视化趋势并识别问题
与 Lakehouse 和 Unity 目录集成
- Lakehouse 集成 使所有跟踪、评估和监视数据都可用于下游工作流,使用 Databricks AI/BI 功能 创建自定义仪表板、分析和报告 GenAI 数据
- Unity 目录治理 提供企业级安全性和访问控制
完全托管的托管托管
- 零基础结构管理 - Databricks 处理所有托管、缩放和更新
- 具有高可用性和自动备份的企业 SLA
- 无缝升级到 最新的 MLflow 功能
后续步骤
创建试用 Databricks 帐户
MLflow 已预安装并配置
按照 快速入门 指南开始。