Azure Databricks上的机器学习

在Azure Databricks上生成、部署和管理机器学习应用程序。集成平台将整个 ML 生命周期从数据准备到生产监视统一。

开始

请尝试快速入门、准备数据或生成低代码模型。

指南	Description
入门：在 Databricks 上构建第一个机器学习模型	使用 scikit-learn 端到端构建简单的分类模型。
AutoML	使用自动化功能工程和超参数优化，使用最少的代码自动生成高质量的模型。
加载机器学习和深度学习的数据	加载并准备适用于机器学习和深度学习工作流的数据。
训练推荐器模型	使用双塔或 DLRM 体系结构训练推荐器模型。

训练经典机器学习模型

使用自动化工具和协作开发环境创建机器学习模型。

功能 / 特点	Description
用于 ML 的 Databricks Runtime	使用 scikit-learn、XGBoost、MLflow 和其他 ML 库预先配置的群集，以及对深度学习框架的支持。
MLflow 跟踪	跟踪试验、比较模型性能以及管理完整的模型开发生命周期。
特征工程	使用自动化数据管道和功能发现创建、管理和提供功能。
Databricks 笔记本	协作开发环境，支持 Python、R、Scala 和 SQL for ML 工作流。

训练深度学习模型

使用托管计算和内置框架开发深度学习模型。

功能 / 特点	Description
分布式训练	使用 Ray、TorchDistributor 和 DeepSpeed 进行分布式深度学习的示例。
DL 最佳做法	框架选择、数据加载、分布式缩放和管理深度学习模型生命周期指南。
PyTorch	使用 PyTorch 的单节点和分布式训练。

部署和提供模型

使用可缩放的终结点、实时推理和企业级监视将模型部署到生产环境。

监视和管理 ML 系统

通过全面的监视和治理工具确保模型质量、数据完整性和合规性。

功能 / 特点	Description
Unity Catalog	使用统一的访问控制、世系跟踪和发现来管理数据、功能、模型和函数。
MLflow 用于模型	在整个开发生命周期中跟踪、评估和监视生成 AI 应用程序。

实现机器学习工作流生产化

使用自动化工作流程、CI/CD 集成和生产就绪的管道扩展机器学习操作。

功能 / 特点	Description
Unity 目录中的模型	使用 Unity 目录中的模型注册表进行集中治理，并管理模型生命周期，包括部署。
Lakeflow 作业	生成自动化工作流和生产就绪的 ETL 管道，以便进行 ML 数据处理。
Databricks 上的 Ray	使用分布式计算缩放 ML 工作负荷，以便进行大规模模型训练和推理。
MLOps 工作流	使用自动化训练、测试和部署管道实现端到端机器学习运维（MLOps）。

Last updated on 2026-06-05