10 分钟教程:Azure Databricks 上的机器学习入门

本部分中的笔记本旨在帮助你快速开始使用 Azure Databricks 上的机器学习。 这些笔记本演示了如何在整个机器学习生命周期中使用 Azure Databricks - 生命周期涵盖数据加载和准备,模型训练、优化和推理,以及模型部署和管理。 它们演示了一些有用的工具,例如用于自动超参数优化的 Hyperopt、用于模型开发的 MLflow 跟踪和自动日志记录,以及用于模型管理的模型注册表

scikit-learn 笔记本

笔记本 要求 功能
机器学习快速入门 Databricks Runtime 7.5 ML 或更高版本 分类模型、MLflow、通过 Hyperopt 和 MLflow 实现的自动超参数优化
使用模型注册表的机器学习 Databricks Runtime ML 分类模型、MLflow、通过 Hyperopt 和 MLflow 实现的自动超参数优化、模型注册表
端到端示例 Databricks Runtime ML 分类模型、MLflow、通过 Hyperopt 和 MLflow 实现的自动超参数优化、XGBoost、模型注册表、模型处理

Apache Spark MLlib 笔记本

笔记本 要求 功能
使用 MLlib 的机器学习 Databricks Runtime 7.3 LTS ML 或更高版本 逻辑回归模型、Spark 管道,使用 MLlib API 的自动超参数优化

深度学习笔记本

笔记本 要求 功能
使用 TensorFlow Keras 的深度学习 Databricks Runtime 7.0 ML 或更高版本 神经网络模型、内联 TensorBoard、通过 Hyperopt 和 MLflow 实现的自动超参数优化、自动日志记录、模型注册表