教程:Azure Databricks 上的端到端 ML 模型
现实世界中的机器学习非常混乱。 数据源包含缺少的值、包含冗余行或可能无法放入内存中。 特征工程通常需要特定领域的专业知识并且可能很乏味。 建模也常常混合了数据科学和系统工程,不仅需要了解算法,还需要了解计算机体系结构和分布式系统。
Azure Databricks 简化了此过程。 下面的 10 分钟教程笔记本演示了针对表格数据训练机器学习模型的端到端示例。
你可以导入此笔记本并自己运行,也可以复制代码片段和想法供自己使用。
笔记本
如果为 Unity Catalog 启用了工作区,请使用此版本的笔记本:
在 Databricks 上将 scikit-learn 与 MLflow 集成配合使用 (Unity Catalog)
如果未为 Unity Catalog 启用工作区,请使用此版本的笔记本: