Azure Databricks 入门教程

本部分中的教程介绍了核心功能,并指导你完成使用 Azure Databricks 平台的基础知识。

有关在线培训资源的信息,请参阅 获取免费的 Databricks 培训

如果没有 Azure Databricks 帐户, 请注册试用版

教程 Description
查询和可视化数据 使用 Databricks 笔记本查询 Unity 目录中存储的示例数据,然后将查询结果可视化到笔记本中。
从笔记本导入和可视化 CSV 数据 使用 Databricks 笔记本将数据从 https://health.data.ny.gov CSV 文件导入 Unity 目录卷。
创建表 使用 Unity 目录数据治理模型在 Azure Databricks 中创建表并授予特权。
浏览 Databricks One 中的仪表板和查询数据 导航专为业务用户设计的 Databricks One 界面。 查看仪表板,并发现与你共享的资产。

数据工程

教程 Description
使用 Lakeflow Spark 声明性管道生成 ETL 管道 使用 Lakeflow Spark 声明性管道和 Auto Loader 为数据编排创建和部署 ETL(提取、转换和加载)管道。
使用 Apache Spark 生成 ETL 管道 使用 Apache Spark™ 开发和部署您的首个 ETL(提取、转换和加载)管道,用于数据编排。

人工智能和机器学习

教程 Description
训练和部署 ML 模型 使用 Databricks 上的 scikit-learn 库构建机器学习分类模型,以预测葡萄酒是否被视为“高质量”。 本教程还演示了如何使用 MLflow 跟踪模型开发过程,以及使用 Hyperopt 自动执行超参数优化。

获取帮助

  • 如果你对设置 Azure Databricks 有任何疑问并需要获取实时帮助,请发送电子邮件至 onboarding-help@databricks.com

  • 如果你的组织没有 Azure Databricks 支持订阅,或者你不是公司支持订阅的授权联系人,则可以从 Databricks 社区获取答案。