Azure Databricks 入门
如果不熟悉 Azure Databricks,可以从这里开始。 本节包括基本帐户设置的说明、Databricks 工作区 UI 的导览以及与 Azure Databricks 上的探索性数据分析和 ETL 相关的一些基本教程。
有关联机培训资源的信息,请参阅获取免费的 Databricks 培训。
创建 Azure Databricks 工作区
Databricks 建议使用 Azure 门户部署第一个 Azure Databricks 工作区。 也可使用以下选项之一部署 Azure Databricks:
注意
创建 Azure Databricks 工作区时,可以选择“试用版(高级 - 14天免费 DBU)”定价层,让工作区访问免费的高级 Azure Databricks DBU 14 天。
准备阶段
- 你必须有一个不是试用版订阅的 Azure 试用版订阅。 如果有试用版订阅,请完成下面的步骤:
- 转到个人资料,将订阅更改为“标准预付费套餐”。 请参阅 Azure 试用版订阅。
- 移除支出限制。
- 对你所在区域中的 vCPU 请求增加配额。
- 登录 Azure 门户。
- 必须是 Azure 参与者或所有者,或者必须在订阅中注册 Microsoft.ManagedIdentity 资源提供程序。 若要注册 Microsoft.ManagedIdentity 资源提供程序,必须拥有有权执行
/register/action
操作的自定义角色。 有关详细信息,请参阅 Azure 资源提供程序。
使用该门户创建 Azure Databricks 工作区
在 Azure 门户中,选择“创建资源”>“数据 + 分析”,选择“在市场中查看更多内容”,并搜索“Azure Databricks”。
在“Azure Databricks 服务”下,提供所需的值以创建 Databricks 工作区。
Property 说明 工作区名称 提供 Databricks 工作区的名称 订阅 从下拉列表中选择自己的 Azure 订阅。 资源组 指定是要创建新的资源组还是使用现有的资源组。 资源组是用于保存 Azure 解决方案相关资源的容器。 有关详细信息,请参阅 Azure 资源组概述。 位置 选择“中国东部 2”。 有关其他可用区域,请参阅各区域推出的 Azure 服务。 定价层 在“标准”、“高级”和“试用”之间进行选择。 有关这些层的详细信息,请参阅 Databricks 价格页。 选择“查看 + 创建”,然后选择“创建” 。 创建工作区需要几分钟时间。 创建工作区时,可以在“通知”中查看部署状态。 完成此过程后,你的用户帐户将自动添加为工作区的管理员用户。
注意
当工作区部署失败时,仍然会在失败状态下创建工作区。 删除失败的工作区,并创建一个解决部署错误的新工作区。 删除失败的工作区时,托管资源组和任何成功部署的资源也将被删除。
后续步骤
后续步骤取决于是要继续设置帐户组织和安全性,还是要开始构建数据管道:
将 Databricks 工作区连接到外部数据源。 请参阅连接到数据源。
将数据输入工作区。 查看将数据输入 Databricks 湖屋。
建立帐户组织和安全性。 请参阅 Azure Databricks 管理入门。
了解如何管理对工作区中数据的访问。 请参阅什么是 Unity Catalog?。
了解如何管理对工作区对象的访问,如笔记本、计算、仪表板和查询。 请参阅访问控制列表。
获取帮助
如果你对设置 Azure Databricks 有任何疑问并需要获取实时帮助,请发送电子邮件至 onboarding-help@databricks.com。
如果你的组织没有订阅 Azure Databricks 支持,或者你不是贵公司支持订阅的授权联系人,可以在 Databricks 办公时间或从 Databricks 社区获取许多问题的解答。
如果需要其他帮助,请报名参加每周现场演示,这样你就可以提出问题并与 Databricks 专家一起练习。 也可参阅这个有关管理和维护环境的最佳做法的博客系列。