Azure Databricks 入门

如果不熟悉 Azure Databricks,可以从这里开始。 本节包括基本帐户设置的说明、Databricks 工作区 UI 的导览以及与 Azure Databricks 上的探索性数据分析和 ETL 相关的一些基本教程。

有关联机培训资源的信息,请参阅获取免费的 Databricks 培训

创建 Azure Databricks 工作区

Databricks 建议使用 Azure 门户部署第一个 Azure Databricks 工作区。 也可使用以下选项之一部署 Azure Databricks:

注意

创建 Azure Databricks 工作区时,可以选择“试用版(高级 - 14天免费 DBU)”定价层,让工作区访问免费的高级 Azure Databricks DBU 14 天。

准备阶段

  • 你必须有一个不是试用版订阅的 Azure 试用版订阅。 如果有试用版订阅,请完成下面的步骤:
  • 登录 Azure 门户
  • 必须是 Azure 参与者或所有者,或者必须在订阅中注册 Microsoft.ManagedIdentity 资源提供程序。 若要注册 Microsoft.ManagedIdentity 资源提供程序,必须拥有有权执行 /register/action 操作的自定义角色。 有关详细信息,请参阅 Azure 资源提供程序

使用该门户创建 Azure Databricks 工作区

  1. 在 Azure 门户中,选择“创建资源”>“数据 + 分析”,选择“在市场中查看更多内容”,并搜索“Azure Databricks”。

  2. 在“Azure Databricks 服务”下,提供所需的值以创建 Databricks 工作区。

    Property 说明
    工作区名称 提供 Databricks 工作区的名称
    订阅 从下拉列表中选择自己的 Azure 订阅。
    资源组 指定是要创建新的资源组还是使用现有的资源组。 资源组是用于保存 Azure 解决方案相关资源的容器。 有关详细信息,请参阅 Azure 资源组概述
    位置 选择“中国东部 2”。 有关其他可用区域,请参阅各区域推出的 Azure 服务
    定价层 在“标准”、“高级”和“试用”之间进行选择。 有关这些层的详细信息,请参阅 Databricks 价格页
  3. 选择“查看 + 创建”,然后选择“创建” 。 创建工作区需要几分钟时间。 创建工作区时,可以在“通知”中查看部署状态。 完成此过程后,你的用户帐户将自动添加为工作区的管理员用户。

注意

当工作区部署失败时,仍然会在失败状态下创建工作区。 删除失败的工作区,并创建一个解决部署错误的新工作区。 删除失败的工作区时,托管资源组和任何成功部署的资源也将被删除。

后续步骤

后续步骤取决于是要继续设置帐户组织和安全性,还是要开始构建数据管道:

获取帮助