DataGrip 与 Azure Databricks 的集成

注意

本文介绍了 Databricks 既不提供也不支持的 DataGrip。 若要联系提供商,请参阅 DataGrip 支持

DataGrip 是一个适用于数据库开发人员的集成开发环境 (IDE),它提供查询控制台、架构导航、解释计划、智能代码完成、实时分析和快速修复、重构、版本控制集成以及其他功能。

本文介绍了如何使用本地开发计算机来安装、配置和使用 DataGrip,以使用 Azure DataRicks 中的数据库。

注意

本文已使用 macOS、Databricks JDBC 驱动程序版本 2.6.36 和 DataGrip 版本 2023.3.1 进行了测试。

要求

安装 DataGrip 之前,本地开发计算机必须满足以下要求:

  • Linux、macOS 或 Windows 操作系统。
  • Databricks JDBC 驱动程序下载到本地开发计算机上,从下载的 DatabricksJDBC42-<version>.zip 文件中提取 DatabricksJDBC42.jar 文件。
  • 要与 DataGrip 连接的 Azure Databricks 群集SQL 仓库

步骤 1:安装 DataGrip

下载并安装 DataGrip

  • Linux:下载 .zip 文件,提取其内容,然后按照 Install-Linux-tar.txt 文件中的说明进行操作。
  • macOS:下载并运行 .dmg 文件。
  • Windows:下载并运行 .exe 文件。

有关详细信息,请参阅 DataGrip 网站上的安装 DataGrip

步骤 2:配置用于 DataGrip 的 Databricks JDBC 驱动程序

使用前面下载的 Databricks JDBC 驱动程序的相关信息设置 DataGrip。

  1. 启动 DataGrip。
  2. 单击“文件”>“数据源”。
  3. 在“数据源和驱动程序”对话框中,单击“驱动程序”选项卡。
  4. 单击“ (驱动程序)”按钮来添加驱动程序+
  5. 对于“名称”,请输入 Databricks
  6. 在“常规”选项卡上的“驱动程序文件”列表中,单击“ (添加)”按钮+
  7. 单击“自定义 JAR”。
  8. 通过浏览找到并选择你之前提取的 DatabricksJDBC42.jar 文件,然后单击“打开”。
  9. 对于“类”,请选择 com.databricks.client.jdbc.Driver
  10. 单击“确定”。

步骤 3:将 DataGrip 连接到你的 Azure Databricks 数据库

  1. 在 DataGrip 中,单击“文件”>“数据源”。

  2. 在“数据源”选项卡上,单击“ (添加)”按钮+

  3. 选择在上一步添加的 Databricks 驱动程序。

  4. 在“常规”选项卡上,对于“URL”,请输入你的 Azure Databricks 资源的“JDBC URL”字段的值。 有关 JDBC URL 字段语法,请参阅 Databricks JDBC 驱动程序的身份验证设置

  5. 单击 “测试连接”

    提示

    在测试连接之前,你应当启动你的资源。 否则,测试会在资源启动的同时进行,可能需要几分钟才能完成。

  6. 如果连接成功,请在“架构”选项卡上选中你希望能够访问的架构对应的复选框,例如“所有架构”

  7. 单击“确定”。

针对需要 DataGrip 访问的每个资源,按此步骤中的说明重复操作。

步骤4:使用 DataGrip 来浏览表

使用 DataGrip 访问你的 Azure Databricks 工作区中的表。

  1. 在 DataGrip 的“数据库”窗口中,依次展开你的资源节点、要浏览的架构、“tables”。
  2. 双击某个表。 此时会显示该表中的第一组行。

按此步骤中的说明重复操作,以访问其他表。

若要访问其他架构中的表,请在“数据库”窗口的工具栏中,单击“数据源属性”图标。 在“数据源和驱动程序”对话框中的“架构”选项卡上,选中你要访问的每个其他架构对应的复选框,然后单击“确定”。

步骤 5:使用 DataGrip 运行 SQL 语句

使用 DataGrip 从 samples 目录的 nyctaxi 架构加载示例 trips 表。

  1. 在 DataGrip 中,单击“文件”>“新建”>“SQL 文件”

  2. 为文件输入一个名称,例如 select_trips

  3. select_trips.sql 文件选项卡中,输入以下 SQL 语句:

    SELECT * FROM samples.nyctaxi.trips;
    
  4. 选择 SELECT 语句。

  5. 在文件选项卡的工具栏上,单击“执行”图标。

后续步骤

其他资源