连接到 Matillion

Matillion ETL 是专为云数据库平台(包括 Azure Databricks)而构建的 ETL/ELT 工具。 Matillion ETL 具有基于浏览器的新式 UI,具有强大的下推 ETL/ELT 功能。

可以将 Databricks SQL 仓库(以前称为 Databricks SQL 终结点)和 Azure Databricks 群集与 Matillion 集成。

手动连接到 Matillion

本部分介绍如何将 Azure Databricks 工作区中的现有 SQL 仓库或群集手动连接到 Matillion。

要求

在手动与 Matillion 集成之前,必须满足以下条件:

连接步骤

若要手动连接到 Matillion,请执行以下操作:

  1. 获取要在工作区中使用的现有计算资源(SQL 仓库或群集)的名称。 稍后,你将选择该名称以完成计算资源与 Matillion ETL 实例之间的连接。

    • 若要查看工作区中的 SQL 仓库,请单击边栏中的 终结点图标“SQL 仓库”。 若要创建新的 SQL 仓库,请参阅创建 SQL 仓库
    • 若要查看工作区中的群集,请单击边栏中的 计算图标“计算”。 要创建群集,请参阅计算配置参考
  2. 按照 Matillion 文档中的连接到 Matillion ETL 实例并登录到该实例进行操作。

  3. 按照 Matillion 文档中的在 Databricks 项目上创建 Delta Lake 进行操作。

    对于这些说明中的“Delta Lake 连接”部分中的设置,请输入以下信息:

    • 对于“工作区 ID”,请输入 Azure Databricks 每个工作区 URL 的工作区 ID。 请勿在第一个“点”(.) 后添加任何内容。 请参阅工作区实例名称、URL 和 ID
    • 对于“用户名”,输入单词
    • 对于“密码”,请输入 Azure Databricks 个人访问令牌或 Microsoft Entra ID 令牌。

    对于这些说明中的“Delta Lake 默认设置”部分中的设置,对于“群集”,请选择 SQL 仓库或群集的名称。

  4. 继续执行后续步骤。

后续步骤

在 Matillion 网站上浏览以下一个或多个资源: