Azure Databricks 为许多云原生数据系统提供内置集成,并提供可扩展 JDBC 支持来连接到其他数据系统。
本节中介绍的连接器主要侧重于配置与外部数据系统中单个表的连接。 也可以使用其中一些驱动程序将数据写回到外部系统。
对于只读数据连接,Databricks 建议使用 Lakehouse 联合身份验证,以便将整个数据库从外部系统同步到 Azure Databricks,并由 Unity Catalog 管理。 请参阅“什么是 Lakehouse Federation?”。
可以使用 JDBC 连接到许多数据源。 Databricks Runtime 包含许多 JDBC 数据库的驱动程序,但可能需要安装驱动程序或不同的驱动程序版本才能连接到首选数据库。 支持的数据库包括:
- 使用 Azure Databricks 查询 PostgreSQL
- 使用 Azure Databricks 查询 MySQL
- 使用 Azure Databricks 查询 MariaDB
- 使用 Azure Databricks 查询 SQL Server
- 使用 Databricks 连接器连接到另一个 Databricks 工作区
以下数据服务要求配置连接设置、安全凭据和网络设置。 可能需要 Azure 帐户或 Azure Databricks 工作区中的管理员或 Power User 权限。 一些还需要你创建一个 Azure Databricks 库并将它安装在群集中: