Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
本页介绍从 Microsoft Power BI Desktop 连接到 Azure Databricks 的不同方法。 Power BI Desktop 是基于 Windows 的应用程序,可用于连接、塑造和可视化来自各种源的数据。 借助 Power BI Desktop,可以使用自助服务商业智能工具创建交互式报表和仪表板。
将 Azure Databricks 用作 Power BI 的数据源时,可将 Azure Databricks 的性能和功能扩展到数据科学家和数据工程师之外,扩展到所有业务用户。
可以将 Power BI Desktop 连接到 Azure Databricks 群集和 Databricks SQL 仓库。 还可以将 Power BI 报表发布到 Power BI 服务,让用户能够使用单一登录 (SSO),并传递用于访问报表的相同 Microsoft Entra ID 凭据来访问基础 Azure Databricks 数据。
从以下方法中选择从 Power BI Desktop 连接到 Azure Databricks 的方法之一:
如果要将数据从 Azure Databricks 发布到 Power BI 服务,请参阅 从 Azure Databricks 发布到 Power BI 服务。
注释
适用于 Power BI 的 Azure Databricks 连接器支持 箭头数据库连接(ADBC) 驱动程序。 在此处了解详细信息。
要求
若要将 Unity 目录管理的数据与 Power BI 配合使用,Databricks 建议使用最新版本的 Power BI Desktop。
注释
如果作系统不是 Windows,请在物理主机或基于 Windows 的虚拟机上运行 Power BI Desktop,然后从作系统连接到它。
如果使用低于 2.85.681.0 的 Power BI Desktop 版本,请在与 Power BI Desktop 相同的环境中安装 Databricks ODBC 驱动程序 。
要进行身份验证的下列项之一:
Azure Databricks 个人访问令牌或你的 Microsoft Entra ID 帐户凭据。
M2M OAuth 的 Azure Databricks 服务主体。 此身份验证方法需要 Power BI Desktop 2.143.878.0(2025 年 5 月版本)或更高版本。 请参阅 在 Azure Databricks for Power BI 上配置服务主体。
Databricks SQL 仓库。
手动连接到 Azure Databricks
根据所选的身份验证方法,按照这些说明使用 Power BI Desktop 连接到群集或 SQL 仓库。 在 DirectQuery 模式下使用 Power BI 时,建议使用 Databricks SQL 仓库。
启动 Power BI Desktop。
单击“获取数据”或“文件”“获取数据”>。
单击“获取数据以开始”。
搜索 Databricks,然后单击 连接器 Azure Databricks。
单击连接。
输入“服务器主机名”和“HTTP 路径”。
选择你的数据连接模式。 有关“导入”和 DirectQuery 之间的差异的信息,请参阅在 Power BI Desktop 中使用 DirectQuery。
单击 “确定” 。
单击你的身份验证方法:
个人访问令牌:请输入您的个人访问令牌
Azure Databricks 个人访问令牌。
Microsoft Entra ID:单击“登录”,然后按照屏幕上的说明操作。
客户端凭据:使用服务主体进行身份验证时使用。 输入服务主体的客户端 ID 和客户端密码。
单击连接。
从 Power BI 导航器中选择要查询的 Azure Databricks 数据。
Power BI Delta Sharing 连接器
使用 Power BI Delta Sharing 连接器,用户可以通过 Delta Sharing 开放协议来发现、分析和可视化与他们共享的数据集。 该协议利用 REST 和云存储实现跨产品和平台的数据集安全交换。 此方法仅支持 导入 模式,并允许与不在 Azure Databricks 上的用户共享数据。
有关连接说明,请参阅 Power BI:读取共享数据。
连接配置
Azure Databricks Power BI 连接器支持以下附加连接配置。
本机 SQL 查询
借助 Databricks 连接器,可以对 Power BI Desktop 中的 Databricks SQL 仓库使用本机 SQL 查询进行更大的作和计算密集型查询。 这需要 Power BI v2.112.603.0 或更高版本(2022 年 12 月版本)。
在 Power BI Desktop 上执行以下作以使用本机 SQL 查询:
在 “获取数据” 菜单中,找到 Azure Databricks 数据源。
在连接对话框中,输入目录和数据库服务器详细信息。 如果要使用本机查询,则需要这些字段。
在 本机查询中,输入要提交的 SQL 查询。
进行身份验证后,可以查询。
若要修改查询,请使用 Power BI 高级查询编辑器。 如果进行任何更改,请保存查询。
自动 HTTP 代理检测
Power BI Desktop 版本 2.104.941.0 及更高版本(2022 年 5 月发布)内置支持检测 Windows 系统范围的 HTTP 代理配置。
Power BI Desktop 可以自动检测和使用 Windows 系统范围的 HTTP 代理配置。
如果代理服务器未提供 CRL 分发点 (CDP),Power BI 可能会显示以下错误消息:
Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."
若要修复此错误,请完成以下步骤:
如果文件
C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini
不存在,请创建该文件。将以下配置添加到
microsoft.sparkodbc.ini
文件中:[Driver] CheckCertRevocation=0
局限性
- Azure Databricks 连接器支持 Web 代理。 但是,不支持文件中
.pac
定义的自动代理设置。 - 在 Azure Databricks 连接器中,不支持结合 DirectQuery 模式使用
Databricks.Query
数据源。 - 使用增量共享连接器加载的数据必须适合计算机的本地内存。 为了确保这一点,连接器会将导入的行数限制限制为初始连接设置过程中设置的 行数 。 请参阅 Power BI:读取共享数据。