从 Microsoft Excel 连接到 Azure Databricks
本文介绍如何使用 Azure Databricks ODBC 驱动程序将 Azure Databricks 连接到 Microsoft Excel。 建立连接后,可以从 Excel 访问 Azure Databricks 中的数据。 还可以使用 Excel 进一步分析数据。
- 创建 Azure Databricks 工作区。
- 创建一个 Azure Databricks 群集并将数据与该群集相关联。 请参阅在 Azure Databricks 上运行第一个 ETL 工作负载。
- 下载适用于你的 OS 的 64 位版 ODBC 驱动程序。
- 安装并配置 ODBC 驱动程序 (Windows | MacOS | Linux)。 这会设置一个可用于将 Azure Databricks 连接到 Microsoft Excel 的数据源名称 (DSN) 配置。
- 令牌管理 API。
- Azure Databricks 个人访问令牌。
- 安装 Microsoft Excel。 可以使用试用版。
本部分介绍如何使用在先决条件中创建的 DSN 将数据从 Azure Databricks 拉取到 Microsoft Excel 中。
备注
本部分的步骤已使用适用于 Excel for Microsoft 365 for Windows Server 2022 Datacenter 64 位进行测试。
以下是可供用户在单一登录体验中连接到 Azure Databricks 的步骤。
- 启动“ODBC 数据源”。
- 转到“系统 DSN”选项卡,在 DSN 列表中选择“Simba Spark”条目(也可以按照托管在 Microsoft 站点上的说明创建新 DSN)。
- 单击“配置”按钮,你将看到下面的弹出窗口。
- 在“机制”上,选择“OAuth 2.0”。
- 单击“OAuth 选项”按钮,你将看到以下“OAuth 选项”弹出窗口。
- 选择“基于浏览器的授权代码”,然后取消选中“IGNORE_SQLDRIVER_NOPROMPT”。 关闭该弹出窗口。
- 单击“HTTP 选项”按钮,然后在弹出窗口中输入 HTTP 路径。
- 关闭“HTTP 选项”弹出窗口。 单击“高级选项”按钮,然后单击弹出窗口中的“服务器端属性”按钮。
- 添加服务器端属性“Auth_Flow”和值“2”。
现已成功配置 ODBC DSN。
- 启动 Microsoft Excel,然后创建一个新的空白工作簿。 选择菜单“数据”>“获取数据”>“自其他源”>“从 ODBC”
- 选择刚刚配置的 DSN。
单击“确定”按钮进行连接。 系统会提示你在浏览器弹出窗口中验证自己的身份。
备注
本部分的步骤已使用 Excel for Microsoft 365 for Windows 版本 11 进行测试。
还可以使用连接 URL 直接将 Excel 连接到 Azure Databricks。 连接 URL 的格式如下:
Driver=Simba Spark ODBC Driver;Host=<hostName>;Port=443;HttpPath=<httpPath>;SSL=1;AuthMech=11;Auth_Flow=2;Catalog=samples;Schema=default
- 启动 Excel 并选择“数据”菜单 >“获取数据”>“自其他源”>“从 ODBC”
- 在“数据源名称 (DSN)”中,选择“Simba Spark”
- 单击并展开“高级选项”部分。
- 在“连接字符串(非凭据属性)(可选)”的文本框中输入上述连接 URL
- 单击“确定”按钮。 如果弹出窗口中要求输入用户名和密码,你可以输入随机用户名和密码。
- 单击“连接”按钮,系统将在浏览器弹出窗口中提示你通过 OAuth 2.0 验证自己的身份。
备注
本部分的步骤已使用 Excel for Microsoft 365 for Mac 版本 16.70 进行测试。
在 Microsoft Excel 中打开一个空白工作簿。
在“数据”功能区中,单击“获取数据(Power Query)”旁边的向下箭头图标,然后单击“从数据库(Microsoft Query)”。
在“iODBC 数据源选择器”中,选择在先决条件中创建的 DSN,然后单击“确定”。
对于“用户名”,请输入
token
。对于“密码”,请输入先决条件中提到的个人访问令牌。
在“Microsoft Query”对话框中,选择要加载到 Excel 中的 Azure Databricks 表,然后单击“返回数据”。
在“导入数据”对话框中,选择“表”和“现有工作表”,然后单击“导入”。
将数据加载到 Excel 工作簿后,可对其执行分析操作。