连接到 Spotfire Analyst

本文介绍了如何在 Azure Databricks 群集或 Azure Databricks SQL 仓库上使用 Spotfire Analyst。

要求

Azure Databricks 工作区中的群集或 SQL 仓库。
- 计算配置参考。
- 创建 SQL 仓库。
群集或 SQL 仓库的连接详细信息，特别是“服务器主机名”、“端口”和“HTTP 路径”值。
- 获取 Azure Databricks 计算资源的连接详细信息。
一个 Azure Databricks 个人访问令牌。要创建个人访问令牌，请遵循适用于工作区用户的 Azure Databricks 个人访问令牌中的步骤。

备注

作为安全最佳做法，在使用自动化工具、系统、脚本和应用进行身份验证时，Databricks 建议使用属于服务主体（而不是工作区用户）的个人访问令牌。若要为服务主体创建令牌，请参阅管理服务主体的令牌。

在“连接中的视图”对话框中选择数据。

可用表

浏览 Azure Databricks 中可用的表。
将所需的表添加为视图，这些视图将是在 Spotfire 中分析的数据表。
对于每个视图，可以决定要包含哪些列。如果要创建非常具体且灵活的数据选择，则可以访问此对话框中的一系列强大工具，例如：
- 自定义查询。使用自定义查询，可以通过键入自定义 SQL 查询来选择要分析的数据。
- 提示。将数据选择留给分析文件的用户。基于选择的列配置提示。然后，打开分析的最终用户可以选择限制和查看仅相关值的数据。例如，用户可以选择特定时间范围内或特定地理区域内的数据。
单击“确定”。

选择要分析的数据后，最后一步是选择要如何从 Azure Databricks 检索数据。将显示要添加到分析中的数据表的摘要，可以单击每个表以更改数据加载方法。

顺序表示例

Azure Databricks 的默认选项是“外部”。这意味着数据表将保留在 Azure Databricks 中的数据库中，并且 Spotfire 将基于你在分析中的操作将不同的查询推送到数据库，以获取相关的数据切片。

还可以选择“已导入”，Spotfire 将预先提取整个数据表，从而可以进行本地内存中分析。导入数据表时，还可以在 TIBCO Spotfire 的嵌入式内存中数据引擎中使用分析功能。

第三个选项是“按需”（对应于动态 WHERE 子句），这意味着将基于分析中的用户操作提取数据切片。可以定义条件，这些条件可以是诸如标记或筛选数据或更改文档属性之类的操作。按需数据加载也可以与“外部”数据表结合使用。