使用 Azure 门户为 Azure 时序见解 Gen1 环境创建引用数据集
注意
2025 年 3 月之后,将不再支持时序见解 (TSI) 服务。 请考虑尽快将现有 TSI 环境迁移到备用解决方案。 有关弃用和迁移的详细信息,请访问我们的文档。
注意
这是一篇 Gen1 文章。
提示
Mooncake 不支持 Azure 时序见解 Gen 1 环境的参考数据。
本文介绍了如何向 Azure 时序见解环境添加引用数据集。 引用数据可用于联接到源数据以增强值。
参考数据集是各种项的集合,这些项对事件源中的事件进行了增强。 Azure 时序见解入口引擎将事件源中的每个事件与参考数据集中的相应数据行联接到一起。 然后即可使用此增强的事件进行查询。 该联接基于在参考数据集中定义的主键列。
参考数据不以追溯方式进行联接。 因此,在配置并上传数据后,只会将当前和将来的流入数据匹配并联接到参考数据集。
添加引用数据集
登录到 Azure 门户。
查找现有的 Azure 时序见解环境。 在 Azure 门户左侧的菜单中,选择“所有资源” 。 选择 Azure 时序见解环境。
选择“概述”页面。 展开页面顶部附近的“概要”部分,找到“时序见解资源管理器 URL”并打开链接 。
查看 Azure 时序见解环境的资源管理器。
在 Azure 时序见解资源管理器中展开环境选择器。 选择活动的环境。 选择资源管理器页面右上角的参考数据图标。
选择“+ 添加数据集”按钮以开始添加新数据集。
在“新建参考数据集”页面上,选择数据格式:
- 选择“CSV”表示以逗号分隔的数据。 第一行被视为标题行。
- 对于 JavaScript 对象表示法 (JSON) 格式的数据,请选择“JSON 数组”。
使用下列两种方法之一提供数据:
- 将数据粘贴到文本编辑器中。 然后,选择“分析参考数据”按钮。
- 选择“选择文件”按钮来从本地文本文件添加数据。
如果分析数据值时发生错误,则错误将以红色显示在页面底部,例如
CSV parsing error, no rows extracted
。在成功分析数据后,会显示一个数据网格,其中显示了表示数据的行和列。 查看数据网格以确保正确性。
查看每个列以了解所采用的数据类型,并根据需要更改数据类型。 在列标题中选择数据类型符号: # 表示双精度(数字数据)、# 表示布尔值,Abc 表示字符串。
如果需要,重命名列标题。 键列名称是联接到事件源中的对应属性所必需的。
重要
请确保参考数据键列名称与传入数据中的事件名称完全匹配,包括区分大小写。 非键列名称用来使用对应的参考数据值增强传入数据。
根据需要在“筛选行...”字段中键入一个值来查看特定行。 筛选器适合用来查看数据,但在上传数据时不会应用。
通过填写数据网格上方的“数据集名称”字段为数据集命名。
通过选择数据网格上方的下拉列表,提供数据集中的主键列。
(可选)选择 按钮,将一个辅键列添加为复合主键。 如果需要撤消选择,请从下拉列表中选择空值来删除辅键。
若要上传数据,请选择“上传行”按钮。
页面会确认完成的上传并显示消息“已成功上传数据集”。
警告
参考数据集之间共享的列或属性将显示上传错误“属性名重复”。 此错误不会阻止参考数据集的成功上传。 合并共享重复的属性名的行即可删除该错误。
选择“添加行”、“批量导入行”或“添加列”,根据需要添加更多的参考数据值。
重要
任何与另一行共享唯一键的行,其列都将由最后添加的共享该唯一键的行替代。
注意
添加的行不必为矩形 - 与参考数据集中的其他项相比,它们的列可以更少、更大或不同。