您可以使用 Catalog Explorer 中的 “Insights” 选项卡,查看 Unity Catalog 中注册的任何表的使用趋势,以及常见查询、用户、仪表板、笔记本和关联表。 “分析”选项卡包含一个过去 30 天的表使用情况图表,以及列出过去一个月频繁活动的部分。 目录资源管理器还根据最近的查询活动显示表和列的相对受欢迎程度。 请参阅 “受欢迎程度”。
此信息可帮助回答以下问题:
- 是否可以信任此数据?
- 有哪些好方法可用于使用此数据?
- 哪些用户可以回答我关于此数据的问题?
注意
“见解”选项卡上列出的查询仅限于使用 Databricks SQL 执行的查询。
开始之前
必须具有以下权限才能在“见解”选项卡上查看频繁的查询和用户数据。
在 Unity Catalog 中:
-
SELECT表上的权限。 - 对表父级架构的
USE SCHEMA特权。 - 在表的父目录上的
USE CATALOG权限。
默认情况下,元存储管理员具有这些特权。 请参阅在 Unity Catalog 中管理权限。
在 Databricks SQL 中:
- 查询的“可以查看”权限。 将看不到没有查看权限的查询。 请参阅查询访问控制列表。
查看“见解”选项卡
在 Azure Databricks 工作区中,单击
以打开目录资源管理器。
搜索或导航到要获取见解的表。
在表选项卡上,点击见解选项卡。
将显示最近 30 天的表使用情况图表,以及高频用户、查询、仪表板、笔记本和联接表部分。
过去 30 天内的表使用情况图表和 经常联接的表部分都属于元存储范围,并显示附加到该元存储的所有工作区中的活动情况。 常用用户、常用查询、常用仪表板和常用笔记本部分均限定在工作区范围内,并且仅显示当前工作区内的活动情况。 如果使用情况图显示活动,但“频繁”部分显示为空或不完整,则查询可能源自其他工作区。 若要以编程方式跨所有工作区查询用户活动,请使用 世系系统表。
热门程度
受欢迎程度反映了过去 30 天内查询表或其列的频率。 使用这些信号在浏览架构或表时识别最常用的数据。
表受欢迎程度:若要在架构中查找最常用的表,请打开架构的 “概述 ”选项卡并按热门程度对表进行排序。 受欢迎度指标由表的交互式读取次数总计决定,其中包括来自 JDBC、SQL 语句执行 API 和 SQL 连接器的读取,以及在 Catalog Explorer 中对示例数据的点击。 将鼠标悬停在表格的受欢迎程度图标上,以查看过去 30 天内查询的次数。
列受欢迎程度:若要查找表中最受欢迎的列,请打开表的 “概述 ”选项卡,并按受欢迎程度对列进行排序。 列的受欢迎程度基于过去 30 天内对该表执行的查询。 将鼠标悬停在列的受欢迎程度图标上,以查看过去 30 天内使用该列的查询的大致百分比。
限制
- 频繁查询指标仅捕获 SQL 编辑器中已保存的查询。