如何从 Power BI 获取世系再转至 Microsoft Purview
本文将详细阐述 Microsoft Purview 中 Power BI 源的数据世系。
先决条件
若要在 Microsoft Purview 中查看 Power BI 的数据世系,必须先注册并扫描 Power BI 源。
常见方案
扫描 Power BI 源后,当前数据资产的世系信息以及 Power BI 引用的数据资产将自动添加到 Microsoft Purview 数据目录中。
数据使用者可以从 Microsoft Purview 对报表或仪表板执行根本原因分析。 对于报表中的任何数据差异,用户可以轻松识别上游数据集,并根据需要联系其所有者。
数据生成者可以查看使用其数据集下游报表或仪表板。 在对数据集作出任何更改之前,数据所有者可以作出明智的决定。
用户可以按名称、背书状态、敏感度标签、所有者、说明和其他业务方面进行搜索,以返回相关的 Power BI 项目。
Microsoft Purview 中的 Power BI 项目
Power BI 扫描完成后,将在 Microsoft Purview 中清点以下 Power BI 项目:
- 工作区
- 仪表板
- 报表
- 数据集
- 数据流
- 数据市场
Microsoft Purview 中 Power BI 项目的世系
用户可以按名称、说明或其他详细信息搜索 Power BI 项目,以查看相关结果。 在资产概述和属性选项卡下,会显示说明、分类等基本详细信息。 在“世系”选项卡下,显示的资产关系包含上游和下游依赖关系。
Microsoft Purview 将捕获 Power BI 项目(例如:数据流 -> 数据集 -> 报表 -> 仪表板)和外部数据资产之间的世系。
注意
对于 Power BI 项目和外部数据资产之间的世系,目前支持的源类型包括:
- Azure SQL 数据库
- Azure Blob 存储
- Azure Data Lake Store Gen1
- Azure Data Lake Store Gen2
此外,当使用 Azure SQL 数据库作为源时,将捕获 Power BI 数据集中的列级世系(Power BI 子项目世系)和转换(数据流除外)。 若要查看度量,可以进一步选择列 ->“属性”-> 表达式以查看转换详细信息。
注意
使用 Azure SQL 数据库作为源时,支持列级世系和转换(数据流除外)。 目前不支持其他源。
已知的限制
- Microsoft Purview 利用扫描程序 API 来检索元数据和世系。 若要了解一些 API 限制,请参阅元数据扫描 - 注意事项和限制。
- 如果已将数据集表连接到另一个数据集表,当中间数据集禁用 Power BI 桌面中的“启用加载”选项时,将无法提取世系。
- 对于 Power BI 项目和外部数据资产之间的世系:
- 目前支持的源类型包括 Azure SQL 数据库、Azure Blob 存储、Azure Data Lake Store Gen1 和 Azure Data Lake Store Gen2。
- 使用 Azure SQL 数据库作为源时,仅支持列级世系和转换(Power BI 数据流除外)。 目前不支持其他源。
- 在 Power BI 中使用动态 M 查询参数时(例如将服务器/数据库名称作为参数值传递),不会捕获世系。
- 对于创建了 Power BI 数据流的数据源,目前显示的信息有限。
- 请注意,由于以下限制,如果存在这类情况,而且扫描 Power BI 项目连接到的 Power BI 和数据源,目前你可能会在目录中看到重复的资产。
- 资产中的源对象名称和完全限定的名称遵循 Power BI 设置/查询中使用的大小写,这可能与原始数据源中的对象大小写不一致。
- 当 Power BI 引用 SQL 视图时,它们当前被捕获为 SQL 表资产。
- 当 Power BI 引用 Azure 专用 SQL 池(以前的 SQL DW)源时,它当前被列为 Azure SQL 数据库资产。 (目前不支持 Power BI 项目与外部 Azure 专用 SQL 池之间的世系。)
- 对于 Power BI 子项目世系:
- 某些度量(例如
COUNTROWS
)不会显示在子项目世系中。 - 在世系图中,使用 COUNT 函数选择由列派生的度量时,不会自动选择基础列。 检查列属性选项卡中的度量表达式可识别基础列。
- 如果在支持子项目世系之前扫描了 Power BI 源,可能会在世系图中看到一个数据库资产,该资产未被删除,它与新的表资产一起列出。
- 某些度量(例如
- 目前,对于名称中包含 UTF-8 字符的 Azure SQL 数据库中的相同数据资产,通过扫描 Power BI 生成的完全限定名称可能与通过扫描 Azure SQL 数据库生成的完全限定名称不同,因为前者将经历额外的编码,并且可能会引入重复的 Azure SQL 数据资产。