本文讨论如何手动对Microsoft Purview 数据映射中的资产应用分类。
分类 是逻辑标签,可帮助你和你的团队确定你在整个数据资产中拥有的数据类型。 例如:如果文件或表包含信用卡数字或地址。
Microsoft Purview 会在扫描过程中自动将分类应用于某些资产,但在某些情况下,可能需要手动应用更多分类。 例如,Microsoft Purview 不会自动将分类应用于表资产(仅其列),或者你可能想要应用自定义分类,或者向分组 资源集的资产添加分类。
搜索或浏览Microsoft Purview 统一目录,找到感兴趣的文件,并导航到资产详细信息页。
在“ 概述 ”选项卡上,查看“ 分类 ”部分以查看是否有任何现有分类。 选择 “编辑”。
从“ 分类” 下拉列表中,选择感兴趣的特定分类。 在本示例中,我们将添加 信用卡号,这是系统分类, CustomerAccountID 是自定义分类。
选择“ 保存”。
在“ 概述 ”选项卡上,确认所选分类显示在“ 分类 ”部分下。
当 Microsoft Purview 扫描数据源时,它不会自动将分类分配给表资产(仅在列上)。 若要使表资产具有分类,必须手动添加它们:
要向表资产添加分类,请执行以下操作:
搜索或浏览统一目录,查找感兴趣的表资产。 例如, Customer 表。
确认未向表分配任何分类。 选择 “编辑”。
从“ 分类” 下拉列表中,选择一个或多个分类。 此示例使用名为 CustomerInfo 的自定义分类,但可以为此步骤选择任何分类。
选择 “保存” 以保存分类。
在 “概述 ”页上,验证 Microsoft Purview 是否添加了新分类。
Microsoft Purview 会自动扫描所有列资产并为其添加分类。 但是,如果要更改分类,可以在列级别进行操作。
搜索或浏览统一目录,查找包含要更新的列的表资产。
从“概述”选项卡中选择“编辑”。
选择“ 架构 ”选项卡。
确定感兴趣的列,然后选择 “添加分类”。 本示例将 通用密码 分类添加到 PasswordHash 列。
选择“ 保存”。
选择 “架构 ”选项卡并确认已将分类添加到该列。
Microsoft Purview 捕获重要详细信息,例如应用分类的人员及其应用时间。 若要查看详细信息,请将鼠标悬停在分类上,显示分类详情卡片。 分类详细信息卡显示以下信息:
- 分类名称 - 应用于资产或列的分类的名称。
- 应用者 - 应用分类的人员。 可能的值为 scan 和用户名。
- 应用时间 - 通过扫描或手动应用分类时的本地时间戳。
- 分类类型 - 系统或自定义。
具有数据管理员角色的用户可以查看通过扫描自动应用的分类的更多详细信息。 这些详细信息包括扫描程序读取以对数据进行分类的样本计数,以及扫描程序找到的样本中的非重复数据计数。
分类标记的第一次应用是根据数据采样以及将这些样本与预定义的正则表达式模式或字典匹配自动进行的。 后续重新扫描可以保留、删除或增量添加分类标记,具体取决于几个因素:
扫描运行不会删除手动应用的分类标记。
扫描运行不会重新应用手动删除的分类标记。
以后的扫描运行如果继续使用相同的扫描规则,则可以更新分类标记。
对于扫描操作,可以根据下表中列出的条件保留或删除以前扫描中的分类标签:
文件类型 文件大小 上一次扫描的分类标记将为: 没有特定大小的文件类型(例如 SQL) 全部 保留 .doc、.docm、.docx、.dot、.odp、.ods、.odt、.pdf、.pot、.pps、.ppsx、.ppt、.pptm、.pptx、.txt、.xlc、.xls、.xlsb、.xlsm、.xlsx、.xlt >20 MB 保留 .doc、.docm、.docx、.dot、.odp、.ods、.odt、.pdf、.pot、.pps、.ppsx、.ppt、.pptm、.pptx、.txt、.xlc、.xls、.xlsb、.xlsm、.xlsx、.xlt <20 MB 已删除 GZ >400 KB 保留 GZ <400 KB 已删除 没有扩展名或结构化文件类型的文件 > 1 MB 保留 没有扩展名或结构化文件类型的文件 < 1 MB 已删除