在 Microsoft Purview 中自动对资产应用分类
在 Microsoft Purview 数据映射中注册数据源后,下一步是扫描数据源。 扫描进程与数据源建立连接,捕获技术元数据,并可以使用支持的系统分类或用于自定义分类的规则自动对数据进行分类。 例如,如果你有一个名为 multiple.docx 的文件,其内容中包含国家/地区 ID 号,则在扫描过程中,Microsoft Purview 会向文件资产的详细信息页添加分类“欧盟国家/地区标识号”。
这些分类可帮助你和你的团队识别整个数据资产中的数据类型。 例如:如果文件或者表包含信用卡号或地址。 那么,你可以更轻松地搜索某些类型的信息(例如客户 ID),或者指定敏感数据类型的安全优先级。
在扫描过程中,可以自动对文件和列资产应用分类。
本文将介绍:
自动应用分类
注意
不会为表资产自动分配分类,因为分类将分配到这些资产的列,但你可以手动将分类应用于表资产。
注册数据源后,可以通过运行扫描来自动对该源的数据资产中的数据进行分类。
请查看数据源的源文章的“扫描”部分,确认是否已设置任何先决条件或身份验证,并已准备好进行扫描。
在 Microsoft Purview 数据映射中搜索已注册的、包含你要分类的数据资产(文件和列)的源。
选择资源下的“新建扫描”图标。
提示
如果未看到“新建扫描”按钮,原因可能是你没有正确的权限。 若要运行扫描,至少需要对注册源的集合拥有数据源管理员权限。
选择你的凭据并对源进行身份验证。 (有关对源进行身份验证的详细信息,请参阅特定源的源文章的“先决条件”和“扫描”部分。)选择“继续”。
如果需要,请选择源中要扫描的资产。 可以根据源扫描所有资产,或者扫描一部分文件夹、文件或表。
选择扫描规则集。 你将看到可用扫描规则集的列表,可以选择其中的一个,或者可以使用顶部的“新建扫描规则集”按钮创建新的扫描规则集。 扫描规则集将确定要比较哪些分类并将其应用于你的数据。 有关详细信息,请参阅 Microsoft Purview 如何将资产分类。
提示
有关在创建扫描规则集时可用的选项的详细信息,请从创建扫描规则集的步骤中的步骤 4 开始了解。
计划扫描。
保存并运行扫描。 扫描规则集中适用的分类将自动应用于扫描的资产。 扫描完成后,可以查看和管理这些资产。
查看分类结果
Microsoft Purview 捕获重要详细信息,例如应用分类的人员及应用时间。 若要查看详细信息,请将鼠标悬停在分类上以显示分类详细信息卡片。 分类详细信息卡片会显示以下信息:
- 分类名称 - 对资产或列应用的分类的名称。
- 应用者 - 应用分类的人。 可能的值为扫描和用户名。
- 应用时间 - 通过扫描或手动操作应用分类时的本地时间戳。
- 分类类型 - 系统或自定义。
具有“数据管护者”角色的用户将看到通过扫描自动应用的分类的其他详细信息。 这些详细信息将包括扫描程序为分类数据而读取的样本计数,以及扫描程序找到的样本中的不同数据计数。
重新扫描现有分类的影响
分类标记的第一次应用是根据数据采样以及将这些样本与预定义的正则表达式模式或字典匹配自动进行的。 后续重新扫描可以保留、移除或以增量方式添加分类标记,具体取决于几个因素:
- 扫描运行不会移除已手动应用的分类标记。
- 扫描运行不会重新应用已手动移除的分类标记。
- 以后的扫描运行如果继续使用相同的扫描规则,则可以更新分类标记。
- 扫描运行不会移除已由另一个扫描运行应用的分类标记(如果后者基于不同的扫描规则)。
Microsoft Purview 如何将资产分类
扫描数据源时,Microsoft Purview 会将资产中的数据与称为扫描规则集的可能分类列表进行比较。
对于包含当前可用于相应数据源的系统分类的每个数据源,有现成的系统扫描规则集可用。 或者,你可以创建自定义扫描规则集,以创建针对数据集定制的分类列表。
如果你的数据仅限于特定类型的信息或区域,则为数据创建自定义规则集可能是个好主意,因为将数据与更少的分类类型进行比较可以加快扫描过程。 例如,如果数据集仅包含欧洲数据,则你可以创建一个自定义扫描规则集,以避免对其他区域进行识别。
如果你已创建自定义分类和分类规则,则也可以创建自定义规则集,以便在扫描期间自动应用自定义分类。
有关可用系统分类和数据分类方式的详细信息,请参阅系统分类页。