Microsoft Purview 治理门户中的数据分类

Microsoft Purview 治理门户中的数据分类是一种通过将唯一的逻辑标记或类分配给数据资产来对数据资产进行分类的方法。 分类基于数据的业务上下文。 例如,可以按护照号码、驾照编号、信用卡号码、SWIFT 代码、个人姓名等对资产进行分类。

将数据资产分类会使它们更易于理解、搜索和治理。 将数据资产分类还有助于了解其相关的风险。 而这又有助于实施措施来保护敏感或重要的数据,避免其在整个数据产业中不受监管地扩散和未经授权对其进行访问。

扫描数据源时,Microsoft Purview 数据映射会提供自动分类功能。 你将获得 200 多种内置系统分类,并可为数据创建自定义分类。 可以在资产作为已配置扫描的一部分被引入时自动对其进行分类,也可以在扫描和引入资产后在 Microsoft Purview 治理门户中手动对其进行编辑。

分类的用途

分类是将数据组织成逻辑类别,使数据易于检索、排序和识别以备将来使用的过程。 这对于数据治理而言尤为重要。 对数据资产进行分类非常重要的其他原因包括,这有助于:

  • 缩小你感兴趣的数据资产的搜索范围。
  • 整理和了解在组织中非常重要的各种数据类及其存储位置。
  • 了解与最重要数据资产相关的风险,然后采取适当的措施来缓解这些风险。

下图显示了扫描 Azure SQL 数据库中的 Customer 表时应用的分类。

Screenshot that shows the classification of the 'Customers' table in Azure SQL Database.

分类的类型

Microsoft Purview 治理门户支持系统分类和自定义分类。

  • 系统分类:支持 200 多种现成的系统分类。 有关可用系统分类的完整列表,请参阅 Microsoft Purview 治理门户中受支持的分类

    在上图中的示例中,“人员姓名”是一个系统分类。 系统分类有闪电图标和分类名称。 将鼠标悬停在分类本身上可提供有关分类类型的更多详细信息,以及有关如何应用分类的更多详细信息

  • 自定义分类:当你想要基于某个不可用作系统分类的模式或特定列名对资产进行分类时,可以创建自定义分类。 自定义分类规则可以基于正则表达式模式或字典。

    假设“员工 ID”列遵循 EMPLOYEE{GUID} 模式(例如 EMPLOYEE9c55c474-9996-420c-a285-0d0fc23f1f55)。 你可以使用正则表达式(例如 \^Employee\[A-Za-z0-9\]{8}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{12}\$)创建自己的自定义分类。

后续步骤