Microsoft Purview 数据映射 中的数据分类是通过向数据资产分配唯一的逻辑标记或类来对数据资产进行分类的一种方法。 分类基于数据的业务上下文。 例如,可以按护照号码、驾照编号、信用卡号码、SWIFT 代码、个人姓名等对资产进行分类。
将数据资产分类会使它们更易于理解、搜索和治理。 将数据资产分类还有助于了解其相关的风险。 而这又有助于实施措施来保护敏感或重要的数据,避免其在整个数据产业中不受监管地扩散和未经授权对其进行访问。
扫描数据源时,数据映射提供自动分类功能。 你将获得 200 多种内置系统分类,并可为数据创建自定义分类。 可以在资产作为已配置扫描的一部分被引入时自动对其进行分类,也可以在扫描和引入资产后在 Microsoft Purview 治理门户中手动对其进行编辑。
分类是将数据组织成逻辑类别,使数据易于检索、排序和识别以备将来使用的过程。 这对于数据治理而言尤为重要。 对数据资产进行分类非常重要的其他原因包括,这有助于:
- 缩小你感兴趣的数据资产的搜索范围。
- 整理和了解在组织中非常重要的各种数据类及其存储位置。
- 了解与最重要数据资产相关的风险,然后采取适当的措施来缓解这些风险。
下图显示了扫描 Azure SQL 数据库中的 Customer 表时应用的分类。
Microsoft Purview 治理门户支持系统分类和自定义分类。
系统分类:支持 200 多个系统分类。 请参阅 可用系统分类的完整列表。
在上图的示例中, 人员名称 是系统分类。 系统分类有闪电图标和分类名称。 将鼠标悬停在分类本身上可提供有关分类类型的更多详细信息,以及有关如何应用分类的更多详细信息
自定义分类:如果要根据无法作为系统分类的模式或特定列名称对资产进行分类,则可以创建自定义分类。 自定义分类规则可以基于 正则表达式 模式或 字典。
假设 员工 ID 列遵循 EMPLOYEE{GUID} 模式 (例如 EMPLOYEE9c55c474-9996-420c-a285-0d0fc23f1f55) 。 可以使用正则表达式(例如
\^Employee\[A-Za-z0-9\]{8}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{12}\$
)创建自己的自定义分类。