本页介绍从 SAP Business Data Cloud(BDC)自动同步到 Unity Catalog 的语义元数据,用于挂载的 SAP BDC 共享。
SAP 表和列名称可能难以读取。 对于所有装载的 SAP BDC 共享,当访问表时,语义元数据会自动引入到 Unity 目录中,从而使数据更易于理解和可发现。 SAP BDC 中所做的任何更改都反映在 Unity 目录中。
SAP BDC 是语义元数据的真相来源。 从 SAP BDC 同步的元数据在 Azure Databricks 中是只读的。 SAP BDC 共享的增量共享收件人无法直接访问或查询语义元数据。
注释
如果在目录资源管理器中看不到最新的元数据,请单击“ 刷新表 ”以触发引入。
引入的 SAP 语义类型
SAP BDC 中的以下语义引入到 Unity 目录中:
| SAP 语义元数据 | Description |
|---|---|
| 表和列注释 | 每个表和列的用途描述。 |
| 主键 | SAP BDC 中定义的主键被同步为 Unity Catalog 的主键约束。 |
| 外键 | 同一共享中的表之间的外键关系。 不支持引用不同共享中的表的外键。 |
| SAP 治理标记 | 对个人数据和敏感数据进行分类的 sap.PersonalData.* 命名空间中的系统标记。 请参阅 SAP 治理标记。 |
SAP 治理标记
SAP BDC 将 sap.PersonalData 命名空间中的治理标记在 Unity Catalog 的表中同步为系统治理标记。 这些标记对 SAP BDC 数据是否包含个人或敏感信息进行分类。
Important
不要在命名空间中 sap.* 手动分配、修改或删除标记。 这些是装载 SAP BDC 共享时由Azure Databricks系统自动分配的系统保留值。 如果手动分配它们,Databricks 可能会在以后清除或删除它们。
若要基于这些标记控制访问,请创建引用它们的基于属性的访问控制 (ABAC) 策略。
以下标记已同步。 有关 SAP 个人数据注释的详细信息,请参阅 SAP CSN 互操作规范。
| SAP 标签 | Unity Catalog 系统标签 | 已应用于 | Description |
|---|---|---|---|
@PersonalData.entitySemantics |
sap.PersonalData.entitySemantics |
Tables | 指示表是否表示数据主体,例如人员或组织。 已知值包括 DataSubject、 DataSubjectDetails或 Other。 |
在 Azure Databricks 中使用 SAP BDC 元数据
将 SAP BDC 共享装载到目录后,同步元数据可在Azure Databricks中使用。 由于 SAP 表和列名称通常难以解释,因此同步的注释、关键约束和标记可帮助你更有效地理解和使用 SAP 数据。
目录资源管理器:查看表和列详细信息中的注释、键约束和标记。 可以通过搜索其批注的内容来筛选列,从而更轻松地查找相关列。
SQL:使用
DESCRIBE TABLE EXTENDED查看表和列注释,以及键约束。 查询INFORMATION_SCHEMA.TABLE_TAGS以查看 SAP 治理标记。治理:在 ABAC 策略中使用同步的 SAP 治理标记 来控制对敏感数据的访问。
审核日志:元数据同步事件(包括标记分配、注释更新和约束更改)记录在 审核日志中。 使用审核日志跟踪在目录中引入或更新 SAP BDC 元数据的时间。