适用于 Microsoft Purview 的 Reltio 集成是通过 Reltio Integration Hub (RIH) 实现的。 集成包括 Reltio 和 Microsoft Purview 连接和方案,用于从 Reltio 读取租户业务配置,并在 Microsoft Purview 中创建相应的对象。
集成支持以下对象:
- 实体类型
- 实体属性 - 简单、嵌套、参考
- 关系类型
- 关系属性 - 简单、嵌套
集成的基础是在 Microsoft Purview 数据映射中为每个 Reltio 对象创建 EntityDefs。
Microsoft Purview 数据映射就像一个中央库存,支持 Microsoft Purview 统一目录、Microsoft Purview 数据资产见解和 Microsoft Purview 数据策略,作为 Microsoft Purview 治理门户中的统一体验。
EntityDef 类似于面向对象的编程中的类,为所有 Reltio 对象提供架构或蓝图。 它定义了实体、属性、关系及其类型的结构。 此架构确保实体的所有实例都遵守实体的规则和约束。
| Reltio | Microsoft 的 Microsoft Purview |
|---|---|
| 系统 | EntityDef “reltio_system” |
| 租户 | EntityDef “reltio_tenant” |
| 实体类型 | EntityDef “reltio_entity_type” |
| 简单属性(实体类型、关系类型) | EntityDef “reltio_attribute” |
| 嵌套属性(实体类型、关系类型) | EntityDef “reltio_attribute” |
| 参考属性(实体类型) | EntityDef “reltio_attribute” |
| 关系类型 | EntityDef “reltio_relationship_type” |
稍后,集成会在 Microsoft Purview 数据映射中创建 Reltio 系统作为实体。 在 Microsoft Purview 中,也会使用实现关系,作为 Reltio 系统下的一个实体创建Reltio 租户。
Reltio 系统包含以下属性:description、displayName(与 Reltio 标签相同)、name(Reltio URI 的最后一部分)、qualifiedName(唯一标识符)。
Reltio 租户包含以下属性:description、displayName、isActive(如果未在 Reltio 上删除实体)、name、qualifiedName、updatedBy(自动填充)、updatedTime(自动填充)。
属性是描述性属性或元数据,可提供数据资产的上下文,有助于发现、管理和治理,而不会影响数据的实际结构或格式。
Microsoft Purview 实体 qualifiedName 使用以下对象派生
<collectionId>/<env>/<tenantId>/<URI>
由于实体 qualifiedName 使用租户 ID 和 env,对一个租户来说始终是唯一的,因此同一个 Microsoft Purview 帐户可用于多个租户。
可以在 DataMap->域->集合(默认为根)-> 资产-> 搜索资产/实体的名称下,验证创建的实体。 若要确保实体在统一目录中显示,请将其手动添加到需要发布的 Microsoft Purview 数据产品。 实体出现在分配给所选数据产品作为数据资产的统一目录中,其属性(未包含子嵌套和参考的属性)显示在“架构”部分中。 架构部分仅适用于特定资产类型的实体:Reltio 实体类型、Reltio 关系类型。 架构定义数据的结构,并规定存储、查询和维护数据的方式。 它规定必须如何设置数据的格式,以及数据中存在哪些关系
架构
架构是一个重要概念,它反映了数据在数据存储中的存储和组织方式。 它反映了数据的结构,以及构成该结构的元素的数据限制。 可以按不同的方式将同一架构中的元素分类(因为其内容不同)。 此外,可以仅针对元素的子集进行不同的转换(世系)。 由于这些特性,Microsoft Purview 可以将架构和架构元素建模为实体,因此架构通常是数据资产实体的关系属性。 架构元素的示例:表的列、json 架构的 json 属性、xml 架构的 xml 元素等。
类型定义以及如何在 Microsoft Purview 中创建自定义类型
Reltio 对象映射到 Microsoft Purview 实体
实体类型
租户中的实体类型在 Microsoft Purview 中创建为名为 Reltio MDM 实体的实体,其中包含与租户的关系。
Reltio MDM 实体的属性
Reltio MDM 实体包含以下属性:description、displayName、isAbstract(如果实体在 Reltio 上是抽象实体)、isActive、name、qualifiedName。
关系类型
租户中的关系类型在 Microsoft Purview 中创建为名为 Reltio 关系类型的实体,其中包含与租户的关系。
此外,Reltio 关系类型实体与以下两个 Reltio MDM 实体存在关系:start_relationship和end_relationship。 关系属性作为名为 Reltio 属性的实体添加,其中包含与 Reltio 关系类型实体的关系。
该屏幕截图显示了一个联系人 Reltio MDM 实体,它与具有 start_relationship 关系的“具有地址”Reltio 关系类型实体相连。 之后,“具有地址”Reltio 关系类型实体与具有 end_relationship 关系的位置 Reltio 实体类型实体相连。 “具有地址”Reltio 关系类型实体有四个简单数据属性,其中包含关系:Address Type、Address。 Rank、Active、Status。
关系属性可进一步包含与 Reference 属性的关系。 在示例中,地址类型关系数据属性参考联系人 Reltio 实体类型实体。
此外,Reltio 关系类型实体包含了与 Reltio 实体类型实体相同的属性:description、displayName、isActive、name、qualifiedName。
特性
所有 Reltio 属性实体(简单、嵌套、参考)可能包含以下属性(具体取决于 Reltio 的可用性):
- dataType(简单属性的嵌套、参考或数据类型),
- description、displayName、isActive、name、ualifiedName,
- 分面
- hidden
- 重要说明
- PII
- RDMAttributeName
- 必答
- searchable
- 系统
简单属性
简单属性在 Microsoft Purview 中创建为名为“Reltio Attribute”的实体,其中存在与其实体的包含关系。
嵌套属性
嵌套属性在 Microsoft Purview 中创建为名为“Reltio 属性”的实体,其中存在与其实体的关系。 子嵌套属性也创建为名为“Reltio 属性”的实体,其中存在与父嵌套属性的关系。 此屏幕截图显示包含电子邮件嵌套属性的联系人 Reltio 实体类型,该类型还进一步包含多个子嵌套属性,如用户名、域类型等。
引用属性
Reltio 实体类型中的参考属性在 Microsoft Purview 中也创建为名为“Reltio 属性”的实体,其中存在与其实体之间的包含关系。 子参考属性也创建为名为“Reltio 属性”的实体,其中存在与父参考属性的包含关系。
此屏幕截图显示了一个联系人 Reltio 实体类型实体,其参考属性称为地址,其中包含多个简单属性,例如验证状态、邮政信箱、州、国家/地区等,以及一些嵌套属性(如邮编和地理位置)。
查找表
Microsoft Purview 创建的资产
存储 Microsoft Purview 资产 GUID。 将用于软删除 Microsoft Purview 资产。
Microsoft Purview 参考属性表
存储参考属性的 ID 及其所参考 URI 的数组。 这样可以避免为了创建参考属性而重复检查 L3 配置。
Microsoft Purview 递归表
充当存储函数调用的堆栈,用于实现处理嵌套属性的递归调用。 存储属性的 json、父级的资产 ID、父资产类型、关系类型。 包含一个名为“processed”的虚拟字段,该字段不会被使用,但从表中获取单个条目时需要它。
配置 RIH 方案
你需要在合同中拥有 Microsoft Purview 连接器许可证。 请联系 Reltio 客户经理,以了解许可需求。
在 Reltio 合同中拥有 Microsoft Purview 连接器许可证后,Microsoft Purview 连接器方案和连接将部署到租户的 Reltio Integration Hub (RIH) 实例。
- 配置连接
- 配置环境属性。
配置方案:检查方案
方案包中包含两个连接和七个方案函数。 包在 RIH 帐户的 Reltio 解决方案模板项目中部署。
- 与 Reltio 租户连接
- 输入连接详细信息
- 连接名称:例如,Microsoft Purview
- 环境 URL:例如 361、tst-01 等
- 租户 ID:例如 a0bcdEf1ghiJ2Kl
- 将客户端授权设置为“否”
- Reltio 用户名和密码
- 选择连接
- 输入连接详细信息
- 建立连接后,状态将更改为“已连接”,按钮将更改为“断开连接”
- 连接你的 Purview 帐户
在能够连接之前,你需要根据本文档生成客户端 ID 和客户端密码 - Microsoft Purview 数据平面的 API 身份验证
- 输入连接详细信息
- 连接名称 - 例如,Microsoft Purview 门户
- 连接类型 - 云
- 身份验证类型 - Azure OAuth 2
- Azure 租户 ID - 例如 a0bcdEf1ghiJ2Kl
- Azure OAuth 客户端 ID 和客户端机密
- 基 URL
https://api.purview-service.microsoft.com - OAuth 作用域
- 选择连接
- 建立连接后,状态将更改为“已连接”,按钮将更改为“断开连接”。
在数据映射域中手动创建一个 Microsoft Purview 域,将其添加到方案参数(参数名称),并将集合添加到方案参数名称,以在现有域和集合中创建 Reltio 系统。 确保集合创建者的用户 ID 与集成方案的 UserID 一致,否则不会在此填充数据。 如果未创建域,则方案会失败。 如果未为集合提供值,则集成将使用此默认值:
- 集合 - purviewintegration
使用适用于 Microsoft Purview 的 Reltio 集成
让我们了解一下适用于 Microsoft Purview 的 Reltio 集成的使用方案。 以下方案和函数部署到 Recipes 文件夹:
- 主要
- 初始设置
- 创建实体
- 创建属性
- 创建关系
- 创建参考属性关系
- 软删除资产