适用于 Microsoft Purview 的 Reltio 集成

适用于 Microsoft Purview 的 Reltio 集成是通过 Reltio Integration Hub (RIH) 实现的。 集成包括 Reltio 和 Microsoft Purview 连接和方案,用于从 Reltio 读取租户业务配置,并在 Microsoft Purview 中创建相应的对象。

集成支持以下对象:

  • 实体类型
  • 实体属性 - 简单、嵌套、参考
  • 关系类型
  • 关系属性 - 简单、嵌套

集成的基础是在 Microsoft Purview 数据映射中为每个 Reltio 对象创建 EntityDefs。

Microsoft Purview 数据映射就像一个中央库存,支持 Microsoft Purview 统一目录、Microsoft Purview 数据资产见解和 Microsoft Purview 数据策略,作为 Microsoft Purview 治理门户中的统一体验。

EntityDef 类似于面向对象的编程中的类,为所有 Reltio 对象提供架构或蓝图。 它定义了实体、属性、关系及其类型的结构。 此架构确保实体的所有实例都遵守实体的规则和约束。

Reltio Microsoft 的 Microsoft Purview
系统 EntityDef “reltio_system”
租户 EntityDef “reltio_tenant”
实体类型 EntityDef “reltio_entity_type”
简单属性(实体类型、关系类型) EntityDef “reltio_attribute”
嵌套属性(实体类型、关系类型) EntityDef “reltio_attribute”
参考属性(实体类型) EntityDef “reltio_attribute”
关系类型 EntityDef “reltio_relationship_type”

稍后,集成会在 Microsoft Purview 数据映射中创建 Reltio 系统作为实体。 在 Microsoft Purview 中,也会使用实现关系,作为 Reltio 系统下的一个实体创建Reltio 租户。

reltio 世系的屏幕截图。

Reltio 系统包含以下属性:description、displayName(与 Reltio 标签相同)、name(Reltio URI 的最后一部分)、qualifiedName(唯一标识符)。

reltio-datamap-asset 的屏幕截图。

Reltio 租户包含以下属性:description、displayName、isActive(如果未在 Reltio 上删除实体)、name、qualifiedName、updatedBy(自动填充)、updatedTime(自动填充)。

reltio-datamap-asset 1 的屏幕截图。

属性是描述性属性或元数据,可提供数据资产的上下文,有助于发现、管理和治理,而不会影响数据的实际结构或格式。

Microsoft Purview 实体 qualifiedName 使用以下对象派生

<collectionId>/<env>/<tenantId>/<URI>

由于实体 qualifiedName 使用租户 ID 和 env,对一个租户来说始终是唯一的,因此同一个 Microsoft Purview 帐户可用于多个租户。

可以在 DataMap->域->集合(默认为根)-> 资产-> 搜索资产/实体的名称下,验证创建的实体。 若要确保实体在统一目录中显示,请将其手动添加到需要发布的 Microsoft Purview 数据产品。 实体出现在分配给所选数据产品作为数据资产的统一目录中,其属性(未包含子嵌套和参考的属性)显示在“架构”部分中。 架构部分仅适用于特定资产类型的实体:Reltio 实体类型、Reltio 关系类型。 架构定义数据的结构,并规定存储、查询和维护数据的方式。 它规定必须如何设置数据的格式,以及数据中存在哪些关系

reltio-datamap-asset 2 的屏幕截图。

reltio-datamap-asset 3 的屏幕截图。

reltio-datamap-asset 4 的屏幕截图。

reltio-datamap-asset 5 的屏幕截图。

reltio-datamap-asset 6 的屏幕截图。

架构

架构是一个重要概念,它反映了数据在数据存储中的存储和组织方式。 它反映了数据的结构,以及构成该结构的元素的数据限制。 可以按不同的方式将同一架构中的元素分类(因为其内容不同)。 此外,可以仅针对元素的子集进行不同的转换(世系)。 由于这些特性,Microsoft Purview 可以将架构和架构元素建模为实体,因此架构通常是数据资产实体的关系属性。 架构元素的示例:表的列、json 架构的 json 属性、xml 架构的 xml 元素等。

类型定义以及如何在 Microsoft Purview 中创建自定义类型

Reltio 对象映射到 Microsoft Purview 实体

实体类型

租户中的实体类型在 Microsoft Purview 中创建为名为 Reltio MDM 实体的实体,其中包含与租户的关系。

reltio 世系 1 的屏幕截图。

reltio 世系 2 的屏幕截图。

Reltio MDM 实体的属性

Reltio MDM 实体包含以下属性:description、displayName、isAbstract(如果实体在 Reltio 上是抽象实体)、isActive、name、qualifiedName。

reltio-mdm-entity-property-1 的屏幕截图。

reltio-mdm-entity-property-2 的屏幕截图。

关系类型

租户中的关系类型在 Microsoft Purview 中创建为名为 Reltio 关系类型的实体,其中包含与租户的关系。

此外,Reltio 关系类型实体与以下两个 Reltio MDM 实体存在关系:start_relationship和end_relationship。 关系属性作为名为 Reltio 属性的实体添加,其中包含与 Reltio 关系类型实体的关系。

该屏幕截图显示了一个联系人 Reltio MDM 实体,它与具有 start_relationship 关系的“具有地址”Reltio 关系类型实体相连。 之后,“具有地址”Reltio 关系类型实体与具有 end_relationship 关系的位置 Reltio 实体类型实体相连。 “具有地址”Reltio 关系类型实体有四个简单数据属性,其中包含关系:Address Type、Address。 Rank、Active、Status。

reltio-relationship-type-1 的屏幕截图。

关系属性可进一步包含与 Reference 属性的关系。 在示例中,地址类型关系数据属性参考联系人 Reltio 实体类型实体。

reltio-relationship-type-2 的屏幕截图。

此外,Reltio 关系类型实体包含了与 Reltio 实体类型实体相同的属性:description、displayName、isActive、name、qualifiedName。

reltio-relationship-type-3 的屏幕截图。

特性

所有 Reltio 属性实体(简单、嵌套、参考)可能包含以下属性(具体取决于 Reltio 的可用性):

  • dataType(简单属性的嵌套、参考或数据类型),
  • description、displayName、isActive、name、ualifiedName,
  • 分面
  • hidden
  • 重要说明
  • PII
  • RDMAttributeName
  • 必答
  • searchable
  • 系统

reltio-attribute 的屏幕截图。

简单属性

简单属性在 Microsoft Purview 中创建为名为“Reltio Attribute”的实体,其中存在与其实体的包含关系。

reltio-simple-attribute-1 的屏幕截图。

reltio-simple-attribute-2 的屏幕截图。

reltio-simple-attribute-3 的屏幕截图。

嵌套属性

嵌套属性在 Microsoft Purview 中创建为名为“Reltio 属性”的实体,其中存在与其实体的关系。 子嵌套属性也创建为名为“Reltio 属性”的实体,其中存在与父嵌套属性的关系。 此屏幕截图显示包含电子邮件嵌套属性的联系人 Reltio 实体类型,该类型还进一步包含多个子嵌套属性,如用户名、域类型等。

reltio-nested-attribute-1 的屏幕截图。

reltio-nested-attribute-2 的屏幕截图。

引用属性

Reltio 实体类型中的参考属性在 Microsoft Purview 中也创建为名为“Reltio 属性”的实体,其中存在与其实体之间的包含关系。 子参考属性也创建为名为“Reltio 属性”的实体,其中存在与父参考属性的包含关系。

此屏幕截图显示了一个联系人 Reltio 实体类型实体,其参考属性称为地址,其中包含多个简单属性,例如验证状态、邮政信箱、州、国家/地区等,以及一些嵌套属性(如邮编和地理位置)。

reltio-reference-attribute-1 的屏幕截图。

reltio-reference-attribute-2 的屏幕截图。

查找表

  • Microsoft Purview 创建的资产

  • 存储 Microsoft Purview 资产 GUID。 将用于软删除 Microsoft Purview 资产。

  • Microsoft Purview 参考属性表

  • 存储参考属性的 ID 及其所参考 URI 的数组。 这样可以避免为了创建参考属性而重复检查 L3 配置。

Microsoft Purview 递归表

充当存储函数调用的堆栈,用于实现处理嵌套属性的递归调用。 存储属性的 json、父级的资产 ID、父资产类型、关系类型。 包含一个名为“processed”的虚拟字段,该字段不会被使用,但从表中获取单个条目时需要它。

配置 RIH 方案

你需要在合同中拥有 Microsoft Purview 连接器许可证。 请联系 Reltio 客户经理,以了解许可需求。

在 Reltio 合同中拥有 Microsoft Purview 连接器许可证后,Microsoft Purview 连接器方案和连接将部署到租户的 Reltio Integration Hub (RIH) 实例。

  • 配置连接
  • 配置环境属性。

配置方案:检查方案

方案包中包含两个连接和七个方案函数。 包在 RIH 帐户的 Reltio 解决方案模板项目中部署。

  • 与 Reltio 租户连接
    • 输入连接详细信息
      • 连接名称:例如,Microsoft Purview
      • 环境 URL:例如 361、tst-01 等
      • 租户 ID:例如 a0bcdEf1ghiJ2Kl
      • 将客户端授权设置为“否”
      • Reltio 用户名和密码
    • 选择连接
  • 建立连接后,状态将更改为“已连接”,按钮将更改为“断开连接”
  • 连接你的 Purview 帐户

在能够连接之前,你需要根据本文档生成客户端 ID 和客户端密码 - Microsoft Purview 数据平面的 API 身份验证

  1. 输入连接详细信息
  • 连接名称 - 例如,Microsoft Purview 门户
  • 连接类型 - 云
  • 身份验证类型 - Azure OAuth 2
  • Azure 租户 ID - 例如 a0bcdEf1ghiJ2Kl
  • Azure OAuth 客户端 ID 和客户端机密
  • 基 URL
    https://api.purview-service.microsoft.com
    
  • OAuth 作用域
  1. 选择连接
  • 建立连接后,状态将更改为“已连接”,按钮将更改为“断开连接”。

在数据映射域中手动创建一个 Microsoft Purview 域,将其添加到方案参数(参数名称),并将集合添加到方案参数名称,以在现有域和集合中创建 Reltio 系统。 确保集合创建者的用户 ID 与集成方案的 UserID 一致,否则不会在此填充数据。 如果未创建域,则方案会失败。 如果未为集合提供值,则集成将使用此默认值:

  • 集合 - purviewintegration

reltio-purview-collection 的屏幕截图。

使用适用于 Microsoft Purview 的 Reltio 集成

让我们了解一下适用于 Microsoft Purview 的 Reltio 集成的使用方案。 以下方案和函数部署到 Recipes 文件夹:

  • 主要
  • 初始设置
  • 创建实体
  • 创建属性
  • 创建关系
  • 创建参考属性关系
  • 软删除资产