用于主数据管理 (MDM) 的 Microsoft Purview 与 Profisee 集成

企业系统可以有多个主数据源—跨系统共享的常见数据。 编录数据源时,此事实可能会变得明显。 主数据的示例包括客户、产品、位置、资产和供应商数据。 使用 Profisee 合并、验证和更正主数据时,可以使该数据有效。 具体来说,可以使用它构建通用的受信任平台,用于分析和运营改进。 通过使用 Microsoft Purview 中详述的治理定义、见解和专业知识,可以有效地构建平台。

此参考体系结构提供了治理和数据管理解决方案,该解决方案具有 Microsoft Purview 和 Profisee 主数据管理(MDM)平台。 这些服务协同工作,提供高质量的受信任数据的基础,从而最大程度地提高 Azure 中数据的业务价值。

体系结构

下图显示了开发和操作主数据解决方案时要执行的步骤。 将这些步骤视为高度迭代。 随着解决方案的演变,可能会重复这些步骤和阶段,有时自动,有时手动。 使用自动步骤还是手动步骤取决于主数据解决方案、元数据和数据经历的更改。

在微服务设计体系架构中使用 Microsoft Purview 和 Profisee MDM 的数据治理和管理解决方案的体系架构图。

下载此体系结构的 Visio 文件

数据流

元数据和数据流包括以下步骤,如上图所示:

  1. 使用预生成的 Microsoft Purview 连接器从源业务应用程序生成统一目录。 连接器扫描数据源并填充统一目录。

  2. 主数据模型会发布到 Microsoft Purview。 在 Profisee MDM 中创建的主数据实体会无缝发布到 Microsoft Purview。 此步骤会进一步填充统一目录并确保 Microsoft Purview 中有此关键数据源的记录。

  3. 数据管理的治理标准和策略用于扩充主数据实体定义。 在 Microsoft Purview 中使用数据字典和术语表信息、所有权数据和敏感数据分类扩充数据。 Microsoft Purview 中可用的任何定义和元数据都在 Profisee 中实时可见,作为 MDM 数据专员的指南。

  4. 源系统中的主数据会加载到 Profisee MDM 中。 Azure 数据工厂等数据集成工具集将使用 100 多个预生成的连接器中的任意一个或使用 REST 网关从源系统中提取数据。 多个主数据流会加载到 Profisee MDM 中。

  5. 主数据根据治理规则进行标准化、匹配、合并、扩充和验证。 Microsoft Purview 等其他系统可能会定义数据质量和治理规则。 但是 Profisee MDM 是强制执行这些规则的系统。 源记录在源系统内和源系统之间进行匹配和合并,从而创建尽可能完整和正确的记录。 数据质量规则检查每条记录是否符合业务和技术要求。 任何未通过验证或返回概率低分的记录都需要修正。 为了修正失败的验证,工作流过程会将需要审查的记录分配给作为其业务数据领域专家的数据专员。 验证或更正记录后,即可将其用作 黄金记录 母版。

  6. 事务数据会加载到下游分析解决方案中。 数据工厂等数据集成工具集将使用 100 多个预生成的连接器中的任意一个或使用 REST 网关从源系统中提取事务数据。 工具集将数据直接加载到 Azure Synapse Analytics 等分析数据平台中。 由于数据重叠、不匹配以及冲突尚未得到解决,因此在无适当主黄金数据的情况下,对此原始信息的分析可能会不准确。

  7. Power BI 连接器提供对特选主数据的直接访问。 Power BI 用户可以直接在报告中使用主数据。 专用 Power BI 连接器识别并强制执行基于角色的安全性。 它还会隐藏各种系统字段以简化使用。

  8. 高质量的特选主数据会发布到下游分析解决方案中。 如果主数据记录已合并到单个黄金记录中,会保留指向原始记录的父子链接。

  9. 分析平台具有一组经过认证的数据,即它完整、一致且准确。 该数据包括适当特选的主数据和关联的事务数据。 这种组合构成了可用于进一步分析的受信任数据的坚实基础。

  10. 对高质量主数据进行可视化和分析,并应用机器学习模型。 系统提供优秀见解以推动业务发展。

组件

  • Microsoft Purview 是一种数据治理解决方案,可全面洞察本地和云数据资产。 Microsoft Purview 提供数据发现和分类、世系、元数据搜索和发现以及使用情况见解的组合。 这些功能全都有助于管理和了解整个企业数据环境中的数据。

  • Profisee MDM 是快速且直观的 MDM 平台,可与 Microsoft 技术和 Azure 数据管理生态系统无缝集成。

  • 数据工厂是混合数据集成服务。 可以使用数据工厂创建、安排和编排提取、转换和加载 (ETL) 以及提取、加载。 数据工厂还会提供 100 多个预生成的连接器和一个 REST 网关,可用于从源系统中提取数据。

  • Azure Synapse Analytics 是快速、灵活且受信任的云数据仓库,可使用大规模并行处理体系结构。 可以使用 Azure Synapse Analytics 弹性且独立地缩放、计算和存储数据。

  • Power BI 是一套业务分析工具,用于在整个组织内提供见解。 可以使用 Power BI 连接到数百个数据源、简化数据准备并推动即兴分析。 还可以生成美观的报告,然后发布它们以供组织在 Web 和移动设备上使用。

备选方法

如果没有专用的 MDM 应用程序,可以在 Azure 中找到生成 MDM 解决方案所需的一些技术功能:

  • 数据质量。 将数据加载到分析平台时,可以将数据质量构建到集成过程中。 例如,可以使用硬编码脚本以在 数据工厂 管道中应用数据质量转换。
  • 数据标准化和扩充。 Azure Maps 可以为地址数据提供数据验证和标准化。 可以在 Azure Functions 和数据工厂中使用标准化数据。 要对其他数据进行标准化,可能需要开发硬编码脚本。
  • 重复数据管理。 如果有足够的标识符可用于完全匹配,可以使用数据工厂 删除重复行。 可能需要自定义硬编码脚本以实现合并匹配行所需的逻辑,同时应用适当的数据存活技术。
  • 数据管理。 可以使用 Power Apps 快速开发基本的数据管理解决方案,从而在 Azure 中管理数据。 还可以为评审、警报和验证开发适当的用户界面。

在以 Microsoft 为中心的环境中,Azure Synapse Analytics 是首选的分析服务。 但可以使用任何分析数据库。 Databricks 是常见的选择。

方案详细信息

随着加载到 Azure 的数据量增加,对正确治理和管理所有数据源中的数据的需求会增加,数据使用者也会增加。 在源系统中看似足够的数据在共享时往往发现有缺陷。 它可能缺少信息或信息不完整,或者有重复和冲突。 整体质量可能很差。 需要完整、一致且准确的数据。

如果 Azure 数据资产中没有高质量的数据,Azure 的业务价值会削弱,甚至可能会严重削弱。 解决方案是为数据治理和管理构建基础,从而为高质量的受信任数据生成和提供真实源。 Microsoft Purview 和 Profisee MDM 协同工作,构成了此企业平台。

图中显示了 Microsoft Purview 和 Profisee MDM 如何将未治理的数据转换为高质量的受信任数据。

Microsoft Purview 编录所有数据源并识别任何敏感信息和世系。 数据架构师可在其中考虑要对所有数据实施的适当数据标准。 Microsoft Purview 专注于治理,从而查找、定义策略和标准并对其进行分类。 MDM 系统等技术承担强制执行策略和标准、编录数据源以及修正缺陷数据的任务。

Profisee MDM 旨在接受来自任何源的主数据。 然后,Profisee MDM 跨系统匹配、合并、标准化、验证、更正和同步数据。 此过程可确保数据可以正确集成,并满足下游系统(例如商业智能(BI)和机器学习应用程序)的需求。 集成的 Profisee 平台跨多个数据孤岛强制执行治理标准。

结合使用效果更好

Microsoft Purview 和 Profisee MDM 协同工作效果更好。 集成后,它们可简化数据管理任务,并确保所有系统都强制执行相同的标准。 Profisee MDM 将其主数据模型发布到 Microsoft Purview,它可以在其中参与治理。 然后,Microsoft Purview 共享治理输出,例如统一目录和词汇表信息。 Profisee 可以查看输出并强制执行标准。 通过合作,Microsoft Purview 和 Profisee 创造了自然的、结合使用效果更好的协同效应,比每个独立产品/服务更深入。

例如,编录企业数据源后,可以确定主数据存在于多个系统中。 主数据是定义域实体的数据。 主数据的示例包括客户、产品、资产、位置、供应商、患者、家庭、菜单项和成分数据。 解析不同的定义并跨系统匹配和合并此数据对于以有意义的方式使用此数据的能力至关重要。 为有效起见,应使用 Microsoft Purview 中详述的治理定义、见解和专业知识,从而在 Profisee MDM 中合并、验证和更正主数据。 这样,Microsoft Purview 和 Profisee MDM 便构成了治理和数据管理的基础,并最大程度提高了 Azure 中数据的业务价值。

替换方法是使用可获取的任何信息。 但是,采用此方法时,可能会产生损害业务的误导性结果。 改用高质量的主数据时,可以消除常见的数据质量问题。 然后,无论将哪种工具用于分析、机器学习和可视化,系统都提供可用于推动业务发展的优秀见解。 精选的主数据对于构建坚实、可靠的数据基础非常关键。

将 Profisee MDM 与 Microsoft Purview 结合使用时,会获得以下优势:

  • 通用技术基础。 Profisee 起源于 Microsoft 技术。 Profisee 和 Microsoft 使用常见的工具、数据库和基础结构,这使得使用 Microsoft 技术的任何用户都能够熟悉 Profisee 解决方案。 事实上,多年来,Profisee MDM 基于 Microsoft Master Data Services 构建。 现在,Master Data Services 生命周期即将结束,Profisee 则是顶级的 升级和替换解决方案。
  • 开发人员协作和共同开发。 Profisee 和 Microsoft Purview 开发人员广泛协作,从而确保在各自的解决方案之间实现良好的互补性。 这种协作提供了满足客户需求的无缝集成。
  • 共同销售和部署。 与其他 MDM 供应商相比,Profisee 在 Azure 上部署了更多的 MDM,且与 Microsoft Purview 共同部署了更多的 MDM。 可以通过 Azure 市场购买 Profisee。 在 2023 财年,Profisee 是唯一获得顶级 Microsoft 合作伙伴认证的 MDM 供应商,该认证在 Azure 市场中具有基础结构即服务(IaaS)、容器即服务(CaaS),或软件即服务(saaS)产品/服务。
  • 快速可靠的部署。 所有企业软件的一项关键功能是快速可靠的部署。 根据 Git Peer Insights 平台,与任何其他 MDM 供应商相比,Profisee 的实现所需的时间少于 90 天。
  • 多个域。 Profisee 提供了一种固有地使用多个域的 MDM 方法。 可创建的主数据域数没有限制。 此设计与计划实现数据资产现代化的客户非常一致。 客户可能从有限数量的域开始,但他们最终会从在整个数据资产中最大程度扩大域覆盖范围中受益。 此域覆盖范围与其数据管理覆盖范围匹配。
  • 专为 Azure 设计的工程。 Profisee 设计为云原生,具有适用于 Azure 上的 SaaS 和托管 IaaS 或 CaaS 部署的选项。

可能的用例

有关此解决方案的 MDM 用例的详细列表,请参阅后文的 MDM 用例。 关键 MDM 用例包括以下零售和制造示例:

  • 整合客户数据进行分析。
  • 以一致和可访问的形式 360 度查看产品数据,例如每个产品的名称、描述和特征。
  • 建立参考数据以一致地增加主数据的描述。 例如,参考数据包括国家/地区、货币、颜色、大小和度量单位的列表。

这些 MDM 解决方案还为严重依赖数据进行关键活动(例如及时报告)的金融组织提供帮助。

MDM 与 Microsoft Purview 集成

下图详细说明了 Profisee MDM 在 Microsoft Purview 中的集成。 为了支持此集成,Profisee 治理子系统提供与 Microsoft Purview 的双向集成,其中包括两个不同的流:

  • 当数据建模师更改主数据模型、匹配策略及其相关子主题时,会发布解决方案元数据。 这些更改会在发生时无缝发布到 Microsoft Purview。 发布这些更改会同步与主数据模型和解决方案相关的元数据。 因此,统一目录会进一步填充,并且 Microsoft Purview 具有此关键数据源的记录。
  • 会返回治理详细信息并将其提供给数据专员和业务用户。 当用户使用 Profisee FastApp 门户查看数据、扩充数据和修正数据质量问题时,可以使用这些详细信息。

图中显示了 Profisee MDM 如何与 Microsoft Purview 集成以引入、治理数据并为其建模。

Microsoft Purview 集成功能

Microsoft Purview 目录和术语表有助于最大化集成。

主数据模型设计

准备 MDM 解决方案的挑战之一是确定构成主数据的内容,以及填充主数据模型时要使用的数据源。 可以使用 Microsoft Purview 帮助完成这项工作。 可以利用扫描关键数据源的功能,并吸引数据专员和行业专家(SME)。 这样,便可以使用专员稍后可访问的信息扩充统一目录,从而更好地使主数据模型与业务线系统保持一致。 可以协调冲突术语。 此过程会生成主数据模型,该模型以最佳方式反映要为业务实现标准化的术语和定义。 它还可避免过时和误导性的谓词。

以下来自更广泛关系图的摘录说明了此集成用例。 首先,使用 Microsoft Purview 系统扫描功能从业务线系统引入元数据。 接下来,数据专员和 SME 准备可靠的目录和联系人。 然后,使用 Profisee MDM 建模服务的数据建模师可以准备和改进主数据模型。 此工作符合你在 Microsoft Purview 中定义的标准。

图中显示了 Profisee MDM 与 Microsoft Purview 集成以引入、治理数据并为其建模的用例。

随着数据专员改进模型,Profisee MDM 平台内的建模服务会发布 Profisee MDM 治理服务收到的更改。 反过来,Profisee MDM 会准备这些更改并将其转发给 Microsoft Purview,从而包含在其更新的统一目录中。 这些添加到目录中的内容可确保主数据定义包含在更广泛的数据资产中,并且可以按照与业务线系统元数据相同的方式对它们进行治理和控制。 通过确保将此信息编录在一起,可以更好地管理主数据和业务线系统数据之间的关系。

数据管理

具有相应复杂和广泛数据资产的大型企业可能会给数据专员带来挑战,他们负责在出现问题时进行管理和修正。 关键数据领域可能很复杂,有许多模糊的属性,只有具有重要机构知识的终身员工才能理解。 通过 Profisee MDM 与 Microsoft Purview 的集成,可以在 Microsoft Purview 内捕获此机构知识,并将其用于 Profisee MDM。 因此,在管理关键和时间敏感型信息时,可缓解对企业数据知识的极大需求。

下图演示了从 MicrosoftPurview 到在 Profisee FastApp 门户中工作的数据专员的信息流。 治理数据服务与 Microsoft Purview 和 Microsoft Entra ID 集成。 此服务提供查找功能。 FastApp 门户用户可以使用此功能检索有关实体及其使用的属性的扩充治理数据。

图中显示了数据专员如何使用 Profisee 门户处理 Microsoft Purview 和 Profisee MDM 管理的数据。

治理服务还将从 Microsoft Purview 收到的联系人解析为其完整的个人资料详细信息(在 Microsoft Entra ID 中可用)。 借助完整的个人资料详细信息,专员能够与数据所有者和专家进行有效协作,他们致力于提高主数据的质量。

Profisee MDM“治理”对话框为界面,数据专员和用户通过它与治理级别详细信息进行交互。 此 UI 向用户呈现从 Microsoft Purview 获取的信息。 通过使用此信息,用户可以查看从中启动对话框的数据背后的详细信息。 如果“治理”对话框中提供的信息不足,用户可以直接转到 Microsoft Purview 用户体验。

数据专员和业务用户可以通过 FastApp 门户访问三种 Profisee 数据资产类型:

  • Profisee 实例,提供用户正在查看的 Profisee MDM 平台特定实例的基础结构属性
  • Profisee 实体,提供专员或用户当前正在查看的主数据实体(表)的属性
  • Profisee 属性,提供用户感兴趣的属性(例如字段或列)的属性

下图演示了在 FastApp 门户中工作的用户可以查看每种资产类型的治理详细信息。 可以在“帮助”菜单上找到实例级详细信息。 可以从包含实体网格的页面区域标头中访问实体详细信息。 有关属性详细信息,请转到与实体网格关联的窗体。 从与属性关联的标签中访问详细信息。

Profisee 门户的屏幕截图。有关客户的信息可见。在“帮助”菜单上,“治理”实例突出显示。

要查看摘要信息,请将鼠标悬停在治理图标上,例如 Microsoft Purview。 选择图标以显示完整的治理对话框:

Profisee 门户的屏幕截图。在“客户”页面,对话框提供有关出生日期属性的详细信息。

要转到完整的 Microsoft Purview 用户体验,请在对话框标头中选择治理图标。 选择该图标会将你转到当前正在查看的资产上下文中的 Microsoft Purview。 然后,可以根据发现需求在 Microsoft Purview 中轻松移动。

MDM 处理

MDM 解决方案的强大功能包含在详细信息中。

数据建模

MDM 解决方案的核心是基础数据模型。 它代表公司内主数据的定义。 开发主数据模型涉及以下任务:

  • 从整个系统环境中识别对公司运营至关重要且对分析性能尤为关键的源数据元素。
  • 使用从其他第三方源获取的元素以扩充模型,从而使数据呈现得更有用、更准确且更可信。
  • 明确建立与数据模型元素相关的所有权和权限。 此做法有助于确保将可见性和变更管理纳入模型设计。

数据治理为支持提供了关键基础:

  • 治理统一目录、字典、术语表和支持资源是治理数据专员的宝贵信息来源。 这些资源可帮助专员确定主数据模型中要包含的内容。 它们还有助于确定 Microsoft Purview 中的所有权和敏感数据分类。 可以强化模型中的术语。 通过此做法,可以为业务建立官方词典。 通过集成术语,主数据模型可以将在各种源系统中使用的深奥术语翻译成业务中认可的语言。
  • 第三方系统通常是独立于业务线系统的主数据的源。 向模型添加元素以捕获这些系统添加到数据中的信息并将这些信息源反映回统一目录中至关重要。
  • 可以使用在治理目录中识别的所有权和数据访问以在 MDM 解决方案中强制执行访问和变更管理权限。 因此,可将企业策略和需求与用于管理主数据的工具保持一致。

源数据加载

理想情况下,不同的业务线系统会将数据加载到主数据模型中,几乎不需要更改或转换。 目标是拥有源系统中存在的数据的集中式版本。 源系统和主数据存储库之间的保真度损失应尽可能少。 通过限制加载过程的复杂性,世系会变得更简单。 使用数据工厂管道等技术时,治理解决方案可以检查流。 然后,解决方案可以识别源系统和主数据模型之间的关系。 具体而言,你的解决方案可以使用超过 100 个预生成连接器中的任何一个以及 REST 网关从源系统中提取数据。

数据扩充和标准化

在将源数据加载到模型中后,可以挖掘丰富的第三方数据源以对其进行扩展。 可以使用这些系统以改进从业务线系统中获取的数据。 还可以使用这些系统以扩充源数据的信息,从而增强其他下游使用者对它的使用。 例如:

  • 可以使用必应等地址验证服务以更正并改进源系统地址。 这些服务可以添加缺失信息并对其进行标准化,这些信息对地理位置和邮件传递至关重要。
  • Dun & Bradstreet 等第三方信息服务可以提供通用或行业特定的数据。 可以使用此数据扩展黄金主记录的值。 具体来说,可以添加曾在不同的业务线系统中不可用或冲突的信息。

Profisee 的发布/订阅基础结构便于根据需要将自己的第三方源集成到解决方案中。

了解此数据背后的源和含义的能力对于第三方数据和内部业务线系统同样重要。 通过将主数据模型集成到治理统一目录中,可以管理内部和外部数据源之间的关系,同时使用治理详细信息扩充模型。

数据质量验证和管理

加载和扩充数据后,必须检查其质量以及是否符合你通过治理过程建立的标准。 Microsoft Purview 可以再次成为丰富的标准信息源。 可以使用 Microsoft Purview 以推动 MDM 解决方案强制执行的数据质量规则。 Profisee MDM 还可以将数据质量规则作为资产发布到治理目录。 需要审查和批准对这些规则,这有助于对与主数据关联的质量标准进行自上而下的监督。 规则绑定到主数据实体和属性,且这些属性可以追溯到源系统。 出于这些原因,可以确定源自业务线系统的数据质量差的根本原因。

数据专员是其治理领域中的专家。 当专员解决主数据解决方案揭示的问题时,可以使用 Microsoft Purview 数据治理目录。 该目录可帮助专员了解并解决出现的质量问题。 在数据所有者和专家的支持下,专员可做好准备,从而快速、准确地解决数据质量问题。

匹配和存留

借助高质量的扩充源数据,可以生成黄金记录母版,该母版代表不同业务线系统中最准确的信息。 下图演示了所有步骤如何最终生成可用于业务分析的高质量数据。 可以随时跨数据资产同步此数据。

图中显示了存活和数据世系如何影响黄金记录,以及如何扩充数据。

作为存活过程的一部分,Profisee MDM 的匹配引擎会生成黄金记录母版。 存活规则选择性地使用跨各种源系统选择的信息填充此黄金记录。

Profisee MDM 历史记录和审核跟踪子系统跟踪用户所做的更改。 此子系统还跟踪存活等系统过程所做的更改。 借助匹配和存活,可以跟踪从源记录到主记录的信息流。 Profisee MDM 具有负责特定源记录的源系统的记录。 你还了解不同的源记录如何填充黄金记录。 因此,可以实现从分析回到报告引用的源数据的数据世系。

MDM 用例

尽管 MDM 有很多用例,但只有少数用例涵盖了大多数实际的 MDM 实现。 这些用例专注于单个域,但它们不太可能仅从该域构建。 即使是这些重点用例,也很可能涉及多个域。 在每个用例中,MDM 都满足提供基本数据类型的 360 度或统一视图的目标。

客户数据

整合客户数据并对其进行标准化以进行 BI 分析是最常见的 MDM 用例。 组织跨越来越多的系统和应用程序捕获客户数据。 重复的客户数据会记录结果。 这些重复项位于应用程序中和应用程序之间,并且包含不一致内容和差异。 客户数据的质量差限制了新式分析解决方案的价值。 症状包括以下挑战:

  • 很难回答基本的业务问题,例如“谁是我们的主要客户?”以及“我们有多少新客户?”回答这些问题需要大量的手动工作。
  • 客户信息缺失和不准确,使得难以汇总或向下钻取数据。
  • 无法跨组织和系统边界唯一识别或验证客户。 因此,无法跨系统或业务部门分析客户数据。
  • 由于输入数据质量差,AI 和机器学习中的见解质量很差。

产品数据

产品数据通常分布在多个企业应用程序中,例如企业资源规划(ERP)、产品生命周期管理(PLM)或电子商务应用程序。 因此,很难理解具有不一致属性(例如产品的名称、描述和特征)定义的整个产品目录。 参考数据的定义不同使这种情况复杂化。 症状包括以下挑战:

  • 无法为产品分析支持不同的替换分层汇总和向下钻取路径。
  • 对于成品或材料库存,难以评估产品库存和知名的供应商。 你也有重复的产品,这会导致库存过剩。
  • 由于定义冲突,难以使产品合理化。 这种情况会导致分析中缺少信息或信息不准确。

引用数据

在分析上下文中,参考数据作为大量数据列表存在。 这些列表通常用于进一步描述其他主数据集。 例如,参考数据包括国家/地区、货币、颜色、大小和度量单位的列表。 参考数据不一致会导致下游分析中出现明显的错误。 症状如下:

  • 同一值的多个表示形式。 例如,佐治亚州被列为 GAGeorgia,这使得难以一致地聚合和向下钻取数据。
  • 由于无法在系统之间 交叉使用 或映射参考数据值,因此难以跨系统流式传输数据。 例如,红色在 ERP 系统中用 R 表示,在 PLM 系统中用 Red 表示。
  • 由于用于数据分类的建立的参考数据值存在差异,因此组织之间的数字难以划分。

财务数据

金融机构高度依赖于数据来进行关键活动,如月度、季度和年度报告。 拥有多个财务和会计系统的组织通常拥有跨多个总账的财务数据,需要合并这些数据才能生成财务报告。 MDM 可以提供集中式中心以映射并管理帐户、成本中心、业务实体和其他财务数据集。 通过该集中式中心,MDM 提供这些数据集的合并视图。 症状包括以下挑战:

  • 难以将跨多个系统的财务数据聚合到一个合并视图中
  • 缺乏在财务系统中添加和映射新数据元素的过程
  • 延迟生成期末财务报告

注意事项

这些注意事项实施 Azure 架构良好的框架的支柱原则,即一套可用于改善工作负荷质量的指导原则。 有关详细信息,请参阅 Azure 架构良好的框架

为组织选择数据管理解决方案时,请考虑这些因素。

可靠性

可靠性可确保应用程序符合你对客户的承诺。 有关详细信息,请参阅可靠性支柱概述

Profisee 在 Azure Kubernetes (AKS)服务和 Azure SQL 数据库上本机运行。 这两项服务都提供现成的功能,以支持高可用性。

安全性

安全性针对蓄意攻击及滥用宝贵数据和系统提供保障措施。 有关详细信息,请参阅安全性支柱概述

Profisee 使用实现 OAuth 2.0 身份验证流的 OpenID Connect 对用户进行身份验证。 大多数组织将 Profisee MDM 配置为针对 Microsoft Entra ID 对用户进行身份验证,从而确保可以应用和强制执行企业策略以进行身份验证。

成本优化

成本优化是关于寻找减少不必要的费用和提高运营效率的方法。 有关详细信息,请参阅成本优化支柱概述

运行成本包括软件许可证和 Azure 消耗。

性能效率

性能效率是指工作负荷能够以高效的方式扩展以满足用户对它的需求。 有关详细信息,请参阅性能效率要素概述

Profisee MDM 在 AKS 和 SQL 数据库上本机运行。 可以将 AKS 配置为纵向扩展、纵向缩减和跨业务部门扩展 Profisee MDM。 可以以多种配置部署 SQL 数据库,从而平衡性能、可伸缩性和成本。

动态缩放是 Profisee 云原生体系结构中的固有功能,它使用微服务和容器。 如果通过 Kubernetes 在云租户中运行 Profisee,可以根据负载动态纵向扩展和横向扩展。 借助在 AKS 上运行的 Profisee SaaS 服务,可以为 Pod 配置大型节点池。 这些池根据跨多租户基础结构的系统负载动态缩放。

有关如何在 AKS 上部署 Profisee 和 Microsoft Purview 的详细信息,请参阅 Microsoft Purview - Profisee MDM 集成

部署此方案

Profisee MDM 是打包的 Kubernetes 服务。 可以将 Profisee MDM 部署为 Azure 租户、任何其他云租户或本地的 PaaS

  1. 通过提出 https://support.profisee.com/ 的支持票证从 Profisee 获取许可证文件。 此步骤的唯一先决条件是,需要预先确定 Profisee 在 Azure 上设置的 DNS 解析 URL。 即,保留部署中所使用负载均衡器的 DNS 主机名。 它类似于 "[profisee_name].[region].chinacloudapp.cn"。 例如,DNSHOSTNAME="purviewprofisee.chinanorth3.chinacloudapp.cn"。 在提出支持票证时,请向 Profisee 支持提供此 DNSHOSTNAME,并且 Profisee 将使用许可证文件进行还原。 在下一个配置步骤中,需要提供此文件。

  2. 在 Azure 中创建用户分配的托管标识。 必须创建托管标识才能运行部署。 部署完成后,可以删除托管标识。 根据 ARM 模板选项,需要将以下某些或全部角色和权限分配给托管标识:

    • 将部署 AKS 的资源组的参与者角色。 可以直接将它分配给资源组,也可以分配给订阅级别和更低级别。
    • 将创建条目的特定 DNS 区域的 DNS 区域参与者角色,或 DNS 区域资源组的参与者角色。 仅当更新 Azure 中托管的 DNS 时,才需要此 DNS 角色。
    • Microsoft Entra ID 中的应用程序管理员角色,因此可以分配应用程序注册所需的权限。
    • 订阅级别的托管标识参与者和用户访问管理员。 需要 ARM 模板托管标识才能创建密钥保管库特定托管标识,该标识将由 Profisee 用来拉取存储在密钥保管库中的值。

    Profisee 托管标识 Azure 角色分配的屏幕截图。

  3. 创建应用程序注册,在安装 Profisee 后作为登录标识。 它需要是 Microsoft Entra ID 的一部分,该 ID 将用于登录到 Profisee。 保存应用程序(客户端)ID 供以后使用。

    • 设置身份验证以匹配以下设置:
      • 支持 ID 令牌(用于隐式和混合流)
      • 将重定向 URL 设置为 https://<your-deployment-url>/profisee/auth/signin-microsoft
        • 你的部署 URL 是在步骤 1 中提供给 Profisee 的 URL
  4. 创建一个服务主体,Microsoft Purview 将在此 Profisee 部署期间使用它自行执行一些操作。 若要创建服务主体,请像在上一步中一样创建应用程序,然后创建应用程序密码。 保存应用程序的对象 ID,以及创建的密钥的值供以后使用。

    • 向此服务主体(使用名称或对象 ID 来定位)授予对你的 Microsoft Purview 帐户根集合的“数据管护者”权限。
  5. 转到 https://github.com/Profisee/kubernetes 并选择 Microsoft Purview Azure ARM

    • ARM 模板将使用入口控制器在负载均衡的 AKS(Azure Kubernetes 服务)基础结构上部署 Profisee。
    • 自述文件包括故障排除步骤。
    • 仔细阅读所有步骤并排查 Wiki 页面问题。
  6. 选择“部署到 Azure”

    部署到 Azure

    • 配置器向导将请求输入,如下所示 - 使用 ARM 模板部署 AKS 群集
    • 在步骤 1 中授予托管标识权限时,请确保在部署中提供完全相同的 RG(资源组)。
  7. 部署完成后,选择 Microsoft Purview“转到资源组”并打开 Profisee AKS 群集。

典型的 Microsoft Purview 阶段 - Profisee 部署运行

  1. 在“基本信息”页上,选择之前创建的用户分配的托管标识来部署资源。

  2. 对于 Profisee 配置,可以将信息存储在 Key Vault 中,或在部署期间提供详细信息。

    1. 选择你的 Profisee 版本,提供管理员用户帐户和许可证。
    2. 选择以使用 Microsoft Purview 进行配置。
    3. 对于“应用程序注册客户端 ID”,请为之前创建的应用程序注册提供应用程序(客户端)ID
    4. 选择你的 Microsoft Purview 帐户。
    5. 添加之前创建的服务主体的对象 ID。
    6. 添加为该服务主体创建的密钥的值。
    7. 为 Web 应用程序命名。

    Azure ARM 向导的“Profisee”页的屏幕截图,所有值都已填写。

  3. 在“Kubernetes”页上,可根据需要选择较旧版本的 Kubernetes,但请将字段留空以部署最新版本。

    ARM 部署向导中 Kubernetes 配置页的屏幕截图,配置了最小标准大小和默认网络设置。

    提示

    在大多数情况下,将版本字段留空就足够了,除非有理由需要专门使用较旧版本的 Kubernetes AKS 进行部署。

  4. 在存储配置页上,可以选择创建新的存储帐户或使用现有存储帐户。 如果选择现有帐户,则需要提供访问密钥和现有文件共享的名称。

    ARM 部署向导中存储帐户页的屏幕截图,其中提供了详细信息。

  5. 在网络配置页上,选择使用默认 Azure DNS 或提供你自己的 DNS 主机名。

    提示

    建议使用“是的,使用默认 Azure DNS”配置。 选择“是”,部署程序会自动创建 HTTP/TLS 的 Let's Encrypt 证书。 如果选择“否”,则需要提供各种网络配置参数和自己的 HTTPS/TLS 证书。

    ARM 部署“网络”页的屏幕截图,其中选中了“是的,使用默认 Azure DNS”。

    警告

    默认 Azure DNS URL(例如 URL="https://purviewprofisee.chinanorth3.chinacloudapp.cn/profisee") 将由 ARM 模板部署向导从 Profisee 提供的许可证文件中获取。 如果打算进行更改而不使用默认的 Azure DNS,请确保将完整的 DNS 和 Profisee DNS 的完全限定 URL 传达给 Profisee 支持团队,以便他们可以重新生成并提供更新的许可证文件。 否则将导致 Profisee 安装出现故障。

  6. 在“查看 + 创建”页上,查看详细信息,以确保它们是正确的,同时向导会验证你的配置。 通过验证后,选择“创建”。

    ARM 部署向导的“查看 + 创建”页的屏幕截图,显示所有详细信息,页面顶部带有验证通过标志。

  7. 需要大约 45-50 分钟此部署才能完成安装 Profisee。 在部署期间,你将看到正在进行的方面,并且可以刷新页面以查看进度。 全部完成后,部署将显示为完成。 完成“InstallProfiseePlatform”阶段还表示部署已完成!

    Profisee Azure ARM 向导部署进度的屏幕截图,显示中等进度。

    Profisee Azure ARM 向导部署进度的屏幕截图,显示已完成进度。

  8. 部署完成后,打开在其中部署集成的资源组。

    在其中部署 Profisee 资源的资源组的屏幕截图,其中突出显示了部署脚本。

  9. 在“输出”下,获取最终部署 URL。 需要在浏览器地址栏上粘贴最终 WEBURL,然后开始享受 Profisee-Purview 集成! 获取许可证文件时,你提供给 Profisee 支持的 URL 将与此 URL 相同。 除非选择更改 URL 格式,否则其类似于 "https://[profisee_name].[region].chinacloudapp.cn/profisee/"

    部署脚本输出的屏幕截图,显示突出显示的“输出”中的部署 WEB URL。

  10. 通过安装 FastApp,将数据填充并水化到新安装的 Profisee 环境中。 转到 Profisee 部署 URL,然后选择“/Profisee/api/client”。 它应该类似于 - "https://[profisee_name].[region].chinacloudapp.cn/profisee/api/client"。 选择“Profisee FastApp 工作室”实用工具和“Profisee Platform 工具”的下载链接。 在本地客户端计算机上安装这两个工具。

    Profisee 客户端工具下载的屏幕截图,其中突出显示了下载链接。

  11. 登录 FastApp 工作室,并执行 Profisee 的 MDM 管理和配置管理的其余部分。 使用安装期间提供的管理员电子邮件地址登录后,应能够在 Profisee FastApp 工作室的左侧窗格中看到管理菜单。 导航到这些菜单,使用 FastApp 工具执行 MDM 旅程的其余部分。 若能够看到如下图所示的管理菜单,则可确认已在 Azure 平台上成功安装 Profisee。

    登录 Profisee FastApp 工作室后的屏幕截图,显示已选中的帐户和团队菜单,并且突出显示了 FastApps 链接。

  12. 为了确保成功进行安装并检查 Profisee 是否已成功连接到 Microsoft Purview 实例,请完成最后的验证步骤,即转到 /Profisee/api/governance/health。它应该类似于“https://[profisee_name].[region].chinacloudapp.cn//Profisee/api/governance/health”。 输出响应将针对所有 Microsoft Purview 子系统指示“"Status": "Healthy"”。

{
  "OverallStatus": "Healthy",
  "TotalCheckDuration": "0:XXXXXXX",
  "DependencyHealthChecks": {
    "purview_service_health_check": {
      "Status": "Healthy",
      "Duration": "00:00:NNNN",
      "Description": "Successfully connected to Purview."
    },
    "governance_service_health_check": {
      "Status": "Healthy",
      "Duration": "00:00:NNNN",
      "Description": "Purview cache loaded successfully. 
      Total assets: NNN; Instances: 1; Entities: NNN; Attributes: NNN; Relationships: NNN; Hierarchies: NNN"
    },
    "messaging_db_health_check": {
      "Status": "Healthy",
      "Duration": "00:00:NNNN",
      "Description": null
    },
    "logging_db_health_check": {
      "Status": "Healthy",
      "Duration": "00:00:NNNN",
      "Description": null
    }
  }
}

与上述类似的输出响应可确认安装成功,完成所有部署步骤;验证 Profisee 是否已成功连接到 Microsoft Purview,并指示两个系统能够正常通信。

后续步骤