为你的方案选择适当的集成运行时配置
集成运行时 (IR) 是一种计算基础结构,由 Microsoft Purview 用于跨不同网络环境进行数据扫描。 本文介绍 Microsoft Purview 中提供的不同类型的集成运行时,并提供有关如何为方案选择合适的集成运行时配置的指导。
集成运行时的类型
Microsoft Purview 提供以下类型的集成运行时:
- Azure 集成运行时:Azure 集成运行时是完全托管的弹性计算,可用于扫描 Azure 或非 Azure 数据源。 Azure IR 支持使用可公开访问的终结点连接到数据存储和计算服务。 它是默认的集成运行时,无需创建任何内容即可开始使用。
- 自承载集成运行时:自承载集成运行时可用于扫描本地网络或虚拟网络中的数据源。 可以将其安装在本地计算机或专用网络内的虚拟机上。 有关详细信息,请参阅创建和管理自承载集成运行时。
- Kubernetes 支持的自承载集成运行时(预览版):此集成运行时托管在 Kubernetes 群集上,可用于扫描本地网络或虚拟网络中的数据源。 Kubernetes 支持可提高整体性能,并允许集成运行时与作业一起缩放。 在创建和管理 Kubernetes 支持的自承载集成运行时中了解详细信息
选择正确的集成运行时
选择适当的集成运行时类型很重要。 它不仅必须适合你现有的体系结构和要求以进行数据集成,同时,你还需要考虑如何进一步满足不断增长的业务需求和将来增加的工作负载。
以下考虑事项可帮助你做出决策:
要扫描哪些数据源类型?
请查看支持的数据源部分,了解要扫描的数据源支持的 IR 类型。
数据源的网络访问控制是什么?
不同的数据源(可以是本地或云/SaaS 数据存储)可能有不同的网络防火墙设置,以保护其免遭通过 Internet 进行的随机访问。 下表列出了一些常用的防火墙选项。 可以根据自己的方案选择支持的 IR 类型。
数据源防火墙 受 Azure IR 支持 受 SHIR 支持 允许公共访问 ✓ ✓ 允许 Azure 服务或受信任的服务 ✓ 允许从特定 Azure 虚拟网络进行访问 ✓ 允许特定 IP/IP 范围 ✓ 其他本地或专用网络访问 ✓ 你的 Microsoft Purview 防火墙设置是什么?
Microsoft Purview 提供不同的网络防火墙选项。 有关详细信息,请参阅配置 Microsoft Purview 防火墙。 可以根据自己的方案选择支持的 IR 类型。
Purview 防火墙 受 Azure IR 支持 受 SHIR 支持 已从所有网络启用 ✓ ✓ 已从所有网络禁用 ✓(需要从你的网络创建专用终结点) 数据传输期间需要哪种级别的安全性?
集成运行时位置定义其后端计算的位置以及执行扫描操作的位置。 出于数据驻留考虑:
- 使用 Azure IR 时,Microsoft Purview 会自动检测数据源的位置并使用该区域中的 IR。 如果 Microsoft Purview 无法检测到该区域,则其使用 Purview 帐户所属的区域。
- 使用托管 VNet IR 时,它在为托管虚拟网络配置的区域中运行。
- 使用 SHIR 时,可由你完全决定本地或 Azure 虚拟机中的位置。
例如,为了在数据传输过程中防范中间人攻击,可以选择使用专用终结点和专用链接来确保数据安全。
- 使用托管 VNet IR 时,可以为数据存储创建托管专用终结点。 专用终结点由托管虚拟网络中的 Microsoft Purview 服务维护。
- 还可以在虚拟网络中创建专用终结点,SHIR 可以使用它们来访问数据存储。
你能够提供什么级别的维护?
维护基础结构、服务器和设备是企业 IT 部门的重要任务之一。 这通常需要大量的时间和精力。
- 使用 Azure IR 和托管 VNet IR 时,无需担心更新、修补和版本控制等维护工作。 Microsoft Purview 服务负责所有维护工作。
- 由于 SHIR 安装在计算机上,并且 Kubernetes 支持的 SHIR 位于 Kubernetes 群集上,因此需要管理维护。
- SHIR 支持自动更新,只要有更新,就会自动获取最新版本。 有关详细信息,请参阅自承载集成运行时自动更新和过期。
- 目前,Kubernetes 支持的自承载集成运行时仅支持手动更新。
性能和可伸缩性
建议在适用时使用完全托管和自动缩放的 Azure IR、托管 VNet IR 或 Kubernetes 支持的自承载集成运行时。 借助弹性,它们可提供更好的性能和可伸缩性,尤其是在扫描大规模数据系统时。
支持的数据源
下表显示了 Microsoft Purview 扫描支持的所有数据源以及支持的集成运行时类型。
类别 | 支持的数据存储 | 受 Azure IR/AWS IR 支持 | 受 SHIR 支持 | |
---|---|---|---|---|
Azure | 多个源 | ✓ | ||
Azure Blob 存储 | ✓ | ✓ | ||
Azure Cosmos DB (API for NoSQL) | ✓ | ✓ | ||
Azure 数据资源管理器 | ✓ | ✓ | ||
Azure Data Lake Storage Gen1 | ✓ | ✓ | ||
Azure Data Lake Storage Gen2 | ✓ | ✓ | ||
Azure Database for MySQL | ✓ | ✓ | ||
Azure Database for PostgreSQL | ✓ | ✓ | ||
Azure Databricks Hive 元存储 | ✓ | |||
Azure Databricks Unity Catalog | ✓ | |||
Azure 专用 SQL 池(以前称为 SQL DW) | ✓ | ✓ | ||
Azure 文件 | ✓ | ✓ | ||
Azure SQL 数据库 | ✓ | ✓ | ||
Azure SQL 托管实例 | ✓ | ✓ | ||
Azure Synapse Analytics(工作区) | ✓ | ✓ | ||
Fabric | ✓ | |||
Power BI | ✓ | ✓ |