Microsoft Purview 自动化最佳做法
尽管 Microsoft Purview 治理解决方案提供现成的 Microsoft Purview 治理门户用户体验,但并非所有任务都适合图形用户体验的可点击性质。
例如:
- 触发扫描以在自动化过程中运行。
- 实时监视元数据更改。
- 构建自己的自定义用户体验。
Microsoft Purview 提供了多种工具,可用于以自动化和编程方式与基础平台进行交互。 由于 Microsoft Purview 服务的开放性质,我们可实现从控制平面(可通过 Azure 资源管理器访问)到 Microsoft Purview 的多数据平面(目录、扫描、管理等)等不同方面的自动化。
本文总结了可用的选项以及有关何时使用何种工具的指导。
工具
工具类型 | 工具 | 方案 | 管理 | 目录 | 扫描 | 日志 |
---|---|---|---|---|---|---|
资源管理 | 基础结构即代码 | ✓ | ||||
命令行 | 交互 | ✓ | ||||
命令行 | 交互 | ✓ | ✓ | |||
API | 按需 | ✓ | ✓ | ✓ | ||
流式传输 (Apache Atlas) | 实时 | ✓ | ||||
Monitoring | 监视 | ✓ | ||||
SDK | 自定义开发 | ✓ | ✓ | ✓ |
命令行
Azure CLI 和 Azure PowerShell 都是命令行工具,可用于管理 Azure 资源,例如 Microsoft Purview。 虽然列表中的命令会随着时间的推移而增多,但当前只有一部分 Microsoft Purview 控制平面操作可用。 有关当前可用命令的最新列表,请查看文档 (Azure CLI | Azure PowerShell)。
- Azure CLI - 允许使用交互式命令行提示符或脚本通过终端执行命令的跨平台工具。 Azure CLI 有一个 Microsoft Purview 扩展,可用于管理 Microsoft Purview 帐户。 例如,
az purview account
。 - Azure PowerShell - 一个跨平台任务自动化程序,由一组用于管理 Azure 资源的 cmdlet 组成。 Azure PowerShell 有一个模块叫做“Az.Purview”,可用于管理 Microsoft Purview 帐户。 例如,
Get-AzPurviewAccount
。
何时使用?
- 最适合临时任务和快速探索操作。
API
REST API 是呈现不同方法(POST
、GET
、PUT
、DELETE
)的 HTTP 终结点,会触发创建、读取、更新或删除 (CRUD) 等操作。 Microsoft Purview 通过多个服务终结点公开 Microsoft Purview 平台的大部分内容。
何时使用?
- 无法通过 Azure CLI、Azure PowerShell 或本机客户端库使用必需的操作。
- 自定义应用程序开发或流程自动化。
流式传输 (Apache Atlas)
每个 Microsoft Purview 帐户都可以配置可通过其 Atlas Kafka 终结点访问的事件中心。
注意
启用此事件中心命名空间确实会产生命名空间费用。 有关具体详细信息,请参阅定价页。
启用命名空间后,可使用来自事件中心的消息来监视 Microsoft Purview 事件。 外部系统还可使用事件中心在事件发生时将其发布到 Microsoft Purview。
- 使用事件 - Microsoft Purview 会将有关元数据更改的通知发送到 Kafka 主题 ATLAS_ENTITIES。 对元数据更改感兴趣的应用程序可以监视这些通知。 支持的操作包括:
ENTITY_CREATE
、ENTITY_UPDATE
、ENTITY_DELETE
、CLASSIFICATION_ADD
、CLASSIFICATION_UPDATE
、CLASSIFICATION_DELETE
。 - 发布事件 - Microsoft Purview 可通过传给 Kafka 主题 ATLAS_HOOK 的通知来获知元数据更改的信息。 支持的操作包括:
ENTITY_CREATE_V2
、ENTITY_PARTIAL_UPDATE_V2
、ENTITY_FULL_UPDATE_V2
、ENTITY_DELETE_V2
。
何时使用?
- 需要实时发布或使用 Apache Atlas 事件的应用程序或进程。
监视
Microsoft Purview 可通过“诊断设置”将平台日志和指标发送到一个或多个目标位置(Log Analytics 工作区、存储帐户或 Azure 事件中心)。 可用指标包括 Data Map Capacity Units
、Data Map Storage Size
、Scan Canceled
、Scan Completed
、Scan Failed
和 Scan Time Taken
。
配置好后,Microsoft Purview 自动将这些事件作为 JSON 有效负载发送到目标位置。 然后,需要使用这些事件并针对它们采取行动的应用程序订阅者就可以通过编排下游逻辑选项来执行相应的操作。
何时使用?
- 需要使用诊断事件的应用程序或进程。
SDK
Microsoft 提供 Azure SDK,可用于以编程方式管理 Azure 服务并与之交互。 Microsoft Purview 客户端库有多种语言(.NET、Java、JavaScript 和 Python)版本,具有一致性、易于使用,并且符合使用习惯。
何时使用?
- 当本地客户端库(如果可用)将遵循与开发人员觉得自然的目标语言相符的标准编程语言约定时,推荐使用 SDK 而非 REST API。