在 Microsoft Purview 中连接到 Azure Cosmos DB for SQL API

本文概述了在 Microsoft Purview 中注册和扫描 Azure Cosmos DB for SQL API 实例的过程,包括对 Azure Cosmos DB 数据库源进行身份验证以及与其交互的说明

支持的功能

元数据提取 完全扫描 增量扫描 限定范围扫描 分类 访问策略 沿袭
否**

** 如果数据集用作数据工厂复制活动中的源/接收器,则支持世系

先决条件

注册

本部分介绍如何注册 Azure Cosmos DB for SQL API 实例,并设置适当的身份验证机制以确保成功扫描数据源。

注册步骤

在为数据源设置扫描之前,务必在 Microsoft Purview 中注册数据源。

  1. 使用以下方法打开 Microsoft Purview 治理门户:

  2. 导航到“数据映射”-->“集合”

    导航到数据映射中的源链接的屏幕截图

  3. 使用“集合”菜单创建集合层次结构,并根据需要为各个子集合分配权限

    显示用于创建集合层次结构的“集合”菜单的屏幕截图

  4. 导航到“源”菜单下的相应集合,然后选择“注册”图标以注册新的 Azure Cosmos DB 数据库

    显示用于注册数据源的集合的屏幕截图

  5. 选择 Azure Cosmos DB for SQL API 数据源,然后选择继续

    允许选择数据源的屏幕截图

  6. 为数据源提供合适的名称,选择相关的 Azure 订阅、Cosmos DB 帐户名称和集合,然后选择“应用”

    显示为了注册数据源而要输入的详细信息的屏幕截图

  7. “Azure Cosmos DB 数据库”存储帐户将显示在所选集合下

    显示映射到集合以启动扫描的数据源的屏幕截图

扫描

针对扫描的身份验证

为了获取扫描数据源所需的访问权限,需要在 Azure Cosmos DB 数据库存储帐户中配置身份验证方法。

只有一种方法可以设置 Azure Cosmos DB 数据库的身份验证:

帐户密钥 - 可以在 Azure 密钥保管库中创建机密以存储凭据,使 Microsoft Purview 有权使用机密安全地扫描数据源。 机密可以是存储帐户密钥、SQL 登录密码或某个密码。

注意

需要在订阅中部署一个 Azure 密钥保管库资源,并为 Microsoft Purview 帐户的 MSI 分配对 Azure 密钥保管库中的机密的所需访问权限。

使用帐户密钥进行扫描

需要获取你的访问密钥并将其存储在密钥保管库中:

  1. 导航到你的 Azure Cosmos DB 数据库存储帐户

  2. 选择“设置”>“密钥”

    显示存储帐户中的访问密钥的屏幕截图

  3. 复制你的密钥,并将其单独保存以便在后续步骤中使用

    显示要复制的访问密钥的屏幕截图

  4. 导航到你的密钥保管库

    显示密钥保管库的屏幕截图

  5. 选择“设置”>“机密”,然后选择“+ 生成/导入”

    显示用于生成机密的密钥保管库选项的屏幕截图

  6. 输入与存储帐户中的密钥相同的名称和值,然后选择“创建”以完成操作

    显示用于输入机密值的密钥保管库选项的屏幕截图

  7. 如果密钥保管库尚未连接到 Microsoft Purview,则需要创建新的密钥保管库连接

  8. 最后,使用密钥创建新凭据来设置扫描。

创建扫描

  1. 打开你的 Microsoft Purview 帐户并选择“打开 Microsoft Purview 治理门户”

  2. 导航到“数据映射”--“源”,查看集合层次结构

  3. 选择前面注册的“Azure Cosmos 数据库”下的“新建扫描”图标

    显示用于创建新扫描的屏幕的屏幕截图

  4. 为扫描提供名称。

  5. 如果源是公开访问的,请选择 Azure 集成运行时,如果源位于专用虚拟网络中,则选择自承载集成运行时。 有关要使用哪种集成运行时的详细信息,请参阅 选择正确的集成运行时配置一文。

  6. 选择适当的扫描集合,然后选择“凭据”下的“+ 新建”

    显示用于扫描的帐户密钥选项的屏幕截图

  7. 选择创建帐户密钥时使用的相应密钥保管库连接和机密名称 。 选择“帐户密钥”作为身份验证方法

    显示帐户密钥选项的屏幕截图

  8. 选择“测试连接”。 连接成功后,选择“继续”

    显示测试连接成功的屏幕截图

限定扫描范围并运行扫描

  1. 可以选择列表中适当的项,以便将扫描范围限定在特定的文件夹和子文件夹。

    限定扫描范围

  2. 然后选择扫描规则集。 可以在系统默认项和现有的自定义规则集之间选择,或者可以以内联方式创建新规则集。

    扫描规则集

    新建扫描规则

  3. 可以选择要包含在扫描规则中的分类规则

    扫描规则集分类规则

    扫描规则集选项

  4. 选择扫描触发器。 可以设置一个计划或运行一次扫描。

    扫描触发器

  5. 查看扫描并选择“保存并运行”。

    检查扫描

查看扫描

  1. 导航到“集合”中的“数据源”,然后选择“查看详细信息”以检查扫描状态

    查看扫描

  2. 扫描详细信息在“上次运行状态”中指示扫描进度,并会指示已扫描和已分类的资产数量

    查看扫描详细信息

  3. 整个扫描成功运行后,“上次运行状态”将更新为“正在进行”,然后更新为“已完成”

    查看正在进行的扫描

    查看已完成的扫描

管理扫描

可以管理扫描,或者在完成时再次运行扫描。

  1. 选择“扫描名称”即可管理扫描

    管理扫描

  2. 可以再次运行扫描、编辑扫描或删除扫描

    管理扫描选项

  3. 可以再次运行完整扫描

    完整扫描

后续步骤

现在,你已经注册了源,接下来请按照以下指南来详细了解 Microsoft Purview 和你的数据。