Compartilhar via

在 Azure Data Factory 中复制或克隆数据工厂

适用于: Azure Data Factory Azure Synapse Analytics

本文介绍如何在 Azure Data Factory 中复制或克隆数据工厂。

克隆数据工厂的用例

以下是一些您可能会发现复制或克隆数据工厂很有用的情况:

  • 将数据工厂移到新区域。 若要将数据工厂移到其他区域,最佳方法是在目标区域中创建副本,并删除现有数据工厂。

  • 重命名数据工厂。 Azure不支持重命名资源。 若要重命名数据工厂,可以使用其他名称克隆该数据工厂,然后删除现有数据工厂。

  • 调试更改,在调试功能不足时进行。 在大多数情况下,可以使用调试。 在其他情况下,在克隆的沙盒环境中测试更改会更有意义。 例如,当触发器在文件到达时触发而不是翻转时间窗口时,参数化 ETL 管道的行为方式可能无法通过调试轻松进行测试。 在这些情况下,你可能想要克隆用于试验的沙盒环境。 由于Azure Data Factory主要按运行次数收费,第二个工厂不会导致任何额外费用。

如何克隆数据工厂

  1. 作为先决条件,首先需要从Azure门户创建目标数据工厂。

  2. 如果你处于 Git 模式:

    1. 每次从门户发布时,工厂的 Resource Manager 模板都会保存在 adf_publish 分支中的 Git 仓库中。
    2. 将新工厂连接到同一存储库,并从 adf_publish 分支进行构建。 资源(如管道、数据集和触发器)将继续保留
  3. 如果你处于实时模式:

    1. 使用数据工厂 UI 可将数据工厂的整个有效负载导出到Resource Manager模板文件和参数文件中。 可以通过门户中的 ARM 模板\导出资源管理器模板按钮访问。
    2. 你可以对参数文件进行适当的更改,将新工厂的参数替换为新的值。
    3. 接下来,可以通过标准Resource Manager模板部署方法部署它。 有关详细步骤,请参阅 使用 ARM 模板部署资源
  4. 如果源工厂中有 SelfHosted IntegrationRuntime(自托管集成运行时),则需要在目标工厂中使用相同的名称预先创建它。 如果要在不同工厂之间共享 SelfHosted Integration Runtime,可以使用发布在此处的 SelfHosted IR 共享模式。

  5. 出于安全原因,生成的Resource Manager模板不包含任何机密信息,例如链接服务的密码。 因此,你需要提供凭据作为部署参数。 如果手动输入凭据不适合设置,请考虑改为从Azure Key Vault检索连接字符串和密码。 详细查看

查看在 使用 Azure Data Factory UI 创建数据工厂