Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
适用于:
Azure 数据工厂
Azure Synapse Analytics
如果要将 Data Lake 或企业数据仓库(EDW)迁移到Azure,请考虑使用Azure 数据工厂。 Azure 数据工厂非常适合以下方案:
- 大数据工作负荷从 Amazon 简单存储服务(Amazon S3)或本地 Hadoop 分布式文件系统(HDFS)迁移到Azure
- 从 Oracle Exadata、Netezza、Teradata 或 Amazon Redshift 迁移企业数据仓库 (EDW) 到 Azure
Azure 数据工厂 可以移动 PB 级的数据进行数据湖迁移,以及移动数十 TB 的数据用于数据仓库迁移。
为什么Azure 数据工厂可用于数据迁移
- Azure 数据工厂可以轻松纵向扩展处理能力,以无服务器方式移动数据,具有高性能、复原能力和可伸缩性。 你只需为使用的资源付费。 另请注意下列事项:
- Azure 数据工厂对数据量或文件数没有限制。
- Azure 数据工厂可以充分利用您的网络和存储带宽,以实现环境中数据移动的最高吞吐量。
- Azure 数据工厂使用预付费方法,以便仅支付实际用于运行数据迁移到Azure的时间。
- Azure 数据工厂可以同时执行一次性历史负载和计划的增量加载。
- Azure 数据工厂 使用 Azure 集成运行时(IR)在可公开访问的数据湖和仓库终结点之间移动数据。 它还可以使用自承载 IR 在 Azure 虚拟网络(VNet)或防火墙后面传输数据湖和数据仓库终结点的数据。
- Azure 数据工厂具有企业级安全性:可以使用Windows安装程序(MSI)或服务标识进行安全的服务到服务集成,或使用Azure 密钥保管库进行凭据管理。
- Azure 数据工厂提供无代码创作体验和丰富的内置监视仪表板。
联机与脱机数据迁移
Azure 数据工厂是一种标准联机数据迁移工具,用于通过网络(Internet、ER 或 VPN)传输数据。 使用脱机数据迁移时,用户实际将数据传输设备从其组织寄送到Azure数据中心。
在联机与脱机迁移方法之间选择时,请注意三个要点:
- 要迁移的数据大小
- 网络带宽
- 迁移时限
例如,假设你计划使用 Azure 数据工厂 在两周内完成数据迁移(迁移窗口)。 请注意下表中的粉红色/蓝色切割线。 在任意给定列中,最下方的粉红色单元格显示数据大小与网络带宽的配对,其迁移时间窗口最接近但不到两周。 (蓝色单元格中的任何大小/带宽对的联机迁移时限超过两周。)
此表可帮助你根据数据和可用网络带宽的大小确定能否通过联机迁移(Azure 数据工厂)满足预期迁移窗口。 如果联机迁移时限超过两周,则需要使用脱机迁移。
注意
使用联机迁移,可以通过一个工具端到端地实现历史数据加载和增量馈送。 通过此方法,数据在整个迁移时限内可在现有存储与新存储之间保持同步。 这意味着,可以使用刷新的数据在新存储中重新生成 ETL 逻辑。