将 HDInsight 群集迁移到较新版本

若要利用最新的 HDInsight 功能,建议将 HDInsight 群集定期迁移到最新版本。 HDInsight 不支持将现有群集升级到较新组件版本的就地升级。 必须使用所需的组件和平台版本创建新群集,然后迁移应用程序以使用新群集。 按照以下准则迁移 HDInsight 群集版本。

备注

有关支持的 HDInsight 版本的信息,请参阅 HDInsight 组件版本

迁移任务

升级 HDInsight 群集的工作流如下所示。

升级工作流示意图

  1. 请阅读本文档的每个部分,了解在升级 HDInsight 群集时可能需要进行的更改。
  2. 创建群集作为测试/质量保证环境。 有关创建群集的详细信息,请参阅了解如何创建基于 Linux 的 HDInsight 群集
  3. 将现有作业、数据源及接收器复制到新环境。
  4. 执行验证测试,以确保作业在新群集上按预期工作。

验证一切都按预期工作后,请为迁移安排停机时间。 在此停机期间,请执行以下操作:

  1. 备份所有存储在本地群集节点上的暂时性数据。 例如,如果数据直接存储在头节点上。
  2. 删除现有群集
  3. 使用前一群集使用的同一默认数据存储在具有最新(或支持)的 HDI 版本的同一 VNET 子网中创建群集。 这样,新群集便可针对现有生产数据继续运行。
  4. 导入任何已备份的暂时性数据。
  5. 使用新群集启动作业/继续处理。

特定于工作负载的指南

以下文档提供有关如何迁移特定工作负载的指南:

备份和还原

有关数据库备份和还原的详细信息,请参阅使用自动数据库备份在 Azure SQL 数据库中恢复数据库

后续步骤