将 HPC 基础结构从本地环境迁移到云时,需要考虑各个方面。 本文档提供了有关如何在云中创建此类 HPC 环境的指导。 建议采用两阶段方法。 首先是概念验证,然后是生产级环境。 在生产环境启动并运行后,随着时间的推移,只应修改某些组件,包括更改 VM 类型和存储功能,以最好地满足用户、项目和业务不断变化的需求。
本文和以下文章将指导你完成产品级环境迁移。
先决条件
你需要一个 Azure 订阅来预配云资源。
从本地迁移到云:生产级别
在概念证明阶段之后,需要规划才能准备好创建生产级 HPC 环境。 此新环境可以表示本地基础设施的一部分(例如,来自集群组的高性能计算(HPC)集群,或现有集群的队列/分区),或者表示整个计算能力。
由于组件依赖项,此 HPC 云环境的部署基于一系列部署,其中包括:
- 基本基础结构,包括创建资源组、网络访问和网络安全规则;
- 基本服务,包括身份管理、作业调度器和资源规划器及其各自的配置;
- 存储;
- 计算节点规格
- 最终用户入口点。
在以下文章中,我们将介绍每个部署步骤和所涉及的组件。 在组件的说明中,我们更详细地强调了它们的相关依赖项。 值得注意的是,可以通过多种方式执行组件部署步骤。 我们提供了一些提示来帮助通过 Azure 门户开始使用部署组件。 但在生产级别,我们建议创建利用基础结构即代码的环境部署器(例如,通过 bicep、Terraform 或 Azure CLI)。 通过这样做,可以采用自动化和可复制的方式创建环境。
对于每个步骤,在开始迁移过程之前,需要评估某些主题。