设置 Azure HPC 或 AI VM

本操作指南介绍了如何为装有 NVIDIA 或 AMD GPU 的 HPC 和 AI 创建基础 Azure 虚拟机 (VM)。 这些 VM 大小适用于需要高性能计算(HPC 大小)或 GPU 加速计算(AI 大小)的工作负荷。

选择 VM 大小

Azure VM 有许多不同的选项,亦称为 VM 大小。 适用于 HPCGPU 优化计算的 VM 大小有不同系列。

并非所有 Azure 产品都适用于全部 Azure 区域。 有关详细信息,请参阅当前可用 Azure 产品(按区域分)的列表。

创建 VM

在部署工作负荷之前,需要通过 Azure 门户创建 VM。

根据 VM 的操作系统,查看 Linux VM 快速入门Windows VM 快速入门。 然后,创建具有以下设置的 VM:

  1. 对于“订阅”,请选择要用于此 VM 的 Azure 订阅。

  2. 对于“区域”,请根据可用于 VM 大小的容量,选择区域。

  3. 对于“映像”,选择在上一部分中选择的 VM 映像。

    备注

    例如,本指南使用的图像为“适用于 AI 和 HPC v21.04.1 第 1 代的 NVIDIA GPU 优化图像”。 如果使用的是其他映像,可能需要安装其他软件,如 NVIDIA 驱动程序和 Docker,然后再继续。

  4. 对于“大小”,请选择 HPC 或 GPU 实例类型。 有关详细信息,请参阅如何选择 VM 大小

  5. 对于“SSH 公钥”,请选择“生产新密钥对”。

  6. 等待密钥验证完成。

  7. 出现提示时,选择“下载私钥和创建资源”。

    备注

    需要下载密钥对才能通过 SSH 连接到 VM,以便稍后配置。

  8. 对于“密钥对名称”,请输入密钥对的名称。

  9. 在“网络”选项卡下,确保已禁用“加速网络”。

  10. (可选)将数据磁盘添加到 VM。 有关详细信息,请参阅如何将数据磁盘添加到 Linux VMWindows VM

    备注

    添加数据磁盘有助于存储模型、数据集和其他必要的组件以进行基准测试。

  11. 选择“查看 + 创建”以创建 VM。

连接到 VM

使用 SSH 连接到新 VM,这允许执行进一步的配置。 一些连接方法包括:

设置 VM

为 HPC 或 AI 工作负荷设置新的虚拟机。 安装最新版 NVIDIA 或 AMD GPU 驱动程序,该驱动程序映射到你的 VM 大小。

后续步骤