本操作指南介绍了如何为装有 NVIDIA 或 AMD GPU 的 HPC 和 AI 创建基础 Azure 虚拟机 (VM)。 这些 VM 大小适用于需要高性能计算(HPC 大小)或 GPU 加速计算(AI 大小)的工作负荷。
Azure VM 有许多不同的选项,亦称为 VM 大小。 适用于 HPC 和 GPU 优化计算的 VM 大小有不同系列。
并非所有 Azure 产品都适用于全部 Azure 区域。 有关详细信息,请参阅当前可用 Azure 产品(按区域分)的列表。
在部署工作负荷之前,需要通过 Azure 门户创建 VM。
根据 VM 的操作系统,查看 Linux VM 快速入门或 Windows VM 快速入门。 然后,创建具有以下设置的 VM:
对于“订阅”,请选择要用于此 VM 的 Azure 订阅。
对于“区域”,请根据可用于 VM 大小的容量,选择区域。
对于“映像”,选择在上一部分中选择的 VM 映像。
备注
例如,本指南使用的图像为“适用于 AI 和 HPC v21.04.1 第 1 代的 NVIDIA GPU 优化图像”。 如果使用的是其他映像,可能需要安装其他软件,如 NVIDIA 驱动程序和 Docker,然后再继续。
对于“大小”,请选择 HPC 或 GPU 实例类型。 有关详细信息,请参阅如何选择 VM 大小。
对于“SSH 公钥”,请选择“生产新密钥对”。
等待密钥验证完成。
出现提示时,选择“下载私钥和创建资源”。
备注
需要下载密钥对才能通过 SSH 连接到 VM,以便稍后配置。
对于“密钥对名称”,请输入密钥对的名称。
在“网络”选项卡下,确保已禁用“加速网络”。
(可选)将数据磁盘添加到 VM。 有关详细信息,请参阅如何将数据磁盘添加到 Linux VM 或 Windows VM。
备注
添加数据磁盘有助于存储模型、数据集和其他必要的组件以进行基准测试。
选择“查看 + 创建”以创建 VM。
使用 SSH 连接到新 VM,这允许执行进一步的配置。 一些连接方法包括:
为 HPC 或 AI 工作负荷设置新的虚拟机。 安装最新版 NVIDIA 或 AMD GPU 驱动程序,该驱动程序映射到你的 VM 大小。