HBv3 系列虚拟机概述

适用于:✔️ Linux VM ✔️ Windows VM ✔️ 灵活规模集 ✔️ 统一规模集

HBv3 系列服务器具有 2 个 64 核 EPYC 7V73X CPU,总共 128 个物理“Zen3”内核,并采用 AMD 3D V-Cache 技术。 HBv3 上禁用了同时多线程处理技术 (SMT)。 这 128 个核心被分为 16 个分区(每个套接字 8 个),每个分区包含 8 个处理器核心,并且能够均匀访问 96 MB 的 L3 缓存。 Azure HBv3 服务器还运行以下 AMD BIOS 设置:

Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled

因此,服务器启动时有 4 个 NUMA 域(每个插槽各有 2 个)。 每个域的大小为 32 个核心。 每个 NUMA 都可以直接访问 4 个物理 DRAM 通道,速度为 3,200 MT/s。

为了为 Azure 管理程序(Hypervisor)提供空间,我们保留每台服务器的 8 个物理核心,以便不干扰 VM 的运行。

VM 拓扑

下图显示了服务器的拓扑。 我们以对称方式在两个 CPU 插槽上保留这 8 个虚拟机监控程序主机核心(黄色),前 2 个核心来自每个 NUMA 域上特定的 Core Complex Dies (CCD),其余核心用于 HBv3 系列 VM(绿色)。

HBv3 系列服务器的拓扑

CCD 边界不等效于 NUMA 边界。 在 HBv3 上,一组连续的四 (4) 个 CCD 配置为一个 NUMA 域,不论是在主机服务器级别,还是在客户 VM 中。 因此,所有 HBv3 VM 大小都会公开 4 个 NUMA 域,这些域显示在 OS 和应用程序中,如下所示。 4 个统一的 NUMA 域,每个域具有不同数量的内核,具体取决于特定的 HBv3 VM 大小

HBv3 系列 VM 的拓扑

每种大小的 HBv3 VM 与 AMD EPYC 7003 系列中其他 CPU 的物理布局、功能和性能相似,如下所示:

HBv3 系列 VM 大小 NUMA 域 每个 NUMA 域的核心 与 AMD EPYC 相似
Standard_HB120rs_v3 4 30 双插槽 EPYC 7773X
Standard_HB120-96rs_v3 4 24 双插槽 EPYC 7643
Standard_HB120-64rs_v3 4 16 双插槽 EPYC 7573X
Standard_HB120-32rs_v3 4 8 双插槽 EPYC 7373X
Standard_HB120-16rs_v3 4 4 双插槽 EPYC 72F3

注意事项

受约束核心的 VM 大小仅减少向虚拟机显示的物理核心数量。 所有全局共享资产(RAM、内存带宽、L3 缓存、GMI 和 xGMI 连接、InfiniBand、Azure以太网网络、本地 SSD)保持不变。 此功能允许客户选择最适合一组给定工作负荷或软件许可需求的 VM 大小。

每种 HBv3 VM 大小的虚拟 NUMA 映射与基础物理 NUMA 拓扑相映射。 直接显示硬件拓扑,避免使用可能导致误导的抽象。

通过 lstopo 输出显示 HBv3 VM 各种大小的确切拓扑,展示如下:

lstopo-no-graphics --no-io --no-legend --of txt

单击以查看 Standard_HB120rs_v3 的 lstopo 输出

HBv3-120 VM 的 lstopo 输出

单击以查看 Standard_HB120rs-96_v3 的 lstopo 输出

HBv3-96 VM 的 lstopo 输出

单击以查看 Standard_HB120rs-64_v3 的 lstopo 输出

HBv3-64 VM 的 lstopo 输出

单击以查看 Standard_HB120rs-32_v3 的 lstopo 输出结果

HBv3-32 VM 的 lstopo 输出

单击以查看 Standard_HB120rs-16_v3 的 lstopo 输出结果

HBv3-16 VM 的 lstopo 输出

InfiniBand 网络

HBv3 虚拟机还支持 NVIDIA HDR InfiniBand 网络适配器(ConnectX-6),运行速度可达 200 千兆位/秒。网络接口卡通过 SRIOV 直接传递到虚拟机,使得网络流量可以绕过虚拟化的管理程序。 因此,客户会像在裸机环境中一样在 HBv3 VM 上加载标准的 Mellanox OFED 驱动程序。

HBv3 VM 支持自适应路由、动态连接传输(DCT,以及标准 RC 和 UD 传输),并通过 ConnectX-6 适配器的机载处理器实现基于硬件的 MPI 集合运算卸载。 这些功能增强了应用性能、可伸缩性和一致性,我们建议使用。

临时存储

HBv3 VM 具有 3 台物理本地 SSD 设备。 一个设备已预先格式化为页文件,并在 VM 中显示为通用“SSD”设备。

另外两个更大的 SSD 作为无格式块 NVMe 设备提供。 当块状 NVMe 设备绕过虚拟机监控程序时,它们的带宽和 IOPS 更高。 当在条带阵列中配对时,NVMe SSD 可提供高达 7 GB/秒的读取速度和 3 GB/秒的写入速度,以及高达 186,000 IOPS(读取)和 201,000 IOPS(写入)的深度队列深度。

硬件规格

硬件规格 HBv3 系列 VM
核心 120、96、64、32 或 16(已禁用 SMT)
CPU AMD EPYC 7V73X
CPU 频率(非 AVX) 3.0 GHz(所有内核)、3.5 GHz(多达 10 个内核)
内存 448 GB(每个内核的 RAM 依赖于 VM 大小)
本地磁盘 2 个 960 GB NVMe(块存储)、480 GB SSD(页面文件)
Infiniband 200 Gb/s NVIDIA ConnectX-6 HDR InfiniBand
Azure 网络 50 Gb/s (40 Gb/s Azure加速网络)

硬件规格

硬件规格 HBv3 系列 VM
最大 MPI 作业大小 36,000 个核心(单个虚拟机规模集中有 300 个 VM,且 singlePlacementGroup=true)
MPI 支持 HPC-X、OpenMPI、MVAPICH2、MPICH
其他框架 UCX、libfabric、PGAS
Azure 存储支持 标准磁盘和高级磁盘(最多 32 个磁盘)
对 RDMA 的 OS 支持 RHEL 8.3+、AlmaLinux 8.10+、Ubuntu 22.04+ LTS、SLES 15.7+、Windows Server 2022/2025
推荐的性能操作系统 RHEL 9.7、AlmaLinux HPC 9.7、Ubuntu HPC 24.04 LTS、Windows Server 2025
Orchestrator 支持 Azure CycleCloud、Azure Batch、Azure Kubernetes 服务

后续步骤