Azure Stack Hub 支持将图形处理单元(GPU)添加到现有的 Azure Stack Hub 系统。 必须咨询硬件合作伙伴,以验证系统是否已验证并可以支持 GPU。
在 Azure Stack Hub 中,物理服务器也称为 缩放单元节点。 属于单个缩放单元成员的所有缩放单元节点必须具有相同的类型和 GPU 数量。
注释
在继续之前,请查阅您的硬件制造商文档,查看制造商是否支持该系统中的GPU,以及如何订购这些组件。 OEM 硬件供应商支持合同可能需要供应商执行安装。
概述
以下流程展示了向每个缩放单元节点添加内存的常规步骤:
每个 GPU VM 只能从单个节点使用 GPU,GPU VM 不会自动进行负载均衡。 例如,每个节点上有 4 个节点和 2 个 GPU,为每个 VM 创建 4 个具有 1 个 GPU 的 VM。 每个 VM 可以存在于不同的节点上。 如果发生这种情况,则任何单个节点只剩下 1 个可用的 GPU。 在门户中,可以看到有 4 个 GPU 可用。 但是,如果尝试创建具有 2 个 GPU 的 VM,它将失败,GPU 容量不足,因为没有单个节点有 2 个 GPU 可用。 解决方案是先创建包含 2 个 GPU 的 VM。
升级 GPU 或添加到现有节点
以下部分简要概述了添加 GPU 的过程。
警告
请勿在参考 OEM 提供的文档的情况下执行这些步骤。
- 必须关闭整个缩放单元,因为不支持滚动 GPU 升级。 请按照 《启动和停止 Azure Stack Hub》 一文中所述的步骤停止 Azure Stack Hub。
- 使用硬件制造商的文档在每个物理计算机上添加或升级内存。
- 使用 “启动”和“停止 Azure Stack Hub”中的步骤启动 Azure Stack Hub。
更改 GPU 分区大小
Azure Stack Hub 支持 AMD MI25 的 GPU 分区。 使用 GPU 分区,可以使用虚拟 GPU 实例增加虚拟机的密度。 可以更改分区大小以满足特定的工作负荷要求。 默认情况下,Azure Stack Hub 使用最大的分区大小(1/8)提供具有 2 GB 帧缓冲区的最高可能密度。 此分区对于需要加速图形应用程序和虚拟桌面的工作负荷非常有用。
若要更改分区大小,请执行以下步骤:
取消分配当前使用 GPU 的所有 VM。
确保已安装适用于 Azure Stack Hub 的 PowerShell Az 模块 。
将 PowerShell 连接到管理员 Azure 资源管理器终结点。
运行以下 PowerShell cmdlet:
首先确定要更新的规模单元的名称:
Get-AzsScaleUnit # Returns a list of information about scale units in your stamp
使用上一步返回的“
$partitionSize
”值来更新以下变量:$scaleUnitName
和,然后运行以下命令以更新缩放单元分区大小。$partitionSize = 4 # Specify the partition size (1, 2, 4, 8) $scaleUnitName = "contoso/cluster" # Specify the scale unit name Set-AzsScaleUnit -Name $scaleUnitName -NumberOfGPUPartition $partitionSize
$partitionSize
支持的值有:价值 DESCRIPTION 8 (默认值) 物理 GPU 的 1/8。 4 物理 GPU 的 1/4。 2 物理 GPU 的 1/2。 1 整个物理 GPU。
注释
不支持调整 GPU VM 的大小。