管理 GPU 容量

Azure Stack Hub 支持将图形处理单元(GPU)添加到现有的 Azure Stack Hub 系统。 必须咨询硬件合作伙伴,以验证系统是否已验证并可以支持 GPU。

在 Azure Stack Hub 中,物理服务器也称为 缩放单元节点。 属于单个缩放单元成员的所有缩放单元节点必须具有相同的类型和 GPU 数量。

注释

在继续之前,请查阅您的硬件制造商文档,查看制造商是否支持该系统中的GPU,以及如何订购这些组件。 OEM 硬件供应商支持合同可能需要供应商执行安装。

概述

以下流程展示了向每个缩放单元节点添加内存的常规步骤:

添加 GPU 容量流

每个 GPU VM 只能从单个节点使用 GPU,GPU VM 不会自动进行负载均衡。 例如,每个节点上有 4 个节点和 2 个 GPU,为每个 VM 创建 4 个具有 1 个 GPU 的 VM。 每个 VM 可以存在于不同的节点上。 如果发生这种情况,则任何单个节点只剩下 1 个可用的 GPU。 在门户中,可以看到有 4 个 GPU 可用。 但是,如果尝试创建具有 2 个 GPU 的 VM,它将失败,GPU 容量不足,因为没有单个节点有 2 个 GPU 可用。 解决方案是先创建包含 2 个 GPU 的 VM。

升级 GPU 或添加到现有节点

以下部分简要概述了添加 GPU 的过程。

警告

请勿在参考 OEM 提供的文档的情况下执行这些步骤。

  1. 必须关闭整个缩放单元,因为不支持滚动 GPU 升级。 请按照 《启动和停止 Azure Stack Hub》 一文中所述的步骤停止 Azure Stack Hub。
  2. 使用硬件制造商的文档在每个物理计算机上添加或升级内存。
  3. 使用 “启动”和“停止 Azure Stack Hub”中的步骤启动 Azure Stack Hub

更改 GPU 分区大小

Azure Stack Hub 支持 AMD MI25 的 GPU 分区。 使用 GPU 分区,可以使用虚拟 GPU 实例增加虚拟机的密度。 可以更改分区大小以满足特定的工作负荷要求。 默认情况下,Azure Stack Hub 使用最大的分区大小(1/8)提供具有 2 GB 帧缓冲区的最高可能密度。 此分区对于需要加速图形应用程序和虚拟桌面的工作负荷非常有用。

若要更改分区大小,请执行以下步骤:

  1. 取消分配当前使用 GPU 的所有 VM。

  2. 确保已安装适用于 Azure Stack Hub 的 PowerShell Az 模块

  3. 将 PowerShell 连接到管理员 Azure 资源管理器终结点。

  4. 运行以下 PowerShell cmdlet:

    首先确定要更新的规模单元的名称:

    Get-AzsScaleUnit                    # Returns a list of information about scale units in your stamp 
    

    使用上一步返回的“$partitionSize”值来更新以下变量:$scaleUnitName,然后运行以下命令以更新缩放单元分区大小。

    $partitionSize = 4                  # Specify the partition size (1, 2, 4, 8)
    $scaleUnitName = "contoso/cluster"  # Specify the scale unit name
    Set-AzsScaleUnit -Name $scaleUnitName -NumberOfGPUPartition $partitionSize
    

    $partitionSize 支持的值有:

    价值 DESCRIPTION
    8 (默认值) 物理 GPU 的 1/8。
    4 物理 GPU 的 1/4。
    2 物理 GPU 的 1/2。
    1 整个物理 GPU。

注释

不支持调整 GPU VM 的大小。

后续步骤