使用托管映像创建自定义映像池

要为 Batch 池的虚拟机 (VM) 创建自定义映像,可以使用托管映像创建 Azure Compute Gallery 映像。 还支持只使用托管映像,但仅适用于最高 2019-08-01(含)的 API 版本。

警告

对于使用托管映像创建 Batch 池的支持将于 2026 年 3 月 31 日后停用。 请迁移到 Azure Compute Gallery 中的托管自定义映像,它可用于在 Batch 中创建自定义映像池。 有关详细信息,请参阅迁移指南

本主题说明如何只使用托管映像创建自定义映像池。

先决条件

  • 托管映像资源。 若要使用自定义映像创建虚拟机池,需在 Batch 帐户所在的同一 Azure 订阅和区域中使用或创建托管映像资源。 应该基于 VM 的操作系统 (OS) 磁盘快照及其附加的数据磁盘(可选)创建该映像。

    • 对创建的每个池使用唯一的自定义映像。
    • 若要使用 Batch API 创建包含映像的池,请指定映像的资源 ID,其格式为 /subscriptions/xxxx-xxxxxx-xxxxx-xxxxxx/resourceGroups/myResourceGroup/providers/Microsoft.Compute/images/myImage
    • 托管映像资源应该在池的生存期内存在,以便能够纵向扩展,并可在删除池后将其删除。
  • Microsoft Entra 身份验证。 Batch 客户端 API 必须使用 Microsoft Entra 身份验证。 对 Microsoft Entra ID 的 Azure Batch 支持记录在使用 Active Directory 对 Batch 服务解决方案进行验证中。

准备托管映像

在 Azure 中,可以通过以下项准备托管映像:

  • Azure VM 的 OS 和数据磁盘快照
  • 带托管磁盘的通用 Azure VM
  • 已上传到云的通用本地 VHD

若要使用托管映像可靠地缩放 Batch 池,建议仅使用第一种方法创建托管映像:使用 VM 磁盘的快照。 以下步骤展示了如何准备 VM、创建快照,然后基于该快照创建托管映像。

准备 VM

要为映像创建新 VM,请将 Batch 支持的第一方 Azure 市场映像用作托管映像的基础映像。 仅第一方映像可以用作基础映像。 若要获取 Azure Batch 支持的 Azure 市场映像参考的完整列表,请参阅列出节点代理 SKU 操作。

注意

不能使用具有附加许可和购买条款的第三方映像作为基础映像。 有关这些市场图像的信息,请参阅 LinuxWindows VM 指南。

  • 确保使用托管磁盘创建 VM。 这是创建 VM 时的默认存储设置。
  • 不要在 VM 上安装自定义脚本扩展等 Azure 扩展。 如果映像包含预安装的扩展,则在部署 Batch 池时 Azure 可能会遇到问题。
  • 使用附加的数据磁盘时,需要从 VM 中装载和格式化磁盘,才能使用它们。
  • 确保所提供的基础 OS 映像使用默认临时驱动器。 Batch 节点代理目前需要使用默认的临时驱动器。
  • 确保 OS 磁盘未加密。
  • VM 开始运行后,请通过 RDP(适用于 Windows)或 SSH(适用于 Linux)进行连接。 安装所需的任何软件,或复制所需的数据。

创建 VM 快照

快照是 VHD 的完整只读副本。 要创建 VM 操作系统或数据磁盘的快照,可以使用 Azure 门户或命令行工具。 有关创建快照的步骤和选项,请参阅适用于 VM 的指导。

基于一个或多个快照创建映像

若要基于快照创建托管映像,请使用 Azure 命令行工具,例如 az image create 命令。 可以通过指定 OS 磁盘快照并选择性地指定一个或多个数据磁盘快照来创建映像。

从托管映像创建池

找到托管映像的资源 ID 后,便可通过该映像创建自定义映像池。 以下步骤演示如何使用 Batch 服务或 Batch 管理创建自定义映像池。

注意

确保用于 Microsoft Entra 身份验证的标识拥有对映像资源的权限。 请参阅使用 Active Directory 对 Batch 服务解决方案进行身份验证

托管映像的资源必须在池的生存期内存在。 如果删除了基础资源,则无法缩放池。

Batch 服务 .NET SDK

private static VirtualMachineConfiguration CreateVirtualMachineConfiguration(ImageReference imageReference)
{
    return new VirtualMachineConfiguration(
        imageReference: imageReference,
        nodeAgentSkuId: "batch.node.windows amd64");
}

private static ImageReference CreateImageReference()
{
    return new ImageReference(
        virtualMachineImageId: "/subscriptions/{sub id}/resourceGroups/{resource group name}/providers/Microsoft.Compute/images/{image definition name}");
}

private static void CreateBatchPool(BatchClient batchClient, VirtualMachineConfiguration vmConfiguration)
{
    try
    {
        CloudPool pool = batchClient.PoolOperations.CreatePool(
            poolId: PoolId,
            targetDedicatedComputeNodes: PoolNodeCount,
            virtualMachineSize: PoolVMSize,
            virtualMachineConfiguration: vmConfiguration);

        pool.Commit();
    }

Batch 管理 REST API

REST API URI

 PUT https://management.chinacloudapi.cn/subscriptions/{sub id}/resourceGroups/{resource group name}/providers/Microsoft.Batch/batchAccounts/{account name}/pools/{pool name}?api-version=2020-03-01

请求正文

 {
   "properties": {
     "vmSize": "{VM size}",
     "deploymentConfiguration": {
       "virtualMachineConfiguration": {
         "imageReference": {
           "id": "/subscriptions/{sub id}/resourceGroups/{resource group name}/providers/Microsoft.Compute/images/{image name}"
         },
         "nodeAgentSkuId": "{Node Agent SKU ID}"
       }
     }
   }
 }

大型池的注意事项

如果计划使用自定义映像创建包含数百个或更多 VM 的池,则必须遵循前面的指导使用根据 VM 快照创建的映像。

另请注意以下注意事项:

  • 大小限制 - 当你使用自定义映像时,Batch 会将池大小限制为 2500 个专用计算节点或 1000 个现成虚拟机节点。

    如果使用相同的映像(或基于同一基础快照的多个映像)来创建多个池,则池中的计算节点总数不能超过上述限制。 不建议将某个映像或其基础快照用于多个池。

    如果使用入站 NAT 池来配置池,可以降低限制。

  • 调整超时 - 如果池包含固定数目的节点(不会自动缩放),请增大 resizeTimeout 属性的值,例如 20-30 分钟。 如果在超时期限内池未达到其目标大小,请再次执行调整大小操作

    如果你打算创建包含 300 个以上的计算节点的池,可能需要多次调整池大小才能达到目标大小。

通过使用 Azure Compute Gallery,可以借助自定义映像和更多共享映像副本创建更大的池,同时提高性能优势,例如减少节点准备就绪的时间。

使用 Packer 的注意事项

只能通过用户订阅模式 Batch 帐户来直接使用 Packer 创建托管映像资源。 对于 Batch 服务模式帐户,需要首先创建 VHD,然后将 VHD 导入托管映像资源。 根据池分配模式(用户订阅或 Batch 服务),创建托管映像资源的步骤会有所不同。

确保用于创建托管映像的资源在引用自定义映像的任何池的生存期内存在。 否则可能会导致池分配失败和/或重设大小失败。

如果删除了图像或基础资源,则可能会收到类似于以下内容的错误:There was an error encountered while performing the last resize on the pool. Please try resizing the pool again. Code: AllocationFailed。 如果收到此错误,请确保尚未移除基础资源。

有关使用 Packer 创建 VM 的详细信息,请参阅使用 Packer 构建 Linux 映像使用 Packer 构建 Windows 映像

后续步骤