Azure 中虚拟机的计划内维护

Azure 定期执行更新,以提高虚拟机的主机基础结构的可靠性、性能及安全性。 此类更新包括修补宿主环境(例如操作系统、虚拟机监控程序以及主机上部署的各种代理)中的软件组件、升级网络组件以及硬件解除授权等多项内容。 大多数此类更新在执行时不会影响托管的虚拟机。 但是,也会存在更新产生影响的情况:

  • 如果可进行无需重启的更新,则在更新主机或虚拟机完全移动到已更新主机时,Azure 会使用内存保留维护来暂停 VM。

  • 如果维护需重新启动,系统会告知计划维护的时间。 在这种情况下,系统还会提供一个时间范围,方便在合适的时间自行启动维护。

本页介绍 Azure 如何执行上述两种类型的维护。 有关非计划事件(故障)的详细信息,请参阅“管理 WindowsLinux 虚拟机的可用性”。

在虚拟机中运行的应用程序可以通过适用于 WindowsLinux 的 Azure 元数据服务收集即将发布的更新的相关信息。

有关管理计划维护的“操作说明”信息,请参阅 LinuxWindows 的“处理计划维护通知”。

内存保留维护

如果更新不需要完全重新启动,则会使用内存保留维护机制来限制对虚拟机的影响。 虚拟机会暂停最多 30 秒,保留在 RAM 中的内存,而宿主环境则会应用必需的更新和修补程序,或将 VM 移动到已更新的主机。 然后,虚拟机会进行恢复,其时钟会自动同步。

这些非重启型维护操作会一个容错域接着一个容错域地应用。如果收到任何警告性运行状况信号,则进度会停止。

这些类型的更新可能会影响某些应用程序。 执行实时事件处理(例如媒体流或转码)或高吞吐量网络方案的应用程序可能无法容忍暂停 30 秒钟。 如果将 VM 移动到不同的主机,则某些敏感的工作负荷可能会在导致虚拟机暂停的几分钟内出现略微的性能下降。

需要重新启动的维护

如果计划内维护需要重新启动 VM,系统会提前告知。 计划内维护有两个阶段:自助式时段和计划维护时段。

自助式时段允许在 VM 上启动维护。 在此时段内,可以通过查询每个 VM 来了解其状态,并查看上次维护请求的结果。

启动自助式维护时,VM 会转到已更新的某个节点,并重启。 由于 VM 重新启动,临时磁盘会丢失,而与虚拟网络接口关联的动态 IP 地址会更新。

如果在启动自助式维护的过程中出错,系统会停止操作,不更新 VM,并让你选择是否重试自助维护。

自助式维护时段过后,就会开始计划维护时段。 在这段时间内,仍可以查询维护时段,但不能再自行启动维护。

有关管理需要重启的维护的信息,请参阅 LinuxWindows的“处理计划维护通知”。

计划性维护期间的可用性注意事项

如果决定一直等到计划性维护时段,则为了保持 VM 的最高可用性,需注意一些事项。

配对区域

每个 Azure 区域与同一地理位置中另一个区域配对,共同组成一个区域对。 在计划内维护期间,Azure 只会更新一个区域对中单个区域的 VM。 例如,更新中国北部的虚拟机时,Azure 不会同时更新中国东部的任何虚拟机。 了解区域对的工作原理有助于更好地跨区域分配 VM。

可用性集和规模集

在 Azure VM 上部署工作负荷时,可以在可用性集中创建 VM,向应用程序提供高可用性。 这样可确保在发生故障或重启性维护事件期间,至少有一个虚拟机可用。

在可用性集中,各个 VM 可分布在最多 20 个更新域 (UD) 中。 在计划性维护期间,任意时间都只有一个更新域受影响。 请注意,不一定按顺序来影响更新域。

虚拟机规模集是一种 Azure 计算资源,支持将一组相同的 VM 作为单个资源进行部署和管理。 规模集自动跨更新域进行部署,此类更新域就像可用性集中的 VM 一样。 在计划性维护期间使用规模集时,就像使用可用性集一样,在任意给定的时间都只会影响单个更新域。

有关配置虚拟机以实现高可用性的详细信息,请参阅“管理 WindowsLinux 虚拟机的可用性”。

后续步骤

有关管理需要重启的维护的信息和常见问题,请参阅处理计划内维护通知