升级和更新 Azure Service Fabric 群集

Azure Service Fabric 群集是你拥有的但部分由 Azure 管理的资源。本文介绍有关何时以及如何更新 Azure Service Fabric 群集的选项。

自动与手动升级

确保 Service Fabric 群集始终运行支持的运行时版本至关重要。每次 Microsoft 宣布发布新版本的 Service Fabric 时，自该日期起至少 60 天后，上一个版本将被标记为停止支持。新版本将在 Service Fabric 团队博客中宣布。

群集运行的版本过期前十四天，系统会生成运行状况事件，使群集进入警告运行状况状态。在升级到支持的运行时版本之前，群集将保持警告状态。

可以将群集设置为在 Microsoft 发布自动 Service Fabric 升级时接收这些升级，也可以从当前支持的版本列表中手动进行选择。 Service Fabric 群集资源的“结构升级”部分中提供了这些选项。

在 Azure 门户中群集资源的“结构升级”部分选择自动升级或手动升级。

还可以设置群集升级模式，并使用资源管理器模板选择运行时版本。

自动升级是推荐的升级方式，因为此选项可确保集群保持在受支持状态，并受益于最新的修补程序和功能，同时还使您可以使用波形部署策略，以对工作负载干扰最小的方式进行更新规划。

注意

如果将现有群集更改为自动模式，则该群集将在新版本开始的下一个升级阶段中注册。新版本将在 Service Fabric 团队博客中宣布。每个升级期间，尽可能选择最高升级路径，请参阅支持的版本。手动升级模式触发立即升级。

用于自动升级的分阶段部署

使用波形部署时，可以根据工作负载，选择升级的成熟度来最大程度地减少升级对群集造成的中断。例如，可以为各种 Service Fabric 群集设置“测试”-“暂存”->“生产”波形部署管道，以便在将运行时升级应用于生产工作负载之前测试其兼容性。

若要选择波形部署，请为群集指定以下波形值之一（在其部署模板中）：

Wave 0：发布新的 Service Fabric 版本后，立即更新群集。用于测试/开发群集。
第1波：在新的版本发布一周（七天）后，集群将会更新。用于预生产/测试集群。
第二阶段：新版本发布两周（14 日）后更新集群。用于生产群集。

如果群集升级失败，您可以注册电子邮件通知以获取包含进一步帮助链接的消息。请参阅自动升级的 Wave 部署说明以开始使用。

自动升级的阶段

Microsoft维护在 Azure 群集中运行的 Service Fabric 运行时代码和配置。我们根据需要，自动对软件执行受监视的升级。升级的部分可能是代码和/或配置。若要最大程度减小这些升级对应用程序的影响，请按以下阶段执行它们：

阶段 1：通过使用所有群集运行状况策略来执行升级。

在此阶段，升级过程将每次升级一个升级域，已在群集中运行的应用程序继续运行，而不会造成任何停机时间。升级过程中遵守群集运行状况策略（适用于节点运行状况和应用程序运行状况）。

如果不符合群集运行状况策略，则升级将被回退，并且会将电子邮件发送给订阅的所有者。电子邮件中包含以下信息：

有关必须回滚群集升级的通知。
建议的补救措施（如果有）。
距离执行阶段 2 的天数 (n)。

如果有任何升级因为基础结构方面的原因而失败，我们将尝试多次执行同一升级。自电子邮件发送日期的 n 天之后，我们将继续执行阶段 2。

如果符合群集运行状况策略，则升级被视为成功并标记为完成。在此阶段进行初始升级或重新运行任何升级期间，可能发生这种情形。不会对成功运行进行电子邮件确认，以避免发送过多的电子邮件。收到电子邮件表明操作出现异常。大多数群集升级预期都会成功，且不影响应用程序可用性。

阶段 2：只使用默认健康策略来进行升级。

在此阶段设置好运行状况策略，以便在升级开始时运行正常的应用程序数目在升级过程中保持不变。与阶段 1 一样，阶段 2 升级过程将每次升级一个升级域，已在群集中运行的应用程序继续运行，而不会造成任何停机时间。在升级期间，将遵守群集运行状况策略（节点运行状况和所有在群集中运行的应用程序的运行状况的组合）。

如果不符合生效的群集运行状况策略，则回滚升级。然后，系统会向订阅所有者发送一封电子邮件。电子邮件中包含以下信息：

有关必须回滚群集升级的通知。
建议的补救措施（如果有）。
距离执行阶段 3 的天数 (n)。

如果有任何升级因为基础结构方面的原因而失败，我们将尝试多次执行同一升级。将在 n 天结束前的几天发送提醒电子邮件。自电子邮件发送日期的 n 天之后，我们将继续执行阶段 3。第二阶段发送的电子邮件必须被认真对待，并采取补救措施。

如果符合群集运行状况策略，则升级被视为成功并标记为完成。在此阶段进行初始升级或重新运行任何升级期间，可能发生这种情形。如果运行成功，将不发送任何电子邮件确认。

阶段 3：使用积极的健康策略执行升级

此阶段中的这些健康策略旨在完成升级，而非应用程序的健康。很少有群集升级在此阶段结束。如果群集进入此阶段，则表示应用程序有可能变得不正常和/或失去可用性。

类似于另外两个阶段，阶段 3 每次升级一个升级域。

如果集群健康策略不满足，则升级将被回滚。如果有任何升级因为基础结构方面的原因而失败，我们将尝试多次执行同一升级。之后，便会锁定群集，使它不再接收支持和/或升级。

系统会将包含此信息以及补救措施的电子邮件发送给订阅所有者。预期不会有任何群集遇到阶段 3 失败的状况。

手动升级的自定义策略

可为手动群集升级指定自定义策略。每次选择新的运行时版本时，都会应用这些策略，从而触发系统启动群集升级。如果不覆盖这些策略，则会使用默认设置。有关详细信息，请参阅为手动升级设置自定义策略。

其他群集更新

除了升级运行时之外，可能还需要执行一些其他操作才能使群集保持最新状态，包括以下各项：

管理证书

Service Fabric 使用创建群集时指定的 X.509 服务器证书，以保护群集节点之间的通信并对客户端进行身份验证。可以在 Azure 门户中添加、更新或删除群集和客户端的证书，也可以使用 PowerShell/Azure CLI 完成这些操作。若要了解详细信息，请参阅添加或删除证书

打开应用程序端口

可以通过更改与节点类型关联的负载均衡器资源属性来更改应用程序端口。可以使用 Azure 门户，也可以使用 PowerShell/Azure CLI。有关详细信息，请参阅打开群集的应用程序端口。

定义节点属性

有时，可能需要确保仅在群集中特定类型的节点上运行某些工作负荷。例如，某些工作负荷可能需要 GPU 或 SSD，而有些则不用。对于群集中的每个节点类型，可以向群集节点添加自定义节点属性。附加到单个服务的放置约束是用来选择一个或多个节点属性的条件。位置约束定义服务运行的位置。

有关使用放置约束、节点属性以及如何定义它们的详细信息，请参阅节点属性和放置约束。

添加容量指标

对于每个节点类型，可以添加要在应用程序中用于报告负载的自定义容量度量值。有关使用容量指标来报告负载的详细信息，请参阅 Service Fabric 群集 Resource Manager 文档描述群集，以及指标和负载。

自定义您的集群设置

可以在群集上自定义许多不同的配置设置，例如群集的可靠性级别和节点属性。有关详细信息，请参阅 Service Fabric 群集结构设置。

注意

对于使用 10.0CU6、10.1CU5 和 9.1CU12 之前的运行时版本的群集，如果修改或计划修改 FileStoreService 的任何 NTLM 设置，则群集节点重启时需要一些停机时间。此重启与升级周期期间发生的清理相关。

此行为自 10.0CU6、10.1CU5 和 9.1CU12 起发生更改，并且运行这些版本或更高版本的群集上不应发生节点重启。

有关 Service Fabric 版本控制的详细信息，请参阅版本页。

为群集节点升级 OS 映像

最佳做法是为 Service Fabric 群集节点启用自动 OS 映像升级。若要执行该操作，需要实现几个群集要求和步骤。另一个选项是使用修补业务流程应用程序 (POA)，这是一个 Service Fabric 应用程序，可在 Service Fabric 群集中自动修补操作系统，而无需停机。若要了解有关这些选项的详细信息，请参阅在 Service Fabric 群集中修补 Windows 操作系统。

后续步骤

Last updated on 2026-04-13