可靠性建议

Azure 顾问可帮助确保并提高业务关键应用程序的连续性。可以在顾问仪表板的“可靠性”选项卡上获取可靠性建议。

登录到 Azure 门户。
在任意页面中搜索并选择顾问。
在顾问仪表板中，选择“可靠性”选项卡。

AgFood 平台

升级到最新的 FarmBeats API 版本

我们确定了对计划弃用的 ADMA API 版本的调用。为了确保不间断地访问 ADMA、最新功能并改进性能，请切换到最新的 ADMA API 版本。

潜在优势：确保对 FarmBeats 的访问不间断

影响：中等

有关详细信息，请参阅 Azure Data Manager for Agriculture REST API 参考

ResourceType：microsoft.agfoodplatform/farmbeats
建议 ID：1233e513-ac1c-402d-be94-7133dc37cac6
子类别：服务升级与退役

升级到最新的 ADMA Python SDK 版本

我们确定了对计划弃用的 ADMA Python SDK 版本的调用。为确保不间断地访问 ADMA、最新功能并改进性能，建议切换到最新的 SDK 版本。

请考虑将应用服务计划横向扩展到至少两个实例，以在日常维护期间避免冷启动延迟和服务中断。

潜在优势：优化用户体验和可用性

影响：中等

有关详细信息，请参阅在云中运行正常应用的终极指南 - Azure 应用服务

ResourceType：microsoft.web/serverfarms
建议编号：45cfc38d-3ffd-4088-bb15-e4d0e1e160fe
子类别：可伸缩性

横向扩展应用程序服务计划以避免 CPU 耗尽

CPU 利用率高可能导致应用程序出现运行时问题。应用程序在过去几天的 CPU 使用率超过了 90%。为了减少 CPU 使用率并避免运行时问题，请横向扩展应用程序。

潜在优势：使应用保持正常运行

影响：高

ResourceType：microsoft.web/sites
建议编号：1294987d-c97d-41d0-8fd8-cb6eab52d87b
子类别：可伸缩性

检查应用的服务运行状况问题

我们有一个与应用的服务运行状况相关的建议。打开 Azure 门户，转到应用，单击“诊断并解决”以查看更多详细信息。

潜在优势：使应用保持正常运行

影响：高

有关详细信息，请参阅 Azure 应用服务最佳做法 - Azure 应用服务

ResourceType：microsoft.web/sites
建议 ID：a85f5f1c-c01f-4926-84ec-700b7624af8c
子类别：其他

修复应用服务资源的备份数据库设置

当应用程序的数据库配置无效时，其备份将失败。有关详细信息，请参阅应用管理页上的应用程序备份历史记录。

潜在优势：确保业务连续性

影响：高

ResourceType：microsoft.web/sites
建议 ID：b30897cc-2c2e-4677-a2a1-107ae982ff49
子类别：灾难恢复

升级应用服务计划的 SKU 以避免内存问题

包含应用程序的应用服务计划超过 85% 的内存分配。内存消耗过高可能导致应用程序出现运行时问题。找到有问题的应用程序，并将其纵向扩展到具有更多内存资源的更高计划。

潜在优势：使应用保持正常运行

影响：高

ResourceType：microsoft.web/sites
建议 ID：66d3137a-c4da-4c8a-b6b8-e03f5dfba66e
子类别：可伸缩性

修复应用程序代码，一个工作进程因未处理的异常而发生故障

应用程序中的工作进程因未处理的异常而发生故障。若要确定根本原因，请在发生故障时收集内存转储和调用堆栈信息。

潜在优势：使应用保持正常运行且高度可用

影响：高

有关详细信息，请参阅 Azure 应用服务中的崩溃监视 - Azure 应用服务

ResourceType：microsoft.web/sites
建议 ID：3e35f804-52cb-4ebf-84d5-d15b3ab85dfc
子类别：其他

将应用服务升级到标准计划以避免请求拒绝

当某应用程序是共享的应用程序服务计划的一部分并多次达到其配额时，可能会拒绝传入请求。满足配额后，Web 应用程序无法接受传入请求。若要去除配额，请升级到标准计划。

潜在优势：使应用保持正常运行

影响：高

ResourceType：microsoft.web/sites
建议 ID：78c5ab69-858a-43ca-a5ac-4ca6f9cdc30d
子类别：可伸缩性

将应用服务资源移到标准或更高层级并使用部署槽

当一周内多次部署应用程序时，可能会出现问题。你上周多次部署了应用程序。为了帮助减少对生产 Web 应用程序的部署影响，请将应用服务资源移动到标准（或更高）计划，并使用部署槽位。

潜在优势：在更新时使应用保持正常运行

影响：高

ResourceType：microsoft.web/sites
建议 ID：59a83512-d885-4f09-8e4f-c796c71c686e
子类别：其他

迁移到支持的 AGC 版本

容器应用程序网关的版本是使用预览版预配的，不支持用于生产。务必使用最新 API 版本来预配新网关。

潜在优势：确保生产工作负载的可支持性和复原能力

影响：高

有关详细信息，请参阅什么是适用于容器的应用程序网关？

ResourceType：microsoft.servicenetworking/trafficcontrollers
建议 ID：db83b3d4-96e5-4cfe-b736-b3280cadd163
子类别：服务升级与退役

应用程序网关

升级你的 SKU 或添加更多实例

部署两个或更多中型或大型实例将在计划内或计划外维护导致服务中断时确保业务连续性（容错）。

潜在优势：通过应用程序网关复原确保业务连续性

影响：中等

有关详细信息，请参阅多区域负载均衡 - Azure 参考体系结构

ResourceType：microsoft.network/applicationgateways
建议 ID：6a2b1e70-bd4c-4163-86de-5243d7ac05ee
子类别：业务连续性

避免替代主机名以确保站点的完整性

在配置应用程序网关时避免替代主机名。如果在应用程序网关前端使用的域不同于访问后端所使用的域，则可能会导致 Cookie 或重定向 URL 损坏。确保后端能够应对域差异或更新应用程序网关配置，以便不需要在后端替代主机名。在配合应用程序服务一起使用时，请将自定义域名附加到 Web 应用，并避免在后端使用 *.chinacloudsites.cn 主机名。请注意，在所有情况下，不同的前端域不是问题，某些类别的后端（如 REST API）通常不太敏感。

潜在优势：通过可复原的应用程序网关配置，确保站点完整性并避免 cookie 或重定向 URL 被破坏。

影响：中等

有关详细信息，请参阅排查重定向到应用服务 URL 的问题 - Azure 应用程序网关

ResourceType：microsoft.network/applicationgateways
建议 ID：52a9d0a7-efe1-4512-9716-394abd4e0ab1
子类别：其他

更改 V1 网关的子网，因为当前子网包含 NAT 网关

由于内部升级失败，2024 年 10 月之后应用程序网关可能会被删除。这是因为它缺少专用子网，并且包含 NAT 网关。要解决此问题，请更改子网、删除 NAT 网关或迁移到 V2。在消息修复后，留出一天时间让其消失

潜在优势：避免应用程序网关 V1 资源的管理中断

影响：高

有关详细信息，请参阅有关应用程序网关的常见问题解答

ResourceType：microsoft.network/applicationgateways
建议 ID：511a9f7b-7b5e-4713-b18d-0b7464a84d1f
子类别：未定义

跨可用性区域部署应用程序网关

通过跨可用区部署应用程序网关来实现区域冗余。区域冗余可使应用程序网关在各种中断情况下正常运行，从而增强其恢复能力。区域冗余可确保即使一个区域受到影响也能保持连续性，并提高整体可靠性。

潜在优势：可用性区域为应用程序网关添加复原能力

影响：高

有关详细信息，请参阅缩放和区域冗余应用程序网关 v2

ResourceType：microsoft.network/applicationgateways
建议 ID：5c488377-be3e-4365-92e8-09d1e8d9038c
子类别：未定义

重写主机头时，请求 Cookie 和 URL 重定向可能会中断。使用诸如 Azure 应用程序服务等平台时，会话亲和性以及身份验证和授权等功能可能无法正常工作。请确保验证应用程序是否能正常工作。

潜在优势：通过保留原始主机名来确保应用程序的完整性

影响：中等

有关详细信息，请参阅 Azure Front Door - 最佳做法

以防止因源网络地址转换 (SNAT) 端口耗尽导致的连接失败问题，请为虚拟网络的出站流量使用 NAT 网关。 NAT 网关会动态缩放，为发往 Internet 的流量提供安全连接。

潜在优势：使用 NAT 网关防止出站连接失败

影响：中等

有关详细信息，请参阅用于出站连接的源网络地址转换 (SNAT) - Azure 负载均衡器

ResourceType：microsoft.network/virtualnetworks
建议 ID：56f0c458-521d-4b8b-a704-c0a099483d19
子类别：HighAvailability

使用健康探针监测服务器的运行状况

使用应用程序网关的运行状况探测来监视后端池中服务器的运行状况。应用程序网关的健康探测器会阻止流量发送到健康探测器认为不正常的服务器。

潜在优势：防止将流量发送到不正常的服务器。

影响：高

有关详细信息，请参阅 Azure 应用程序网关的运行状况监视概述

ResourceType：microsoft.network/applicationgateways
建议 ID：01c0dcd3-d6f7-4d50-a98b-4e15f9486a32
子类别：未定义

跨可用性区域部署区域冗余虚拟网络网关可确保区域复原能力，从而提高对 Azure 上任务关键型可缩放服务的访问。

潜在优势：提高可用性和可靠性

影响：高

有关详细信息，请参阅关于 Azure 可用性区域中的区域冗余虚拟网络网关 - Azure VPN 网关

ResourceType：microsoft.network/virtualnetworkgateways
推荐 ID：1afa00b3-bb4c-496d-99e5-b7bda59a057c
子类别：HighAvailability

跨多个可用性区域部署 Azure 防火墙

Azure 防火墙 SLA 因部署类型（例如单个或多个可用性区域）而异，以提高可靠性和性能。

潜在优势：增强 SLA 和可靠性

影响：高

有关详细信息，请参阅使用 PowerShell 使用可用性区域部署 Azure 防火墙

ResourceType：microsoft.network/azurefirewalls
建议 ID：e82f5b61-b0f8-48e7-8e18-5aa1f57bff81
子类别：HighAvailability

配置为使用可用性区域的标准负载均衡器和相关资源提供对区域故障的复原能力。将区域冗余前端 IP 分配到标准负载均衡器可确保持续流量分布，即使一个可用性区域发生故障也是如此。

潜在优势：提高可用性和可靠性

影响：高

有关详细信息，请参阅 Azure 负载均衡器中的可靠性

ResourceType：microsoft.network/loadbalancers
建议 ID：796b9be0-487d-4daa-8771-f08e4d7c9c0c
子类别：HighAvailability

确保后端池至少包含两个实例

部署具有至少两个实例的 Azure 负载均衡器后端池可防止单一故障点。与虚拟机规模集配对可以提供额外的可伸缩性。

潜在优势：增强可靠性和可伸缩性

影响：高

有关详细信息，请参阅服务的复原能力清单 - Azure 体系结构中心

ResourceType：microsoft.network/loadbalancers
建议 ID：5b132ebc-bd86-46fc-b2ee-95bc3e2d3017
子类别：HighAvailability

将 Microsoft Flux 扩展升级到最新主版本

Microsoft Flux 扩展有一个主要版本。规划在 6 个月内为所有已启用 Azure Arc 的 Kubernetes 和 Azure Kubernetes 服务 (AKS) 群集手动升级到 Microsoft Flux 的最新主要版本，以获取持续支持和新功能。

潜在优势：持续支持和新功能

影响：中等

有关详细信息，请参阅已启用 Azure Arc 的 Kubernetes 群集的可用扩展 - Azure Arc

ResourceType：microsoft.kubernetesconfiguration/extensions
建议 ID：4bc7a00b-edbb-4963-8800-1b0f8897fecf
子类别：服务升级与退役

Microsoft Flux 扩展即将推出的中断性变更

Microsoft Flux 扩展经常会接收到安全更新和稳定性更新。即将推出的更新与 OSS Flux 项目保持一致，将通过删除已弃用的字段来修改 HelmRelease 和 HelmChart API。为了避免工作负载中断，需要采取必要的操作。

潜在优势：降低中断风险;高级缓存的 99.9% 运行时间

影响：高

有关详细信息，请参阅什么是 Azure Redis 缓存？ - Azure Redis 缓存

ResourceType：microsoft.cache/redis
建议 ID：1a0a309c-54f0-4cb0-a839-2cee5912ba62
子类别：HighAvailability

将企业 SKU 与区域冗余配合使用

在门户或 ARM 模板中选择区域冗余

潜在优势：降低中断风险;企业缓存的 99.9% 运行时间

影响：高

有关详细信息，请参阅什么是 Azure Redis 缓存？ - Azure Redis 缓存

ResourceType：microsoft.cache/redisenterprise
建议 ID：08cff11d-aa10-44a1-a92f-a76a19e63f7d
子类别：HighAvailability

Contoso 建议 - R4

潜在优势：测试潜在优势

影响：低

ResourceType：microsoft.cache/redis
建议 ID：4ea9775d-8a8e-481c-8594-5aabd8214431
子类别：未定义

从 Azure Cache for Redis 迁移到 Azure Managed Redis

为避免服务中断，请在停用日期前将工作负荷迁移到 Azure 托管 Redis。

潜在优势：避免服务中断

影响：中等

有关详细信息，请参阅 Azure 更新

ResourceType：microsoft.cache/redis
建议 ID：f3aded79-f9ff-4ce4-99e3-2ffcf11161a4
子类别：未定义

从 Azure Cache for Redis Enterprise 迁移到 Azure 托管 Redis

为避免服务中断，请在停用日期前将工作负荷迁移到 Azure 托管 Redis。

潜在优势：避免服务中断并确保持续支持

影响：中等

有关详细信息，请参阅 Azure 更新

ResourceType：microsoft.cache/redisenterprise
建议 ID：b498df1b-749b-4fdb-a7a1-28551cef6a82
子类别：未定义

Azure 容器应用

续订自定义域证书

你上传的自定义域证书即将过期。为了防止可能出现的服务中断，请续订证书并为容器应用上传新证书。

潜在优势：服务不会因证书过期而失败。

影响：中等

有关详细信息，请参阅 Azure 容器应用中自定义域名和证书

ResourceType：microsoft.app/containerapps
推荐ID：b9ce2d2e-554b-4391-8ebc-91c570602b04
子类别：其他

检测到阻止续订托管证书的问题。

我们已检测到容器应用使用的托管证书无法自动续订。按照文档链接确保自定义域的 DNS 设置正确。

潜在优势：避免由于证书过期而停机。

影响：高

有关详细信息，请参阅 Azure 容器应用中自定义域名和免费托管证书

ResourceType：microsoft.app/containerapps
建议 ID：fa6c0880-da2e-42fd-9cb3-e1267ec5b5c2
子类别：其他

请为您的容器化应用增加最小副本数量

为 Azure 容器应用容器化应用程序设置的最小副本计数可能太低，这可能导致复原、可伸缩性和负载均衡方面的问题。请考虑增加最低副本数量，以提高可用性。

潜在优势：提高容器应用的可用性。

影响：中等

有关详细信息，请参阅在 Azure 容器应用中缩放

ResourceType：microsoft.app/containerapps
建议 ID：9be5f344-6fa5-4abc-a1f2-61ae6192a075
子类别：HighAvailability

重新创建容器应用环境以避免 DNS 问题

容器应用环境可能存在网络问题，进而导致 DNS 问题。我们建议你创建新的容器应用环境，在新的环境中重新创建容器应用，并删除旧的容器应用环境。

潜在优势：避免容器应用环境中出现 DNS 故障。

影响：高

有关详细信息，请参阅快速入门：使用 Azure 门户部署第一个容器应用

ResourceType：microsoft.app/managedenvironments
建议 ID：c692e862-953b-49fe-9c51-e5d2792c1cc1
子类别：其他

为托管环境启用区域冗余

若要最大程度地提高高可用性，请在区域内的多个区域中部署应用程序副本。流量会自动分布在这些区域之间。为了获得最佳复原能力，请配置至少三个应用程序副本，并确保工作负荷配置文件节点计数至少为 3 个。

潜在优势：保护应用和数据免受数据中心故障的影响

影响：高

ResourceType：microsoft.app/managedenvironments
建议 ID：b7e00078-7703-4a0a-afac-1b403803ba62
子类别：HighAvailability

从 Azure 容器应用上的服务连接器（预览版）迁移

对 Azure 容器应用上的服务连接器（预览版）的支持即将终止。已阻止通过任何界面使用服务连接器（预览版）创建新的服务连接。

你的 Azure Cosmos DB API for MongoDB 帐户符合升级到版本 4.2 的条件。升级到 v4.2 后可利用新存储格式，从而将存储成本最多降低 55%，将查询成本最多降低 45%。 v4.2 还包括许多其他功能，例如多文档事务。

潜在优势：改进了可靠性、查询/存储效率、性能和新功能

影响：中等

有关详细信息，请参阅升级 Mongo 版本 - Azure Cosmos DB for MongoDB

ResourceType：microsoft.documentdb/databaseaccounts
建议 ID：0da795d9-26d2-4f02-a019-0ec383363c88
子类别：其他

解决虚拟网络问题

由于虚拟网络 (VNet) 问题，服务无法安装或继续。若要解决此问题，请执行故障排除指南中的步骤。

潜在优势：改进了可靠性、可用性、性能并提供新功能

影响：高

有关详细信息，请参阅在虚拟网络中排查 Azure 数据资源管理器群集的访问、数据摄取和运行问题 - Azure 数据资源管理器

ResourceType：microsoft.kusto/clusters
建议 ID：fa2649e9-e1a5-4d07-9b26-51c080d9a9ba
子类别：其他

为“Microsoft.Kusto/clusters”添加子网委派

如果未委托子网，关联的 Azure 服务将无法在其中运行。你的子网没有所需的委派。为“Microsoft.Kusto/clusters”委派子网。

Azure Databricks

升级到 Azure Databricks 的高级层工作区

标准层工作区即将停用。在停用日期之前升级到高级层。停用日期后，标准层工作区会自动升级到高级层。

潜在优势：访问增强功能

影响：中等

有关详细信息，请参阅 Azure 更新

ResourceType：microsoft.databricks/workspaces
建议 ID：99db65bb-fdb3-4bc8-b015-341fba99865c
子类别：未定义

Azure IoT 中心

将设备客户端 SDK 升级到 Iot 中心的受支持版本

当设备使用过时版本的 SDK 时，可能出现性能下降。部分或所有设备正在使用过时的 SDK。我们建议你升级到受支持的 SDK 版本。

潜在优势：使用受支持的设备 SDK 来确保业务连续性

影响：中等

有关详细信息，请参阅 Azure IoT 中心设备和服务 SDK

ResourceType：microsoft.devices/iothubs
建议 ID：d448c687-b808-4143-bbdc-02c35478198a
子类别：服务升级与退役

检测到 IoT 中心潜在设备风暴

当至少两个设备尝试使用相同的设备 ID 凭据连接到 IoT 中心时，就可能发生这种情况。当第二个设备 (B) 进行连接时，会导致第一个设备 (A) 断开连接。然后 (A) 尝试再次重新连接，这会导致 (B) 断开连接。

潜在优势：改进设备的连接性

影响：中等

有关详细信息，请参阅排查 Azure IoT 中心错误代码

ResourceType：microsoft.devices/iothubs
建议 ID：8d7efd88-c891-46be-9287-0aec2fabd51c
子类别：其他

添加 IoT Hub 单位或提高 SKU 级别

当 IoT 中心超过每日消息配额时，可能出现操作和成本问题。若要确保将来的顺利运行，请添加单位或增加 SKU 级别。

潜在优势：IoT 中心可以再次接收消息。

影响：高

有关详细信息，请参阅排查 Azure IoT 中心错误代码

ResourceType：microsoft.devices/iothubs
建议编号：e4bda6ac-032c-44e0-9b40-e0522796a6d2
子类别：可伸缩性

Azure Kubernetes 服务 (AKS)

对具有永久性卷的群集使用 AKS 备份

Azure Kubernetes 服务 (AKS) 备份是一种云原生解决方案，用于备份和还原 AKS 群集中的容器化应用和数据。 AKS 备份支持对群集状态和永久性卷进行计划备份。 AKS 备份提供对命名空间或整个群集的精细控制。

潜在优势：群集状态和永久性卷的备份

影响：中等

有关详细信息，请参阅什么是 Azure Kubernetes 服务（AKS）备份？ - Azure 备份

ResourceType：microsoft.containerservice/managedclusters
建议编号：29f2eea3-b0d8-4934-a0f8-171dbd70ba13
子类别：灾难恢复

为系统节点池启用自动缩放

若要确保在高负载期间计划系统 Pod，请在系统节点池上启用自动缩放。

潜在优势：自动扩缩器可提升系统 Pod 运行时间

影响：高

有关详细信息，请参阅使用 Azure Kubernetes 服务中的群集自动缩放程序（AKS） - Azure Kubernetes 服务

ResourceType：microsoft.containerservice/managedclusters
建议 ID：70829b1a-272b-4728-b418-8f1a56432d33
子类别：未定义

系统节点池中至少有 2 个节点

确保系统节点池至少有 2 个节点，从而确保系统 Pod 的可靠性。如果群集中只有一个节点，则在节点或硬件出现故障时，您的群集可能会发生故障。

潜在优势：拥有 2 个节点可确保针对节点故障的复原能力。

影响：高

有关详细信息，请参阅使用 Azure Kubernetes 服务（AKS）中的系统节点池 - Azure Kubernetes 服务

ResourceType：microsoft.containerservice/managedclusters
建议 ID：a9228ae7-4386-41be-b527-acd59fad3c79
子类别：未定义

创建专用系统节点池

没有专用系统节点池的群集可靠性较低。建议将系统节点池专用于为关键系统 Pod 提供服务，防止在系统 Pod 与竞争性的用户 Pod 之间造成资源饥饿现象。在池中使用 CriticalAddonsOnly=true:NoSchedule 污点强制实施此行为。

潜在优势：防止核心系统 Pod 的资源短缺

影响：高

有关详细信息，请参阅使用 Azure Kubernetes 服务（AKS）中的系统节点池 - Azure Kubernetes 服务

ResourceType：microsoft.containerservice/managedclusters
建议 ID：f31832f1-7e87-499d-a52a-120f610aba98
子类别：未定义

确保生产环境中不使用 B 系列虚拟机 (VM)

当群集中具有一个或多个使用不推荐的可突发 VM SKU 的节点池时，不保证可 100% 使用全部 vCPU 功能。确保生产环境中不使用 B 系列 VM。

潜在优势：实现一致性能的最佳做法

影响：中等

有关详细信息，请参阅 Bv1 大小系列 - Azure 虚拟机

ResourceType：microsoft.containerservice/managedclusters
建议 ID：fac2ad84-1421-4dd3-8477-9d6e605392b4
子类别：HighAvailability

Azure 区域中的可用性区域通过提供独立位置来确保高可用性。可用性区域配备了独立的电源、冷却和网络，以确保应用程序和数据免受数据中心级故障的影响。

潜在优势：提高可用性和可靠性

影响：高

有关详细信息，请参阅 Azure Kubernetes 服务中的可用性区域（AKS） - Azure Kubernetes 服务

ResourceType：microsoft.containerservice/managedclusters
建议 ID：9f3263db-b9c0-43bb-8523-6800f9f50793
子类别：HighAvailability

Azure Kubernetes 服务上的 Ubuntu 20.04 即将停用

为避免服务中断、扩展限制并继续获得支持；升级到受支持的 Kubernetes 版本。

潜在优势：避免潜在的中断

影响：中等

有关详细信息，请参阅 Azure 更新

ResourceType：microsoft.containerservice/managedclusters
建议 ID：863d09bd-e767-472b-9980-f32709414ade
子类别：未定义

Azure 机器学习

从即将停用的 Azure 机器学习预览功能中迁移

Azure 机器学习的预览功能即将停用。预览功能包括分组多个步骤，以便更好地组织复杂的管道作业以调试故障或意外问题等。创建用于删除预览功能依赖项的计划。

潜在优势：避免服务中断

影响：高

有关详细信息，请参阅 Azure 更新

ResourceType：microsoft.machinelearningservices/workspaces
建议 ID：262c35d4-83fe-457f-afa7-cac774c371d8
子类别：未定义

适用于 Grafana 的 Azure 托管工作区

升级到 X2 以获取更多内存并实现可靠性能

负载较高的 Grafana 工作区可能会遇到内存不足 (OOM) 问题，这可能会导致服务不稳定。缩放到 X2 大小会增加内存资源，使工作区能够保持峰值使用量，同时提供更加稳定的性能和更高的可用性。

潜在优势：通过缩放到具有更高内存的 X2 来提高可靠性

影响：中等

有关详细信息，请参阅什么是 Azure 托管 Grafana？

ResourceType：microsoft.dashboard/grafana
推荐 ID：83357e9d-cc5b-46c3-ac81-6709cf07965e
子类别：未定义

Azure 中继

在可用性区域支持区域中创建，使中继在发生区域中断期间保持运行

在支持可用性区域和区域冗余的区域部署中继。如果可用，请在创建过程中为服务或资源启用区域冗余。

潜在优势：区域中断期间消息传递连续性

影响：高

有关详细信息，请参阅为 Azure 工作负荷启用区域复原

ResourceType：microsoft.relay/namespaces
建议 ID：f94e36fd-c8c1-4af3-8ac6-39c151f9515e
子类别：未定义

Azure Site Recovery

为恢复服务保管库启用软删除

通过软删除，可在删除后将备份数据再保留在恢复服务保管库中一段时间，让你有机会在永久删除之前检索这些数据。

潜在优势：帮助在意外删除时恢复备份数据

影响：中等

有关详细信息，请参阅 Azure 备份的软删除 - Azure 备份

ResourceType：microsoft.recoveryservices/vaults
建议 ID：3ebfaf53-4d8c-4e67-a948-017bbbf59de6
子类别：灾难恢复

为恢复服务保管库启用跨区域还原

使用跨区域还原 (CRR)，可以还原位于次要区域（Azure 配对区域）的 Azure VM，帮助进行灾难恢复。

潜在优势：作为还原选项之一，跨区域还原 (CRR) 允许你在某个次要区域（Azure 配对区域）中还原 Azure VM。

影响：中等

有关详细信息，请参阅使用 Azure 门户通过 Azure 备份还原 VM - Azure 备份

ResourceType：microsoft.recoveryservices/vaults
建议 ID：9b1308f1-4c25-4347-a061-7cc5cd6a44ab
子类别：灾难恢复

为保管库存储启用区域冗余存储 (ZRS)，以保护备份免受区域故障的影响

在支持区域冗余存储 (ZRS) 的区域中创建用于备份数据的保管库。

潜在优势：ZRS 备份在区域级别故障中幸存下来

影响：高

有关详细信息，请参阅为 Azure 工作负荷启用区域复原

ResourceType：microsoft.recoveryservices/vaults
建议 ID：21ac578c-0fb9-42eb-9c58-69716f87e7fb
子类别：未定义

Azure Spring Apps

将应用程序配置服务升级到第 2 代

我们注意到，你仍在使用第 1 代应用程序配置服务，后者将于 2024 年 4 月终止支持。与第 1 代服务相比，第 2 代应用程序配置服务提供更好的性能，从第 1 代服务升级到第 2 代服务无需停机，因此我们建议你尽快升级。

潜在优势：更高的稳定性和可用性。

影响：中等

有关详细信息，请参阅使用 Tanzu 的应用程序配置服务 - Azure Spring Apps Enterprise 计划

ResourceType：microsoft.appplatform/spring
建议 ID：39d862c8-445c-40c6-ba59-0e86134df606
子类别：其他

Azure Spring Apps 即将停用。

新客户无法再注册该服务，现有客户在计划停用之前仍可运行。

升级到 Arc 启用的 AKS 最新版本

升级到由 Azure Arc 启用的 AKS 的 API/SDK 最新版本，以获得新功能并提高稳定性。

潜在优势：Azure Arc 启用的最新版本的 AKS，包含最新功能和更高的稳定性。

影响：低

有关详细信息，请参阅 Azure SDK 版本

ResourceType：microsoft.azurestackhci/clusters
建议 ID：09e56b5a-9a00-47a7-82dd-9bd9569eb6ed
子类别：服务升级与退役

升级到 Arc 启用的 AKS 最新版本

升级到由 Azure Arc 启用的 AKS 的 API/SDK 最新版本，以获得新功能并提高稳定性。

潜在优势：Azure Arc 启用的最新版本的 AKS，包含最新功能和更高的稳定性。

影响：低

有关详细信息，请参阅 Azure SDK 版本

ResourceType：microsoft.azurestackhci/clusters
建议 ID：2ac72093-309f-41ec-bf9d-55e9fc490563
子类别：服务升级与退役

经典部署模型存储

需要执行的操作：在 2024/8/30 前迁移经典存储帐户

将经典存储帐户迁移到 Azure 资源管理器以确保业务连续性。 Azure Resource Manager 将提供所有相同的功能以及一致的管理层、资源分组以及对新功能和更新的访问权限。

潜在优势：保持管理数据的能力

影响：高

有关详细信息，请参阅 2024 年 8 月 31 日停用经典存储帐户 - Azure 存储

ResourceType：microsoft.classicstorage/storageaccounts
建议 ID：fd04ff97-d3b3-470a-9544-dfea3a5708db
子类别：未定义

经典部署模型虚拟机

在 2024 年 8 月 31 日之前，停止使用经典版云服务。

云服务（经典）即将停用。为避免数据丢失或业务连续性受损，请在 2024 年 8 月 31 日之前迁移。

潜在优势：服务的连续性

影响：中等

有关详细信息，请参阅将 Azure 云服务（经典版）迁移到 Azure 云服务（扩展支持）

ResourceType：microsoft.classiccompute/domainnames
建议 ID：13ff4efb-6c84-4684-8838-52c123e3e3a2
子类别：服务升级与退役

出口流量

此资源已超出配额，请等待或升级以取消阻止

影响：高

有关详细信息，请参阅如何添加自定义域 - Azure Front Door

ResourceType：microsoft.cdn/profiles
建议 ID：bfe85fd2-ee53-4c35-8781-7790da2107e1
子类别：未定义

将机密版本切换到 Azure Front Door 客户证书的“最新”

将 Azure Front Door（AFD）客户证书机密配置为“最新”，以便 AFD 引用 Azure Key Vault 中的最新机密版本，从而允许自动轮换机密。

潜在优势：避免 Kafka 中转站问题

影响：高

有关详细信息，请参阅 Broker 因 Azure HDInsight 的磁盘已满而无法启动

ResourceType：microsoft.hdinsight/clusters
推荐 ID：35e3a19f-16e7-4bb1-a7b8-49e02a35af2e
子类别：未定义

将群集升级到最新的 HDInsight 映像

群集没有最新的映像升级。群集是在 1 年前创建的。为确保获得最新的开放源代码更新、Azure 改进和安全补丁，平台建议使用最新的 HDInsight 映像。群集升级的建议最长期限为 6 个月或更短。

潜在优势：获取最新的修补程序和功能

影响：高

有关详细信息，请参阅在开始使用 Azure HDInsight 之前

ResourceType：microsoft.hdinsight/clusters
建议 ID：8f163c95-0029-4139-952a-42bd0d773b93
子类别：未定义

升级 HDInsight 集群

未使用最新映像的群集没有最新的升级。你的群集未使用最新映像。我们建议你使用最新版本的 HDInsight 映像，以获取最好的开放源代码更新、Azure 更新和安全修补程序。新的 HDInsight 版本每 30 到 60 天发布一次。

潜在优势：获取最新的修补程序和功能

影响：高

有关详细信息，请参阅 Azure HDInsight 的发行说明

ResourceType：microsoft.hdinsight/clusters
建议 ID：97355d8e-59ae-43ff-9214-d4acf728467a
子类别：未定义

服务总线

使用服务总线高级层提高复原能力

运行关键应用程序时，服务总线高级层在 CPU 和内存级别提供更好的资源隔离，进而增强可用性。它还支持异地复制功能，支持从区域灾难中完全恢复。

潜在优势：使用 CPU 隔离和异地复制增强复原能力

影响：低

有关详细信息，请参阅 Azure 服务总线高级消息传送层 - Azure 服务总线

ResourceType：microsoft.servicebus/namespaces
建议 ID：29765e2c-5286-4039-963f-f8231e56cc3e
子类别：HighAvailability

使用高级层中的服务总线自动缩放功能来提高复原能力

在运行关键应用程序时，启用自动缩放功能可以让你拥有足够的容量来处理应用程序的负载。运行适当的资源量可以减少限制，并提供更好的用户体验。

为虚拟机上的 SQL 启用 Azure 备份

要实现 SQL AG 集成的零基础结构备份、时间点还原和集中管理等优势，请使用 Azure 备份为虚拟机上的 SQL 数据库启用备份。

根据工作负载要求，迁移到通用 v2 存储帐户或专用替代方案，例如 BlockBlobStorage 或 FileStorage。

在放置于 Azure 负载均衡器之后的 VM 上禁用 TCP 时间戳，以在 SAP 工作负载中设置 HANA DB HA

在放置于 Azure 负载均衡器之后的 VM 上禁用 TCP 时间戳。启用 TCP 时间戳后，VM 来宾 OS 的 TCP 堆栈会删除 TCP 数据包，导致运行状况探测失败，从而使负载均衡器将终结点标记为停止。

潜在优势：SAP 工作负载中 HA 设置的可靠性

影响：中等

有关详细信息，请参阅 Azure 负载均衡器运行状况探测

ResourceType：microsoft.workloads/sapvirtualinstances/databaseinstances
建议 ID：760ba688-69ea-431b-afeb-13683a03f0c2
子类别：其他

后续步骤

详细了解可靠性 - Microsoft Azure 良好架构框架

Last updated on 2025-12-05

Compartir a través de

可靠性建议

AgFood 平台

升级到最新的 FarmBeats API 版本

升级到最新的 ADMA Python SDK 版本

API Management

主机名证书轮换失败

旧门户已在 3 年前被弃用，于 2023 年 10 月停用。 但我们看到该门户的使用非常活跃，当我们禁用它后，可能会导致服务中断。

依赖项网络状态检查失败

SSL/TLS 重新协商受阻

将 Azure API Management 实例部署到多个 Azure 区域以享更高的服务可用性

在生产工作负载上为 API 管理实例启用和配置自动缩放。

升级到 Premium 并让 API 管理实例跨多个区域部署

应用服务证书

颁发应用程序服务证书需要域验证

App Service

验证应用服务域的联系信息

横向扩展应用服务计划

横向扩展应用程序服务计划以避免 CPU 耗尽

检查应用的服务运行状况问题

修复应用服务资源的备份数据库设置

升级应用服务计划的 SKU 以避免内存问题

修复应用程序代码，一个工作进程因未处理的异常而发生故障

将应用服务升级到标准计划以避免请求拒绝

将应用服务资源移到标准或更高层级并使用部署槽

对应用服务资源使用部署槽

考虑将应用程序体系结构更改为 64 位

请考虑将此订阅中的 Static Web App(s) 托管计划升级到标准 SKU。

使用标准层或高级层

将应用程序服务的最小实例计数设置为 2

为应用服务启用运行状况检查

迁移到区域支持的应用服务环境

使用区域支持的应用服务计划

需要执行的作：受 MPIC 符合性影响的应用服务托管证书

应用服务托管证书：不再支持 trafficmanager.cn 域

将 PHP 升级到较新的受支持版本

将配置存储为网站的应用设置

适用于容器的应用程序网关

迁移到支持的 AGC 版本

应用程序网关

升级你的 SKU 或添加更多实例

避免替代主机名以确保站点的完整性

更改 V1 网关的子网，因为当前子网包含 NAT 网关

跨可用性区域部署应用程序网关

更新应用程序网关用户的 VNet 权限

确保自动缩放用于提高性能和复原能力

更改名为 GatewaySubnet 的 V1 网关子网，因为它已保留用于 VPN/Express 路由

重新激活订阅以解除对 V1 网关内部升级的限制

使用托管 TLS 证书

考虑至少有两个原点

在 Front Door 和原点上使用同一域名

避免将流量管理器放在 Front Door 后面

解决专用终结点未处于成功状态的问题

向配置文件再添加至少一个终结点（首选在另一 Azure 区域进行）

将配置的终结点添加到“所有(全球)”

将一个终结点添加或移动到另一个 Azure 区域

ExpressRoute IP 路由接近指定的限制

从基本网关移到生产网关 SKU

启用主动-主动网关以确保冗余

为 ExpressRoute 实现站点复原

实现区域冗余 ExpressRoute 网关

使用用于出站连接的 NAT 网关

使用健康探针监测服务器的运行状况

配置和部署 VPN 网关和相关资源以使用可用性区域

跨多个可用性区域部署 Azure 防火墙

配置和部署负载均衡器和相关资源以使用可用性区域

确保后端池至少包含两个实例

配置和部署公共 IP 地址和相关资源以使用可用性区域。

配置维护配置

将标准 SKU 与区域冗余 IP 地址配合使用

流量管理器监视器应处于联机状态

监视虚拟 WAN 点到站点 VPN 网关的运行状况

使用无版本密钥保管库机密标识符来引用证书

应用程序网关 v1 已停用。 迁移到应用程序网关 v2。

标准和高性能 VPN 网关 SKU 即将停用

Azure AI 搜索

创建标准搜索服务 (2GB)

创建标准搜索服务 (50MB)

通过添加更多分区，来避免超出可用存储配额

升级到最新版本的 listQueryKeys 请求

旧门户已在 3 年前被弃用，于 2023 年 10 月停用。但我们看到该门户的使用非常活跃，当我们禁用它后，可能会导致服务中断。

应用程序网关 v1 已停用。迁移到应用程序网关 v2。