使用运行状况检查监视应用服务实例

本文介绍如何使用 Azure 门户中的运行状况检查来监视 Azure 应用服务实例。运行状况检查通过将请求从不健康的实例重新路由出去，并在实例持续处于不健康状态时替换这些实例，从而提高应用程序的可用性。它通过你选择的路径，每分钟向你的 Web 应用发送一次 ping。

显示运行状况检查工作原理的示意图。

请注意，/api/health 只是一个示例。没有默认的运行状况检查路径。应确保选择的路径是应用程序中存在的有效路径。

健康检查的工作原理

为应用指定路径后，健康检查会每隔 1 分钟对 App Service 应用的所有实例上的该路径发出 ping 请求。
如果给定实例上运行的 web 应用在 10 次请求后，未响应 200 和 299（含）之间的状态代码，则应用服务会将该实例判定为运行不正常，并将其从 Web 应用的负载均衡器中删除。被视为运行不正常的实例所需的失败请求数最少可配置为 2 个请求。
删除该实例后，运行状况检查仍会继续向该实例发送 ping 请求。如果实例开始以正常状态代码 (200-299) 进行响应，则实例将返回到负载均衡器。
如果实例上运行的 Web 应用在一小时内始终不正常，则该实例将被替换为新的实例。
横向扩展时，应用服务会向健康检查路径发送 ping，以确保新实例已准备就绪。

注意

健康检查不跟随 302 重定向。
每小时最多更换一个实例，每个应用服务计划每天最多更换三个实例。
如果运行状况检查发送状态 Waiting for health check response，则该检查很可能因为收到 HTTP 状态码 307 而失败。如果启用了 HTTPS 重定向但禁用 HTTPS Only，则可能会出现此状态。

启用健康检查

若要启用运行状况检查，请前往 Azure 门户并选择应用服务应用。
在左侧窗格的“监视”下，选择“运行状况检查”。
选择“启用”，然后为应用程序提供有效的 URL 路径，例如或 /health/api/health。
选择“保存”。

注意

您的应用服务计划应扩展到两个或更多个实例，以充分利用运行状况检查。
健康检查路径应检查应用程序的关键组件。例如，如果应用程序依赖于数据库和消息传递系统，则运行状况检查终结点应连接到这些组件。如果应用程序无法连接到关键组件，则路径应返回介于 500 级别的响应代码，以指示应用运行不正常。此外，如果路径在一分钟内未返回响应，则运行状况检查 ping 被视为不正常。
选择健康检查路径时，请确保所选路径仅在应用已完全预热时才返回 200 状态代码。
若要对函数应用使用运行状况检查，必须使用高级或专用托管计划。
有关函数应用的运行状况检查的详细信息，请参阅使用运行状况检查监视函数应用。

注意

运行状况检查配置的更改将导致你的应用重启。为了充分减少对生产应用的影响，我们建议你配置过渡槽并切换到生产环境。

配置

除了配置运行状况检查选项以外，还可以配置以下应用设置：

应用设置名称	允许的值	说明
`WEBSITE_HEALTHCHECK_MAXPINGFAILURES`	2 - 10	所需的失败请求数，达到该数量后实例将被视为不正常并从负载均衡器中移除。例如，当此项设置为 `2` 时，则在 2 次失败的 ping 操作后，将删除实例。（默认值为 `10`。）
`WEBSITE_HEALTHCHECK_MAXUNHEALTHYWORKERPERCENT`	1 - 100	默认情况下，为避免其余的正常实例不堪重负，每次不会从负载均衡器中排除超过半数的实例。例如，如果应用服务计划扩展到 4 个实例，且其中 3 个运行不正常，则将排除 2 个。其他 2 个实例（1 个运行正常的实例和 1 个运行不正常的实例）将继续接收请求。在所有实例都处于不健康状态的情况下，不会排除任何实例。若要重写此行为，请将此应用设置指定为介于 `1` 和 `100` 之间的值。值越高，表示移除的不健康实例越多。（默认值为 `50`。）

身份验证和安全性

运行状况检查与应用服务的身份验证和授权功能相集成。如果启用了这些安全功能，则不需要其他设置。

如果使用自己的身份验证系统，则必须允许匿名访问运行状况检查路径。若要为运行状况检查终结点提供安全性，应先使用 IP 限制、客户端证书或虚拟网络等功能来限制对应用程序的访问。在设置好这些功能后，即可检查标头 x-ms-auth-internal-token 并验证它是否与环境变量 WEBSITE_AUTH_ENCRYPTION_KEY 的 SHA256 哈希匹配，从而对运行状况检查请求进行身份验证。如果相匹配，则说明运行状况检查请求是有效的，并且是源自应用服务。

注意

对于 Azure Functions 身份验证，充当运行状况检查终结点的函数需要允许匿名访问。

using System;
using System.Security.Cryptography;
using System.Text;

/// <summary>
/// Method <c>HeaderMatchesEnvVar</c> returns true if <c>headerValue</c> matches WEBSITE_AUTH_ENCRYPTION_KEY.
/// </summary>
public bool HeaderMatchesEnvVar(string headerValue)
{
    var sha = SHA256.Create();
    string envVar = Environment.GetEnvironmentVariable("WEBSITE_AUTH_ENCRYPTION_KEY");
    string hash = Convert.ToBase64String(sha.ComputeHash(Encoding.UTF8.GetBytes(envVar)));
    return string.Equals(hash, headerValue, StringComparison.Ordinal);
}

from hashlib import sha256
import base64
import os

def header_matches_env_var(header_value):
    """
    Returns true if SHA256 of header_value matches WEBSITE_AUTH_ENCRYPTION_KEY.
    
    :param header_value: Value of the x-ms-auth-internal-token header.
    """
    
    env_var = os.getenv('WEBSITE_AUTH_ENCRYPTION_KEY')
    hash = base64.b64encode(sha256(env_var.encode('utf-8')).digest()).decode('utf-8')
    return hash == header_value

import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.Base64;
import java.nio.charset.StandardCharsets;

public static Boolean headerMatchesEnvVar(String headerValue) throws NoSuchAlgorithmException {
    MessageDigest digest = MessageDigest.getInstance("SHA-256");
    String envVar = System.getenv("WEBSITE_AUTH_ENCRYPTION_KEY");
    String hash = new String(Base64.getDecoder().decode(digest.digest(envVar.getBytes(StandardCharsets.UTF_8))));
    return hash.equals(headerValue);
}

var crypto = require('crypto');

function envVarMatchesHeader(headerValue) {
    let envVar = process.env.WEBSITE_AUTH_ENCRYPTION_KEY;
    let hash = crypto.createHash('sha256').update(envVar).digest('base64');
    return hash == headerValue;
}

实例

启用运行状况检查后，可以从“实例”选项卡重启并监控应用程序实例的状态。“实例”选项卡会显示实例名称以及该应用程序实例的状态。你也可以从此选项卡手动执行高级应用程序重启，只需选择“重启”按钮即可。

如果应用程序实例状态为“不健康”，你可以通过选择表中的“重新启动”按钮来手动重新启动相应应用程序的工作进程。重启不会影响同一应用服务计划上托管的任何其他应用程序。如果有其他应用程序使用与该实例相同的应用服务计划，则当你选择“重新启动”时，这些应用程序会列在打开的窗格中。

如果重启实例时重启过程失败，系统会提供替换工作进程的选项。（每小时只能替换一个实例。）此操作会影响使用同一应用服务计划的所有应用程序。

对于 Windows 应用程序，还可以通过进程资源管理器查看进程。这样就可以进一步了解实例的进程，包括线程计数、专用内存和 CPU 总时间。

诊断信息收集

对于 Windows 应用程序，可以选择在“运行状况检查”选项卡中收集诊断信息。启用诊断收集将添加一个自动修复规则，该规则为运行不正常的实例创建内存转储，并将其保存到指定的存储帐户。启用此选项将更改自动修复配置。如果存在现有的自动修复规则，我们建议通过 App 服务诊断进行设置。

启用诊断收集后，可为文件创建存储帐户或选择现有的存储帐户。只能选择与应用程序位于同一区域中的存储帐户。请记住，保存操作将重启应用程序。保存后，如果连续 ping 后发现站点实例运行不正常，则可以转到存储帐户资源并查看内存转储。

监控

提供应用程序的运行状况检查路径后，可以使用 Azure Monitor 监视站点的运行状况。在门户的“运行状况检查”页中，选择工具栏中的“指标”。这会打开一个新页面，可在其中查看站点的运行状况检查状态历史记录和创建新的警报规则。运行状况检查状态会聚合成功的 ping，只有在根据配置的运行状况检查负载平衡阈值认为实例运行不正常时才显示失败。默认情况下，此值设置为 10 分钟，因此给定实例需要 10 次连续 ping（每分钟 1 次），才会被视为运行不正常，然后才会反映在指标上。有关监视站点的详细信息，请参阅 Azure 应用服务配额和指标。

限制

可为“免费”和“共享”应用服务计划启用运行状况检查，以获取站点运行状况的指标和设置警报。但是，由于免费和共享网站不支持横向扩展，因此不会自动替换不正常的实例。您应升级到 Basic 层级或更高层级，这样便可横向扩展到两个或更多个实例，并充分发挥“运行状况检查”的全部作用。建议将此配置用于面向生产的应用程序，因为它会提升应用的可用性和性能。
应用服务计划每小时最多可替换一个不正常的实例，每天最多替换三个实例。
每个缩放单元中，由运行状况检查替换的实例总数都有一个不可配置的上限。如果达到此限制，则不会替换运行不正常的实例。此值每 12 小时重置一次。

常见问题解答

如果应用在单个实例上运行，会发生什么情况？

如果应用仅扩展到一个实例并且变得不正常，则它将不会从负载均衡器中删除，因为这样会使应用程序完全崩溃。不过，如果连续一小时都是不健康的 ping 结果，则该实例将被替换。将实例横向扩展至两个或更多个实例，即可获得运行状况检查带来的流量重新路由好处。如果应用在单个实例上运行，仍可使用运行状况检查的监视功能来跟踪应用程序的运行状况。

为什么我的 Web 服务器日志中没有显示健康检查请求？

运行状况检查请求会在内部发送到您的站点，因此该请求不会显示在 Web 服务器日志中。你可以在运行状况检查代码中添加日志语句，以记录运行状况检查路径何时被请求。

健康检查请求是通过 HTTP 还是 HTTPS 发送的？

在 Windows 和 Linux 上的 App Service 中，当站点启用仅 HTTPS 时，健康检查请求会通过 HTTPS 发送。否则，将通过 HTTP 发送。

健康检查是否遵循由应用程序代码配置的默认域与自定义域之间的重定向？

不是，运行状况检查功能会检测 Web 应用程序默认域的路径。如果从默认域重定向到自定义域，则运行状况检查返回的状态代码不是 200。这将是一个 301 重定向，会将工作进程标记为不健康。

如果同一应用服务计划上有多个应用，该怎么做？

无论应用服务计划上的其他应用如何，始终会从负载均衡器轮换中删除不正常实例（最大删除百分比为 WEBSITE_HEALTHCHECK_MAXUNHEALTHYWORKERPERCENT 中指定的百分比）。如果一个实例上的某个应用处于不正常状态超过一小时，仅当所有其他已启用运行状况检查的应用也不正常时，该实例才会被替换。未启用运行状况检查的应用将不会被考虑在内。

示例

假设你有两个应用程序（或一个具有槽的应用），并启用了运行状况检查。它们名为应用 A 和应用 B。它们采用相同的应用服务计划，该计划已横向扩展为四个实例。如果应用 A 在两个实例上变得运行不正常，负载均衡器将停止向这两个实例上的应用 A 发送请求。如果应用 B 正常，请求仍将路由到这些实例上的应用 B。如果应用 A 在这两个实例上处于运行不正常状态超过一小时，仅当应用 B 在这些实例上也运行不正常时，这些实例才会被替换。如果应用 B 正常，则这些实例将不会被替换。

示例方案的示意图。

注意

如果计划（应用 C）中存在未启用运行状况检查的其他站点或槽，则不会考虑对其进行实例替换。

如果所有实例都不正常，该怎么办？

如果应用程序的所有实例都不正常，则应用服务将不会从负载均衡器中删除实例。在这种情况下，从负载均衡器轮换中删除所有不正常的应用实例实际上会导致应用程序出现故障。但是，实例替换仍会进行。

插槽交换时会发生什么情况？

健康状况检查配置不针对特定槽，因此交换后，交换槽的健康状况检查配置将应用于目标槽，反之亦然。例如，如果为过渡槽启用了健康状况检查，则在交换后，配置的终结点将应用于生产槽。如果可能，建议对生产槽和非生产槽使用一致的配置，以防止交换后出现任何意外行为。

Last updated on 2026-05-26