排查 Azure 应用服务中应用性能缓慢的问题

本文帮助排查 Azure 应用服务中应用性能缓慢的问题。

如果对本文中的任何观点存在疑问,可以联系 Azure 支持上的 Azure 专家。 或者,也可以提出 Azure 支持事件。 请转到 Azure 支持站点,并单击“获取支持”。

症状

浏览应用时,页面加载缓慢,并且有时还会超时。

原因

此问题通常是应用程序级别的问题造成的,例如:

  • 网络请求耗时过长
  • 应用程序代码或数据库查询效率低下
  • 应用程序的内存/CPU 使用率过高
  • 应用程序因异常而崩溃

疑难解答步骤

故障排除可划分为三种不同的任务,依次为:

  1. 观察和监视应用程序行为
  2. 收集数据
  3. 缓解问题

应用服务在每个步骤提供了多种选项。

1.观察和监视应用程序行为

跟踪服务运行状况

每次发生服务中断或性能下降时 Azure 会进行宣传。 可以在 Azure 门户中跟踪服务的运行状况。 有关详细信息,请参阅跟踪服务的运行状况

监视应用

此选项可让你找出应用程序是否存在任何问题。 在应用的边栏选项卡中,单击“请求和错误”磁贴。 “指标”边栏选项卡显示所有可以添加的指标。

可能需要在应用中监视的一些指标包括

  • 平均内存工作集
  • 平均响应时间
  • CPU 时间
  • 内存工作集
  • 请求

monitor app performance

有关详细信息,请参阅:

监视 Web 终结点状态

如果在“标准”定价层中运行应用,应用服务允许从三个地理位置监视两个终结点。

终结点监视可从测试 Web URL 的响应时间和运行时间的分布式地理位置配置 Web 测试。 该测试可对 Web URL 执行 HTTP GET 操作,以从每个位置确定响应时间和运行时间。 每个已配置位置每 5 分钟运行一次测试。

使用 HTTP 响应代码监视运行时间,并且以毫秒为单位计算响应时间。 如果 HTTP 响应代码大于或等于 400 或响应时间超过 30 秒,则监视测试失败。 如果从所有指定的位置监视测试均成功,则终结点被视为可用。

有关详细信息,请参阅在 Azure 应用服务中监视应用

使用扩展的应用程序性能监视

还可以使用站点扩展监视应用程序的性能。

每个应用服务应用都提供了一个可扩展的管理终结点,通过此终结点可使用一组作为站点扩展部署的功能强大的工具。 扩展包括:

  • 源代码编辑器,如 Azure DevOps
  • 连接的资源(如连接到应用的 MySQL 数据库)的管理工具。

2.收集数据

应用服务为 Web 服务器和 Web 应用程序中的日志记录信息提供诊断功能。 此信息分为 Web 服务器诊断和应用程序诊断。

启用 Web 服务器诊断

可以启用或禁用以下种类的日志:

  • 详细错误日志记录 - 指示故障的 HTTP 状态代码(状态代码 400 或更大数字)的详细错误消息。 其中可能包含有助于确定服务器返回错误代码的原因的信息。
  • 失败请求跟踪 - 有关失败请求的详细信息,包括对用于处理请求的 IIS 组件和每个组件所用的时间的跟踪。 在尝试提高应用性能或查找导致特定 HTTP 错误的问题时,此信息很有用。
  • Web 服务器日志记录 - 使用 W3C 扩展日志文件格式的 HTTP 事务信息。 这在确定总体应用指标(如处理的请求数量或来自特定 IP 地址的请求数)时非常有用。

启用应用程序诊断

可通过多种选项收集应用服务中的应用程序性能数据、从 Visual Studio 中实时分析应用程序,或修改应用程序代码以记录更多信息和跟踪。 可以基于针对应用程序的访问权限和通过监视工具观察到的内容选择相关选项。

使用 Application Insights Profiler

可以启用 Application Insights Profiler 开始捕获详细的性能跟踪。 需要调查过去发生的问题时,可以访问最多五日天前捕获的跟踪。 只要有权访问 Azure 门户中应用的 Application Insights 资源,就可以选择此选项。

Application Insights Profiler 提供每个 Web 调用响应时间的统计信息,以及指示哪一行代码导致响应缓慢的跟踪信息。 有时应用服务应用运行速度慢,因为某些代码不是以高性能方式编写的。 示例包括可并行运行的顺序代码和不需要的数据库锁争用。 删除代码中的这些瓶颈会提高应用性能,但是如果不设置详细的跟踪和日志,则很难检测到这些瓶颈。 Application Insights Profiler 收集的跟踪信息有助于识别减慢应用程序速度的代码行,还有助于为应用服务应用解决这一挑战。

有关详细信息,请参阅使用 Application Insights 分析 Azure 应用服务中的实时应用

使用远程分析

在 Azure 应用服务中,可以远程分析 Web 应用、API 应用、移动后端和 WebJobs。 如果有权访问应用资源并且知道如何再现问题,或者知道出现性能问题的确切时间间隔,请选择此选项。

远程分析非常有用,如果进程的 CPU 使用率偏高并且进程运行速度比预期缓慢,或者 HTTP 请求的延迟高于平时,可以远程分析进程并获取 CPU 采样调用堆栈,以分析进程活动和代码繁忙的路径。

有关详细信息,请参阅 Azure 应用服务中的远程分析支持

手动设置诊断跟踪

如果有权访问 Web 应用程序源代码,使用应用程序诊断可以捕获 Web 应用程序生成的信息。 ASP.NET 应用程序可使用 System.Diagnostics.Trace 类将信息记录到应用程序诊断日志。 但是需要更改代码并重新部署应用程序。 如果应用在测试环境中运行,则推荐使用此方法。

有关如何在应用程序中配置日志记录的详细说明,请参阅在 Azure 应用服务中启用应用的诊断日志记录

使用诊断工具

应用服务提供了智能的交互式体验,可帮助我们排查应用的问题,且无需配置。 如果应用确实出现问题,诊断工具会指出问题所在,并引导你获取适当的信息,以便更轻松快速地排查和解决问题。

若要访问应用服务诊断,请在 Azure 门户中导航到你的应用服务应用或应用服务环境。 在左侧导航栏中,单击“诊断并解决问题”。

使用 Kudu 调试控制台

应用服务随附可用于调试、浏览和上传文件的调试控制台,以及用于获取环境相关信息的 JSON 终结点。 此控制台称为应用的 Kudu 控制台或 SCM 仪表板。

转到链接 https://<Your app name>.scm.chinacloudsites.cn/ 即可访问此仪表板。

Kudu 提供的一些信息和功能包括:

  • 应用程序的环境设置
  • 日志流
  • 诊断转储
  • 调试控制台,可以在其中运行 PowerShell cmdlet 和基本 DOS 命令。

Kudu 的另一项有用功能是,如果应用程序引发第一次异常,可以使用 Kudu 和 SysInternals 工具 Procdump 创建内存转储。 这些内存转储是进程的快照,通常可帮助排查较复杂的应用问题。

有关 Kudu 提供的功能的详细信息,请参阅你应该了解的 Azure DevOps 工具

3.缓解问题

缩放应用

在 Azure 应用服务中,为了提高性能和吞吐量,可以调整运行应用程序的规模。 纵向扩展应用涉及到两个相关操作:将应用服务计划更改为较高的定价层,以及在切换到较高的定价层后配置特定的设置。

有关缩放的详细信息,请参阅缩放 Azure 应用服务中的应用

此外,可以选择在多个实例上运行应用程序。 扩展不仅能提供更强大的处理功能,而且还能提供一定程度的容错。 如果进程在某个实例上中断,其他实例会继续处理请求。

可以将缩放设置为手动或自动。

使用 AutoHeal

AutoHeal 会根据你选择的设置(例如配置更改、请求、基于内存的限制或执行请求所需的时间),回收应用程序的工作进程。 在大多数情况下,回收进程是在出现问题后进行恢复的最快方式。 尽管始终都可从 Azure 门户中直接重启应用,但 AutoHeal 可以自动执行此操作。 只需在应用的根 web.config 中添加一些触发器即可。 即使应用程序并非 .NET 应用,这些设置的工作方式也仍然相同。

有关详细信息,请参阅 自动修复 Azure 网站

重启应用

重启通常是在发生一次性问题后进行恢复的最简单方式。 Azure 门户的应用边栏选项卡中提供了用于停止或重启应用的选项。

restart app to solve performance issues

还可以使用 Azure Powershell 管理应用。 有关详细信息,请参阅将 Azure PowerShell 与 Azure 资源管理器配合使用