排查 Azure VM 扩展问题

本文提供了故障排查步骤,可帮助你解决与 VM 代理和扩展相关的 Azure Site Recovery 错误。

系统资源不足

如果系统内存不足,且无法为移动服务安装分配内存,则会出现此问题。 确保已释放足够的内存,以便安装继续进行并成功完成。

Azure Site Recovery 扩展超时

错误消息:“跟踪要启动的扩展操作时,任务执行超时”
错误代码:“151076”

Azure Site Recovery 在启用保护作业时在虚拟机上安装了一个扩展。 以下任何条件都可能阻止触发保护并导致作业失败。 完成以下故障排除步骤,然后重试操作:

错误消息:“之前的 Site Recovery 扩展操作花费的时间比预期更多。”
错误代码:“150066”

由于 VM 代理无响应,保护失败

错误消息:“跟踪要启动的扩展操作时,任务执行超时。”
错误代码:“151099”

如果虚拟机中的 Azure 来宾代理未处于就绪状态,则会发生此错误。

可以在 Azure 门户中检查 Azure 来宾代理的状态。 转到你尝试保护的虚拟机,在“VM”>“设置”>“属性”>“代理状态”中检查状态。 大多数情况下,重新启动虚拟机后,代理的状态是准备就绪。 但是,如果无法重启或仍然面临问题,请完成以下故障排除步骤:

错误消息:“跟踪要启动的扩展操作时,任务执行超时。”
错误代码:“151095”

如果 Linux 计算机上的代理版本过时,则可能发生此错误。 请完成以下故障排除步骤:

原因和解决方案

代理安装在 VM 中,但无响应(针对 Windows VM)

解决方案

VM 代理可能已损坏或服务可能已停止。 重新安装 VM 代理可帮助获取最新版本。 此外,还有助于与服务重新开始通信。

  1. 确定 Azure 来宾代理服务是否在 VM 服务 (services.msc) 中运行。 重启 Azure 来宾代理服务。
  2. 如果“Azure 来宾代理”服务在“服务”中不可见,请打开“控制面板”。 转到“程序和功能”来查看是否安装了“Windows 来宾代理”服务。
  3. 如果“程序和功能”中显示了 Azure 来宾代理,请将其卸载。
  4. 下载并安装最新版本的代理 MSI。 必须拥有管理员权限才能完成安装。
  5. 检查服务中是否显示了“Azure 来宾代理”服务。
  6. 重启保护作业。

此外,检查是否在 VM 中安装了 Microsoft .NET 4.5。 需要具有 .NET 4.5,VM 代理才能与该服务进行通信。

VM 中安装的代理已过时(针对 Linux VM)

解决方案

对于 Linux VM,与代理或扩展相关的大多数失败都是由于影响过时的 VM 代理的问题所造成的。 若要解决此问题,请遵循以下通用准则:

  1. 按照更新 Linux VM 代理的说明进行操作。

    注意

    强烈建议 只通过分发存储库更新代理。 建议不要直接从 GitHub 下载代理代码并将其更新。 如果你的分发没有可用的最新代理,请联系分发支持部门,了解如何安装最新代理。 若要检查最新代理,请转到 GitHub 存储库中的 Azure Linux 代理 页。

  2. 运行以下命令,确保 Azure 代理可在 VM 上运行:ps -e

    如果该进程未运行,请使用以下命令进行重启:

    • 对于 Ubuntu:
       sudo systemctl enable --now walinuxagent.service
    
    • 对于其他分发版:
       sudo systemctl enable --now waagent.service
    
  3. 配置自动重启代理

  4. 启用对虚拟机的保护。

Site Recovery 扩展未能更新或加载

扩展状态显示为“空”、“未就绪”或“正在转换”。

解决方案

卸载扩展并再次重启操作。

卸载扩展:

  1. Azure 门户中,找到备份失败的 VM。
  2. 选择“设置” 。
  3. 选择“扩展”。
  4. 选择“Site Recovery 扩展”
  5. 选择“卸载” 。

对于 Linux VM,如果 VMSnapshot 扩展未显示在 Azure 门户中,请更新 Azure Linux 代理。 然后运行保护。

完成这些步骤后,会在保护期间重新安装扩展。