排查 Azure VM 扩展问题
本文提供了故障排查步骤,可帮助你解决与 VM 代理和扩展相关的 Azure Site Recovery 错误。
系统资源不足
如果系统内存不足,且无法为移动服务安装分配内存,则会出现此问题。 确保已释放足够的内存,以便安装继续进行并成功完成。
Azure Site Recovery 扩展超时
错误消息:“跟踪要启动的扩展操作时,任务执行超时”
错误代码:“151076”
Azure Site Recovery 在启用保护作业时在虚拟机上安装了一个扩展。 以下任何条件都可能阻止触发保护并导致作业失败。 完成以下故障排除步骤,然后重试操作:
错误消息:“之前的 Site Recovery 扩展操作花费的时间比预期更多。”
错误代码:“150066”
由于 VM 代理无响应,保护失败
错误消息:“跟踪要启动的扩展操作时,任务执行超时。”
错误代码:“151099”
如果虚拟机中的 Azure 来宾代理未处于就绪状态,则会发生此错误。
可以在 Azure 门户中检查 Azure 来宾代理的状态。 转到你尝试保护的虚拟机,在“VM”>“设置”>“属性”>“代理状态”中检查状态。 大多数情况下,重新启动虚拟机后,代理的状态是准备就绪。 但是,如果无法重启或仍然面临问题,请完成以下故障排除步骤:
错误消息:“跟踪要启动的扩展操作时,任务执行超时。”
错误代码:“151095”
如果 Linux 计算机上的代理版本过时,则可能发生此错误。 请完成以下故障排除步骤:
原因和解决方案
代理安装在 VM 中,但无响应(针对 Windows VM)
解决方案
VM 代理可能已损坏或服务可能已停止。 重新安装 VM 代理可帮助获取最新版本。 此外,还有助于与服务重新开始通信。
- 确定 Azure 来宾代理服务是否在 VM 服务 (services.msc) 中运行。 重启 Azure 来宾代理服务。
- 如果“Azure 来宾代理”服务在“服务”中不可见,请打开“控制面板”。 转到“程序和功能”来查看是否安装了“Windows 来宾代理”服务。
- 如果“程序和功能”中显示了 Azure 来宾代理,请将其卸载。
- 下载并安装最新版本的代理 MSI。 必须拥有管理员权限才能完成安装。
- 检查服务中是否显示了“Azure 来宾代理”服务。
- 重启保护作业。
此外,检查是否在 VM 中安装了 Microsoft .NET 4.5。 需要具有 .NET 4.5,VM 代理才能与该服务进行通信。
VM 中安装的代理已过时(针对 Linux VM)
解决方案
对于 Linux VM,与代理或扩展相关的大多数失败都是由于影响过时的 VM 代理的问题所造成的。 若要解决此问题,请遵循以下通用准则:
按照更新 Linux VM 代理的说明进行操作。
注意
强烈建议 只通过分发存储库更新代理。 建议不要直接从 GitHub 下载代理代码并将其更新。 如果你的分发没有可用的最新代理,请联系分发支持部门,了解如何安装最新代理。 若要检查最新代理,请转到 GitHub 存储库中的 Azure Linux 代理 页。
运行以下命令,确保 Azure 代理可在 VM 上运行:
ps -e
如果该进程未运行,请使用以下命令进行重启:
- 对于 Ubuntu:
sudo systemctl enable --now walinuxagent.service
- 对于其他分发版:
sudo systemctl enable --now waagent.service
启用对虚拟机的保护。
Site Recovery 扩展未能更新或加载
扩展状态显示为“空”、“未就绪”或“正在转换”。
解决方案
卸载扩展并再次重启操作。
卸载扩展:
- 在 Azure 门户中,找到备份失败的 VM。
- 选择“设置” 。
- 选择“扩展”。
- 选择“Site Recovery 扩展”。
- 选择“卸载” 。
对于 Linux VM,如果 VMSnapshot 扩展未显示在 Azure 门户中,请更新 Azure Linux 代理。 然后运行保护。
完成这些步骤后,会在保护期间重新安装扩展。
后续步骤
- 排查通过 RDP 连接到 Windows VM 的问题
- 排查通过 SSH 连接到 Linux VM 的问题