Condividi tramite

排查配置服务器故障问题

本文可帮助你排查在部署和管理 Azure Site Recovery 配置服务器时遇到的问题。 配置服务器充当管理服务器。 使用配置服务器,通过 Site Recovery 设置本地 VMware 虚拟机(VM)和物理服务器的灾难恢复到 Azure。 以下部分讨论了添加和管理新配置服务器时可能会遇到的最常见故障。

注册失败

安装移动代理时,源计算机将注册到配置服务器。 在执行此步骤时,如果出现任何失败,您可以按照以下指导原则进行调试:

  1. 打开 C:\ProgramData\ASR\home\svsystems\var\configurator_register_host_static_info.log 文件。 该 ProgramData 文件夹可能是隐藏文件夹。

  2. 如果未看到 ProgramData 文件夹,请在文件资源管理器的 “视图 ”选项卡上的“ 显示/隐藏 ”部分中,选中“ 隐藏项目 ”复选框。 多个问题可能会导致失败。

  3. 搜索 找不到有效的 IP 地址的字符串:

    • 如果找到了该字符串:

      1. 验证请求的主机 ID 是否与源计算机的主机 ID 相同。

      2. 验证源计算机是否至少有一个 IP 地址分配给物理网络接口卡(NIC)。 若要将代理成功注册到配置服务器,必须为源计算机的物理 NIC 至少分配一个有效的 IPV4 地址。

      3. 在源计算机上运行以下命令之一,以获取源计算机的所有 IP 地址:

        • Windows> ipconfig /all
        • Linux# ifconfig -a
    • 如果未找到字符串:

      1. 搜索字符串 Reason=>NULL。 如果源计算机使用空主机注册到配置服务器,则会发生此错误。

      2. 如果找到字符串 Reason=>NULL ,请在解决问题后手动重试注册。 请遵循在 配置服务器上注册源计算机中所述的指南进行操作。

        如果未找到字符串 Reason=>NULL

        1. 在源计算机上,打开 C:\ProgramData\ASRSetupLogs\UploadedLogs\ASRUnifiedAgentInstaller.log 该文件。 该 ProgramData 文件夹可能是隐藏文件夹。
        2. 如果未看到 ProgramData 文件夹,请在文件资源管理器的 “视图 ”选项卡上的“ 显示/隐藏 ”部分中,选中“ 隐藏项目 ”复选框。 多个问题可能会导致失败。
  4. 搜索字符串 发布请求:(7) - 无法连接到服务器

    • 如果找到了该字符串:

      1. 解决源计算机与配置服务器之间的网络问题。 验证是否可以使用 ping、traceroute 或 Web 浏览器等网络工具从源计算机访问配置服务器。 确保源计算机可以通过端口 443 访问配置服务器。

      2. 检查源计算机上是否有任何防火墙规则正在阻止源计算机与配置服务器之间的连接。 与网络管理员合作以解决任何连接问题。

      3. 确保防病毒软件中排除Site Recovery 文件夹排除项中列出的文件夹。

      4. 解决网络问题后,遵照将源计算机注册到配置服务器中的指导原则重试注册。

    • 如果未找到字符串:

      1. 在同一日志文件中,查找字符串 请求:(60) - 不能使用给定 CA 证书对等证书进行身份验证。 此错误可能是因为配置服务器证书过期或源计算机不支持传输层安全性 (TLS) 1.0 或更高版本协议。 如果防火墙阻止了源计算机与配置服务器之间的 TLS 通信,则也可能会发生此错误。

      2. 如果字符串 请求:(60) - 找不到使用给定 CA 证书进行身份验证的对等证书

        1. 使用源计算机上的 Web 浏览器连接到配置服务器 IP 地址。 使用 URI https:\/\/<configuration server IP address\>:443/。 确保源计算机可以通过端口 443 访问配置服务器。
        2. 检查是否需要在源计算机上添加或删除任何防火墙规则,使源计算机能够与配置服务器通信。 由于使用的防火墙软件多种多样,我们无法列出全部所需的防火墙配置。 请与网络管理员合作以解除任何连接问题。
        3. 确保将防病毒软件中列出的Site Recovery 文件夹排除项中的文件夹排除在外。
        4. 解决问题后,按照配置 服务器注册源计算机中的准则重试注册。
  5. 在 Linux 上,如果平台 <INSTALLATION_DIR\>/etc/drscout.conf 的值已损坏,注册将失败。 若要识别此问题,请打开 /var/log/ua_install.log 该文件。 搜索字符串 由于 VM_PLATFORM 值为空或不是 VmWare/Azure,正在终止配置。 平台应设置为 VmWareAzuredrscout.conf如果文件已损坏,建议卸载移动代理,然后重新安装移动代理。 如果卸载失败,请执行以下步骤:

    1. 打开Installation_Directory/uninstall.sh文件,并注释掉函数StopServices的调用。

    2. 打开Installation_Directory/Vx/bin/uninstall.sh文件,并注释掉函数stop_services的调用。

    3. Installation_Directory/Fx/uninstall.sh文件打开,并注释掉用于尝试停止 Fx 服务的整段内容。

    4. 卸载移动代理。 成功卸载后,重新启动系统,然后尝试安装移动代理。

  6. 确保未为用户帐户启用多重身份验证(MFA)。 目前,Site Recovery 不支持用户帐户的 MFA。 在未启用 MFA 的用户帐户的情况下注册配置服务器。

安装失败:无法加载帐户

当服务安装移动代理并注册到配置服务器时,无法从传输连接读取数据时,会发生此错误。 若要解决此问题,请确保在源计算机上启用 TLS 1.0。

vCenter 发现失败

若要解决 vCenter 发现失败,请将 vCenter 服务器添加到 byPass 列表代理设置:

  • PsExec从 PsExec v2.43 下载该工具以访问系统用户内容。
  • 通过运行以下命令行在系统用户内容中打开 Internet Explorer: psexec -s -i "%programfiles%\Internet Explorer\iexplore.exe"
  • 在 Internet Explorer 中添加代理设置并重启 tmanssvc 服务。
  • 若要配置灾难恢复体系结构的代理设置,请运行以下命令: cd C:\Program Files\Azure Site Recovery Provider
  • 运行 DRCONFIGURATOR.EXE /configure /AddBypassUrls [add IP Address/FQDN of vCenter Server provided during the Configure vCenter Server/vSphere ESXi server step of [Configuration Server deployment](vmware-azure-deploy-configuration-server.md#configure-settings)]

更改配置服务器的 IP 地址

我们强烈建议不要更改配置服务器的 IP 地址。 确保分配给配置服务器的所有 IP 是静态 IP 地址。 请勿使用动态主机配置协议 IP 地址。

ACS50008: SAML 令牌无效

若要避免此错误,请确保系统时钟上的时间与本地时间之间的偏差不超过 15 分钟。 重新运行安装程序以完成注册。

无法创建证书

无法创建用于在 Site Recovery 中进行身份验证的证书。 确保以本地管理员的身份运行安装程序后,重新运行安装程序。

无法将 Windows 许可证从服务器标准评估激活到服务器标准版

  1. 作为通过 Open Virtualization Format(OVF)进行配置服务器部署的一部分,将使用评估许可证,该许可证有效期为 180 天。 需要在许可证过期之前激活此许可证。 否则,配置服务器可能会频繁关闭,这会妨碍复制活动。
  2. 如果无法激活 Windows 许可证,请联系 Windows 支持团队 来解决此问题。

将源计算机注册到配置服务器

如果源计算机运行 Windows

在源计算机上运行以下命令:

  cd C:\Program Files (x86)\Azure Site Recovery\agent
  UnifiedAgentConfigurator.exe  /CSEndPoint <configuration server IP address> /PassphraseFilePath <passphrase file path>
设置 详细信息
使用情况 UnifiedAgentConfigurator.exe /CSEndPoint <configuration server IP address\> /PassphraseFilePath <passphrase file path\>
代理配置日志 位于%ProgramData%\ASRSetupLogs\ASRUnifiedAgentConfigurator.log.
/CSEndPoint 必需的参数。 指定配置服务器的 IP 地址。 使用任何有效的 IP 地址。
/PassphraseFilePath 必需。 通行短语的位置。 使用任何有效的通用命名约定或本地文件路径。

如果源计算机运行 Linux

在源计算机上运行以下命令:

  /usr/local/ASR/Vx/bin/UnifiedAgentConfigurator.sh -i <configuration server IP address> -P /var/passphrase.txt
设置 详细信息
使用情况 cd /usr/local/ASR/Vx/bin

UnifiedAgentConfigurator.sh -i <configuration server IP address\> -P <passphrase file path\>
-i 必需的参数。 指定配置服务器的 IP 地址。 使用任何有效的 IP 地址。
-P 必需。 通行短语所保存到的文件的完整文件路径。 使用任何有效文件夹。

无法配置配置服务器

如果在 VM 上安装配置服务器以外的应用程序,则可能无法配置主目标。

配置服务器必须是单一用途服务器。 不支持将其用作共享服务器。

有关详细信息,请参阅部署配置服务器中的配置常见问题解答。

从配置服务器数据库中删除受保护项的过时条目

若要删除配置服务器上的过时受保护计算机,请执行以下步骤:

  1. 确定过时条目的源计算机和 IP 地址:

    1. 在管理员模式下打开 MYSQL 命令行。

    2. 运行以下命令:

      mysql> use svsdb1;
      mysql> select id as hostid, name, ipaddress, ostype as operatingsystem, from_unixtime(lasthostupdatetime) as heartbeat from hosts where name!='InMageProfiler'\G;
      

      此命令返回已注册计算机的列表,以及它们的 IP 地址和最后一次心跳。 查找具有失效复制对的主机。

  2. 打开管理员权限的命令提示符并转到 C:\ProgramData\ASR\home\svsystems\bin

  3. 若要从配置服务器中删除已注册的主机详细信息和过时条目信息,请使用源计算机和过时条目的 IP 地址运行以下命令。

    Syntax: Unregister-ASRComponent.pl -IPAddress <IP_ADDRESS_OF_MACHINE_TO_UNREGISTER> -Component <Source/ PS / MT>

    如果源服务器条目的 "OnPrem-VM01" IP 地址为 10.0.0.4,请改用以下命令:

    perl Unregister-ASRComponent.pl -IPAddress 10.0.0.4 -Component Source

  4. 重启源计算机上的以下服务,以重新注册配置服务器:

    • InMage Scout 应用程序服务
    • InMage Scout VX 代理 - Sentinel/Outpost

服务无法停止时升级失败

当某些服务未停止时,配置服务器升级会失败。

若要确定问题,请转到 C:\ProgramData\ASRSetupLogs\CX_TP_InstallLogFile 配置服务器。 如果发现以下错误,请按照以下步骤解决问题:

2018-06-28 14:28:12.943   Successfully copied php.ini to C:\Temp from C:\thirdparty\php5nts
2018-06-28 14:28:12.943   svagents service status - SERVICE_RUNNING
2018-06-28 14:28:12.944   Stopping svagents service.
2018-06-28 14:31:32.949   Unable to stop svagents service.
2018-06-28 14:31:32.949   Stopping svagents service.
2018-06-28 14:34:52.960   Unable to stop svagents service.
2018-06-28 14:34:52.960   Stopping svagents service.
2018-06-28 14:38:12.971   Unable to stop svagents service.
2018-06-28 14:38:12.971   Rolling back the install changes.
2018-06-28 14:38:12.971   Upgrade has failed.

若要解决问题,请执行以下操作:

手动停止以下服务:

  • cxprocessserver
  • InMage Scout VX 代理 – Sentinel/Outpost
  • Azure 恢复服务 (MARS) 代理
  • Azure Site Recovery
  • tmansvc

若要更新配置服务器,请再次运行 统一安装程序

Microsoft Entra 应用程序创建失败

你没有足够的权限使用 OVA 模板在 Microsoft Entra ID 中创建应用程序。

若要解决此问题,请登录到 Azure 门户并选择以下选项之一:

进程服务器/主目标无法与配置服务器通信

进程服务器和主目标 (MT) 模块无法与配置服务器通信。 在 Azure 门户中,其状态显示为未连接。

通常,由于端口 443 出错,因此会出现此问题。 使用以下步骤来解除端口阻止并重新启用与配置服务器的通信。

验证 MARS 代理是否由主目标代理调用

若要验证主目标代理(MTA)是否可以为配置服务器 IP 创建 TCP 会话,请在 MTA 日志中查找类似于以下跟踪的跟踪:

TCP \<Replace IP with CS IP here>:52739 \<Replace IP with CS IP here>:443 SYN_SENT

TCP 192.168.1.40:52739 192.168.1.40:443 SYN_SENT // Replace IP with CS IP here

如果在 MTA 日志中发现以下类似的踪迹,MTA 会在端口 443 上报错:

#~> (11-20-2018 20:31:51):   ERROR  2508 8408 313 FAILED : PostToSVServer with error [at curlwrapper.cpp:CurlWrapper::processCurlResponse:212]   failed to post request: (7) - Couldn't connect to server
#~> (11-20-2018 20:31:54):   ERROR  2508 8408 314 FAILED : PostToSVServer with error [at curlwrapper.cpp:CurlWrapper::processCurlResponse:212]   failed to post request: (7) - Couldn't connect to server

当其他应用程序也使用端口 443 或防火墙设置阻止端口时,可能会出现此错误。

若要解决问题,请执行以下操作:

  • 验证防火墙是否未阻止端口 443。
  • 如果端口由于使用该端口的另一个应用程序而无法访问,请停止并卸载该应用。
    • 如果停止应用不可行,请设置新的干净配置服务器。
  • 重启配置服务器。
  • 重启 Internet Information Services。

由于 UUID 条目不正确,配置服务器未连接

当数据库中有多个配置服务器实例普遍唯一标识符(UUID)条目时,可能会出现此错误。 此问题经常在克隆配置服务器 VM 时发生。

若要解决问题,请执行以下操作:

  1. 从 vCenter 中删除过时/旧的配置服务器 VM。 有关详细信息,请参阅删除服务器并禁用保护

  2. 登录到配置服务器 VM 并连接到 MySQL svsdb1 数据库。

  3. 运行以下查询:

    重要

    验证是否输入克隆的配置服务器的 UUID 详细信息或不再用于保护 VM 的配置服务器的过时条目。 输入不正确的 UUID 会导致丢失所有现有受保护项的信息。

        MySQL> use svsdb1;
        MySQL> delete from infrastructurevms where infrastructurevmid='<Stale CS VM UUID>';
        MySQL> commit; 
    
  4. 刷新门户页面。

输入凭据时,将发生无限登录循环

在配置服务器 OVF 上输入正确的用户名和密码后,Azure 登录将继续提示输入正确的凭据。

系统时间不正确时可能会发生此问题。

若要解决此问题,请在计算机上设置正确的时间,然后重试登录。