通过 Windows Admin Center 中的 Azure Stack HCI 排查软件定义网络部署问题

适用于:Azure Stack HCI 版本 22H2、Windows Server 2022、Windows Server 2019

本文介绍如何排查在使用 Windows Admin Center 部署 SDN 组件时可能遇到的问题。 在创建支持票证之前,请先使用本指南排查问题。 本文还提供有关如何在成功排查问题后收集日志的说明,以帮助诊断部署失败的原因。

排查超时错误

如果为各种 SDN 组件(包括网络控制器、软件负载均衡器或网关)部署虚拟机 (VM) 超时,你会看到以下错误:

....在 1800 秒超时后尚未准备就绪。

在部署网络控制器、软件负载均衡器或网关期间,你可能会在 Windows Admin Center 中看到此消息。

若要通过 Windows Admin Center 识别 SDN 部署失败的原因并进行故障排除,请执行以下检查:

完成这些检查并通过故障排除解决所有已识别的问题后,再次部署 SDN。 我们还建议收集日志以确定 SDN VM 部署失败的原因。

下载正确的 VHDX 文件

必须下载 Azure Stack HCI 操作系统的虚拟硬盘以用于 SDN 基础结构 VM(网络控制器、软件负载均衡器、网关)。 有关下载说明,请参阅下载 VHDX 文件

验证管理网络 VLAN 的连接

如果管理网络 VLAN 与 Azure Stack HCI 之间未建立连接,则 VM 部署会超时。

按照以下步骤验证管理网络 VLAN 的连接:

  1. 确保你有权访问现有的 Azure Stack HCI 群集和管理网络 VLAN。

  2. 在 Windows Admin Center 中,使用任何受支持的操作系统在 Azure Stack HCI 群集上创建新的 VM

  3. 将已分配到管理网络的同一个 IP 地址分配到新 VM。

  4. 在新 VM 所在的主机上为该 VM 配置相同的 VLAN。

  5. 若要确认是否为新 VM 分配了正确的 IP 地址并排查任何重复地址问题,请在新 VM 上运行 ipconfig /all 命令。

  6. 验证新 VM 是否可以 ping 通 Azure Stack HCI 主机,反之亦然。

  7. 检查新 VM 是否可与管理网络的 DNS 服务器和默认网关通信。

  8. 使用部署 SDN VM 期间提供的相同凭据将新 VM 加入同一域。

确保 Windows Defender 和防火墙策略允许建立 WinRM 连接

必须启用 Windows 远程管理 (WinRM) 和 PowerShell 远程处理才能在已部署的网络控制器 VM 上开始进行配置。 如果未启用,则会发生超时错误。

若要验证或启用 WinRM 和 PowerShell 远程处理,请执行以下步骤:

  1. 在 Windows Admin Center 中,与网络控制器 VM 建立远程 PowerShell 会话。

    Enter-PSSession NCVMExample
    
    • 如果你能够进入远程会话,则表示域管理员已设置网络策略。 若要通过 Windows Admin Center 成功部署 SDN,请查看这些策略并确保它们允许 WinRM 和 PowerShell 远程处理。

    • 如果收到以下 WinRM 错误消息,请继续执行本部分所述的操作以解决错误。 示例错误消息:

      Enter-PSSession : Connecting to remote server NCVMExample failed with the following error message : WinRM cannot complete the operation. Verify that the specified computer name is valid, that the computer is accessible over the network, and that a firewall exception for the WinRM service is enabled and allows access from this computer. By default, the WinRM firewall exception for public profiles limits access to remote computers within the same local subnet.

  2. 在本地或使用远程桌面协议 (RDP) 连接登录到网络控制器 VM 之一。

  3. 运行以下命令以禁用 Windows 防火墙:

    Set-NetFirewallProfile -Profile Domain,Public,Private -Enabled False
    
  4. 在 Windows Admin Center 中,再次与网络控制器 VM 建立远程 PowerShell 会话:

    Enter-PSSession NCVMExample
    
  5. 如果你能够进入远程会话,作为临时措施,你可以在其余的网络控制器 VM 上禁用防火墙以完成 SDN 部署。 但是,在应用组策略更新后,此配置更改可能会还原。

验证与 SDN URI 或 SDN 群集的连接

当 Windows Admin Center 首次连接到 SDN 环境,以及当你针对网络控制器运行 PowerShell cmdlet 时,SDN URI 和群集名称非常有用。

如果你无法连接到 SDN URI 或群集名称,请确保已启用动态 DNS。 有关如何启用动态 DNS 的信息,请参阅动态 DNS 更新

启用动态 DNS 后,可以通过完成以下注册步骤来移动 SDNAPI 微服务:

  1. 在 Windows Admin Center 中,与网络控制器 VM 建立远程 PowerShell 会话。

    Enter-PSSession NCVMExample
    
  2. 运行以下命令,以便与网络控制器 VM 上的 Service Fabric 群集建立连接。

    Connect-ServiceFabricCluster
    
  3. 运行以下命令以移动 SDNAPI 微服务:

    Move-ServiceFabricPrimaryReplica -ServiceName fabric:/NetworkController/ApiService
    
  4. 等待大约五分钟,然后 ping 网络控制器 URI 名称。

    Ping nchci.contoso.com
    

收集 SDN 组件的日志

成功排查部署问题后,我们建议收集日志来确定 SDN VM 部署失败的原因。

按照以下步骤收集 SDN VM 的来宾日志:

  1. 使用 Windows Admin Center 或 Hyper-V 主机连接到要收集其日志的 SDN VM。

    提示

    如果使用 Hyper-V 主机登录到 VM 后未看到“Hyper-V”屏幕,请按 Shift + F10 键打开命令提示符。

  2. 转到 C: 驱动器并收集应答文件 (unattend.xml)。

  3. 若要获取 VM 部署历史记录详细信息,请转到 C:\Windows\Panther 文件夹并收集该文件夹的整个内容。

  4. 若要收集服务器上的 SDN 日志,请连接到 Azure Stack HCI 群集的第一个物理节点。 在“工具”>“文件和文件共享”>“此电脑”>“C:”>“文档和设置”下找到 SDN 日志文件