排查 Azure Stack Hub 中的问题

本文提供 Azure Stack Hub 集成环境的故障排除信息。

常见问题

这些部分包括指向文档的链接,这些文档涵盖发送到 Azure 支持的常见问题。

购买注意事项

更新和诊断

虚拟机客户机支持的操作系统和大小

Azure Marketplace

管理容量

内存

若要增加 Azure Stack Hub 的总可用内存容量,可以添加额外的内存。 在 Azure Stack Hub 中,物理服务器也称为缩放单元节点。 属于单个缩放单元成员的所有缩放单元节点必须具有相同 的内存量

保留期

保留期设置允许云作员指定一个时间段(介于 0 到 9999 天之间),在此期间可以恢复任何已删除的帐户。 默认保留期设置为 0 天。 将值设置为 0 意味着任何已删除的帐户会立即退出保留状态,并标记为定期垃圾回收。

安全性、合规性和标识

管理 RBAC

Azure Stack Hub 中的用户可以是订阅、资源组或服务的每个实例的读取者、所有者或参与者。

如果 Azure 资源的内置角色不能满足组织的特定需求,则你可以创建自己的自定义角色。 对于本教程,你将使用 Azure PowerShell 创建名为 Reader Support Tickets 的自定义角色。

以 CSP 身份管理使用情况和计费

选择用于 Azure Stack Hub 的共享服务帐户的类型。 可以用来注册多租户 Azure Stack Hub 的订阅类型为:

  • 云解决方案提供商
  • 合作伙伴共享服务订阅

获取缩放单元指标

可以使用 PowerShell 获取印花利用率信息,而无需 Azure 支持人员提供帮助。 获取戳记使用率:

  1. 创建 PEP 会话

  2. 运行下面的命令:

    Test-AzureStack
    
  3. 退出 PEP 会话。

  4. 使用 Invoke-Command 调用运行以下命令:

    Get-AzureStackLog -FilterByRole SeedRing
    
  5. 提取 seedring .zip。 可以从运行 Test-AzureStack位置的 ERCS 文件夹中获取验证报告。

有关详细信息,请参阅 Azure Stack Hub 诊断

对虚拟机(VM)进行故障排除

重置 Linux VM 密码

如果忘记了 Linux VM 的密码,并且由于 VMAccess 扩展问题而 重置密码 选项不起作用,可以按照以下步骤执行重置:

  1. 选择要用作恢复 VM 的 Linux VM。

  2. 登录到用户门户:

    1. 记下 VM 大小、NIC、公共 IP、NSG 和数据磁盘。
    2. 停止受影响的 VM。
    3. 删除受影响的 VM。
    4. 将受影响 VM 中的磁盘附加为恢复 VM 上的数据磁盘(可能需要几分钟才能让磁盘可用)。
  3. 登录到恢复 VM 并运行以下命令:

    sudo su -
    mkdir /tempmount
    fdisk -l
    mount /dev/sdc2 /tempmount /*adjust /dev/sdc2 as necessary*/
    chroot /tempmount/
    passwd root /*substitute root with the user whose password you want to reset*/
    rm -f /.autorelabel /*Remove the .autorelabel file to prevent a time consuming SELinux relabel of the disk*/
    exit /*to exit the chroot environment*/
    umount /tempmount
    
  4. 登录到用户门户:

    1. 从恢复 VM 拆离该磁盘。
    2. 从磁盘重新创建 VM。
    3. 请务必从以前的 VM 传输公共 IP、附加数据磁盘等。

还可以拍摄原始磁盘的快照,并从中创建新磁盘,而不是直接在原始磁盘上执行更改。 有关详细信息,请参阅以下主题:

预配期间 Windows Server 2012 R2 许可证激活失败

在这种情况下,Windows 无法激活,屏幕右下角会显示水印。 位于 C:\Windows\Panther 下的 WaSetup.xml 日志包含以下事件:

<Event time="2019-05-16T21:32:58.660Z" category="ERROR" source="Unattend">
    <UnhandledError>
        <Message>InstrumentProcedure: Failed to execute 'Call ConfigureLicensing()'. Will raise error to caller</Message>
        <Number>-2147221500</Number>
        <Description>Could not find the VOLUME_KMSCLIENT product</Description>
        <Source>Licensing.wsf</Source>
    </UnhandledError>
</Event>

若要激活许可证,请复制要激活的 SKU 的自动虚拟机激活(AVMA)密钥。

版本 AVMA 密钥
数据中心 Y4TGP-NPTV9-HTC2H-7MGQ3-DV4TW
标准 DBGBW-NPF86-BJVTX-K3WKJ-MTB6V
Essentials K2XGM-NMBT3-2R6Q8-WF2FK-P36R2

在 VM 上运行以下命令:

slmgr /ipk <AVMA_key>

有关完整详细信息,请参阅 VM 激活

在 Azure Stack Hub 中部署虚拟机之前,必须先添加 Windows Server 映像和图库项。

我删除了一些 VM,但仍会看到磁盘上的 VHD 文件

此行为是设计使然。

  • 删除 VM 时,不会删除 VHD。 磁盘是资源组中的单独资源。
  • 删除存储帐户后,该删除会立即通过 Azure 资源管理器显示。 但是,它可能包含的磁盘仍然保留在存储中,直到垃圾回收机制运行。

如果看到“孤立”VHD,请务必确认它们是否属于已删除存储帐户的文件夹。 如果未删除存储帐户,则它们仍然在那里是正常的。

可以在 管理存储帐户中详细了解如何配置保留阈值和按需回收。

排查存储问题

存储空间回收

回收容量可能需要长达 14 小时才能显示在门户网站上。 空间回收取决于不同的因素,包括块 Blob 存储中内部容器文件的用量百分比。 因此,根据删除的数据量,运行垃圾回收器时,无法保证能回收多少空间。

Azure 存储资源管理器无法与 Azure Stack Hub 协同工作

如果在断开连接的情况下使用集成系统,建议使用企业证书颁发机构(CA)。 以 Base-64 格式导出根证书,然后在 Azure 存储资源管理器中导入该证书。 确保从资源管理器终结点中删除尾部斜杠 (/)。 有关详细信息,请参阅 准备连接到 Azure Stack Hub

应用服务疑难解答

Create-AADIdentityApp.ps1 脚本失败

如果应用服务所需的 Create-AADIdentityApp.ps1 脚本失败,请确保在运行脚本时包含所需的 -AzureStackAdminCredential 参数。 有关详细信息,请参阅 在 Azure Stack Hub 上部署应用服务的先决条件

对 Azure Stack Hub 更新进行故障排除

Azure Stack Hub 修补程序和更新过程旨在允许作员以一致、简化的方式应用更新包。 虽然不常见,但修补程序和更新过程中可能会出现问题。 如果修补程序和更新过程中遇到问题,建议执行以下步骤:

  1. 先决条件:请确保遵循 更新活动清单启用主动日志收集

  2. 按照在更新失败时创建的失败警报中的补救步骤进行操作。

  3. 如果无法解决问题,请创建 Azure Stack Hub 支持请求。 请确保在问题发生时的时间跨度内收集日志。 如果更新失败(出现严重警报或警告),请务必查看失败情况,并根据警报中的指示联系 Azure 客户支持服务,以便缩放单元长时间不处于失败状态。 将缩放单元长时间处于更新失败状态可能会导致以后更难解决的其他问题。

常见的 Azure Stack Hub 修补程序和更新问题

适用于:Azure Stack Hub 集成系统

准备失败

适用:此问题适用于所有受支持的版本。

原因:尝试安装 Azure Stack Hub 更新时,更新状态可能会失败,并更改为PreparationFailed状态。 对于连接到 Internet 的系统,这通常表明由于 Internet 连接薄弱,更新包无法正确下载。

修正:可以通过再次单击“ 立即安装 ”来解决此问题。 如果问题仍然存在,建议按照 “安装更新 ”部分手动上传更新包。

出现次数:常见

更新失败:请在 CSV 上检查并强制实施外部密钥保护程序

适用:此问题适用于所有受支持的版本。

原因:基板管理控制器(BMC)密码未正确设置。

修正更新 BMC 凭据 并恢复更新。

更新进行过程中报告的警告和错误

适用:此问题适用于所有受支持的版本。

原因:当 Azure Stack Hub 更新处于“ 正在进行”状态时,可能会在门户中报告警告和错误。 组件在升级期间等待其他组件时可能会超时,从而导致错误。 Azure Stack Hub 具有一些因间歇性错误而重试或修正某些任务的机制。

修正:当 Azure Stack Hub 更新处于“ 正在进行”状态时,可以忽略门户中报告的警告和错误。

出现次数:常见

2002 更新失败

适用:此问题仅适用于 2002 版本。

原因:尝试 2002 更新时,更新可能会失败并提供以下消息: The private network parameter is missing from cloud parameters. Please use set-azsprivatenetwork cmdlet to set private networkTrace

修正设置专用内部网络