排查 Azure Stack Hub 中的问题

本文档提供 Azure Stack Hub 集成环境的故障排除信息。 有关 Azure Stack 开发工具包的帮助,请参阅 ASDK 故障排除或获取 Azure Stack Hub MSDN 论坛上的专家帮助。

常见问题

这些部分包含有关发送到 Azure 支持的常见问题的文档链接。

购买注意事项

更新和诊断

来宾 VM 支持的操作系统和大小

Azure 市场

管理容量

内存

若要增加 Azure Stack Hub 的总可用内存容量,可以添加更多内存。 在 Azure Stack Hub 中,物理服务器也称为“缩放单元节点”。 属于单个缩放单元的所有缩放单元节点必须具有相同的内存量

保留期

云操作员可以使用保留期设置来指定时间间隔天数(0 到 9999 天),在此期间,任何已删除的帐户都有可能能够恢复。 默认保留期设置为 0 天。 将值设置为 0 表示任何已删除的帐户会立即超出保留期,并标记为定期进行垃圾回收。

安全性、合规性和标识

管理 RBAC

Azure Stack Hub 中的用户可以是订阅、资源组或服务的每个实例的读者、所有者或参与者。

如果 Azure 资源的内置角色不能满足组织的特定需求,则你可以创建自己的自定义角色。 对于本教程,你将使用 Azure PowerShell 创建名为 Reader Support Tickets 的自定义角色。

以 CSP 身份管理使用情况和计费

选择用于 Azure Stack Hub 的共享服务帐户的类型。 可以用来注册多租户 Azure Stack Hub 的订阅类型为:

  • 云解决方案提供商
  • 合作伙伴共享服务订阅

获取缩放单元指标

可以使用 PowerShell 获取戳记使用情况信息,不需 Azure 支持提供帮助。 若要获取戳记使用率,请执行以下操作:

  1. 创建 PEP 会话

  2. 运行以下命令:

    Test-AzureStack
    
  3. 退出 PEP 会话。

  4. 使用 Invoke-Command 调用运行以下命令:

    Get-AzureStackLog -FilterByRole SeedRing
    
  5. 提取 seedring .zip。 可以从运行 Test-AzureStack 的 ERCS 文件夹获取验证报告。

有关详细信息,请参阅 Azure Stack Hub 诊断

排查虚拟机 (VM) 的问题

重置 Linux VM 密码

如果你忘记了 Linux VM 的密码,并且因为 VMAccess 扩展出现问题,“重置密码”选项不起作用,你可执行以下步骤进行重置:

  1. 选择要用作恢复 VM 的 Linux VM。

  2. 登录到用户门户:

    1. 记下 VM 大小、NIC、公共 IP、NSG 和数据磁盘。
    2. 停止受影响的 VM。
    3. 删除受影响的 VM。
    4. 将受影响的 VM 中的磁盘作为数据磁盘附加到恢复 VM 上(可能需要花费几分钟时间才能使用该磁盘)。
  3. 登录到恢复 VM,并运行以下命令:

    sudo su -
    mkdir /tempmount
    fdisk -l
    mount /dev/sdc2 /tempmount /*adjust /dev/sdc2 as necessary*/
    chroot /tempmount/
    passwd root /*substitute root with the user whose password you want to reset*/
    rm -f /.autorelabel /*Remove the .autorelabel file to prevent a time consuming SELinux relabel of the disk*/
    exit /*to exit the chroot environment*/
    umount /tempmount
    
  4. 登录到用户门户:

    1. 从恢复 VM 拆离该磁盘。
    2. 从磁盘重新创建 VM。
    3. 请务必从前一个 VM 传输公共 IP、附加数据磁盘等。

还可以拍摄原始磁盘的快照并从中创建新磁盘,而不是直接在原始磁盘上执行更改。 有关详细信息,请参阅以下主题:

预配期间,Windows Server 2012 R2 的许可证激活失败

在这种情况下,Windows 将无法激活,此时屏幕右下角将显示一个水印。 位于 C:\Windows\Panther 下的 WaSetup.xml 日志包含以下事件:

<Event time="2019-05-16T21:32:58.660Z" category="ERROR" source="Unattend">
    <UnhandledError>
        <Message>InstrumentProcedure: Failed to execute 'Call ConfigureLicensing()'. Will raise error to caller</Message>
        <Number>-2147221500</Number>
        <Description>Could not find the VOLUME_KMSCLIENT product</Description>
        <Source>Licensing.wsf</Source>
    </UnhandledError>
</Event>

若要激活许可证,请复制要激活的 SKU 的自动虚拟机激活 (AVMA) 密钥。

版本 AVMA 密钥
数据中心 Y4TGP-NPTV9-HTC2H-7MGQ3-DV4TW
Standard DBGBW-NPF86-BJVTX-K3WKJ-MTB6V
Essentials K2XGM-NMBT3-2R6Q8-WF2FK-P36R2

在 VM 上运行以下命令:

slmgr /ipk <AVMA_key>

若要获取完整的详细信息,请参阅 VM 激活

在 Azure Stack Hub 中部署 VM 之前,必须先添加 Windows Server 映像和库项。

我已删除某些 VM,但仍在磁盘上看到 VHD 文件

此行为是设计使然:

  • 删除 VM 时,不会删除 VHD。 磁盘是资源组中的独立资源。
  • 删除某个存储帐户后,Azure 资源管理器会立即反映删除结果。 但是,该存储帐户包含的磁盘仍保留在存储中,直到运行垃圾收集为止。

如果看到“孤立的”VHD,必须知道它们是否包含在已删除的存储帐户的文件夹中。 如果未删除存储帐户,则正常情况下会保留这些 VHD。

可以在管理存储帐户中详细了解如何配置保留阈值和按需回收。

排查存储问题

存储回收

回收的容量最长可能需要在 14 小时后才显示在门户中。 空间回收取决于不同的因素,包括块 Blob 存储中内部容器文件的用量百分比。 因此,我们无法保证运行垃圾回收器时可回收的空间量,这取决于删除的数据量。

Azure 存储资源管理器不兼容 Azure Stack Hub

如果在离线场景中使用集成系统,建议使用企业证书颁发机构 (CA)。 以 Base-64 格式导出根证书,然后将其导入 Azure 存储资源管理器。 确保从资源管理器终结点中删除尾部斜杠 (/)。 有关详细信息,请参阅准备连接到 Azure Stack Hub

对应用服务进行故障排除

Create-AADIdentityApp.ps1 脚本失败

如果应用服务所需的 Create-AADIdentityApp.ps1 脚本失败,请确保在运行该脚本时包含必需的 -AzureStackAdminCredential 参数。 有关详细信息,请参阅在 Azure Stack Hub 上部署应用服务的先决条件

对 Azure Stack Hub 更新进行故障排除

Azure Stack Hub 修补程序和更新过程旨在让操作员以一致且简单的方式应用更新包。 虽然不常见,但在修补和更新过程中可能会出现问题。 如果在修补和更新过程中遇到问题,建议执行以下步骤:

  1. 先决条件:请确保已遵循更新活动清单,并启用主动日志收集

  2. 按照在更新失败时创建的失败警报中的补救步骤进行操作。

  3. 如果无法解决问题,请创建 Azure Stack Hub 支持票证。 请确保已针对发生问题的时间跨度收集日志。 如果更新失败(无论是出现关键警报还是出现警告),请务必检查故障并按照警报中的指示联系 Azure 客户支持服务,从而使缩放单元不会长时间处于失败状态。 使缩放单元长时间处于失败的更新状态可能会导致以后更难解决的其他问题。

常见 Azure Stack Hub 修补程序和更新问题

适用于:Azure Stack Hub 集成系统

PreparationFailed

适用于:此问题适用于所有支持的版本。

原因: 尝试安装 Azure Stack Hub 更新时,更新的状态可能会失败并将状态更改为 PreparationFailed。 对于连接到 Internet 的系统,这通常表明由于 Internet 连接不稳定,无法正确下载更新包。

补救措施:可以通过再次单击“立即安装”来解决此问题。 如果此问题仍然存在,建议按照安装更新部分的说明手动上传更新包。

发生率:通用

更新失败:请在 CSV 上检查并强制实施外部密钥保护程序

适用于:此问题适用于所有支持的版本。

原因:基板管理控制器 (BMC) 密码设置不正确。

修正措施更新 BMC 凭据然后继续更新。

更新过程中报告的警告和错误

适用于:此问题适用于所有支持的版本。

原因: 当 Azure Stack Hub 更新处于“正在进行”状态时,可能会在门户中报告警告和错误。 组件在升级期间等待其他组件时可能会超时,从而导致错误。 Azure Stack Hub 有一种机制,可以重试或修正由于间歇性错误导致的一些任务。

补救措施:当 Azure Stack Hub 更新处于“正在进行”状态时,可能会忽略门户中报告的警告和错误。

发生率:通用

2002 更新失败

适用于:此问题仅适用于 2002 版本。

原因: 尝试安装 2002 更新时,更新可能会失败并提供以下消息:The private network parameter is missing from cloud parameters. Please use set-azsprivatenetwork cmdlet to set private networkTrace

补救措施设置专用内部网络