管理 Azure Stack Hub 的存储基础结构

本文介绍 Azure Stack Hub 存储基础结构资源的运行状况和作状态。 这些资源包括存储驱动器和卷。 本主题中的信息可帮助你排查各种问题,例如,无法将驱动器添加到池的问题。

卷状态

若要确定卷所处的状态,请使用以下 PowerShell 命令:

$scaleunit_name = (Get-AzsScaleUnit)[0].name

$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name

Get-AzsVolume -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object VolumeLabel, HealthStatus, OperationalStatus, RepairStatus, Description, Action, TotalCapacityGB, RemainingCapacityGB

以下示例输出显示有一个卷已分离,并且有一个卷已降级/不完整:

VolumeLabel 健康状态 OperationalStatus
ObjStore_1 未知 分离
ObjStore_2 警告 {已降级,不完整}

以下部分列出了运行状况和工作状态:

卷运行状况状态:正常

操作状态 DESCRIPTION
好的 音量正常。
欠佳 数据未均匀写入到各个驱动器。

行动: 请联系支持部门优化存储池中的驱动器使用情况。 在完成之前,请使用以下 https://aka.ms/azurestacklogfiles指南启动日志文件收集过程。 恢复失败的连接后,可能需要从备份还原数据。

卷运行状况状态:警告

如果卷处于“警告”运行状况状态,则表示数据的一个或多个副本不可用,但 Azure Stack Hub 仍可读取至少一个数据副本。

操作状态 DESCRIPTION
运行中 Azure Stack Hub 正在修复卷(例如,在添加或删除驱动器之后)。 修复完成后,卷应该会恢复“正常”运行状况。

操作: 等待 Azure Stack Hub 完成修复卷,然后检查状态。
不完整 由于一个或多个驱动器出现故障或缺失,卷的复原能力下降。 但是,缺失的驱动器包含数据的最新副本。

行动: 重新连接任何缺失的驱动器,替换任何失败的驱动器,并联机所有脱机的服务器。
已降级 由于一个或多个驱动器出现故障或缺失,并且驱动器上的数据副本已过时,因此卷的复原能力下降。

行动: 重新连接任何缺失的驱动器,替换任何失败的驱动器,并联机所有脱机的服务器。

卷运行状况:不正常

如果某个卷处于“不正常”运行状况状态,该卷上的部分或所有数据当前将不可访问。

操作状态 DESCRIPTION
无冗余 由于过多的驱动器出现故障,该卷已丢失数据。

行动: 请联系支持人员。 在完成之前,请使用以下 https://aka.ms/azurestacklogfiles指南启动日志文件收集过程。

运行状况状态:未知

如果虚拟磁盘已分离,卷也有可能处于“未知”运行状况状态。

操作状态 DESCRIPTION
分离 某个存储设备出现故障,从而可能导致卷不可访问。 某些数据可能会丢失。

操作:
1.检查所有存储设备的物理和网络连接。
2.如果所有设备都正确连接,请联系支持人员。 在完成之前,请使用以下 https://aka.ms/azurestacklogfiles指南启动日志文件收集过程。 恢复失败的连接后,可能需要从备份还原数据。

驱动器状态

使用以下 PowerShell 命令监视驱动器的状态:

$scaleunit_name = (Get-AzsScaleUnit)[0].name

$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name

Get-AzsDrive -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object StorageNode, PhysicalLocation, HealthStatus, OperationalStatus, Description, Action, Usage, CanPool, CannotPoolReason, SerialNumber, Model, MediaType, CapacityGB

以下部分介绍了驱动器可以处于的运行状况状态:

驱动器运行状况:正常

操作状态 DESCRIPTION
好的 音量正常。
运行中 驱动器正在执行某些内部保养操作。 操作完成后,驱动器应返回到正常运行状态。

驱动器运行状况:警告

处于“警告”状态的驱动器可以成功读取和写入数据,但存在问题。

操作状态 DESCRIPTION
通信断开 与驱动器的连接已丢失。

行动: 将所有服务器重新联机。 如果未修复,请重新连接驱动器。 如果此状态仍然存在,请替换驱动器以确保完全复原。
预测性故障 预计驱动器会很快发生故障。

行动: 尽快更换驱动器,以确保完全复原。
IO 错误 访问驱动器时发生暂时性错误。

行动: 如果此状态仍然存在,请替换驱动器以确保完全复原。
暂时性错误 驱动器出现暂时性错误。 此错误通常意味着驱动器无响应,但也可能意味着驱动器上的存储空间直通保护分区被不当删除。

行动: 如果此状态仍然存在,请替换驱动器以确保完全复原。
异常延迟 驱动器有时无响应,并显示故障迹象。

行动: 如果此状态仍然存在,请替换驱动器以确保完全复原。
从池中删除 Azure Stack Hub 正在从其存储池中删除驱动器。

行动: 等待 Azure Stack Hub 完成驱动器删除,然后检查状态。
如果状态仍然存在,请联系支持人员。 在完成之前,请使用以下 https://aka.ms/azurestacklogfiles指南启动日志文件收集过程。
启动维护模式 Azure Stack Hub 正在将驱动器置于维护模式。 此状态为临时状态-驱动器应很快处于维护模式状态。

行动: 等待 Azure Stack Hub 完成该过程,然后检查状态。
维护中模式 驱动器处于维护模式,停止从驱动器读取和写入。 此状态通常意味着 Azure Stack Hub 管理任务(如 PNU 或 FRU)正在运行驱动器。 但管理员还可以将驱动器置于维护模式。

行动: 等待 Hub Azure Stack Hub 完成管理任务,然后检查状态。
如果状态仍然存在,请联系支持人员。 在完成之前,请使用以下 https://aka.ms/azurestacklogfiles指南启动日志文件收集过程。
停止维护模式 Azure Stack Hub 正在使驱动器重新联机。 此状态是暂时性的 - 驱动器应该很快就会处于另一种状态,理想情况下为“正常运行”状态。

行动: 等待 Azure Stack Hub 完成该过程,然后检查状态。

驱动器运行状况:不正常

当前无法写入或访问处于“不正常”状态的驱动器。

操作状态 DESCRIPTION
分裂 已从池中分离驱动器。

行动: 将驱动器替换为新磁盘。 如果必须使用此磁盘,请从系统中删除磁盘,确保磁盘上没有有用的数据,擦除磁盘,然后重新插入磁盘。
不可用 物理磁盘被隔离,因为它不受解决方案供应商的支持。 仅支持批准用于解决方案并且包含正确磁盘固件的磁盘。

行动: 将驱动器替换为具有已批准的制造商和解决方案型号的磁盘。
已过时的元数据 更换磁盘以前使用过,可能包含来自未知存储系统的数据。 磁盘已隔离。

行动: 将驱动器替换为新磁盘。 如果必须使用此磁盘,请从系统中删除磁盘,确保磁盘上没有有用的数据,擦除磁盘,然后重新插入磁盘。
无法识别的元数据 在驱动器上发现无法识别的元数据,这通常意味着该驱动器具有来自不同存储池的元数据。

行动: 将驱动器替换为新磁盘。 如果必须使用此磁盘,请从系统中删除磁盘,确保磁盘上没有有用的数据,擦除磁盘,然后重新插入磁盘。
介质故障 驱动器出现故障,不再可供存储空间使用。

行动: 尽快更换驱动器,以确保完全复原。
设备硬件故障 此驱动器上出现硬件故障。

行动: 尽快更换驱动器,以确保完全复原。
正在更新固件 Azure Stack Hub 正在更新驱动器上的固件。 此状态是临时的,通常持续不到一分钟,在此期间池中的其他驱动器处理所有读取和写入。

行动: 等待 Azure Stack Hub 完成更新,然后检查状态。
正在启动 驱动器正在为操作做好准备。 此状态应为临时状态-完成后,驱动器应转换为其他作状态。

行动: 等待 Azure Stack Hub 完成作,然后检查状态。

驱动器无法入池的原因

某些驱动器尚未做好加入 Azure Stack Hub 存储池的准备。 可以通过查看 CannotPoolReason 驱动器的属性来了解驱动器为何不符合加入池的条件。 下表更具体地描述了每种原因。

原因 DESCRIPTION
硬件不合规 使用运行状况服务指定的已批准存储模型列表中不包括该驱动程序。

行动: 将驱动器替换为新磁盘。
固件不合规 使用运行状况服务指定的已批准固件修订版列表中不包括该物理驱动器上的固件。

行动: 将驱动器替换为新磁盘。
已由群集使用 该驱动器当前已由故障转移群集使用。

行动: 将驱动器替换为新磁盘。
可移动媒体 该驱动器分类为可移动驱动器。

行动: 将驱动器替换为新磁盘。
不正常 该驱动器不处于正常状态,可能需要更换。

行动: 将驱动器替换为新磁盘。
容量不足 有分区占用驱动器上的可用空间。

行动: 将驱动器替换为新磁盘。 如果必须使用此磁盘,请从系统中删除磁盘,确保磁盘上没有有用的数据,擦除磁盘,然后重新插入磁盘。
正在验证 运行状况服务正在检查是否已批准使用驱动器上的固件。

行动: 等待 Azure Stack Hub 完成该过程,然后检查状态。
验证失败 健康服务无法检查驱动器或驱动器上的固件是否已获批准用于使用。

行动: 请联系支持人员。 在完成之前,请使用以下 https://aka.ms/azurestacklogfiles指南启动日志文件收集过程。
离线 驱动器已脱机。

行动: 请联系支持人员。 在完成之前,请使用以下 https://aka.ms/azurestacklogfiles指南启动日志文件收集过程。