Azure Stack HCI 遥测和诊断扩展
适用于:Azure Stack HCI 版本 22H2
本文简要概述了用于 Azure Stack HCI 群集的遥测和诊断扩展及其优势和可用选项。
关于扩展
使用遥测和诊断 Arc 扩展(在 Azure 门户中显示为 AzureEdgeTelemetryAndDiagnostics)可以从 Azure Stack HCI 系统收集遥测和诊断信息。 这些信息可帮助我们深入了解系统的行为。
使用遥测和诊断扩展可以监视和评估 Azure Stack HCI 的性能、功能与整体运行状况。 我们还可以使用此扩展提供的诊断信息来排查和解决系统中的任何潜在问题。
有关详细信息,请参阅 Azure Stack HCI 上的 Azure Arc 扩展管理。
好处
遥测和诊断扩展的部分优点包括:
提高合规性:启用遥测和诊断数据,以便在数据上传期间符合区域服务和数据驻留要求。
简化日志收集,加快问题解决速度:让你轻松收集诊断日志。 Azure 支持和工程团队可使用这些日志快速解决任何系统问题。
减轻更新造成的影响:允许对 Azure Stack HCI 系统进行非破坏性更新,并且不需要重启主机服务器。
资源消耗控制:确保占用的 CPU 不超过 5%。 通过 Azure Arc 扩展框架强制控制该过程。
遥测和诊断设置
即使已安装并运行遥测扩展,也可以控制是否将遥测数据发送到 Azure。
若要访问发送遥测数据的选项,请执行以下步骤:
在 Azure 门户中,转到你的 Azure Stack HCI 群集资源。 在左侧窗格中转到“设置”,然后选择“扩展”。
选择以下选项之一来共享遥测数据:
关闭:如果选择此选项,将不会向 Azure 发送系统数据。
基本:如果选择此选项,将向 Azure 发送保持群集最新、安全且正常运行所需的最少系统数据。
增强:如果选择此选项,将发送更多系统数据以帮助 Azure 识别和修复操作问题以及改进产品。 强烈建议启用增强诊断。
增强数据共享的部分优点包括:
- 将系统数据保留最多一个月。
- 自动捕获错误和诊断信息以更快解决问题。 无需操作员干预。
诊断数据收集
若要识别并修复 Azure Stack HCI 解决方案的问题,可以收集诊断日志并将其发送到 Azure。 若要手动收集诊断日志并将其发送到 Azure,请在任何 Azure Stack HCI 服务器节点中使用 Send-DiagnosticData
cmdlet。 建议在提交支持案例之前使用此 cmdlet 上传诊断数据。
数据收集同意
Azure 根据其标准隐私做法收集数据。 新的遥测代理不会替代现有控制设置。
如果撤销了对数据收集的同意,撤销前收集的任何数据都不受影响。 Azure 会继续根据数据收集时制定的条款处理并使用收集的数据。
以下是数据收集时需要考虑的事项:
了解 Azure 如何处理和使用数据。 查看 Azure 的隐私做法和策略。
了解同意数据收集和撤销同意的含义。 为确保完全理解,请咨询法律或隐私专业人士。
数据隐私注意事项
Azure Stack HCI 将系统数据路由回受保护的云存储位置。 只有具有有效业务需求的 Azure 人员才能访问系统数据。 除非客户自行要求,或者符合 Azure 隐私声明中所述的受限目的,否则 Azure 不会与第三方共享客户个人数据。 数据共享决策由 Azure 内部团队(包括隐私、法律和数据管理利益干系人)做出。
请勿在资源或文件名中包含任何机密信息或个人信息。 例如,VM 名称、卷名称、配置文件名、存储文件名(VHD 名称)或群集资源名称。
错误处理。
以下部分讨论错误代码、消息,并针对你在使用遥测和诊断扩展时可能遇到的任何问题提供建议的解决方法:
错误代码 1
错误消息:发生了未经处理的异常。
原因:如果发生未经处理的异常,会显示错误消息。 可以在扩展日志中找到完整的错误消息及其堆栈跟踪。
建议的解决方法:检查一般性错误消息并联系 Azure 支持。 从以下路径收集日志并将这些日志提供给 Azure 支持:C:\ProgramData\GuestConfig\extension_logs\Microsoft.AzureStack.Observability.TelemetrAndDiagnostics\ObservabilityExtension.log
。
错误代码 9
错误消息:驱动器上的可用磁盘空间不足。 若要继续安装扩展,请删除部分文件以释放空间。
原因:该扩展作为安装前步骤进行验证,并且至少需要 20 GB 的空间用于系统驱动器上的 GMA 缓存。 如果驱动器空间不足,扩展会针对此问题引发错误消息。
建议的解决方法:释放磁盘空间以允许扩展继续。
错误代码 12
错误消息:如果 Get-AzureStackHCI
或 Get-ClusterNode
cmdlet 都无法检索必要信息,则扩展无法创建租户 JSON 配置文件。
原因:扩展使用 Get-AzureStackHCI
和 Get-ClusterNode
cmdlet 识别参数并检索创建租户 JSON 所需的信息。 如果这些 cmdlet 不存在,扩展会引发错误消息,指示没有这些 cmdlet 就无法继续工作。
建议的解决方法:验证 Azure Stack HCI 注册。