场景:在 Azure HDInsight 中无法读取 Apache Yarn 日志

本文介绍在与 Azure HDInsight 群集交互时出现的问题的故障排除步骤和可能的解决方法。

问题

从存储帐户找到的 Apache Yarn 日志无法人工读取。 文件分析程序不起作用,并产成以下错误消息:

java.io.IOException: Not a valid BCFile.

原因

Apache Yarn 日志被聚合为 IndexFile 格式,但文件分析程序不支持该格式。

解决方法

  1. 在 Web 浏览器中,导航到 https://CLUSTERNAME.azurehdinsight.cn,其中 CLUSTERNAME 是群集的名称。

  2. 在 Ambari UI 中,导航到“YARN”>“配置”>“高级”>“高级 Yarn 站点”。

  3. 对于 WASB 存储:yarn.log-aggregation.file-formats 的默认值为 IndexedFormat,TFile。 将值更改为 TFile

  4. 对于 ADLS 存储:yarn.nodemanager.log-aggregation.compression-type 的默认值为 gz。 将值更改为 none

  5. 保存更改并重启所有受影响的服务。

后续步骤

如果你的问题未在本文中列出,或者无法解决问题,请访问以下渠道以获取更多支持:

  • 如果需要更多帮助,可以从 Azure 门户提交支持请求。 从菜单栏中选择“支持” ,或打开“帮助 + 支持” 中心。 有关更多详细信息,请参阅如何创建 Azure 支持请求。 Microsoft Azure 订阅中带有对订阅管理和计费支持的访问权限,技术支持通过 Azure 支持计划之一提供。