问题发布日期:2023 年 10 月 13 日
在 Azure HDInsight 主动可靠性管理中,我们最近在使用 2022 年 2 月或更低版本映像的 HDInsight 群集上发现了潜在的可靠性问题。
问题背景
在 2022 年 3 月之前的 HDInsight 映像中,在一个特定的 Azure Linux 内部版本上发现了一个已知 bug。 Azure Linux 代理 (waagent
)(一个对虚拟机进行管理的轻量级进程)不稳定并导致了 VM 中断。 使用 Azure Linux 内部版本的 HDInsight 群集经历了服务中断、作业失败以及对 IPSec 和自动缩放等功能的不利影响。
必需的操作
如果你的群集是在 2022 年 3 月之前创建的,建议使用最新的 HDInsight 映像重新生成群集。 对 2022 年 3 月之前的群集映像的支持已于 2023 年 11 月 10 日结束。 这些映像不会收到安全更新程序、bug 修补程序或补丁,从而极易受到漏洞的影响。
重要
建议定期将群集更新到最新的 HDInsight 版本。 通过使用基于最新 HDInsight 映像的群集,可确保它们具有最新的操作系统补丁、安全修补程序、bug 修补程序和库版本。 这种做法可帮助你将风险和潜在的安全漏洞降到最低。
常见问题解答
如果使用这些受影响的 HDInsight 映像的 HDInsight 群集中出现 VM 中断,会发生什么情况?
无法通过直接重启来恢复此类虚拟机。 该中断可能持续数小时,需要 Azure 支持团队进行手动干预。
此问题是否已在最新的 HDInsight 映像中得到纠正?
是的。 我们在 2022 年 3 月 1 日或之后的 HDInsight 映像上修复了此问题。 建议迁移到最新的稳定版本,以保持服务级别协议 (SLA) 和服务可靠性。
如何确定群集所在的 HDInsight 映像的日期?
HDInsight 映像版本中的最后 10 位数字表示映像的日期和时间。 例如,映像版本 5.0.3000.1.2208310943 表示的日期为 2022 年 8 月 31 日。 了解如何验证 HDInsight 映像版本。