方案:Azure HDInsight 中 Apache Hive LLAP 查询的性能不佳

本文介绍在 Azure HDInsight 群集中使用交互式查询组件时出现的问题的故障排除步骤和可能的解决方案。

问题

默认群集配置未针对工作负荷进行充分优化。 Hive LLAP 中的查询执行速度低于预期。

原因

各种原因可能会导致发生此情况。

解决方法

LLAP 已针对涉及联接和聚合的查询进行了优化。 如下所示的查询在交互式 Hive 群集中无法正常运行:

select * from table where column = "columnvalue"

若要提高 Hive LLAP 中的点查询性能,请设置以下配置:

hive.llap.io.enabled=false; (disable LLAP IO)
hive.optimize.index.filter=false; (disable ORC row index)
hive.exec.orc.split.strategy=BI; (to avoid recombining splits)

还可以通过以下配置更改增加 LLAP 缓存的使用率以提高性能:

hive.fetch.task.conversion=none

后续步骤

如果你的问题未在本文中列出,或者无法解决问题,请访问以下渠道之一获取更多支持:

  • 如果需要更多帮助,可以从 Azure 门户提交支持请求。 从菜单栏中选择“支持” ,或打开“帮助 + 支持” 中心。