什么是 Azure HDInsight 中的交互式查询?

交互式查询(也称为 Apache Hive LLAP 或低延迟分析处理)是一种 Azure HDInsight 群集类型。 交互式查询支持内存中缓存,可提高 Apache Hive 查询速度和交互性。 客户使用交互式查询以超快的方式查询存储在 Azure 存储和 Azure Data Lake Storage 中的数据。 交互式查询使开发人员和数据科学家可以使用他们最喜欢的 BI 工具轻松处理大数据。 HDInsight 交互式查询支持使用多种工具轻松访问大数据。

交互式查询群集与 Apache Hadoop 群集有所不同。 交互式 Hive 群集只包含 Hive 服务。

仅可通过 Apache Ambari Hive 视图、Beeline 和 Azure Hive 开放式数据库连接驱动程序 (Hive ODBC) 访问交互式查询群集中的 Hive 服务。 不能通过 Hive 控制台、Templeton、Azure 经典 CLI 或 Azure PowerShell 对其进行访问。

创建交互式查询群集

有关创建 HDInsight 群集的信息,请参阅在 HDInsight 中创建 Apache Hadoop 群集。 选择“交互式查询”群集类型。

重要

交互式查询群集的最小头节点大小为 Standard_D13_v2。 有关详细信息,请参阅 Azure 虚拟机大小调整图

从交互式查询执行 Apache Hive 查询

若要执行 Hive 查询,可以使用以下选项:

方法 说明
Microsoft Power BI 请参阅在 Azure HDInsight 中使用 Power BI 直观显示交互式查询 Apache Hive 数据以及在 Azure HDInsight 中使用 Power BI 直观显示大数据
Visual Studio 请参阅使用针对 Visual Studio 的 Data Lake 工具连接到 Azure HDInsight 并运行 Apache Hive 查询
Visual Studio Code 请参阅将 Visual Studio Code 用于 Apache Hive、LLAP 或 pySpark
Apache Ambari Hive 视图 请参阅将 Apache Hive 视图与 Azure HDInsight 中的 Apache Hadoop 配合使用。 Hive 视图不可用于 HDInsight 4.0。
Apache Beeline 请参阅通过 Beeline 将 Apache Hive 与 HDInsight 中的 Apache Hadoop 配合使用。 可以使用来自头结点或空边缘节点的 Beeline。 建议使用来自空边缘节点的 Beeline。 有关如何使用空边缘节点创建 HDInsight 群集的信息,请参阅在 HDInsight 中使用空边缘节点
Hive ODBC 请参阅使用 Azure Hive ODBC 驱动程序将 Excel 连接到 Apache Hadoop

若要查找 Java Database Connectivity (JDBC) 连接字符串:

  1. 在 Web 浏览器中,导航到 https://CLUSTERNAME.azurehdinsight.cn/#/main/services/HIVE/summary,其中 CLUSTERNAME 是群集的名称。

  2. 若要复制 URL,请选择剪贴板图标:

    HDInsight Hadoop 交互式查询 LLAP JDBC。

后续步骤