在 HDInsight 中使用直接查询通过 Microsoft Power BI 直观显示 Interactive Query Apache Hive 数据

本文介绍如何将 Microsoft Power BI 连接到 Azure HDInsight 交互式查询群集并使用直接查询直观显示 Apache Hive 数据。 所提供的示例从 hivesampletable Hive 表将数据加载到 Power BI 中。 hivesampletable Hive 表包含一些移动电话使用情况数据。 然后在世界地图上绘制使用情况数据:

HDInsight Power BI the map report

可以使用 Apache Hive ODBC 驱动程序,通过 Power BI Desktop 中的通用 ODBC 连接器执行导入操作。 但是,鉴于 Hive 查询引擎的非交互性质,不建议对 BI 工作负荷执行此操作。 出于性能考量,HDInsight 交互式查询连接器HDInsight Apache Spark 连接器是更好的选择。

先决条件

在开始阅读本文前,必须具备以下项:

  • HDInsight 群集。 该群集可以是包含 Apache Hive 的 HDInsight 群集,也可以是新发布的交互式查询群集。 有关创建群集的信息,请参阅创建群集
  • Microsoft Power BI Desktop 。 可从下载中心下载副本。

从 HDInsight 加载数据

所有 HDInsight 群集都随附了 hivesampletable Hive 表。

  1. 启动 Power BI Desktop。

  2. 在菜单栏中,导航到“主页”>“获取数据”>“更多…” 。

    HDInsight Power BI Get Data More

  3. 在“获取数据”窗口的搜索框中输入 hdinsight

  4. 从搜索结果中选择“HDInsight 交互式查询”,然后选择“连接”。 如果看不到“HDInsight 交互式查询”,需要将 Power BI Desktop 更新到最新版本

  5. 选择“继续”,关闭“连接到第三方服务”对话框。

  6. 在“HDInsight 交互式查询”窗口中输入以下信息,然后选择“确定”

    属性
    服务器 输入群集名称,例如,myiqcluster.azurehdinsight.cn
    数据库 就本文来说,请输入“default”。
    数据连接模式 就本文来说,请选择“DirectQuery”。

    HDInsight interactive query Power BI DirectQuery connect

  7. 输入 HTTP 凭据,然后选择“连接”。 默认的用户名为 admin

  8. 在左侧窗格的“导航器”窗口中,选择“hivesampletale”

  9. 在主窗口中选择“加载”。

    HDInsight interactive query Power BI hivesampletable

在地图上直观显示数据

从上一过程继续进行。

  1. 在“可视化”窗格中,选择“地图”(地球图标)。 然后会在主窗口中显示常规地图。

    HDInsight Power BI customizes report

  2. 在“字段”窗格中,选择 country 和 devicemake。 一会儿就会在主窗口中显示包含数据点的世界地图。

  3. 展开地图。

后续步骤

本文介绍了如何使用 Microsoft Power BI 直观显示 HDInsight 中的数据。 有关数据可视化的详细信息,请参阅以下文章: