Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
了解如何在 Azure HDInsight 上安装第三方 Apache Hadoop 应用程序。 有关安装自己的应用程序的说明,请参阅 安装自定义 HDInsight 应用程序。
HDInsight 应用程序是用户可以在 HDInsight 群集上安装的应用程序。 这些应用程序可由Microsoft、独立软件供应商(ISV)或自己开发。
以下列表显示了已发布的应用程序:
| 应用程序 | 群集类型 | Description |
|---|---|---|
| AtScale Intelligence Platform | Hadoop | AtScale 将 HDInsight 群集转换为横向扩展 OLAP 服务器,允许你使用已了解、拥有和喜爱的 BI 工具(从 Microsoft Excel、Power BI、Tableau Software 到 QlikView)以交互方式查询数十亿行数据。 |
| Datameer | Hadoop | Datameer 的自助服务可缩放平台,用于准备、探索和管理数据以进行分析可加速将复杂的多源数据转变为有价值的业务就绪信息,从而在企业级提供更快、更智能的见解。 |
| HDInsight 上的 Dataiku DSS | Hadoop、Spark | 企业数据科学平台中的 Dataiku DSS 使数据科学家和数据分析师能够更有效地设计和运行新的数据产品和服务,从而将原始数据转化为有影响力的预测。 |
| WANdisco Fusion HDI 应用 | Hadoop、Spark、HBase、Kafka | 在分布式环境中保持数据一致是一项大规模数据操作挑战。 WANdisco Fusion 是企业级软件平台,通过跨任何环境实现非结构化数据一致性来解决此问题。 |
| 适用于 HDInsight 的 H2O SparklingWater | Spark | H2O Sparkling Water 支持以下分布式算法:GLM、Naïve Bayes、分布式随机林、梯度提升机、深度神经网络、深度学习、K 平均值、PCA、通用低排名模型、异常检测、自动编码器。 |
| Striim for Real-Time Data Integration to HDInsight | Hadoop,HBase,Spark,Kafka | Striim(发音为“stream”)是端到端流数据集成 + 智能平台,可实现对不同数据流的持续引入、处理和分析。 |
| Jumbune Enterprise-Accelerating BigData Analytics | Hadoop、Spark | 总体而言,Jumbune 通过以下方式帮助企业:1. 加速 Tez、MapReduce 和基于 Spark 引擎的 Hive、Java、Scala 工作负荷性能。 2. Hadoop 集群主动监控,3. 建立分布式文件系统上的数据质量管理 |
| Kyligence Enterprise | Hadoop,HBase,Spark | Kyligence Enterprise 由 Apache Kylin 提供支持,支持大数据上的 BI。 作为 Hadoop 上的企业 OLAP 引擎,Kyligence Enterprise 授权业务分析师使用行业标准数据仓库和 BI 方法在 Hadoop 上构建 BI。 |
| HDInsight Cloud 的 StreamSets 数据收集器 | Hadoop,HBase,Spark,Kafka | StreamSets 数据收集器是一种轻型、功能强大的引擎,可实时流式传输数据。 使用数据收集器路由和处理数据流中的数据。 它附带了 30 天的试用许可证。 |
| Trifacta Wrangler Enterprise | Hadoop、Spark、HBase | 适用于 HDInsight 的 Trifacta Wrangler Enterprise 支持针对任何规模的数据进行企业范围的数据整理。 在 Azure 上运行 Trifacta 的成本是 Trifacta 订阅成本以及虚拟机的Azure基础结构成本的组合。 |
| Unifi 数据平台 | Hadoop,HBase,Spark | Unifi 数据平台是一套无缝集成的自助服务数据工具,旨在使业务用户能够应对推动增量收入、降低成本或运营复杂性的数据挑战。 |
本文中提供的说明使用Azure门户。 还可以从门户导出Azure 资源管理器模板,或者从供应商获取资源管理器模板的副本,并使用Azure PowerShell和Azure经典 CLI 部署模板。 请参阅 使用 资源管理器 模板在 HDInsight 上创建 Apache Hadoop 群集。
先决条件
如果要在现有 HDInsight 群集上安装 HDInsight 应用程序,则必须具有 HDInsight 群集。 若要创建群集,请参阅 “创建群集”。 还可以在创建 HDInsight 群集时安装 HDInsight 应用程序。
将应用程序安装到现有群集
以下过程演示如何将 HDInsight 应用程序安装到现有的 HDInsight 群集。
安装 HDInsight 应用程序
登录 Azure 门户。
在左侧菜单中,导航到 “所有服务>分析>HDInsight 群集”。
从列表中选择 HDInsight 群集。 如果没有,必须先创建一个。 请参阅 “创建群集”。
在 “设置” 类别下,选择“ 应用程序”。 可以在主窗口中查看已安装的应用程序的列表。
从菜单中选择 “+添加 ”。 可以看到可用应用程序的列表。 如果 +Add 显示为灰色,则表示此版本的 HDInsight 群集没有可用的应用程序。
选择其中一个可用的应用程序,然后按照说明接受法律条款。
可以从门户通知中看到安装状态(选择门户顶部的钟形图标)。 安装应用程序后,该应用程序将显示在“已安装的应用”列表中。
在群集创建过程中安装应用程序
创建群集时,可以安装 HDInsight 应用程序。 在此过程中,HDInsight 应用程序在创建群集并处于运行状态后安装。 若要使用 Azure 门户在群集创建期间安装应用程序,请从 Configuration + pricing 选项卡中,选择 + 添加应用程序。
列出已安装的 HDInsight 应用和属性
门户显示群集已安装的 HDInsight 应用程序的列表,以及每个已安装应用程序的属性。
列出 HDInsight 应用程序和显示属性
登录 Azure 门户。
在左侧菜单中,导航到 “所有服务>分析>HDInsight 群集”。
从列表中选择 HDInsight 群集。
在 “设置” 类别下,选择“ 应用程序”。 可以在主窗口中查看已安装的应用程序的列表。
选择其中一个已安装的应用程序以显示该属性。 属性列表:
财产 Description 应用名称 应用程序名称。 地位 应用程序状态。 网页 已部署到边缘节点的 Web 应用程序的 URL。 凭据与为群集配置的 HTTP 用户凭据相同。 SSH 端点 可以使用 SSH 连接到边缘节点。 SSH 凭据与为群集配置的 SSH 用户凭据相同。 有关信息,请参阅 将 SSH 与 HDInsight 配合使用。 Description 应用程序说明。 若要删除应用程序,请右键单击该应用程序,然后单击上下文菜单中的“ 删除 ”。
连接到边缘节点
可以使用 HTTP 和 SSH 连接到边缘节点。 可以从 门户找到终结点信息。 有关信息,请参阅 将 SSH 与 HDInsight 配合使用。
HTTP 终结点凭据是为 HDInsight 群集配置的 HTTP 用户凭据。 SSH 终结点凭据是为 HDInsight 群集配置的 SSH 凭据。
故障排除
请参阅 安装疑难解答。
后续步骤
- 安装自定义 HDInsight 应用程序:了解如何将未发布的 HDInsight 应用程序部署到 HDInsight。
- MSDN:安装 HDInsight 应用程序:了解如何定义 HDInsight 应用程序。
- 使用脚本操作自定义基于 Linux 的 HDInsight 群集:了解如何使用脚本操作安装其他应用程序。
- 使用 资源管理器 模板在 HDInsight 中创建基于 Linux 的 Apache Hadoop 群集:了解如何调用 资源管理器 模板来创建 HDInsight 群集。
- 在 HDInsight 中使用空边缘节点:了解如何使用空边缘节点来访问 HDInsight 群集、测试 HDInsight 应用程序以及托管 HDInsight 应用程序。