在开始创建群集之前请考虑以下几点。
根据最佳做法,在开始创建群集之前考虑以下几点。
自带数据库
HDInsight 提供两个选项用于在群集中配置数据库。
- 自带数据库(外部)
- 默认数据库(内部)
在创建群集期间,默认配置使用内部数据库。 创建群集后,客户无法更改数据库类型。 因此,建议创建并使用外部数据库。 可为 Ambari、Hive 和 Ranger 创建自定义数据库。
有关详细信息,请参阅如何使用自定义 Ambari DB 设置 HDInsight 群集
使群集保持最新状态
为了利用最新的 HDInsight 功能,我们建议定期将 HDInsight 群集迁移到最新版本。 HDInsight 不支持就地升级(这种升级方式会将现有群集升级到新组件版本)。 需要使用所需的组件和平台版本创建新群集,然后迁移应用程序以使用新群集。
根据最佳做法,我们建议定期更新群集。
HDInsight 版本每隔 30 到 60 天发布一次。 最好尽早迁移到最新版本。 在六个月内(建议的最长间隔时间)升级群集。
有关详细信息,请参阅如何将 HDInsight 群集迁移到较新版本。
集成第三方应用程序
Azure 仅支持 HDInsight 服务创建的计算机(例如 HDInsight 群集、边缘节点和工作器节点)。 我们不支持第三方客户端计算机,也不支持将 HDInsight 库从受支持的计算机移动到外部计算机。
虽然这种第三方集成可能在一段时间内有效,但不建议在生产环境中这样做,因为不支持此方案。
当你为不支持的方案提出支持请求时,系统会要求你在受支持的方案中重现问题,以便我们可以进行调查。 所提供的任何修补程序都仅适用于受支持的方案。
支持集成第三方应用程序的方法
- 安装 HDInsight 应用程序:了解如何在群集上安装 HDInsight 应用程序。
- 安装自定义 HDInsight 应用程序:了解如何将未发布的 HDInsight 应用程序部署到 HDInsight。
后续步骤
- 在 HDInsight 中创建 Apache Hadoop 群集
- 创建 Apache Spark 群集 - 门户
- Azure HDInsight 中的企业安全性