排查 Azure HDInsight 中的群集创建失败问题

以下问题是导致群集创建失败的最常见根本原因:

  • 权限问题
  • 资源策略限制
  • 防火墙
  • 资源锁
  • 不支持的组件版本
  • 存储帐户名称限制
  • 服务中断

权限问题

如果使用的是 Azure Data Lake Storage Gen2 并收到错误 AmbariClusterCreationFailedErrorCode(“Internal server error occurred while processing the request. Please retry the request or contact support.”),请打开 Azure 门户,转到你的存储帐户,并在访问控制 (IAM) 下确保“存储 Blob 数据参与者”或“存储 Blob 数据所有者”角色已经为该订阅的“用户分配的托管标识”分配了访问权限 。 有关详细说明,请参阅在 Data Lake Storage Gen2 上设置托管标识的权限

如果使用 Azure 存储,请确保创建群集期间存储帐户名称有效。

资源策略限制

基于订阅的 Azure 策略可能会拒绝创建公共 IP 地址。 创建 HDInsight 群集需要两个公共 IP。 

一般情况下,以下策略可能会影响群集创建:

  • 阻止在订阅中创建 IP 地址和负载均衡器的策略。
  • 阻止创建存储帐户的策略。
  • 阻止删除网络资源(IP 地址/负载均衡器)的策略。

防火墙

虚拟网络或存储帐户中的防火墙可能会拒绝与 HDInsight 管理 IP 地址通信。

允许来自下表中所述 IP 地址的流量。

源 IP 地址 目标 方向
168.61.49.99 *:443 入站
23.99.5.239 *:443 入站
168.61.48.131 *:443 入站
138.91.141.162 *:443 入站

另外,添加特定于创建群集的区域的 IP 地址。 有关每个 Azure 区域的地址列表,请参阅 HDInsight 管理 IP 地址

如果使用 Express Route 或自己的自定义 DNS 服务器,请参阅规划 Azure HDInsight 的虚拟网络 - 连接多个网络

资源锁

确保虚拟网络和资源组中没有锁。 如果资源组被锁定,则无法创建或删除群集。

不支持的组件版本

确保在解决方案中使用受支持版本的 Azure HDInsight 和 Apache Hadoop 组件

存储帐户名称限制

存储帐户名称不能超过 24 个字符,且不能包含特殊字符。 这些限制也适用于存储帐户中的默认容器名称。

其他命名限制也适用于群集创建。 有关详细信息,请参阅群集名称限制

服务中断

请检查 Azure 状态是否存在任何潜在的中断或服务问题。

后续步骤