有关在生产环境中的 Kubernetes 上运行自承载网关的指导

适用于：开发人员 | 高级

为了在生产环境中运行自主托管网关，需要考虑多个方面。例如，它应以高度可用的方式进行部署，使用配置备份处理临时断开连接等。

本文提供了有关如何在 Kubernetes 上为生产工作负载运行自托管网关以确保它能够顺畅可靠地运行的指导。

访问令牌

如果没有有效的访问令牌，自承载网关将无法从关联的 API 管理服务的终结点访问和下载配置数据。访问令牌的有效期最长为 30 天。必须在到期前重新生成令牌，并手动或通过自动化方式用新令牌配置群集。

自动刷新令牌时，请使用此管理 API 操作生成新令牌。有关管理 Kubernetes 机密的信息，请参阅 Kubernetes 网站。

小提示

还可将自承载网关部署到 Kubernetes，并使用 Microsoft Entra ID 对 API 管理实例启用身份验证。

自动缩放

虽然我们提供了有关自承载网关的最小副本数的指导，但我们建议你对自承载网关使用自动缩放，以更主动地满足流量需求。

可以通过两种方式横向自动扩展自托管网关：

根据资源使用情况（CPU 和内存）自动缩放
根据每秒的请求数自动缩放

这可通过本机 Kubernetes 功能实现，或者通过使用 Kubernetes Event-driven Autoscaling (KEDA) 来实现。 KEDA 是一个 CNCF 孵化项目，致力于简化应用自动扩展。

注释

KEDA 是一种开源技术，不受 Azure 支持的支持，需要由客户操作。

基于资源的自动缩放

Kubernetes 允许使用水平 Pod 自动缩放程序根据资源使用量自动缩放自承载网关。它使你能够定义 CPU 和内存阈值，以及要横向扩展或纵向扩展的副本数。

一种替代方法是使用 Kubernetes Event-driven Autoscaling (KEDA)，它使你能够根据各种缩放器缩放工作负载，包括 CPU 和内存。

小提示

如果已在使用 KEDA 缩放其他工作负载，建议使用 KEDA 作为统一的应用自动缩放器。如果不是这种情况，则我们强烈建议通过水平 Pod 自动缩放程序来依赖原生 Kubernetes 功能。

基于流量的自动缩放

Kubernetes 不提供基于流量的自动缩放的现成机制。

Kubernetes Event-driven Autoscaling (KEDA) 提供了多种方法来帮助进行基于流量的自动缩放：

如果 Kubernetes 入口中的指标在 Prometheus 或 Azure Monitor 中可用，则可使用现成的缩放器基于这些指标实现缩放。
可以安装 HTTP 附加组件（在 beta 版本中提供），并根据每秒的请求数进行缩放。

配置备份

为自承载网关容器配置本地存储卷，使其能够保留最新下载配置的备份副本。如果连接断开，则存储卷可以在重启时使用备份副本。卷装载路径必须为 /apim/config，且必须由组 ID 1001 拥有。请参阅 GitHub 上的示例。若要了解 Kubernetes 中的存储，请参阅 Kubernetes 网站。若要更改已装载路径的所有权，请参阅 securityContext.fsGroup上的设置。

注释

若要了解出现临时 Azure 连接中断时的自承载网关行为，请参阅自承载网关概述。

容器映像标记

Azure 门户中提供的 YAML 文件使用“最新”标记。此标签始终引用自托管网关容器映像的最新版本。

请考虑在生产环境中使用特定版本的标记，以避免无意中升级到较新版本。

可以下载可用标记的完整列表。

小提示

使用 Helm 安装时，系统将为你优化映像标记。 Helm 图表的应用程序版本将网关固定在指定版本，不依赖于 latest。

详细了解如何使用 Helm 在 Kubernetes 上安装 API 管理自托管网关。

容器资源

默认情况下，Azure 门户中提供的 YAML 文件不指定容器资源请求。

无法可靠地预测和建议每个容器 CPU 和内存资源的容量以及支持特定工作负载所需的副本数量。有许多影响因素，例如：

运行群集的特定硬件。
虚拟化的存在情况和类型。
并发客户端连接的数量和速率。
请求速率。
已配置策略的种类和数量。
有效负载大小以及有效负载是进行缓冲还是流式传输。
后端服务延迟。

建议最初将资源请求设置为两个内核和 2 个 GiB。执行负载测试并根据结果决定扩展或缩减规模。

自定义域名和 SSL 证书

如果对 API 管理终结点使用自定义域名，尤其是对管理终结点使用自定义域名时，你可能需要更新 config.service.endpoint 文件中的 < 的值，将默认域名替换为自定义域名。请确保可以从 Kubernetes 群集中自承载网关的 pod 访问管理终结点。

在这种情况下，如果管理终结点使用的 SSL 证书不是由已知 CA 证书签名的，则必须确保自承载网关的 Pod 信任 CA 证书。

注释

通过自托管网关 v2，API 管理提供新的配置端点：<apim-service-name>.configuration.azure-api.cn。此终结点支持自定义主机名，并且可使用此主机名，而不是默认主机名。

DNS 策略

DNS 名称解析在自托管网关连接 Azure 中的依赖项以及将 API 调用传递至后端服务的能力中起着关键作用。

Azure 门户中提供的 YAML 文件将应用默认的 ClusterFirst 策略。此策略可导致群集 DNS 未解析的名称解析请求转发到从节点继承的上游 DNS 服务器。

若要了解 Kubernetes 中的名称解析，请参阅 Kubernetes 网站。请考虑根据你的设置自定义 DNS 策略或 DNS 配置。

外部流量策略

Azure 门户中提供的 YAML 文件将 externalTrafficPolicy 字段设置为的 Local 对象上。这样可以保留调用方 IP 地址（可在请求上下文中访问）并禁用跨节点负载均衡，从而消除由此引起的网络跃点。请注意，在每个节点的网关 Pod 数不相等的部署中，此设置可能导致流量的不对称分布。

健康探测

将 HTTP 探测 /status-0123456789abcdef 终结点用于网关部署上的就绪情况和运行情况探测。这有助于仅将流量路由到已成功启动并准备好为流量提供服务或者已知仍能响应的网关部署。

如果没有运行状况探测，则网关部署可能会启动得更快，但配置可能尚未完全加载，从而导致数据平面流量出现 503 错误。

小提示

使用 Helm 进行安装时，默认情况下会自动启用健康探测。

高可用性

自托管网关是基础结构中的关键组件，并且必须具有高可用性。但是，失败也可能会发生。

请考虑保护自承载网关，防止出现中断。

小提示

使用 Helm 进行安装时，通过启用 highAvailability.enabled 配置选项，可以轻松开启高度可用的调度。

详细了解如何使用 Helm 在 Kubernetes 上安装 API 管理自托管网关。

防范节点故障

若要防止由于数据中心或节点发生故障而受到影响，请考虑使用 Kubernetes 群集，该群集使用可用性区域实现节点级别的高可用性。

可用性区域允许使用以下方式在跨区域节点上计划自承载网关的 Pod：

Pod 拓扑扩散约束（建议 - Kubernetes v1.19+）
Pod 反相关性

注释

如果你使用的是 Azure Kubernetes 服务，请参阅本文，了解如何使用可用性区域。

防止出现 Pod 中断

出于各种原因（例如手动删除 Pod、节点维护等），Pod 可能会中断。

请考虑使用 Pod 中断预算来强制规定任意给定时间内可用的最小 Pod 数量。

HTTP(S) 代理

自托管网关通过使用传统的 HTTP_PROXY、HTTPS_PROXY 和 NO_PROXY 环境变量提供对 HTTP(S) 代理的支持。

配置完成后，自托管网关将自动为后端服务的所有出站 HTTP(S) 请求使用代理。

从版本 2.1.5 或更高版本开始，自托管网关提供与请求代理相关的可观测性：

API 检查器将在使用 HTTP(S) 代理及其相关交互时显示其他步骤。
系统会提供详细的日志来指示请求代理行为。

注释

由于使用基本身份验证的 HTTP 代理存在一个已知问题，因此不支持使用证书吊销列表 (CRL) 验证。请从自承载网关设置参考中详细了解如何正确配置它。

警告

确保已满足基础结构要求，并且自托管网关仍可以连接到它们，否则某些功能将无法正常工作。

本地日志和指标

自承载网关根据关联的 API 管理服务中的配置设置，向 Azure Monitor 和 Azure Application Insights 发送遥测。当与 Azure 的连接暂时丢失时，到 Azure 的遥测流将中断，并且在中断期间数据将丢失。

请考虑使用 Azure Monitor 容器见解监视容器或设置本地监视，以确保能够在 Azure 连接中断期间观察 API 流量并防止遥测丢失。

Namespace

Kubernetes 命名空间有助于在多个团队、项目或应用程序之间划分单个群集。命名空间为资源和名称提供了作用域。它们可以与资源配额和访问控制策略相关联。

Azure 门户提供了在“默认”命名空间中创建自承载网关资源的命令。此命名空间为自动创建，存在于每个群集中且无法删除。请考虑在生产环境中将自承载网关创建和部署到单独的命名空间中。

副本数

适合生产的最小副本数为 3 个，最好与高度可用的实例计划相结合。

默认情况下，自承载网关会以RollingUpdate部署策略进行部署。检查默认值并考虑显式设置 maxUnavailable 和 maxSurge 字段，尤其是在使用大量副本时。

性能

建议将容器日志减少为警告 (warn) 以提高性能。有关详细信息，请参阅自承载网关配置参考。

请求限制

可以通过使用 API 管理 rate-limit 或 rate-limit-by-key 策略来启用自承载网关中的请求限制。通过在 Kubernetes 部署中公开以下端口进行实例发现，配置速率限制计数以跨群集节点在网关实例之间进行同步：

端口 4290 (UDP)，用于速率限制同步
端口 4291 (UDP)，用于将心跳信号发送到其他实例

注释

可以将自承载网关中的速率限制计数配置为本地同步（在跨群集节点的网关实例之间），例如，通过 Kubernetes 的 Helm 图表部署或使用 Azure 门户部署模板。但是，速率限制计数不会与 API 管理实例中配置的其他网关资源同步，包括云中的托管网关。

安全性

自托管网关能够在 Kubernetes 中以非 root 身份运行，因此客户可以安全地运行该网关。

以下是自托管网关容器的安全性上下文示例：

securityContext:
  allowPrivilegeEscalation: false
  runAsNonRoot: true
  runAsUser: 1001       # This is a built-in user, but you can use any user ie 1000 as well
  runAsGroup: 2000      # This is just an example
  privileged: false
  capabilities:
    drop:
    - all

警告

不支持运行使用只读文件系统 (readOnlyRootFilesystem: true) 的自承载网关。

警告

使用本地 CA 证书时，自托管网关必须使用用户 ID (UID) 1001 运行才能管理 CA 证书，否则该网关将无法启动。

若要详细了解自承载网关，请参阅自承载网关概述。

Last updated on 2025-06-09

通过