Azure Cosmos DB 中预配的吞吐量简介

适用于: ✅ NoSQL, ✅ MongoDB, ✅ Apache Cassandra, ✅ Apache Gremlin, ✅ Table

Azure Cosmos DB 允许对数据库和容器设置预配的吞吐量。有两种类型的预配吞吐量：标准（手动配置）和自动调节。本文概述了预配吞吐量的工作原理。

Azure Cosmos DB 数据库是一组容器的管理单元。数据库包含一组不限架构的容器。 Azure Cosmos DB 容器是处理能力和存储扩展性的单位。容器在Azure区域中的一组计算机之间水平分区，并分布在与 Azure Cosmos DB 帐户关联的所有Azure中国区域。

使用 Azure Cosmos DB，可以采用两种粒度预配吞吐量：

Azure Cosmos DB 容器
Azure Cosmos DB 数据库

对容器设置吞吐量

Azure Cosmos DB 容器上预配的吞吐量专用于该容器。容器始终可获得预配的吞吐量。容器上预配的吞吐量在财务上由服务级别协议（SLA）提供支持。若要了解如何在容器上配置标准（手动）吞吐量，请参阅对容器预配标准（手动）吞吐量。若要了解如何在容器上配置自动缩放吞吐量，请参阅在数据库或容器上预配自动缩放吞吐量。

在容器上设置预配吞吐量是最常用的选项，也是针对大多数工作负荷的建议方法。可以通过使用请求单位（RU）预配任意数量的吞吐量来弹性缩放容器的吞吐量。每个容器都有自己的专用容量，因此一个容器的工作负荷不会影响另一个容器的性能。

为容器预配的吞吐量在其物理分区之间均匀分布。假设有一个适当的分区键，它在物理分区之间均匀分配逻辑分区，那么吞吐量也均匀分布在容器的所有逻辑分区上。你无法有选择性地指定逻辑分区的吞吐量。由于某个容器的一个或多个逻辑分区由物理分区托管，因此，物理分区专属于该容器，并支持对该容器预配的吞吐量。

如果逻辑分区上运行的工作负荷消耗的吞吐量超过分配给基础物理分区的吞吐量，则作可能会受到速率限制。当一个逻辑分区的请求比其他分区键值多得多时，就会出现所谓的“热分区”。

出现速率限制时，可以增大整个容器的预配吞吐量，或重试操作。您还应确保选择一个分区键，以确保存储和请求量的均匀分布。有关分区的详细信息，请参阅 Azure Cosmos DB 中的分区和水平缩放。

如果你希望容器的性能可预测，建议你以容器粒度配置吞吐量。

下图显示了物理分区如何托管容器的一个或多个逻辑分区：

对数据库设置吞吐量

注释

对于大多数工作负荷，不建议使用共享数据库吞吐量。尽管它可以简化某些场景下的资源预配，但在多个容器之间共享吞吐量可能会导致难以预测且不可取的性能和扩缩容行为。由于同一数据库共享分区中的容器，因此缩放数据库吞吐量以支持大型或不断增长的容器可能会触发对较小、共置容器的重新分区，将它们分散在过多的分区中。建议在容器级别配置吞吐量。了解这些权衡的高级方案的客户仍可使用 Azure Cosmos DB SDK 以编程方式创建和管理共享数据库吞吐量。

在 Azure Cosmos DB 数据库上预配吞吐量时，吞吐量将跨数据库中的所有容器（称为共享数据库容器）共享。例外情况是在数据库中指定特定容器的预配吞吐量。在容器之间共享数据库级预配吞吐量相当于在计算机群集上托管数据库。由于数据库中的所有容器共享一台计算机上的可用资源，因此，任何特定容器的性能自然不可预测。若要了解如何在数据库上配置预配的吞吐量，请参阅对数据库预配标准（手动）吞吐量。若要了解如何在数据库上配置自动缩放吞吐量，请参阅在数据库或容器上预配自动缩放吞吐量。

由于数据库中的所有容器共享预配的吞吐量，Azure Cosmos DB 不会为该数据库中的特定容器提供任何可预测的吞吐量保证。特定容器可获得的吞吐量部分取决于：

容器数
为各种容器选择分区键
容器的各个逻辑分区中的工作负荷分配

如果高级方案希望跨多个容器共享吞吐量，并且不需要任何特定容器的专用性能，则可以选择数据库级吞吐量。在选择此方法之前，请查看本部分中的权衡。

以下示例演示了数据库级吞吐量可能很有用的位置：

在一组容器之间共享数据库的预配吞吐量对于多租户应用程序非常有用，其中每个用户由不同的Azure Cosmos DB容器表示。请注意，在此模型中，任何单个容器都不保证拥有固定的吞吐量份额，因此负载高的租户可能会影响其他租户。
跨一组容器共享数据库的预配吞吐量可以简化从托管在 VM 群集上或从本地物理服务器到Azure Cosmos DB的 NoSQL 数据库（例如 MongoDB 或 Cassandra）的迁移。随着工作负荷在迁移后稳定下来，请考虑迁移到容器级吞吐量，以获取更可预测的性能。

必须使用分区键创建在具有预配吞吐量的数据库内创建的所有容器。在任何给定的时间点，数据库上配置的吞吐量由该数据库内的所有容器共享。如果有容器共享对数据库配置的预配吞吐量，则无法选择性地将吞吐量应用到特定的容器或逻辑分区。

如果一个或多个逻辑分区上的工作负荷总计超过了基础物理分区的已分配吞吐量，则会对操作进行速率限制。出现速率限制时，可以增大整个数据库的吞吐量，或重试操作。有关分区的详细信息，请参阅分区。

共享吞吐量数据库中的容器共享分配给该数据库的吞吐量（RU/秒）。使用标准（手动）预配吞吐量，数据库中最多可以有 25 个最小吞吐量为 400 RU/秒的容器。如果使用自动缩放预配吞吐量，那么一个数据库中最多可以有 25 个容器，最小自动缩放预配吞吐量是 1000 RU/秒（系统将在 100 到 1000 RU/秒之间进行缩放）。

注释

共享吞吐量数据库限制为 25 个容器。在前 25 个容器之后，仅当使用专用吞吐量预配容器时，才能向数据库添加更多容器，这与数据库的共享吞吐量不同。
如果 Azure Cosmos DB 帐户已包含具有 >=25 容器的共享吞吐量数据库，则同一Azure订阅中的帐户和所有其他帐户均不受此更改的限制。如果你有反馈或问题，请联系 product support。

如果工作负荷涉及删除和重新创建数据库中的所有集合，建议删除空数据库，并在创建集合之前重新创建一个新数据库。下图显示了物理分区如何托管属于数据库中不同容器的一个或多个逻辑分区：

何时改用容器级吞吐量

对于单个容器具有不同或不断增长的吞吐量需求的工作负荷，请在容器级别配置吞吐量。在共享数据库吞吐量的情况下，为支持规模较大或持续增长的容器而进行扩展，可能会触发对较小的共置容器重新分区，使其过度分散到过多的分区中。实际上，这意味着这些较小的容器可能会遭遇限流（HTTP 429 错误），并且响应时间的稳定性较差。容器级吞吐量可避免这些副作用，因为每个容器独立缩放。这是大多数新工作负载的推荐起点。请参阅容器的预配吞吐量。

对数据库和容器设置吞吐量

可以合并两个模型。可以同时对数据库和容器预配吞吐量。以下示例演示如何在 Azure Cosmos DB 数据库和容器上预配标准（手动）预配的吞吐量：

可以创建一个名为Z的 Azure Cosmos DB 数据库，使用标准（手动）预配吞吐量 "K" RUs。
接下来，在该数据库中创建名为 A、B、C、D 和 E 的五个容器。在创建容器 B 时，请确保启用“为此容器预配专用吞吐量”选项，并在该容器上清晰地配置“P” 个 RU 的预配吞吐量。只有在创建数据库和容器时，才能配置共享吞吐量和专用吞吐量。
“K”RU/s 的吞吐量在 A、C、D 和 E 这四个容器之间共享。A、C、D 或 E 所能获得的确切吞吐量可能有所不同。每个容器的吞吐量均没有 SLA 保障。
名为B的容器保证始终可以获得P RU/s 的吞吐量。它由 SLA 支持。

注释

具有预配吞吐量的容器不能转换为共享数据库容器。反之，共享数据库容器也不能转换为专用吞吐量容器。

更新数据库或容器的吞吐量

创建 Azure Cosmos DB 容器或数据库后，可以更新预配的吞吐量。可对数据库或容器配置的最大预配吞吐量没有限制。

当前的预配的吞吐量

可以在Azure portal或使用 SDK 检索容器或数据库的预配吞吐量：

.NET SDK 上的 Container.ReadThroughputAsync。
Java SDK 上的CosmosAsyncContainer.readThroughput。

这些方法的响应还包含容器或数据库的 minimum 预配吞吐量：

实际的最小 RU/s 可能因帐户配置而异。有关详细信息，请参阅自动缩放 FAQ。

更改预配的吞吐量

可以通过Azure portal或使用 SDK 缩放容器或数据库的预配吞吐量：

.NET SDK 上的 Container.ReplaceThroughputAsync。
Java SDK 中的 CosmosAsyncContainer.replaceThroughput。

如果要减少预配吞吐量，则可以将其降至最低值。

如果你增大预配吞吐量，则在大多数情况下，操作是即时的。但是在某些情况下，由于系统任务的原因，该操作可能需要较长的时间来预配所需的资源。在这种情况下，如果尝试在此操作正在进行时修改预配的吞吐量，则会生成一个 HTTP 423 响应，并会出现一条错误消息，指出另一个缩放操作正在进行。

了解有关缩放预配吞吐量（RU/s）的最佳做法的详细信息。

注释

如果你正在计划一个非常大的数据引入工作负荷，并且这个工作负荷需要预配吞吐量的大幅增长，请记住，缩放操作没有 SLA，如前一段所述，当增幅很大时，可能需要较长时间。你可能想要提前计划，并在工作负荷启动之前启动缩放，并使用以下方法来检查进度。

你可以通过编程方式检查缩放进度，方法是：读取当前预配的吞吐量并使用以下项：

.NET SDK 上的 ThroughputResponse.IsReplacePending。
Java SDK 上的ThroughputResponse.isReplacePending（）。

可以使用 Azure 监视指标查看资源的预配吞吐量（RU/s）和存储的历史记录。

模型比较

下表显示了数据库与容器上的预配标准（手动）吞吐量之间的比较。对于大多数工作负荷，建议使用容器级吞吐量（列 2 和 4）。

参数	在数据库的标准（手动）吞吐量	建议的容器 ✅ 上的标准（手动）吞吐量	自动缩放数据库的吞吐量	对容器的吞吐量进行自动缩放 ✅ 建议
入口点（最小 RU/秒）	400 RU/秒。最多可以有 25 个容器，每个容器没有最小的 RU/秒吞吐量。	400	在 100 - 1000 RU/秒之间自动缩放。最多可以有 25 个容器，每个容器没有最小的 RU/秒吞吐量。	在 100 - 1000 RU/秒之间自动缩放。
每个容器的最小 RU/秒值	--	400	--	可在 100 - 1000 RU/秒范围内自动调整缩放
最大 RU 数	在数据库内为无限制。	在容器上为无限。	在数据库内为无限制。	在容器上为无限。
分配或提供给特定容器的 RU 数	无保证。为给定容器分配的 RU 数取决于多种属性。属性可以是为共享吞吐量的容器选择的分区键、工作负荷的分布，以及容器的数量。	对容器配置的所有 RU 专门保留给该容器使用。	无保证。为给定容器分配的 RU 数取决于多种属性。属性可以是为共享吞吐量的容器选择的分区键、工作负荷的分布，以及容器的数量。	对容器配置的所有 RU 专门保留给该容器使用。
容器的最大存储	无限制	无限制	无限制	无限制
容器的每个逻辑分区的最大吞吐量	10K RU/秒	10K RU/秒	10K RU/秒	10K RU/秒
每个容器中的逻辑分区的最大存储（数据 + 索引）	20 GB	20 GB	20 GB	20 GB

后续步骤

Cosmos DB Azure 中的分区和水平缩放
为 Azure Cosmos DB 容器设置标准（手动）吞吐量
在 Azure Cosmos DB 中的数据库或容器上预配自动缩放吞吐量
尝试为迁移到 Azure Cosmos DB 做容量规划？可以使用有关现有数据库群集的信息进行容量规划。
- 如果只知道现有数据库群集中的 vCore 和服务器数量，请阅读使用 vCore 或 vCPU 估算请求单位
- 如果您知道当前数据库工作负荷的典型请求速率，请阅读有关使用 Azure Cosmos DB 容量规划工具来估计请求单位的文章

Last updated on 2026-05-29