Azure Cosmos DB 中的分区和水平缩放

適用対象: ✅ NoSQL, ✅ MongoDB, ✅ Apache Cassandra, ✅ Apache Gremlin, ✅ Table

Azure Cosmos DB 使用分区缩放数据库中的容器以满足应用程序的性能需求。容器中的项分为不同的子集，称为逻辑分区。逻辑分区形式基于与容器中的每个项关联的 分区键 的值。逻辑分区中的所有项都具有相同的分区键值。

例如，某个容器装有物品。每个项具有唯一的 UserID 属性值。如果 UserID 充当容器中的项的分区键，并且有 1,000 个唯一的 UserID 值，则会为容器创建 1,000 个逻辑分区。

容器中的每个项都有一个 分区键 ，用于确定其逻辑分区以及该分区中唯一 的项 ID 。将分区键与项 ID 相结合可创建项的索引，用来唯一地标识该项。分区键的选择非常重要，它会影响应用程序的性能。

注释

在某些分布式数据库系统和学习材料中，术语 分片键 用于描述用于确定数据如何在分片之间分布的属性。在 Azure Cosmos DB 中，同一概念称为 分区键。

这两个术语都指用于分发和定位数据的值，但分区键是整个 Azure cosmos DB 文档和 API 中使用的正式和正确的术语。

本文介绍逻辑分区与物理分区之间的关系、讨论分区的最佳做法，并深入地了解水平缩放在 Azure Cosmos DB 中的工作原理。无需了解这些内部详细信息来选择分区键，但本文将介绍它们来阐明 Cosmos DB Azure的工作原理。

逻辑分区

逻辑分区是共享同一分区键的一组项。例如，在包含食物营养相关数据的容器中，所有项都包含 foodGroup 属性。使用 foodGroup 作为容器的分区键。具有特定 foodGroup 值（例如 Beef Products、Baked Products 和 Sausages and Luncheon Meats）的项组构成了独立的逻辑分区。

逻辑分区也定义数据库事务的范围。可以使用支持快照隔离的事务来更新逻辑分区中的项。当向容器中添加新项时，系统会以透明的方式创建新的逻辑分区。无需担心在删除基础数据时是否会删除逻辑分区。

容器中的逻辑分区数没有限制。每个逻辑分区最多可保存 20 GB 的数据。有效的分区键具有广泛的可能值。例如，在一个其中所有项都包含 foodGroup 属性的容器中，Beef Products 逻辑分区内的数据最多可以增长到 20 GB。选择具有多种可能值的分区键会确保容器能够缩放。

使用Azure监视警报来监视逻辑分区的大小是否接近 20 GB。

物理分区

容器通过将数据和吞吐量分布到物理分区上来实现扩展。在内部，一个或多个逻辑分区映射到单个物理分区。通常，较小的容器具有许多逻辑分区，但只需要单个物理分区。与逻辑分区不同，物理分区是内部系统实现，Azure Cosmos DB 完全管理它们。

容器中的物理分区数取决于以下特征：

预配的吞吐量（每个单独的物理分区最多可以提供每秒 10,000 个请求单位的吞吐量）。由于每个逻辑分区仅会映射到一个物理分区，若物理分区受到 10,000 RU/秒的限制，则意味着逻辑分区也会受 10,000 RU/秒的限制。
总数据存储（每个物理分区最多可以存储 50 GB 的数据）。

注释

物理分区是内部系统实现，完全由 Azure Cosmos DB 管理。开发解决方案时，请不要将重点放在物理分区上，因为你无法对其进行控制。而是将注意力集中在分区键上。选择跨逻辑分区均匀分配吞吐量消耗的分区键可确保在物理分区之间均衡的吞吐量消耗。

容器中物理分区总数没有限制。随着预配的吞吐量或数据大小的增长，Azure Cosmos DB 通过拆分现有分区来自动创建新的物理分区。物理分区拆分不影响应用程序可用性。物理分区拆分后，单个逻辑分区内的所有数据仍将存储在同一个物理分区中。物理分区拆分只是创建逻辑分区到物理分区的新映射。

容器的预配吞吐量在物理分区之间均匀划分。不均匀分配请求的分区键设计可能会导致定向到“热”的一小部分分区的请求过多。热分区导致预配吞吐量的使用效率低下，这可能会导致速率限制和更高的成本。

例如，假设有一个容器，其路径 /foodGroup 指定为分区键。容器可以有任意数量的物理分区，但在此示例中，我们假定它有三个。单个物理分区可以包含多个分区键。例如，最大的物理分区可能包含前三个最大的逻辑分区：Beef Products、Vegetable and Vegetable Products 和 Soups, Sauces, and Gravies。

如果分配的吞吐量为每秒 18,000 个请求单位（RU/秒），则三个物理分区中的每一个都使用预配的总吞吐量的三分之一。在选定的物理分区中，逻辑分区键 Beef Products、Vegetable and Vegetable Products 和 Soups, Sauces, and Gravies 可以共同利用为物理分区预配的每秒 6,000 个 RU。由于预配的吞吐量在容器的物理分区中被均等划分，因此，选择一个能够均衡分配吞吐量消耗的分区键是十分重要的。有关详细信息，请参阅选择正确的逻辑分区键。

管理逻辑分区

Azure Cosmos DB 会自动管理逻辑分区在物理分区上的位置，以满足容器的可伸缩性和性能需求。当应用程序的吞吐量和storage要求增加时，Azure Cosmos DB 移动逻辑分区以将负载分散到更多物理分区。详细了解物理分区。

Azure Cosmos DB 使用基于哈希的分区在物理分区之间分配逻辑分区。 Azure Cosmos DB 对项的分区键值进行哈希处理。哈希处理结果确定了逻辑分区。然后，Azure Cosmos DB 跨物理分区均匀分配分区键哈希的键空间。

存储过程或触发器中的事务仅限于单个逻辑分区的项。

副本集

每个物理分区由一组副本组成，也称为 副本集。每个副本托管一个数据库引擎的实例。副本集使物理分区中的数据存储具有持久性、高可用性和一致性。物理分区中的每个副本都继承分区的storage配额。物理分区的所有副本共同支持分配给该物理分区的吞吐量。 Azure Cosmos DB 自动管理副本集。

较小的容器通常需要单个物理分区，但它们仍至少有四个副本。

此图显示了逻辑分区如何映射到多区域分布的物理分区。映像中的分区集是指一组物理分区，这些物理分区跨多个区域管理相同的逻辑分区键：

显示 Azure Cosmos DB 分区的图。

选择分区键

分区键具有两个组成部分：分区键路径和分区键值。例如，考虑项目 { "userId" : "Andrew", "worksFor": "Microsoft" }，如果选择“userId”作为分区键，下列是两个分区键组件：

分区键路径（例如 "/userId"）。分区键路径支持字母数字和下划线 (_) 字符。还可以通过标准路径表示法 (/) 来使用嵌套的对象。
分区键值（例如 "Andrew"）。分区键值可以是字符串或数值类型。

了解 Azure Cosmos DB 服务配额一文中的吞吐量、storage和分区键长度限制。

在 Azure Cosmos DB 中，选择分区键是一个简单但重要的设计选择。选择分区键后，无法就地更改它。如果需要更改分区键，请将数据移动到具有所需分区键的新容器。

对于所有容器，分区键应：

是一个属性，其值不会改变。如果某个属性是分区键，那么你不能更新该属性的值。

Important

分区键值是不可变的。 创建项后，无法就地更改其分区键值。项替换操作要求分区键与现有项匹配，不能使用它在分区之间移动项。若要“移动”项，必须使用新的分区键值创建新项，并删除原始项。这两个操作不能在不同的逻辑分区之间以原子方式执行。
仅包含String值，或者如果根据String双精度数字的边界可能超出，则将数字转换为。 Json 规范解释了为何由于互作性问题而使用此边界之外的数字是一种不良做法。这些问题尤其与分区键列相关，因为它不可变，并且需要数据迁移才能在以后进行更改。
具有较高的基数。换言之，该属性应具有范围广泛的可能值。
将请求单位（RU）消耗和数据存储均匀地分散在所有逻辑分区之间。这种分布可确保请求单位（RU）平均消耗，并在物理分区之间均匀存储。
值通常不超过 2048 字节，或者不超过 101 字节（在未启用大分区键的情况下）。有关详细信息，请参阅大分区键

如果需要在 Azure Cosmos DB 中进行多项ACID事务，您需要使用存储过程或触发器。所有基于 JavaScript 的存储过程和触发器的作用范围仅限于单个逻辑分区。

注释

如果只有一个物理分区，或者分区数很小，例如 <= 5，则分区键的值可能不相关。如果查询中不包括分区键，检查每个附加物理分区的开销为每个物理分区 2-3 RU。详细了解物理分区。

常见分区键反模式

选择分区键时，应避免采用那些起初看似方便、但日后可能导致扩展性或查询问题的做法。

使用 `id` 作为通用工作负载的分区键

使用 /id 在项和分区键值之间创建一个 1：1 映射，这意味着每个项实际上是其自己的逻辑分区。此模式提供出色的写入分布，并支持低延迟、低 RU 点读取。但是，任何按 id 以外的属性进行筛选的查询都需要跨分区查询。

当您的工作负载主要是点读取和写入，并且很少运行更广泛的筛选查询时，请使用 /id。对于混合查询工作负荷，请选择与筛选器模式匹配的键。

使用低基数字段

使用 status、type 或 country 之类的字段，会创建数量有限的逻辑分区，其数量等于不同值的数量。此模式通常会导致 RU 和存储分布不均衡，并且可以在负载下创建热分区。

仅当数据量较小且每个值的流量远远低于逻辑分区限制（每个逻辑分区 20 GB 存储和 10,000 RU/秒）时，才使用低基数字段。否则，请使用具有更多不同值的属性（或合成键）。

分区键的类型

分区策略	何时使用	优点	缺点
常规分区键（例如 CustomerId、OrderId）	当分区键具有高基数并符合查询模式（例如，按 CustomerId 进行筛选）时使用。适用于查询主要面向单个客户数据的工作负荷（例如，检索客户的所有订单）。	易于管理。当访问模式与分区键匹配，例如查询所有 CustomerId 的订单时，可实现高效查询。如果access模式一致，则防止跨分区查询。	存在热分区的风险，如果某些值（例如，少数高流量客户）生成的数据比其他值多。如果特定键的数据量迅速增长，则可能会达到每个逻辑分区的 20 GB 限制。
合成分区键（例如客户ID + 订单日期）	当没有任何字段同时具有高基数并匹配查询条件时使用。适用于写入密集型工作负荷，其中数据需要均匀分布在物理分区（例如，许多订单都放在同一日期）。	帮助跨分区均匀分布数据，减少热分区（例如，按 CustomerId 和 OrderDate 分发订单）。将写入分散到多个分区，并提高吞吐量。	仅按一个字段（例如 CustomerId）进行筛选的查询可能会导致跨分区查询。跨分区查询可能会导致增加 RU 消耗（每存在一个物理分区，将增加 2-3 RU/秒的额外费用）并导致延迟增加。
分层分区键（HPK）（例如 CustomerId/OrderId、StoreId/ProductId）	需要多级分区来支持大规模数据集时使用。查询在层次结构的第一级和第二级进行筛选时，这是理想的选择。	通过创建多个分区级别来帮助避免 20 GB 的限制。对两个分层级别的高效查询（例如，先按 CustomerID 筛选，再按 OrderID 筛选）。最大程度地减少针对顶级查询的跨分区查询（例如，从特定 CustomerID 检索所有数据）。	需要仔细规划以确保一级密钥具有较高的基数，并且包含在大多数查询中。比管理常规分区键更复杂。如果查询与层次结构不一致（例如，仅当 CustomerID 为第一级时按 OrderID 进行筛选），则查询性能可能会受到影响。

读取密集型容器的分区键

对于大多数容器，选择分区键时需要考虑这些条件。但对于较大的读取密集型容器，可能需要选择在查询中经常作为筛选器出现的分区键。在筛选器谓词中包括分区键可有效地将查询路由到相关的物理分区。

如果大多数工作负荷的请求是查询，并且大多数查询对同一属性使用相等筛选器，则此属性是一个很好的分区键选择。例如，如果经常运行在 UserID 上筛选的查询，则选择 UserID 作为分区键将减少跨分区查询的数目。

如果容器较小，则可能没有足够的物理分区来担心跨分区查询的性能。 Azure Cosmos DB 中的大多数小型容器只需要一两个物理分区。

如果容器可能会增长到许多个物理分区，则应确保选择一个可以最大程度地减少跨分区查询的分区键。如果满足以下任一情况，容器需要多个物理分区：

容器已预配超过 30,000 个请求单位
容器存储的数据超过 100 GB

使用项 ID 作为分区键

注释

本部分主要适用于 API for NoSQL。其他 API（例如 Gremlin API）不支持唯一标识符作为分区键。

如果容器具有具有各种可能值的属性，则可能是一个很好的分区键选择。此类属性的示例是 项 ID。对于较小的读取密集型容器或任意大小的写入密集型容器，项 ID (/id) 自然是很好的分区键选择。

系统属性 项 ID 存在于容器中的每个项中。可能会有其他用于表示您的项目逻辑 ID 的属性。在许多情况下，这些唯一标识符也是理想的分区键选择项，原因与 项 ID 相同。

item ID 是一个很好的分区键选择，原因如下：

其可能值范围十分广泛（每个项一个唯一的项 ID）。
由于每个项都有唯一的 item ID，因此 item ID 在均衡 RU 消耗和数据存储时表现出色。
你可以轻松执行高效的点读取，因为一旦知道项的 项 ID，就能始终知道项的分区键。

选择 项 ID 作为分区键时，请考虑以下注意事项：

如果 项 ID 是分区键，则它将成为整个容器的唯一标识符。无法创建具有重复 标识符的项目。
如果一个读取密集型容器有大量物理分区，则当查询具有一个包含项 ID 的等式筛选器时，查询将更高效。
存储过程或触发器不能以多个逻辑分区为目标。

Last updated on 2026-06-29