Java 批量执行程序库：下载信息

适用范围： NoSQL

重要

这不是最新的 Java Bulk Executor for Azure Cosmos DB！请考虑使用 Azure Cosmos DB Java SDK v4 来执行批量操作。若要升级，请按照迁移到 Azure Cosmos DB Java SDK v4 指南和 Reactor 与 RxJava 指南中的说明进行操作。

重要

2024 年 2 月 29 日，Azure Cosmos DB Sync Java SDK v2.x 将停用；此 SDK 和所有使用此 SDK 的应用程序（包括 Bulk Executor）将继续运行；Azure Cosmos DB 将仅停止为此 SDK 提供进一步的维护和支持。我们建议按照上述说明迁移到 Azure Cosmos DB Java SDK v4。

	链接/注释
说明	批量执行程序库允许客户端应用程序在 Azure Cosmos DB 帐户中执行批量操作。批量执行程序库提供 BulkImport 和 BulkUpdate 命名空间。 BulkImport 模块可以批量以优化方式引入文档，以便最大程度地使用为集合配置的吞吐量。 BulkUpdate 模块可以作为修补程序批量更新 Azure Cosmos DB 容器中的现有数据。
SDK 下载	Maven
GitHub 中的批量执行程序库	GitHub
API 文档	Java API 参考文档
入门	批量执行程序库 Java SDK 入门
受支持的最小运行时	Java 开发工具包 (JDK) 7+

发行说明

2.12.3

修复了当 GoneException 包装在 IllegalStateException 中时的重试策略 - 此更改是确保在出现 410 时刷新网关缓存所必需的，这样 Spark 连接器（适用于 Spark 2.4）便可以使用自定义重试策略，使查询能够在分区拆分期间获得成功

2.12.2

修复了导致文档在出现暂时性错误时不始终导入的问题。

2.12.1

升级以使用最新版本的 Azure Cosmos DB Core SDK。

2.12.0

改进了通过 Spark 连接器为批量操作提供的 RU 预算的处理。最初的一次性批量导入是使用 baseBatchSize 从 spark 连接器执行的，并且会收集上述批量导入的 RU 消耗量。基于以上 RU 消耗计算 miniBatchSizeAdjustmentFactor，并据此调整小型批处理大小。根据每个批量导入的运行时间和消耗的 RU，计算休眠持续时间，以限制每秒 RU 消耗量，并用于在下次批量导入之前暂停线程。

2.11.0

修复了在使用嵌套分区键时阻止批量更新的 bug

2.10.0

修复了 DocumentAnalyzer.java，以从 JSON 中正确提取嵌套的分区键值。

2.9.4

在 BulkDelete 操作中添加了相应的功能，以便在发生特定的失败后重试，并向用户返回可重试的失败列表。

2.9.3

更新 Azure Cosmos DB SDK 版本 2.4.7。

2.9.2

修复了“mergeAll”，使之能够在遇到“id”和分区键值时继续运行，以便将“id”和分区键值后面的所有已修补文档属性添加到更新的项列表。

2.9.1

已将起始并发度更新为 1，并增加了 minibatch 的调试日志。

Last updated on 2024-09-14

通过