此内容适用于:v3.1 (GA)
v3.0 (GA)
v2.1 (GA)
文档智能服务会不断更新。 将此页添加为书签,以了解最新的发行说明、功能增强和我们的最新文档。
重要
发布 GA API 后,预览版 API 将会停用。 2023-02-28-preview API 版本即将停用。 如果仍在使用预览 API 或关联的 SDK 版本,请更新代码,以最新的 API 版本 2024-11-30 (GA)
为目标。
2025 年 6 月
文档智能 v4.0 读取容器现已推出!
此容器映像包括高度请求的读取功能,如可搜索 PDF! 有关详细信息, 请参阅:
2025 年 4 月
文档智能 v4.0 布局容器现已推出!
有关详细信息, 请参阅:
2024 年 12 月
文档智能 v4.0 编程语言 SDK 现已推出正式版 (GA)!
最新的客户端库默认使用服务的 2024-11-30 REST API (GA) 版本。
有关详细信息,请参阅下面支持的编程语言的客户端库:
2024 年 11 月
文档智能 REST API v4.0: 2024-11-30 REST API (GA) 现已推出正式版 (GA)! v4.0 REST API 包含以下更改:
🆕 可搜索 PDF。 预生成读取模型现在支持图像格式(JPEG/JPG、PNG、BMP、TIFF、HEIF)和语言扩展,目的是包括用于 PDF 输出的中文、日语和韩语。
-
- 自定义分类模型支持增量训练。 可以向现有类添加新样本,或通过引用现有分类器来添加新类。
- 默认情况下,使用 v4.0 时,自定义分类模型在分析期间不拆分文档。 需要将“splitMode”属性显式设置为 auto,以便保存较旧的行为。
- 自定义分类模型现在支持将 25,000 页作为新的训练页面限制。
-
- 抵押贷款模型现在支持 1003 表、1004 表、1005 表和结算披露表的签名检测。
-
- 收据模型现在支持更多字段,其中包括 ReceiptType、税率、CountryRegion、净额和说明。
-
- 为 1095A、1095C、1099SSA 和 W4 添加了新的预生成税收模型。
-
- 分析响应会在检索操作完成时起存储 24 小时。 对于想要更快地删除响应的方案,请使用删除分析响应 API 删除响应。
v4.0 API 包含来自预览版的累积更新,如下所示:
2024 年 5 月
文档智能工作室添加了对 Microsoft Entra(以前称为 Azure Active Directory)身份验证的支持。 有关详细信息,请参阅文档智能工作室中的身份验证。
2023 年12 月
针对 REST API 2023-10-31-preview 的 文档智能客户端库现已可供使用!
2023 年 11 月
文档智能 2023-10-31-preview REST API 现在可用。 此预览版 API 引入并更新了多项功能:
- “读取”模型
- 手写语言扩展:俄语(
ru
)、阿拉伯语(ar
)、泰国语(th
)。 - 网络行政命令 (EO) 合规性。
- 手写语言扩展:俄语(
-
布局模型
- 支持 Office 和 HTML 文件。
- Markdown 输出支持。
- 改进表提取、读取顺序和节标题检测。
- 推出文档智能 2023-10-31-preview 后,常规文档模型(预生成文档)已弃用。 今后,若要从文档中提取键值对,请使用
prebuilt-layout
模型并启用可选的查询字符串参数features=keyValuePairs
。
-
收据模型
- 现在提取所有与价格相关的字段的货币。
-
医疗保险卡模型
- 针对医疗保险和医疗补助信息的新字段支持。
-
美国税务文件模型
- 新的 1099 税务模型。 支持基本 1099 形式和以下变体:A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB。
-
发票模型
- 对
KVK
字段的支持。 - 对
BPAY
字段的支持。 - 许多字段优化。
- 对
-
自定义分类
- 支持多语言文档。
- 新的页面拆分选项:自动拆分、始终按页面拆分、不拆分。
-
附加功能
-
版本中提供了
2023-10-31-preview
。 - 除读取模型外,所有模型都提供加载项功能。
-
版本中提供了
注意
随着 2022-08-31
API 正式发布(GA)版本,关联的预览版 API 将被弃用。 如果使用 2021-09-30-preview、2022-01-30-preview 或 2022-06-30-preview API 版本,请将应用程序更新为面向 2022-08-31
API 版本。 涉及一些细微更改。有关详细信息,请参阅迁移指南。