文档智能收据模型

重要

  • 使用文档智能选公共预览版,可以提前使用目前正处于开发状态的功能。
  • 在正式发布 (GA) 之前,根据用户反馈,功能、方法和流程可能会发生更改。
  • 文档智能客户端库的公共预览版默认为 REST API 版本 2023-10-31-preview

此内容适用于:checkmarkv4.0(预览版) | 先前版本:blue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)blue-checkmarkv2.1 (GA)

此内容适用于:checkmarkv3.1 (GA) | 最新版本:purple-checkmarkv4.0(预览版) | 先前版本:blue-checkmarkv3.0blue-checkmarkv2.1

此内容适用于:checkmarkv3.0 (GA) | 最新版本:purple-checkmarkv4.0(预览版)purple-checkmarkv3.1(预览版) | 先前版本:blue-checkmarkv2.1

此内容适用于:checkmarkv2.1 | 最新版本:blue-checkmarkv4.0(预览版)

文档智能收据模型将强大的光学字符识别 (OCR) 功能与深度学习模型相结合,可从销售收据中分析和提取关键信息。 收据的格式和质量各有不同,包括印刷和手写收据。 该 API 提取关键信息,例如商家名称、商家电话号码、交易日期、税金和交易总额,并返回结构化 JSON 数据。

收据数据提取

收据数字化包括将各种类型的收据(包括扫描件、照片和打印副本)转换为数字格式,以便简化下游处理。 示例包括费用管理、消费者行为分析、税务自动化等。将文档智能与 OCR(光学字符识别)技术结合使用,可以提取和解释这些不同收据格式中的数据。 文档智能处理不仅简化了转换过程,还大大减少了所需的时间和工作量,从而促进了高效的数据管理和检索。

使用文档智能工作室处理的示例收据

Screenshot of a sample receipt processed in the Document Intelligence Studio.

使用文档智能示例标记工具处理的示例收据

Screenshot of a sample receipt processed with the Form Sample Labeling tool.

开发选项

文档智能 v4.0 (2023-10-31-preview) 支持以下工具、应用程序和库:

功能 资源 模型 ID
收据模型 文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

文档智能 v3.1 支持以下工具、应用程序和库:

功能 资源 模型 ID
收据模型 文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

文档智能 v3.0 支持以下工具、应用程序和库:

功能 资源 模型 ID
收据模型 文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

文档智能 v2.1 支持以下工具、应用程序和库:

功能 资源
收据模型 文档智能标记工具
REST API
客户端库 SDK
文档智能 Docker 容器

输入要求

  • 为获得最佳结果,请针对每个文档提供一张清晰的照片或高质量的扫描件。

  • 支持的文件格式:

    型号 PDF 图像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX) 和 HTML
    阅读
    布局 ✔ (2023-10-31-preview)
    常规文档
    预生成
    自定义
  • 对于 PDF 和 TIFF,最多可处理 2000 页(对于免费层订阅,仅处理前两页)。

  • 用于分析文档的文件大小对于付费 (S0) 层为 500 MB,对于免费 (F0) 层为 4 MB。

  • 图像尺寸必须介于 50 x 50 像素与 10,000 x 10,000 像素之间。

  • 如果 PDF 是密码锁定的文件,则必须先删除锁,然后才能提交它们。

  • 对于 1024 x 768 像素的图像,要提取的文本的最小高度为 12 像素。 此尺寸对应于 150 点/英寸 (DPI) 的大约 8 号字文本。

  • 对于自定义模型训练,自定义模板模型的训练数据最大页数为 500,自定义神经模型的训练数据最大页数为 50,000。

  • 对于自定义提取模型训练,模板模型的训练数据总大小为 50 MB,神经模型的训练数据总大小为为 1G-MB。

  • 对于自定义分类模型训练,训练数据的总大小为 1GB,最大为 10,000 页。

  • 支持的文件格式:JPEG、PNG、PDF 和 TIFF
  • 对于 PDF 和 TIFF,文档智能最多可为标准层订阅者处理 2000 个页面,或仅可为免费层订阅者处理前两页。
  • 文件大小必须小于 50 MB,且尺寸介于 50 x 50 像素和 10,000 x 10,000 像素之间。

收据模型数据提取

查看文档智能如何从收据中提取数据(包括交易时间和日期、商家信息和总金额)。 需要以下资源:

  • Azure 订阅 - 可以创建试用订阅

  • Azure 门户中的文档智能实例。 可以使用免费定价层 (F0) 来试用该服务。 在部署资源后,选择“转到资源”以获取密钥和终结点。

Screenshot of keys and endpoint location in the Azure portal.

注意

文档智能工作室提供 v3.1 和 v3.0 API 及更高版本。

  1. 在文档智能工作室主页上,选择“收据

  2. 可以分析示例收据或上传自己的文件。

  3. 选择“运行分析”按钮,并根据需要配置“分析选项”:

    Screenshot of Run analysis and Analyze options buttons in the Document Intelligence Studio.

    试用 Document Intelligence Studio

文档智能示例标记工具

  1. 导航到“文档智能示例工具”。

  2. 在示例工具主页上,选择“使用预生成模型获取数据”磁贴。

    Screenshot of the layout model analyze results process.

  3. 从下拉菜单中选择要分析的“表单类型”。

  4. 从以下选项中选择要分析的文件的 URL:

  5. 从“源”字段的下拉菜单中选择“URL”,粘贴所选 URL,然后选择“提取”按钮。

    Screenshot of source location dropdown menu.

  6. 在“文档智能服务终结点”字段中,粘贴使用文档智能订阅获得的终结点。

  7. 在“密钥”字段中,粘贴从文档智能资源中获取的密钥。

    Screenshot of the select-form-type dropdown menu.

  8. 选择“运行分析”。 文档智能示例标记工具可调用分析预生成 API 并分析文档。

  9. 查看结果 - 查看提取的键值对、明细项目、突出显示的提取的文本和检测到的表。

    Screenshot of the layout model analyze results operation.

注意

示例标记工具不支持 BMP 文件格式。 这是工具的一项限制,而不是文档智能服务的限制。

支持的语言和区域设置

有关受支持语言的完整列表,请参阅我们的“语言支持 - 预生成模型”页。

字段提取

名称 Type 说明 标准化输出
ReceiptType 字符串 销售收据类型 Itemized
MerchantName 字符串 开具收据的商家的名称
MerchantPhoneNumber phoneNumber 列出的商户电话号码 +1 xxx xxx xxxx
MerchantAddress 字符串 列出的商家地址
TransactionDate Date 开具收据的日期 yyyy-mm-dd
TransactionTime 时间 开具收据的时间 hh-mm-ss(24 小时)
总计 数字(美元) 全部交易收据总额 两位小数浮点数
小计 数字(美元) 收据小计,通常在纳税前 两位小数浮点数
税款 数字(美元) 收据上的总税额(通常为销售税或等价税款)。 在 2022-06-30 版本中重命名为“TotalTax” 两位小数浮点数
提示 数字(美元) 买家提供的小费 两位小数浮点数
对象数组 提取的行项,其中包含名称、数量、单价和提取的总价格
名称 String 项的说明。 在 2022-06-30 版本中重命名为“Description”
数量 Number 每个项的数量 两位小数浮点数
价格 Number 每个项单位的单独价格 两位小数浮点数
TotalPrice Number 行项总价 两位小数浮点数

文档智能 v3.0 及更高版本引入了几项新特性和功能。 除了热收据外,“收据”模型还支持单页酒店收据处理和对所有收据类型提取税务明细。

在 Document Intelligence V4.0 及更高版本中,针对热力和酒店行业收据的所有价格相关字段引入了货币支持。

收据

字段 类型​​ 说明 示例
MerchantName string 开具收据的商家的名称 Contoso
MerchantPhoneNumber phoneNumber 列出的商户电话号码 987-654-3210
MerchantAddress address 列出的商家地址 123 Main St. Redmond WA 98052
Total number 全部交易收据总额 14.34 美元
TransactionDate date 开具收据的日期 2019 年 6 月 6 日
TransactionTime time 开具收据的时间 下午 4:49
Subtotal number 收据小计,通常在纳税前 12.34 美元
TotalTax number 收据上的税金,通常为销售税或等价税款 $2.00
Tip number 买家提供的小费 1\.00 美元
Items array
Items.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
Items.*.TotalPrice number 行项总价 999.00 美元
Items.*.Description string 项的说明 Surface Pro 6
Items.*.Quantity number 每个项的数量 1
Items.*.Price number 每个项单位的单独价格 999.00 美元
Items.*.ProductCode string 与特定行项目关联的产品代码、产品编号或 SKU A123
Items.*.QuantityUnit string 每个项的数量单位
TaxDetails array
TaxDetails.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
TaxDetails.*.Amount currency 税务明细金额 999.00 美元

receipt.retailMeal

字段 类型​​ 说明 示例
MerchantName string 开具收据的商家的名称 Contoso
MerchantPhoneNumber phoneNumber 列出的商户电话号码 987-654-3210
MerchantAddress address 列出的商家地址 123 Main St. Redmond WA 98052
Total number 全部交易收据总额 14.34 美元
TransactionDate date 开具收据的日期 2019 年 6 月 6 日
TransactionTime time 开具收据的时间 下午 4:49
Subtotal number 收据小计,通常在纳税前 12.34 美元
TotalTax number 收据上的税金,通常为销售税或等价税款 $2.00
Tip number 买家提供的小费 1\.00 美元
Items array
Items.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
Items.*.TotalPrice number 行项总价 999.00 美元
Items.*.Description string 项的说明 Surface Pro 6
Items.*.Quantity number 每个项的数量 1
Items.*.Price number 每个项单位的单独价格 999.00 美元
Items.*.ProductCode string 与特定行项目关联的产品代码、产品编号或 SKU A123
Items.*.QuantityUnit string 每个项的数量单位
TaxDetails array
TaxDetails.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
TaxDetails.*.Amount currency 税务明细金额 999.00 美元

receipt.creditCard

字段 类型​​ 说明 示例
MerchantName string 开具收据的商家的名称 Contoso
MerchantPhoneNumber phoneNumber 列出的商户电话号码 987-654-3210
MerchantAddress address 列出的商家地址 123 Main St. Redmond WA 98052
Total number 全部交易收据总额 14.34 美元
TransactionDate date 开具收据的日期 2019 年 6 月 6 日
TransactionTime time 开具收据的时间 下午 4:49
Subtotal number 收据小计,通常在纳税前 12.34 美元
TotalTax number 收据上的税金,通常为销售税或等价税款 $2.00
Tip number 买家提供的小费 1\.00 美元
Items array
Items.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
Items.*.TotalPrice number 行项总价 999.00 美元
Items.*.Description string 项的说明 Surface Pro 6
Items.*.Quantity number 每个项的数量 1
Items.*.Price number 每个项单位的单独价格 999.00 美元
Items.*.ProductCode string 与特定行项目关联的产品代码、产品编号或 SKU A123
Items.*.QuantityUnit string 每个项的数量单位
TaxDetails array
TaxDetails.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
TaxDetails.*.Amount currency 税务明细金额 999.00 美元

receipt.gas

字段 类型​​ 说明 示例
MerchantName string 开具收据的商家的名称 Contoso
MerchantPhoneNumber phoneNumber 列出的商户电话号码 987-654-3210
MerchantAddress address 列出的商家地址 123 Main St. Redmond WA 98052
Total number 全部交易收据总额 14.34 美元
TransactionDate date 开具收据的日期 2019 年 6 月 6 日
TransactionTime time 开具收据的时间 下午 4:49
Subtotal number 收据小计,通常在纳税前 12.34 美元
TotalTax number 收据上的税金,通常为销售税或等价税款 $2.00
Tip number 买家提供的小费 1\.00 美元
Items array
Items.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
Items.*.TotalPrice number 行项总价 999.00 美元
Items.*.Description string 项的说明 Surface Pro 6
Items.*.Quantity number 每个项的数量 1
Items.*.Price number 每个项单位的单独价格 999.00 美元
Items.*.ProductCode string 与特定行项目关联的产品代码、产品编号或 SKU A123
Items.*.QuantityUnit string 每个项的数量单位
TaxDetails array
TaxDetails.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
TaxDetails.*.Amount currency 税务明细金额 999.00 美元

receipt.parking

字段 类型​​ 说明 示例
MerchantName string 开具收据的商家的名称 Contoso
MerchantPhoneNumber phoneNumber 列出的商户电话号码 987-654-3210
MerchantAddress address 列出的商家地址 123 Main St. Redmond WA 98052
Total number 全部交易收据总额 14.34 美元
TransactionDate date 开具收据的日期 2019 年 6 月 6 日
TransactionTime time 开具收据的时间 下午 4:49
Subtotal number 收据小计,通常在纳税前 12.34 美元
TotalTax number 收据上的税金,通常为销售税或等价税款 $2.00
Tip number 买家提供的小费 1\.00 美元
Items array
Items.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
Items.*.TotalPrice number 行项总价 999.00 美元
Items.*.Description string 项的说明 Surface Pro 6
Items.*.Quantity number 每个项的数量 1
Items.*.Price number 每个项单位的单独价格 999.00 美元
Items.*.ProductCode string 与特定行项目关联的产品代码、产品编号或 SKU A123
Items.*.QuantityUnit string 每个项的数量单位
TaxDetails array
TaxDetails.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
TaxDetails.*.Amount currency 税务明细金额 999.00 美元

receipt.hotel

字段 类型​​ 说明 示例
MerchantName string 开具收据的商家的名称 Contoso
MerchantPhoneNumber phoneNumber 列出的商户电话号码 987-654-310
MerchantAddress address 列出的商家地址 123 Main St. Redmond WA 98052
Total number 全部交易收据总额 14.34 美元
ArrivalDate date 到达日期 27Mar21
DepartureDate date 出发日期 28Mar21
Currency string 收据金额的货币单位 (ISO 4217) 或者“混合”(如果找到多个值) USD
MerchantAliases array
MerchantAliases.* string 商家的备用名称 Contoso (R)
Items array
Items.* object 提取的行项 1
Surface Pro 6
999.00 美元
999.00 美元
Items.*.TotalPrice number 行项总价 999.00 美元
Items.*.Description string 项的说明 房间费用
Items.*.Date date 项日期 27Mar21
Items.*.Category string 项目类别 会议室

迁移指南和 REST API v3.1

后续步骤