文档智能美国税务文档模型

此内容适用于:选中标记v3.1 (GA)

文档智能合同模型使用强大的光学字符识别 (OCR) 功能来分析和提取一组选定的税务文档中的关键字段和行项。 税务文档可以是各种格式和质量的,包括手机拍摄的图像、扫描的文档和数字 PDF。 该 API 可分析文档文本,提取客户姓名、帐单邮寄地址、截止日期和未付金额等关键信息,并返回结构化的 JSON 数据表示形式。 该模型目前支持某些英语税务文档格式。

支持的文档类型:

  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 和变体(A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB)
  • 1040 和变体(计划 1、计划 2、计划 3、计划 8812、计划 A、计划 B、计划 C、计划 D、计划 E、计划 EIC、计划 F、计划 H、计划 J、计划 R、计划 SE 和计划 Senior)

自动税务文档处理

自动税务文档处理是从税务文档中提取关键字段的过程。 传统的税务文档处理需要人工作业。 此模型允许轻松地自动处理税务方案。

开发选项

文档智能 v3.1 支持以下工具、应用程序和库:

功能 资源 模型 ID
美国税务表单模型 文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

文档智能 v3.0 支持以下工具、应用程序和库:

功能 资源 模型 ID
美国税务表单模型 文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

输入要求

  • 为获得最佳结果,请针对每个文档提供一张清晰的照片或高质量的扫描件。

  • 支持的文件格式:

    型号 PDF 图像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX) 和 HTML
    阅读
    布局 ✔(2024-02-29-preview、2023-10-31-preview)
    常规文档
    预生成
    自定义
  • 对于 PDF 和 TIFF,最多可处理 2000 页(对于免费层订阅,仅处理前两页)。

  • 用于分析文档的文件大小对于付费 (S0) 层为 500 MB,对于免费 (F0) 层为 4 MB。

  • 图像尺寸必须介于 50 x 50 像素与 10,000 x 10,000 像素之间。

  • 如果 PDF 是密码锁定的文件,则必须先删除锁,然后才能提交它们。

  • 对于 1024 x 768 像素的图像,要提取的文本的最小高度为 12 像素。 此尺寸对应于 150 点/英寸 (DPI) 的大约 8 号字文本。

  • 对于自定义模型训练,自定义模板模型的训练数据最大页数为 500,自定义神经模型的训练数据最大页数为 50,000。

  • 对于自定义提取模型训练,模板模型的训练数据总大小为 50 MB,神经模型的训练数据总大小为为 1G-MB。

  • 对于自定义分类模型训练,训练数据的总大小为 1GB,最大为 10,000 页。

试用税务文档数据提取

了解如何从发票中提取数据,包括客户信息、供应商详细信息和行项目。 需要以下资源:

  • Azure 订阅 - 可以创建试用订阅

  • Azure 门户中的文档智能实例。 可以使用免费定价层 (F0) 来试用该服务。 在部署资源后,选择“转到资源”以获取密钥和终结点。

该屏幕截图显示了 Azure 门户中密钥和终结点的位置。

文档智能工作室

  1. 文档智能工作室主页上,选择支持的税务文档模型。

  2. 可以分析示例税务文档或上传自己的文件。

  3. 选择“运行分析”按钮,并根据需要配置“分析选项”:

    文档智能工作室中“运行分析”和“分析选项”按钮的屏幕截图。

试用 Document Intelligence Studio

支持的语言和区域设置

有关受支持语言的完整列表,请参阅我们的语言支持 - 预生成模型页。

字段提取 W-2

下面是从 JSON 输出响应中的 W-2 税务表单中提取的字段。

名称 Type 描述 示例输出 dependents
W-2FormVariant 字符串 IR W-2 表单变体。 此字段可以具有以下值之一:W-2W-2ASW-2CMW-2GUW-2VI W-2
TaxYear Number 表单税务年度 2021
W2Copy 字符串 W-2 税务副本版本以及与此副本相关的打印说明 副本 A–提交给社会安全局
Employee object 包含社会安全号码、姓名和地址的对象
ControlNumber string W-2 控制编号。 IRS W-2 字段 d 0AB12 D345 7890
Employer Object 包含雇主标识号、姓名和地址的对象
WagesTipsAndOtherCompensation Number 工资、小费和其他报酬金额(美元)。 IRS W-2 字段 1 1234567.89
FederalIncomeTaxWithheld Number 联邦所得税预扣金额(美元)。 IRS W-2 字段 2 1234567.89
SocialSecurityWages Number 社会安全工资金额(美元)。 IRS W-2 字段 3 1234567.89
SocialSecurityTaxWithheld 社会安全税预扣金额(美元)。 IRS W-2 字段 4 1234567.89
MedicareWagesAndTips 医疗保险工资和小费金额(美元)。 IRS W-2 字段 5 1234567.89
MedicareTaxWithheld 医疗保险税预扣金额(美元)。 IRS W-2 字段 6 1234567.89
SocialSecurityTips Number 社会安全小费金额(美元)。 IRS W-2 字段 7 1234567.89
AllocatedTips Number 分配的小费(美元)。 IRS W-2 字段 8 1234567.89
VerificationCode W-2 验证码。 IRS W-2 字段 9 1234567.89
DependentCareBenefits 受抚养人照护福利金额(美元)。 IRS W-2 字段 10 1234567.89
NonQualifiedPlans Number 非限定计划金额(美元)。 IRS W-2 字段 11 1234567.89
IsStatutoryEmployee 字符串 IRS W-2 字段 13 的一部分。 可以为“true”或“false”
IsRetirementPlan 字符串 IRS W-2 字段 13 的一部分。 可以为“true”或“false”
IsThirdPartySickPay 字符串 IRS W-2 字段 13 的一部分。 可以为“true”或“false”
Other 字符串 IRS W-2 字段 14 的内容 病假工资上限为 511 美元/天 1356
StateTaxInfos Array 州税务相关信息。 IRS W-2 字段 15 到 17 的内容
LocaleTaxInfos Array 当地税务相关信息。 IRS W-2 字段 18 到 20 的内容

字段提取 1098

下面是从 JSON 输出响应中的 1098 税务表单中提取的字段。 1098-T 和 1098-E 表单也受支持。

名称 Type 描述 示例输出
TaxYear Number 表单税务年度 2021
借款人 Object 包含借款人的 TIN、Name、Address 和 AccountNumber 的对象
出借人 Object 包含出借人的 TIN、Name、Address 和 Telephone 的对象
MortgageInterest Number 从付款人/借款人收到的按揭利息金额(框 1) 1,234,567.89
OutstandingMortgagePrincipal Number 未偿抵押贷款本金(框 2) 1,234,567.89
MortgageOriginationDate Date 抵押贷款发放日期(框 3) 2022-01-01
OverpaidInterestRefund Number 多付利息的退款金额(框 4) 1,234,567.89
MortgageInsurancePremium Number 抵押贷款保险费金额(框 5) 1,234,567.89
PointsPaid Number 购买主要住宅时支付的点数(框 6) 1,234,567.89
IsPropertyAddressSameAsBorrower 字符串 担保抵押贷款的房产地址是否与付款人/借款人的邮寄地址相同(框 7)
PropertyAddress 字符串 担保抵押贷款的房产的地址或说明(框 8) 123 Main St., Redmond WA 98052
MortgagedPropertiesCount Number 抵押房产数(框 9) 1
其他 字符串 向付款人报告的其他信息(框 10)
RealEstateTax 房地产税(框 1) 1,234,567.89
AdditionalAssessment 字符串 添加了对房产的评估(框 10) 1,234,567.89
MortgageAcquisitionDate date 抵押贷款取得日期(框 11) 2022-01-01

字段提取 1099-NEC

下面是从 JSON 输出响应中的 1099-nec 税务表单中提取的字段。 还支持 1099 的其他变体。

名称 Type 描述 示例输出
TaxYear 字符串 从 1099-NEC 表单中提取的税务年份。 2021
Payer 对象 包含付款人的 TIN、Name、Address 和 PhoneNumber 的对象
Recipient Object 包含收款人的 TIN、Name、Address 和 AccountNumber 的对象
Box1 数字 从 1099-NEC 表单中提取的 Box 1。 123456
Box2 boolean 从 1099-NEC 表单中提取的 Box 2。
Box4 数字 从 1099-NEC 表单中提取的 Box 4。 123456
StateTaxesWithheld array 从 1099-NEC 表单中提取的州扣缴税款(box 5、6 和 7)

1040 税务表单的字段提取

下面是从 JSON 输出响应中的 1040 税务表单中提取的字段。 还支持 1040 的其他变体。

名称 Type 描述 示例输出
TaxPayer Object 一个对象,其中包含纳税人的信息,如 SSN、姓氏和地址
Spouse Object 一个对象,其中包含配偶的信息,如 SSN、姓氏、名字和首字母缩写
Dependents array 一个数组,其中包含被扶养人列表,包括姓名、SSN 和信用类型等信息
ThirdPartyDesignee object 一个对象,其中包含第三方受托人的相关信息
SignatureDetails object 一个对象,其中包含有关签字人的信息,如电话号码和电子邮件
PaidPreparer object 包含填表人相关信息的对象。
FillingStatus 字符串 值可以是 noSelection、single、marriedFilingJointly、marriedFillingSeparately、headOfHousehold、qualifyingSurvivingSpouse 或 multiSelection 之一。 single
FilingStatusDetails object 一个对象,其中包含报税身份的相关信息。
NameOfSpouseOrQualifyingPerson 字符串 从表单 1040 中提取的配偶或合格个人的姓名。 John Smith
PresidentialElectionCampaign 字符串 值可以是 noSelection、taxpayer、spouse 或 multiSelection 之一。 Taxpayer
PresidentialElectionCampaignDetails object 一个对象,其中包含有关总统竞选活动的详细信息。
DigitalAssets 字符串 值可以是 noSelection、yes、no 或 multiSelection 之一。
DigitalAssetsDetails 对象 (object) 一个对象,其中包含有关数字资产的详细信息。
ClaimStatus 字符串 值可以是 noSelection、taxpayerAsDependent、spouseAsDependent、spouseItemizesSeparatelyOrDualStatusAlien 或 multiSelection 之一。 taxpayerAsDependent
ClaimStatusDetails object 一个对象,其中包含有关申报身份的详细信息。
TaxpayerAgeBlindness 字符串 值可以是 noSelection、above64、blind 或 multiSelection 之一。 above64
TaxPayerAgeBlindnessDetails object 一个对象,其中包含有关纳税人年龄/失明情况的详细信息。
SpouseAgeBlindness 字符串 值可以是 noSelection、above64、blind 或 multiSelection 之一。 above64
TaxPayerAgeBlindnessDetails object 一个对象,其中包含有关配偶年龄/失明情况的详细信息。
MoreThanFourDependents boolean 从表单 1040 中提取的 4 名以上的被扶养人。
Box1a 数字 从 1040 中提取的框 1a 123456
根据提供的 JSON 结构将其转换为符合请求的表格式,结果如下所示:
Box1b 数字 从 1040 中提取的框 1b 123456
Box1c 数字 从 1040 中提取的框 1c 123456
Box1d 数字 从 1040 中提取的框 1d 123456
Box1e 数字 从 1040 中提取的框 1e 123456
Box1f 数字 从 1040 中提取的框 1f 123456
Box1g 数字 从 1040 中提取的框 1g 123456
Box1h 数字 从 1040 中提取的框 1h 123456
Box1i 数字 从 1040 中提取的框 1i 123456
Box1z 数字 从 1040 中提取的框 1z 123456
Box2a 数字 从 1040 中提取的框 2a 123456
Box2b 数字 从 1040 中提取的框 2b 123456
Box3a 数字 从 1040 中提取的框 3a 123456
Box3b 数字 从 1040 中提取的框 3b 123456
Box4a 数字 从 1040 中提取的框 4a 123456
Box4b 数字 从 1040 中提取的框 4b 123456
Box5a 数字 从 1040 中提取的框 5a 123456
Box5b 数字 从 1040 中提取的框 5b 123456
Box6a 数字 从 1040 中提取的框 6a 123456
Box6b 数字 从 1040 中提取的框 6b 123456
Box6cCheckbox boolean 从 1040 中提取的框 6c 复选框。
Box7Checkbox boolean 从 1040 中提取的框 7 复选框。
Box7 数字 从 1040 中提取的框 7。 123456
Box8 数字 从 1040 中提取的框 8。 123456
Box9 数字 从 1040 中提取的框 9。 123456
Box10 数字 从 1040 中提取的框 10。 123456
Box11 数字 从 1040 中提取的框 11。 123456
Box12 数字 从 1040 中提取的框 12。 123456
Box13 数字 从 1040 中提取的框 13。 123456
Box14 数字 从 1040 中提取的框 14。 123456
Box15 数字 从 1040 中提取的框 15。 123456
Box16FromForm string 值可以是 noSelection、8814、4972、other 或 multiSelection 之一。 8814
Box16FromFormDetails object 包含有关框 16 的详细信息的对象
Box16OtherFormNumber string 从 1040 中提取的框 16 其他表单编号。 8888
Box16 数字 从 1040 中提取的框 16。 123456
Box17 数字 从 1040 中提取的框 17。 123456
Box18 数字 从 1040 中提取的框 18。 123456
Box19 数字 从 1040 中提取的框 19。 123456
Box20 数字 从 1040 中提取的框 20。 123456
Box21 数字 从 1040 中提取的框 21。 123456
Box22 数字 从 1040 中提取的框 22。 123456
Box23 数字 从 1040 中提取的框 23。 123456
Box24 数字 从 1040 中提取的框 24。 123456
Box25a 数字 从 1040 中提取的框 25a 123456
Box25b 数字 从 1040 中提取的框 25b 123456
Box25c 数字 从 1040 中提取的框 25c 123456
Box25d 数字 从 1040 中提取的框 25d 123456
Box26 数字 从 1040 中提取的框 26。 123456
Box27 数字 从 1040 中提取的框 27。 123456
Box28 数字 从 1040 中提取的框 28。 123456
Box29 数字 从 1040 中提取的框 29。 123456
Box31 数字 从 1040 中提取的框 31。 123456
Box32 数字 从 1040 中提取的框 32。 123456
Box33 数字 从 1040 中提取的框 33。 123456
Box34 数字 从 1040 中提取的框 34。 123456
Box35Checkbox boolean 从 1040 中提取的框 35。
Box35a 数字 从 1040 中提取的框 35a 123456
Box35b 数字 从 1040 中提取的框 35b 123456
Box35c string 值可以是 noSelection、checking、savings 或 multiSelection 之一。 检查
Box35cDetails object 包含有关框 35c 的详细信息的对象
Box35d 数字 从 1040 中提取的框 35d 123456
Box36 数字 从 1040 中提取的框 36。 123456
Box37 数字 从 1040 中提取的框 37。 123456
Box38 数字 从 1040 中提取的框 38。 123456
HasAssignedThirdPartyDesignee string 值可以是 noSelection、yes、no 或 multiSelection 之一。
HasAssignedThirdPartyDesigneeDetails 对象 (object) 该对象包含为指定的第三方受托人选择的内容的信息

提取的税务文档键值对和行项位于 JSON 输出的 documentResults 部分。

后续步骤