文档智能美国税务文档模型
此内容适用于: v3.1 (GA)
文档智能合同模型使用强大的光学字符识别 (OCR) 功能来分析和提取一组选定的税务文档中的关键字段和行项。 税务文档可以是各种格式和质量的,包括手机拍摄的图像、扫描的文档和数字 PDF。 该 API 可分析文档文本,提取客户姓名、帐单邮寄地址、截止日期和未付金额等关键信息,并返回结构化的 JSON 数据表示形式。 该模型目前支持某些英语税务文档格式。
支持的税务表单类型:
- 美国统一税
- W-2
- 1098
- 1098-E
- 1098-T
- 1099 和变体(A、B、C、CAP、Combo、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB)
- 1040 和变体(计划 1、计划 2、计划 3、计划 8812、计划 A、计划 B、计划 C、计划 D、计划 E、计划 EIC、计划 F、计划 H、计划 J、计划 R、计划 SE 和计划 Senior)
自动税务文档处理
自动税务文档处理是从税务文档中提取关键字段的过程。 传统的税务文档处理需要人工作业。 此模型允许轻松地自动处理税务方案。
美国统一税
此预览版引入了 Unified US Tax
预生成模型,该模型会自动检测和提取提交的文档中的 W2
、1098
、1040
和 1099
税务表单中的数据。 这些文档可以由许多税务或非税务相关文档组成。 模型仅处理它支持的表单。
开发选项
文档智能 v3.1 支持以下工具、应用程序和库:
功能 | 资源 | 模型 ID |
---|---|---|
美国税务表单模型 | • 文档智能工作室 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us.W-2 • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T |
文档智能 v3.0 支持以下工具、应用程序和库:
功能 | 资源 | 模型 ID |
---|---|---|
美国税务表单模型 | • 文档智能工作室 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us.W-2 • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T |
输入要求
支持的文件格式:
型号 PDF 图像: JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
Microsoft Office:
Word (DOCX
)、Excel (XLSX
)、PowerPoint (PPTX
)、HTML读取 ✔ ✔ ✔ 布局 ✔ ✔ ✔(2024-07-31-preview、2024-02-29-preview、2023-10-31-preview) 常规文档 ✔ ✔ 预生成 ✔ ✔ 自定义提取 ✔ ✔ 自定义分类 ✔ ✔ ✔(2024-07-31-preview、2024-02-29-preview) 为获得最佳结果,请针对每个文档提供一张清晰的照片或高质量的扫描件。
对于 PDF 和 TIFF,最多可处理 2,000 页(对于免费层订阅,仅处理前两页)。
用于分析文档的文件大小对于付费 (S0) 层为 500 MB,对于免费 (F0) 层为
4
MB。图像尺寸必须介于 50 像素 x 50 像素与 10,000 像素 x 10,000 像素之间。
如果 PDF 是密码锁定的文件,则必须先删除锁,然后才能提交它们。
对于 1024 x 768 像素的图像,要提取的文本的最小高度为 12 像素。 此尺寸对应于 150 点/英寸 (DPI) 的大约
8
号字文本。对于自定义模型训练,自定义模板模型的训练数据最大页数为 500,自定义神经模型的训练数据最大页数为 50,000。
对于自定义提取模型训练,模板模型的训练数据总大小为 50 MB,神经网络模型的训练数据总大小为
1
GB。对于自定义分类模型训练,训练数据总大小为
1
GB,上限为 10,000 页。 对于 2024-07-31-preview 及更高版本,训练数据总大小为2
GB,上限为 10,000 页。
试用税务文档数据提取
了解如何从发票中提取数据,包括客户信息、供应商详细信息和行项目。 需要以下资源:
文档智能工作室
在文档智能工作室主页上,选择支持的税务文档模型。
可以分析示例税务文档或上传自己的文件。
选择“运行分析”按钮,并根据需要配置“分析选项”:
支持的语言和区域设置
有关受支持语言的完整列表,请参阅我们的语言支持 - 预生成模型页。
字段提取 W-2
下面是从 JSON 输出响应中的 W-2 税务表单中提取的字段。
名称 | Type | 说明 | 示例 |
---|---|---|---|
W2FormVariant |
string |
IRS W2 税务表单变体。 此字段可以具有以下值之一:W-2 、W-2AS 、W-2CM 、W-2GU 或 W-2VI |
W-2 |
TaxYear |
string |
表单税务年度 | 2021 |
W2Copy |
string |
W2 税务表单副本版本以及与此副本相关的打印说明 | 副本 A–提交给社会安全局 |
Employee |
object |
包含社会安全号码、姓名和地址的对象 | |
Employee.SocialSecurityNumber |
string |
员工社会安全号码。 IRS W2 税务字段 A ,例如 123-45-6789 |
123-45-6789 |
Employee.Name |
string |
员工名字、中间完整/首字母缩写名、姓氏和后缀。 IRS W2 税务字段 e | John Contoso |
Employee.Address |
address |
员工地址。 IRS W2 税务字段 f 的一部分 | 123 Microsoft way, Redmond Washington, 98123 |
ControlNumber |
string |
W2 税务表单控制编号。 IRS W2 税务字段 d | 0AB12 D345 7890 |
Employer |
object |
包含雇主标识号、姓名和地址的对象 | |
Employer.IdNumber |
string |
雇主标识号。 IRS W2 税务字段 b | 12-3456789 |
Employer.Name |
string |
雇主名称。 IRS W2 税务字段 c 的一部分 | Fabrikam |
Employer.Address |
address |
雇主地址。 IRS W2 税务字段 c 的一部分 | 321 Microsoft way, Redmond Washington, 98123 |
WagesTipsAndOtherCompensation |
number |
工资、小费和其他报酬金额(美元)。 IRS W2 税务字段 1 | 1234567.89 |
FederalIncomeTaxWithheld |
number |
联邦所得税预扣金额(美元)。 IRS W2 税务字段 2 | 1234567.89 |
SocialSecurityWages |
number |
社会安全工资金额(美元)。 IRS W2 税务字段 3 | 1234567.89 |
SocialSecurityTaxWithheld |
number |
社会安全税预扣金额(美元)。 IRS W2 税务字段 4 | 1234567.89 |
MedicareWagesAndTips |
number |
医疗保险工资和小费金额(美元)。 IRS W2 税务字段 5 | 1234567.89 |
MedicareTaxWithheld |
number |
医疗保险税预扣金额(美元)。 IRS W2 税务字段 6 | 1234567.89 |
SocialSecurityTips |
number |
社会安全小费金额(美元)。 IRS W2 税务字段 7 | 1234567.89 |
AllocatedTips |
number |
分配的小费(美元)。 IRS W2 税务字段 8 | 1234567.89 |
VerificationCode |
string |
W2 税务表单验证码。 IRS W2 税务字段 9 | AB123456 |
DependentCareBenefits |
number |
受抚养人照护福利金额(美元)。 IRS W2 税务字段 10 | 1234567.89 |
NonQualifiedPlans |
number |
非限定计划金额(美元)。 IRS W2 税务字段 11 | 1234567.89 |
AdditionalInfo |
array |
保存 W2 代码的数组。 IRS W2 税务字段 12 | |
AdditionalInfo.* |
object |
||
AdditionalInfo.*.LetterCode |
string |
有关 IRS W2 框 12 字母代码的详细信息,请参阅 IRS 字母代码 | A |
AdditionalInfo.*.Amount |
number |
代码金额(美元) | 1234567.89 |
IsStatutoryEmployee |
string |
IRS W2 税务字段 13 的一部分。 可以是 true 或 false |
是 |
IsRetirementPlan |
string |
IRS W2 税务字段 13 的一部分。 可以是 true 或 false |
是 |
IsThirdPartySickPay |
string |
IRS W2 税务字段 13 的一部分。 可以是 true 或 false |
是 |
Other |
string |
IRS W2 税务字段 14 的内容 | 病假工资上限为 511 美元/天 1356 |
StateTaxInfos |
array |
州税务相关信息。 IRS W2 税务字段 15 到 17 的内容 | |
StateTaxInfos.* |
object |
||
StateTaxInfos.*.State |
string |
两个字母状态代码。 IRS W2 税务字段 15 的一部分 | WA |
StateTaxInfos.*.EmployerStateIdNumber |
string |
雇主状态 ID 号。 IRS W2 税务字段 15 的一部分 | 1234567 |
StateTaxInfos.*.StateWagesTipsEtc |
number |
州工资、小费、金额(美元)。 IRS W2 税务字段 16 | 1234567.89 |
StateTaxInfos.*.StateIncomeTax |
number |
州所得税金额(美元)。 IRS W2 税务字段 17 | 1234567.89 |
LocalTaxInfos |
array |
当地税务相关信息。 IRS W2 税务字段 18 到 20 的内容 | |
LocalTaxInfos.* |
object |
||
LocalTaxInfos.*.LocalWagesTipsEtc |
number |
当地工资、小费、金额(美元)。 IRS W2 税务字段 18 的一部分 | 1234567.89 |
LocalTaxInfos.*.LocalIncomeTax |
number |
当地所得税金额(美元)。 IRS W2 税务字段 19 的一部分 | 1234567.89 |
LocalTaxInfos.*.LocalityName |
string |
所在地名称。 IRS W2 税务字段 20 的一部分 | Redmond |
字段提取 1098
下面是从 JSON 输出响应中的 1098 税务表单中提取的字段。 1098-T 和 1098-E 表单也受支持。
字段 | 类型 | 说明 | 示例 |
---|---|---|---|
TaxYear |
number |
表单税务年度 | 2021 |
Borrower |
object |
包含借款人的 TIN、姓名、地址和帐号的对象 | |
Borrower.TIN |
string |
借款人税务标识号 | 123-45-6789 |
Borrower.Name |
string |
表单上写的借款人全名 | John Smith |
Borrower.Address |
address |
借款人地址 | 123 Microsoft Way, Redmond Washington 98052 |
Borrower.AccountNumber |
string |
借款人帐号 | 55123456789 |
Lender |
object |
包含贷款人的 TIN、邢敏、地址和电话的对象 | |
Lender.TIN |
string |
贷款人税务标识号 | 12-3456789 |
Lender.Name |
string |
贷款人姓名 | Woodgrove Bank |
Lender.Address |
address |
贷款人地址 | 321 Microsoft Way, Redmond Washington 98052 |
Lender.Telephone |
string |
贷款人电话号码 | (987) 654-3210 |
MortgageInterest |
number |
从付款人/借款人收到的按揭利息金额(框 1) | 1,234,567.89 |
OutstandingMortgagePrincipal |
number |
未偿抵押贷款本金(框 2) | 1,234,567.89 |
MortgageOriginationDate |
date |
抵押贷款发放日期(框 3) | 2022-01-01 |
OverpaidInterestRefund |
number |
多付利息的退款金额(框 4) | 1,234,567.89 |
MortgageInsurancePremium |
number |
抵押贷款保险费金额(框 5) | 1,234,567.89 |
PointsPaid |
number |
购买主要住宅时支付的点数(框 6) | 1,234,567.89 |
IsPropertyAddressSameAsBorrower |
string |
担保抵押贷款的房产地址是否与付款人/借款人的邮寄地址相同(框 7) | 是 |
PropertyAddress |
string |
担保抵押贷款的房产的地址或说明(框 8) | 123 Main St., Redmond Washington 98052 |
MortgagedPropertiesCount |
number |
抵押房产数(框 9) | 1 |
Other |
string |
向付款人报告的其他信息(框 10) | |
RealEstateTax |
number |
房地产税(框 10) | 1,234,567.89 |
AdditionalAssessment |
string |
对房产的其他评估(框 10) | 观察到的结构性损失 |
MortgageAcquisitionDate |
date |
抵押贷款取得日期(框 11) | 2022-01-01 |
IsCorrected |
string |
指示表单是否为纠正存档。 | 是 |
字段提取 1099-NEC
下面是从 JSON 输出响应中的 1099-nec 税务表单中提取的字段。 还支持 1099 的其他变体。
字段 | 类型 | 说明 | 示例 |
---|---|---|---|
TaxYear |
string |
从 1099-NEC 表单中提取的税务年份。 | 2022 |
Payer |
object |
包含付款人的 TIN、姓名、地址和电话号码的对象 | |
Payer.TIN |
string |
付款人税务标识号。 | 123-45-6789 |
Payer.Name |
string |
表单上写的付款人全名。 | John Smith |
Payer.Address |
address |
付款人地址。 | 123 Microsoft Way, Redmond Washington 98052 |
Payer.PhoneNumber |
phoneNumber |
付款人电话号码。 | +19876543210 |
Recipient |
object |
包含收款人的 TIN、姓名、地址和帐号的对象 | |
Recipient.TIN |
string |
收款人税务标识号。 | 123-45-6789 |
Recipient.Name |
string |
表单上写的收款人全名。 | John Smith |
Recipient.Address |
address |
收款人地址。 | 123 Microsoft Way, Redmond Washington 98052 |
Recipient.AccountNumber |
string |
收款人帐号。 | 55123456789 |
Box1 |
number |
从 1099-NEC 中提取的框 1。 | 123456 |
Box2 |
boolean |
从 1099-NEC 中提取的框 2。 | :selected: |
Box4 |
number |
从 1099-NEC 中提取的框 4。 | 123456 |
StateTaxesWithheld |
array |
从 1099-NEC 表单中提取的州预扣税 | |
StateTaxesWithheld.* |
object |
包含州税务详细信息的对象 | |
StateTaxesWithheld.*.Box5 |
number |
从 1099-NEC 中提取的框 5。 | 123456 |
StateTaxesWithheld.*.Box6 |
string |
从 1099-NEC 中提取的框 6。 | 12-3456789 |
StateTaxesWithheld.*.Box7 |
number |
从 1099-NEC 中提取的框 7。 | 123456 |
字段提取 1099-Combo
下面是从 JSON 输出响应中的 1099-Combo 税务表单中提取的字段。 还支持 1099 的其他变体:
字段 | 类型 | 说明 | 示例 |
---|---|---|---|
TaxYear |
string |
从 1099-Combo 表单提取的税年。 | 2022 |
Payer |
object |
包含付款人的 TIN、姓名、地址和电话号码的对象 | |
Payer.TIN |
string |
付款人税务标识号。 | 123-45-6789 |
Payer.Name |
string |
表单上写的付款人全名。 | John Smith |
Payer.Address |
address |
付款人地址。 | 123 Microsoft Way, Redmond Washington 98052 |
Payer.AccountNumber |
phoneNumber |
付款人电话号码。 | +19876543210 |
Recipient |
object |
包含收款人的 TIN、姓名、地址和帐号的对象 | |
Recipient.TIN |
string |
收款人税务标识号。 | 123-45-6789 |
Recipient.Name |
string |
表单上写的收款人全名。 | John Smith |
Recipient.Address |
address |
收款人地址。 | 123 Microsoft Way, Redmond Washington 98052 |
Recipient.AccountNumber |
string |
收款人帐号。 | 55123456789 |
1099-B |
object |
||
1099-B.Summary |
array |
1099-B 中报告的事务摘要列表 |
|
1099-B.Summary.* |
object |
||
1099-B.Summary.*.Category |
string |
可以是以下类别之一:shortTermBasisReportedToIRS 、shortTermBasisNotReportedToIRS 、shortTerm1099BNotReceived 、longTermBasisReportedToIRS 、longTermBasisNotReportedToIRS 、longTerm1099BNotReceived 、underterminedTermBasisReportedToIRS 、undertinedTermBasisNotReportedToIRS 、undertined1099BNotReceived 。 |
shortTermBasisReportedToIRS |
1099-B.Summary.*.TotalProceeds |
number |
从 1099-B 中提取的总收益摘要 |
123456 |
1099-B.Summary.*.TotalCostBasis |
string |
从 1099-B 中提取的总成本基础摘要 |
123456 |
1099-B.Summary.*.TotalMarketDiscount |
string |
从 1099-B 中提取的总市场折扣摘要 |
123456 |
1099-B.Summary.*.TotalWashSales |
string |
从 1099-B 中提取的总洗售摘要 |
123456 |
1099-B.Summary.*.TotalRealizedGainOrLoss |
string |
从 1099-B 中提取的获取的总收益或总损失摘要 |
123456 |
1099-B.Summary.*.TotalFederalIncomeTaxWithheld |
string |
从 1099-B 中提取的总联邦预扣所得税摘要 |
123456 |
1099-B.Transactions |
array |
1099-B 中报告的事务列表 |
|
1099-B.Transactions.* |
object |
||
1099-B.Transactions.*.CusipNumber |
string |
从 Cusip 中提取的 1099-B 号 |
981276345 |
1099-B.Transactions.*.IsFactaFilingRequired |
boolean |
需要从 1099-B 中提取的 FACTA 归档 |
:selected: |
1099-B.Transactions.*.ApplicableForm8949Checkbox |
string |
从 1099-B 中提取的适用的 8949 表单复选框 |
A |
1099-B.Transactions.*.BasisStatus |
selectionGroup |
值为至少包含以下代码之一的列表:basisReportedToIRS 、basisNotReportedToIRS 、1099BNotReceived 。 |
basisReportedToIRS:unselected: basisNotReportedToIRS:unselected: undetermined:unselected: |
1099-B.Transactions.*.Box1a |
string |
从 1099-B 中提取的框 1a |
100 sh。XYZ Co。 |
1099-B.Transactions.*.Box1b |
date |
从 1099-B 中提取的框 1b |
2022-12-31 |
1099-B.Transactions.*.Box1c |
date |
从 1099-B 中提取的框 1c |
2022-12-31 |
1099-B.Transactions.*.Box1d |
number |
从 1099-B 中提取的框 1d |
123456 |
1099-B.Transactions.*.Box1e |
number |
从 1099-B 中提取的框 1e |
123456 |
1099-B.Transactions.*.Box1f |
number |
从 1099-B 中提取的框 1f |
123456 |
1099-B.Transactions.*.Box1g |
number |
从 1099-B 中提取的框 1g |
123456 |
1099-B.Transactions.*.Box2 |
selectionGroup |
值为至少包含以下代码之一的列表:shortTermGainOrLoss 、longTermGainOrLoss 、ordinary 、undertermined 。 |
shortTermGainOrLoss:unselected: longTermGainOrLoss:unselected: ordinary:unselected: |
1099-B.Transactions.*.Box3 |
selectionGroup |
值是至少包含以下代码之一的列表:collectible 、qof 。 |
collectible:unselected: qof :unselected: |
1099-B.Transactions.*.Box4 |
number |
从 1099-B 中提取的框 4 |
123456 |
1099-B.Transactions.*.Box5 |
boolean |
从 1099-B 中提取的框 5 |
:selected: |
1099-B.Transactions.*.Box6 |
selectionGroup |
值是至少包含以下代码之一的列表:grossProceeds 、netProceeds 。 |
grossProceeds:unselected: netProceeds:unselected: |
1099-B.Transactions.*.Box7 |
boolean |
从 1099-B 中提取的框 7 |
:selected: |
1099-B.Transactions.*.Box8 |
number |
从 1099-B 中提取的框 8 |
123456 |
1099-B.Transactions.*.Box9 |
number |
从 1099-B 中提取的框 9 |
123456 |
1099-B.Transactions.*.Box10 |
number |
从 1099-B 中提取的框 10 |
123456 |
1099-B.Transactions.*.Box11 |
number |
从 1099-B 中提取的框 11 |
123456 |
1099-B.Transactions.*.Box12 |
boolean |
从 1099-B 中提取的框 12 |
:selected: |
1099-B.Transactions.*.Box13 |
number |
从 1099-B 中提取的框 13 |
123456 |
1099-B.Transactions.*.StateTaxesWithheld |
array |
从 1099-B 中提取的州预扣税 |
|
1099-B.Transactions.*.StateTaxesWithheld.* |
object |
||
1099-B.Transactions.*.StateTaxesWithheld.*.Box14 |
string |
从 1099-B 中提取的框 14 |
华盛顿州 |
1099-B.Transactions.*.StateTaxesWithheld.*.Box15 |
string |
从 1099-B 中提取的框 15 |
12-3456789 |
1099-B.Transactions.*.StateTaxesWithheld.*.Box16 |
number |
从 1099-B 中提取的框 16 |
123456 |
1099-DIV |
object |
||
1099-DIV.Box1a |
number |
从 1099-DIV 中提取的框 1a。 | 123456 |
1099-DIV.Box1b |
number |
从 1099-DIV 中提取的框 1b。 | 123456 |
1099-DIV.Box2a |
number |
从 1099-DIV 中提取的框 2a。 | 123456 |
1099-DIV.Box2b |
number |
从 1099-DIV 中提取的框 2b。 | 123456 |
1099-DIV.Box2c |
number |
从 1099-DIV 中提取的框 2c。 | 123456 |
1099-DIV.Box2d |
number |
从 1099-DIV 中提取的框 2d。 | 123456 |
1099-DIV.Box2e |
number |
从 1099-DIV 中提取的框 2e。 | 123456 |
1099-DIV.Box2f |
number |
从 1099-DIV 中提取的框 2f。 | 123456 |
1099-DIV.Box3 |
number |
从 1099-DIV 中提取的框 3。 | 123456 |
1099-DIV.Box4 |
number |
从 1099-DIV 中提取的框 4。 | 123456 |
1099-DIV.Box5 |
number |
从 1099-DIV 中提取的框 5。 | 123456 |
1099-DIV.Box6 |
number |
从 1099-DIV 中提取的框 6。 | 123456 |
1099-DIV.Box7 |
number |
从 1099-DIV 中提取的框 7。 | 123456 |
1099-DIV.Box8 |
string |
从 1099-DIV 中提取的框 8。 | Foreign |
1099-DIV.Box9 |
number |
从 1099-DIV 中提取的框 9。 | 123456 |
1099-DIV.Box10 |
number |
从 1099-DIV 中提取的框 10。 | 123456 |
1099-DIV.Box11 |
boolean |
从 1099-DIV 中提取的框 11。 | :selected: |
1099-DIV.Box12 |
number |
从 1099-DIV 中提取的框 12。 | 123456 |
1099-DIV.Box13 |
number |
从 1099-DIV 中提取的框 13。 | 123456 |
1099-DIV.StateTaxesWithheld |
array |
从 1099-DIV 提取的州预扣税 | |
1099-DIV.StateTaxesWithheld.* |
object |
||
1099-DIV.StateTaxesWithheld.*.Box14 |
string |
从 1099-DIV 中提取的框 14。 | 华盛顿州 |
1099-DIV.StateTaxesWithheld.*.Box15 |
string |
从 1099-DIV 中提取的框 15。 | 12-3456789 |
1099-DIV.StateTaxesWithheld.*.Box16 |
number |
从 1099-DIV 中提取的框 16。 | 123456 |
1099-INT |
object |
||
1099-INT.IsFactaFilingRequired |
boolean |
需要从 1099-INT 中提取的 FACTA 归档 | :selected: |
1099-INT.Box1 |
number |
从 1099-INT 中提取的框 1。 | 123456 |
1099-INT.Box2 |
number |
从 1099-INT 中提取的框 2。 | 123456 |
1099-INT.Box3 |
number |
从 1099-INT 中提取的框 3。 | 123456 |
1099-INT.Box4 |
number |
从 1099-INT 中提取的框 4。 | 123456 |
1099-INT.Box5 |
number |
从 1099-INT 中提取的框 5。 | 123456 |
1099-INT.Box6 |
number |
从 1099-INT 中提取的框 6。 | 123456 |
1099-INT.Box7 |
string |
从 1099-INT 中提取的框 7。 | Foreign |
1099-INT.Box8 |
number |
从 1099-INT 中提取的框 8。 | 123456 |
1099-INT.Box9 |
number |
从 1099-INT 中提取的框 9。 | 123456 |
1099-INT.Box10 |
number |
从 1099-INT 中提取的框 10。 | 123456 |
1099-INT.Box11 |
number |
从 1099-INT 中提取的框 11。 | 123456 |
1099-INT.Box12 |
number |
从 1099-INT 中提取的框 12。 | 123456 |
1099-INT.Box13 |
number |
从 1099-INT 中提取的框 13。 | 123456 |
1099-INT.Box14 |
string |
从 1099-INT 中提取的框 14。 | 123456789 |
1099-INT.StateTaxesWithheld |
array |
从 1099-INT 提取的州预扣税 | |
1099-INT.StateTaxesWithheld.* |
object |
||
1099-INT.StateTaxesWithheld.*.Box15 |
string |
从 1099-INT 中提取的框 15。 | 华盛顿州 |
1099-INT.StateTaxesWithheld.*.Box16 |
string |
从 1099-INT 中提取的框 16。 | 12-3456789 |
1099-INT.StateTaxesWithheld.*.Box17 |
number |
从 1099-INT 中提取的框 17。 | 123456 |
1040 税务表单的字段提取
下面是从 JSON 输出响应中的 1040 税务表单中提取的字段。 还支持 1040 的其他变体。
字段 | 类型 | 说明 | 示例 |
---|---|---|---|
TaxYear |
string |
从 1040 表单中提取的税务年份。 | 2022 |
Taxpayer |
object |
一个对象,其中包含纳税人的信息,如 SSN、姓氏和地址 | |
Taxpayer.SSN |
string |
纳税人税务社会安全号码。 | 123-45-6789 |
Taxpayer.LastName |
string |
表单上写的纳税人的姓氏。 | Smith |
Taxpayer.FirstNameAndInitials |
string |
表单上写的纳税人的名字和中间名首字母缩写。 | John T |
Taxpayer.Address |
address |
纳税人地址。 | 123 Main Street, Seattle Washington 98122 |
Taxpayer.ForeignCountryName |
string |
纳税人的外国国家/地区名称。 | 德国 |
Taxpayer.ForeignProvinceStateOrCounty |
string |
纳税人外国省/州或县名称。 | 汉堡 |
Taxpayer.ForeignPostalCode |
string |
纳税人外国邮政编码。 | 20095 |
Spouse |
object |
一个对象,其中包含配偶的信息,如 SSN、姓氏、名字和首字母缩写 | |
Spouse.SSN |
string |
配偶税务社会安全号码。 | 123-45-6789 |
Spouse.LastName |
string |
表单上写的配偶的姓氏。 | Smith |
Spouse.FirstNameAndInitials |
string |
表单上写的配偶的名字和中间名首字母缩写。 | John T |
Dependents |
array |
从表单 1040 中提取的被扶养人 | |
Dependents.* |
object |
一个数组,其中包含被扶养人列表,包括姓名、SSN 和信用类型等信息 | |
Dependents.*.Name |
string |
表单上写的被扶养人全名。 | John Smith |
Dependents.*.SSN |
string |
被扶养人税务社会安全号码。 | 123-45-6789 |
Dependents.*.RelationshipToFiler |
string |
表单上写的被扶养人全名。 | John Smith |
Dependents.*.CreditType |
selectionGroup |
值是至少包含以下代码之一的列表:childTaxCredit 、creditForOtherDependents 。 |
childTaxCredit: selected creditForOtherDependents:unselected: |
ThirdPartyDesignee |
object |
一个对象,其中包含第三方受托人的相关信息 | |
ThirdPartyDesignee.PhoneNumber |
phoneNumber |
第三方受托人电话号码。 | 1-123-456-7890 |
ThirdPartyDesignee.Name |
string |
表单上写的第三方受托人名称。 | John Smith |
ThirdPartyDesignee.PersonalIdentificationNumber |
string |
第三方受托人 PIN。 | 123456 |
SignatureDetails |
object |
一个对象,其中包含有关签字人的信息,如电话号码和电子邮件 | |
SignatureDetails.TaxpayerOccupation |
string |
纳税人职业。 | 软件 |
SignatureDetails.TaxpayerPIN |
string |
纳税人 PIN。 | 123456 |
SignatureDetails.TaxpayerPhoneNumber |
phoneNumber |
纳税人电话号码。 | 1-123-456-7890 |
SignatureDetails.TaxpayerEmail |
string |
纳税人电子邮件。 | johnsmith@contoso.com |
SignatureDetails.SpouseOccupation |
string |
配偶职业。 | 软件 |
SignatureDetails.SpousePIN |
string |
配偶 PIN。 | 123456 |
PaidPreparer |
object |
包含填表人相关信息的对象。 | |
PaidPreparer.PreparerName |
date |
准备人姓名。 | John Smith |
PaidPreparer.PreparerPTIN |
string |
准备人 PIN。 | 123456 |
PaidPreparer.IsPreparerSelfEmployed |
boolean |
准备人是否自雇 | :selected: |
PaidPreparer.PreparerFirmName |
string |
纳税人公司名称。 | Contoso |
PaidPreparer.PreparerFirmPhoneNumber |
phoneNumber |
准备人公司电话号码 | 1-123-456-7890 |
PaidPreparer.PreparerFirmAddress |
address |
准备人公司地址。 | 123 First street, Seattle Washington 98001 |
PaidPreparer.PreparerFirmEIN |
string |
准备人公司 EIN。 | 98-7654321 |
FilingStatus |
selectionGroup |
值是至少包含以下代码之一的列表:single 、marriedFilingJointly 、marriedFillingSeparately 、headOfHousehold 、qualifyingSurvivingSpouse 。 |
single:unselected: marriedFilingJointly:unselected: marriedFillingSeparately:unselected: headOfHousehold:unselected: qualifyingSurvivingSpouse:unselected: |
NameOfSpouseOrQualifyingPerson |
string |
从表单 1040 中提取的配偶或合格个人的姓名。 | Pascale Weyderth |
PresidentialElectionCampaign |
selectionGroup |
值是至少包含以下代码之一的列表:taxpayer 、spouse 。 |
taxpayer:unselected: spouse:unselected: |
DigitalAssets |
selectionGroup |
值是至少包含以下代码之一的列表:yes 、no 。 |
yes:unselected: no:unselected: |
ClaimStatus |
selectionGroup |
值为至少包含以下代码之一的列表:taxpayerAsDependent 、spouseAsDependent 、spouseItemizesSeparatelyOrDualStatusAlien 。 |
taxpayerAsDependent:unselected: spouseAsDependent:unselected: spouseItemizesSeparatelyOrDualStatusAlien:unselected: |
TaxpayerAgeBlindeness |
selectionGroup |
值是至少包含以下代码之一的列表:above64 、blind 。 |
above64:unselected: blind:unselected: |
SpouseAgeBlindeness |
selectionGroup |
值是至少包含以下代码之一的列表:above64 、blind 。 |
above64:unselected: blind:unselected: |
MoreThanFourDependents |
boolean |
从表单 1040 中提取的 4 名以上的被扶养人。 | :selected: |
Box1a |
number |
从 1040 表单中提取的框 1a 。 |
123456 |
Box1b |
number |
从 1040 表单中提取的框 1b 。 |
123456 |
Box1c |
number |
从 1040 表单中提取的框 1c 。 |
123456 |
Box1d |
number |
从 1040 表单中提取的框 1d 。 |
123456 |
Box1e |
number |
从 1040 表单中提取的框 1e 。 |
123456 |
Box1f |
number |
从 1040 表单中提取的框 1f 。 |
123456 |
Box1g |
number |
从 1040 表单中提取的框 1g 。 |
123456 |
Box1h |
number |
从 1040 表单中提取的框 1h 。 |
123456 |
Box1i |
number |
从 1040 表单中提取的框 1i。 | 123456 |
Box1z |
number |
从 1040 表单中提取的框 1z。 | 123456 |
Box2a |
number |
从 1040 表单中提取的框 2a。 | 123456 |
Box2b |
number |
从 1040 表单中提取的框 2b。 | 123456 |
Box3a |
number |
从 1040 表单中提取的框 3a。 | 123456 |
Box3b |
number |
从 1040 表单中提取的框 3b。 | 123456 |
Box4a |
number |
从 1040 表单中提取的框 4a。 | 123456 |
Box4b |
number |
从 1040 表单中提取的框 4b。 | 123456 |
Box5a |
number |
从 1040 表单中提取的框 5a。 | 123456 |
Box5b |
number |
从 1040 表单中提取的框 5b。 | 123456 |
Box6a |
number |
从 1040 表单中提取的框 6a。 | 123456 |
Box6b |
number |
从 1040 表单中提取的框 6b。 | 123456 |
Box6cCheckbox |
boolean |
从 1040 表单中提取的框 6c 复选框。 | :selected: |
Box7Checkbox |
boolean |
从 1040 表单中提取的框 7 复选框。 | :selected: |
Box7 |
number |
从 1040 表单中提取的框 7。 | 123456 |
Box8 |
number |
从 1040 表单中提取的框 8。 | 123456 |
Box9 |
number |
从 1040 表单中提取的框 9。 | 123456 |
Box10 |
number |
从 1040 表单中提取的框 10。 | 123456 |
Box11 |
number |
从 1040 表单中提取的框 11。 | 123456 |
Box12 |
number |
从 1040 表单中提取的框 12。 | 123456 |
Box13 |
number |
从 1040 表单中提取的框 13。 | 123456 |
Box14 |
number |
从 1040 表单中提取的框 14。 | 123456 |
Box15 |
number |
从 1040 表单中提取的框 15。 | 123456 |
Box16FromForm |
selectionGroup |
值为至少包含以下代码之一的列表:8814 、4972 、other 。 |
8814:unselected: 4972:unselected: other:unselected: |
Box16OtherFormNumber |
string |
从 1040 表单中提取的框 16 其他表单编号。 | 8888 |
Box16 |
number |
从 1040 表单中提取的框 16。 | 123456 |
Box17 |
number |
从 1040 表单中提取的框 17。 | 123456 |
Box18 |
number |
从 1040 表单中提取的框 18。 | 123456 |
Box19 |
number |
从 1040 表单中提取的框 19。 | 123456 |
Box20 |
number |
从 1040 表单中提取的框 20。 | 123456 |
Box21 |
number |
从 1040 表单中提取的框 21。 | 123456 |
Box22 |
number |
从 1040 表单中提取的框 22。 | 123456 |
Box23 |
number |
从 1040 表单中提取的框 23。 | 123456 |
Box24 |
number |
从 1040 表单中提取的框 24。 | 123456 |
Box25a |
number |
从 1040 表单中提取的框 25a。 | 123456 |
Box25b |
number |
从 1040 表单中提取的框 25b。 | 123456 |
Box25c |
number |
从 1040 表单中提取的框 25c。 | 123456 |
Box25d |
number |
从 1040 表单中提取的框 25d。 | 123456 |
Box26 |
number |
从 1040 表单中提取的框 26。 | 123456 |
Box27 |
number |
从 1040 表单中提取的框 27。 | 123456 |
Box28 |
number |
从 1040 表单中提取的框 28。 | 123456 |
Box29 |
number |
从 1040 表单中提取的框 29。 | 123456 |
Box31 |
number |
从 1040 表单中提取的框 31。 | 123456 |
Box32 |
number |
从 1040 表单中提取的框 32。 | 123456 |
Box33 |
number |
从 1040 表单中提取的框 33。 | 123456 |
Box34 |
number |
从 1040 表单中提取的框 34。 | 123456 |
Box35Checkbox |
boolean |
从 1040 表单中提取的框 35 复选框。 | :selected: |
Box35a |
number |
从 1040 表单中提取的框 35a。 | 123456 |
Box35b |
number |
从 1040 表单中提取的框 35b。 | 123456 |
Box35c |
selectionGroup |
值是至少包含以下代码之一的列表:checking 、saving 。 |
checking:unselected: saving:unselected: |
Box35d |
number |
从 1040 表单中提取的框 35d。 | 123456 |
Box36 |
number |
从 1040 表单中提取的框 36。 | 123456 |
Box37 |
number |
从 1040 表单中提取的框 37。 | 123456 |
Box38 |
number |
从 1040 表单中提取的框 38。 | 123456 |
HasAssignedThirdPartyDesignee |
selectionGroup |
值是至少包含以下代码之一的列表:yes 、no 。 |
yes:unselected: no:unselected: |
提取的税务文档键值对和行项位于 JSON 输出的 documentResults
部分。
后续步骤
尝试使用 Document Intelligence Studio 来处理你自己的表单和文档。
完成文档智能快速入门,并使用你选择的开发语言开始创建文档处理应用。