应该选择哪个模型?
此内容适用于: v3.1 (GA) | 先前的版本: v3.0
此内容适用于: v3.0 (GA) | 最新的版本: v3.1
Azure AI 文档智能支持多种模型,因此可以将智能文档处理添加到应用程序,并对工作流进行优化。 选择正确的模型对于确保企业取得成功至关重要。 在本文中,我们将探索可用的文档智能模型,并提供有关如何为项目选择最佳解决方案的指导。
以下决策图表突出显示了每个文档智能 v3.0 支持模型的功能,并帮助你选择最佳模型来满足应用程序的需求和要求。
重要
请务必查看支持的语言页面,了解支持的语言文本和按功能提取的字段。
预训练的文档分析模型
文档类型 | 示例 | 要提取的数据 | 最佳解决方案 |
---|---|---|---|
通用文档. | 合同或信件。 | 你希望提取的主要是书面或打印的文本行、字词、位置和检测到的语言。 | 读取 OCR 模型 |
包含结构信息的文档。 | 报告或研究。 | 除了书面或打印文本,还需要提取结构信息,例如表格、选择标记、段落、标题、标题和副标题。 | 布局分析模型 |
结构化或半结构化文档,其中包含格式化为字段(键)和值的内容。 | 表单或文档,这是企业或行业中常用的标准化格式,例如信用申请或调查。 | 你需要提取字段和值,包括场景特定的预生成模型未涵盖的字段和值, 而无需训练自定义模型。 | **启用了可选查询字符串参数 features=keyValuePairs 的布局分析模型** |
预训练的特定于方案的模型
文档类型 | 要提取的数据 | 最佳解决方案 |
---|---|---|
美国统一税 | 你想要从单个文件中提取 W2、1040、1090、1098 所有税务表单的关键信息,而无需运行任何你自己的自定义分类。 | 美国统一税务模型 |
美国税务 W-2 税款 | 你希望提取关键信息,如薪酬、工资和预扣税款。 | 美国税务 W-2 模型 |
美国税务 1098 | 你想要提取抵押贷款利息详细信息,如本金、积分和税款。 | 美国税务 1098 表 |
美国税务 1098-E | 你想要提取学生贷款利息详细信息,例如贷款人和利息金额。 | 美国税务 1098-E 表 |
美国税务 1098T | 你想要提取符合条件的学费详细信息,例如奖学金调整、学生身份和贷款人信息。 | 美国税务 1098-T 模型 |
美国税务 1099(变体) | 你想要从 1099 表单及其变体(A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB)中提取信息。 |
美国税务 1099 模型 |
美国税务 1040(变体) | 你想要从 1040 表单及其变体中提取信息(单据 1、单据 2、单据 3、单据 8812、单据 A、单据 B、单据 C、单据 D、单据 E、单据 EIC 、单据 F、单据 H、单据 J、单据 R、单据 SE 、单据高级)。 |
美国税务 1040 模型 |
合同(相关方之间的法律协议)。 | 你想要提取合同协议详细信息,例如参与方、日期和间隔。 | 合同模型 |
保险卡或医疗保险 ID。 | 你希望提取关键信息,例如保险公司、会员 ID、处方保险和团体。 | 医疗保险卡模型 |
信用卡/借记卡 | 你想要提取关键信息银行卡,如卡号和银行名称。 | 信用卡/借记卡模型 |
结婚证 | 你想要从结婚证中提取关键信息。 | 结婚证模型 |
发票或计费帐单 | 你希望提取关键信息,例如客户姓名、帐单邮寄地址和到期金额。 | 发票模型 |
收据、代金券或单页酒店收据。 | 你希望提取关键信息,如商家名称、交易日期和交易总额。 | 收据模型 |
身份证件 (ID),例如美国驾照或国际护照 | 你想要提取名字、姓氏、出生日期、地址和签名等关键信息。 | 身份证件 (ID) 模型 |
美国抵押贷款 1003 | 你想要从统一住宅贷款申请表中提取关键信息。 | 1003 表单模型 |
美国抵押贷款 1004 | 你想要从统一住宅评估报告 (URAR) 中提取关键信息。 | 1004 表单模型 |
美国抵押贷款 1005 | 你想要从在职证明表单中提取关键信息 | 1005 表单模型 |
美国抵押贷款 1008 | 你想要从统一认购和传输汇总表中提取关键信息。 | 1008 表单模型 |
美国按揭过户信息披露 | 你想要从按揭过户信息披露表单中提取关键信息。 | 按揭过户信息披露表单模型 |
包含结构化、半结构化和/或非结构化元素的混合型文档 | 你想要提取未由预生成或常规文档模型提取的键值对、选择标记、表、签名字段和选定区域。 | 自定义模型 |
提示
- 如果你仍不确定要使用哪个预先训练的模型,请在启用可选的查询字符串参数
features=keyValuePairs
的情况下尝试“布局模型”。 - 布局模型由“读取 OCR”引擎提供支持,用于检测页面、表、样式、文本、行、字词、位置和语言。
自定义提取模型
训练集 | 示例文档 | 最佳解决方案 |
---|---|---|
具有静态布局的结构化、一致的文档。 | 结构化表单,例如问卷或申请。 | 自定义模板模型 |
几个模型的集合,每个模型都在相似类型的文档上进行训练。 | ● 日用品采购订单 ● 设备采购订单 ● 家具采购订单 全部组合成一个模型。 |
组合自定义模型 |
自定义分类模型
训练集 | 示例文档 | 最佳解决方案 |
---|---|---|
至少两种类型的文档。 | 窗体、字母或文档 | 自定义分类模型 |