语言支持:自定义模型
此内容适用于: v2.1
Azure AI 文档智能模型提供多语言文档处理支持。 我们的语言支持功能使用户能够以自然的方式与应用程序进行通信,并触达全球用户。 使用标记的数据集训练自定义模型,以便从特定于用例的结构化、半结构化和非结构化文档中提取不同的数据。 可以组合独立的自定义模型来创建组合模型。 下表列出了模型和功能的可用语言和区域设置支持:
自定义分类器
语言 - 区域设置代码 |
默认 |
英语(美国)—en-US |
英语(美国)—en-US |
自定义模板
下表列出了印刷体文本支持的语言。
语言 |
代码(可选) |
阿巴扎语 |
abq |
阿布哈兹语 |
ab |
亚齐语 |
ace |
阿柯利语 |
ach |
阿当梅语 |
ada |
阿迪格语 |
ady |
阿法尔语 |
aa |
南非荷兰语 |
af |
阿肯语 |
ak |
阿尔巴尼亚语 |
sq |
阿尔贡金语 |
alq |
昂加语(天城文) |
anp |
阿拉伯语 |
ar |
阿斯图里亚斯语 |
ast |
阿苏语(坦桑尼亚) |
asa |
阿瓦尔语 |
av |
阿瓦德语-印地语(天城文) |
awa |
艾马拉语 |
ay |
阿塞拜疆语(拉丁语) |
az |
巴菲亚语 |
ksf |
巴格里语 |
bfy |
班巴拉语 |
bm |
巴什基尔语 |
ba |
巴斯克语 |
eu |
白俄罗斯语(西里尔语) |
be、be-cyrl |
白俄罗斯语(拉丁语) |
be、be-latn |
别姆巴语(赞比亚) |
bem |
贝纳语(坦桑尼亚) |
bez |
博杰普尔语-印地语(天城文) |
bho |
比考尔语 |
bik |
比尼语 |
bin |
比斯拉马语 |
bi |
博多语(天城文) |
brx |
波斯尼亚语(拉丁语系) |
bs |
布拉伊巴语 |
bra |
布列塔尼语 |
br |
保加利亚语 |
bg |
本德利语 |
bns |
布里亚特语(西里尔语) |
bua |
加泰罗尼亚语 |
ca |
宿雾语 |
ceb |
查姆林语 |
rab |
查莫罗语 |
ch |
车臣语 |
ce |
恰蒂斯加尔希语(天城文) |
hne |
奇加语 |
cgg |
简体中文 |
zh-Hans |
中文(繁体) |
zh-Hant |
乔克托语 |
cho |
楚科奇语 |
ckt |
楚瓦什语 |
cv |
康沃尔语 |
kw |
柯西嘉语 |
co |
克里语 |
cr |
克里克语 |
mus |
克里米亚鞑靼语(拉丁语) |
crh |
克罗地亚语 |
人力资源 |
克罗语 |
cro |
捷克语 |
cs |
丹麦语 |
da |
尔格瓦语 |
dar |
达里语 |
prs |
迪马尔语(天城文) |
dhi |
多格拉语(天城文) |
doi |
都阿拉语 |
dua |
东干语 |
dng |
荷兰语 |
nl |
埃菲克语 |
efi |
英语 |
en |
厄尔兹亚语(西里尔语) |
myv |
爱沙尼亚语 |
et |
法罗语 |
fo |
斐济语 |
fj |
菲律宾语 |
fil |
芬兰语 |
fi |
语言 |
代码(可选) |
丰族语 |
fon |
法语 |
fr |
弗留利语 |
fur |
加蓬语 |
gaa |
嘎嘎乌孜语(拉丁语) |
gag |
加利西亚语 |
gl |
干达语 |
lg |
迦约语 |
gay |
德语 |
de |
吉尔伯特斯语 |
gil |
贡迪语(天城文) |
gon |
希腊语 |
el |
格陵兰语 |
kl |
瓜拉尼语 |
gn |
古隆语(天城文) |
gvr |
古斯族语 |
guz |
海地克里奥尔语 |
ht |
哈尔比语(天城文) |
hlb |
哈尼语 |
hni |
哈里亚维 |
bgc |
夏威夷语 |
haw |
希伯来语 |
he |
赫雷罗语 |
hz |
希利盖农语 |
hil |
印地语 |
hi |
白苗语(拉丁语) |
mww |
霍语(天城文) |
hoc |
匈牙利语 |
hu |
伊班语 |
iba |
冰岛语 |
是 |
伊博语 |
ig |
伊洛干诺语 |
ilo |
伊纳里萨米语 |
smn |
印度尼西亚语 |
id |
印古什语 |
inh |
国际语 |
ia |
因纽特语(拉丁语) |
iu |
爱尔兰语 |
ga |
意大利语 |
it |
日语 |
ja |
贾恩萨里语(天城文) |
Jns |
爪哇文 |
jv |
朱拉语 |
dyo |
卡巴尔德语 |
kbd |
卡布佛得鲁语 |
kea |
克钦语(拉丁语) |
kac |
卡伦津人语 |
kln |
卡尔梅克语 |
xal |
康格里语(天城文) |
xnr |
卡努里语 |
kr |
卡巴尔达语 |
krc |
卡拉卡巴克语(西里尔语) |
kaa-cyrl |
卡拉卡巴克语(拉丁语) |
kaa |
卡舒比语 |
csb |
哈萨克语(西里尔语) |
kk-cyrl |
哈萨克语(拉丁语) |
kk-latn |
哈卡斯语 |
kjh |
哈林语 |
klr |
卡西语 |
kha |
基切语 |
quc |
吉库尤语 |
ki |
基尔丁萨米语 |
sjd |
卢旺达语 |
rw |
科米语 |
kv |
刚果语 |
千克 |
朝鲜语 |
ko |
科尔库语 |
kfq |
科里亚克语 |
kpy |
科斯拉伊语 |
kos |
格贝列文语 |
kpe |
宽亚玛语 |
kj |
库梅克语(西里尔语) |
kum |
库尔德语(阿拉伯语) |
ku-arab |
库尔德语(拉丁语) |
ku-latn |
库鲁克语(天城文) |
kru |
吉尔吉斯语(西里尔语) |
ky |
腊克语 |
lbe |
拉科塔语 |
lkt |
语言 |
代码(可选) |
拉丁语 |
la |
拉脱维亚语 |
lv |
列兹金语 |
lex |
林加拉语 |
ln |
立陶宛语 |
lt |
下索布语 |
dsb |
洛奇语 |
loz |
律勒萨米语 |
smj |
卢奥语(肯尼亚和坦桑尼亚) |
luo |
卢森堡语 |
lb |
卢雅语 |
luy |
马其顿语 |
mk |
马切姆语 |
jmc |
马都拉语 |
mad |
玛哈苏帕哈里(天城文) |
bfz |
马库阿语 |
mgh |
马孔德语 |
kde |
马达加斯加语 |
mg |
马来语(拉丁语系) |
毫秒 |
马耳他语 |
mt |
马尔托语(天城文) |
kmj |
曼丁哥语 |
mnk |
马恩岛语 |
gv |
毛利语 |
mi |
马普切语 |
arn |
马拉地语 |
mr |
马里语(俄罗斯) |
chm |
马赛语 |
mas |
曼德语(塞拉利昂) |
men |
梅鲁语 |
mer |
梅塔语 |
mgo |
米南卡保语 |
min |
摩霍克语 |
moh |
蒙古语(西里尔文) |
mn |
蒙贡多语 |
mog |
蒙特内哥罗语(西里尔语) |
cnr-cyrl |
蒙特内哥罗语(拉丁语) |
cnr-latn |
模里西斯语 |
mfe |
蒙当语 |
mua |
纳瓦特尔语 |
nah |
Navajo |
nv |
恩东加语 |
ng |
那不勒斯语 |
nap |
尼泊尔语 |
ne |
恩贡巴语 |
jgo |
纽埃语 |
niu |
诺盖语 |
nog |
北恩德贝勒语 |
nd |
北萨米语(拉丁语) |
sme |
挪威语 |
否 |
尼昂加语 |
ny |
尼昂科勒语 |
nyn |
恩济马语 |
nzi |
奥克西唐语 |
oc |
奥吉布瓦语 |
oj |
奥罗莫语 |
om |
奥塞丁语 |
os |
邦板牙语 |
pam |
邦阿西南语 |
pag |
帕皮阿门托语 |
pap |
普什图语 |
ps |
佩迪语 |
nso |
波斯语 |
fa |
波兰语 |
pl |
葡萄牙语 |
pt |
旁遮普语(阿拉伯语) |
pa |
盖丘亚语 |
qu |
利普里安语 |
ksh |
罗马尼亚语 |
ro |
罗曼什语 |
rm |
隆迪语 |
rn |
俄语 |
ru |
罗瓦语 |
rwk |
萨德里语(天城文) |
sck |
萨哈语 |
sah |
桑布鲁语 |
saq |
萨摩亚语(拉丁语) |
sm |
桑戈语 |
sg |
语言 |
代码(可选) |
桑古语(加蓬) |
snq |
梵语(天城文) |
sa |
桑塔利语(天城文) |
周六 |
苏格兰语 |
sco |
苏格兰盖尔语 |
gd |
塞纳语 |
seh |
塞尔维亚语(西里尔) |
sr-cyrl |
塞尔维亚语(拉丁) |
sr、sr-latn |
香巴拉语 |
ksb |
绍纳语 |
sn |
西克西卡语 |
bla |
西尔毛里语(天城文) |
srx |
斯科特萨米语 |
sms |
斯洛伐克语 |
sk |
斯洛文尼亚语 |
sl |
索加语 |
xog |
索马里语(阿拉伯语) |
so |
索马里语(拉丁语) |
so-latn |
桑海语 |
son |
南恩德贝勒语 |
nr |
南阿尔泰语 |
alt |
南萨米语 |
sma |
南索托语 |
st |
西班牙语 |
es |
巽他语 |
su |
斯瓦希里语(拉丁语) |
sw |
斯瓦蒂语 |
ss |
瑞典语 |
sv |
塔巴萨兰语 |
选项卡 |
希尔哈语 |
shi |
塔希提语 |
ty |
台塔语 |
dav |
塔吉克语(西里尔文) |
tg |
泰米尔语 |
ta |
鞑靼语(西里尔文) |
tt-cyrl |
鞑靼语(拉丁语) |
tt |
特索语 |
teo |
德顿语 |
tet |
泰语 |
th |
汤米语 |
thf |
巴布亚皮钦语 |
tpi |
汤加语 |
to |
汤加语 |
ts |
茨瓦纳语 |
tn |
土耳其语 |
tr |
土库曼语(拉丁语) |
tk |
图瓦语 |
tyv |
乌德穆尔特语 |
udm |
维吾尔语(西里尔语) |
ug-cyrl |
乌克兰语 |
uk |
上索布语 |
hsb |
乌尔都语 |
ur |
维吾尔语(阿拉伯语) |
ug |
乌兹别克语(阿拉伯语) |
uz-arab |
乌兹别克语(西里尔文) |
uz-cyrl |
乌兹别克语(拉丁文) |
uz |
越南语 |
vi |
沃拉普克语 |
vo |
温旧语 |
vun |
瓦尔瑟语 |
wae |
威尔士语 |
cy |
西弗里西亚语 |
fy |
沃洛夫语 |
wo |
班图语 |
xh |
尤卡坦玛雅语 |
yua |
萨巴特克语 |
zap |
哲尔马语 |
dje |
壮语 |
za |
祖鲁语 |
zu |
下表列出了提取手写文本的受支持语言。
语言 |
语言代码(可选) |
语言 |
语言代码(可选) |
英语 |
en |
日语 |
ja |
简体中文 |
zh-Hans |
韩语 |
ko |
法语 |
fr |
葡萄牙语 |
pt |
德语 |
de |
西班牙语 |
es |
意大利语 |
it |
|
|