语言支持:自定义模型

此内容适用于:选中标记v3.1 (GA) | 先前版本:蓝色复选标记v3.0蓝色复选标记v2.1

此内容适用于:选中标记v3.0 (GA) | 最新版本:紫色复原标记v3.1 | 以前的版本:蓝色复选标记v2.1

此内容适用于:选中标记v2.1

Azure AI 文档智能模型提供多语言文档处理支持。 我们的语言支持功能使用户能够以自然的方式与应用程序进行通信,并触达全球用户。 使用标记的数据集训练自定义模型,以便从特定于用例的结构化、半结构化和非结构化文档中提取不同的数据。 可以组合独立的自定义模型来创建组合模型。 下表列出了模型和功能的可用语言和区域设置支持:

自定义分类器

语言 - 区域设置代码 默认
英语(美国)—en-US 英语(美国)—en-US

自定义模板

下表列出了印刷体文本支持的语言。

语言 代码(可选)
阿巴扎语 abq
阿布哈兹语 ab
亚齐语 ace
阿柯利语 ach
阿当梅语 ada
阿迪格语 ady
阿法尔语 aa
南非荷兰语 af
阿肯语 ak
阿尔巴尼亚语 sq
阿尔贡金语 alq
昂加语(天城文) anp
阿拉伯语 ar
阿斯图里亚斯语 ast
阿苏语(坦桑尼亚) asa
阿瓦尔语 av
阿瓦德语-印地语(天城文) awa
艾马拉语 ay
阿塞拜疆语(拉丁语) az
巴菲亚语 ksf
巴格里语 bfy
班巴拉语 bm
巴什基尔语 ba
巴斯克语 eu
白俄罗斯语(西里尔语) be、be-cyrl
白俄罗斯语(拉丁语) be、be-latn
别姆巴语(赞比亚) bem
贝纳语(坦桑尼亚) bez
博杰普尔语-印地语(天城文) bho
比考尔语 bik
比尼语 bin
比斯拉马语 bi
博多语(天城文) brx
波斯尼亚语(拉丁语系) bs
布拉伊巴语 bra
布列塔尼语 br
保加利亚语 bg
本德利语 bns
布里亚特语(西里尔语) bua
加泰罗尼亚语 ca
宿雾语 ceb
查姆林语 rab
查莫罗语 ch
车臣语 ce
恰蒂斯加尔希语(天城文) hne
奇加语 cgg
简体中文 zh-Hans
中文(繁体) zh-Hant
乔克托语 cho
楚科奇语 ckt
楚瓦什语 cv
康沃尔语 kw
柯西嘉语 co
克里语 cr
克里克语 mus
克里米亚鞑靼语(拉丁语) crh
克罗地亚语 人力资源
克罗语 cro
捷克语 cs
丹麦语 da
尔格瓦语 dar
达里语 prs
迪马尔语(天城文) dhi
多格拉语(天城文) doi
都阿拉语 dua
东干语 dng
荷兰语 nl
埃菲克语 efi
英语 en
厄尔兹亚语(西里尔语) myv
爱沙尼亚语 et
法罗语 fo
斐济语 fj
菲律宾语 fil
芬兰语 fi
语言 代码(可选)
丰族语 fon
法语 fr
弗留利语 fur
加蓬语 gaa
嘎嘎乌孜语(拉丁语) gag
加利西亚语 gl
干达语 lg
迦约语 gay
德语 de
吉尔伯特斯语 gil
贡迪语(天城文) gon
希腊语 el
格陵兰语 kl
瓜拉尼语 gn
古隆语(天城文) gvr
古斯族语 guz
海地克里奥尔语 ht
哈尔比语(天城文) hlb
哈尼语 hni
哈里亚维 bgc
夏威夷语 haw
希伯来语 he
赫雷罗语 hz
希利盖农语 hil
印地语 hi
白苗语(拉丁语) mww
霍语(天城文) hoc
匈牙利语 hu
伊班语 iba
冰岛语
伊博语 ig
伊洛干诺语 ilo
伊纳里萨米语 smn
印度尼西亚语 id
印古什语 inh
国际语 ia
因纽特语(拉丁语) iu
爱尔兰语 ga
意大利语 it
日语 ja
贾恩萨里语(天城文) Jns
爪哇文 jv
朱拉语 dyo
卡巴尔德语 kbd
卡布佛得鲁语 kea
克钦语(拉丁语) kac
卡伦津人语 kln
卡尔梅克语 xal
康格里语(天城文) xnr
卡努里语 kr
卡巴尔达语 krc
卡拉卡巴克语(西里尔语) kaa-cyrl
卡拉卡巴克语(拉丁语) kaa
卡舒比语 csb
哈萨克语(西里尔语) kk-cyrl
哈萨克语(拉丁语) kk-latn
哈卡斯语 kjh
哈林语 klr
卡西语 kha
基切语 quc
吉库尤语 ki
基尔丁萨米语 sjd
卢旺达语 rw
科米语 kv
刚果语 千克
朝鲜语 ko
科尔库语 kfq
科里亚克语 kpy
科斯拉伊语 kos
格贝列文语 kpe
宽亚玛语 kj
库梅克语(西里尔语) kum
库尔德语(阿拉伯语) ku-arab
库尔德语(拉丁语) ku-latn
库鲁克语(天城文) kru
吉尔吉斯语(西里尔语) ky
腊克语 lbe
拉科塔语 lkt
语言 代码(可选)
拉丁语 la
拉脱维亚语 lv
列兹金语 lex
林加拉语 ln
立陶宛语 lt
下索布语 dsb
洛奇语 loz
律勒萨米语 smj
卢奥语(肯尼亚和坦桑尼亚) luo
卢森堡语 lb
卢雅语 luy
马其顿语 mk
马切姆语 jmc
马都拉语 mad
玛哈苏帕哈里(天城文) bfz
马库阿语 mgh
马孔德语 kde
马达加斯加语 mg
马来语(拉丁语系) 毫秒
马耳他语 mt
马尔托语(天城文) kmj
曼丁哥语 mnk
马恩岛语 gv
毛利语 mi
马普切语 arn
马拉地语 mr
马里语(俄罗斯) chm
马赛语 mas
曼德语(塞拉利昂) men
梅鲁语 mer
梅塔语 mgo
米南卡保语 min
摩霍克语 moh
蒙古语(西里尔文) mn
蒙贡多语 mog
蒙特内哥罗语(西里尔语) cnr-cyrl
蒙特内哥罗语(拉丁语) cnr-latn
模里西斯语 mfe
蒙当语 mua
纳瓦特尔语 nah
Navajo nv
恩东加语 ng
那不勒斯语 nap
尼泊尔语 ne
恩贡巴语 jgo
纽埃语 niu
诺盖语 nog
北恩德贝勒语 nd
北萨米语(拉丁语) sme
挪威语
尼昂加语 ny
尼昂科勒语 nyn
恩济马语 nzi
奥克西唐语 oc
奥吉布瓦语 oj
奥罗莫语 om
奥塞丁语 os
邦板牙语 pam
邦阿西南语 pag
帕皮阿门托语 pap
普什图语 ps
佩迪语 nso
波斯语 fa
波兰语 pl
葡萄牙语 pt
旁遮普语(阿拉伯语) pa
盖丘亚语 qu
利普里安语 ksh
罗马尼亚语 ro
罗曼什语 rm
隆迪语 rn
俄语 ru
罗瓦语 rwk
萨德里语(天城文) sck
萨哈语 sah
桑布鲁语 saq
萨摩亚语(拉丁语) sm
桑戈语 sg
语言 代码(可选)
桑古语(加蓬) snq
梵语(天城文) sa
桑塔利语(天城文) 周六
苏格兰语 sco
苏格兰盖尔语 gd
塞纳语 seh
塞尔维亚语(西里尔) sr-cyrl
塞尔维亚语(拉丁) sr、sr-latn
香巴拉语 ksb
绍纳语 sn
西克西卡语 bla
西尔毛里语(天城文) srx
斯科特萨米语 sms
斯洛伐克语 sk
斯洛文尼亚语 sl
索加语 xog
索马里语(阿拉伯语) so
索马里语(拉丁语) so-latn
桑海语 son
南恩德贝勒语 nr
南阿尔泰语 alt
南萨米语 sma
南索托语 st
西班牙语 es
巽他语 su
斯瓦希里语(拉丁语) sw
斯瓦蒂语 ss
瑞典语 sv
塔巴萨兰语 选项卡
希尔哈语 shi
塔希提语 ty
台塔语 dav
塔吉克语(西里尔文) tg
泰米尔语 ta
鞑靼语(西里尔文) tt-cyrl
鞑靼语(拉丁语) tt
特索语 teo
德顿语 tet
泰语 th
汤米语 thf
巴布亚皮钦语 tpi
汤加语 to
汤加语 ts
茨瓦纳语 tn
土耳其语 tr
土库曼语(拉丁语) tk
图瓦语 tyv
乌德穆尔特语 udm
维吾尔语(西里尔语) ug-cyrl
乌克兰语 uk
上索布语 hsb
乌尔都语 ur
维吾尔语(阿拉伯语) ug
乌兹别克语(阿拉伯语) uz-arab
乌兹别克语(西里尔文) uz-cyrl
乌兹别克语(拉丁文) uz
越南语 vi
沃拉普克语 vo
温旧语 vun
瓦尔瑟语 wae
威尔士语 cy
西弗里西亚语 fy
沃洛夫语 wo
班图语 xh
尤卡坦玛雅语 yua
萨巴特克语 zap
哲尔马语 dje
壮语 za
祖鲁语 zu