王斯日古楞,斯琴圖,那順烏日?qǐng)D
(1. 內(nèi)蒙古師范大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,內(nèi)蒙古 呼和浩特 010022;2. 內(nèi)蒙古師范大學(xué) 網(wǎng)絡(luò)中心,內(nèi)蒙古 呼和浩特 010022; 3. 內(nèi)蒙古大學(xué) 蒙古學(xué)學(xué)院, 內(nèi)蒙古 呼和浩特 010021)
關(guān)于漢蒙機(jī)器翻譯,我們?cè)?jīng)做過(guò)基于規(guī)則的研究[1],基于實(shí)例的研究[2]和基于短語(yǔ)的統(tǒng)計(jì)方法研究[3]。漢語(yǔ)和蒙古語(yǔ)的語(yǔ)序有較大的差別,在基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中,我們發(fā)現(xiàn)存在大量的語(yǔ)序錯(cuò)誤。在基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的具體翻譯結(jié)果中,對(duì)于兩種語(yǔ)言中語(yǔ)序相同的句子,翻譯效果較好。例如:
(1) 輸入:這張匯款單,在哪里取款?
輸出:ENE MONGGO G0BIGVLHV HAGVDASV,HAMIG_A J0G0S GARGAJV ABHV BVI ?
(2) 輸入:今天天氣怎么樣?
輸出:ONODOR-UN CAG AGVR-VN BAYIDAL YAMAR BVI ?
可見(jiàn),以上兩個(gè)句子中漢語(yǔ)和蒙古語(yǔ)句子語(yǔ)序基本上一樣,翻譯效果還不錯(cuò)。但是,對(duì)于那些語(yǔ)序不同的句子,翻譯結(jié)果就沒(méi)那么理想了,會(huì)出現(xiàn)大量的語(yǔ)序錯(cuò)誤。例如:
(1) 輸入:我想?yún)⒓右粋€(gè)旅游團(tuán)。
輸出:BI 0R0LCAY_A GEJU B0D0JV NIGEN JIGVLCILAL-VN BOLHOM .
(2) 輸入:我沒(méi)有湯匙。
輸出:UGEI BI NIGE HALBAG_A .
對(duì)于這兩個(gè)譯文,我們是沒(méi)法接受的。其主要原因是譯文語(yǔ)序不符合蒙古語(yǔ)句子的語(yǔ)序。這是由于漢蒙兩種語(yǔ)言的語(yǔ)序差異較大,基于短語(yǔ)的翻譯模型只能解決一些局部語(yǔ)序的調(diào)整。因此,我們考慮使用句法規(guī)則,在漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中進(jìn)行調(diào)序。本文提出了基于蒙古語(yǔ)語(yǔ)序的漢語(yǔ)句子調(diào)序方法,此調(diào)序方法對(duì)基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的NIST和BLUE值都有明顯的提高。
基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯只解決了短距離的局部調(diào)序,為了解決長(zhǎng)距離調(diào)序,研究人員開(kāi)始使用基于句法的調(diào)序方法。隨著統(tǒng)計(jì)機(jī)器翻譯技術(shù)的發(fā)展,基于句法的統(tǒng)計(jì)機(jī)器翻譯已經(jīng)成為近幾年的研究熱點(diǎn)?;诰浞ǖ慕y(tǒng)計(jì)方法將句法信息引入翻譯中,以句法結(jié)構(gòu)作為翻譯單元,建立結(jié)構(gòu)之間的互譯關(guān)系。在基于句法的模型中,結(jié)構(gòu)之間的互譯關(guān)系是通過(guò)翻譯規(guī)則聯(lián)系起來(lái)的,這些規(guī)則可以從平行語(yǔ)料庫(kù)中自動(dòng)獲取,也可以通過(guò)人工進(jìn)行歸納總結(jié)。
文獻(xiàn)[4]和[5]都在源語(yǔ)言預(yù)處理階段使用了語(yǔ)言學(xué)句法分析。文獻(xiàn)[4]中的規(guī)則是對(duì)雙語(yǔ)語(yǔ)料的學(xué)習(xí)后得到的,在英語(yǔ)到法語(yǔ)的機(jī)器翻譯系統(tǒng)實(shí)驗(yàn)中BLEU值提高了10%。文獻(xiàn)[5]中對(duì)于德語(yǔ)到英語(yǔ)的翻譯,根據(jù)語(yǔ)言學(xué)知識(shí)總結(jié)出六種德語(yǔ)子句到英語(yǔ)的調(diào)序規(guī)則。文獻(xiàn)[6]提出了一種將句法分析和基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯的優(yōu)點(diǎn)結(jié)合起來(lái)進(jìn)行調(diào)序的概率方法,對(duì)于給定的句子及其句法樹(shù),通過(guò)樹(shù)操作生成調(diào)序后的n_best作為基于短語(yǔ)統(tǒng)計(jì)解碼器的輸入,此方法在漢語(yǔ)到英語(yǔ)的翻譯實(shí)驗(yàn)中BLEU值提高了1.56%。
我們?cè)诨诙陶Z(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中提出基于蒙古語(yǔ)語(yǔ)序的漢語(yǔ)句子調(diào)序策略。主要方法是對(duì)于輸入的漢語(yǔ)句子先進(jìn)行分詞和詞性標(biāo)注,之后對(duì)句法樹(shù)進(jìn)行分析,根據(jù)調(diào)序規(guī)則對(duì)需要調(diào)序的部分進(jìn)行調(diào)序,使得漢語(yǔ)句子的語(yǔ)序盡量接近蒙古語(yǔ)句子的順序,最后將調(diào)序后的漢語(yǔ)句子送到統(tǒng)計(jì)解碼器進(jìn)行單調(diào)解碼?;玖鞒倘鐖D1所示。
圖1 融入調(diào)序模型的系統(tǒng)流程
在漢蒙機(jī)器翻譯系統(tǒng)中,對(duì)漢語(yǔ)的分析是前提。為了進(jìn)行調(diào)序,首先要對(duì)漢語(yǔ)句子進(jìn)行分詞和句法分析,我們選擇了中國(guó)科學(xué)院計(jì)算技術(shù)研究所的網(wǎng)上資源ICTCLAS和ICTPROP。
ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)是中國(guó)科學(xué)院計(jì)算技術(shù)研究所研制的漢語(yǔ)詞法分析系統(tǒng),作者采用一種基于層疊隱馬模型的漢語(yǔ)詞法分析方法[7],目前已經(jīng)升級(jí)到了ICTCLAS3.0,我們使用了免費(fèi)的ICTCLAS1.0,對(duì)漢語(yǔ)句子進(jìn)行分詞和詞性標(biāo)注。ICTPROP是中國(guó)科學(xué)院計(jì)算技術(shù)研究所開(kāi)發(fā)的一個(gè)概率型的自然語(yǔ)言句法分析器[8]。ICTPROP 的分析算法是綜合了多種優(yōu)化策略的改進(jìn)型chart分析算法, 分析結(jié)果是概率最大的一棵分析樹(shù)。我們使用ICTPROP對(duì)漢語(yǔ)句子進(jìn)行句法分析。
在具體實(shí)驗(yàn)過(guò)程中,漢語(yǔ)句法分析器對(duì)于較長(zhǎng)的漢語(yǔ)句子分析成功率較低。為了提高句法分析器的成功率,我們首先將漢語(yǔ)句子分解成子句,然后對(duì)每個(gè)子句進(jìn)行分析和調(diào)序,最后將調(diào)序后的各個(gè)子句按照順序合并成一個(gè)句子。一般,漢語(yǔ)句子翻譯成蒙古語(yǔ)后,各個(gè)子句的順序是不會(huì)改變的,所以這種做法不會(huì)影響整個(gè)句子的翻譯結(jié)果。我們通過(guò)漢語(yǔ)句子中出現(xiàn)的逗號(hào)(,)、分號(hào)(;)、冒號(hào)(:)、感嘆號(hào)(!),問(wèn)號(hào)(?)和句號(hào)(。)等將漢語(yǔ)句子切分為子句。子句調(diào)序的依據(jù)是漢蒙句子轉(zhuǎn)換規(guī)則,因此我們首先對(duì)漢蒙句子轉(zhuǎn)換規(guī)則進(jìn)行了研究,從中總結(jié)歸納出了具有語(yǔ)序變化的規(guī)則,然后編寫(xiě)了子句調(diào)序模塊。下面詳細(xì)介紹調(diào)序規(guī)則和調(diào)序算法。
我們把漢語(yǔ)句法規(guī)則分為兩部分,一部分是與蒙古語(yǔ)語(yǔ)序相同的,另一部分是與蒙古語(yǔ)語(yǔ)序不同的。我們只考察那些語(yǔ)序不同的規(guī)則,給出相應(yīng)的變換形式。
規(guī)則格式定義為:
其中:X為源語(yǔ)言漢語(yǔ)的短語(yǔ)結(jié)構(gòu)句法規(guī)則,對(duì)應(yīng)漢語(yǔ)的正確語(yǔ)序,我們將其稱(chēng)為分析規(guī)則,即漢語(yǔ)句法分析規(guī)則;Y是漢語(yǔ)規(guī)則中的每個(gè)語(yǔ)法成分對(duì)應(yīng)到蒙古語(yǔ)時(shí)的順序和成分,即調(diào)序部分,我們稱(chēng)其為調(diào)序規(guī)則。Z是限制條件,指出用此規(guī)則調(diào)序時(shí),對(duì)某個(gè)語(yǔ)法成分可設(shè)置單詞限制條件。條件部分是可選的,即可以有,可以沒(méi)有。
分析規(guī)則X的形式為:α->β
其中α為規(guī)則的左部,是一個(gè)漢語(yǔ)短語(yǔ)標(biāo)記(見(jiàn)表1)。β是規(guī)則的右部,由一個(gè)或多個(gè)標(biāo)記組成,標(biāo)記可以是短語(yǔ)標(biāo)記,也可以是詞性標(biāo)記(見(jiàn)表2),各個(gè)標(biāo)記之間以一個(gè)空格分割。
表1 概率句法分析器中的句子、短語(yǔ)標(biāo)記及其對(duì)應(yīng)規(guī)則數(shù)
調(diào)序規(guī)則Y的形式為:A(γ1γ2……),其中A表示規(guī)則中左部漢語(yǔ)短語(yǔ)標(biāo)記對(duì)應(yīng)的蒙古語(yǔ)短語(yǔ)標(biāo)記,每個(gè)γi表示一個(gè)替換項(xiàng)或一個(gè)插入成分。替換項(xiàng)的形式為B/C, 含義是分析規(guī)則中的漢語(yǔ)語(yǔ)法成分C在蒙古語(yǔ)中對(duì)應(yīng)語(yǔ)法成分為B,B是蒙古語(yǔ)的詞類(lèi)或短語(yǔ)標(biāo)記(見(jiàn)表3),C為漢語(yǔ)的詞類(lèi)或短語(yǔ)標(biāo)記。插入成分形式為D,D為蒙古語(yǔ)的詞類(lèi)或短語(yǔ)標(biāo)記,S表示蒙古語(yǔ)的一個(gè)單詞或附加成分,含義是用這個(gè)規(guī)則調(diào)序時(shí),在此位置要插入S。
限制條件Z是單詞限制條件,格式:C=S 或C!=S,用來(lái)指出某個(gè)分析規(guī)則中的語(yǔ)法成分對(duì)應(yīng)的單詞與S中給出的一個(gè)或多個(gè)單詞相等或不等。
表2 漢語(yǔ)詞性標(biāo)記集
表3 蒙古語(yǔ)詞類(lèi)標(biāo)記集
例如:vp->vp np=>VP(NP/np VP/vp)$vp!=是
分析規(guī)則X為:vp->vp np ,表示漢語(yǔ)的vp由一個(gè)vp 后跟一個(gè)np組成。
調(diào)序規(guī)則Y為:VP(NP/np VP/vp),表示漢語(yǔ)的動(dòng)詞短語(yǔ)對(duì)應(yīng)到蒙古語(yǔ)時(shí)也是動(dòng)詞短語(yǔ)VP,此VP由NP后跟VP構(gòu)成,NP對(duì)應(yīng)分析規(guī)則的np, VP對(duì)應(yīng)分析規(guī)則的vp,可見(jiàn)語(yǔ)序是不同的。
限制條件Z:vp!=是,表示使用此規(guī)則調(diào)序時(shí),分析規(guī)則右邊的vp對(duì)應(yīng)的單詞不等于“是”。
漢語(yǔ)短語(yǔ)標(biāo)記使用了漢語(yǔ)概率句法分析器中的短語(yǔ)標(biāo)記集,見(jiàn)表1。漢語(yǔ)詞語(yǔ)用ICTCLAS進(jìn)行詞性標(biāo)注時(shí)選擇了北大標(biāo)記集,即在《現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典詳解》[9]中規(guī)定的漢語(yǔ)詞性標(biāo)記集,見(jiàn)表2,共26個(gè)標(biāo)記。
蒙古語(yǔ)的詞類(lèi)標(biāo)記使用了在2008年11月通過(guò)的《信息處理用蒙古文詞語(yǔ)標(biāo)記集》國(guó)家標(biāo)準(zhǔn)[10]。其中一級(jí)標(biāo)記集規(guī)定了25個(gè)標(biāo)記,見(jiàn)表3。
對(duì)于蒙古語(yǔ)短語(yǔ),在《蒙古語(yǔ)語(yǔ)法信息詞典框架設(shè)計(jì)》[11]中把蒙古語(yǔ)短語(yǔ)分為名詞短語(yǔ)(NP)、形容詞短語(yǔ)(AP)、動(dòng)詞短語(yǔ)(VP)、代詞短語(yǔ)(RP)、數(shù)詞短語(yǔ)(MCP)、數(shù)量詞短語(yǔ)(MP)、方位詞短語(yǔ)(OP)、時(shí)間詞短語(yǔ)(TP)、副詞短語(yǔ)(DP)、后置詞短語(yǔ)(GP)等10 種,同時(shí)根據(jù)實(shí)際需要,我們參考了文獻(xiàn)[12]和[13],將主謂短語(yǔ)(DJ)、語(yǔ)氣詞短語(yǔ)(SP)和情態(tài)詞短語(yǔ)(XP)等都放到蒙古語(yǔ)的短語(yǔ)標(biāo)注集中,共有13個(gè)蒙古語(yǔ)短語(yǔ)標(biāo)記。
確定規(guī)則格式和標(biāo)記集后,我們構(gòu)造了基于蒙古語(yǔ)語(yǔ)序的漢語(yǔ)句子調(diào)序規(guī)則。我們?cè)跐h語(yǔ)分詞、詞性標(biāo)注和句法分析的基礎(chǔ)上,對(duì)如何將一個(gè)漢語(yǔ)句子的短語(yǔ)結(jié)構(gòu)樹(shù)轉(zhuǎn)換成相應(yīng)的蒙古語(yǔ)語(yǔ)法樹(shù)進(jìn)行了研究,進(jìn)一步從中歸納出12條具有語(yǔ)序變化的轉(zhuǎn)換規(guī)則,把這部分規(guī)則我們稱(chēng)之為漢蒙調(diào)序規(guī)則,包括7條動(dòng)詞短語(yǔ)調(diào)序規(guī)則,3條介詞短語(yǔ)調(diào)序規(guī)則和2條主謂短語(yǔ)的調(diào)序規(guī)則,在文獻(xiàn)[14]中給出了詳細(xì)說(shuō)明。
根據(jù)調(diào)序規(guī)則,我們?cè)O(shè)計(jì)了調(diào)序算法,編寫(xiě)了調(diào)序程序。程序主要把以文件形式的規(guī)則轉(zhuǎn)換成線性表的形式,同時(shí)為了便于調(diào)序?qū)⒏怕示浞ǚ治銎鞯姆治鼋Y(jié)果樹(shù)轉(zhuǎn)換成二叉樹(shù)的形式,最后進(jìn)行具體調(diào)序。調(diào)序算法的基本流程為:(1) 根據(jù)規(guī)則文件,建立相應(yīng)規(guī)則數(shù)據(jù)表;(2) 根據(jù)規(guī)則對(duì)帶詞性標(biāo)記的句子調(diào)序;(3) 釋放申請(qǐng)的資源;
其中(1)和(2)對(duì)應(yīng)初始化模塊和調(diào)序模塊。
初始化模塊主要把文本文件形式的調(diào)序規(guī)則轉(zhuǎn)換成線性表數(shù)據(jù)結(jié)構(gòu),以便分析處理。初始化模塊算法流程如下:
打開(kāi)規(guī)則文件
規(guī)則序號(hào)I=0;
WHILE(規(guī)則文件不結(jié)束)
{
讀入一條規(guī)則;
原始字符串規(guī)則列表后面插入規(guī)則;
從原始字符串規(guī)則分離出左邊規(guī)則;
將〈左邊規(guī)則,編號(hào)I〉對(duì)應(yīng)到關(guān)系映射MAP;
分離右邊規(guī)則;
分析規(guī)則,建立反應(yīng)左邊規(guī)則變換成右邊規(guī)則的conv_node數(shù)組;
建立調(diào)序規(guī)則線性表conv_list;
I++;}
調(diào)序模塊首先將漢語(yǔ)概率句法分析程序的結(jié)果樹(shù)用孩子兄弟表示法轉(zhuǎn)換成一棵二叉樹(shù),然后通過(guò)二叉樹(shù)進(jìn)行語(yǔ)序調(diào)序。調(diào)序時(shí)使用了后序遍歷的遞歸算法。后序遍歷的遞歸算法如下:
Conv_tree(struct_mynode *root)
{ Conv_tree(root.child)
Conv_tree(root.brother)
if(root->child != NULL)
{獲取當(dāng)前規(guī)則左部;
獲取當(dāng)前規(guī)則右部;
從rulenum查找當(dāng)前規(guī)則,得到編號(hào)I;
根據(jù)編號(hào)從調(diào)序規(guī)則表CONV_LIST中查找對(duì)應(yīng)調(diào)序規(guī)則;
如果找到,則根據(jù)調(diào)序規(guī)則進(jìn)行調(diào)序;}
}
我們將調(diào)序程序嵌入到統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中,以開(kāi)關(guān)形式選擇是否進(jìn)行調(diào)序。調(diào)序模塊與統(tǒng)計(jì)解碼器相互獨(dú)立,互不影響。
實(shí)驗(yàn)語(yǔ)料我們使用了CWMT2009 漢蒙評(píng)測(cè)語(yǔ)料,實(shí)驗(yàn)語(yǔ)料規(guī)模如表4所示,開(kāi)發(fā)集和測(cè)試集上的實(shí)驗(yàn)結(jié)果如表5所示。其中:baseline系統(tǒng)[3]是基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng);QF表示對(duì)訓(xùn)練語(yǔ)料進(jìn)行了形態(tài)切分; JF:表示進(jìn)行了句法調(diào)序。
表4 實(shí)驗(yàn)語(yǔ)料說(shuō)明
從表5中我們可以看到,形態(tài)切分對(duì)于系統(tǒng)性能的提高是非常明顯的。同時(shí),調(diào)序規(guī)則對(duì)于在開(kāi)發(fā)集和測(cè)試集上的性能都有一定的提高。在開(kāi)發(fā)集實(shí)驗(yàn)中, BLEU值在形態(tài)切分后提高了1.06%,調(diào)序后提高了2.07%。在測(cè)試集實(shí)驗(yàn)中,切分后BLEU值提高了 1.84%,在切分的基礎(chǔ)上進(jìn)行調(diào)序后BLEU值又提高了0.37%。
表5 開(kāi)發(fā)集和測(cè)試上的實(shí)驗(yàn)結(jié)果
為了測(cè)試句法調(diào)序模塊的真正作用,我們通過(guò)人工分析,從開(kāi)發(fā)集和測(cè)試集中將詞法和句法分析錯(cuò)誤的句子去掉,從400個(gè)句子的開(kāi)發(fā)集中挑出了261個(gè)漢語(yǔ)分析正確的,從400個(gè)句子的測(cè)試集中挑出了244個(gè)漢語(yǔ)分析正確的句子進(jìn)了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表6所示。表6給出的實(shí)驗(yàn)結(jié)果顯示,在語(yǔ)言模型和短語(yǔ)表相同的情況下,我們看到在基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯中,使用詞法和句法等語(yǔ)言學(xué)知識(shí)能夠提高系統(tǒng)性能。在開(kāi)發(fā)集實(shí)驗(yàn)中,BLEU值切分后提高了0.27%,調(diào)序后提高了3.59%。在測(cè)試集實(shí)驗(yàn)中,切分后BLEU值提高了2.15%,在切分的基礎(chǔ)上進(jìn)行調(diào)序后BLEU值提高了0.65%。
表6 過(guò)濾后開(kāi)發(fā)集和測(cè)試上的實(shí)驗(yàn)結(jié)果
下面是加入調(diào)序模塊后的系統(tǒng)運(yùn)行過(guò)程及翻譯結(jié)果實(shí)例。
輸入:我想?yún)⒓右粋€(gè)旅游團(tuán)。
分詞之前: 我想?yún)⒓右粋€(gè)旅游團(tuán)。
分詞之后: 我/r 想/v 參加/v 一個(gè)/m 旅游團(tuán)/n 。/w
調(diào)序之后: 我/r 一個(gè)/m 旅游團(tuán)/n 參加/v 想/v 。/w
使用的規(guī)則: vp->vp np=>VP(NP/np VP/vp)$vp!=是
使用的規(guī)則: vp->vp vp=>VP(VP//vp VP/vp)
去掉標(biāo)記后: 我 一個(gè) 旅游團(tuán) 參加 想 。
譯文2: BI NIGE JIGVLCILAL-VN BOLHOM-DU 0R0LCAHV GEJU B0D0JV BAYIN_A .
實(shí)驗(yàn)結(jié)果顯示對(duì)于語(yǔ)序差異較大的漢語(yǔ)和蒙古語(yǔ),基于蒙古語(yǔ)語(yǔ)序的漢語(yǔ)句子調(diào)序方法對(duì)于系統(tǒng)性能的提高相當(dāng)有效。下一步,我們將不斷地完善調(diào)序規(guī)則,擴(kuò)大語(yǔ)料庫(kù)規(guī)模,進(jìn)一步提高基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的性能。
[1] 那順烏日?qǐng)D,劉群,巴達(dá)瑪放德斯?fàn)?關(guān)于漢蒙機(jī)器輔助翻譯系統(tǒng)[J].阿爾泰學(xué)報(bào),2001:91-95.
[2] 侯宏旭,劉群,那順烏日?qǐng)D.基于實(shí)例的漢蒙機(jī)器翻譯[J].中文信息學(xué)報(bào),2007,21(4):65-72.
[3] 王斯日古楞,斯琴圖,那順烏日?qǐng)D.基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯研究[J],計(jì)算機(jī)工程與應(yīng)用,2010,(5):138-142.
[4] Fei Xia, and Michael McCord 2004. Improving a Statistical MT System with Automatically Learned Rewrite Patterns[C]//Proceedings for COLING 2004.
[5] Michael Collins, Philipp Koehn, and Ivona Kucerova.2005. Clause Restructuring for Statistical MachineTranslation[C]//Proceedings for ACL 2005.
[6] Chi-Ho Li, Dongdong Zhang, Mu Li, Ming Zhou, Minghui Li, Yi Guan,A Probabilistic Approach to Syntax-based Reordering for Statistical Machine Translation[C]//Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics, Prague, Czech Republic, June, 2007:720-727.
[7] 劉群,張華平,俞鴻魁,等,基于層疊隱馬模型的漢語(yǔ)詞法分析[J].計(jì)算機(jī)研究與發(fā)展,2004,41(8):1421-1429.
[8] 張浩,劉群,白碩.結(jié)構(gòu)上下文相關(guān)的概率句法分析[C]//第一屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)(SWCL2002)2002.
[9] 俞士汶,等.現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典詳解[M].北京:清華大學(xué)出版社,1998年.
[10] 那順烏日?qǐng)D,等.《信息技術(shù) 信息處理用蒙古文詞語(yǔ)標(biāo)記集》國(guó)家標(biāo)準(zhǔn)[S].2008年11月.
[11] 那順烏日?qǐng)D.蒙古語(yǔ)語(yǔ)法信息詞典框架設(shè)計(jì)[D].內(nèi)蒙古大學(xué),2000年博士學(xué)位論文.
[12] 巴達(dá)瑪敖德斯?fàn)?面向機(jī)器翻譯的漢蒙短語(yǔ)轉(zhuǎn)換規(guī)則研究[M].呼和浩特:內(nèi)蒙古教育出版社,2006年3月.
[13] 達(dá)胡白乙拉.蒙古語(yǔ)基本動(dòng)詞短語(yǔ)自動(dòng)識(shí)別研究[D]. 呼和浩特:內(nèi)蒙古大學(xué), 2005年博士學(xué)位論文.
[14] Wang.Siriguleng,Siqintu and Nasun-urtu. The research on reordering rule of Chinese-Mongolian statistical machine translation[J]. Advanced Materials Research Vols,268-270(2011): 2185-2190.