亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

漢蒙統(tǒng)計(jì)機(jī)器翻譯中的調(diào)序方法研究

2011-06-28 06:27:12王斯日古楞斯琴圖那順烏日?qǐng)D

中文信息學(xué)報(bào) 2011年4期

王斯日古楞，斯琴圖，那順烏日?qǐng)D

(1. 內(nèi)蒙古師范大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,內(nèi)蒙古呼和浩特 010022;2. 內(nèi)蒙古師范大學(xué) 網(wǎng)絡(luò)中心，內(nèi)蒙古呼和浩特 010022; 3. 內(nèi)蒙古大學(xué) 蒙古學(xué)學(xué)院，內(nèi)蒙古呼和浩特 010021)

1 引言

關(guān)于漢蒙機(jī)器翻譯，我們?cè)?jīng)做過(guò)基于規(guī)則的研究[1]，基于實(shí)例的研究[2]和基于短語(yǔ)的統(tǒng)計(jì)方法研究[3]。漢語(yǔ)和蒙古語(yǔ)的語(yǔ)序有較大的差別，在基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中，我們發(fā)現(xiàn)存在大量的語(yǔ)序錯(cuò)誤。在基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的具體翻譯結(jié)果中，對(duì)于兩種語(yǔ)言中語(yǔ)序相同的句子，翻譯效果較好。例如：

(1) 輸入：這張匯款單，在哪里取款？

輸出：ENE MONGGO G0BIGVLHV HAGVDASV,HAMIG_A J0G0S GARGAJV ABHV BVI ?

(2) 輸入:今天天氣怎么樣？

輸出:ONODOR-UN CAG AGVR-VN BAYIDAL YAMAR BVI ?

可見(jiàn)，以上兩個(gè)句子中漢語(yǔ)和蒙古語(yǔ)句子語(yǔ)序基本上一樣，翻譯效果還不錯(cuò)。但是，對(duì)于那些語(yǔ)序不同的句子，翻譯結(jié)果就沒(méi)那么理想了，會(huì)出現(xiàn)大量的語(yǔ)序錯(cuò)誤。例如：

(1) 輸入：我想?yún)⒓右粋€(gè)旅游團(tuán)。

輸出：BI 0R0LCAY_A GEJU B0D0JV NIGEN JIGVLCILAL-VN BOLHOM .

(2) 輸入:我沒(méi)有湯匙。

輸出:UGEI BI NIGE HALBAG_A .

對(duì)于這兩個(gè)譯文，我們是沒(méi)法接受的。其主要原因是譯文語(yǔ)序不符合蒙古語(yǔ)句子的語(yǔ)序。這是由于漢蒙兩種語(yǔ)言的語(yǔ)序差異較大，基于短語(yǔ)的翻譯模型只能解決一些局部語(yǔ)序的調(diào)整。因此，我們考慮使用句法規(guī)則，在漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中進(jìn)行調(diào)序。本文提出了基于蒙古語(yǔ)語(yǔ)序的漢語(yǔ)句子調(diào)序方法，此調(diào)序方法對(duì)基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的NIST和BLUE值都有明顯的提高。

2 基于蒙古語(yǔ)語(yǔ)序的漢語(yǔ)句子調(diào)序方法

基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯只解決了短距離的局部調(diào)序，為了解決長(zhǎng)距離調(diào)序，研究人員開(kāi)始使用基于句法的調(diào)序方法。隨著統(tǒng)計(jì)機(jī)器翻譯技術(shù)的發(fā)展，基于句法的統(tǒng)計(jì)機(jī)器翻譯已經(jīng)成為近幾年的研究熱點(diǎn)?；诰浞ǖ慕y(tǒng)計(jì)方法將句法信息引入翻譯中，以句法結(jié)構(gòu)作為翻譯單元，建立結(jié)構(gòu)之間的互譯關(guān)系。在基于句法的模型中，結(jié)構(gòu)之間的互譯關(guān)系是通過(guò)翻譯規(guī)則聯(lián)系起來(lái)的，這些規(guī)則可以從平行語(yǔ)料庫(kù)中自動(dòng)獲取，也可以通過(guò)人工進(jìn)行歸納總結(jié)。

文獻(xiàn)[4]和[5]都在源語(yǔ)言預(yù)處理階段使用了語(yǔ)言學(xué)句法分析。文獻(xiàn)[4]中的規(guī)則是對(duì)雙語(yǔ)語(yǔ)料的學(xué)習(xí)后得到的，在英語(yǔ)到法語(yǔ)的機(jī)器翻譯系統(tǒng)實(shí)驗(yàn)中BLEU值提高了10%。文獻(xiàn)[5]中對(duì)于德語(yǔ)到英語(yǔ)的翻譯，根據(jù)語(yǔ)言學(xué)知識(shí)總結(jié)出六種德語(yǔ)子句到英語(yǔ)的調(diào)序規(guī)則。文獻(xiàn)[6]提出了一種將句法分析和基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯的優(yōu)點(diǎn)結(jié)合起來(lái)進(jìn)行調(diào)序的概率方法，對(duì)于給定的句子及其句法樹(shù)，通過(guò)樹(shù)操作生成調(diào)序后的n_best作為基于短語(yǔ)統(tǒng)計(jì)解碼器的輸入，此方法在漢語(yǔ)到英語(yǔ)的翻譯實(shí)驗(yàn)中BLEU值提高了1.56%。

我們?cè)诨诙陶Z(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中提出基于蒙古語(yǔ)語(yǔ)序的漢語(yǔ)句子調(diào)序策略。主要方法是對(duì)于輸入的漢語(yǔ)句子先進(jìn)行分詞和詞性標(biāo)注，之后對(duì)句法樹(shù)進(jìn)行分析，根據(jù)調(diào)序規(guī)則對(duì)需要調(diào)序的部分進(jìn)行調(diào)序，使得漢語(yǔ)句子的語(yǔ)序盡量接近蒙古語(yǔ)句子的順序，最后將調(diào)序后的漢語(yǔ)句子送到統(tǒng)計(jì)解碼器進(jìn)行單調(diào)解碼?；玖鞒倘鐖D1所示。

圖1 融入調(diào)序模型的系統(tǒng)流程

在漢蒙機(jī)器翻譯系統(tǒng)中，對(duì)漢語(yǔ)的分析是前提。為了進(jìn)行調(diào)序，首先要對(duì)漢語(yǔ)句子進(jìn)行分詞和句法分析，我們選擇了中國(guó)科學(xué)院計(jì)算技術(shù)研究所的網(wǎng)上資源ICTCLAS和ICTPROP。

ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)是中國(guó)科學(xué)院計(jì)算技術(shù)研究所研制的漢語(yǔ)詞法分析系統(tǒng)，作者采用一種基于層疊隱馬模型的漢語(yǔ)詞法分析方法[7]，目前已經(jīng)升級(jí)到了ICTCLAS3.0，我們使用了免費(fèi)的ICTCLAS1.0，對(duì)漢語(yǔ)句子進(jìn)行分詞和詞性標(biāo)注。ICTPROP是中國(guó)科學(xué)院計(jì)算技術(shù)研究所開(kāi)發(fā)的一個(gè)概率型的自然語(yǔ)言句法分析器[8]。ICTPROP 的分析算法是綜合了多種優(yōu)化策略的改進(jìn)型chart分析算法，分析結(jié)果是概率最大的一棵分析樹(shù)。我們使用ICTPROP對(duì)漢語(yǔ)句子進(jìn)行句法分析。

在具體實(shí)驗(yàn)過(guò)程中，漢語(yǔ)句法分析器對(duì)于較長(zhǎng)的漢語(yǔ)句子分析成功率較低。為了提高句法分析器的成功率，我們首先將漢語(yǔ)句子分解成子句，然后對(duì)每個(gè)子句進(jìn)行分析和調(diào)序，最后將調(diào)序后的各個(gè)子句按照順序合并成一個(gè)句子。一般，漢語(yǔ)句子翻譯成蒙古語(yǔ)后，各個(gè)子句的順序是不會(huì)改變的，所以這種做法不會(huì)影響整個(gè)句子的翻譯結(jié)果。我們通過(guò)漢語(yǔ)句子中出現(xiàn)的逗號(hào)(，)、分號(hào)(；)、冒號(hào)(：)、感嘆號(hào)(！)，問(wèn)號(hào)(？)和句號(hào)(。)等將漢語(yǔ)句子切分為子句。子句調(diào)序的依據(jù)是漢蒙句子轉(zhuǎn)換規(guī)則，因此我們首先對(duì)漢蒙句子轉(zhuǎn)換規(guī)則進(jìn)行了研究，從中總結(jié)歸納出了具有語(yǔ)序變化的規(guī)則，然后編寫(xiě)了子句調(diào)序模塊。下面詳細(xì)介紹調(diào)序規(guī)則和調(diào)序算法。

3 調(diào)序規(guī)則

我們把漢語(yǔ)句法規(guī)則分為兩部分，一部分是與蒙古語(yǔ)語(yǔ)序相同的，另一部分是與蒙古語(yǔ)語(yǔ)序不同的。我們只考察那些語(yǔ)序不同的規(guī)則，給出相應(yīng)的變換形式。

規(guī)則格式定義為：=>[$Z]

其中：X為源語(yǔ)言漢語(yǔ)的短語(yǔ)結(jié)構(gòu)句法規(guī)則，對(duì)應(yīng)漢語(yǔ)的正確語(yǔ)序，我們將其稱(chēng)為分析規(guī)則，即漢語(yǔ)句法分析規(guī)則；Y是漢語(yǔ)規(guī)則中的每個(gè)語(yǔ)法成分對(duì)應(yīng)到蒙古語(yǔ)時(shí)的順序和成分，即調(diào)序部分，我們稱(chēng)其為調(diào)序規(guī)則。Z是限制條件，指出用此規(guī)則調(diào)序時(shí)，對(duì)某個(gè)語(yǔ)法成分可設(shè)置單詞限制條件。條件部分是可選的，即可以有，可以沒(méi)有。

分析規(guī)則X的形式為：α->β

其中α為規(guī)則的左部，是一個(gè)漢語(yǔ)短語(yǔ)標(biāo)記(見(jiàn)表1)。β是規(guī)則的右部，由一個(gè)或多個(gè)標(biāo)記組成，標(biāo)記可以是短語(yǔ)標(biāo)記，也可以是詞性標(biāo)記(見(jiàn)表2)，各個(gè)標(biāo)記之間以一個(gè)空格分割。

表1 概率句法分析器中的句子、短語(yǔ)標(biāo)記及其對(duì)應(yīng)規(guī)則數(shù)

調(diào)序規(guī)則Y的形式為：A(γ1γ2……),其中A表示規(guī)則中左部漢語(yǔ)短語(yǔ)標(biāo)記對(duì)應(yīng)的蒙古語(yǔ)短語(yǔ)標(biāo)記，每個(gè)γi表示一個(gè)替換項(xiàng)或一個(gè)插入成分。替換項(xiàng)的形式為B/C, 含義是分析規(guī)則中的漢語(yǔ)語(yǔ)法成分C在蒙古語(yǔ)中對(duì)應(yīng)語(yǔ)法成分為B，B是蒙古語(yǔ)的詞類(lèi)或短語(yǔ)標(biāo)記(見(jiàn)表3)，C為漢語(yǔ)的詞類(lèi)或短語(yǔ)標(biāo)記。插入成分形式為D,D為蒙古語(yǔ)的詞類(lèi)或短語(yǔ)標(biāo)記，S表示蒙古語(yǔ)的一個(gè)單詞或附加成分，含義是用這個(gè)規(guī)則調(diào)序時(shí)，在此位置要插入S。

限制條件Z是單詞限制條件，格式：C=S 或C!=S,用來(lái)指出某個(gè)分析規(guī)則中的語(yǔ)法成分對(duì)應(yīng)的單詞與S中給出的一個(gè)或多個(gè)單詞相等或不等。

~~表2 漢語(yǔ)詞性標(biāo)記集~~

~~表3 蒙古語(yǔ)詞類(lèi)標(biāo)記集~~

~~例如：vp->vp np=>VP(NP/np VP/vp)$vp!=是~~

~~分析規(guī)則X為：vp->vp np ，表示漢語(yǔ)的vp由一個(gè)vp 后跟一個(gè)np組成。~~

調(diào)序規(guī)則Y為：VP(NP/np VP/vp)，表示漢語(yǔ)的動(dòng)詞短語(yǔ)對(duì)應(yīng)到蒙古語(yǔ)時(shí)也是動(dòng)詞短語(yǔ)VP，此VP由NP后跟VP構(gòu)成，NP對(duì)應(yīng)分析規(guī)則的np, VP對(duì)應(yīng)分析規(guī)則的vp，可見(jiàn)語(yǔ)序是不同的。

~~限制條件Z：vp!=是，表示使用此規(guī)則調(diào)序時(shí)，分析規(guī)則右邊的vp對(duì)應(yīng)的單詞不等于“是”。~~

漢語(yǔ)短語(yǔ)標(biāo)記使用了漢語(yǔ)概率句法分析器中的短語(yǔ)標(biāo)記集，見(jiàn)表1。漢語(yǔ)詞語(yǔ)用ICTCLAS進(jìn)行詞性標(biāo)注時(shí)選擇了北大標(biāo)記集，即在《現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典詳解》[9]中規(guī)定的漢語(yǔ)詞性標(biāo)記集，見(jiàn)表2，共26個(gè)標(biāo)記。

蒙古語(yǔ)的詞類(lèi)標(biāo)記使用了在2008年11月通過(guò)的《信息處理用蒙古文詞語(yǔ)標(biāo)記集》國(guó)家標(biāo)準(zhǔn)[10]。其中一級(jí)標(biāo)記集規(guī)定了25個(gè)標(biāo)記，見(jiàn)表3。

對(duì)于蒙古語(yǔ)短語(yǔ)，在《蒙古語(yǔ)語(yǔ)法信息詞典框架設(shè)計(jì)》[11]中把蒙古語(yǔ)短語(yǔ)分為名詞短語(yǔ)(NP)、形容詞短語(yǔ)(AP)、動(dòng)詞短語(yǔ)(VP)、代詞短語(yǔ)(RP)、數(shù)詞短語(yǔ)(MCP)、數(shù)量詞短語(yǔ)(MP)、方位詞短語(yǔ)(OP)、時(shí)間詞短語(yǔ)(TP)、副詞短語(yǔ)(DP)、后置詞短語(yǔ)(GP)等10 種，同時(shí)根據(jù)實(shí)際需要，我們參考了文獻(xiàn)[12]和[13]，將主謂短語(yǔ)(DJ)、語(yǔ)氣詞短語(yǔ)(SP)和情態(tài)詞短語(yǔ)(XP)等都放到蒙古語(yǔ)的短語(yǔ)標(biāo)注集中，共有13個(gè)蒙古語(yǔ)短語(yǔ)標(biāo)記。

確定規(guī)則格式和標(biāo)記集后，我們構(gòu)造了基于蒙古語(yǔ)語(yǔ)序的漢語(yǔ)句子調(diào)序規(guī)則。我們?cè)跐h語(yǔ)分詞、詞性標(biāo)注和句法分析的基礎(chǔ)上，對(duì)如何將一個(gè)漢語(yǔ)句子的短語(yǔ)結(jié)構(gòu)樹(shù)轉(zhuǎn)換成相應(yīng)的蒙古語(yǔ)語(yǔ)法樹(shù)進(jìn)行了研究，進(jìn)一步從中歸納出12條具有語(yǔ)序變化的轉(zhuǎn)換規(guī)則，把這部分規(guī)則我們稱(chēng)之為漢蒙調(diào)序規(guī)則，包括7條動(dòng)詞短語(yǔ)調(diào)序規(guī)則，3條介詞短語(yǔ)調(diào)序規(guī)則和2條主謂短語(yǔ)的調(diào)序規(guī)則，在文獻(xiàn)[14]中給出了詳細(xì)說(shuō)明。

4 調(diào)序算法

根據(jù)調(diào)序規(guī)則，我們?cè)O(shè)計(jì)了調(diào)序算法，編寫(xiě)了調(diào)序程序。程序主要把以文件形式的規(guī)則轉(zhuǎn)換成線性表的形式，同時(shí)為了便于調(diào)序?qū)⒏怕示浞ǚ治銎鞯姆治鼋Y(jié)果樹(shù)轉(zhuǎn)換成二叉樹(shù)的形式，最后進(jìn)行具體調(diào)序。調(diào)序算法的基本流程為：(1) 根據(jù)規(guī)則文件，建立相應(yīng)規(guī)則數(shù)據(jù)表；(2) 根據(jù)規(guī)則對(duì)帶詞性標(biāo)記的句子調(diào)序；(3) 釋放申請(qǐng)的資源；

~~其中(1)和(2)對(duì)應(yīng)初始化模塊和調(diào)序模塊。~~

~~初始化模塊主要把文本文件形式的調(diào)序規(guī)則轉(zhuǎn)換成線性表數(shù)據(jù)結(jié)構(gòu)，以便分析處理。初始化模塊算法流程如下：~~

~~打開(kāi)規(guī)則文件~~

~~規(guī)則序號(hào)I=0；~~

~~WHILE(規(guī)則文件不結(jié)束)~~

{

~~讀入一條規(guī)則；~~

~~原始字符串規(guī)則列表后面插入規(guī)則；~~

~~從原始字符串規(guī)則分離出左邊規(guī)則；~~

~~將〈左邊規(guī)則，編號(hào)I〉對(duì)應(yīng)到關(guān)系映射MAP；~~

~~分離右邊規(guī)則；~~

~~分析規(guī)則，建立反應(yīng)左邊規(guī)則變換成右邊規(guī)則的conv_node數(shù)組；~~

~~建立調(diào)序規(guī)則線性表conv_list；~~

~~I++；}~~

調(diào)序模塊首先將漢語(yǔ)概率句法分析程序的結(jié)果樹(shù)用孩子兄弟表示法轉(zhuǎn)換成一棵二叉樹(shù)，然后通過(guò)二叉樹(shù)進(jìn)行語(yǔ)序調(diào)序。調(diào)序時(shí)使用了后序遍歷的遞歸算法。后序遍歷的遞歸算法如下：

~~Conv_tree(struct_mynode *root)~~

~~{ Conv_tree(root.child)~~

~~Conv_tree(root.brother)~~

~~if(root->child != NULL)~~

~~{獲取當(dāng)前規(guī)則左部；~~

~~獲取當(dāng)前規(guī)則右部；~~

~~從rulenum查找當(dāng)前規(guī)則，得到編號(hào)I；~~

~~根據(jù)編號(hào)從調(diào)序規(guī)則表CONV_LIST中查找對(duì)應(yīng)調(diào)序規(guī)則；~~

~~如果找到，則根據(jù)調(diào)序規(guī)則進(jìn)行調(diào)序；}~~

}

我們將調(diào)序程序嵌入到統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中，以開(kāi)關(guān)形式選擇是否進(jìn)行調(diào)序。調(diào)序模塊與統(tǒng)計(jì)解碼器相互獨(dú)立，互不影響。

5 實(shí)驗(yàn)及其分析

實(shí)驗(yàn)語(yǔ)料我們使用了CWMT2009 漢蒙評(píng)測(cè)語(yǔ)料，實(shí)驗(yàn)語(yǔ)料規(guī)模如表4所示,開(kāi)發(fā)集和測(cè)試集上的實(shí)驗(yàn)結(jié)果如表5所示。其中：baseline系統(tǒng)[3]是基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)；QF表示對(duì)訓(xùn)練語(yǔ)料進(jìn)行了形態(tài)切分； JF：表示進(jìn)行了句法調(diào)序。

~~表4 實(shí)驗(yàn)語(yǔ)料說(shuō)明~~

從表5中我們可以看到，形態(tài)切分對(duì)于系統(tǒng)性能的提高是非常明顯的。同時(shí)，調(diào)序規(guī)則對(duì)于在開(kāi)發(fā)集和測(cè)試集上的性能都有一定的提高。在開(kāi)發(fā)集實(shí)驗(yàn)中, BLEU值在形態(tài)切分后提高了1.06%,調(diào)序后提高了2.07%。在測(cè)試集實(shí)驗(yàn)中,切分后BLEU值提高了 1.84%,在切分的基礎(chǔ)上進(jìn)行調(diào)序后BLEU值又提高了0.37%。

~~表5 開(kāi)發(fā)集和測(cè)試上的實(shí)驗(yàn)結(jié)果~~

為了測(cè)試句法調(diào)序模塊的真正作用，我們通過(guò)人工分析，從開(kāi)發(fā)集和測(cè)試集中將詞法和句法分析錯(cuò)誤的句子去掉，從400個(gè)句子的開(kāi)發(fā)集中挑出了261個(gè)漢語(yǔ)分析正確的，從400個(gè)句子的測(cè)試集中挑出了244個(gè)漢語(yǔ)分析正確的句子進(jìn)了實(shí)驗(yàn)，實(shí)驗(yàn)結(jié)果如表6所示。表6給出的實(shí)驗(yàn)結(jié)果顯示，在語(yǔ)言模型和短語(yǔ)表相同的情況下，我們看到在基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯中，使用詞法和句法等語(yǔ)言學(xué)知識(shí)能夠提高系統(tǒng)性能。在開(kāi)發(fā)集實(shí)驗(yàn)中,BLEU值切分后提高了0.27%,調(diào)序后提高了3.59%。在測(cè)試集實(shí)驗(yàn)中,切分后BLEU值提高了2.15%,在切分的基礎(chǔ)上進(jìn)行調(diào)序后BLEU值提高了0.65%。

~~表6 過(guò)濾后開(kāi)發(fā)集和測(cè)試上的實(shí)驗(yàn)結(jié)果~~

~~下面是加入調(diào)序模塊后的系統(tǒng)運(yùn)行過(guò)程及翻譯結(jié)果實(shí)例。~~

~~輸入:我想?yún)⒓右粋€(gè)旅游團(tuán)。~~

~~分詞之前：我想?yún)⒓右粋€(gè)旅游團(tuán)。~~

~~分詞之后：我/r 想/v 參加/v 一個(gè)/m 旅游團(tuán)/n 。/w~~

~~調(diào)序之后：我/r 一個(gè)/m 旅游團(tuán)/n 參加/v 想/v 。/w~~

~~使用的規(guī)則: vp->vp np=>VP(NP/np VP/vp)$vp!=是~~

~~使用的規(guī)則: vp->vp vp=>VP(VP//vp VP/vp)~~

~~去掉標(biāo)記后：我一個(gè) 旅游團(tuán) 參加想。~~

~~譯文2: BI NIGE JIGVLCILAL-VN BOLHOM-DU 0R0LCAHV GEJU B0D0JV BAYIN_A .~~

實(shí)驗(yàn)結(jié)果顯示對(duì)于語(yǔ)序差異較大的漢語(yǔ)和蒙古語(yǔ)，基于蒙古語(yǔ)語(yǔ)序的漢語(yǔ)句子調(diào)序方法對(duì)于系統(tǒng)性能的提高相當(dāng)有效。下一步，我們將不斷地完善調(diào)序規(guī)則，擴(kuò)大語(yǔ)料庫(kù)規(guī)模，進(jìn)一步提高基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的性能。

~~[1] 那順烏日?qǐng)D，劉群，巴達(dá)瑪放德斯?fàn)?關(guān)于漢蒙機(jī)器輔助翻譯系統(tǒng)[J].阿爾泰學(xué)報(bào),2001:91-95.~~

~~[2] 侯宏旭，劉群，那順烏日?qǐng)D.基于實(shí)例的漢蒙機(jī)器翻譯[J].中文信息學(xué)報(bào),2007，21(4):65-72.~~

~~[3] 王斯日古楞,斯琴圖，那順烏日?qǐng)D.基于短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯研究[J],計(jì)算機(jī)工程與應(yīng)用，2010,(5):138-142.~~

~~[4] Fei Xia, and Michael McCord 2004. Improving a Statistical MT System with Automatically Learned Rewrite Patterns[C]//Proceedings for COLING 2004.~~

~~[5] Michael Collins, Philipp Koehn, and Ivona Kucerova.2005. Clause Restructuring for Statistical MachineTranslation[C]//Proceedings for ACL 2005.~~

[6] Chi-Ho Li, Dongdong Zhang, Mu Li, Ming Zhou, Minghui Li, Yi Guan,A Probabilistic Approach to Syntax-based Reordering for Statistical Machine Translation[C]//Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics, Prague, Czech Republic, June, 2007：720-727.

~~[7] 劉群，張華平，俞鴻魁,等，基于層疊隱馬模型的漢語(yǔ)詞法分析[J].計(jì)算機(jī)研究與發(fā)展，2004,41(8):1421-1429.~~

~~[8] 張浩，劉群，白碩.結(jié)構(gòu)上下文相關(guān)的概率句法分析[C]//第一屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)(SWCL2002)2002.~~

~~[9] 俞士汶,等.現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典詳解[M].北京:清華大學(xué)出版社，1998年.~~

~~[10] 那順烏日?qǐng)D,等.《信息技術(shù) 信息處理用蒙古文詞語(yǔ)標(biāo)記集》國(guó)家標(biāo)準(zhǔn)[S].2008年11月.~~

~~[11] 那順烏日?qǐng)D.蒙古語(yǔ)語(yǔ)法信息詞典框架設(shè)計(jì)[D].內(nèi)蒙古大學(xué),2000年博士學(xué)位論文.~~

~~[12] 巴達(dá)瑪敖德斯?fàn)?面向機(jī)器翻譯的漢蒙短語(yǔ)轉(zhuǎn)換規(guī)則研究[M].呼和浩特:內(nèi)蒙古教育出版社，2006年3月.~~

~~[13] 達(dá)胡白乙拉.蒙古語(yǔ)基本動(dòng)詞短語(yǔ)自動(dòng)識(shí)別研究[D]. 呼和浩特:內(nèi)蒙古大學(xué), 2005年博士學(xué)位論文.~~

~~[14] Wang.Siriguleng,Siqintu and Nasun-urtu. The research on reordering rule of Chinese-Mongolian statistical machine translation[J]. Advanced Materials Research Vols,268-270(2011)： 2185-2190.~~

猜你喜歡

蒙古語(yǔ)語(yǔ)序短語(yǔ)

含有“心”一詞蒙古語(yǔ)復(fù)合詞的語(yǔ)義
西部蒙古論壇(2022年2期)2022-07-12 04:47:38
土默特地方蒙古語(yǔ)地名再探
蒙古學(xué)問(wèn)題與爭(zhēng)論(2020年0期)2020-03-29 06:26:58
論蒙古語(yǔ)中反映心理逆境傾向的某些字的含義
赤峰學(xué)院學(xué)報(bào)(蒙文哲學(xué)社會(huì)科學(xué)版)(2018年1期)2018-04-25 07:57:25
語(yǔ)序類(lèi)語(yǔ)法填空題的解題技巧
高中生·天天向上(2017年10期)2018-01-18 22:02:07
as引導(dǎo)狀語(yǔ)從句的倒裝語(yǔ)序
高中生·天天向上(2017年5期)2017-06-12 06:55:06
漢韓“在”字句的語(yǔ)序類(lèi)型及習(xí)得研究
國(guó)際漢語(yǔ)學(xué)報(bào)(2016年1期)2017-01-20 08:21:07
俄語(yǔ)詞“Sherti”在蒙古語(yǔ)中的變義(蒙古文)
衛(wèi)拉特研究(2016年0期)2016-12-06 09:12:06

中文信息學(xué)報(bào)2011年4期

中文信息學(xué)報(bào)的其它文章
框架元素語(yǔ)義核心詞自動(dòng)識(shí)別研究
蒙古語(yǔ)標(biāo)準(zhǔn)音輔音組合的協(xié)同發(fā)音研究
維吾爾語(yǔ)中漢族人名的識(shí)別及翻譯
基于短語(yǔ)統(tǒng)計(jì)機(jī)器翻譯模型蒙古文形態(tài)切分
藏語(yǔ)句子相似度算法的研究
基于樸素貝葉斯分類(lèi)器的朝鮮語(yǔ)文本分類(lèi)的研究

雜志排行

1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化》2024年2期
4《微型小說(shuō)月報(bào)》2024年10期
5《工業(yè)微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業(yè)管理與科技》2024年6期
9《現(xiàn)代食品》2024年4期
10《衛(wèi)生職業(yè)教育》2024年10期

感谢您访问我们的网站，您可能还对以下资源感兴趣：