李俠
(咸陽師范學(xué)院 外國語學(xué)院,陜西 咸陽 712000)
英漢機(jī)器翻譯中的英語動(dòng)詞漢譯研究
李俠
(咸陽師范學(xué)院 外國語學(xué)院,陜西 咸陽 712000)
機(jī)器翻譯是一項(xiàng)非常重要且困難的工作,動(dòng)詞因其形式多樣且使用較為靈活,是機(jī)器翻譯過程中的重要環(huán)節(jié)。本文針對(duì)機(jī)器翻譯過程中的動(dòng)詞翻譯進(jìn)行研究,先對(duì)語義語言理論進(jìn)行介紹,進(jìn)而對(duì)動(dòng)詞語義進(jìn)行分析,然后在動(dòng)詞語義模式的基礎(chǔ)上對(duì)動(dòng)詞進(jìn)行詳細(xì)的研究。在對(duì)語義進(jìn)行歸納總結(jié)以后,將動(dòng)詞的語義模式分為三類,再將動(dòng)詞語義模式庫進(jìn)行搭建,最后設(shè)計(jì)出一種以語義、句式以及變量為基礎(chǔ)的翻譯方法,該漢譯方法適用于英語句子當(dāng)中的動(dòng)詞翻譯過程中。
機(jī)器翻譯;動(dòng)詞;語義模式;語義類型;變量
隨著計(jì)算機(jī)的普及,人們希望它能實(shí)現(xiàn)更多的功能,同時(shí),現(xiàn)今社會(huì)當(dāng)中,各民族之間的交流也日益增加,隨之而來的就是語言障礙問題,那么,為了保證各個(gè)語言國家之間的交流順利,且提高相互交流效率,使用計(jì)算機(jī)來進(jìn)行翻譯就勢在必行了。然而,現(xiàn)有的機(jī)器翻譯系統(tǒng)遠(yuǎn)遠(yuǎn)滿足不了語言的復(fù)雜性和人們對(duì)語言使用的不規(guī)則性,所以,高效的機(jī)器翻譯系統(tǒng)就非常有必要了。機(jī)器翻譯系統(tǒng)是針對(duì)句子進(jìn)行翻譯,而句子是由不同詞性的詞匯組成,其中,動(dòng)詞是句子中的重要組成部分,對(duì)動(dòng)詞翻譯的準(zhǔn)確性影響著對(duì)句子翻譯的質(zhì)量。對(duì)于同一個(gè)詞匯,在不同環(huán)境中所表達(dá)的意義可能有所不同,所以,在機(jī)器翻譯過程中,對(duì)同一動(dòng)詞而言,要針對(duì)不同環(huán)境來選擇不同的含義?,F(xiàn)今對(duì)動(dòng)詞翻譯的研究還處于研究過程階段,對(duì)動(dòng)詞翻譯的準(zhǔn)確性提高也會(huì)提高句子翻譯的質(zhì)量,有利于機(jī)器翻譯系統(tǒng)的擴(kuò)充和完善[1-2]。
機(jī)器翻譯是指利用計(jì)算機(jī)將一種語言翻譯為另一種語言的技術(shù)。這種技術(shù)非常復(fù)雜,它將語言學(xué)、計(jì)算機(jī)學(xué)、心理學(xué)等各個(gè)學(xué)科相互結(jié)合,是一項(xiàng)非常困難的研究課題。它的特點(diǎn)是[3-5]:
1)涉及多個(gè)學(xué)科領(lǐng)域,必須將不同學(xué)科的領(lǐng)頭人相互合作才可能完成機(jī)器翻譯系統(tǒng)的實(shí)現(xiàn)。
2)翻譯過程可計(jì)算,也就是說,必須利用計(jì)算機(jī)相關(guān)技術(shù)才可以實(shí)現(xiàn)機(jī)器翻譯。
3)翻譯過程困難,因?yàn)闄C(jī)器翻譯的是人類自然語言,會(huì)因人對(duì)語言理解不同而有所不同,無法實(shí)現(xiàn)對(duì)語言的可操控性。
4)具有實(shí)用價(jià)值。
2.1語義語言
語義單元表示的是在任意一個(gè)自然語言中所表述的一個(gè)含義的單元。語義單元又可以組成語義語言,其形式通常可表示為:(A、B、C、D、E)。其中,A表示完結(jié)符,B表示變量標(biāo)志符、C表示語義單元集合,D表示類集,也就是說每個(gè)語義單元都與一個(gè)類集一一對(duì)應(yīng),E表示變量代替法則。
通??蓪⒄Z義語言分為三層,分別是語言層、知識(shí)層以及語用層。比如,“把這瓶水倒入那壺濃硫酸里”,這一句話是由“這”、“瓶”、“水”、“那”、“壺”、“濃硫酸”六個(gè)語義單元所組成,可以歸結(jié)為“把
將上述例子用語言層理解,就是分別找到兩個(gè)N表示的名詞,然后再根據(jù)語句命令將這個(gè)N倒入那個(gè)N中,而不會(huì)考慮會(huì)出現(xiàn)什么后果。
若用知識(shí)層來理解,就是知道將水倒入濃硫酸中會(huì)發(fā)生爆炸,會(huì)產(chǎn)生嚴(yán)重的后果,那么會(huì)對(duì)該命令進(jìn)行提醒并警告。
所以,綜上所述,針對(duì)不同層次理解,所得到的信息是不一樣的,但是在本文中,僅僅是針對(duì)語言層來理解語義單元[6-7]。
2.2基于語義單元的機(jī)器翻譯方法
以語義單元為基礎(chǔ)的機(jī)器翻譯方法可分為兩部分,分別是統(tǒng)一的機(jī)器翻譯軟件和多個(gè)語言單元庫[8-9]。該機(jī)器翻譯流程圖如圖1所示。
圖1 基于語義單元的機(jī)器翻譯系統(tǒng)流程圖
3.1動(dòng)詞語義模式的提取方法
動(dòng)詞語義模式的提取原則主要有以下幾點(diǎn)[10-11]:
1)動(dòng)詞語義模式是按照一定的排列次序,將變量和實(shí)量排列組成,并且該排列結(jié)構(gòu)可以有效的反應(yīng)出句子中的內(nèi)部排列次序。其中,實(shí)量是語義當(dāng)中的最小語義單元,變量根據(jù)其處于句子當(dāng)中的不同位置由多種語義代替。
2)在提取過程中,動(dòng)詞是作為實(shí)量來進(jìn)行提取,并將與動(dòng)詞搭配的詞匯定義為相關(guān)詞組,也視為實(shí)量進(jìn)行提取。
3)對(duì)動(dòng)詞及相關(guān)詞組的含義會(huì)產(chǎn)生異議的部分定為變量來提取。
4)因?yàn)闈h英句子的結(jié)構(gòu)排列次序不同,所以變量的提取也不必要求一一對(duì)應(yīng)。
5)將動(dòng)詞語義庫中的語義模式類型用來代表句子中的句法形式,使得動(dòng)詞可以被代替。
6)動(dòng)詞語義模式當(dāng)中的變量既可以表示形容詞,也可以表示動(dòng)名詞、句子等形式。
7)表示同一個(gè)語義的變量可用相同的動(dòng)詞語義模式來替換。
3.2動(dòng)詞語義模式庫
動(dòng)詞語義模式庫分類如圖2所示。由圖2可看出,動(dòng)詞語義模式庫由VO語義模式庫和V語義模式庫組成,其中,VO語義模式庫又可以分為VO相鄰語義模式庫和VO非相鄰語義模式庫兩種。VO語義模式表示的是動(dòng)詞與其他屬性的實(shí)量根據(jù)不同排列順序所構(gòu)成的語義模式,動(dòng)詞與相鄰的實(shí)量一起組成的語義模式稱為VO相鄰語義模式,反之則為VO非相鄰語義模式。V語義模式是指由一個(gè)動(dòng)詞構(gòu)成R部。不同的語義模式組合構(gòu)成不同的語義模式庫[12-13]。動(dòng)詞語義模式庫結(jié)構(gòu)如表1所示。
圖2 動(dòng)詞語義模式庫分類
表1 動(dòng)詞語義模式庫結(jié)構(gòu)
4.1常用動(dòng)詞的漢譯方法的選擇
常用動(dòng)詞的漢譯方法主要有[14]:
1)統(tǒng)計(jì)法:在所要求翻譯的句子中,根據(jù)上下問中頻繁出現(xiàn)的并且與所要求翻譯的詞較為類似的譯文,通過統(tǒng)計(jì)的方法來確定目標(biāo)詞匯的譯文。這種方法需要較大的工作量,并且需要大量的語句庫作為參考,而且語句庫的翻譯質(zhì)量會(huì)對(duì)最終的翻譯結(jié)果產(chǎn)生較大的影響。
2)實(shí)例法:與統(tǒng)計(jì)法較為相似,也是通過在語句庫中大規(guī)模的找尋與目標(biāo)語句較為相似的句子,將該句子提取出來做適當(dāng)修改以后作為輸出結(jié)果。
3)語義模式法:首先要先創(chuàng)建語義模式庫,并且創(chuàng)建過程必須有一定的限制條件才可以。在對(duì)目標(biāo)語句翻譯中,先從庫中找出與之相符的語義模式,然后再根據(jù)目標(biāo)語句的語境找出最符合的語義模式,最后再輸出結(jié)果。
4.2漢譯算法的實(shí)現(xiàn)
對(duì)英語中動(dòng)詞的翻譯算法流程圖如圖3所示。步驟如下:
圖3 算法流程圖
1)先對(duì)開始輸入的英語句子進(jìn)行初始化;
2)將初始化的句子與固定句式庫中的語句匹配,若成功,則輸出結(jié)果,若失敗,則轉(zhuǎn)3);
3)0將初始化句子再與VO相鄰語義模式庫進(jìn)行匹配,若成功,轉(zhuǎn)到4),若失敗,則轉(zhuǎn)到6);
4)去句子中的右邊的詞N,將N與VO相鄰語義模式庫進(jìn)行匹配,若成功,轉(zhuǎn)5),若失敗,轉(zhuǎn)6);
5)根據(jù)語義模式匹配算法將匹配成功的N在相鄰語義模式庫中進(jìn)行匹配,若成功,轉(zhuǎn)11),若失敗,轉(zhuǎn)6);
6)將句子與VO非相鄰語義模式庫進(jìn)行匹配,若成功,轉(zhuǎn)7),若失敗,轉(zhuǎn)9);
7)再去句子中從右邊取除了N以外的詞,分別與VO非相鄰語義模式庫進(jìn)行匹配,若成功,轉(zhuǎn)8),若失敗,轉(zhuǎn)9);
8)利用匹配算法匹配語義,若成功,轉(zhuǎn)11),若失敗,轉(zhuǎn)9);
9)將句子與V語義模式庫進(jìn)行匹配,若成功,轉(zhuǎn)10),若失敗,則輸出結(jié)果失敗,結(jié)束過程。
10)用匹配算法匹配語義模式,若成功,轉(zhuǎn)11),若失敗,則輸出結(jié)果失敗,結(jié)果過程。
11)分別輸出英語和漢語的語義模式;
12)輸出的漢語語義模式即英語的譯文。
機(jī)器翻譯是一項(xiàng)非常重要且困難的工作,動(dòng)詞在句子中是重要部分,它的復(fù)雜多變性是機(jī)器翻譯過程中需要攻克的難點(diǎn)。文中先對(duì)語義語言進(jìn)行介紹,提出了基于語義單元的機(jī)器翻譯方法,然后再對(duì)動(dòng)詞語義模式的提取方式進(jìn)行了大致的闡述,并對(duì)動(dòng)詞語義模式庫詳細(xì)的進(jìn)行了分析和介紹,最后對(duì)漢譯方法進(jìn)一步解釋,提出了一種漢譯的算法流程,并對(duì)這種方法的過程進(jìn)行詳細(xì)的研究。根據(jù)這種方法,進(jìn)一步可以提高英語動(dòng)詞漢譯的準(zhǔn)確性和高效率。
[1]趙鐵軍.機(jī)器翻譯原理[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社, 2001.
[2]Gao Q S,Hu Y,LI L,et al.Semantic language and multi一language MT approach based on SL[J].JournalofComputer Science&Technology,2003,18(6):848-852.
[3]高慶獅,高小宇,胡明.基于語義的機(jī)器翻譯系統(tǒng)及方法:中國,01131689.6[P].2001,12,27.
[4]胡明,高小宇,高慶獅.多語言機(jī)譯系統(tǒng)中高質(zhì)量語義單元庫形成方法[J].北京科技大學(xué)學(xué)報(bào),2008,30(6):698-703.
[5]HutchinsJThedevelopmentanduseofmachinetranslationsystemsand computer-based translation tools[C]//Proceedings of International Conference on Machine Translation&Computer Language Information Proeessing.June26-28,1999,Beijing, China.1999:1-16.
[6]王小捷,常寶寶.自然語言處理技術(shù)基礎(chǔ)[M].北京:北京郵電大學(xué)出版社,2002.
[7]俞士漢.現(xiàn)代漢語語法信息詞典[M].北京:北京大學(xué)計(jì)算語言學(xué)研究所,2000.
[8]陳群秀.信息處理用現(xiàn)代漢語語義分類詞典的設(shè)計(jì)與實(shí)現(xiàn) [M]//曹石琦.輝煌二十——中國中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議.北京:清華大學(xué)出版社,2001:148-155.
[9]馮志偉.中國語料庫研究的歷史與現(xiàn)狀[J].Journal of Chinese Language and Computing,2002,12(1):43-62.
[10]俞士漢.計(jì)算語言學(xué)的應(yīng)用研究與基礎(chǔ)研究[M]//曹石琦.輝煌二十年——中國中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議.北京:清華大學(xué)出版社,2001:54-65.
[11]周強(qiáng),詹衛(wèi)東,任海波,等.構(gòu)建大規(guī)模的漢語語塊庫[M]//黃昌寧,張普.自然語言理解與機(jī)器翻譯.北京:清華大學(xué)出版社,2001:102-115.
[12]高小宇,高慶獅,胡明,等.基于語義單元表示樹剪枝的高速多語言機(jī)器翻譯[J].軟件學(xué)報(bào),2005,16(11):1909-1919.
[13]高慶獅,李莉,劉宏嵐.基于語義單元表示樹剪枝的關(guān)鍵字過濾方法[J].北京科技大學(xué)學(xué)報(bào),2006,28(12):1191-1195.
[14]BuscaldiD,RossoP,PlaF,e al.VerbSenseDisambiguationUsing Support Vector Machines:ImpactofWordNet-ExtractedFeatures[C]//7th International ConferenceonComputationalLinguisticsand Intelligent TextProcessing,February19-25,2006,MexicoCity,Mexico.Springer,2006:192-195.
A study on English translation of English verbs in English and chinese machine translation
LI Xia
(Foreign language college,Xianyang Normal University,Xianyang 712000,China)
Machine translation is a very important and difficult task,because of its diverse forms and the use of a more flexible, is an important part of the machine translation process.In this paper,we study the verb translation in the process of machine translation,first introduce the theory of semantic language,then analyze the semantics of the verb,and then make a detailed study of the verbs in the semantic model.After summarizing the semantics,the semantic patterns of verbs can be divided into three categories,then the verb semantic pattern base is set up.Finally,a translation method based on semantics,syntax and variable is designed.
machine translation;verbs;semantic patters;semantic types;variable
TM933.4
A
1674-6236(2016)13-0013-03
2015-11-27稿件編號(hào):201511273
陜西省社會(huì)科學(xué)基金項(xiàng)目(13K045)
李 俠(1978—),女,陜西韓城人,碩士,講師。研究方向:英語教學(xué)與英語翻譯。