亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        針對(duì)專利文獻(xiàn)的韓漢機(jī)器翻譯中模板的實(shí)現(xiàn)方法

        2014-12-31 00:00:00張延花

        摘 要:本文提出一種,針對(duì)專利文獻(xiàn)的機(jī)器翻譯系統(tǒng)中,通過人工撰寫模板,提高翻譯準(zhǔn)確率的同時(shí)節(jié)省時(shí)間和人力的方法。此方法不僅僅限于韓漢翻譯系統(tǒng),也可廣泛應(yīng)用于其他語言之間的翻譯系統(tǒng)。

        關(guān)鍵詞:模板;專利文獻(xiàn)韓漢機(jī)器翻譯

        中圖分類號(hào):TP391.2

        隨著計(jì)算機(jī)科學(xué)技術(shù)、特別是自然語言處理技術(shù)的高速發(fā)展,機(jī)器翻譯技術(shù)可以利用其發(fā)展而不斷進(jìn)步,已成為未來翻譯領(lǐng)域的前沿課題以及大勢(shì)所趨。自2007年韓國專利文獻(xiàn)被納入PCT最低文獻(xiàn)量之后,世界范圍內(nèi)對(duì)韓國專利文獻(xiàn)的關(guān)注度也越顯突出。本文介紹一種能夠提高專利文獻(xiàn)韓漢機(jī)器翻譯引擎的翻譯質(zhì)量的方法,即基于模板的專利文獻(xiàn)韓漢機(jī)器翻譯研究方法。

        1 模板的翻譯引擎

        機(jī)器翻譯領(lǐng)域中,統(tǒng)計(jì)機(jī)器翻譯的基本思想即是通過對(duì)大量的平行語料進(jìn)行統(tǒng)計(jì)分析,構(gòu)建統(tǒng)計(jì)翻譯模型,進(jìn)而使用此模型進(jìn)行翻譯。但統(tǒng)計(jì)翻譯引擎需要大量的語料進(jìn)行訓(xùn)練,語料的搜集量以及準(zhǔn)確性直接影響其翻譯質(zhì)量,因此怎樣有效的搜集大量的對(duì)齊語料,并能保證語料的準(zhǔn)確性是構(gòu)建統(tǒng)計(jì)機(jī)器翻譯引擎的一個(gè)非常關(guān)鍵的因素,特別是研究人力有限的情況下,這將是一個(gè)非常龐大而長期的工程。

        基于模板的翻譯引擎可在有限研究人力的情況下,彌補(bǔ)統(tǒng)計(jì)翻譯引擎帶來的弊端。運(yùn)用專利文獻(xiàn)的語言特征,編寫相對(duì)應(yīng)的模板,針對(duì)性比較強(qiáng),模板覆蓋范圍比較廣,有效解決機(jī)器翻譯中譯文語序混亂、不符合專利敘寫規(guī)范等問題。

        2 模板的設(shè)計(jì)

        2.1 專利文獻(xiàn)的特點(diǎn)

        仔細(xì)觀察專利文獻(xiàn)的語言特征,不難看出,專利文獻(xiàn)帶有比較特殊的語法結(jié)構(gòu)。例如:

        (1)本發(fā)明提供一種由充氣式圓環(huán)形圈構(gòu)成的嬰幼兒游泳圈;

        (2)本發(fā)明涉及一種股骨頸保護(hù)裝置;

        (3)本發(fā)明涉及冶金渣處理裝置;

        這些語句都含有“本發(fā)明提供/涉及……”的句式;

        (4)根據(jù)權(quán)利要求1所述的股骨頸保護(hù)裝置,其特征在于:所述的凸緣(12)在股骨(30)與股骨頸(20)相接的表面上略呈弧曲狀;

        (5)根據(jù)權(quán)利要求4-6中任一項(xiàng)所述的方法,其特征在于,在步驟B中,所述逐點(diǎn)計(jì)算所有計(jì)算塊的運(yùn)動(dòng)矢量的步驟。

        上述(4),(5)的例句中都包含“根據(jù)權(quán)利要求xx,其特征在于……”的句式?;谀0宓臋C(jī)器翻譯研究即是利用上述專利文獻(xiàn)的語言特征,人工撰寫對(duì)應(yīng)的語法模板,提高翻譯文的可讀性。

        2.2 模板設(shè)計(jì)思路

        人工撰寫模板的意義其實(shí)就在于,用計(jì)算機(jī)語言編寫人工語言的語法規(guī)則,使計(jì)算機(jī)熟悉人工語言語法。因此,模板的設(shè)計(jì)需要考慮每一句的語序安排,以及如何針對(duì)性的撰寫模板的問題。

        圖1

        如上述舉例,韓文和中文的語序存在差異,撰寫模板時(shí)應(yīng)考慮此類現(xiàn)象。

        3 模板的撰寫方法

        模板編寫是可運(yùn)用正則文法的表達(dá)式,正則文法描述的是搜索文本正文時(shí)需要匹配的一個(gè)或者多個(gè)字符串,因此可用作于將字符模式與要搜索的字符串相匹配的模板。

        表1

        []標(biāo)記括號(hào)表達(dá)式的開始和結(jié)尾。[ABC]與“ABC”或包括“ABC”的字符串匹配。

        {}標(biāo)記限定符表達(dá)式的開始和結(jié)尾。a{2,3}與“aa”和“aaa”匹配。

        +一次或多次匹配前面的字符或子表達(dá)式。zo+與“zo”和“zoo”匹配,但與“z”不匹配。

        假如有“abc/ef/g/hi”這么一段自然語言語句,對(duì)應(yīng)的目標(biāo)語言為“ABC/HI/EF/G”的語序,那么運(yùn)用上述符號(hào),可編寫以下模板的表達(dá)式:

        (0){abc}+(1){ef}+(2){g}+(3){hi}==>(0){ABC}+(1){HI}+(2){EF}+(3){G}

        圖2

        3.1 源語言表達(dá)方式

        由于源語言是韓文,因此規(guī)定源語言的參數(shù)都以“K”為開頭,這樣的設(shè)置,方便了今后其他語言之間的機(jī)器翻譯系統(tǒng)的開發(fā)。

        TEM[max]:無限變量,可以是一個(gè)字符,也可以是一個(gè)詞組,或者一段語句,語句可以帶任何標(biāo)點(diǎn)符號(hào)。

        KRN:韓文詞匯,也可以是詞組,復(fù)合詞等。

        KRN_M:韓文短語,包括助詞和謂語的組合,或者主語和助詞的組合。

        KYM:韓文符號(hào),一般指逗號(hào)或者分號(hào)。

        KNU:韓文序列號(hào),專利文中常見的序列號(hào),如第一,第二,或者權(quán)利要求1,權(quán)利要求2,圖1,圖2等。

        3.2 目標(biāo)語言表達(dá)方式

        同樣的,目標(biāo)語言為中文,因此目標(biāo)語言參數(shù)部分都以“C”為開頭。

        TEM[max]:無限變量,與上述韓文中的符號(hào)一樣,沒有長度限制。

        CRN:中文詞匯,也可以是詞組,復(fù)合詞等。

        CRN_M:中文短語,包括助詞和謂語的組合,或者主語和助詞的組合。

        CYM:中文符號(hào),一般指逗號(hào)或者分號(hào)。

        CNU:中文序列號(hào)。

        模板中,“@”為促發(fā)點(diǎn),“$”作為結(jié)束點(diǎn)。

        4 模板的實(shí)現(xiàn)與效果

        4.1 模板的實(shí)現(xiàn)

        圖3

        整套翻譯系統(tǒng)是由記憶、模板、規(guī)則、統(tǒng)計(jì)相結(jié)合的方式運(yùn)行。本論文的模板的實(shí)現(xiàn)方法是其中的一環(huán),當(dāng)輸入一段韓文語句,系統(tǒng)會(huì)對(duì)其進(jìn)行分詞,之后根據(jù)記憶庫的資源,進(jìn)行記憶匹配,由于記憶匹配是100%的完整匹配,因此很多情況下,無法找到匹配的語句。之后引擎會(huì)根據(jù)模板庫的資源,進(jìn)行模板的匹配,一個(gè)語句只能匹配一個(gè)對(duì)應(yīng)的模板,通過模板的匹配可調(diào)整譯文的語序,提高譯文的可讀性。

        4.2 模板的分類

        模板可根據(jù)促發(fā)詞在語句中的位置,可分為首詞模板、尾詞模板、任意詞模板。

        (1)首詞模板。促發(fā)詞為語句中的首詞的情況下,可寫成首詞模板。大部分是摘要中出現(xiàn)此類模板。例如“本發(fā)明公開…”“根據(jù)本發(fā)明…”等。

        源語言:? 1??????????.

        目標(biāo)語言:圖1是本發(fā)明的斜視圖。

        @?

        (0){KRN_M[?]}+(1){KNU[NUM?|?]}+(2){TEM[max]}==>(0){STR[圖]}+(1){CHN[1]}+(2){STR[是]}+(3){CHN[2]}

        $;

        (2)尾詞模板。促發(fā)詞為語句中的末尾詞的情況下,可寫成尾詞模板。

        源語言:?????????????????.

        目標(biāo)語言:本發(fā)明提供可折疊的便攜式椅子。

        @????

        (0){TEM[max]}+(1){TAIL[?|?]}+(2){TEM[max]}+(3){KOR[??]}==>(0){CHN[1]}+(1){STR[提供]}+(2){CHN[2]};

        (3)任意詞模板。促發(fā)詞為語句中的任意一個(gè)位置(除了句首和句尾以外)時(shí),可寫成任意詞模板。

        源語言:????????????????????….

        目標(biāo)語言:含有鉆石切割刀片的玻璃切割裝置….

        @??(0){TEM[max]}+(1){KOR[??]LTAIL[?|?]}+(2){TEM[max]}+(3){KRN_M[??|???]}==>(0){STR[含有]}+(1){CHN[0]}+(2){STR[的]}+(3){CHN[2]}

        $

        4.3 模板的效果

        通過以上的模板的分類以及撰寫方法,實(shí)驗(yàn)組人工撰寫了100個(gè)模板,其中首詞模板為40個(gè),尾詞模板為30個(gè),任意詞模板為30個(gè),放到實(shí)驗(yàn)組自行研發(fā)的韓漢專利文獻(xiàn)機(jī)器翻譯系統(tǒng)。并隨機(jī)收取100句韓文專利文,進(jìn)行了模板的測(cè)試,得到如下結(jié)果。

        表2

        改進(jìn)程度數(shù)量

        明顯67

        一般25

        無改進(jìn)8

        專利文中,比較典型的句式大部分都得到了很好的改善,輸出的譯文比較符合專利句式,有助于了解源語言的意境。

        源語言:?????????????????????????.

        原譯文:在布發(fā)明提供和軌道因?yàn)橹杏袕S的故障棚子數(shù)。

        模板譯文:由于本發(fā)明提供軌道,因此能夠棚子廠的故障。

        參考譯文:由于本發(fā)明提供軌道,因此能夠防止機(jī)械的故障。

        5 結(jié)束語

        本文提出了利用專利文獻(xiàn)的語言特征,運(yùn)用正則文法的表達(dá)式,人工撰寫專利文獻(xiàn)韓漢機(jī)器翻譯的模板的方法。并通過撰寫100條模板樣例,抽取100個(gè)例句進(jìn)行了試驗(yàn)性的測(cè)試。通過上述的試驗(yàn)方法,可以看出人工撰寫的模板,針對(duì)性比較強(qiáng),覆蓋面相對(duì)廣,有很好的譯文句式改進(jìn)效果。但同時(shí)也出現(xiàn),添加較多的模板之后模板之間發(fā)生沖突,導(dǎo)致系統(tǒng)癱瘓,以及引擎選擇模板時(shí),混淆類似的模板,導(dǎo)致匹配錯(cuò)模板的問題。此類問題今后需要改進(jìn)和升級(jí)系統(tǒng)來解決。

        參考文獻(xiàn):

        [1]馮志偉.基于語料庫的機(jī)器翻譯系統(tǒng)[J].術(shù)語標(biāo)準(zhǔn)化與信息技術(shù),2010(01).

        [2]張冬梅,劉小蝶,晉耀紅.基于模板的漢英專利機(jī)器翻譯研究[J].計(jì)算機(jī)應(yīng)用研究,2013(07).

        [3]蔡舒,呂雅娟,劉群.人工書寫機(jī)器翻譯模板在統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中的應(yīng)用[A].第五屆全國機(jī)器翻譯研討會(huì)論文集[C],2009.

        作者簡(jiǎn)介:張延花(1981-),女,朝鮮族,吉林人,碩士,實(shí)習(xí)研究員,研究方向:語言學(xué),機(jī)器翻譯。

        作者單位:中國專利信息中心,北京 100088

        亚洲毛片αv无线播放一区| 欧美成人www在线观看| 亚洲愉拍99热成人精品热久久| 国产精品成人国产乱| 一本大道久久精品 东京热 | 又大又粗又爽18禁免费看| 无码精品黑人一区二区三区| 无码超乳爆乳中文字幕| 亚洲国产av午夜福利精品一区| 日韩精品人妻系列中文字幕| 夜夜高潮夜夜爽国产伦精品| 日本免费一区二区三区| 亚洲VA中文字幕欧美VA丝袜| 亚洲精品尤物av在线网站| 久久精品国产亚洲av一般男女| 一本无码中文字幕在线观| 国产绳艺sm调教室论坛| 无码电影在线观看一区二区三区| 日本av一区二区播放| 99青青草视频在线观看| 日本一区二区三区爆乳| 男人j进女人j啪啪无遮挡| 美女一级毛片免费观看97| 高清亚洲精品一区二区三区| 两人前一后地插着她丰满| 国产精品9999久久久久仙踪林| 大地资源在线播放观看mv| 无码AV午夜福利一区| 国产又大大紧一区二区三区| 亚洲成熟女人毛毛耸耸多| 亚洲狠狠婷婷综合久久久久图片 | 亚洲国产av一区二区不卡| 国产精品毛片一区二区三区| 老鸭窝视频在线观看| 国产高清一区二区三区视频 | 国产av一级黄一区二区三区| 综合色区亚洲熟妇另类| 精品无码国产污污污免费网站| 国产伪娘人妖在线观看| 极品美女调教喷水网站| 亚洲国产精品无码久久|