亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于交互式機(jī)器翻譯的譯文查詢行文預(yù)測(cè)技術(shù)

        2017-11-16 09:28:10楊倩倩秦旭明
        電子科技 2017年11期
        關(guān)鍵詞:語(yǔ)義模型

        楊倩倩,秦旭明

        (惠州工程職業(yè)學(xué)院,廣東 惠州 5610000)

        基于交互式機(jī)器翻譯的譯文查詢行文預(yù)測(cè)技術(shù)

        楊倩倩,秦旭明

        (惠州工程職業(yè)學(xué)院,廣東 惠州 5610000)

        隨著信息交流的密切,人工翻譯工作量大,且收益較低,矛盾凸顯。文中基于此背景以交互式機(jī)器翻譯技術(shù)(IMT)為核心,針對(duì)各類(lèi)用戶翻譯過(guò)程中查詢調(diào)用行為出現(xiàn)的頻繁鼠標(biāo)、鍵盤(pán)切換問(wèn)題,提出了一種交互機(jī)器替代的智能預(yù)測(cè)模型。此預(yù)測(cè)模型采用翻譯條件選擇機(jī)制,搭配對(duì)齊模型、翻譯模型、語(yǔ)言模型等進(jìn)行全面語(yǔ)義分析,在較大程度上保證了查詞行為預(yù)測(cè)的可行性。經(jīng)過(guò)測(cè)試,在人工雙語(yǔ)對(duì)齊類(lèi)語(yǔ)料中,預(yù)測(cè)準(zhǔn)確性達(dá)64.99%,尤其在各類(lèi)語(yǔ)義明確的名詞類(lèi)句段預(yù)測(cè)時(shí),精確度可達(dá)72.28%。基于此種執(zhí)行效率,機(jī)器交互翻譯系統(tǒng)雖無(wú)法完全替代人工翻譯過(guò)程,但可大幅減少重復(fù)、底層的勞動(dòng)行為,使人從機(jī)械的操作中解放出來(lái)。在改善用戶交互翻譯體驗(yàn)的同時(shí),大幅提升工作效率。

        交互機(jī)器翻譯;對(duì)齊模型;語(yǔ)言模型;翻譯預(yù)測(cè)

        近年來(lái),由于大規(guī)模語(yǔ)料翻譯需求的擴(kuò)大,使得機(jī)器翻譯的研究和應(yīng)用得以快速發(fā)展,機(jī)譯速度不斷提升。然而,無(wú)論基于哪種翻譯規(guī)則的機(jī)譯系統(tǒng)均無(wú)法有效地解決模糊性語(yǔ)義和多重語(yǔ)境下,復(fù)雜語(yǔ)段的精準(zhǔn)表達(dá)問(wèn)題。導(dǎo)致機(jī)器翻譯質(zhì)量低下,無(wú)法滿足人們研究和學(xué)習(xí)的要求。針對(duì)這種情況,國(guó)內(nèi)外眾多研究機(jī)構(gòu)陸續(xù)開(kāi)始深入研究機(jī)器翻譯系統(tǒng)的改良與優(yōu)化。

        在此背景下,Kay最早提出了交互式機(jī)器翻譯系統(tǒng),由用戶自己負(fù)責(zé)復(fù)雜類(lèi)語(yǔ)段的內(nèi)容定義,消除歧義,并確定語(yǔ)義走向[1-3]。隨后由機(jī)器規(guī)則系統(tǒng)對(duì)照用戶所提供的內(nèi)容進(jìn)行原文翻譯,這樣的工作方式使翻譯質(zhì)量得到較大提升,也使得翻譯的自由度和使用范圍更廣。但該種工作方式只在某些特定的翻譯應(yīng)用中具備優(yōu)勢(shì),而在大部分常規(guī)翻譯需求中,譯文質(zhì)量參差不齊,無(wú)法保持一定水準(zhǔn)的翻譯精度。另外,消除語(yǔ)法歧義的工作對(duì)于翻譯用戶而言難度較高,尤其對(duì)陌生語(yǔ)種,缺乏實(shí)踐操作的可行性[4-8]。

        隨后,研究逐漸從人機(jī)交互過(guò)程轉(zhuǎn)移到了譯文后編輯處理中來(lái),期望通過(guò)人機(jī)整合來(lái)實(shí)現(xiàn)效率和質(zhì)量的提升。雖國(guó)內(nèi)外眾多翻譯交互系統(tǒng)為此提出了多種解決方案,如快捷鍵操作、切換設(shè)定等,卻均不夠完善[9-12]。因此,本文基于譯文和原意的對(duì)齊關(guān)系,嘗試進(jìn)行查詢操作的預(yù)測(cè)行為分析,在輸入檢測(cè)過(guò)程中預(yù)測(cè)可能出現(xiàn)的翻譯結(jié)果,減少大量的人工對(duì)比與切換行為,實(shí)現(xiàn)高質(zhì)、省時(shí)的文獻(xiàn)翻譯。

        1 預(yù)測(cè)模型組建

        文獻(xiàn)翻譯過(guò)程中,用戶為保證翻譯質(zhì)量,經(jīng)常要對(duì)單詞進(jìn)行譯文釋義對(duì)照查詢,工作量大。若是對(duì)整個(gè)翻譯過(guò)程建立模型,可將實(shí)現(xiàn)交互的抽象過(guò)程分化由大量的源語(yǔ)片段S=s1,s2,s3…sn,以及與之對(duì)應(yīng)的一組中間參考語(yǔ)段T=t1,t2,t3…tn構(gòu)成[13-14]。規(guī)定當(dāng)前所處翻譯位置為i,則理論上翻譯選擇概率為p(sj|i,T)。因此,對(duì)于原文語(yǔ)段的翻譯可轉(zhuǎn)化為對(duì)概率P值最大的最優(yōu)化解答。

        可由式(1)表示最大概率值。

        sj=argsjmax(sj|iT)

        (1)

        若假設(shè)每一種語(yǔ)義出現(xiàn)概率相等,可由貝葉斯公式推得式(2)

        sj=argsjmaxp(sj|i,T)=
        argsjmaxP(T|i,sj)p(i|sj)p(sj)=
        argsjmaxP(T|i,sj)p(i|sj)
        ln(sj)=argsjmax(lnp(T|i,sj)+lnp(i|sj))

        (2)

        考慮到上式各乘積項(xiàng)對(duì)結(jié)果ln(sj)的影響不同,可進(jìn)行加權(quán)(w)運(yùn)算,得

        ln(sj)=argsjmax(w×lnp(T|i,sj)+(1-w)lnp(i|sj))

        (3)

        以上為預(yù)測(cè)概率模型的建立。通過(guò)原語(yǔ)單詞sj、中間譯文T關(guān)系和目標(biāo)語(yǔ)義的對(duì)齊概率求得最優(yōu)解,即最佳翻譯。然而,上述模型只分抽象出單一語(yǔ)段與其對(duì)應(yīng)中間譯文的相關(guān)概率,無(wú)法在實(shí)際復(fù)雜語(yǔ)義環(huán)境中使用,還需進(jìn)一步優(yōu)化。

        1.1 語(yǔ)段對(duì)齊概率模型分析

        在復(fù)雜語(yǔ)段中可能包含多個(gè)詞性相同的詞匯。因此,若要精確表述原語(yǔ)詞匯sj翻譯到位置i的翻譯概率,需要進(jìn)一步將位置參數(shù)引入概率估計(jì)條件中,即建立p(i│j,sj)概率計(jì)算。但進(jìn)行此類(lèi)位置多層疊加型翻譯計(jì)算,將會(huì)導(dǎo)致嚴(yán)重的數(shù)據(jù)系數(shù)問(wèn)題,同時(shí)模型復(fù)雜程度過(guò)高,影響計(jì)算效率。因此,文中轉(zhuǎn)而采用對(duì)齊概率模型來(lái)進(jìn)行較長(zhǎng)語(yǔ)段的概率估計(jì)。

        引入Toutanova等人提出的基于上下文詞匯關(guān)聯(lián)模型的傳統(tǒng)化對(duì)齊模型統(tǒng)計(jì)算法,求得期望最大值,并將所有特征參量(詞性、語(yǔ)義標(biāo)記、多重語(yǔ)義、抽象意及歧義)等包含在特征函數(shù)中,可得

        本文選取對(duì)案例地各特征帶有明顯情感描述的評(píng)論,共861條,采用“-5,-3,-1,1,3,5”的分值分別表示“嚴(yán)重不滿”“比較不滿”“輕度不滿”“一般滿意”“比較滿意”和“非常滿意” 6種不同情感,通過(guò)等權(quán)賦值對(duì)旅游者情感及強(qiáng)度進(jìn)行評(píng)分,計(jì)算公式為:

        (4)

        其中,Z^是歸一化常數(shù),與T參量和S參量有關(guān);λt為模型參量;ft為特征函數(shù),其內(nèi)參量由具體語(yǔ)義和句法進(jìn)行定義。

        此外,可以根據(jù)句法及翻譯需求來(lái)進(jìn)行模型模板定義。表1列出了部分特征模板所代表的元素或位置參量信息,稱為原子模板,其在概念上等同于當(dāng)前翻譯位置下的各類(lèi)特征函數(shù)。

        表1 原子特征模板范例

        需要注意的是,原子模板僅表征了特征函數(shù)的一個(gè)單一屬性,無(wú)法完整表征語(yǔ)段的具體含義。因此,在實(shí)際應(yīng)用中需要建立復(fù)合原子模板。通過(guò)模板的不同組合,將參量數(shù)值化后,得到具體的語(yǔ)義表征,即一個(gè)二值特征函數(shù)式

        (5)

        由于翻譯內(nèi)容的復(fù)雜性,單一的原子模板無(wú)法全面表征。因此,本文準(zhǔn)備了40個(gè)以上的復(fù)合模板來(lái)應(yīng)對(duì)實(shí)際語(yǔ)段內(nèi)的復(fù)雜結(jié)構(gòu)和多重釋義的選擇。

        1.2 相關(guān)概率模型計(jì)算

        (6)

        2 實(shí)驗(yàn)測(cè)試與分析

        2.1 實(shí)驗(yàn)設(shè)置

        首先,依據(jù)最大熵算法得出語(yǔ)料對(duì)齊概率模型,由式(6)得到相關(guān)概率模型。綜合兩式,取0.05等間隔下[0,1]間任意3個(gè)候選值,評(píng)分機(jī)制參考MRR(Mean Reciprocal Rank)定義如下

        其中,Sh指代候選數(shù)量;Q指代當(dāng)前譯文;Ri指代翻譯候選;n指代譯文預(yù)測(cè)的數(shù)目;Scorrect(Ri)指代正確候選的位置; RR(Ri)指代當(dāng)前位置的得分。

        2.2 實(shí)驗(yàn)結(jié)果及數(shù)據(jù)分析

        2.2.1 權(quán)值概率分析

        數(shù)據(jù)預(yù)測(cè)正確率,如圖1所示。權(quán)值[0,1],預(yù)測(cè)正確率峰值對(duì)應(yīng)w=0.15,準(zhǔn)確率達(dá)65,27%,MRR評(píng)分趨于54.23%,同步達(dá)到最大值點(diǎn)。

        圖1 預(yù)測(cè)正確率曲線和對(duì)應(yīng)MRR

        分析圖中曲線可得,當(dāng)w=0時(shí),即僅當(dāng)對(duì)齊模型存在時(shí),翻譯精確率為64.99%;當(dāng)w=1取最大值,此時(shí)只存在相關(guān)概率模型,正確率降為25.32%。當(dāng)兩種概率模型混合存在時(shí),正確率在峰值處提升了0.82個(gè)百分點(diǎn),且整體正確率會(huì)隨著相關(guān)概率模型權(quán)值的增加而降低。

        2.2.2 語(yǔ)段詞性的預(yù)測(cè)與分析

        圖2中列舉了人工翻譯對(duì)照的漢英雙語(yǔ)材料中各類(lèi)詞性語(yǔ)段占比,明顯看出名詞與動(dòng)詞占有絕大部分比重。

        圖2 語(yǔ)段中各類(lèi)詞性占比

        圖3給出了語(yǔ)料庫(kù)中各常用詞性單詞的預(yù)測(cè)正確率,從中可以看出:實(shí)詞正確率最高。而通常語(yǔ)料中名詞與動(dòng)詞占比最大。因此,基于這種語(yǔ)料查詢預(yù)測(cè)方式下翻譯質(zhì)量將得到較大提升。而實(shí)驗(yàn)結(jié)果顯示,影響實(shí)詞翻譯正確率(名詞72.28%,動(dòng)詞63.7%)的主要因素在于:其他詞性的單詞翻譯依據(jù)相關(guān)模型預(yù)測(cè),而模糊翻譯將降低翻譯準(zhǔn)確率。

        圖3 各類(lèi)詞性正確率

        3 結(jié)束語(yǔ)

        本文以文獻(xiàn)翻譯過(guò)程的詞義轉(zhuǎn)化作為研究對(duì)象,引用交互式機(jī)器翻譯方式進(jìn)行語(yǔ)段翻譯結(jié)果的可能性分析,通過(guò)建立對(duì)齊模型進(jìn)一步提升復(fù)雜語(yǔ)段翻譯的準(zhǔn)確率。與傳統(tǒng)的上下文預(yù)測(cè)方式相比,基于對(duì)齊模型和相關(guān)概率模型的預(yù)測(cè)法可有效縮小中間參量范圍,提高模型翻譯效率及預(yù)測(cè)準(zhǔn)確率。同時(shí),本文充分考慮了語(yǔ)段翻譯存在的特征選擇性,將其加入到翻譯模型產(chǎn)量中,并以Niutrains語(yǔ)料庫(kù)做了全面的實(shí)驗(yàn)分析。實(shí)驗(yàn)結(jié)果表明,名詞、動(dòng)詞性語(yǔ)段為主的語(yǔ)料翻譯質(zhì)量較高,達(dá)72.28%,其他詞性單詞的翻譯準(zhǔn)確率相對(duì)較低。據(jù)此還可進(jìn)行下一步的研究與模型改良,實(shí)現(xiàn)語(yǔ)料翻譯質(zhì)量的再提升。

        [1] Kay M.The proper place of men and machines in language translation[J].Machine Translation,1997,12(1/2):3-23.

        [2] Foster G,Isabelle P,Plamondon P.Target-text mediated interactive machine translation[J].Machine Translation,1997,12(1/2):175-194.

        [3] Simard M,Ueffing N,Isabelle P,et a1.Rule—based translation with statistical phrase—based post—editing[C].Stroudsburg:Proceedings of the 2nd Workshop on Statistical Machine Translation,Association for Computational Linguistics,2007.

        [4] Foster G,Langlais P,Lapalme G.User-friendly text pre-diction for translators[C].Stroudsburg:Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing,Association for Computational Linguistics,2002.

        [5] Koehn P,Haddow B.Interactive assistance to human translators Using statistical machine translation methods[C]. Menlo Park: Proceedings of AAAI Conference on Artificial Intelligence,2011.

        [6] Hassan S,Mihalcea R.Semantic relatedness using salient semantic analysis[C].Menlo Park:Proceedings of AAAI Conference on Artificial Intelligence,2011.

        [7] Sanchis-Trilles G,Ortiz-Martinez D,Civera J,et a1.Improving interactive machine translation via mouse actions[C].Stroudsburg:Proceedings of the Conference on Empirical Methods in Natural Language Processing,Association for Computational Linguistics,2008.

        [8] Toutanova K,Ilhan H T,Manning C D.Extensions to HMM-based statistical word alignment models [C].Stroudsburg:EMNL 2002:Proceedings of the ACL_02 Conference on Empirical Methods in Natural Language Processing,Association for Computational Linguistics,2002.

        [9] Langlais P,Lapalime G.Trans type: development-evaluation cycles to boost translator’s productivity[J]. Machine Translation,2002,17(2):77-98.

        [10] 張華.交互式機(jī)器翻譯技術(shù)研究[D].沈陽(yáng):沈陽(yáng)航空航天大學(xué),2014.

        [11] 付一韜.基于正向多約束的交互式機(jī)器翻譯技術(shù)研究[D].沈陽(yáng):沈陽(yáng)航空航天大學(xué),2016.

        [12] 程善伯.短語(yǔ)翻譯系統(tǒng)中的交互翻譯研究[D].南京:南京大學(xué),2016.

        [13] 季鐸,馬斌,葉娜.交互式機(jī)器翻譯中譯文查詢行為的預(yù)測(cè)技術(shù)[J].計(jì)算機(jī)應(yīng)用,2015,35(4):1009-1012.

        [14] 龐觀松,張黎莎,蔣盛益.跨語(yǔ)言智能學(xué)術(shù)搜索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].山東大學(xué)學(xué)報(bào):工學(xué)版,2011,41(5):63-68.

        Research on the Technology of Text Query Based on Interactive Machine Translation

        YANG Qianqian,QIN Xuming

        (Huizhou Engineering Vocational and Technical College,Huizhou 5610000,China)

        Nowadays,the exchange of information is very close,and the translation and inquiry of documents become the high frequency behavior in the process of research and study. However,the workload of manual translation is too large,and the income is low. Based on the background of interactive technology to Machine Translation (IMT) as the core,to solve the problem of frequent switching behavior of mouse and keyboard call query all kinds of users in the translation process,put forward a prediction model of intelligent interactive machine replacement. This prediction model is based on the translation condition selection mechanism,with the alignment model,the translation model and the language model. After testing,the accuracy of prediction is 64.99%,which is more than 72.28%,especially in all kinds of semantic NOUN class. Based on the efficiency of the system,the system can not completely replace the manual translation process,but it can greatly reduce duplication,the bottom of the labor behavior,so that people from the mechanical operation of the liberation. While improving the user interaction translation experience and greatly improve work efficiency.

        interactive Machine Translation; alignment model; language model; translation prediction

        TP391.7

        A

        1007-7820(2017)11-110-04

        2017- 05- 10

        楊倩倩(1983-),女,講師。研究方向:英語(yǔ)翻譯。

        10.16180/j.cnki.issn1007-7820.2017.11.030

        猜你喜歡
        語(yǔ)義模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        語(yǔ)言與語(yǔ)義
        3D打印中的模型分割與打包
        “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        認(rèn)知范疇模糊與語(yǔ)義模糊
        “深+N季”組配的認(rèn)知語(yǔ)義分析
        語(yǔ)義分析與漢俄副名組合
        国产成a人亚洲精品无码樱花| 国内精品熟女一区二区| 黄色潮片三级三级三级免费| 欧美白人战黑吊| 人妻丰满熟妇av无码片| 国产精品久久久久尤物| 久久熟女精品—区二区蜜臀| 人妻少妇被猛烈进入中文字幕| 国产真实强被迫伦姧女在线观看| 亚洲欧美日韩国产色另类| 精品人妻一区二区蜜臀av| 丰满人妻中文字幕一区三区| 久久婷婷人人澡人人爽人人爱| 久久亚洲av永久无码精品| 看黄色亚洲看黄色亚洲| 人妻少妇精品视频一区二区三| 巨大巨粗巨长 黑人长吊| 亚洲天堂在线播放| 日韩精品国产一区在线| 日本高清乱码中文字幕| 人妻精品人妻一区二区三区四区| 精品久久久久久无码中文野结衣| 97精品一区二区视频在线观看| 成人a在线观看| 久久亚洲精品成人av观看| 成人自慰女黄网站免费大全| 三男一女吃奶添下面| 蜜桃在线播放免费一区二区三区| av天堂手机在线看片资源| 国产成人小视频| 日韩精品无码久久一区二区三| 亚洲AV成人无码久久精品在| 国产偷闻女邻居av在线观看| 风情韵味人妻hd| 极品粉嫩嫩模大尺度无码| 亚洲免费一区二区三区视频| 免费av一区男人的天堂| 日本少妇春药特殊按摩3| 在线看片无码永久免费aⅴ| 亚洲一区二区三区乱码在线| 国产欧美在线观看不卡|