亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        不同語(yǔ)義認(rèn)知視角下交互式智能翻譯方法研究

        2021-04-16 01:17:22何春燕
        宿州學(xué)院學(xué)報(bào) 2021年1期
        關(guān)鍵詞:短語(yǔ)語(yǔ)義語(yǔ)法

        何春燕

        甘肅醫(yī)學(xué)院外語(yǔ)教研室,甘肅平?jīng)?744000

        交互智能翻譯的技術(shù)難度主要是由于語(yǔ)序不一致和虛詞類(lèi)型過(guò)多等原因所致,在句子翻譯過(guò)程中主要依賴(lài)虛詞的來(lái)源、時(shí)間和狀態(tài)等因素,從而增加了交互智能翻譯的難度[1]。交互式智能翻譯的研究對(duì)象是語(yǔ)言的生成問(wèn)題,理解句意是語(yǔ)言生成的前提,通過(guò)對(duì)句法的深入分析和理解,可以提高翻譯的準(zhǔn)確性[2]。

        文獻(xiàn)[3]提出基于雙語(yǔ)短語(yǔ)約束的交互式機(jī)器翻譯方法,交互式機(jī)器翻譯是通過(guò)機(jī)器翻譯系統(tǒng)與譯員之間的交互作用來(lái)引導(dǎo)計(jì)算機(jī)解碼的一種技術(shù)。目前主流的翻譯方法是用解釋器確定的前綴作為引導(dǎo)解碼的唯一標(biāo)準(zhǔn),但交互作用有限,交互效率較低。采用短語(yǔ)表的多樣性排序算法,提升候選短語(yǔ)的多樣性,雙語(yǔ)短語(yǔ)和前綴一起約束解碼過(guò)程進(jìn)行解碼,可減少翻譯時(shí)間。文獻(xiàn)[4]提出基于Transfer和Triangulation融合的中介語(yǔ)統(tǒng)計(jì)機(jī)器翻譯方法,這是一種以英語(yǔ)為介質(zhì)語(yǔ)言的德—漢翻譯方法,將Transfer方法與Triangulation方法的優(yōu)勢(shì)相融合,形成新的翻譯方法,采用解碼中介短語(yǔ)改善短語(yǔ)表,提升翻譯性能。在基于中介語(yǔ)的翻譯過(guò)程中,通過(guò)對(duì)中介語(yǔ)短語(yǔ)進(jìn)行解碼,結(jié)合傳統(tǒng)中介語(yǔ)翻譯方法及其特點(diǎn),可以改善短語(yǔ)翻譯方法。文獻(xiàn)[5]提出基于實(shí)例相似度檢測(cè)的蒙漢機(jī)器翻譯方法,提出了一種基于詞匯的多樣性排序算法來(lái)改進(jìn)短語(yǔ)的候選詞,根據(jù)譯者的翻譯認(rèn)知過(guò)程設(shè)計(jì)交互界面,提高翻譯過(guò)程中的用戶(hù)體驗(yàn)。在翻譯算法方面,利用雙語(yǔ)短語(yǔ)和前綴作為約束,引導(dǎo)源語(yǔ)言短語(yǔ)的解碼,提高翻譯假設(shè)評(píng)估和過(guò)濾的準(zhǔn)確性。

        盡管以上研究取得了相應(yīng)的研究成果,但由于不適合不同的語(yǔ)義認(rèn)知角度的智能翻譯,而且在翻譯過(guò)程中準(zhǔn)確率較低,因此本研究提出不同語(yǔ)義認(rèn)知視角下交互式智能翻譯方法。以英漢翻譯為例,把語(yǔ)義單元理解和語(yǔ)義單元合成的句義理解結(jié)合起來(lái),即一個(gè)語(yǔ)義單元存在于一個(gè)系統(tǒng)中,系統(tǒng)和被理解的對(duì)象形成了一種對(duì)應(yīng)關(guān)系,表示這個(gè)系統(tǒng)理解這個(gè)語(yǔ)義單元,理解一個(gè)句子中所有的語(yǔ)義單元就表示這個(gè)系統(tǒng)理解這個(gè)句義,并且這個(gè)系統(tǒng)還能理解整個(gè)句子中所有的語(yǔ)義單元之間的相互代入關(guān)系?;诓煌Z(yǔ)義構(gòu)建翻譯模型,計(jì)算短語(yǔ)相似度,完成交互式智能翻譯方法。人們?yōu)g覽不同語(yǔ)言資料時(shí),可通過(guò)交互式智能翻譯方法實(shí)現(xiàn)實(shí)時(shí)翻譯,為以不同語(yǔ)言為母語(yǔ)的人們提供交流便利。

        1 不同語(yǔ)義認(rèn)知視角下的翻譯方法

        根據(jù)語(yǔ)義信息的機(jī)器翻譯特征,構(gòu)建語(yǔ)義語(yǔ)法樹(shù),實(shí)現(xiàn)交互式智能翻譯[6],具體步驟如下:

        步驟1:根據(jù)語(yǔ)義信息列舉語(yǔ)義單元;

        步驟2:基于語(yǔ)義語(yǔ)法樹(shù)獲取語(yǔ)義語(yǔ)法模式;

        步驟3:詞語(yǔ)對(duì)齊;

        步驟4:計(jì)算翻譯模型處理后的單詞翻譯概率,采用詞匯化加權(quán)公式計(jì)算該翻譯概率,獲取短語(yǔ)相似度,并作為新特征[7];

        步驟5:將新特征加入解碼器,輸出翻譯結(jié)果;圖1為不同語(yǔ)義認(rèn)知視角下的翻譯技術(shù)路線(xiàn)圖。

        圖1 不同語(yǔ)義認(rèn)知視角下的翻譯技術(shù)路線(xiàn)圖

        如圖1所示,列舉語(yǔ)義單元、獲取語(yǔ)義語(yǔ)法模式和詞語(yǔ)對(duì)齊在翻譯模型中占有重要地位。不同語(yǔ)義認(rèn)知視角下的交互智能翻譯問(wèn)題可以借鑒翻譯技術(shù)路線(xiàn)來(lái)實(shí)現(xiàn)[8]。

        1.1 列舉語(yǔ)義單元

        不同語(yǔ)言里的字與詞之間并非存在明顯的對(duì)應(yīng)關(guān)系,在不同語(yǔ)言里均有表述一致語(yǔ)義的句子,表示不同語(yǔ)言能夠互相翻譯[9]。每種語(yǔ)言的語(yǔ)義單元合成對(duì)應(yīng)語(yǔ)言的句子,字、詞、詞組與變量構(gòu)成語(yǔ)義單元。

        首先,分別從文本編碼器和圖像編碼器學(xué)習(xí)獨(dú)立的上下文向量的基礎(chǔ)上,列出語(yǔ)義單元需要考慮的文本和圖像[10];其次,在為文本和圖像學(xué)習(xí)共享空間時(shí),要約束句子,使它們更接近共享空間中句子的意義,即語(yǔ)義一致。最終建立語(yǔ)義單元,并用語(yǔ)義單元表示概念,具體表示為:

        設(shè)置K種語(yǔ)言組成的語(yǔ)言合集Q={I-不同語(yǔ)言|I=1,2,…,G},式中,G=1。語(yǔ)言包括:漢語(yǔ)與英語(yǔ)等。其中,I-不同語(yǔ)言的一個(gè)句子的語(yǔ)義為句義(CC),I-不同語(yǔ)言∈Q。

        句義表示(PICC)是在每個(gè)I-不同語(yǔ)言中句義一致的句子,即該句義在每個(gè)I-不同語(yǔ)言中的句義。

        語(yǔ)義單元CV是在每個(gè)I-不同語(yǔ)言中表示意思一致的單元,(PICV)為在每個(gè)I-不同語(yǔ)言中的語(yǔ)義單元表示。

        句義(CC)即語(yǔ)義單元(CV)。(PICV)為I-不同語(yǔ)言中的語(yǔ)義單元表示,同時(shí)是I-不同語(yǔ)言中的句子。

        舉例說(shuō)明:“王女士是營(yíng)養(yǎng)師”的四個(gè)語(yǔ)義單元如表1所示,與其相應(yīng)的四個(gè)語(yǔ)義單元寫(xiě)法如表2所示。

        表1 語(yǔ)義單元表

        表2 語(yǔ)義單元寫(xiě)法

        1.2 語(yǔ)義語(yǔ)法模式

        1.2.1 語(yǔ)義語(yǔ)法樹(shù)

        語(yǔ)義語(yǔ)法樹(shù)表示不同概念之間的語(yǔ)義語(yǔ)法層次結(jié)構(gòu)。特指語(yǔ)義語(yǔ)法分類(lèi)總稱(chēng)為根節(jié)點(diǎn)S,即樹(shù)的頂端;語(yǔ)法分類(lèi)名為枝節(jié)點(diǎn),即第二層節(jié)點(diǎn)[11];語(yǔ)義分類(lèi)名為第三層以下節(jié)點(diǎn)。將產(chǎn)生大量的單語(yǔ)義語(yǔ)法內(nèi)容,如配有文字說(shuō)明的圖片等。圖像描述生成模型對(duì)輸入圖像進(jìn)行自然語(yǔ)言描述,并對(duì)其進(jìn)行標(biāo)注,使圖像與語(yǔ)言相關(guān)聯(lián),即此種模式為語(yǔ)義語(yǔ)法樹(shù)的表現(xiàn)形式。

        根據(jù)同義詞詞林,綜合考慮其余語(yǔ)義概念層次結(jié)構(gòu)設(shè)置語(yǔ)義類(lèi)別名稱(chēng)。圖2、圖3分別是部分英語(yǔ)與漢語(yǔ)語(yǔ)義語(yǔ)法樹(shù)。

        圖2 英語(yǔ)語(yǔ)義語(yǔ)法樹(shù)

        圖3 漢語(yǔ)語(yǔ)義語(yǔ)法樹(shù)

        圖2與圖3中,路徑中也許存在其他節(jié)點(diǎn),用虛線(xiàn)代表。不同類(lèi)型的詞語(yǔ)語(yǔ)義語(yǔ)法表現(xiàn)形式不同,英語(yǔ)語(yǔ)義語(yǔ)法樹(shù)和漢語(yǔ)語(yǔ)義語(yǔ)法樹(shù)也有所不同。

        1.2.2 獲取語(yǔ)義語(yǔ)法模式

        需要解釋的詞為B,語(yǔ)義語(yǔ)法模式T部從存在B的句子(短語(yǔ))的相同部分獲取,語(yǔ)義語(yǔ)法模式V部從一個(gè)句子(短語(yǔ))的不同部分獲取。最后的s,d變量名為Gen(s,d),s到d的最短路徑為Genscore(s,d),詞、詞語(yǔ)與變量名均可用s,d表示。

        設(shè)定Genscore(s,ε)或Genscore(ε,d)=2,空字符為ε。則有

        Genscore(s1…sn,d1…dn)=Genscore(s1,d1)+…+Genscore(sn,dn)

        語(yǔ)義語(yǔ)法模式的算法:

        (1)初始化S1S2S3…SN-1SNSN+1單詞,按照從左至右順序形成的英語(yǔ)句子,與其相應(yīng)的E1E2E3…EM-1EMEM+1漢字按照從左至右順序形成的漢語(yǔ)句子;

        (2)英語(yǔ)與漢語(yǔ)語(yǔ)義語(yǔ)法模式T部從句子的相同部分獲??;英語(yǔ)與漢語(yǔ)語(yǔ)義語(yǔ)法模式L部從句子的不同部分獲取;

        (3)如果s,d為姐妹,Gen(s,d)是s,d的父節(jié)點(diǎn),或者Gen(s,d)是s的父節(jié)點(diǎn),Gen(s,d)也是d的父節(jié)點(diǎn),將最后結(jié)果輸出;

        (4)如果不同部分并非兩個(gè)單個(gè)詞s,d,為不同部分詞語(yǔ)(s1…sn,d1…dm)分配指定搭配集;

        (5)計(jì)算詞語(yǔ)長(zhǎng)度,其中各個(gè)指定搭配集長(zhǎng)度以一個(gè)詞的長(zhǎng)度計(jì)算;

        (6)Gen(s1…sn,d1…dm)=Gen(s1,d1)…Gen(sn,dm),再按照(3)的過(guò)程獲取Gen(s1,d1)…Gen(sn,dm)的結(jié)果。

        (7)如果計(jì)算長(zhǎng)度不同,通過(guò)搭配空字符與詞語(yǔ)(指定搭配集)形成Gen(s1…sn,d1…dm)的更多可能性;

        (8)計(jì)算全部可能性Genscore(s1…sn,d1…dm);

        (9)Gen(s1…sn,d1…dm)的最后結(jié)果是Genscore的最小情況,再按照(3)的過(guò)程獲取Gen(s1,d1),…,Gen(sn,dm)的結(jié)果。

        以“我是陌生的面孔=I am a strange face”與“他是陌生的面孔=He is a strange face”作為兩句翻譯實(shí)例,按照語(yǔ)義語(yǔ)法模式的算法,得出語(yǔ)義語(yǔ)法模式T部是從兩個(gè)句子中存在face的相同部分獲取,語(yǔ)義語(yǔ)法模式L部從兩個(gè)句子中的不同部分獲取。兩個(gè)英語(yǔ)句子的不同部分為(I,He),兩個(gè)漢語(yǔ)句子的不同部分為(我,他),剩下部分則為兩個(gè)句子的相同部分,保留相同部分,利用語(yǔ)義語(yǔ)法樹(shù)將不同部分更改成語(yǔ)義語(yǔ)法變量名,即N{pronoun}be*a strange face=N{代表}陌生的面孔,If N{pronoun}=N{代表}I=我、he=他。

        1.3 詞語(yǔ)對(duì)齊

        伯克利對(duì)準(zhǔn)器可用于機(jī)器翻譯工具[12]。在翻譯之前,伯克利首先訓(xùn)練英語(yǔ)和漢語(yǔ)的平行語(yǔ)料,然后再進(jìn)行翻譯。以英語(yǔ)詞為標(biāo)準(zhǔn),使?jié)h語(yǔ)詞與英語(yǔ)詞對(duì)齊,出現(xiàn)英語(yǔ)詞時(shí)都會(huì)出現(xiàn)相應(yīng)的漢語(yǔ)翻譯[13-14]。然后,根據(jù)源語(yǔ)言和目標(biāo)語(yǔ)言、短語(yǔ)和句子之間的關(guān)系顯式,優(yōu)化評(píng)價(jià)兩個(gè)句子的語(yǔ)義一致性,正式地把翻譯任務(wù)轉(zhuǎn)化為強(qiáng)化學(xué)習(xí)問(wèn)題。

        作為空白處,同一語(yǔ)料里一個(gè)英語(yǔ)詞的兩種漢語(yǔ)對(duì)比形式通過(guò)最大似然概率獲取,使各個(gè)漢語(yǔ)詞均精準(zhǔn)出現(xiàn)在英語(yǔ)詞后[15]。

        1.4 短語(yǔ)翻譯相似度

        1.4.1 獲取單詞翻譯概率

        目標(biāo)語(yǔ)言端的語(yǔ)義k近鄰詞是通過(guò)雙語(yǔ)語(yǔ)義向量映射辦法將翻譯模型處理后的單詞映射到目標(biāo)語(yǔ)言端獲取。以語(yǔ)義k近鄰詞為基準(zhǔn),計(jì)算翻譯模型翻譯后的單詞和標(biāo)準(zhǔn)語(yǔ)言單詞翻譯概率,公式如下:

        (1)

        (2)

        式中,y(h|f)表示翻譯模型處理后的單詞與目標(biāo)語(yǔ)言端單詞間的翻譯概率;h′表示在目標(biāo)語(yǔ)言端中單詞f的映射向量;O(h′)表示在目標(biāo)語(yǔ)言端中單詞f的語(yǔ)義k近鄰詞集合;sim(h|hk)表示語(yǔ)義k近鄰詞hk與單詞h的語(yǔ)義相似度,通過(guò)歸一化向量余弦相似度得出語(yǔ)義相似度;x(hk|f)表示單詞f和目標(biāo)語(yǔ)言端語(yǔ)義k近鄰詞hk間的互譯度,通過(guò)softmax函數(shù)歸一化處理映射向量與k近鄰詞向量的語(yǔ)義相似度獲取互譯度。

        1.4.2 短語(yǔ)翻譯相似度計(jì)算

        短語(yǔ)翻譯相似度依據(jù)短語(yǔ)的詞匯化加權(quán)公式進(jìn)行計(jì)算。依據(jù)單詞翻譯概率,采用詞匯化加權(quán)公式計(jì)算得到正反向短語(yǔ)翻譯相似度,將正反向的短語(yǔ)翻譯相似度當(dāng)作新特征加入解碼器,輸出翻譯結(jié)果。計(jì)算正向短語(yǔ)翻譯相似度公式如下:

        (3)

        式中,f表示翻譯模型翻譯后的短語(yǔ),h表示標(biāo)準(zhǔn)語(yǔ)言短語(yǔ),a表示詞對(duì)齊,len(f)表示f短語(yǔ)的長(zhǎng)度,x(hj|fi)表示hj與fi的正向翻譯概率。

        同理,計(jì)算反向短語(yǔ)翻譯相似度的公式如下:

        (4)

        式中,len(h)表示短語(yǔ)的長(zhǎng)度,x(fi|hj)表示fi與hj的反向翻譯概率。

        2 實(shí)驗(yàn)分析

        選取新聞?lì)I(lǐng)域的600句英語(yǔ)材料為實(shí)驗(yàn)對(duì)象,找出600句英語(yǔ)材料中的有關(guān)人體單詞的基本信息,如表3所示。

        表3 有關(guān)人體詞的基本信息

        根據(jù)四種不同情況測(cè)試本文方法翻譯英文的準(zhǔn)確率與召回率,四種情況分別如下:

        第一種:成功輸出翻譯結(jié)果且翻譯準(zhǔn)確,與原本漢語(yǔ)譯文一致;

        第二種:成功輸出翻譯結(jié)果,與原本漢語(yǔ)譯文不同,但意思一致,屬于準(zhǔn)確翻譯;

        第三種:成功輸出翻譯結(jié)果,翻譯錯(cuò)誤;

        第四種:翻譯失敗表示沒(méi)有輸出翻譯結(jié)果。

        準(zhǔn)確率P的計(jì)算公式如下:

        (5)

        召回率R的計(jì)算公式如下:

        (6)

        本文方法準(zhǔn)確率與召回率的測(cè)試結(jié)果見(jiàn)表4。

        表4 本文方法英譯漢的準(zhǔn)確率與召回率的測(cè)試結(jié)果

        (續(xù)表)

        根據(jù)表4可知,本文方法英譯漢的平均準(zhǔn)確率為97.9%,平均召回率為96.4%。實(shí)驗(yàn)證明:本文方法能夠有效翻譯目標(biāo)單詞,且準(zhǔn)確率高。

        采用本文方法與基于雙語(yǔ)短語(yǔ)約束的交互式機(jī)器翻譯方法(文獻(xiàn)[3]方法)、基于Transfer和Triangulation融合的中介語(yǔ)統(tǒng)計(jì)機(jī)器翻譯方法(文獻(xiàn)[4]方法)對(duì)所選取新聞?lì)I(lǐng)域的600句英語(yǔ)句子進(jìn)行翻譯,分別統(tǒng)計(jì)句中小于等于20詞與大于20詞的情況下正確翻譯句子的數(shù)量,表5為三種方法的測(cè)試結(jié)果。

        表5 三種方法的翻譯正確數(shù)量統(tǒng)計(jì)結(jié)果

        由表5發(fā)現(xiàn),本文方法翻譯正確的句子數(shù)量高于其余兩種方法。在對(duì)準(zhǔn)器小于等于20詞的句子中,本文方法翻譯正確率為96%,其余兩種方法的翻譯正確率分別為82%與79%,在對(duì)準(zhǔn)器大于20詞的句子中,本文方法翻譯正確率為98%,其余兩種方法的翻譯正確率分別為83%與81%。實(shí)驗(yàn)證明:本文方法在翻譯句子時(shí)的準(zhǔn)確率更高,可為交互式智能翻譯提供重要參考。

        3 結(jié) 語(yǔ)

        本文從語(yǔ)義認(rèn)知的角度探討了不同語(yǔ)義認(rèn)知視角下交互式智能翻譯方法,分析了翻譯中需要翻譯的句義信息,提高了翻譯的準(zhǔn)確性。實(shí)驗(yàn)結(jié)果表明,該方法有效可行,翻譯準(zhǔn)確率高于其他兩種對(duì)比方法。

        鑒于今后的研究方向,單語(yǔ)料的發(fā)展規(guī)律可進(jìn)一步加以探討。在當(dāng)前普遍采用的單語(yǔ)料開(kāi)發(fā)方法中,訓(xùn)練成本和時(shí)間成本較大,如何更有效、快速地開(kāi)發(fā)使用單語(yǔ)料是值得深入研究的問(wèn)題。

        猜你喜歡
        短語(yǔ)語(yǔ)義語(yǔ)法
        語(yǔ)言與語(yǔ)義
        跟蹤導(dǎo)練(二)4
        KEYS
        Keys
        Book 5 Unit 1~Unit 3語(yǔ)法鞏固練習(xí)
        “上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
        認(rèn)知范疇模糊與語(yǔ)義模糊
        語(yǔ)義分析與漢俄副名組合
        日韩人妻高清福利视频| 永久免费av无码网站yy| 亚洲精品老司机在线观看| 麻豆国产成人AV网| 91精品国产高清久久福利| 国产精品美女一区二区视频 | 国产av一区二区三区日韩 | 色94色欧美sute亚洲线路二| 无码成年性午夜免费网站蜜蜂| 中文乱码字幕在线亚洲av| 日本少妇浓毛bbwbbwbbw| 免费做爰猛烈吃奶摸视频在线观看| АⅤ天堂中文在线网| 韩国一区二区三区黄色录像| 玩弄放荡人妇系列av在线网站| 日日干夜夜操高清视频| 亚洲日韩精品AⅤ片无码富二代| 久久热免费最新精品视频网站| 大屁股人妻女教师撅着屁股| 亚洲AV日韩AV永久无码电影| 青青手机在线视频观看| 精品人妻一区二区三区在线观看 | 午夜秒播久久精品麻豆| 国产精品v欧美精品v日韩精品 | 亚洲熟女一区二区三区250p| 亚洲中文字幕成人无码| 免费超爽大片黄| 国产视频一区二区三区在线看| 久久人人爽人人爽人人片av高请| 97久久香蕉国产线看观看| 成人午夜免费福利| av免费网站免费久久网| 色噜噜久久综合伊人一本| 北条麻妃在线视频观看| 最近中文字幕一区二区三区| 亚洲av福利天堂一区二区三 | 偷拍一区二区视频播放器| 国产特级毛片aaaaaa高清| 92精品国产自产在线观看48页| 日韩五码一区二区三区地址| 亚洲精品久久久www小说|