亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)算法的機(jī)器自動(dòng)翻譯質(zhì)量評(píng)估模型

        2021-11-10 05:27:06胡仁青
        電子設(shè)計(jì)工程 2021年21期
        關(guān)鍵詞:監(jiān)督語言質(zhì)量

        胡仁青

        (西安交通工程學(xué)院公共課部,陜西西安710300)

        目前,翻譯產(chǎn)品開發(fā)人員需要評(píng)估翻譯產(chǎn)品的機(jī)器自動(dòng)翻譯質(zhì)量,分析翻譯產(chǎn)品的使用效果;用戶需要了解哪個(gè)翻譯產(chǎn)品的機(jī)器自動(dòng)翻譯質(zhì)量?jī)?yōu)秀,以此決定自己需要使用哪個(gè)翻譯產(chǎn)品[1-2]。所以,評(píng)估機(jī)器自動(dòng)翻譯質(zhì)量具有十分顯著的意義。

        目前,所有翻譯產(chǎn)品的評(píng)估都圍繞著某個(gè)固定標(biāo)準(zhǔn)來評(píng)價(jià)產(chǎn)品的某種屬性,評(píng)價(jià)機(jī)器自動(dòng)翻譯質(zhì)量的優(yōu)劣不存在固定的評(píng)估標(biāo)準(zhǔn),所以,高精度評(píng)估機(jī)器自動(dòng)翻譯質(zhì)量存在一定難度。目前,諸多學(xué)者對(duì)評(píng)估機(jī)器自動(dòng)翻譯質(zhì)量進(jìn)行了一定研究,例如,吉奕衛(wèi)[3]為解決機(jī)器翻譯處理漢語被動(dòng)語態(tài)的問題,以谷歌翻譯和有道翻譯譯文為例,評(píng)估了漢語被動(dòng)語態(tài)的機(jī)器翻譯譯文質(zhì)量;孫逸群[4]為對(duì)翻譯軟件進(jìn)行全面評(píng)估并比較其各項(xiàng)指標(biāo)的具體差異,研究了基于問卷與數(shù)據(jù)分析的機(jī)器翻譯質(zhì)量評(píng)價(jià)方法;賀文照等人[5]以谷歌機(jī)器翻譯為例對(duì)英語關(guān)系從句機(jī)譯漢語進(jìn)行了評(píng)價(jià)。盡管以上學(xué)者對(duì)評(píng)估機(jī)器自動(dòng)翻譯質(zhì)量進(jìn)行了一定研究,但仍可以發(fā)現(xiàn),目前的部分評(píng)估機(jī)器自動(dòng)翻譯質(zhì)量方法存在精度較低的問題,為了有效解決這一問題,文中引入了BP 神經(jīng)網(wǎng)絡(luò)算法這一深度學(xué)習(xí)算法。

        深度學(xué)習(xí)算法中的BP 神經(jīng)網(wǎng)絡(luò)算法能夠以學(xué)習(xí)訓(xùn)練機(jī)器自動(dòng)化翻譯譯文中雙語詞的形式,完成對(duì)機(jī)器翻譯譯文語言向量特征的高精度提取,且能夠?qū)崿F(xiàn)機(jī)器自動(dòng)翻譯譯文語義質(zhì)量的高精度評(píng)價(jià)。為此,文中利用BP 神經(jīng)網(wǎng)絡(luò)算法構(gòu)建一種基于深度學(xué)習(xí)算法的機(jī)器自動(dòng)翻譯質(zhì)量評(píng)估模型,在特征提取、質(zhì)量評(píng)估兩個(gè)步驟中均使用深度學(xué)習(xí)算法,實(shí)現(xiàn)機(jī)器自動(dòng)翻譯后語言特征的高精度提取、譯文質(zhì)量的高精度評(píng)估。

        1 機(jī)器自動(dòng)翻譯質(zhì)量評(píng)估模型

        1.1 自動(dòng)翻譯語言信息提取

        設(shè)置機(jī)器自動(dòng)翻譯質(zhì)量為超參數(shù),并以兩種語言為例,使用基于深度學(xué)習(xí)的機(jī)器自動(dòng)翻譯語言信息提取方法,將兩類語言信息相融。在基于深度學(xué)習(xí)的機(jī)器自動(dòng)翻譯語言信息提取方法中,學(xué)習(xí)訓(xùn)練階段由無監(jiān)督學(xué)習(xí)階段與有監(jiān)督學(xué)習(xí)階段構(gòu)成。無監(jiān)督學(xué)習(xí)階段主要通過降噪自動(dòng)編碼機(jī)同時(shí)對(duì)雙語詞進(jìn)行學(xué)習(xí)訓(xùn)練,得到翻譯前后兩種自然語言的雙語語義特征。有監(jiān)督學(xué)習(xí)階段把自然語言語料的標(biāo)準(zhǔn)信息導(dǎo)進(jìn)雙語詞中,實(shí)現(xiàn)兩種自然語言的雙語語義特征微調(diào),優(yōu)化語言向量特征提取效果[6]。

        1.1.1 無監(jiān)督學(xué)習(xí)階段

        無監(jiān)督學(xué)習(xí)階段中的學(xué)習(xí)對(duì)象為需翻譯自然語言A 的訓(xùn)練語料、自然語言翻譯結(jié)果B,自然語言翻譯結(jié)果B 屬于和自然語言A 存在差異的自然語言。無監(jiān)督學(xué)習(xí)階段的學(xué)習(xí)示意圖如圖1所示。訓(xùn)練機(jī)器自動(dòng)翻譯樣例y的A 向量YE與B 向量YC,能夠獲取機(jī)器自動(dòng)翻譯樣例y中雙語對(duì)齊的樣例對(duì)(YE,YC),其表示雙語詞。使用降噪自動(dòng)編碼機(jī)對(duì)雙語詞實(shí)施無監(jiān)督學(xué)習(xí),重構(gòu)獲取樣例y中的A 向量、B 向量。針對(duì)樣例y中的B 向量而言,需要重構(gòu)此樣例的自然語言A 向量、自然語言B 向量,獲取機(jī)器自動(dòng)翻譯樣例中的語言向量特征[7-9]。

        圖1 無監(jiān)督學(xué)習(xí)階段的學(xué)習(xí)示意圖

        為了優(yōu)化無監(jiān)督學(xué)習(xí)的可靠性,使用降噪自動(dòng)編碼機(jī)對(duì)雙語詞實(shí)施無監(jiān)督學(xué)習(xí),在重構(gòu)樣例y中的A 向量、B 向量之前,向樣例對(duì)(YE,YC)導(dǎo)入一定程度的噪聲。樣例對(duì)(YE,YC)導(dǎo)進(jìn)噪聲后的向量為降噪自動(dòng)編碼機(jī)作為兩種語言的編碼器,可通過sigmoid 激活函數(shù)編碼獲取自然語言A 與自然語言翻譯結(jié)果B 的隱式表達(dá)kE、kC,為:

        其中,gθ與r分別是編碼函數(shù)和sigmoid 激活函數(shù);A 與B 互相變換的翻譯矩陣參數(shù)分別為VE、VC,VE、VC是具有各自語言特征的雙語詞;因?yàn)閗E、kC的維度不存在差異,所以自然語言A 與自然語言B 的編碼器共享一種偏移值β。

        得到kE、kC后,使用降噪自動(dòng)編碼機(jī)依次對(duì)兩類語言的隱式表達(dá)進(jìn)行解碼[10-12]。針對(duì)自然語言A 的隱式表達(dá)kE而言,文中對(duì)自然語言A 與自然語言翻譯結(jié)果B 的兩種解碼器實(shí)施解碼:將kE依次解碼成自然語言A 的重構(gòu)向量與自然語言翻譯結(jié)果B 的重構(gòu)向量:

        其中,gθ′是解碼函數(shù);dE、dC為兩種自然語言的解碼器偏移量。

        隱式表達(dá)kC的解碼步驟和隱式表達(dá)kE的解碼方法不存在顯著差異,解碼kC可獲取,解碼kE可獲取。

        此類編碼、解碼的形式能夠讓一種語言的輸入向量重構(gòu)至自己原始語言的向量,也能夠?qū)⑵渲貥?gòu)成其他語言的向量[13]。但是兩種自然語言間的信息并不相同,重構(gòu)時(shí)具有重構(gòu)誤差。針對(duì)設(shè)置的輸入樣例對(duì)(YE,YC),文中將重構(gòu)誤差設(shè)成交叉熵的模式,將下述5 類重構(gòu)誤差的和設(shè)成無監(jiān)督學(xué)習(xí)階段的損失函數(shù):

        1)YE重構(gòu)成翻譯前的語言向量間誤差是p(YE)。

        2)YC重構(gòu)成原向量的誤差是p(YC)。

        3)YE重構(gòu)成翻譯前的語言向量YC的誤差是p(YE,YC)。

        4)YC重構(gòu)成翻譯前的語言向量YE的誤差是p(YC,YE)。

        5)兩種自然語言向量對(duì)(YE,YC)重構(gòu)成原始(翻譯前)向量對(duì)的誤差是損失函數(shù)O為:

        在無監(jiān)督階段中,設(shè)定無監(jiān)督學(xué)習(xí)的解碼函數(shù)為gθ′={VE,VC,dE,dC},使用梯度下降算法更新解碼函數(shù)gθ′,使損失函數(shù)O達(dá)到最小值,訓(xùn)練得到VE、VC。

        1.1.2 有監(jiān)督學(xué)習(xí)階段

        有監(jiān)督學(xué)習(xí)階段可降低自然語言重構(gòu)誤差。兩種自然語言向量對(duì)(YE,YC)在y中具有兩類語言的全部信息,所以文中將自然語言A、自然語言B 的向量對(duì)(YE,YC)使用翻譯變換矩陣(VE,VC)進(jìn)行實(shí)時(shí)編碼,獲取隱式表達(dá)kβ,kβ中存在此樣例的雙語信息。

        其中,β是編碼器的偏移值。

        通過kβ運(yùn)算樣例的正例、負(fù)例概率為:

        其中,?表示權(quán)重;Q1、Q2依次是正例、負(fù)例概率。

        通過有監(jiān)督學(xué)習(xí),能夠獲取嵌入翻譯信息的變換翻譯矩陣VE、VC,它們均有屬于語言特征的雙語詞,從而優(yōu)化自然語言向量特征提取的效果。

        1.2 基于深度學(xué)習(xí)的譯文質(zhì)量評(píng)估模型

        基于深度學(xué)習(xí)的譯文質(zhì)量評(píng)估模型由1 個(gè)可視層、3 個(gè)隱藏層、1 個(gè)回歸層構(gòu)成,可視層的輸入是1.1.1 節(jié)中獲取的VE、VC。隱藏層的節(jié)點(diǎn)數(shù)目都是100,3 個(gè)隱藏層依次描述為t1、t2、t3?;貧w層即為輸出層,節(jié)點(diǎn)數(shù)是1??梢晫优c隱藏層的聯(lián)合概率分布是:

        其中,Q(t1)、Q(t2)、Q(t3)分別是3 個(gè)隱藏層的語言變量分別滿足翻譯需求的概率。

        基于深度學(xué)習(xí)的譯文質(zhì)量評(píng)估模型的評(píng)估步驟是:

        1)在深度學(xué)習(xí)網(wǎng)絡(luò)中,從上到下實(shí)施無監(jiān)督訓(xùn)練,將各層均設(shè)成一個(gè)限制玻爾茲曼機(jī),使用貪婪學(xué)習(xí)法訓(xùn)練各層權(quán)重,從下往上分層訓(xùn)練。首層與其他層分別建模成高斯-二進(jìn)制的限制玻爾茲曼機(jī)、二進(jìn)制-二進(jìn)制的限制玻爾茲曼機(jī)[14]。在限制玻爾茲曼機(jī)中,各個(gè)可視節(jié)點(diǎn)與隱藏節(jié)點(diǎn)間不具有連接性,其條件概率分布θ1與聯(lián)合概率分布θ2為:

        式中,M()、logistic()分別是高斯密度函數(shù)與邏輯函數(shù);可視層uj的偏置是fj;t1表示隱藏層節(jié)點(diǎn)數(shù)是1;j=1,2,3;ε表示標(biāo)準(zhǔn)差。

        2)有監(jiān)督的微調(diào)。輸出層按照所輸入的具有各自語言特征的有監(jiān)督雙語詞VE、VC實(shí)行整體微調(diào)。

        3)回歸。通過無監(jiān)督訓(xùn)練與有監(jiān)督學(xué)習(xí)能夠獲取每層的權(quán)值與偏置,構(gòu)建輸出譯文特征的回歸模型,使用該模型對(duì)機(jī)器自動(dòng)翻譯指令實(shí)施評(píng)估[15]。模型為:

        其中,Ω為機(jī)器自動(dòng)翻譯質(zhì)量評(píng)估結(jié)果。

        2 仿真實(shí)驗(yàn)

        2.1 模型有效性分析

        該模型的數(shù)據(jù)集為某新聞網(wǎng)站的語句,且以中國(guó)翻譯協(xié)會(huì)制定的《翻譯服務(wù)規(guī)范第1 部分:筆譯》(GB/T 19363. 1-2003)為評(píng)價(jià)指標(biāo)標(biāo)準(zhǔn)[16]。使用提出模型對(duì)訓(xùn)練某新聞網(wǎng)站的語句實(shí)施翻譯質(zhì)量評(píng)估,該新聞?wù)Z句詳情如圖2所示。

        圖2 新聞?wù)Z句詳情

        如圖2所示,新聞?wù)Z句經(jīng)機(jī)器自動(dòng)翻譯完畢后,使用提出模型進(jìn)行譯文質(zhì)量評(píng)估,評(píng)估過程中多種語言的訓(xùn)練集及測(cè)試集的翻譯語句都是5 000 個(gè)。語句類型都為從屬?gòu)?fù)合句。各種譯文類型的翻譯詳情如圖3所示。

        圖3 譯文翻譯詳情

        測(cè)試提出模型對(duì)機(jī)器自動(dòng)翻譯質(zhì)量評(píng)估有效性時(shí),測(cè)試指標(biāo)設(shè)成評(píng)估結(jié)果與實(shí)際情況的差值。提出模型的評(píng)估結(jié)果如圖4所示。對(duì)比圖3與圖4可知,在提出模型評(píng)估下,機(jī)器自動(dòng)翻譯正確語句的數(shù)量與實(shí)際數(shù)量間的差值都是1 個(gè),原因是每種語言都具有各自獨(dú)特的語法結(jié)構(gòu),在此前提下,提出模型評(píng)估結(jié)果符合現(xiàn)實(shí)使用需求,可有效評(píng)估機(jī)器自動(dòng)翻譯的質(zhì)量。

        圖4 提出模型評(píng)估結(jié)果

        2.2 翻譯句型對(duì)提出模型評(píng)估性能的影響

        設(shè)置機(jī)器自動(dòng)翻譯的語句類型分別是陳述句、特殊用法句、疑問句、并列復(fù)合句,以測(cè)試提出模型評(píng)估機(jī)器自動(dòng)翻譯的翻譯質(zhì)量,結(jié)果如圖5、圖6所示。分析圖5、圖6可知,在不同語言與不同翻譯句型下,提出模型的評(píng)估結(jié)果和實(shí)際情況的差異較小,僅特殊用法句翻譯質(zhì)量的評(píng)估結(jié)果存在差值,但差值較小,為1 個(gè)。陳述句、疑問句、并列復(fù)合句對(duì)提出模型的評(píng)估效果無影響,評(píng)估結(jié)果和實(shí)際情況一致。

        圖5 陳述句與特殊用法句的翻譯質(zhì)量

        圖6 疑問句與并列復(fù)合句的翻譯質(zhì)量

        2.3 語句數(shù)量對(duì)提出模型評(píng)估性能的影響

        雙語評(píng)估候補(bǔ)(Bilingual Evaluation Understudy,BLEU)分?jǐn)?shù):對(duì)于一個(gè)給定的句子,有實(shí)際翻譯質(zhì)量信息A1,還有一個(gè)提出模型評(píng)估的結(jié)果A2,對(duì)于A2而言,判斷提出模型評(píng)估結(jié)果A2 中具有多少正確評(píng)估結(jié)果出現(xiàn)在A1 中,此比率即為BLEU 分?jǐn)?shù)。BLEU分?jǐn)?shù)可對(duì)測(cè)試集中的單個(gè)句子翻譯錯(cuò)誤進(jìn)行求和,判斷提出模型的評(píng)估性能,結(jié)果如圖7所示。分析圖7可知,語句數(shù)量對(duì)提出模型評(píng)估性能不存在顯著影響,語句數(shù)量由1 000 個(gè)增加至6 000 個(gè)時(shí),提出模型的BLEU 分?jǐn)?shù)由96 分增加至98 分,結(jié)果表明提出模型的使用性能較好。

        圖7 語句數(shù)量對(duì)該文模型評(píng)估性能影響

        為了進(jìn)一步分析提出模型的有效性,將其與文獻(xiàn)[3]、文獻(xiàn)[4]方法進(jìn)行對(duì)比,得到3 種模型的精度對(duì)比,如圖8所示。

        圖8 不同語句數(shù)量下3種方法的精度對(duì)比

        從圖8可以看出,無論語句數(shù)量為1 000、2 000、3 000、4 000、5 000 還是6 000 個(gè),提出模型的機(jī)器自動(dòng)翻譯質(zhì)量評(píng)估精度遠(yuǎn)高于另外兩種方法,精度最高可達(dá)97%,且更加穩(wěn)定,具有一定的應(yīng)用價(jià)值。

        為了更好地分析提出模型的應(yīng)用價(jià)值,再次對(duì)3種模型的質(zhì)量評(píng)價(jià)效率進(jìn)行對(duì)比,可得結(jié)果如圖9所示。

        從圖9可以看出,無論語句數(shù)量為1 000、2 000、3 000、4 000、5 000 還是6 000 個(gè),在保證質(zhì)量評(píng)估精度的同時(shí),提出模型的機(jī)器自動(dòng)翻譯質(zhì)量評(píng)估效率遠(yuǎn)高于另外兩種方法,質(zhì)量評(píng)價(jià)效率最高在95%以上,在一定程度上可以證明提出模型的可行性。

        圖9 不同語句數(shù)量下3種方法的質(zhì)量評(píng)價(jià)效率

        3 結(jié) 論

        文中構(gòu)建了基于深度學(xué)習(xí)算法的機(jī)器自動(dòng)翻譯質(zhì)量評(píng)估模型,并通過實(shí)驗(yàn)測(cè)試了該模型,可知:

        1)提出模型認(rèn)為機(jī)器自動(dòng)翻譯正確語句的數(shù)量與實(shí)際數(shù)量間的差值都是1 個(gè),評(píng)估結(jié)果準(zhǔn)確性較高。

        2)在不同語言與不同翻譯句型下,提出模型的評(píng)估結(jié)果和實(shí)際情況差異較小,僅對(duì)特殊用法句翻譯質(zhì)量的評(píng)估結(jié)果存在差值。

        3)隨著語句數(shù)量的增多,提出模型的BLEU 分?jǐn)?shù)小幅度增大,最高分為98 分。

        綜上所述,提出模型適用于機(jī)器自動(dòng)翻譯質(zhì)量評(píng)估工作中。

        猜你喜歡
        監(jiān)督語言質(zhì)量
        “質(zhì)量”知識(shí)鞏固
        質(zhì)量守恒定律考什么
        突出“四個(gè)注重” 預(yù)算監(jiān)督顯實(shí)效
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        做夢(mèng)導(dǎo)致睡眠質(zhì)量差嗎
        讓語言描寫搖曳多姿
        監(jiān)督見成效 舊貌換新顏
        夯實(shí)監(jiān)督之基
        累積動(dòng)態(tài)分析下的同聲傳譯語言壓縮
        質(zhì)量投訴超六成
        汽車觀察(2016年3期)2016-02-28 13:16:26
        久久精品亚洲国产av网站| 97无码人妻Va一区二区三区| 欧洲亚洲第一区久久久| 国产一级av理论手机在线| 国产亚洲精品品视频在线| 69一区二三区好的精华| 亚洲男人的天堂网站| 看全色黄大色大片免费久久久| 日本超级老熟女影音播放| 日韩精品极品视频在线观看免费| 精品少妇人妻av免费久久久| 亚洲欧美香港在线观看三级片 | 色狠狠色噜噜av天堂一区| 国产一起色一起爱| 国产黄片一区视频在线观看| 成人国产精品三上悠亚久久| 亚洲av片在线观看| 狠狠色狠狠色综合| 国产女人高潮的av毛片| 亚洲精品1区2区在线观看| 国模欢欢炮交啪啪150| 日本一区二区啪啪视频| 精品一区2区3区4区| 亚洲人成自拍网站在线观看| 97午夜理论片在线影院| 爱v天堂在线观看| 国产精品国产三级久久| 99热这里有精品| 亚洲Va中文字幕久久无码一区 | 99久久婷婷国产精品网| 久久午夜羞羞影院免费观看| 亚洲av无码资源在线观看| 国产一区二区三区视频大全| 久久99天堂av亚洲av| 国产高清在线精品一区二区三区 | 国产综合久久久久久鬼色| 久久99国产亚洲高清观看韩国| 亚洲综合免费在线视频| 少妇人妻综合久久中文字幕| 国产激情内射在线影院| 日韩精品永久免费播放平台|