孫 夏
合肥師范學(xué)院 外國語學(xué)院,安徽 合肥230601
對翻譯質(zhì)量的評價研究是近些年語言處理方向的研究熱點(diǎn)之一,對于翻譯系統(tǒng)的深入研究具有重要意義[1]。但當(dāng)前翻譯準(zhǔn)確性評定主要由相關(guān)領(lǐng)域的專家人工評價,但因各專家受自身的才能限制,導(dǎo)致結(jié)果準(zhǔn)確性不高,不具有客觀性。
為此,國內(nèi)有學(xué)者提出基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯評價系統(tǒng)[2],如文獻(xiàn)[2]描述系統(tǒng)漢英翻譯,在基礎(chǔ)詞匯、句子準(zhǔn)確度和流暢度方面效果較好,無效翻譯少,平均質(zhì)量基本達(dá)到及格水準(zhǔn);與此同時,在罕見詞、復(fù)雜長句、隱性邏輯等方面也相對由于其他機(jī)械翻譯。上述研究結(jié)果表明,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯質(zhì)量較高,能為人類譯員提供高效輔助。不足之處是,機(jī)器翻譯存在無法克服的問題,尤其在文化、語境、交際等層面。文獻(xiàn)[3]設(shè)計并改進(jìn)基于語義網(wǎng)絡(luò)的英語機(jī)器翻譯模型,采用基于向量混合的短語合成語義統(tǒng)計英語機(jī)器翻譯方法,在翻譯相似度模型中,經(jīng)過帶權(quán)向量加法的計算,極易辨別兩個相似向量的不同之處,從而獲取精準(zhǔn)的英語翻譯結(jié)果。
構(gòu)建英語語義翻譯評定的約束對象模型,在語義相關(guān)度的最大關(guān)聯(lián)約束控制下[4],構(gòu)建英語語義翻譯準(zhǔn)確性評定的目標(biāo)函數(shù)和約束參數(shù)集[5-6],可實(shí)現(xiàn)英語語義翻譯準(zhǔn)確性評定和優(yōu)化設(shè)計,最后進(jìn)行仿真測試分析,展示了本文方法在提高英語語義翻譯準(zhǔn)確性評定能力方面的優(yōu)越性能。
考慮目前已有翻譯系統(tǒng)準(zhǔn)確性不高、客觀性差的特點(diǎn),從語義翻譯的角度入手,建立語義翻譯評定的約束對象模型。
為了實(shí)現(xiàn)基于無監(jiān)督學(xué)習(xí)的英語語義翻譯準(zhǔn)確性評定,構(gòu)建英語語義翻譯評定的約束對象模型,采用上下文關(guān)聯(lián)映射方法[7],實(shí)現(xiàn)對英語語義翻譯準(zhǔn)確性評價的模糊性融合處理。在英語語義上下文關(guān)聯(lián)映射本體映射分布的關(guān)聯(lián)規(guī)則約束控制下,得到英語語義上下文關(guān)聯(lián)映射的相似度特征分布系數(shù)為ω=(ω1,ω2,…,ωi),ωi∈[0,1],采用自然語言映射和語義本體模塊設(shè)計的方法,建立英語語義上下文關(guān)聯(lián)映射本體參數(shù)分布規(guī)則集,表示為:
式中,a表示英語語義上下文關(guān)聯(lián)詞片段,s表示英語語義上下文關(guān)聯(lián)映射。采用本體映射過程中概念之間語義特征分解的方法,得到英語語義上下文關(guān)聯(lián)模型表示為:
式中,表示關(guān)鍵字詞在全文中的權(quán)重。
在本體結(jié)構(gòu)特征分布中,采用相似傳遞性原則實(shí)現(xiàn)對英語義分析過程中的塊匹配和特征提取[8],構(gòu)建語義映射的關(guān)系集合,如圖1所示。
圖1 英語語義翻譯的語義映射關(guān)系集合
根據(jù)圖1所示的語義映射的關(guān)系集合分布,實(shí)現(xiàn)對上下文關(guān)聯(lián)映射語義檢索,計算每個子句的語義相似度值,采用強(qiáng)化的無監(jiān)督學(xué)習(xí)方法[9],分析英語語義翻譯的語義本體特征集,建立本體之間多種語義映射模型[10],得到本體之間語義相關(guān)性特征量表示為β∈[0,1],即:
假設(shè)(sk,ak),k∈[-0.5,0.5)為上下文的本體結(jié)構(gòu)特征分量,采用父概念(Super-Concept)和子概念(Sub-Concept)聯(lián)合特征分析的方法,英語語義翻譯準(zhǔn)確性評定的模糊映射集為:
根據(jù)對英語語義翻譯準(zhǔn)確性評定的最佳約束函數(shù)構(gòu)造,得到語義不相交映射關(guān)系模型表示為:
式中,λi為語義不相交映射的模糊加權(quán)值,p為決策概率。研究本體之間的語義泛化關(guān)系,得到2個英語語義翻譯準(zhǔn)確性評定的數(shù)據(jù)塊m1和m2,使用關(guān)聯(lián)語義模糊化解析模型[11],得到英語語義上下文的副本中的關(guān)聯(lián)度為:
建立英語語義翻譯準(zhǔn)確性評定的語言語義相關(guān)度計算模型,采用無監(jiān)督學(xué)習(xí)方法,得到英語語義翻譯的語義映射模型[12],如圖2所示。
圖2 語義本體結(jié)構(gòu)特征構(gòu)造
曾有人提出深度信任網(wǎng)絡(luò)無監(jiān)督學(xué)習(xí)算法,通過無監(jiān)督學(xué)習(xí)的方法來解決深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上存在的問題。深度神經(jīng)網(wǎng)絡(luò)具有較好的特征學(xué)習(xí)能力,通過學(xué)習(xí)獲得的特征更能對數(shù)據(jù)的本質(zhì)進(jìn)行描述,在數(shù)據(jù)可視化或分類等方面非常有效。采用無監(jiān)督學(xué)習(xí)方法,實(shí)現(xiàn)對英語語義翻譯過程中的非語句主干的分段學(xué)習(xí)控制[13],通過邏輯推理的方法,得到英語語義翻譯的語義映射的關(guān)聯(lián)度模型表達(dá)式為:
式中,x為本體之間語義映射因子,y為語義標(biāo)識的最優(yōu)解析因子,Hi為概念詞語知識的語義分布函數(shù)。根據(jù)語義詞典庫和領(lǐng)域知識,采用無監(jiān)督學(xué)習(xí)方法,得到語義翻譯準(zhǔn)確性評估的特征函數(shù)為:
分析每個普通實(shí)詞的靜態(tài)語義特性,本文定義一個動態(tài)傳遞函數(shù)描述英語翻譯中存在的歧義項,進(jìn)行上下文的語義映射[14],映射表達(dá)式為:
將各個分詞的語義特征量采用模糊聚類方法實(shí)現(xiàn)信息融合,得到不同本體的概念分布序列e={e1,e2,…,ei},將連接詞和逗號表示成析取形式,采用無監(jiān)督的語義本體構(gòu)造的方法,得到不同本體的概念之間的語義關(guān)聯(lián)維分布為:
其中,t為給定的映射集合,n為不同本體的兩個概念的相似度。語義等價模型為L(n),采用語義模糊化解析控制,得到無監(jiān)督學(xué)習(xí)因子為:
根據(jù)上述分析,采用無監(jiān)督學(xué)習(xí)方法,實(shí)現(xiàn)對英語語義翻譯過程中的非語句主干的分段學(xué)習(xí),根據(jù)分段學(xué)習(xí)結(jié)果實(shí)現(xiàn)語義翻譯準(zhǔn)確性評價。
隨著翻譯軟件的革新,英語機(jī)器翻譯軟件的準(zhǔn)確度已不能滿足新的要求。在采用英語翻譯軟件進(jìn)行英漢翻譯過程中,受到英語語句的歧義性和語言表達(dá)習(xí)慣等因素的影響,導(dǎo)致英漢翻譯中出現(xiàn)模糊語句,對語義的分析準(zhǔn)確性不好,以致翻譯質(zhì)量下降,需要進(jìn)行英漢翻譯模型的優(yōu)化設(shè)計。
在建立本體之間的語義映射時,把語義塊的j個英語語義翻譯的語義映射作為做信息包實(shí)現(xiàn)詞語知識融合,得到概念集為Xj,在有向圖節(jié)點(diǎn)模型中,將概念的語義表示成邏輯公式(g1,Y1),(g2,Y2),…,(gq,Yq),根據(jù)概念附近的各種本體相關(guān)性關(guān)系,得到語義標(biāo)識過程的模糊度向量■,分析語義翻譯的準(zhǔn)確性評估模型,根據(jù)語義成分的邏輯相關(guān)性關(guān)系,得到英語語義翻譯準(zhǔn)確性評定結(jié)果,英語語義翻譯準(zhǔn)確性評定的暫態(tài)函數(shù)為:
式中,tc為[n+1]的語義相似度分布特征序列,ta為參考本體與概念本體的融合系數(shù),得到英語語義翻譯準(zhǔn)確性評價的決策函數(shù)為:
在語義等價中,得到語義關(guān)系所對應(yīng)的本體節(jié)點(diǎn),定義兩點(diǎn)之間的相似度特征分布聚類中心,在語義相關(guān)度的最大關(guān)聯(lián)約束控制下,構(gòu)建英語語義翻譯準(zhǔn)確性評定的目標(biāo)函數(shù)和約束參數(shù)集[15]。根據(jù)對英語語義翻譯準(zhǔn)確性評定的無監(jiān)督學(xué)習(xí)結(jié)果實(shí)現(xiàn)加權(quán)學(xué)習(xí)和自適應(yīng)權(quán)重分析,結(jié)果如圖3所示。
圖3 英語語義翻譯準(zhǔn)確性評定決策實(shí)現(xiàn)流程
為了測試本文方法在實(shí)現(xiàn)英語語義翻譯準(zhǔn)確性評定的應(yīng)用性能,進(jìn)行試驗測試分析,試驗的場景如圖4所示。
圖4 試驗場景設(shè)定
根據(jù)圖2的英語語義翻譯準(zhǔn)確性評定的實(shí)驗場景設(shè)定,設(shè)定英語語義翻譯語義評價集的個數(shù)為1 024個實(shí)例集,迭代次數(shù)為200,得到英語語義翻譯準(zhǔn)確性評定的模糊決策屬性表見表1。
表1 英語語義翻譯準(zhǔn)確性評定的模糊決策屬性表
分析表1結(jié)果,語義特征值越高,關(guān)聯(lián)系數(shù)和相似度系數(shù)越高。由此揭示:對于不同語義,相似度隨其特征值及關(guān)聯(lián)系數(shù)總體呈現(xiàn)出正相關(guān)的表征。
為實(shí)現(xiàn)英語語義翻譯準(zhǔn)確性評定,英語語義翻譯準(zhǔn)確性評定的目標(biāo)函數(shù)變化值如圖5所示。
圖5 英語語義翻譯準(zhǔn)確性評定的目標(biāo)函數(shù)變化值
根據(jù)評定結(jié)果,測試英語語義翻譯準(zhǔn)確性評定的收斂性,得到結(jié)果如圖6所示。
收斂性通常用于描述函數(shù)無限趨近于某值的性質(zhì),這里用一組函數(shù)計算結(jié)果的終值描述其收斂性,以進(jìn)一步衡量翻譯的準(zhǔn)確性。
圖6 收斂性分析
由圖6得知,本文方法實(shí)現(xiàn)英語語義翻譯準(zhǔn)確性評定的收斂性較好。英語語義翻譯準(zhǔn)確性評定的
穩(wěn)定性較高,評定結(jié)果可靠。結(jié)果如下圖7。
圖7 準(zhǔn)確性分析
綜上,本文實(shí)現(xiàn)英語語義翻譯準(zhǔn)確性評定的方法具有穩(wěn)定性高,評定結(jié)果準(zhǔn)確的優(yōu)勢。
本文提出基于無監(jiān)督學(xué)習(xí)的英語語義翻譯準(zhǔn)確性評定系統(tǒng),采用相似傳遞性原則實(shí)現(xiàn)對英語語義分析過程中的塊匹配和特征提取。建立本體之間多種語義映射模型,首先構(gòu)建語言的內(nèi)部意義翻譯評定的約束對象模型,利用上下文關(guān)聯(lián)映射,模糊性融合處理英語語義翻譯準(zhǔn)確性評價;其次根據(jù)英語語義上下文關(guān)聯(lián)映射本體映射分布的關(guān)聯(lián)規(guī)則約束控制,得到英語語義上下文關(guān)聯(lián)映射的相似度特征分布系數(shù),以實(shí)現(xiàn)對上下文關(guān)聯(lián)映射語義檢索。根據(jù)語義詞典庫和領(lǐng)域知識,采用無監(jiān)督學(xué)習(xí)方法,分析每個普通實(shí)詞的靜態(tài)語義特性;根據(jù)對英語語義翻譯準(zhǔn)確性評定的無監(jiān)督學(xué)習(xí)結(jié)果實(shí)現(xiàn)加權(quán)學(xué)習(xí)和自適應(yīng)權(quán)重分析,由此實(shí)現(xiàn)英語語義翻譯準(zhǔn)確性評定決策。