【摘要】結(jié)合長字符英語自動翻譯系統(tǒng)設計需求,本文提出采用翻譯記憶方式實現(xiàn)記憶輔助型自動翻譯系統(tǒng)設計,能夠通過語義特征提取加強系統(tǒng)輸出結(jié)果與上下文的匹配,利用詞語間互信息完成翻譯反饋校正。從系統(tǒng)性能仿真結(jié)果來看,系統(tǒng)翻譯最大能達到100%的匹配率,數(shù)據(jù)召回率最大為40%,因此能夠保證翻譯準確性。
【關鍵詞】翻譯記憶;長字符英語;自動翻譯系統(tǒng)
【作者簡介】吳曉娟(1980.01-),女,漢族,甘肅蘭州人,蘭州理工大學,博士,講師,研究方向:語言學及跨文化交際。
引言
在跨語言交際方面,語言障礙成為為溝通交流的最大阻礙。在翻譯內(nèi)容日漸增多背景下,已經(jīng)無法單純依靠人工翻譯解決溝通問題,所以需要完成自動翻譯系統(tǒng)研發(fā)。但目前該類系統(tǒng)在長字符英語翻譯方面無法保證準確性,因此還應加強記憶輔助型長字符英語自動翻譯系統(tǒng)設計,以促進計算機翻譯技術的發(fā)展。
一、記憶輔助型長字符英語自動翻譯系統(tǒng)設計需求
在對長字符英語進行翻譯時,采用自動翻譯軟件通常會出現(xiàn)譯文語序組合不當、譯義選擇有誤或修飾關系不準確等問題,造成譯文與原文內(nèi)容存在較大偏差。出現(xiàn)這種情況,主要是由于傳統(tǒng)機器翻譯基本是根據(jù)規(guī)則進行翻譯,受分析技術限制,翻譯方法以句法直譯和轉(zhuǎn)化為主,側(cè)重于語法分析,使得譯文可讀性和準確性受到了較大影響。針對這一情況,采用翻譯記憶與計算機輔助翻譯方式,能夠?qū)⒃凑Z言和翻譯得到的譯文對照存入計算機記憶庫中,作為翻譯的源語言進行使用。在計算機系統(tǒng)自動進行長字符英語翻譯時,可以通過數(shù)據(jù)搜索完成模糊匹配。因此針對帶有特殊語義的長字符英語來講,設計記憶輔助型自動翻譯系統(tǒng),能夠使文本翻譯的一致性、完整性得到保證。
二、記憶輔助型長字符英語自動翻譯系統(tǒng)具體設計
1.系統(tǒng)總體架構(gòu)設計。實際進行系統(tǒng)設計,可以采用B/S架構(gòu)完成系統(tǒng)軟件開發(fā),為記憶輔助翻譯算法的實現(xiàn)提供支撐。采用該架構(gòu),可以利用Hadoop、Storm和MongoDB開源底層計算框架開發(fā)系統(tǒng)基礎層和應用層,完成系統(tǒng)頁面交互設計。在系統(tǒng)軟件開發(fā)架構(gòu)上,運用模塊化設計思想,可以得到由信息管理模塊、網(wǎng)絡通信模塊、程序加載模塊和數(shù)據(jù)庫構(gòu)成的自動翻譯系統(tǒng)。利用信息管理模塊,能夠?qū)崿F(xiàn)系統(tǒng)數(shù)據(jù)信息的輸入、輸出控制管理。在網(wǎng)絡通信模塊支撐下,可以實現(xiàn)數(shù)據(jù)傳輸,為系統(tǒng)在線翻譯功能實現(xiàn)提供技術支撐。憑借程序加載模塊,系統(tǒng)能夠?qū)τ⒄Z交叉編譯指令程序進行加載,完成英語翻譯資源調(diào)用,并通過調(diào)用系統(tǒng)翻譯算法實現(xiàn)交叉編譯控制,使系統(tǒng)完成英語自動翻譯。在系統(tǒng)數(shù)據(jù)庫設計上,需要利用寄存器完成翻譯輸出緩存處理,完成寄存器時鐘初始化和傳輸位時序設定,促使加載程序能夠按照網(wǎng)絡進程完成英語翻譯,實現(xiàn)相應寄存器的配置,繼而加強系統(tǒng)數(shù)據(jù)內(nèi)存管理。
2.系統(tǒng)語義特征提取。系統(tǒng)設計關鍵,在于翻譯算法實現(xiàn)。在長字符英語翻譯方面,應用翻譯記憶方法實現(xiàn)計算機輔助翻譯,需要完成英語自然語義特征分析提取,以便形成相應實例集,對長字符英語短語進行語義分割,得到語義特征相匹配的語義本體模型。在實際進行語義分割時,系統(tǒng)需要完成模糊映射處理。具體來講,就是先完成語義映射約束系數(shù)設定,對翻譯準確性評價集與相關鄰域概念進行匹配,得到相應實詞集。根據(jù)語義本體模型同義詞特征,可以得到匹配集,實現(xiàn)模糊語義最優(yōu)解計算,以便從語義上完成翻譯內(nèi)容正確組織。運用該種方法,其實就是根據(jù)主題詞特征對英語短語內(nèi)容進行相關性分析,可以根據(jù)字符匹配算子對翻譯本體片段英語翻譯進行可靠性預測,實現(xiàn)本體映射。針對從句語義,還應在確定相關性特征后完成二元語義信息特征提取,實現(xiàn)英語詞片相關性搜索,最終輸出優(yōu)化語義特征。
3.系統(tǒng)自動翻譯流程。按照系統(tǒng)翻譯算法,在英語翻譯輸出結(jié)果集中,可以實現(xiàn)自相關特征匹配,得到字符翻譯優(yōu)化解向量。從流程上來看,即在前后文語義模糊概念集k
4.系統(tǒng)性能仿真分析。為確定系統(tǒng)性能,可以利用Visual DSP++仿真平臺完成系統(tǒng)翻譯仿真實驗。與傳統(tǒng)翻譯系統(tǒng)相比較,在英語詞匯包大小達到80Gbit的情況下,系統(tǒng)最大能夠達到96%的上下文匹配率。隨著英語詞匯包大小的增加,系統(tǒng)翻譯速度逐漸下降,在詞匯包大小達到600Gbit的情況下,數(shù)據(jù)召回率最大為35%。采用設計自動翻譯系統(tǒng),在英語詞匯包大小達到80Gbit時系統(tǒng)最大能夠達到100%的匹配率,在詞匯包大小達到600Gbit時數(shù)據(jù)召回率最大為40%。由此可見,相較于傳統(tǒng)翻譯系統(tǒng),設計出的自動翻譯系統(tǒng)擁有更高翻譯準確性。
三、結(jié)論
綜上所述,在長字符英語翻譯方面,想要提高翻譯軟件準確性,還要采用翻譯記憶方式實現(xiàn)計算機輔助翻譯,以便結(jié)合文本語義特征加強上下文聯(lián)系,使翻譯結(jié)果與上下文匹配率得到提高。實際進行自動翻譯系統(tǒng)設計時,可以借助B/S架構(gòu)實現(xiàn)系統(tǒng)翻譯算法,促使系統(tǒng)翻譯性能得到有效改善。
參考文獻:
[1]張岳琢.記憶輔助型長字符英語自動翻譯系統(tǒng)設計[J].自動化與儀器儀表,2018(10):116-118+123.