亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于英語語義分析的智能算法研究

        2020-11-13 03:38:57梁珊
        微型電腦應(yīng)用 2020年10期
        關(guān)鍵詞:英語語音翻譯

        梁珊

        摘要:英語翻譯過程中,語義越相似,則相關(guān)度越大,容易造成不同語境下的理解錯(cuò)誤,給翻譯工作帶來困難?;诖?,從英漢句子雙語料入手,建立基于語義詞典和語料庫相結(jié)合的相似度計(jì)算模型。在建立的語料庫條件下,確定相關(guān)語義提取規(guī)則和依存關(guān)系,通過英語句子相似度算法,采用向量空間模型標(biāo)準(zhǔn),將計(jì)算的相似度作為向量元素,尋找到語句的差異化程度,區(qū)別語句和單詞詞性、句法、時(shí)態(tài)多方面內(nèi)容。研究結(jié)果表明:系統(tǒng)在語句翻譯過程中具備較高的準(zhǔn)確度和召喚率,尤其是在介詞、虛詞、時(shí)態(tài)方面的英譯過程中,具有更高的翻譯效率和準(zhǔn)確度。

        關(guān)鍵詞:英語語音;翻譯;相似度模型;語法時(shí)態(tài)

        中圖分類號:G643

        文獻(xiàn)標(biāo)志碼:A

        ResearchonIntelligentAlgorithmBasedonEnglishSemantic

        LIANGShan

        AcademicAffairsOffice,ShanxiCollegeofCommunicationTechnology,Xian710000,China

        Abstract:IntheprocessofEnglishtranslation,themoresimilarthesemanticsis,thegreaterthecorrelation.Itcaneasilycauseunderstandingerrorsindifferentcontexts,andbringdifficultiestothetranslationwork.Basedonthis,thispaperestablishesasimilaritycalculationmodelbasedonthecombinationofsemanticdictionaryandcorpus.Undertheconditionoftheestablishedcorpus,therelevantsemanticextractionrulesanddependenciesaredetermined.ThroughtheEnglishsentencesimilarityalgorithm,usingthevectorspacemodelstandard,thecalculatedsimilarityisusedasthevectorelementtofindthedegreeofdifferentiationofthesentence,distinguishthesentencefromthewordpartofspeech,syntax,tense,andmanyaspectsofthecontent.Theresultsshowthatthetranslationprocesshashigheraccuracyandcallrate,especiallyinthetranslationofprepositions,functionwords,tenses,withhighertranslationefficiencyandaccuracy.

        Keywords:Englishphonetics;translation;similaritymodel;grammaticaltense

        0引言

        隨著國際經(jīng)濟(jì)形勢和貿(mào)易的擴(kuò)展,英語作為國際通用語言得到更多的重視,英語翻譯成為必不可少的一部分,各類機(jī)器翻譯系統(tǒng)快速發(fā)展[13]。機(jī)器翻譯已經(jīng)不局限于單個(gè)語法和句子翻譯,更多的是語言內(nèi)部句群、段落、篇章、體裁的語境信息[4]。從語義學(xué)角度講,詞語語義計(jì)算可在整個(gè)文本中或單個(gè)詞義間進(jìn)行定義,因而詞語語義具備了相關(guān)度和相似度,即反應(yīng)了兩個(gè)詞語在同一語境中的共性和兩個(gè)詞語間的聚合特征[57]。在一定程度上,詞語間語義越相似,其相關(guān)度越大,容易造成不同語境下的理解錯(cuò)誤,給翻譯工作帶來困難。目前,詞語語義計(jì)算更多的是基于自然語言處理,探索詞語間相關(guān)程度[811]。如結(jié)合馬爾科夫模型對比輸入譯文和參照譯文的相似詞,并進(jìn)行匹配,計(jì)算二者的近似度。通過將InformationContent算法融合在WordNet系統(tǒng)內(nèi)建立詞語語義的相關(guān)度模型,利用現(xiàn)有詞義詞典的概念關(guān)系度量詞語語義相關(guān)度[12]。一些學(xué)者從詞語文檔該案屬性程度方面計(jì)算詞語概念相關(guān)度,通過統(tǒng)計(jì)算法確定文檔中詞語共線性和相關(guān)性[13]。基于此,本文將英語語義相似度算法應(yīng)用于英語只能反應(yīng)中,綜合考慮英語單詞和語義多方面特征,提高英語翻譯系統(tǒng)的語句翻譯準(zhǔn)確度。

        1英語翻譯分析系統(tǒng)設(shè)計(jì)

        英語翻譯系統(tǒng)主要是將收入的譯文資料保存在系統(tǒng)資料庫中,并通過對收錄語言進(jìn)行語義檢測,信息特征提取,進(jìn)行特定語境下下單詞和語義的分析,最后將結(jié)果反饋給應(yīng)用者。根據(jù)英語反應(yīng)系統(tǒng)的需求,構(gòu)建層次結(jié)構(gòu)主要包括譯文資料收錄、信息特征提取、數(shù)據(jù)模型構(gòu)建和分析、結(jié)果反饋四個(gè)功能模塊,如圖1所示。

        系統(tǒng)初期,通過譯文資料模塊收錄相應(yīng)的英文譯文,并經(jīng)過標(biāo)準(zhǔn)化處理,將獲得的標(biāo)準(zhǔn)化格式保存在資料庫文件中。根據(jù)文件內(nèi)容通過信息特征提取模塊進(jìn)行內(nèi)容細(xì)分,利用軟件算法提取標(biāo)準(zhǔn)文件特征值。由分析模塊根據(jù)提取的信息特征值獲得提取結(jié)果,在此基礎(chǔ)上通過結(jié)果反饋模塊完成譯文翻譯和反饋工作。

        同時(shí)引入自然語言處理系統(tǒng)進(jìn)行人與機(jī)的有效通信,作為翻譯系統(tǒng)的輔助部分實(shí)現(xiàn)信息交互。用戶將傳疑問上傳到用戶端,通過自然語言只能處理完成信息交互后,輸入系統(tǒng)翻譯模型,利用模型文件進(jìn)行評分和結(jié)果反饋,并基于人工檢驗(yàn)評測查閱用戶英語翻譯文檔,選擇訓(xùn)練模型譯文集數(shù)據(jù),提高翻譯整體效果。

        2系統(tǒng)關(guān)鍵技術(shù)

        從系統(tǒng)結(jié)構(gòu)層次可以看出,利用軟件算法提取標(biāo)準(zhǔn)文件的信息特征值是實(shí)現(xiàn)不同語義環(huán)境下準(zhǔn)確翻譯的基礎(chǔ)[14]。而詞語和句子間存在的相似度是造成系統(tǒng)在不同語義環(huán)境下翻譯下降到因素。語句的相對度包括詞性、句法、語句多方面內(nèi)容,通過句子相似度計(jì)算,尋找到語句的差異化程度,即相似度值越大,則表明兩句子在詞形、句法和語義方面的信息越解決[15]。本文基于英語距離的相似度算法計(jì)算英語單詞和語句間的相似度。

        2.1概念詞的相似度

        針對語句間概念詞的相似度,在相關(guān)研究的基礎(chǔ)上[16],重新定義了概念次的相似度計(jì)算方法,即確定兩概念詞間語義相似度值位于區(qū)間[0,1]間,相互關(guān)系如式(1)。

        sim(w1,w2)=e-αL·12(HcH1+HcH2)

        (1)

        上式中

        L為概念詞w1和w2間的最短路徑;Hc為概念詞在公共上位詞集的深度,Hw1、Hw2對應(yīng)的深度;α為常數(shù)。對于式(1)中可以理解為:當(dāng)兩概念次間最短路徑越小,公共上位詞深度越大,距離越短,則語義相似度越大。

        2.2語句間相似度

        在衡量語句相似度時(shí),采用向量空間模型標(biāo)準(zhǔn)。向量空間模型(VectorspacemodelVSM)

        是把文本中的單詞、短語等最小語義單元分隔開,將其計(jì)算的相似度作為向量元素[17]。在兩條英語句中使用教教余弦來獲得語義間的相似度。

        2.2.1語句的向量化表示

        在英語語句向量化表示中,首先將兩個(gè)語句用等長度向量表示,如對于

        語句T1和T2,將兩條語句所有單詞匯集程一個(gè)聯(lián)合詞集T如式(2)。

        T=T1∪T2=w1,q1,…,wm,qn

        (2)

        去掉T1和T2中相同的單詞,確保聯(lián)合詞集T中的元素互異性,其中w1,w2,…,wm為語句T1中單詞集合,q1,q2,…,qn為語句T2的單詞集合,例如對于英語語句:

        T1:{Whatisyoufavoritesports?}

        T2:{Whatkindofsportsdoyouenjoymost?}

        對兩個(gè)語句進(jìn)行組合,將兩條語句中的冠詞、感嘆詞刪除,保留實(shí)意單詞原型,并記錄相同單詞,獲得組合后的語句T:{Whatisyourfavoritesportkindofdoyouenjoymost?}。將聯(lián)合語句T以一個(gè)向量S表示。聯(lián)合語義向量單詞長度與聯(lián)合語句數(shù)量相同,同時(shí),將語句T1表示問聯(lián)合語義向量S1,將T2表示問聯(lián)合語義向量S2。將向量中單詞以分量值的形式,若wi包含在語義向量中,則Si取為1,若不包含在語句中,則根據(jù)式(1)計(jì)算相似度。獲得語句T1和T2對應(yīng)的語義向量S1和S2。

        S1:1,1,1,1,1,0.8,0.8,0,0,1,0.8,0.9

        S2:1,0,1,0.8,1,1,1,1,1,1,1

        其中計(jì)算獲得的小數(shù)為單詞對應(yīng)的相似度數(shù)值。語句中的of、do等介詞和助動詞無比較單詞。確定語句T1和T2對應(yīng)的語義向量S1和S2后,根據(jù)式(3)計(jì)算得到T1和T2的相似度,將相似度值大于設(shè)定閾值備選答案作為最終答案如式(3)。

        sim(T1,T2)=S1·S2S1·S2

        (3)

        2.2.2算法的流程

        算法為用戶輸入一條英語語句,輸出與該語句相似的所有備翻譯語義以及相似值,取相似度取值范圍[0,1],確定算法的具體處理流程,如圖2所示。

        (1)輸入一個(gè)英語語句,進(jìn)行句子的預(yù)處理,獲得翻譯語句的備選答案;(2)對輸入語句和備選答案進(jìn)行還原處理,并標(biāo)注每個(gè)單詞的詞性;(3)將處理后的語句和答案組成聯(lián)合詞集,進(jìn)行向量化處理,構(gòu)成聯(lián)合語義向量集;(4)由將聯(lián)合語義向量賦予概念相似度值,根據(jù)余弦相似度計(jì)算公式獲得語義相似度值;(5)由語義相似度結(jié)果排序,并最終選擇相似度最高句子作為最終答案。

        3系統(tǒng)實(shí)現(xiàn)

        系統(tǒng)以MYSQL數(shù)據(jù)庫和知識題庫作為數(shù)據(jù)管理系統(tǒng)。采用常用詞詞典和WordNet語義詞典作為數(shù)據(jù)表,在Eclipse平臺架構(gòu)進(jìn)行層次設(shè)計(jì),使系統(tǒng)具體流程圖,如圖3所示。

        本文選擇測試用例1:“漢英對照例句集”,測試用例2:“走遍美國雙語篇章級語料”第2324課,測試用例3:“Internet上雙語新聞”共17篇中的雙語篇章預(yù)料進(jìn)行測試,測試預(yù)料信息以及獲得的測試結(jié)果,如表1所示。

        其中準(zhǔn)確率R和召喚率P如式(4)、式(5)。

        R=輸出正確譯文次數(shù)句對總數(shù)×100%

        (4)

        P=輸出正確譯文次數(shù)輸出譯文次數(shù)×100%

        (5)

        從獲得的實(shí)驗(yàn)結(jié)果可以看出,采用系統(tǒng)來解決漢譯音問題能夠獲得較高的準(zhǔn)確率。其中測試用例3的準(zhǔn)確率和召喚率較其他二者較低,這是由于用例3主要為新聞題材,以敘事性文和說明性文字交織,在時(shí)態(tài)方面存在較多的變化,存在一定錯(cuò)誤,因此需要增加對受限領(lǐng)域、場景和句子模式識別的深入研究,以及句子銜接規(guī)律的研究。

        下面針對英語翻譯中常存在是時(shí)態(tài)問題進(jìn)行分析,基于語義語言的機(jī)器翻譯在進(jìn)行轉(zhuǎn)化處理中,得到的結(jié)果更多的是英語動詞原形形式。如基于機(jī)器翻譯系統(tǒng)將英語句子“Thewillinvestigatethiswork”到漢語的翻譯過程如下:

        (1)展開漢語句子過程:進(jìn)行語義單元的編碼“Thewillinvestigatethiswork”→1(The,thiswork)→1(They,2(work))→1(2,3(4))。

        (2)進(jìn)行語義分析過程為:1(2,3(4))→“調(diào)查(他們,該(工作))”→“調(diào)查(他們,該(工作))1”→“他們(2)調(diào)查該(工作)(3)”→“他們(2)調(diào)查該工作(4)”→“他們調(diào)查該工作”。

        由于針對句子語義單元忽略了“將”一類時(shí)間副詞和助詞,僅提取時(shí)間短語的語義單元,對存在時(shí)間連詞句子僅提取時(shí)間連詞,并未在表示中標(biāo)志時(shí)間信息,顯然,時(shí)間模式表能直接反應(yīng)時(shí)間信息和轉(zhuǎn)換時(shí)態(tài),因此,直接利用本文算法,根據(jù)語義相似度來處理句子獲得時(shí)態(tài)結(jié)果,并與機(jī)器反應(yīng)系統(tǒng)翻譯結(jié)果結(jié)合,獲得帶有時(shí)態(tài)標(biāo)記譯文。

        4總結(jié)

        本文從英漢句子雙語料入手,針對語義語言的翻譯系統(tǒng)若干關(guān)鍵問題進(jìn)行分析。基于語義詞典和語料庫相結(jié)合的相似度計(jì)算模型,并給出系統(tǒng)開發(fā)過程和模塊的功能作用。以建立語料庫為基礎(chǔ),確定相關(guān)語義提取規(guī)則和依存關(guān)系,通過研究英語句子相似度算法,采用向量空間模型標(biāo)準(zhǔn),將計(jì)算的相似度作為向量元素,尋找到語句的差異化程度,區(qū)別語句和單詞詞性、句法、時(shí)態(tài)多方面內(nèi)容。通過實(shí)際體驗(yàn)和使用,系統(tǒng)能夠有效提高英語翻譯的準(zhǔn)確度,進(jìn)一步提升了系統(tǒng)的效率。

        參考文獻(xiàn)

        [1]

        劉蕾.智能播種機(jī)嵌入式英語語音識別控制系統(tǒng)設(shè)計(jì)與研究[J].農(nóng)機(jī)化研究,2018,40(12):240244.

        [2]譚詠梅,吳坤.面向英語文章的詞性標(biāo)注算法[J].北京郵電大學(xué)學(xué)報(bào),2014,37(6):120124.

        [3]雷香花,幸晉渝.基于短語譯文組合的智能化英語自動翻譯系統(tǒng)[J].自動化與儀器儀表,2018(5):152155.

        [4]吳秉健.基于人工智能的英語故事寫作應(yīng)用研究[J].中小學(xué)數(shù)字化教學(xué),2018(4):8688.

        [5]楊燕.BP神經(jīng)網(wǎng)絡(luò)算法下英語MOOC平臺的設(shè)計(jì)與實(shí)現(xiàn)[J].自動化與儀器儀表,2018(8):8183.

        [6]詹海寶,張立國.大學(xué)英語詞匯鎖屏移動學(xué)習(xí)軟件的設(shè)計(jì)與應(yīng)用[J].中國遠(yuǎn)程教育,2015(4):4348.

        [7]謝雪梅.英語口語測試系統(tǒng)發(fā)音錯(cuò)誤智能檢測技術(shù)研究[J].自動化與儀器儀表,2018(12):5861.

        [8]賀建英,王光瓊,唐青松.一種基于遺傳算法的智能組卷策略優(yōu)化研究[J].計(jì)算機(jī)與數(shù)字工程,2019,47(1):130135.

        [9]郭蕾.基于自然語言處理的英語翻譯計(jì)算機(jī)智能評分系統(tǒng)設(shè)計(jì)[J].現(xiàn)代電子技術(shù),2019,42(4):158160.

        [10]洪常春.人工智能時(shí)代大學(xué)英語生態(tài)教學(xué)模式構(gòu)建研究[J].外語電化教學(xué),2018(6):2934.

        [11]王曉茹.基于個(gè)性化推薦的英語輔助教學(xué)系統(tǒng)設(shè)計(jì)[J].微型電腦應(yīng)用,2019,35(5):3538.

        [12]涂惠燕,陳一寧.基于語音識別和手機(jī)平臺的英語口語發(fā)音學(xué)習(xí)系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(9):6466.

        [13]季春元,熊澤金,侯艷芳,等.基于人機(jī)交互的網(wǎng)絡(luò)化智能翻譯系統(tǒng)設(shè)計(jì)[J].自動化與儀器儀表,2019(8):2528.

        [14]梁慧.嵌入式英語語音識別系統(tǒng)誤差自動檢測方法研究[J].自動化與儀器儀表,2019(9):5558.

        [15]尹鐘,陳瑋,付東翔,等.智能控制課程中英雙語教學(xué)方法研究與教學(xué)案例設(shè)計(jì)[J].計(jì)算機(jī)教育,2019(10):5155.

        [16]劉學(xué)豐.基于差分進(jìn)化算法的英語考試智能組卷[J].計(jì)算機(jī)技術(shù)與發(fā)展,2016,26(1):181184.

        [17]譚詠梅,王曉輝,楊一梟.基于語料庫的英語文章語法錯(cuò)誤檢查及糾正方法[J].北京郵電大學(xué)學(xué)報(bào),2016,39(4):9297.

        (收稿日期:2020.03.27)

        猜你喜歡
        英語語音翻譯
        微課環(huán)境下英語語音教學(xué)新模式探索
        東方教育(2016年12期)2017-01-12 19:39:32
        少數(shù)民族預(yù)科英語語音課程建設(shè)研究
        東方教育(2016年4期)2016-12-14 21:19:34
        關(guān)于大學(xué)英語語音的語用研究
        本科英語專業(yè)翻譯教學(xué)改革與實(shí)用型翻譯人才的培養(yǎng)
        淺析跨文化交際
        人間(2016年26期)2016-11-03 18:34:20
        商務(wù)英語翻譯在國際貿(mào)易中的重要性及其應(yīng)用
        小議翻譯活動中的等值理論
        考試周刊(2016年77期)2016-10-09 10:36:47
        語音層面英語歧義及其消解淺析
        考試周刊(2016年60期)2016-08-23 06:54:26
        非英語專業(yè)大學(xué)生英語連讀習(xí)得狀況研究
        考試周刊(2016年28期)2016-05-27 08:48:14
        英語語音教學(xué)方法的實(shí)踐與研究
        成才之路(2016年9期)2016-04-15 10:42:43
        日韩中文字幕免费视频| 亚洲毛片在线免费视频| 国产精品特级毛片一区二区三区| 日韩一区av二区三区| 午夜福利理论片在线观看| 国产一卡2卡3卡四卡国色天香| 18禁超污无遮挡无码免费游戏| 粉嫩少妇内射浓精videos| 午夜无码一区二区三区在线| 国产 字幕 制服 中文 在线| 国精产品一品二品国在线| 澳门精品无码一区二区三区| 亚洲一区二区自拍偷拍| 久久精品国产亚洲av热一区| 国产91人妻一区二区三区| 久爱www人成免费网站| 成年免费视频黄网站zxgk| 久久久久亚洲精品天堂| 人妻少妇人人丰满视频网站| 亚洲素人av在线观看| 丰满巨臀人妻中文字幕| 看女人毛茸茸下面视频| 私人vps一夜爽毛片免费| 久久久久亚洲精品天堂| 亚州五十路伊人网| 日本女优爱爱中文字幕| 人妻少妇猛烈井进入中文字幕 | 中文字幕女同系列在线看一 | 日韩精品久久久一区 | 欧美视频二区欧美影视| 国内自拍第一区二区三区| av黄页网国产精品大全| 久久er99热精品一区二区| av无码av在线a∨天堂app| 在线女同免费观看网站| 极品粉嫩小仙女高潮喷水操av| 精品人妻无码视频中文字幕一区二区三区 | 国产女同va一区二区三区| 成人网站免费看黄a站视频| 亚洲精品无码av片| 久久青草亚洲AV无码麻豆|