亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工智能理論的機(jī)器自動翻譯系統(tǒng)

        2020-12-23 06:57:07霍小靜
        微型電腦應(yīng)用 2020年11期
        關(guān)鍵詞:人工智能

        霍小靜

        摘 要:以高精度翻譯多種自然語言的單詞/語句為目標(biāo),設(shè)計基于人工智能的機(jī)器自動翻譯系統(tǒng)。首先設(shè)計了機(jī)器自動翻譯系統(tǒng)的總體結(jié)構(gòu),然后重點描述了機(jī)器自動翻譯系統(tǒng)的核心模塊,該模塊獲取單詞/語句通過訓(xùn)練獲取詞向量,初始詞向量并賦予詞性特征,采用對數(shù)線性模型實現(xiàn)多種自然語言的單詞/語句的詞向量多特征融合翻譯,最后進(jìn)行了實例分析與驗證。結(jié)果表明,該系統(tǒng)可高精度翻譯自然語言,在不同句型、不同并發(fā)用戶量、未登錄詞不同字符數(shù)量下,系統(tǒng)翻譯性能較為穩(wěn)定,能夠滿足實際應(yīng)用需求。

        關(guān)鍵詞:人工智能;機(jī)器自動翻譯;詞向量;低頻詞

        中圖分類號:TP391

        文獻(xiàn)標(biāo)志碼:A

        文章編號:1007-757X(2020)11-0077-03

        Abstract:In order to translate the words/sentences of many natural languages with high precision, a machine automatic translation system based on artificial intelligence is designed. The overall structure of the MT system is designed firstly, and then the core module of the MT system is described. The module obtains the word vector and the initial word vector, and gives the part of speech features through training. The log linear model is used to realize the word vector multi feature fusion translation of multiple natural languages. Finally, an example is analyzed. The results show that the system can translate natural languages with high accuracy. Under different sentence patterns, different concurrent users and different characters of non-login words, the system has stable translation performance and can meet the practical application requirements.

        Key words:artificial intelligence;machine automatic translation;word vector;low frequency word

        0?引言

        機(jī)器翻譯將大數(shù)據(jù)技術(shù)和計算機(jī)系統(tǒng)作為運(yùn)行基礎(chǔ),可在確保翻譯正確率和實時性的同時,通過人工智能理論不斷優(yōu)化內(nèi)部結(jié)構(gòu),提高翻譯質(zhì)量[1]。翻譯并非是語言服務(wù)的全部,僅是語言服務(wù)的一個細(xì)化內(nèi)容。機(jī)器翻譯不僅解決了語言服務(wù)的初翻譯問題,還可解決語言服務(wù)的內(nèi)容管理、項目管理等內(nèi)容。當(dāng)前計算機(jī)技術(shù)推動機(jī)器自動翻譯系統(tǒng)發(fā)展,機(jī)器自動翻譯系統(tǒng)被很多高校與研究機(jī)構(gòu)使用,進(jìn)入實用化與商品化階段[2-4]。人工智能技術(shù)的出現(xiàn),使得機(jī)器自動翻譯系統(tǒng)的翻譯效果得以提升[5-7]。

        本文圍繞人工智能理論,設(shè)計了基于人工智能的機(jī)器自動翻譯系統(tǒng),該系統(tǒng)翻譯模塊采用基于多特征融合的神經(jīng)網(wǎng)絡(luò)翻譯模型,不單可以去除語義、詞義中差異,還可以實現(xiàn)多特征融合的機(jī)器自動翻譯。

        1?人工智能的機(jī)器自動翻譯系統(tǒng)

        1.1?系統(tǒng)架構(gòu)設(shè)計

        人工智能的機(jī)器自動翻譯系統(tǒng)架構(gòu)設(shè)計圖,如圖1所示。

        系統(tǒng)由用戶應(yīng)用模塊、翻譯模塊與系統(tǒng)管理模塊構(gòu)成。用戶應(yīng)用模塊為用戶提供登錄、翻譯服務(wù),翻譯模塊實現(xiàn)多種自然語言間單詞/語句翻譯,將反饋結(jié)果呈現(xiàn)至用戶。系統(tǒng)管理員通過管理模塊進(jìn)行查詢、修改翻譯規(guī)則。

        翻譯模塊為人工智能的機(jī)器自動翻譯系統(tǒng)的核心,其架構(gòu)圖如圖2所示。

        用戶使用系統(tǒng)時,在翻譯界面輸入翻譯請求后,翻譯模塊將翻譯請求以詞向量的形式傳輸至服務(wù)器,服務(wù)器使用神經(jīng)網(wǎng)絡(luò)翻譯模型翻譯單詞/語句,能夠設(shè)定訪問次數(shù)限制,完成并發(fā)請求的分配。

        1.2?多特征融合的神經(jīng)網(wǎng)絡(luò)翻譯模型

        神經(jīng)網(wǎng)絡(luò)是人工智能理論技術(shù)中的一種,采用多特征構(gòu)建翻譯模型,將用戶輸入的單詞/語句通過訓(xùn)練獲取詞向量。對詞向量融入詞性特征,去除語義、詞義中差異。

        1.2.1?詞向量訓(xùn)練

        構(gòu)建基于連續(xù)詞向量學(xué)習(xí)方法的詞向量訓(xùn)練模型,詞向量訓(xùn)練模型,如圖3所示。

        1.2.2?低頻詞替換

        使用具備詞性特征的詞向量,運(yùn)算多種自然語言詞和詞之間的近似水平后,把系統(tǒng)知識庫中未登錄詞(低頻詞)通過詞典中和它近似水平最大的詞替換掉,降低未登錄詞的數(shù)目[8]。

        (1) 將翻譯語句單詞分成高頻詞和低頻詞。

        (2) 計算詞向量運(yùn)算低頻和高頻詞的相似度。

        1.2.3?多特征融合

        (1) 使用對數(shù)線性模型融合多種語言的詞性特征。對數(shù)線性模型,如式(5)。

        (2) 針對某些語句與其描述內(nèi)容存在詞不表意情況時,使用文本詞干、詞綴序列依次建模的形式,獲取自然語言A特征,如式(6)、式(7)。

        式中,ε、μ依次描述詞綴與詞干特征函數(shù)權(quán)重;Ω1、Ω2分別為詞綴、詞干序列的特征函數(shù)。

        1.2.4?模型構(gòu)建

        通過最大似然估計的方法訓(xùn)練式(5),設(shè)置詞向量特征訓(xùn)練集為(j,φj),多特征融合的神經(jīng)網(wǎng)絡(luò)翻譯結(jié)果,如式(8)。

        2?實例測試

        2.1?語料庫

        采用本文系統(tǒng)對CWMT201英漢新聞領(lǐng)域語句進(jìn)行翻譯,CWMT2017英漢新聞領(lǐng)域語句詳情,如表1所示。

        表1中,CWMT2017英漢新聞領(lǐng)域語句訓(xùn)練集20 000個英漢新聞領(lǐng)域語句,用于訓(xùn)練本文系統(tǒng)中基于多特征融合的神經(jīng)網(wǎng)絡(luò)翻譯模型;開發(fā)集20 000個英漢新聞領(lǐng)域語句,用于優(yōu)化本文系統(tǒng)中基于多特征融合的神經(jīng)網(wǎng)絡(luò)翻譯模型參數(shù),測試集20 000個英漢新聞領(lǐng)域語句,用于測試本文系統(tǒng)翻譯效果。

        2.2?召回率統(tǒng)計

        以召回率為判斷指標(biāo),本文系統(tǒng)對英漢語句翻譯效果的召回率,如圖4所示。

        分析圖4可知,不同語句數(shù)量下,本文系統(tǒng)翻譯結(jié)果召回率高,翻譯結(jié)果有效。

        2.3?不同句型下的系統(tǒng)翻譯性能測試

        設(shè)定需要英漢翻譯的句型依次是簡單陳述句、一般疑問句、并列復(fù)合句、從屬復(fù)合句、特殊用法句。測試本文系統(tǒng)對不同句型翻譯后,單詞翻譯正確的語句數(shù)、結(jié)構(gòu)正確的語句數(shù)、語義正確的語句數(shù),如表2所示。

        表2中翻譯結(jié)果顯示,本文系統(tǒng)翻譯5種存在差異的句型后,單詞翻譯正確的語句數(shù)、結(jié)構(gòu)正確的語句數(shù)、語義正確的語句數(shù)為19 999個,和原始數(shù)量相比,缺少1個,原因是特殊用法句不存在通用翻譯模式,但本文系統(tǒng)對簡單陳述句、一般疑問句、并列復(fù)合句和從屬復(fù)合句翻譯后,語句的單詞翻譯、結(jié)構(gòu)和語義全部正確。

        2.4?系統(tǒng)的翻譯耗時和BLEU分?jǐn)?shù)

        使用翻譯能力類似的4名學(xué)生設(shè)成初級翻譯組Q1,使用4名在翻譯單位存在至少4年翻譯經(jīng)驗的翻譯員設(shè)成高級翻譯組Q2,分析兩個翻譯組使用本文系統(tǒng)前后的BLEU分?jǐn)?shù),BLEU分?jǐn)?shù)是對于一個給定的句子,有標(biāo)準(zhǔn)譯文S1,還有一個本文系統(tǒng)翻譯的結(jié)果S2,對于本文系統(tǒng)翻譯S2的所有短語而言,具有多少個短語出現(xiàn)在S1中,此比率即為BLEU的分?jǐn)?shù)。 初級翻譯組、高級翻譯組使用本文系統(tǒng)前后的翻譯耗時與BLEU分?jǐn)?shù),如表3所示。

        分析表3可知,初級翻譯組、高級翻譯組使用本文系統(tǒng)前后的翻譯耗時與BLEU分?jǐn)?shù)差異明顯,使用后的BLEU分?jǐn)?shù)均大于95分,由此可證本文系統(tǒng)能夠提高翻譯速度,優(yōu)化翻譯效果。

        2.5?并發(fā)用戶量對本文系統(tǒng)影響

        設(shè)定并發(fā)用戶量依次是150~550個,測試本文系統(tǒng)響應(yīng)用戶翻譯指令時,系統(tǒng)的響應(yīng)耗時,如表4所示。

        表4中,伴隨并發(fā)用戶量增多,本文系統(tǒng)對用戶指令的響應(yīng)耗時低于1 s,最大值僅有609 ms,原因是本文系統(tǒng)翻譯模塊中,使用解碼器提升了系統(tǒng)的并發(fā)處理性能,優(yōu)化了系統(tǒng)響應(yīng)速度。

        2.6?未登錄詞字符對本文系統(tǒng)翻譯性能影響

        提取CWMT201英漢新聞領(lǐng)域語句中未登錄詞字符數(shù)分別是50~250個的語句,在此條件下,測試本文系統(tǒng)翻譯結(jié)果的BLEU分?jǐn)?shù),如圖5所示。

        當(dāng)需要翻譯語句的未登錄詞字符數(shù)是100個、200個時,本文系統(tǒng)翻譯結(jié)果的BLEU分?jǐn)?shù)為97分,當(dāng)需要翻譯語句的未登錄詞字符數(shù)是300個,甚至大于300個時,翻譯結(jié)果的BLEU分?jǐn)?shù)為96分,雖存在小幅度變化,但是分值大于95分,較為理想。未登錄詞字符對本文系統(tǒng)翻譯性能不存在顯著影響。

        3?總結(jié)

        為了獲得理想的機(jī)器翻譯結(jié)果,設(shè)計了基于人工智能的機(jī)器自動翻譯系統(tǒng),并以CWMT201英漢新聞領(lǐng)域語句為例,進(jìn)行翻譯性能測試。結(jié)果表明,本文系統(tǒng)翻譯結(jié)果,召回率較高,翻譯結(jié)果可信;翻譯速度快,具有十分廣泛的應(yīng)用前景。

        參考文獻(xiàn)

        [1]?侯強(qiáng),侯瑞麗.機(jī)器翻譯方法研究與發(fā)展綜述[J].計算機(jī)工程與應(yīng)用,2019,55(10):30-35.

        [2]?哈里旦木·阿布都克里木,劉洋,孫茂松.神經(jīng)機(jī)器自動翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比[J].清華大學(xué)學(xué)報(自然科學(xué)版), 2017, 57(8):878-883.

        [3]?蘇依拉,烏尼爾,劉婉婉.基于統(tǒng)計分析的蒙漢自然語言的機(jī)器翻譯[J].北京工業(yè)大學(xué)學(xué)報, 2017, 43(1):36-42.

        [4]?李強(qiáng), 黃輝, 周沁,等. 模板驅(qū)動的神經(jīng)機(jī)器翻譯[J]. 計算機(jī)學(xué)報, 2019, 42(3):116-131.

        [5]?李北,王強(qiáng),肖桐, 等.面向神經(jīng)機(jī)器翻譯的集成學(xué)習(xí)方法分析[J].中文信息學(xué)報, 2019, 33(3):42-51.

        [6]?葉紹林,郭武.基于句子級BLEU指標(biāo)挑選數(shù)據(jù)的半監(jiān)督神經(jīng)機(jī)器翻譯[J].模式識別與人工智能, 2017,30(10):937-942.

        [7]?王亞娟, 李曉, 楊雅婷,等. 基于釋義信息的維漢機(jī)器自動翻譯系統(tǒng)融合研究[J]. 計算機(jī)工程, 2019, 45(4):294-301.

        [8]?朱順樂.融合多特征的漢維神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型[J].計算機(jī)工程與設(shè)計, 2019, 40(5):1484-1488.

        [9]?劉宇鵬,馬春光,張亞楠.深度遞歸的層次化機(jī)器翻譯模型[J]. 計算機(jī)學(xué)報, 2017, 40(4):861-871.

        (收稿日期:2020.04.11)

        猜你喜歡
        人工智能
        我校新增“人工智能”本科專業(yè)
        用“小AI”解決人工智能的“大”煩惱
        汽車零部件(2020年3期)2020-03-27 05:30:20
        當(dāng)人工智能遇見再制造
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        AI人工智能解疑答問
        人工智能與就業(yè)
        基于人工智能的電力系統(tǒng)自動化控制
        人工智能,來了
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        人工智能來了
        久久熟女乱一区二区三区四区| 欧美精品中文字幕亚洲专区| 国产喷水福利在线视频| 777久久| 日本一区二区三区在线视频播放 | 日韩内射美女人妻一区二区三区| 天天躁日日躁狠狠躁人妻| 欧美自拍区| 亚洲精彩视频一区二区| 91成人自拍在线观看| 国模无码一区二区三区不卡| a级毛片内射免费视频| 91啦视频在线观看| 日韩精品人妻一区二区三区蜜桃臀| 国内自拍偷国视频系列| 亚洲日韩av一区二区三区中文| 免费无码又爽又刺激聊天app| 亚洲另类激情专区小说婷婷久| 精品人妻一区二区三区不卡毛片| 日韩人妻中文无码一区二区| 免费黄色影片| 国产一区二区波多野结衣| 亚洲中文字幕有综合久久| 日韩少妇人妻中文视频| 老熟妇仑乱视频一区二区| 污污污污污污污网站污| 亚洲女同一区二区久久| 蜜臀av一区二区三区免费观看 | 无夜精品久久久久久| 国产在线视频一区二区三| 中文字幕人乱码中文字幕| 久久久久久成人毛片免费看| 国产一区二区丁香婷婷| 亚洲色图在线免费视频| 国产精品欧美福利久久| 97SE亚洲国产综合自在线不卡| 亚洲女同精品久久女同| 91九色人妻精品一区二区三区| 精品av天堂毛片久久久| 男人的天堂av网站一区二区| 中文字幕一区二区人妻性色av |