亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工智能在機器翻譯中的應(yīng)用研究

        2021-12-07 16:24:48郭明陽張曉玲唐會玲孟慶端任龍波
        關(guān)鍵詞:人工智能語言信息

        郭明陽, 張曉玲, 唐會玲, 孟慶端,任龍波

        (河南科技大學(xué) a.外國語學(xué)院;b.信息工程學(xué)院;c.電氣工程學(xué)院, 河南 洛陽 471023)

        1 人工智能在機器翻譯中應(yīng)用的研究意義

        人工智能(artificial intelligence,AI)是指研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。隨著計算機技術(shù)與信息技術(shù)的快速發(fā)展,人工智能對機器翻譯進行了整體闡述,主要包括自然語言處理、機器人學(xué)和知識系統(tǒng)等方面。機器翻譯是自然語言處理技術(shù)的一個分支,注重利用計算機技術(shù)實現(xiàn)一種人類語言(源語言)到另外一種人類語言(目標語言)的自動翻譯或轉(zhuǎn)換。例如,借助于人工智能技術(shù),翻譯者和技術(shù)人員可以首先對機器的整體翻譯方案開展均勻抽樣;然后采用蒙特卡羅等方法模擬具體文本的翻譯過程,計算每種排布方式下的機器翻譯效率,從而生成大數(shù)據(jù)翻譯樣本供人工智能算法學(xué)習(xí),進而采用人工神經(jīng)網(wǎng)絡(luò)高效地擬合出翻譯架構(gòu)排布與機器翻譯效率之間的關(guān)系;最后結(jié)合遺傳算法尋找機器翻譯的最優(yōu)排布方式。人工智能技術(shù)已經(jīng)應(yīng)用于以谷歌翻譯、百度翻譯為代表的網(wǎng)絡(luò)即時翻譯和以譯星、雅信譯霸為代表的專業(yè)翻譯系統(tǒng)中。

        人工智能技術(shù)雖然尚處于發(fā)展階段,但其應(yīng)用前景是非常明晰的。2017年7月,國務(wù)院發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,人工智能已經(jīng)成為重要的國家戰(zhàn)略。各大經(jīng)濟體均處于同一起跑線上,對人工智能的研究和應(yīng)用均處于投入探索階段[1]。結(jié)合中國國際貿(mào)易高端人才不足、知識經(jīng)濟生產(chǎn)力發(fā)展亟待提速等問題,在新經(jīng)濟時代人工智能技術(shù)給了中國難得的趕超機會。翻譯能力的核心在于與翻譯過程中的各方保持積極的活動關(guān)系,并生產(chǎn)出符合客戶要求的譯文[2]。人工智能以及機器翻譯的各項技術(shù)加速發(fā)展,正在不斷地提升人類對于各種語言信息的處理能力,彌補人工翻譯在速度和成本方面的不足。智能語音、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)機器翻譯等技術(shù)越來越成熟,人工智能給許多行業(yè)帶來了重要影響和挑戰(zhàn)[3]。

        2 人工智能和機器翻譯的研究進程

        伴隨著人工智能的進一步發(fā)展,機器翻譯能夠更好地滿足大多數(shù)一般性翻譯需求,但面對專業(yè)、多元、細致并蘊含人文情感的復(fù)雜溝通翻譯任務(wù),機器翻譯目前仍然難以替代人工翻譯。當前人工智能發(fā)展中顯現(xiàn)出互為鏡像、互為嵌入和互為信息的人機關(guān)系趨勢[4]。因此,目前機器翻譯會和人工譯員一起協(xié)同工作。但是,在這種協(xié)作翻譯的關(guān)系中,以前簡單的“機器輔助翻譯”模式已經(jīng)越來越多地被人工智能交互翻譯(artificial intelligence interactive translation,AIIT)所取代,這是翻譯技術(shù)能力的進步[5]。機器翻譯和計算機輔助翻譯的很多工作,也將會由日益完善的人工智能交互翻譯來完成。

        3 基于人工智能技術(shù)的機器翻譯

        人工智能在機器翻譯中的廣泛應(yīng)用程度與人工智能技術(shù)的進步和機器翻譯功能的提升有關(guān),這一點在專業(yè)翻譯中體現(xiàn)得尤為明顯。嚴格意義上來講,計算機網(wǎng)絡(luò)信息本身是一個龐大的數(shù)據(jù)信息庫,而這個數(shù)據(jù)庫又是由海量的子數(shù)據(jù)庫構(gòu)成的[6]。有些翻譯語料所涉及的領(lǐng)域很多,技術(shù)性和專業(yè)性都很強,而且語料內(nèi)容信息豐富,因此文本內(nèi)容會經(jīng)常出現(xiàn)重復(fù)現(xiàn)象。根據(jù)相關(guān)統(tǒng)計數(shù)據(jù)顯示,有些需要機器翻譯的技術(shù)資料相關(guān)內(nèi)容重復(fù)率能達到40%以上。針對這種情況,人工智能可以依據(jù)機器翻譯的基本原理——翻譯記憶自動對重現(xiàn)的語料成分進行翻譯,例如對前文翻譯過的語句或者語段部分進行快速比對,然后高速呈現(xiàn)翻譯結(jié)果,這樣就極大地提高了機器翻譯的工作效率,并且能夠保證機器前后翻譯內(nèi)容具有一致性,從技術(shù)層面上保證了譯文具有更高的質(zhì)量。

        出于提升翻譯效率和確保翻譯內(nèi)容一致性的考慮, 人工智能在機器翻譯的應(yīng)用系統(tǒng)中,通常會設(shè)置系統(tǒng)翻譯組件,例如翻譯記憶庫和術(shù)語管理組件。翻譯記憶庫主要是指人工智能在機器翻譯系統(tǒng)中所構(gòu)建的語料原文和翻譯內(nèi)容相對應(yīng)的等值語料庫。當機器翻譯系統(tǒng)開始進行翻譯工作時,人工智能會自動對需要翻譯的文本資料在翻譯語料庫中進行存儲和比對,在整個翻譯過程中,人工智能通過對程序代碼進行掃描,發(fā)現(xiàn)有相似或相近的翻譯內(nèi)容時,人工智能系統(tǒng)會自動將其與翻譯語料庫內(nèi)容進行匹配,通過語境和語言使用系統(tǒng)進行確認后,就可以快速將最終翻譯結(jié)果呈現(xiàn)在用戶界面。隨著人工智能技術(shù)的不斷提升,能夠支持模糊匹配的機器翻譯系統(tǒng)也在不斷升級,人工智能系統(tǒng)通過對算法的不斷改進,可以自動設(shè)置語料原文和譯文之間的最小匹配值(如60%或者80%)。然后,通過模糊匹配程序搜索翻譯記憶庫中的語料,即便是對于那些不能實現(xiàn)完全匹配的句型,人工智能也可以通過機器翻譯達到相似的內(nèi)容確認,再通過語言使用系統(tǒng)或者人工譯員進行確認,實現(xiàn)人工智能與人工譯員的互動互助。目前,這樣的工作模式既能夠保證高水平的翻譯質(zhì)量,又能夠讓機器翻譯通過人工智能的自我學(xué)習(xí)程序提升翻譯的質(zhì)量和效率。

        未來,學(xué)習(xí)能力和數(shù)據(jù)處理能力更加強大的人工智能系統(tǒng)將幫助機器翻譯更好地完成工作?,F(xiàn)有的翻譯記憶庫通過人工智能的自我學(xué)習(xí)程序也可以不斷更新,并能夠自動識別和存儲新語料。隨著翻譯記憶庫數(shù)據(jù)的不斷擴大,在大數(shù)據(jù)技術(shù)的支持下,人工智能能夠使機器翻譯的工作效率不斷提升。通過網(wǎng)絡(luò)共享功能,人工智能可以通過對海量網(wǎng)絡(luò)翻譯數(shù)據(jù)進行精確算法分析,從而提升人工智能的自我學(xué)習(xí)能力,使機器翻譯越來越接近人工翻譯的質(zhì)量。

        3.1 人工智能技術(shù)在機器翻譯中的應(yīng)用

        進入21世紀以來,人工智能技術(shù)快速發(fā)展,應(yīng)用領(lǐng)域也越來越廣泛,尤其是專家系統(tǒng)技術(shù)、人工神經(jīng)網(wǎng)絡(luò)和智能決策支持系統(tǒng)在機器翻譯的研究和應(yīng)用中取得了顯著進步。

        3.1.1 專家系統(tǒng)技術(shù)在機器翻譯中的應(yīng)用

        從近些年人工智能研究的成效來看,知識庫專家系統(tǒng)和知識工程成為人工智能研究領(lǐng)域最具有實踐意義的成果,并進行了商業(yè)化運作,經(jīng)濟效益初現(xiàn)。所謂專家系統(tǒng),是指一種基于知識的系統(tǒng),其實質(zhì)是使系統(tǒng)的構(gòu)造和運行都基于控制對象和控制規(guī)律的各種專家知識的數(shù)據(jù)積累。這種人工智能的電腦程序構(gòu)建了一套具有某個專業(yè)領(lǐng)域?qū)<业闹R和經(jīng)驗水平的集成系統(tǒng),并具備解決實際專業(yè)問題的能力。發(fā)展專家系統(tǒng)的關(guān)鍵在于表達和運用專家知識,即來自人類專家的且已被證明能夠解決某領(lǐng)域內(nèi)典型問題的有用的事實和過程[7]。隨著專家系統(tǒng)和翻譯大數(shù)據(jù)技術(shù)的不斷完善,人工智能可以根據(jù)多位翻譯專家分享的翻譯領(lǐng)域知識、工作經(jīng)驗進行有效地推理和判斷, 模擬翻譯專家決策的過程來解決那些翻譯實踐中遇到的各種復(fù)雜問題。

        (2)力學(xué)性能檢測 試件按照ASME IX卷要求進行取樣和力學(xué)性能試驗,取樣位置如圖1所示,各項檢測結(jié)果如表6~表9所示。

        專家系統(tǒng)技術(shù)在機器翻譯中的應(yīng)用主要基于翻譯專家的專業(yè)知識和實踐經(jīng)驗,采用知識表達翻譯技術(shù),建立翻譯模型和翻譯數(shù)據(jù)庫,利用語言知識和以往的翻譯工作經(jīng)驗進行語義推理,制訂翻譯決策控制機制,為機器翻譯提供最優(yōu)控制以及決策支持等。翻譯專家系統(tǒng)的出現(xiàn),改變了過去傳統(tǒng)翻譯單純依靠字對字、詞對詞翻譯的落后局面,使知識模型與翻譯大數(shù)據(jù)進行了有機整合,將知識信息處理技術(shù)與控制技術(shù)相結(jié)合,使機器翻譯的效率和準確率都有了很大程度的提升。

        3.1.2 人工神經(jīng)網(wǎng)絡(luò)在機器翻譯中的應(yīng)用

        神經(jīng)網(wǎng)絡(luò)的信息處理是由神經(jīng)元之間的相互作用實現(xiàn)的:知識與信息的存儲主要表現(xiàn)為網(wǎng)絡(luò)元件互連間分布式的物理聯(lián)系[8]。近年來,人工神經(jīng)網(wǎng)絡(luò)在機器翻譯中的應(yīng)用領(lǐng)域取得了很大的進步,具體體現(xiàn)在機器翻譯算法、語言學(xué)習(xí)等方面,并在文字符號處理、語音識別、最優(yōu)計算、語言信息智能處理、翻譯模式識別等領(lǐng)域不斷取得進展。例如谷歌公司的神經(jīng)機器翻譯(Google’s neural machine translation,GNMT)系統(tǒng),由帶有8個編碼器和8個解碼器的深度長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)組成,并采用了殘差連接對梯度、位置信息等進行傳遞,在英-西、英-中和英-法等多個語對中,與之前的基于短語的機器翻譯(phrase-based machine translation,PBMT)系統(tǒng)相比,翻譯錯誤率降低了60%,已經(jīng)與人類中級譯員的水平不相上下。

        隨著中國“一帶一路”倡議的提出和逐步實施,客觀上沿途各國間的交流溝通有了更廣泛的需求,尤其是在語言轉(zhuǎn)換處理和商務(wù)信息交流方面為機器翻譯提供了廣泛的市場需要,也蘊含著巨大的市場價值。隨著機器翻譯功能的不斷提升,在文化教育交流和商務(wù)洽談中需要使用機器翻譯功能的應(yīng)用場景也越來越多,互聯(lián)網(wǎng)上語言翻譯的市場需求也愈來愈大,要對機器翻譯系統(tǒng)進行有效管理,提升機器翻譯的效率,保證翻譯的質(zhì)量就需要人工智能,尤其是人工神經(jīng)網(wǎng)絡(luò)。為了使機器翻譯的各項系統(tǒng)正常運轉(zhuǎn)且能降低運行成本,提高經(jīng)濟效益,就要不斷提升機器翻譯的自動控制水平、語言信息快速處理能力和翻譯系統(tǒng)運行管理水平。人工智能的自主學(xué)習(xí)和深度學(xué)習(xí)功能,為具有快速學(xué)習(xí)與自適應(yīng)能力的人工神經(jīng)網(wǎng)絡(luò)在系統(tǒng)控制方面提供了監(jiān)督與非監(jiān)督操練。人工神經(jīng)網(wǎng)絡(luò)在機器翻譯中的應(yīng)用包括練習(xí)語言輸入與輸出集合、調(diào)節(jié)神經(jīng)元加權(quán)系數(shù)、語言信息的分類與自組織,并為機器翻譯系統(tǒng)的高級控制奠定了堅實的基礎(chǔ)。

        在人工智能的控制下,機器翻譯能夠按照不同的數(shù)學(xué)建模方式,采用多元化的翻譯策略,根據(jù)不同的信息運算和處理原理進行實際運作。例如,機器翻譯能夠自主研究不同語言符號的特征,構(gòu)建出準確有效的翻譯算法,并且通過適時調(diào)節(jié)翻譯參數(shù)來確定不同的翻譯標準,以適應(yīng)譯文的文化和語言特征,并能夠在人工神經(jīng)網(wǎng)絡(luò)的控制下,對于智能機器翻譯設(shè)備的實時運行動態(tài)和語言信號處理進行有效地檢測、調(diào)節(jié)及故障診斷,進而研制出具有高效自主學(xué)習(xí)能力、自主適應(yīng)功能和自主管理功能的創(chuàng)新性的智能自動化控制系統(tǒng)。這一系統(tǒng)在機器翻譯設(shè)備上的有效應(yīng)用極大地提高了機器翻譯的效能。同時,機器翻譯控制需要準確的語言結(jié)構(gòu)仿真模型,以及準確、靈活的信息處理系統(tǒng)。由于早期機器翻譯模式的非互聯(lián)性,機器翻譯的語料信息不能及時更新,機器翻譯的控制系統(tǒng)無法實現(xiàn)在線運行和實時更新。而在新的人工神經(jīng)網(wǎng)絡(luò)語言信息翻譯處理模型中,由于采取動態(tài)學(xué)習(xí)更新建模的方式,提升了翻譯模型的運轉(zhuǎn)效率。并且這類機器翻譯產(chǎn)品在投放市場時,能夠根據(jù)不同消費群體的需要和物價承受能力,采用個性化、差異化的機器翻譯資源和硬件配置,更好地控制了硬件部分的花費,滿足了更多消費者不同的翻譯需求。尤其是更新的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)策略搭載性能具有更強大的信息處理芯片,實現(xiàn)了真正意義上的神經(jīng)網(wǎng)絡(luò)運算和人工智能控制,使機器翻譯產(chǎn)品的性能不斷提升。由此可以看出:帶有人工神經(jīng)網(wǎng)絡(luò)的機器翻譯產(chǎn)品,在未來的實際生活使用中能夠更加貼切地滿足個人用戶和個性化需求。同時智能化的機器翻譯系統(tǒng)預(yù)示出了人工智能語言學(xué)習(xí)模式的更新,提升了以往機器翻譯產(chǎn)品的運算速度和翻譯質(zhì)量。這一嶄新的機器翻譯和語言學(xué)習(xí)模式的研發(fā),將會給不同文化背景和語言使用者帶來高效率、低花費的應(yīng)用體驗。

        3.1.3 智能決策支持系統(tǒng)在機器翻譯中的應(yīng)用

        伴隨著超級計算機運算技術(shù)、網(wǎng)絡(luò)數(shù)據(jù)庫技術(shù)和物聯(lián)網(wǎng)技術(shù)的高速發(fā)展,智能決策支持系統(tǒng)在機器翻譯中也開始了部分翻譯場景的應(yīng)用。網(wǎng)絡(luò)數(shù)據(jù)庫技術(shù)、云計算和深度學(xué)習(xí)使智能決策這一人工智能技術(shù)控制機器翻譯成為可能,尤其是分布式數(shù)據(jù)庫和網(wǎng)絡(luò)互聯(lián)計算技術(shù)的發(fā)展,更有利于將智能決策系統(tǒng)融入到機器翻譯智能化系統(tǒng)集成中,使得機器翻譯實現(xiàn)智能化。

        智能決策支持系統(tǒng)整合了超級計算機技術(shù)、人工智能技術(shù)和管理科學(xué)的相關(guān)研究成果,是一種有利于提升機器翻譯效度和信度的創(chuàng)新性的信息管理技術(shù)。這項人工智能信息管理技術(shù)依托運籌學(xué)、管理科學(xué)和控制論行為科學(xué)的最新研究成果,積極采用最新的計算機信息挖掘技術(shù),在處理半結(jié)構(gòu)化和非結(jié)構(gòu)化的翻譯決策問題中成效顯著。在對譯文翻譯質(zhì)量的最終控制方面,智能決策支持系統(tǒng)能夠進行有效的決策活動,為機器翻譯最終產(chǎn)品的呈現(xiàn)提供決策所需要的數(shù)據(jù)、信息和資料,并能夠明確決策目標。在針對不同機器翻譯問題時,智能決策支持系統(tǒng)也能夠?qū)τ龅降姆g問題進行快速地甄別和認知,并建立和整改決策計算模型,提供盡可能多的翻譯備選譯文。智能決策支持系統(tǒng)可以幫助翻譯機器對各種翻譯技術(shù)方案進行優(yōu)化,并能夠分析、區(qū)分出不同質(zhì)量的翻譯作品,不斷提升機器翻譯的決策能力、決策質(zhì)量和決策效益,以產(chǎn)生更大的經(jīng)濟效益和社會效益。

        3.1.4 人工智能技術(shù)在機器翻譯中的應(yīng)用場景及優(yōu)缺點對比分析

        基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)的機器翻譯優(yōu)勢在于翻譯反應(yīng)速度快、用戶花費少,可應(yīng)用于工作量大的翻譯項目,但其自身也存在著一些問題。例如,神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)一般包括兩個遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),其中一個主要用來接受輸入文本,將輸入的源語言文本轉(zhuǎn)化為表征空間中的向量,另一個遞歸神經(jīng)網(wǎng)絡(luò)主要是將其轉(zhuǎn)化為目標語句??梢詫⑵湟暈橐粋€語言模型來預(yù)測目標語言的下一個詞匯文本信息,而且其概率依賴于源語言,并通過注意力網(wǎng)絡(luò)連接。但這樣的架構(gòu)需要海量的計算資源,而且人工神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)在應(yīng)對專業(yè)術(shù)語和非常用翻譯文本方面表現(xiàn)乏力。很多情況下只能對原文進行復(fù)制,而沒有進行任何翻譯操作。在處理冗長文本信息時,基于人工神經(jīng)網(wǎng)絡(luò)的機器翻譯會出現(xiàn)文本信息丟失的現(xiàn)象,甚至?xí)z漏重要的文本信息。所以人工神經(jīng)網(wǎng)絡(luò)一般應(yīng)用于網(wǎng)絡(luò)即時翻譯場景,主要為了滿足一般性的翻譯需求。神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)還在不斷發(fā)展,例如,隨著大數(shù)據(jù)技術(shù)和波束搜索等技術(shù)的發(fā)展,其翻譯準確率也在不斷提升。谷歌的神經(jīng)機器翻譯系統(tǒng)宣稱,在多個主要語言對的翻譯中將翻譯誤差降低了55%~85%。

        專家系統(tǒng)技術(shù)在機器翻譯中的應(yīng)用,有效解決了人工神經(jīng)網(wǎng)絡(luò)機器翻譯存在的許多問題,例如,目前的人工神經(jīng)網(wǎng)絡(luò)在文本翻譯時過多地只關(guān)注單詞和句子信息的翻譯,而忽視段落結(jié)構(gòu)及文本上下文語境信息的連接,詞匯文本信息在不同語境下的語言含義搜索和識別效率不高。但專家系統(tǒng)自身也存在著信息更新速度慢、系統(tǒng)構(gòu)建要求高、建設(shè)費用投資大、建設(shè)周期長、應(yīng)用領(lǐng)域過于細化等問題,所以專家系統(tǒng)技術(shù)多應(yīng)用于專業(yè)領(lǐng)域的高端翻譯場景,在高級譯員培訓(xùn)、復(fù)雜語言信息識別、翻譯技術(shù)信息庫建設(shè)和翻譯技術(shù)資源網(wǎng)站開發(fā)等方面應(yīng)用比較廣泛。

        隨著經(jīng)濟發(fā)展模式的不斷創(chuàng)新,新的翻譯需求也呈現(xiàn)多樣性和定制化的特點。智能決策支持系統(tǒng)在垂直領(lǐng)域以及機構(gòu)定制化機器翻譯系統(tǒng)中得到了應(yīng)用。翻譯市場對于機器翻譯的實用性和靈活性的要求不斷促使智能決策支持系統(tǒng)對機器翻譯、CAT工具、術(shù)語管理等翻譯技術(shù)進行整合,尤其是對本地化工具、翻譯管理系統(tǒng)、計算機輔助翻譯等組件進行架構(gòu)重組。但由于人工智能技術(shù)還處于不斷發(fā)展的階段,智能決策支持系統(tǒng)的發(fā)展還不甚完善,其建設(shè)過程還面臨著很多技術(shù)挑戰(zhàn),例如人工智能技術(shù)的不確定性發(fā)展、人機信任機制建立等具體問題,所以,目前智能決策支持系統(tǒng)主要應(yīng)用于機器翻譯譯后編輯(machine translation post-editing, MTPE)和機器翻譯輔助工具的開發(fā)。圖像翻譯也有望進入智能決策支持系統(tǒng)的應(yīng)用場景。

        3.2 人工智能在機器翻譯中的具體實現(xiàn)模式

        人工智能在機器翻譯中的具體實現(xiàn)主要包括3個領(lǐng)域:(1)研究會聽、說、讀、寫和譯的電腦程序, 實現(xiàn)自然語言處理;(2)研制智能化的翻譯機器,具有視覺和聽覺程序處理能力, 并能識別周圍環(huán)境,靈活應(yīng)對遇到的翻譯問題;(3)開發(fā)通過符號識別來模擬人類翻譯專家行為的程序, 即翻譯專家系統(tǒng)。從研究的本質(zhì)來說, 人工智能一般可分為理論研究和工程研究兩個領(lǐng)域。理論研究主要是指依據(jù)有關(guān)開發(fā)和理解人和機器智能方面的理論進行前瞻性研究和探索, 而工程研究則主要是研發(fā)人工智能的工具和類似翻譯專家系統(tǒng)這樣的實用商品。人工智能在機器翻譯中的具體實現(xiàn)模式包括: 對于翻譯信息和相關(guān)知識的人工智能處理、翻譯文字符號的智能處理以及人工智能對于翻譯問題的智能化處理等方面。可以說, 人工智能在機器翻譯中的具體實現(xiàn)模式,就是一種具有靈活信息處理能力和信息演示能力的結(jié)合體。

        3.3 人工智能對于現(xiàn)有機器翻譯技術(shù)的提升作用

        專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)和智能決策支持系統(tǒng)技術(shù)應(yīng)用于機器翻譯技術(shù)的開發(fā),能夠有效提升機器翻譯的效率。例如,基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)的機器翻譯建設(shè)方案,有望解決傳統(tǒng)的基于短語的機器翻譯系統(tǒng)運作效率不高的缺點。翻譯準確度和速度是翻譯效率的重要觀測點。通用的機器翻譯方法主要有兩種:基于規(guī)則的機器翻譯方法和基于語料庫的機器翻譯方法。喬姆斯基(Chomsky)的轉(zhuǎn)換生成語法理論是基于規(guī)則的機器翻譯方法的理論基礎(chǔ),這種技術(shù)方案主要是采用語言規(guī)則來對自然語言的內(nèi)部結(jié)構(gòu)規(guī)律進行描述, 并對自然語言進行形式化的處理。首先,要對輸入的句子進行分析,獲得其句法分析樹;然后,根據(jù)轉(zhuǎn)換規(guī)則把源語言句子結(jié)構(gòu)映射到目標語句子結(jié)構(gòu)上;最后,根據(jù)目標語句子結(jié)構(gòu)對生成的譯文進行最終的語言加工,并可采用直接翻譯法、中間語言法和轉(zhuǎn)換法等模式對源語言進行機器翻譯。人工智能技術(shù)的高感知和高速運算能力對于上述這些機器翻譯模式意義重大。

        語料庫語言學(xué)是基于語料庫的機器翻譯方法的基礎(chǔ),需要獲取大量語料來建立語料庫,這就要求通過大規(guī)模整理互為譯文的雙語語料,并由這些語料的電子格式來建立支撐機器翻譯的語料庫,這些語料信息將作為獲取翻譯知識和統(tǒng)計數(shù)據(jù)的依據(jù)。也可以直接采用語料庫進行機器翻譯中的語料分析、轉(zhuǎn)換和生成。從技術(shù)層面來看,基于語料庫的機器翻譯方法主要有兩種:基于實例的機器翻譯和基于統(tǒng)計的機器翻譯(statistical machine translation,SMT)。其中,基于實例的機器翻譯方法主要是指在雙語語料庫中,通過編輯或查找與需要翻譯的源語言類似的參考實例來對源語言進行翻譯?;诮y(tǒng)計的機器翻譯方法主要是指在雙語語料庫中,通過使用從語料庫中建造的概率模型來對輸入的需要翻譯的源語言自動搜索出一個相似度概率最高的譯文。這種方法的難度取決于對源語言和翻譯目標語進行句對的對齊,并通過詞匯同現(xiàn)可能性的方法將源語言的詞匯映射到目標語言詞匯的比對概率進行計算,進而形成與源語言詞匯表達意義概率學(xué)上最接近的翻譯文本。無論是高速運轉(zhuǎn)的可靠的語料庫的構(gòu)建和管理,還是進行比對概率的高速運算,都離不開人工智能技術(shù)的不斷創(chuàng)新。例如,在處理冗長文本信息的翻譯工作時,谷歌的神經(jīng)機器翻譯引入了注意力機制,將解碼器的底層連接到了編碼器的頂層,從而使機器翻譯系統(tǒng)能夠更為準確高效地應(yīng)對這些復(fù)雜信息。殘差連接技術(shù)的應(yīng)用實現(xiàn)了通過提升并行性來降低機器翻譯訓(xùn)練時間的目標。在推理計算過程中,采用低精度運算方案,從而能夠更快地為用戶呈現(xiàn)出翻譯結(jié)果。

        3.4 人工智能對于機器語言分析和翻譯技術(shù)的推動作用

        機器翻譯在實際運用過程中要處理很多復(fù)雜問題,尤其是要時刻應(yīng)對語言知識復(fù)雜性和文化背景多樣性的挑戰(zhàn)。在應(yīng)對這些翻譯難題時,要利用現(xiàn)代技術(shù)手段[9]。從技術(shù)層面上來看,機器翻譯要同時處理兩種或者兩種以上的語言信息符號,這就需要翻譯機器能夠?qū)υ凑Z言進行語言分析,這是第一步要做的?;谡Z法或者語義的中間結(jié)構(gòu)在理解分析源語言過程中發(fā)揮著重要作用。之后,翻譯機器要對介于源語言和目標語言的中間語言結(jié)構(gòu)進行進一步分析,為下一步進行目標語言的語法或者語義的中間結(jié)構(gòu)的轉(zhuǎn)換打好基礎(chǔ)。在完成上述程序后,才能最終進行語言符號的梳理轉(zhuǎn)換,形成最終的目標語言的呈現(xiàn)表述。由此可見,語言分析對于機器翻譯作用明顯,語言分析的能力直接影響著機器翻譯的質(zhì)量,毫無疑問,具有人工智能的機器翻譯在進行語言分析時,具有更多的優(yōu)勢。

        不同語言之間一般具有明顯的差異性,尤其體現(xiàn)在語法規(guī)律和表達習(xí)慣上,不同語言文字符號系統(tǒng)在詞匯、句子、語法、語義和語境等語言學(xué)信息方面表現(xiàn)出了信息量表述不對稱性的特點,這就使機器翻譯工作面臨著諸多挑戰(zhàn),也需要借助日益發(fā)展的人工智能技術(shù)來解決翻譯實踐中出現(xiàn)的很多具體問題。從某種層面上來說,具有人工智能的翻譯機器是在不斷認知不同語言系統(tǒng)間各自的運作規(guī)律,深入學(xué)習(xí)和辨識篇章、段落、句群在內(nèi)的各種語境信息,并對上述相關(guān)信息進行快速準確地解碼和編碼的過程。除了語言內(nèi)部系統(tǒng)的差異,機器翻譯還要在人工智能的控制下考慮到因為文化背景差異, 導(dǎo)致不同自然語言系統(tǒng)對一些類似或相近語義信息表達時出現(xiàn)相當大的差異性。除此之外,機器翻譯還需要處理不同語言詞匯之間相近意義表述的翻譯,不同語言文化中隱喻的認知,不同語言系統(tǒng)對于不同使用習(xí)慣的詞匯表達的信息處理,容易拼寫錯誤或者翻譯存在誤差的詞語的使用,詞語使用和語言的不同搭配習(xí)慣,在不同語境下同形異義詞的使用等問題。語言搭配是指詞語或者固定短語之間自由組合并具有規(guī)律性呈現(xiàn)的語言現(xiàn)象。在機器翻譯等自然語言處理任務(wù)中,語言搭配發(fā)揮著重要作用。機器翻譯的質(zhì)量往往和語言搭配語料資源的質(zhì)量和應(yīng)用相關(guān)。高效且容量較大的語料庫搭配資源能夠極大地提升自然語言處理的效率。

        翻譯能力的發(fā)展是一個動態(tài)的互動過程,與語言學(xué)習(xí)一樣[10]。翻譯不是單純由漸次輸入引導(dǎo)的線性過程,而是充滿高峰、低谷、前進、倒退、停滯、甚至跳躍式前進的動態(tài)系統(tǒng)行為[11]。機器翻譯在認知和處理不同語言中的隱喻現(xiàn)象時,往往遇到極大的困難。這不僅僅是由于隱喻是一種語言修辭方法,而且還是一種思維模式,它體現(xiàn)了不同人群進行思維和行動的觀念系統(tǒng)的本質(zhì)特征,是不同人群認知、思維乃至語言表述和寫作的基礎(chǔ)。機器難以具備直覺能力、想象能力、靈感和審美能力[12]。由于文化背景、宗教信仰、 生活生產(chǎn)方式、神話傳說、認知模式、社會風俗、文學(xué)作品和自然環(huán)境等存在差異,不同語言系統(tǒng)對于隱喻的理解也存在著巨大差異。這就需要具有高速運算能力的人工智能能夠快速辨認、認知、理解、儲存、比對這些隱喻信息,并將這些海量語言信息進行高速數(shù)據(jù)處理,建立語法隱喻模式集和詞匯隱喻模式集,并通過常規(guī)或?qū)嵗姆椒? 或是推理和統(tǒng)計的方法進行隱喻信息數(shù)據(jù)計算,從而幫助翻譯機器有效地辨識和理解不同語言中存在的隱喻現(xiàn)象,進而更好地完成翻譯任務(wù)。

        機器翻譯的語義理解能力直接與翻譯產(chǎn)品的質(zhì)量密切相關(guān)。人工智能可以很大程度上提升機器翻譯的語義理解能力。一般認為,語義理解能力包含3個方面:(1)基于相關(guān)語言知識基礎(chǔ)的語言層級理解;(2)基于人類知識系統(tǒng)基礎(chǔ)的知識面層級的知識層次理解;(3)基于當時參與語言交流的人員的語用層次理解。在多種語言認知和處理過程中可以發(fā)現(xiàn),針對同一種事物,不同自然語言對其表述存在很大的差異。也就是說,自然語言語義對應(yīng)存在著很多語義偏移現(xiàn)象,即一種事物在一種自然語義中的映射與其在另外一種自然語言中的語義模塊存在偏移,并不是一一對應(yīng)的。由此可見,能否對這些現(xiàn)象進行快速準確有效地理解和辨析,并能夠進行相對應(yīng)的翻譯處理,考驗著機器翻譯的工作能力。目前,感知智能的發(fā)展已經(jīng)比較成熟, 它通過數(shù)學(xué)建模和基于大數(shù)據(jù)的深度學(xué)習(xí)等方法對人類感知能力進行模擬, 輔助人類完成任務(wù)[13]。人工智能可以很好地幫助機器翻譯應(yīng)對這些挑戰(zhàn)。因為語言分析能力在機器翻譯能力構(gòu)建中具有重要作用,所以通過人工智能來加強語言的對比分析并研究相應(yīng)的人工翻譯技術(shù)體系,是機器翻譯的重點研究領(lǐng)域。原有的機器翻譯具有很多局限性,例如,對于自然語言的語言描述與語言知識分析準確度不夠高,無法有效地理解并消除語言歧義的現(xiàn)象,對于隱喻的辨識能力不強或者根本無法辨識,對于不同自然語言形式描述過于粗糙、達不到精準描述的層級等,這些問題制約著機器翻譯能力的提升。尤其是能否讓翻譯機器快速識別并處理容易誤解、誤譯詞語的形式化研究,是一項亟待解決的技術(shù)難題。這些問題的最終解決,離不開人工智能技術(shù)的發(fā)展,因為人工智能具有強大的學(xué)習(xí)能力。學(xué)習(xí)是人類智能的重要特征,是獲得知識的基本手段,而機器學(xué)習(xí)也是使計算機具有智能的根本途徑[14]。在現(xiàn)有技術(shù)基礎(chǔ)上,人工智能通過不斷學(xué)習(xí)已經(jīng)在一些機器翻譯技術(shù)研究方面取得了顯著進步。例如,在加強詞對齊技術(shù)的研究與應(yīng)用方面,提升了從源語言詞匯到目標語言詞匯映射研究的精度和廣度,并構(gòu)建了詞對齊技術(shù)的統(tǒng)計模型。 通過數(shù)據(jù)挖掘技術(shù),能夠從文本數(shù)據(jù)中自動獲取高質(zhì)量的映射信息,并通過相應(yīng)的算法把獵取的映射數(shù)據(jù)運用到自然語言處理工作中。人工智能技術(shù)還可以幫助翻譯機器通過單詞對齊的搭配技術(shù)自動匹配相應(yīng)的算法,取得詞匯搭配概率、位置扭曲概率和詞匯繁殖度概率,并將這些數(shù)據(jù)信息通過相應(yīng)的匹配運算整合到同一個統(tǒng)計模型中,以便更加高效地尋找句子中有可能存在的相關(guān)詞匯搭配的可能性。人工智能技術(shù)也可以幫助翻譯機器在整理和尋找雙語詞對齊中,經(jīng)過預(yù)估詞組內(nèi)部的搭配概率來研判該詞組是否有可能成為一個整體對齊,來制約雙語詞對齊中多詞單元的對齊。在機器翻譯工作中,人工智能技術(shù)能夠經(jīng)過計算來感知短語與待翻譯句子里上下文之間的搭配關(guān)系,判定短語與待翻譯句子的匹配程度,并能夠以此為基礎(chǔ)構(gòu)建出數(shù)據(jù)量大、質(zhì)量高、可擴充的語料庫。在這個語料庫中,包含有語義語法模式集、固定搭配以及變量庫、短語模式集、字面意義模式集、帶有句法語義變量的翻譯模板、句法語義變量和語義類型樹等子系統(tǒng),這些系統(tǒng)的建立為機器翻譯的能力提升打下了良好的基礎(chǔ)。由此可見,一臺計算機若不會學(xué)習(xí),就不能被稱為是具有智能的計算機[15]。通過人工智能自身學(xué)習(xí)能力的提升,機器翻譯的能力也在不斷增強。

        3.5 人工智能與機器翻譯技術(shù)系統(tǒng)構(gòu)建

        人工智能技術(shù)使得世界一體化的翻譯市場的形成成為可能[16]。根據(jù)人工智能技術(shù)發(fā)展的現(xiàn)狀,以及人工智能在機器翻譯應(yīng)用的趨勢,可以看出現(xiàn)有基于人工智能技術(shù)的機器翻譯系統(tǒng)主要包含以下組件:(1)基于人工智能技術(shù)的機器翻譯系統(tǒng)的核心組件和主界面是工作空間,它賦予了機器翻譯具有跨領(lǐng)域應(yīng)用程序的集成能力,這就使翻譯用戶可以在現(xiàn)有常用瀏覽器風格的界面中集中控制所有機器翻譯組件, 并能在人工智能技術(shù)的控制下對所有的翻譯項目和工作流程進行有效地管理。(2)基于人工智能技術(shù)的機器翻譯系統(tǒng)構(gòu)建一般也會有一個翻譯者工作臺,能夠與MSWord XP/2010/2018等軟件操作系統(tǒng)進行無縫對接,現(xiàn)有的運算能力能夠支持多種語言之間的多向互譯。翻譯用戶可以在微軟公司的Word軟件運行中進行相關(guān)交互翻譯。在人工智能技術(shù)的支持下,翻譯者工作臺能夠適時有效地使用后臺運行能力強大的神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)庫,為翻譯工作者和產(chǎn)品用戶儲存并管理源文本和翻譯好的作品,并已經(jīng)實現(xiàn)對源文本的自動翻譯?;谌斯ぶ悄芗夹g(shù)的機器翻譯系統(tǒng)也已經(jīng)實現(xiàn)為用戶動態(tài)提示相關(guān)譯文語句,自動保留源文本格式,并與其他文本處理應(yīng)用軟件有著良好的兼容性。(3)術(shù)語管理組件也是機器翻譯系統(tǒng)的重要構(gòu)成組件,其主要功能是通過人工智能技術(shù)掃描原文中出現(xiàn)的術(shù)語,并由計算機在機器翻譯的專業(yè)語料庫中進行搜索和比對?,F(xiàn)代信息技術(shù)和互聯(lián)網(wǎng)的高速發(fā)展推動著術(shù)語和計算機技術(shù)的結(jié)合日益大眾化[17]?;谌斯ぶ悄艿臋C器翻譯技術(shù)的原理,決定了其應(yīng)用效率與需要翻譯的文本的內(nèi)容重現(xiàn)率有關(guān)。例如,若是源文本前后內(nèi)容表述具有術(shù)語的一致性或短語的一致性等特點,人工智能技術(shù)會通過掃描在機器翻譯語料庫中相對應(yīng)的術(shù)語,并自動匹配出合適的參考譯文。術(shù)語管理組件的功能主要是為了保持相同術(shù)語翻譯的統(tǒng)一性,其翻譯內(nèi)容的質(zhì)量與計算翻譯中專業(yè)語料庫的質(zhì)量和規(guī)模有密切關(guān)系。這些組件的工作效率隨著人工智能技術(shù)的進步也在不斷提升。(4)為了能夠?qū)C器翻譯系統(tǒng)中的語料庫系統(tǒng)進行適時更新,也為了機器翻譯的作品能夠適應(yīng)不斷變化更新的語言使用現(xiàn)象,人工智能技術(shù)支持機器翻譯系統(tǒng)具有術(shù)語抽取能力。這一系統(tǒng)能夠在各種海量文本數(shù)據(jù)中自動抽取翻譯項目所需的術(shù)語,并通過人工智能強大的自運算能力和高效的數(shù)據(jù)運算模型,實現(xiàn)單語或雙語術(shù)語表的自動生成。(5)機器翻譯系統(tǒng)中也會包括匹配建庫系統(tǒng)組件,這一功能組件主要是使用戶能夠在人工智能技術(shù)的幫助下對以往的翻譯成品資料實現(xiàn)回收,其實際使用意義是為了將源文本和譯文作品進行相關(guān)數(shù)據(jù)的適時對比和分析,以計算出相關(guān)匹配值,并將具有高匹配值的語言翻譯模塊或者單語或雙語術(shù)語表輸入到機器翻譯系統(tǒng)自建的翻譯記憶庫中,及時反饋給翻譯者工作臺系統(tǒng)使用。在人工智能的管理下,機器翻譯系統(tǒng)還能夠集成微軟Word軟件的字典功能,從而為更多的語言使用和翻譯者提供功能更為強大的書寫自檢服務(wù)。

        4 人工智能幫助機器翻譯提升工作效率

        隨著全球化和信息化進程不斷推進,海量的翻譯需求給全球語言服務(wù)行業(yè)帶來了前所未有的機遇和挑戰(zhàn)[18]。在面對多語言翻譯任務(wù)時,機器翻譯應(yīng)用面臨的一大挑戰(zhàn)就是如何快速高效地挖掘不同語言系統(tǒng)的內(nèi)部運作規(guī)律。語言服務(wù)業(yè)相信人機交互才是未來的發(fā)展趨勢[19]。人工智能能夠幫助翻譯機器高效率地發(fā)掘語言系統(tǒng)內(nèi)部的運行關(guān)系,從而實現(xiàn)幫助機器翻譯提升工作效率的目的。其工作原理是通過廣泛挖掘數(shù)據(jù),包括句群、段落、篇章、體裁在內(nèi)的各種語言信息的原始數(shù)據(jù),并在設(shè)定好的各種語境狀況下對這些信息進行編碼或解碼。 互聯(lián)網(wǎng)與人工智能蓬勃發(fā)展,信息技術(shù)對翻譯工作的滲透程度日益深化[20]。人工智能支持在機器翻譯中發(fā)揮其語言分析的作用,并通過尋找、定位、解析語言運行的各項特征,在經(jīng)過高速運算后對語言特征進行有目的的對比分析,創(chuàng)新性地研究詞對齊技術(shù),并將之應(yīng)用到機器翻譯的工作過程中,實現(xiàn)通過具有高速運算能力的人工智能來重新構(gòu)建詞對齊技術(shù)的統(tǒng)計模型。這一模型包含了大規(guī)模、高質(zhì)量、可擴充的語義單元庫,這些單元庫或者語料庫能夠推動機器翻譯的不斷發(fā)展。若是將相應(yīng)的人工翻譯技術(shù)體系全面應(yīng)用到機器翻譯系統(tǒng)中,能夠極大地提升機器翻譯的響應(yīng)速度和工作效率。在大數(shù)據(jù)時代,搜集和利用網(wǎng)絡(luò)上龐大的數(shù)據(jù)資源已經(jīng)成為亟待解決的問題[21]。下一階段,人工智能在利用大數(shù)據(jù)技術(shù)幫助機器翻譯結(jié)果更符合母語使用者習(xí)慣和特征方面,將會發(fā)揮更大的作用。

        猜你喜歡
        人工智能語言信息
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        讓語言描寫搖曳多姿
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        累積動態(tài)分析下的同聲傳譯語言壓縮
        下一幕,人工智能!
        南風窗(2016年19期)2016-09-21 16:51:29
        我有我語言
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        亚洲欧洲精品成人久久曰不卡| 一本加勒比hezyo无码专区| 亚洲一区二区三区播放| 精品亚洲成a人7777在线观看| 色妺妺视频网| av无码av在线a∨天堂app| 亚洲AV无码一区二区三区精神| 日本高清一区二区在线播放 | 久久久日韩精品一区二区三区| 欧美亚洲午夜| 尤物AV无码色AV无码麻豆| 丝袜美女美腿一区二区| 国产一级一片内射视频播放| 日日碰狠狠添天天爽| 久久香蕉成人免费大片| 久久久精品国产亚洲av网不卡| 亚洲av产在线精品亚洲第三站| 欧美丰满熟妇bbb久久久 | 亚洲午夜久久久精品国产| 国产tv不卡免费在线观看 | 日本女优激情四射中文字幕| 极品白嫩的小少妇| 毛片免费在线播放| 国产成年女人特黄特色毛片免| 国产高颜值女主播在线| 中文无码一区二区不卡αv| 亚洲h电影| 国产伦精品一区二区三区在线| 人妻精品视频一区二区三区| 麻豆精品久久久久久中文字幕无码| 精品成人av一区二区三区| 人妻无码aⅴ中文系列久久免费| 精品国产污黄网站在线观看| 亚洲综合天堂av网站在线观看| 无码少妇一区二区三区| 国产一级免费黄片无码AV| 国产熟女av一区二区三区四季| 一区二区在线视频免费蜜桃| 超级碰碰色偷偷免费视频| 亚洲国产99精品国自产拍| 免费观看一区二区三区视频|