文/吾守爾·斯拉木 范曉明
近現(xiàn)代以來,隨著歐洲文藝復(fù)興、工業(yè)革命,全球經(jīng)濟(jì)貿(mào)易文化交流與合作日益緊密,翻譯事業(yè)得到快速發(fā)展。
據(jù)不完全統(tǒng)計(jì),目前人類自然語言約有8000余種,即使最強(qiáng)大的語言大師,窮其一生也只能掌握30多種,人們在日常交往以及政治、經(jīng)濟(jì)、文化、科技等信息交互中,主要依賴翻譯或?qū)I(yè)翻譯機(jī)構(gòu)。
國人上小學(xué)起就開始學(xué)習(xí)外語,用外語交流總不如母語得心應(yīng)手,到頭來真正熟練掌握一門外語并非易事,更不用說掌握多門外語了。對于外國人來說,學(xué)習(xí)漢語同樣困難,不僅口語難學(xué),象形文字漢字尤其難學(xué),更不用說還有那么多各地方言!是否能夠不通過專業(yè)翻譯,不用學(xué)習(xí)其他語言,直接使用母語就能讓講不同語言的人們自由交流呢?
實(shí)現(xiàn)不同語種之間的無障礙溝通,一直都是人類終極夢想之一。早在1933年,法國工程師阿爾楚尼就萌生了機(jī)器翻譯的設(shè)想,并獲得一項(xiàng)翻譯機(jī)專利。
什么是機(jī)器翻譯呢?就是使用計(jì)算機(jī)把一種語言翻譯成另一種語言的一門學(xué)科。機(jī)器翻譯要遵循準(zhǔn)確、通順、優(yōu)美的基本原則,這個原則是我國清代思想家、翻譯家嚴(yán)復(fù)首先提出的。
近年來,國內(nèi)外著名高校、互聯(lián)網(wǎng)巨頭提出端到端的神經(jīng)機(jī)器翻譯,引入注意力機(jī)制,使得基于深度學(xué)習(xí)的機(jī)器翻譯獲得重大突破,神經(jīng)機(jī)器翻譯達(dá)到實(shí)用化階段。谷歌、微軟、百度、科大訊飛、騰訊等機(jī)器翻譯系統(tǒng)紛紛上線運(yùn)行,標(biāo)志著機(jī)器翻譯大規(guī)模應(yīng)用時代的到來,人類不同語種之間的無障礙溝通夢想或?qū)?shí)現(xiàn)。
我們的科研團(tuán)隊(duì)致力于機(jī)器翻譯前沿技術(shù)研究,承擔(dān)了原國家863計(jì)劃“維-漢機(jī)器翻譯”項(xiàng)目,應(yīng)用最先進(jìn)的基于詞對齊的統(tǒng)計(jì)翻譯模型研究出維-漢機(jī)器翻譯原型。20多年來,我們的科研團(tuán)隊(duì)面向絲綢之路經(jīng)濟(jì)帶和新疆少數(shù)民族信息化需要,在阿爾泰語系、閃含語系多語種操作系統(tǒng)、辦公套件、電子詞典、文字識別、語音識別、語音合成、機(jī)器翻譯等領(lǐng)域突破了一批關(guān)鍵核心技術(shù),取得了大量科研成果。
新疆大學(xué)與科大訊飛股份有限公司聯(lián)合研制的基于語音識別、語音合成、機(jī)器翻譯的漢語—維吾爾語雙向語音機(jī)器智能翻譯系統(tǒng)研制成功并正式上線,開始為新疆2300多萬漢族和少數(shù)民族群眾提供語言智能翻譯服務(wù),在社會治理、公共服務(wù)、文化交流、教育科研中發(fā)揮了巨大作用,初步實(shí)現(xiàn)了不同語種之間的無障礙溝通。
雖然翻譯機(jī)器的很多核心技術(shù)已掌握,但是多語言的共性模型(如通用聲學(xué)模型、語言模型、通用算法)和預(yù)料數(shù)據(jù),以及知識庫的構(gòu)建、相互轉(zhuǎn)換是當(dāng)前研究的難題,我們期待混合智能認(rèn)知計(jì)算及腦機(jī)融合技術(shù)將進(jìn)一步突破,讓機(jī)器具備人腦的感知、理解、推理、決策和學(xué)習(xí)能力,這是多種語言機(jī)器翻譯的目標(biāo)。
當(dāng)前,研究機(jī)構(gòu)人才眾多、投入也不少,但沒有形成合力,非常需要整合人力和物力資源,共同攻克“一帶一路”多語言互譯平臺建設(shè)的許多難關(guān),才能提升翻譯機(jī)器的研究水平及其產(chǎn)業(yè)化應(yīng)用。