湖南張家界不少出租車(chē)司機(jī)經(jīng)常拉“老外”,不會(huì)外文也能交流無(wú)礙;2019 世界人工智能大會(huì)上,各國(guó)大咖扎堆演講,現(xiàn)場(chǎng)卻不見(jiàn)同聲傳譯者;更多中國(guó)人海外游,面對(duì)東京的日文菜單不再一頭霧水,漫步在巴黎街頭也不再因不懂法語(yǔ)而慌張……
這一切都源于一項(xiàng)近年來(lái)不斷取得突破的技術(shù)——機(jī)器翻譯。
助推機(jī)器翻譯技術(shù)革命
全球知名翻譯公司“一小時(shí)翻譯”首席執(zhí)行官奧弗·紹尚曾指出,未來(lái)一至兩年內(nèi),基于神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)的機(jī)器翻譯將會(huì)承擔(dān)價(jià)值400億美元翻譯市場(chǎng)上的近一半工作,預(yù)計(jì)會(huì)導(dǎo)致50萬(wàn)名翻譯失業(yè)。
神經(jīng)機(jī)器翻譯(NMT)自2014年在科學(xué)論文中首次被提及以來(lái),已使機(jī)器翻譯領(lǐng)域出現(xiàn)翻天覆地的變化,它開(kāi)始全面超越以統(tǒng)計(jì)模型為基礎(chǔ)的統(tǒng)計(jì)機(jī)器翻譯(SMT),快速成為在線(xiàn)翻譯系統(tǒng)的主流標(biāo)配。
神經(jīng)機(jī)器翻譯的“神經(jīng)元”可以學(xué)習(xí)和收集信息,模仿人類(lèi)大腦的神經(jīng)元建立聯(lián)系。它克服了傳統(tǒng)方法將句子分割為不同片段進(jìn)行翻譯的缺點(diǎn),充分利用上下文信息,對(duì)句子進(jìn)行整體編碼和解碼,從而生成更為流暢的譯文。
市面上的神經(jīng)機(jī)器翻譯系統(tǒng)越來(lái)越多,國(guó)內(nèi)的阿里巴巴、騰訊、百度、科大訊飛、搜狗,國(guó)外的谷歌、臉書(shū)、微軟等都在布局,這使相關(guān)技術(shù)發(fā)生質(zhì)變。
如今,許多出租車(chē)司機(jī)都能用手機(jī)上的翻譯軟件,輕松和外國(guó)朋友溝通。在不少?lài)?guó)際會(huì)議上,機(jī)器翻譯干脆直接扮演現(xiàn)場(chǎng)同聲傳譯角色。
語(yǔ)音識(shí)別技術(shù)發(fā)展在這場(chǎng)翻譯革命中也功不可沒(méi)。語(yǔ)音識(shí)別包括遠(yuǎn)場(chǎng)識(shí)別、噪聲識(shí)別以及多輪交互,是人工智能的重要切入點(diǎn)。
因此,這場(chǎng)機(jī)器翻譯技術(shù)革命正是人工智能革命夢(mèng)想照進(jìn)現(xiàn)實(shí)的重要一環(huán)。
應(yīng)用場(chǎng)景日漸豐富
“以前,人工智能的翻譯質(zhì)量往好了說(shuō),也就是讓你能對(duì)文本的內(nèi)容有個(gè)大致了解,專(zhuān)業(yè)翻譯寧愿自己從頭開(kāi)始翻,”奧弗·紹尚說(shuō),“如今,通過(guò)神經(jīng)機(jī)器翻譯,人們只要對(duì)機(jī)器翻譯內(nèi)容進(jìn)行少量修改,就能獲得人性化翻譯?!?/p>
近年來(lái),隨著深度學(xué)習(xí)的進(jìn)展,機(jī)器翻譯技術(shù)飛速發(fā)展,翻譯質(zhì)量大幅提升,與此同時(shí),機(jī)器翻譯應(yīng)用量也正呈加速增加態(tài)勢(shì)。
比如,阿里巴巴達(dá)摩院基于Transformer結(jié)構(gòu)進(jìn)行了網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)和對(duì)詞語(yǔ)位置信息的充分利用,全面改進(jìn)了機(jī)器翻譯的性能,幫助速賣(mài)通平臺(tái)上的中國(guó)及全球中小賣(mài)家,將產(chǎn)品詳情與評(píng)論自動(dòng)翻譯成當(dāng)?shù)卣Z(yǔ)言,還實(shí)現(xiàn)了實(shí)時(shí)人工智能語(yǔ)言翻譯的客戶(hù)服務(wù)與業(yè)務(wù)咨詢(xún)。阿里巴巴的電商機(jī)器翻譯總量已達(dá)到每日7.5億次。在電子郵件和網(wǎng)站頁(yè)面語(yǔ)言轉(zhuǎn)換方面,谷歌公司稱(chēng),其機(jī)器翻譯服務(wù)每天在全世界被使用超過(guò)10億次。
旅游業(yè)對(duì)翻譯需求更加旺盛。文旅部數(shù)據(jù)顯示,2018年中國(guó)公民出境旅游接近1.5億人次,較2017年增長(zhǎng)14.7%。解決語(yǔ)言溝通問(wèn)題正成為越來(lái)越多中國(guó)出境游客的迫切需求。
許多中國(guó)游客借助智能翻譯軟件和機(jī)器,輕松解決國(guó)外道路路牌、餐館菜單和超市購(gòu)物,甚至在旅途中認(rèn)識(shí)外國(guó)朋友。
機(jī)器翻譯的應(yīng)用場(chǎng)景正不斷豐富,越來(lái)越多的政府和企業(yè)網(wǎng)站需將內(nèi)容“多語(yǔ)言化”,視頻網(wǎng)站可能需要借助機(jī)器翻譯將視頻內(nèi)容翻譯成多語(yǔ)言版本,就連人工翻譯服務(wù)供應(yīng)商也會(huì)借助機(jī)器翻譯來(lái)提升人工翻譯的效率。
未來(lái)人機(jī)翻譯相輔相成
隨著人工智能技術(shù)的發(fā)展,“機(jī)器取代人”的趨勢(shì)日益顯現(xiàn),傳統(tǒng)人工翻譯公司的市場(chǎng)份額正在不斷被機(jī)器翻譯公司占領(lǐng)?!皶r(shí)代的發(fā)展讓傳統(tǒng)翻譯企業(yè)壓力倍增?!眰魃裾Z(yǔ)聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司董事長(zhǎng)兼CEO何恩培說(shuō),在1分鐘內(nèi),機(jī)器的翻譯速度是50萬(wàn)字,而人工翻譯最快速度僅為300字,頂級(jí)編輯閱讀速度為每分鐘1500字,也就是說(shuō)機(jī)器翻譯的速度已遠(yuǎn)遠(yuǎn)超過(guò)了人閱讀的速度。
盡管如此,何恩培認(rèn)為“機(jī)器翻譯還無(wú)法代替人類(lèi)譯員”,因?yàn)檎Z(yǔ)言作為人類(lèi)特有的認(rèn)知能力,涉及社會(huì)、文化、語(yǔ)境、心理等多個(gè)方面,短時(shí)間內(nèi),機(jī)器翻譯要做到真正的“信、達(dá)、雅”,仍面臨不少困難。
加拿大國(guó)家研究委員會(huì)研究員、阿里巴巴達(dá)摩院資深算法專(zhuān)家陳博興表示,由于中文的語(yǔ)義復(fù)雜性,在谷歌翻譯的一次測(cè)試中,中英互譯的準(zhǔn)確率遠(yuǎn)低于法語(yǔ)和西班牙語(yǔ)的英語(yǔ)互譯,如在公共場(chǎng)所常見(jiàn)的“小心碰頭”(Mind your head)標(biāo)語(yǔ),機(jī)器翻譯往往出現(xiàn)“Carefully bang head”“Meet carefully”“Look out,Knock head”等啼笑皆非的翻譯結(jié)果?!霸诳梢灶A(yù)見(jiàn)的未來(lái),機(jī)器翻譯質(zhì)量還達(dá)不到專(zhuān)業(yè)譯員水平?!标惒┡d表示,與人工翻譯相比,機(jī)器翻譯成本低得多,其適用于對(duì)翻譯錯(cuò)誤有一定容忍度的場(chǎng)景,如日常會(huì)話(huà)、資訊信息、社交網(wǎng)絡(luò)等。今后,大量簡(jiǎn)單的可讀翻譯會(huì)被機(jī)器取代,但優(yōu)質(zhì)翻譯仍將是人的天下,專(zhuān)業(yè)譯員不必太擔(dān)心失業(yè)問(wèn)題。
陳博興介紹,2017年,人工語(yǔ)言服務(wù)約翻譯了1500億個(gè)詞語(yǔ),全球翻譯市場(chǎng)規(guī)模約450億美元,同比增速超過(guò)10%;2018年,機(jī)器每一天的在線(xiàn)翻譯量就高達(dá)8000億至1萬(wàn)億詞語(yǔ),其市場(chǎng)空間驚人?!霸谡虝?huì)見(jiàn)、合同文書(shū)等專(zhuān)業(yè)翻譯領(lǐng)域,人機(jī)共譯模式將是未來(lái)的發(fā)展方向?!焙味髋嗾J(rèn)為,隨著人工智能技術(shù)升級(jí),每一名譯員背后都會(huì)配有專(zhuān)屬翻譯電腦,在數(shù)年學(xué)習(xí)、適應(yīng)譯員的翻譯風(fēng)格后,就像警察和警犬一樣分工協(xié)作,使人工翻譯速度提高40倍至100倍。(據(jù)新華社、《湖北日?qǐng)?bào)》)