湖南張家界不少出租車司機經常拉“老外”,不會外文也能交流無礙;2019 世界人工智能大會上,各國大咖扎堆演講,現場卻不見同聲傳譯者;更多中國人海外游,面對東京的日文菜單不再一頭霧水,漫步在巴黎街頭也不再因不懂法語而慌張……
這一切都源于一項近年來不斷取得突破的技術——機器翻譯。
全球知名翻譯公司“一小時翻譯”首席執(zhí)行官奧弗·紹尚曾指出,未來一至兩年內,基于神經網絡翻譯技術的機器翻譯將會承擔價值400億美元翻譯市場上的近一半工作,預計會導致50萬名翻譯失業(yè)。
神經機器翻譯(NMT)自2014年在科學論文中首次被提及以來,已使機器翻譯領域出現翻天覆地的變化,它開始全面超越以統(tǒng)計模型為基礎的統(tǒng)計機器翻譯(SMT),快速成為在線翻譯系統(tǒng)的主流標配。
神經機器翻譯的“神經元”可以學習和收集信息,模仿人類大腦的神經元建立聯系。它克服了傳統(tǒng)方法將句子分割為不同片段進行翻譯的缺點,充分利用上下文信息,對句子進行整體編碼和解碼,從而生成更為流暢的譯文。
市面上的神經機器翻譯系統(tǒng)越來越多,國內的阿里巴巴、騰訊、百度、科大訊飛、搜狗,國外的谷歌、臉書、微軟等都在布局,這使相關技術發(fā)生質變。
如今,許多出租車司機都能用手機上的翻譯軟件,輕松和外國朋友溝通。在不少國際會議上,機器翻譯干脆直接扮演現場同聲傳譯角色。
語音識別技術發(fā)展在這場翻譯革命中也功不可沒。語音識別包括遠場識別、噪聲識別以及多輪交互,是人工智能的重要切入點。
因此,這場機器翻譯技術革命正是人工智能革命夢想照進現實的重要一環(huán)。
“以前,人工智能的翻譯質量往好了說,也就是讓你能對文本的內容有個大致了解,專業(yè)翻譯寧愿自己從頭開始翻,”奧弗·紹尚說,“如今,通過神經機器翻譯,人們只要對機器翻譯內容進行少量修改,就能獲得人性化翻譯?!?/p>
近年來,隨著深度學習的進展,機器翻譯技術飛速發(fā)展,翻譯質量大幅提升,與此同時,機器翻譯應用量也正呈加速增加態(tài)勢。
比如,阿里巴巴達摩院基于Transformer結構進行了網絡結構的改進和對詞語位置信息的充分利用,全面改進了機器翻譯的性能,幫助速賣通平臺上的中國及全球中小賣家,將產品詳情與評論自動翻譯成當地語言,還實現了實時人工智能語言翻譯的客戶服務與業(yè)務咨詢。阿里巴巴的電商機器翻譯總量已達到每日7.5億次。在電子郵件和網站頁面語言轉換方面,谷歌公司稱,其機器翻譯服務每天在全世界被使用超過10億次。
旅游業(yè)對翻譯需求更加旺盛。文旅部數據顯示,2018年中國公民出境旅游接近1.5億人次,較2017年增長14.7%。解決語言溝通問題正成為越來越多中國出境游客的迫切需求。
許多中國游客借助智能翻譯軟件和機器,輕松解決國外道路路牌、餐館菜單和超市購物,甚至在旅途中認識外國朋友。
機器翻譯的應用場景正不斷豐富,越來越多的政府和企業(yè)網站需將內容“多語言化”,視頻網站可能需要借助機器翻譯將視頻內容翻譯成多語言版本,就連人工翻譯服務供應商也會借助機器翻譯來提升人工翻譯的效率。
圖/東方IC
隨著人工智能技術的發(fā)展,“機器取代人”的趨勢日益顯現,傳統(tǒng)人工翻譯公司的市場份額正在不斷被機器翻譯公司占領。“時代的發(fā)展讓傳統(tǒng)翻譯企業(yè)壓力倍增。”傳神語聯網網絡科技股份有限公司董事長兼CEO何恩培說,在1分鐘內,機器的翻譯速度是50萬字,而人工翻譯最快速度僅為300字,頂級編輯閱讀速度為每分鐘1500字,也就是說機器翻譯的速度已遠遠超過了人閱讀的速度。
盡管如此,何恩培認為“機器翻譯還無法代替人類譯員”,因為語言作為人類特有的認知能力,涉及社會、文化、語境、心理等多個方面,短時間內,機器翻譯要做到真正的“信、達、雅”,仍面臨不少困難。
加拿大國家研究委員會研究員、阿里巴巴達摩院資深算法專家陳博興表示,由于中文的語義復雜性,在谷歌翻譯的一次測試中,中英互譯的準確率遠低于法語和西班牙語的英語互譯,如在公共場所常見的“小心碰頭”(Mind your head)標語,機器翻譯往往出現“Carefully bang head”“Meet carefully”“Look out,Knock head”等啼笑皆非的翻譯結果?!霸诳梢灶A見的未來,機器翻譯質量還達不到專業(yè)譯員水平。”陳博興表示,與人工翻譯相比,機器翻譯成本低得多,其適用于對翻譯錯誤有一定容忍度的場景,如日常會話、資訊信息、社交網絡等。今后,大量簡單的可讀翻譯會被機器取代,但優(yōu)質翻譯仍將是人的天下,專業(yè)譯員不必太擔心失業(yè)問題。
陳博興介紹,2017年,人工語言服務約翻譯了1500億個詞語,全球翻譯市場規(guī)模約450億美元,同比增速超過10%;2018年,機器每一天的在線翻譯量就高達8000億至1萬億詞語,其市場空間驚人。“在政商會見、合同文書等專業(yè)翻譯領域,人機共譯模式將是未來的發(fā)展方向?!焙味髋嗾J為,隨著人工智能技術升級,每一名譯員背后都會配有專屬翻譯電腦,在數年學習、適應譯員的翻譯風格后,就像警察和警犬一樣分工協作,使人工翻譯速度提高40倍至100倍。