肖開容
(廣東外語(yǔ)外貿(mào)大學(xué),廣州510420;西南大學(xué),重慶400715)
提 要:大數(shù)據(jù)帶動(dòng)科學(xué)研究第四范式的出現(xiàn),引發(fā)科學(xué)思維的深刻變革。同樣,大數(shù)據(jù)驅(qū)動(dòng)的翻譯及翻譯研究也會(huì)發(fā)生翻譯思維的轉(zhuǎn)變,出現(xiàn)相關(guān)性翻譯、基于全部數(shù)據(jù)的概率度翻譯以及對(duì)不同精確度翻譯的區(qū)別性容忍。大數(shù)據(jù)和新技術(shù)催生新的翻譯現(xiàn)象,產(chǎn)生新的研究領(lǐng)域。對(duì)此,翻譯研究有必要更新學(xué)科體系、重新界定核心概念、采用新的研究方法,有效應(yīng)對(duì)大數(shù)據(jù)和新技術(shù)驅(qū)動(dòng)的多元化翻譯新形態(tài)。
上世紀(jì)80年代,著名未來學(xué)家阿爾文·托夫勒在《第三次浪潮》一書中指出,人類社會(huì)如今正進(jìn)入信息化社會(huì)。進(jìn)入21世紀(jì),大數(shù)據(jù)逐漸引起各界關(guān)注。2001年,美國(guó)高德納公司的分析師道格拉斯·蘭尼(D.Laney)對(duì)大數(shù)據(jù)的特征作出界定。2010年以來,大數(shù)據(jù)得到迅速發(fā)展。據(jù)IDC公司統(tǒng)計(jì),2011年全球被創(chuàng)建和復(fù)制的數(shù)據(jù)總量為1.8ZB(1021),遠(yuǎn)遠(yuǎn)超過人類有史以來所有印刷材料的數(shù)據(jù)總量(200PB)(李國(guó)杰 2012:8)。有專家預(yù)測(cè),到2020年全球數(shù)據(jù)量較2010年將增加43倍,達(dá)到35ZB(錢志新 2013:1)。
大數(shù)據(jù)掀起的浪潮影響深遠(yuǎn)。美國(guó)政府2012年3月宣布投入巨資啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,著名電商阿里巴巴集團(tuán)將大數(shù)據(jù)作為三大戰(zhàn)略之一。奧萊利(O'Reilly)更出驚言,聲稱“數(shù)據(jù)是下一個(gè)‘Intel inside’”,未來屬于將數(shù)據(jù)轉(zhuǎn)換成產(chǎn)品的公司和人們”(李國(guó)杰2012:8)。大數(shù)據(jù)同時(shí)引發(fā)科學(xué)研究范式的變革。2007年,圖靈獎(jiǎng)獲得者、微軟研究院高級(jí)研究員吉姆·格雷(J.Gray)在他人生最后一次演講中提出科學(xué)研究的“第四范式”,即基于數(shù)據(jù)密集型計(jì)算的科學(xué)研究范式(Hey et al.2012),這是繼計(jì)算科學(xué)時(shí)代的模擬研究范式以來的又一次科學(xué)研究范式革命,意味著科學(xué)思維的深刻變革。
翻譯以及翻譯研究與大數(shù)據(jù)浪潮的相遇不可避免,而且基于大數(shù)據(jù)的翻譯正在引發(fā)新的翻譯熱潮,重新點(diǎn)燃人們對(duì)機(jī)器翻譯以及與技術(shù)相結(jié)合、以數(shù)據(jù)為基礎(chǔ)的新型翻譯模式的希望。谷歌、百度、必應(yīng)和有道等公司顛覆機(jī)器翻譯基于規(guī)則的傳統(tǒng)模式,采用基于大規(guī)模平行語(yǔ)料的統(tǒng)計(jì)機(jī)器翻譯,推出在線、移動(dòng)端翻譯服務(wù),受到普通用戶熱捧。據(jù)悉,谷歌翻譯提供瀏覽器、網(wǎng)頁(yè)、移動(dòng)端3個(gè)平臺(tái),支持103種語(yǔ)言,擁有五億多用戶,每天翻譯量超過1000億單詞。2015年1月后陸續(xù)推出手機(jī)語(yǔ)音即時(shí)翻譯、拍攝翻譯和點(diǎn)擊翻譯等多種形態(tài)的翻譯。百度翻譯于2011年推出在線服務(wù),2013年又推出手機(jī)端服務(wù),2016年1月獲得2015年國(guó)家科技進(jìn)步二等獎(jiǎng),“通過開放應(yīng)用程序編程接口(API),為華為、金山、OPPO、敦煌網(wǎng)等上萬家第三方翻譯應(yīng)用提供支持”(張慧玉 馮全功2016)。
那么,在以大數(shù)據(jù)為背景的第四范式時(shí)代,翻譯思維將發(fā)生怎樣的變化,翻譯領(lǐng)域?qū)⒊霈F(xiàn)哪些新現(xiàn)象,翻譯研究應(yīng)采取何種理論思考,應(yīng)著力解決哪些問題,以順應(yīng)大數(shù)據(jù)和新技術(shù)進(jìn)步的趨勢(shì)。本文擬參照科學(xué)范式的本體論、認(rèn)識(shí)論和方法論維度,對(duì)翻譯研究的對(duì)象、理論思維和研究方法做一些嘗試性探索和思考。
托馬斯·庫(kù)恩在《科學(xué)革命的結(jié)構(gòu)》(1962)中將“范式”定義為:某一學(xué)科領(lǐng)域的科學(xué)家共同體共同遵從的世界觀和行為方式。科學(xué)演化遵循范式轉(zhuǎn)化的基本模式:前范式科學(xué)(無范式)—常規(guī)科學(xué)(建立范式)—科學(xué)革命(范式動(dòng)搖)—新常規(guī)科學(xué)(建立新范式)(庫(kù)恩2003)??茖W(xué)發(fā)展內(nèi)在規(guī)律以及外部條件推動(dòng)的共同作用,就會(huì)引發(fā)科學(xué)范式的演化。格雷指出,人類的科學(xué)研究共有4種范式,即:經(jīng)驗(yàn)科學(xué)時(shí)代的經(jīng)驗(yàn)范式、理論科學(xué)時(shí)代的理論范式、計(jì)算科學(xué)時(shí)代的模擬范式以及大數(shù)據(jù)科學(xué)時(shí)代的第四范式(Hey et al.2012:x)。經(jīng)驗(yàn)科學(xué)范式以描述經(jīng)驗(yàn)事實(shí)為主,較少做理論概括。理論科學(xué)范式以理論概括、演繹推理構(gòu)建科學(xué)定律和原理。計(jì)算科學(xué)的模擬范式通過模型建構(gòu)、定量分析和計(jì)算分析,借助計(jì)算機(jī)的模擬獲取研究發(fā)現(xiàn)。
如今,在大數(shù)據(jù)時(shí)代,科學(xué)研究面臨4大挑戰(zhàn),即大數(shù)據(jù)的挑戰(zhàn),信息技術(shù)發(fā)展的挑戰(zhàn),科學(xué)研究過程的挑戰(zhàn)以及科學(xué)數(shù)據(jù)管理貢獻(xiàn)的挑戰(zhàn)(鄧仲華 李志芳2013:20-21)。 在這些挑戰(zhàn)下,信息技術(shù)與科學(xué)家相遇,催生eScience,通過各種技術(shù)手段以及互聯(lián)網(wǎng)收集的大規(guī)模數(shù)據(jù),使科學(xué)家們能夠直接從密集型數(shù)據(jù)中了解事物之間的相關(guān)性,得出科學(xué)發(fā)現(xiàn),這便是格雷所說的第四范式。在這一范式下,數(shù)據(jù)不僅是研究的結(jié)果、手段和工具,更是研究的對(duì)象,研究者從對(duì)數(shù)據(jù)的研究中得出知識(shí)發(fā)現(xiàn)。
大數(shù)據(jù)的基本特點(diǎn)是“大”,蘭尼提出大數(shù)據(jù)的3V 特征,即體量(volume)、類型(variety)和處理速度(velocity)(Laney 2001)。 后來,人們又提出另外的3V加1C,即價(jià)值(value)、變化性(varia?bility)、準(zhǔn)確性(veracity)和處理與分析難度(com?plexity)(何小朝2014)。以大數(shù)據(jù)為基礎(chǔ)的第四范式研究呈現(xiàn)出與以往研究截然不同的科學(xué)思維,體現(xiàn)出3種轉(zhuǎn)變。
2.21 從因果關(guān)系到相關(guān)性的轉(zhuǎn)變
傳統(tǒng)的邏輯推理研究重在尋找因果關(guān)系,而大數(shù)據(jù)研究是對(duì)大數(shù)據(jù)做統(tǒng)計(jì)性搜索、比較、聚類和分類,尋找兩個(gè)或兩個(gè)以上變量取值之間存在的某種規(guī)律。上世紀(jì)90年代,美國(guó)沃爾瑪超市發(fā)現(xiàn)啤酒與尿布經(jīng)常同時(shí)出現(xiàn)在消費(fèi)者購(gòu)物籃里,于是將這兩種商品放在同一個(gè)區(qū)域,大大提升了啤酒的銷量。這就是通過數(shù)據(jù)統(tǒng)計(jì)分析尋找相關(guān)性的成功案例。嚴(yán)格來講,統(tǒng)計(jì)學(xué)方法無法、也不旨在檢驗(yàn)邏輯上的因果關(guān)系,但是通過大規(guī)模數(shù)據(jù)分析,往往能找到看似不相關(guān)變量之間的相關(guān)性,得出有實(shí)際效果的研究發(fā)現(xiàn)。
2.22 從隨機(jī)樣本到全部數(shù)據(jù)的轉(zhuǎn)變
維克托·邁爾-舍恩伯格在其著作《大數(shù)據(jù)時(shí)代》中指出,基于有限數(shù)據(jù)的隨機(jī)抽樣考察因便捷而深受青睞,但存在明顯缺陷。一方面,取樣的隨機(jī)性很難控制,難以避免偏見導(dǎo)致的誤差。另一方面,隨機(jī)采樣不適合考察子類別情況。當(dāng)需要了解更深層次的細(xì)分領(lǐng)域時(shí),隨機(jī)采樣方法就不可取。如今,大數(shù)據(jù)技術(shù)的發(fā)展使得全部數(shù)據(jù)模式和總體樣本考察成為可能。采樣的目的是用最少的數(shù)據(jù)得到最多的信息,當(dāng)可以獲得海量數(shù)據(jù)并加以分析的時(shí)候,隨機(jī)采樣方法就失去意義,全部數(shù)據(jù)成為考察的對(duì)象,因而可能得出更為直接的發(fā)現(xiàn)。
2.23 從精確性到混雜性的轉(zhuǎn)變
基于相對(duì)少量卻更具準(zhǔn)確度的數(shù)據(jù),可以在有限范圍內(nèi)得出有一定質(zhì)量的結(jié)果,但是其適用范圍也相對(duì)有限。大數(shù)據(jù)本身的構(gòu)成來源復(fù)雜決定其混雜性特征。目前,基于全部數(shù)據(jù)的統(tǒng)計(jì)分析已經(jīng)帶來一些成效,包括以谷歌翻譯為代表的統(tǒng)計(jì)機(jī)器翻譯取得的進(jìn)展,但是面對(duì)包含大量冗余信息的大數(shù)據(jù),第四范式下的科學(xué)活動(dòng)面臨巨大挑戰(zhàn)。李國(guó)杰指出,基于大數(shù)據(jù)的研究,重要的不僅是如何獲取越來越多的數(shù)據(jù),更重要的是,如何對(duì)數(shù)據(jù)去冗分類、去粗取精,從數(shù)據(jù)中挖掘知識(shí)(李國(guó)杰2012:14)。以前的研究一直追求從薄到厚,把小數(shù)據(jù)變成大數(shù)據(jù),現(xiàn)在要做的是從厚到薄,把大數(shù)據(jù)變成小數(shù)據(jù)。
參照第四范式的思維方式轉(zhuǎn)變,以大數(shù)據(jù)為基礎(chǔ)的翻譯體現(xiàn)出3種翻譯新思維,即相關(guān)性翻譯理念、基于全部數(shù)據(jù)的概率度翻譯和對(duì)不同精確度翻譯的區(qū)別性容忍。
2.31 相關(guān)性翻譯理念
這里的相關(guān)性翻譯指基于數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性(data?based statistical correlation)(褚東偉 2010:51)。古今中外,有關(guān)譯文與原文關(guān)系的討論總是圍繞著語(yǔ)言與意義的關(guān)系展開。不管是“詞對(duì)詞”與“意義對(duì)意義”翻譯的對(duì)立,“直譯”與“意譯”的爭(zhēng)鋒,還是各種不同“對(duì)等”的界定(如形式對(duì)等、動(dòng)態(tài)對(duì)等、功能對(duì)等、文體對(duì)等和語(yǔ)用對(duì)等等),“歸化”與“異化”的對(duì)立,以及“語(yǔ)義翻譯”與“交際翻譯”的差異,無一不是基于這樣一個(gè)基本假設(shè),即任何不同語(yǔ)言的表達(dá)之間總是存在著以共同的意義為基礎(chǔ)的對(duì)應(yīng)關(guān)系,這是聯(lián)系原文與譯文的必然紐帶。只不過語(yǔ)言表達(dá)方式和手段的差異,以及語(yǔ)言模糊性的限制,導(dǎo)致同一個(gè)源語(yǔ)文本的不同譯本之間也很難實(shí)現(xiàn)同一性(same?ness),更遑論處于不同語(yǔ)言中的譯文與原文之間(Bassnett 1980/1991: 36)。 所以,對(duì)等掩蓋原文與譯文之間的真實(shí)關(guān)系。從大數(shù)據(jù)思維來看,原文與譯文之間是以意義或信息為基礎(chǔ)的對(duì)應(yīng)關(guān)系。
在傳統(tǒng)的人工翻譯中,譯者借助語(yǔ)言知識(shí)和百科知識(shí),基于對(duì)意義的理解,結(jié)合語(yǔ)境和翻譯目的,從諸對(duì)對(duì)立元中選擇偏向某一方面的譯文表達(dá),實(shí)現(xiàn)多樣關(guān)聯(lián)中的一種,通過理性判斷實(shí)現(xiàn)原文與譯文的對(duì)應(yīng)相關(guān)性。而在大數(shù)據(jù)時(shí)代,只要有理想規(guī)模的雙語(yǔ)平行語(yǔ)料供檢索,人工翻譯至少可以減少相當(dāng)比例的理性思考,從數(shù)據(jù)庫(kù)中直接查找到具有相關(guān)性的對(duì)應(yīng)表達(dá),既可減少譯者查找資料的時(shí)間,也會(huì)找到更準(zhǔn)確的翻譯,特別是固定表達(dá)、專有名詞、專業(yè)術(shù)語(yǔ),這便是計(jì)算機(jī)輔助翻譯工具的基本原理。
統(tǒng)計(jì)機(jī)器翻譯充分利用這一原理,避免基于規(guī)則的機(jī)器翻譯系統(tǒng)在原文分析和譯文表達(dá)方面難以解決的復(fù)雜性弊端(Quah 2006:77)。以谷歌翻譯為例,計(jì)算機(jī)通過對(duì)大量平行語(yǔ)料進(jìn)行統(tǒng)計(jì)分析,構(gòu)建翻譯模型,進(jìn)而使用此模型進(jìn)行翻譯。在這一翻譯過程中,語(yǔ)言表達(dá)的相關(guān)性發(fā)揮十分重要的作用。據(jù)Softky(2007)介紹,谷歌擁有大量匹配好的翻譯平行文本(特別是聯(lián)合國(guó)文件)及單一語(yǔ)種文本。
2.32 基于全部數(shù)據(jù)的概率度翻譯
應(yīng)該說,基于隨機(jī)樣本的模式并不適用于翻譯這項(xiàng)語(yǔ)言活動(dòng),因?yàn)榉g選擇是從所有可用數(shù)據(jù)中查詢并選擇具有最高相關(guān)度的語(yǔ)言表達(dá)。在缺乏電子資源的人工翻譯時(shí)代,譯者獲取已具對(duì)應(yīng)關(guān)系的表達(dá),要么依靠大腦記憶,要么從詞典或百科全書等紙質(zhì)資料中查詢,而紙質(zhì)資料的有限性嚴(yán)重制約翻譯的質(zhì)量和速度。另外,紙質(zhì)資料受制于編者掌握對(duì)應(yīng)表達(dá)的數(shù)量或準(zhǔn)確度。于是便出現(xiàn)譯者因使用的工具書不完整而難以譯出某個(gè)術(shù)語(yǔ),或因工具書錯(cuò)誤而造成譯文表達(dá)錯(cuò)誤。
在理想規(guī)模的大數(shù)據(jù)中,由于語(yǔ)料足夠大,譯者可快速搜索到所有具有相關(guān)性的對(duì)應(yīng)表達(dá),然后再結(jié)合語(yǔ)境,選擇其中相關(guān)概率最高的譯文表達(dá)。機(jī)器翻譯也同理,只不過對(duì)譯文表達(dá)的選擇依靠的是統(tǒng)計(jì)算法得出的最高相關(guān)概率度。概率算法公式為:P(T/S) =[P(T) x p(T/S)]/P(S),其中,S代表原文,T代表多個(gè)具有相關(guān)性的譯文表達(dá),P代表概率度(Quah 2006:78)。 基于概率算法的機(jī)器翻譯在消歧方面有時(shí)也有不錯(cuò)表現(xiàn)。比如,在谷歌翻譯中輸入中文“中國(guó)總理李克強(qiáng)與新加坡總理在夏季達(dá)沃斯會(huì)面時(shí)強(qiáng)調(diào),加強(qiáng)兩國(guó)外交領(lǐng)域合作”,就會(huì)得到英語(yǔ)譯文:Chinese Premier Li Keqiang and Prime Minister of Singapore in the summer Davos meeting emphasized strengthe?ning diplomatic cooperation.原文的“中國(guó)總理”和“新加坡總理”分別處理成Chinese Premier和the Prime Minister of Singapore.
當(dāng)然,基于全部數(shù)據(jù)的翻譯會(huì)受制于語(yǔ)料的規(guī)模與質(zhì)量,數(shù)據(jù)庫(kù)的規(guī)模畢竟是相對(duì)的,而且數(shù)據(jù)庫(kù)的質(zhì)量又受制于數(shù)據(jù)來源等多種因素的影響。不管是基于翻譯記憶的計(jì)算機(jī)輔助翻譯,還是基于平行語(yǔ)料庫(kù)的統(tǒng)計(jì)機(jī)器翻譯,產(chǎn)出的譯文質(zhì)量都會(huì)隨著數(shù)據(jù)規(guī)模的增加和質(zhì)量的提高而提升。因此,擴(kuò)充數(shù)據(jù)規(guī)模和提升數(shù)據(jù)質(zhì)量成為大數(shù)據(jù)時(shí)代翻譯發(fā)展的必然要求。
2.33 對(duì)不同精確度譯文的區(qū)別性容忍
有關(guān)判斷譯文質(zhì)量的翻譯標(biāo)準(zhǔn),盡管不同的流派有不同的表述,但總是少不了“忠實(shí)”與“通順”這兩個(gè)基本要求。然而,在大數(shù)據(jù)背景下,翻譯的實(shí)用需求呈現(xiàn)多元化特點(diǎn)。大數(shù)據(jù)時(shí)代的基本特征是“廣泛而深入的數(shù)字化”以及整個(gè)人類社會(huì)范圍內(nèi)“數(shù)據(jù)的互聯(lián)互通”,在這一趨勢(shì)下,如何實(shí)現(xiàn)跨語(yǔ)言信息聯(lián)通成為首要任務(wù)(何小朝2014:11)。張春良在環(huán)球網(wǎng)上發(fā)表的題為“機(jī)器翻譯會(huì)不會(huì)成為下一波產(chǎn)業(yè)浪潮”的文章稱:“我們正在以前所未有的速度從單語(yǔ)世界(國(guó)內(nèi))轉(zhuǎn)向多語(yǔ)世界(國(guó)際化)。小到出國(guó)旅游翻譯或者技術(shù)資料翻譯,大到基于互聯(lián)網(wǎng)的在線電商、外貿(mào)活動(dòng)、金融等服務(wù)的國(guó)際化市場(chǎng)推廣,一個(gè)無法避免的痛點(diǎn)在于面臨多語(yǔ)種語(yǔ)言翻譯問題”(張春良2015)。應(yīng)該說,人工翻譯很難完全滿足這些海量而又高效率的跨語(yǔ)言信息交流需求,最快捷、最方便、最低成本的翻譯方式便是通過機(jī)器翻譯技術(shù)提供智能自動(dòng)翻譯。在這些情景下,人們對(duì)跨語(yǔ)言信息交流的首要需求是快速、方便、海量和低成本,而不是高精確度。因此,在大數(shù)據(jù)背景下,翻譯需求的多元化催生不同精確度的翻譯需求,要求我們區(qū)別性容忍,基于不同的用戶需求提供差異化的譯文服務(wù)。
如果以大數(shù)據(jù)的出現(xiàn)為界限,在此之前的翻譯研究對(duì)象大體可以劃分為人工翻譯和翻譯技術(shù)。前者占據(jù)翻譯研究的主流陣地,后者在Holmes勾畫的“翻譯學(xué)”圖譜中屬于“應(yīng)用翻譯研究”下面的“翻譯工具”,僅為譯員培訓(xùn)和翻譯實(shí)務(wù)提供服務(wù)(Holmes 1988/2000:181 -182)。 翻譯技術(shù)和機(jī)器翻譯的發(fā)展由于未能取得預(yù)期的效果,從20世紀(jì)60年代到90年代陷入低谷(So?mers 2008:143)。但是,新技術(shù)的發(fā)展讓該領(lǐng)域的翻譯呈現(xiàn)新的活躍態(tài)勢(shì),出現(xiàn)多元化翻譯形態(tài),形成翻譯研究的新對(duì)象,也產(chǎn)生許多新的研究領(lǐng)域。
從技術(shù)角度出發(fā),Hutchins和Somers(1992:148)歸納出4種翻譯形態(tài):機(jī)器翻譯、人助機(jī)譯、機(jī)助人譯和人工翻譯。這種4分法已經(jīng)很難描繪如今紛繁復(fù)雜的翻譯形態(tài)。機(jī)器翻譯方面,除傳統(tǒng)的機(jī)器翻譯系統(tǒng)外,目前還有在線翻譯、網(wǎng)頁(yè)翻譯、社交平臺(tái)翻譯和移動(dòng)設(shè)備上的翻譯等形式。
在線翻譯大都是統(tǒng)計(jì)機(jī)器翻譯。著名的在線翻譯服務(wù)包括谷歌翻譯、百度翻譯和必應(yīng)翻譯等,提供所支持的任意兩種語(yǔ)言之間的字詞、句子和短小篇章的翻譯。目前谷歌翻譯影響最大,支持90種語(yǔ)言,每天翻譯次數(shù)達(dá)10億次,翻譯處理的文字相當(dāng)于一百萬冊(cè)圖書(張春良2015)。
網(wǎng)頁(yè)翻譯一般都以在線翻譯系統(tǒng)為基礎(chǔ),如谷歌的Chrome瀏覽器可自動(dòng)將網(wǎng)頁(yè)翻譯為某種主要語(yǔ)言,百度翻譯和有道翻譯則可直接輸入網(wǎng)址實(shí)現(xiàn)翻譯。一些商業(yè)網(wǎng)站利用翻譯為客戶提供更好的服務(wù),著名的酒店預(yù)訂網(wǎng)站“繽客”(boo?king.com)提供42種語(yǔ)言版本的選擇。此外,為電子商務(wù)平臺(tái)提供服務(wù)的網(wǎng)頁(yè)翻譯也已出現(xiàn)??萍疾┛途W(wǎng)站TechCrunch報(bào)道,eBay在2013年開拓俄羅斯市場(chǎng)的時(shí)候已經(jīng)嘗試機(jī)器翻譯。俄羅斯用戶輸入俄語(yǔ)搜索關(guān)鍵字,也能返回與關(guān)鍵字匹配、用英語(yǔ)描述的商品。阿里巴巴研發(fā)出英語(yǔ)與俄語(yǔ)、英語(yǔ)與葡萄牙語(yǔ)之間的多套機(jī)器翻譯系統(tǒng)。
社交平臺(tái)翻譯主要是各種網(wǎng)絡(luò)社交媒體上提供的翻譯,如Facebook,Twitter和微信等利用必應(yīng)、谷歌、百度等在線翻譯的API功能進(jìn)行二次開發(fā),為用戶提供翻譯服務(wù)。很多電子郵件服務(wù)也提供翻譯功能,如Gmail設(shè)置140種語(yǔ)言的切換。
移動(dòng)設(shè)備上的翻譯主要是手機(jī)翻譯應(yīng)用軟件。谷歌、百度等都開發(fā)手機(jī)端翻譯軟件,可實(shí)現(xiàn)離線翻譯、語(yǔ)音和實(shí)時(shí)翻譯、跨軟件翻譯、拍照翻譯和點(diǎn)擊翻譯等。比如拍照翻譯,用戶可利用手機(jī)攝像頭實(shí)現(xiàn)實(shí)物翻譯、涂抹翻譯、取詞翻譯、整屏翻譯和菜單翻譯等。另外,視頻通話平臺(tái)Skype Translator推出實(shí)時(shí)跨語(yǔ)言通話服務(wù),目前支持漢語(yǔ)、英語(yǔ)、法語(yǔ)、德語(yǔ)、意大利語(yǔ)、葡萄牙語(yǔ)和西班牙語(yǔ)7種語(yǔ)言的對(duì)話翻譯和五十余種語(yǔ)言間的信息翻譯。
在翻譯技術(shù)和翻譯應(yīng)用不斷發(fā)展的過程中,人機(jī)互助翻譯模式也進(jìn)一步突顯。一方面是機(jī)助人譯。利用翻譯記憶的計(jì)算機(jī)輔助翻譯目前已成為專業(yè)譯者不可或缺的工具,機(jī)助人譯已成常態(tài)。另一方面是人助機(jī)譯。為不斷提高譯文質(zhì)量,許多在線機(jī)器翻譯增加“修改建議”功能,用戶可對(duì)機(jī)譯結(jié)果進(jìn)行修改,并自動(dòng)存入語(yǔ)料庫(kù)。一些非在線機(jī)器翻譯系統(tǒng)也都在通過讓人參與機(jī)譯過程來解決機(jī)器在自然語(yǔ)言理解和表達(dá)方面的弊端,包括譯前編輯(pre?editing)、譯后編輯(post?edi?ting)和人機(jī)互動(dòng)翻譯等(Quah 2006:57 -92)。很多計(jì)算機(jī)輔助翻譯軟件都有內(nèi)置或外接的機(jī)器翻譯功能,可實(shí)現(xiàn)CAT+MT+PE工作模式(王華樹 2015:135)。
大數(shù)據(jù)時(shí)代的翻譯現(xiàn)象和翻譯形態(tài)勢(shì)必極大地拓展翻譯研究的領(lǐng)域。目前看來,在現(xiàn)有研究分支基礎(chǔ)上,至少在以下幾大領(lǐng)域有待突破:數(shù)據(jù)技術(shù)研究、譯文評(píng)測(cè)研究、多模態(tài)翻譯研究和翻譯應(yīng)用研究等。
3.21 數(shù)據(jù)技術(shù)研究
大數(shù)據(jù)驅(qū)動(dòng)的人工與機(jī)器翻譯首先依賴的是語(yǔ)料。語(yǔ)料的數(shù)量、類型和質(zhì)量決定譯文的質(zhì)量。因而,翻譯研究的一個(gè)重要挑戰(zhàn)便是采用恰當(dāng)?shù)募夹g(shù)手段,以人工翻譯的雙語(yǔ)平行語(yǔ)料、高質(zhì)量的單語(yǔ)語(yǔ)料為來源,獲取和構(gòu)建大規(guī)??捎玫臅嬲Z(yǔ)、口語(yǔ)語(yǔ)料。同時(shí),制定規(guī)范、適用的數(shù)據(jù)格式標(biāo)準(zhǔn)、構(gòu)建數(shù)據(jù)資源共享模式和平臺(tái),實(shí)現(xiàn)資源的開放共享。開發(fā)適用于翻譯功能的數(shù)據(jù)挖掘技術(shù),為翻譯獲取有用適切數(shù)據(jù)提供技術(shù)支持。
3.22 譯文評(píng)測(cè)研究
在翻譯形態(tài)呈現(xiàn)多元化的背景下,人工翻譯并不是譯文產(chǎn)生的唯一方式,由機(jī)器翻譯衍生出的新形態(tài)翻譯,并不符合傳統(tǒng)的譯文評(píng)價(jià)標(biāo)準(zhǔn),但是卻在發(fā)揮著人工翻譯無法取代的作用。那么到底何種譯文能夠滿足哪些用戶在什么情況下的使用,如何對(duì)機(jī)器翻譯及其衍生翻譯作出評(píng)測(cè),這是譯文評(píng)測(cè)研究需要解決的問題,未來的目標(biāo)是“采用合理的自動(dòng)評(píng)價(jià)準(zhǔn)則應(yīng)用于翻譯評(píng)測(cè)活動(dòng),同時(shí)引入高效的人工翻譯方式,以評(píng)測(cè)促進(jìn)機(jī)器翻譯的研究與應(yīng)用”(杜金華等2013:8)。
3.23 多模態(tài)翻譯研究
在移動(dòng)計(jì)算和大數(shù)據(jù)時(shí)代,隨著智能設(shè)備的進(jìn)一步發(fā)展,翻譯愈加呈現(xiàn)多模態(tài)趨勢(shì)。翻譯研究的一個(gè)重要拓展是,結(jié)合先進(jìn)的移動(dòng)和多媒體設(shè)備,開發(fā)語(yǔ)音翻譯、視頻翻譯、文字—語(yǔ)音—視頻相結(jié)合的多維翻譯,其中語(yǔ)音識(shí)別、口語(yǔ)翻譯、語(yǔ)音合成和視頻轉(zhuǎn)換等是關(guān)鍵技術(shù)??谧g資源的構(gòu)建與深度處理是需要攻克的另一大難題。另外,也有一些研究者從事動(dòng)物語(yǔ)言與人類語(yǔ)言、人類肢體語(yǔ)言與自然語(yǔ)言之間的翻譯,大大拓展翻譯的應(yīng)用領(lǐng)域。
3.24 翻譯應(yīng)用研究
如今的翻譯正以空前的節(jié)奏進(jìn)入生產(chǎn)和生活,其中的關(guān)鍵是如何將翻譯研究成果、特別是基于大數(shù)據(jù)的機(jī)器翻譯研究成果轉(zhuǎn)化為實(shí)際應(yīng)用,包括專門領(lǐng)域的行業(yè)應(yīng)用和日常生活應(yīng)用。行業(yè)應(yīng)用涉及幾乎所有需要實(shí)現(xiàn)跨語(yǔ)言信息交換的行業(yè),日常生活應(yīng)用包括涉及吃住行等各方面活動(dòng)的翻譯應(yīng)用,如電子商務(wù)翻譯、旅游翻譯、信息瀏覽與檢索翻譯和餐飲翻譯等。
在大數(shù)據(jù)時(shí)代,基于大規(guī)模語(yǔ)料,借助于各種新技術(shù),翻譯活動(dòng)正在經(jīng)歷劇烈變革,機(jī)器翻譯及其衍生品日新月異,翻譯手段和方式不斷更新,翻譯形態(tài)呈多元化趨勢(shì),快捷、方便、低成本的翻譯服務(wù)已經(jīng)進(jìn)入人們的日常生活,引發(fā)翻譯思維的深刻變化,催生翻譯研究在理論體系、核心概念和研究方法等方面的思考。
Holmes(1988/2000)勾畫的翻譯學(xué)結(jié)構(gòu)圖,在當(dāng)時(shí)條件下,為翻譯學(xué)科體系做出清晰的規(guī)劃。不過,在大數(shù)據(jù)背景下,翻譯形態(tài)愈加多元化,許多新模式、新現(xiàn)象、新技術(shù)和新設(shè)備不斷出現(xiàn),翻譯的應(yīng)用性不斷增強(qiáng),翻譯研究的多學(xué)科、跨學(xué)科性質(zhì)愈加突出,研究領(lǐng)域和陣地不斷擴(kuò)大,越來越多的學(xué)科進(jìn)入翻譯研究領(lǐng)域,引發(fā)一些學(xué)者關(guān)于翻譯學(xué)科體系穩(wěn)定性的隱憂(Mundy 2009:12),使得翻譯學(xué)科體系的重新規(guī)劃成為必須。
翻譯研究需要關(guān)注翻譯新現(xiàn)象,涵蓋更多內(nèi)容,將人工翻譯、機(jī)器翻譯、人機(jī)互助翻譯以及多模態(tài)智能終端的各種翻譯納入考察,對(duì)各種形態(tài)的翻譯提出指導(dǎo)性理論模式,促進(jìn)新形態(tài)翻譯的進(jìn)一步發(fā)展。結(jié)合實(shí)際翻譯活動(dòng)對(duì)翻譯過程做出新的描述,將機(jī)器翻譯中人的參與和人工翻譯中機(jī)器的參與納入翻譯過程模式。描述翻譯研究要關(guān)注機(jī)助人譯、人助機(jī)譯、人機(jī)互助模式產(chǎn)生的譯文及其效果和影響,以及所引發(fā)的人類溝通方式變革。應(yīng)用翻譯研究領(lǐng)域發(fā)生的變化最為突出,已有學(xué)者(如Quah 2006:42)對(duì)該分支進(jìn)行重新描述,特別對(duì)翻譯技術(shù)領(lǐng)域研究做出細(xì)化,但是最近10年是翻譯技術(shù)飛速發(fā)展時(shí)期,出現(xiàn)許多新的現(xiàn)象,應(yīng)用翻譯研究分支也有必要進(jìn)行重新規(guī)劃。
以上所述翻譯新形態(tài)和新現(xiàn)象,以及大數(shù)據(jù)背景下的翻譯新思維,對(duì)部分傳統(tǒng)翻譯概念提出挑戰(zhàn),須要作出重新界定,下面試舉兩例加以說明。
一是翻譯標(biāo)準(zhǔn)問題。傳統(tǒng)的翻譯標(biāo)準(zhǔn)主要針對(duì)人工翻譯,特別是文學(xué)、文化類具有較高文學(xué)藝術(shù)價(jià)值和文化傳承價(jià)值的譯文,或者實(shí)際應(yīng)用領(lǐng)域?qū)ξ谋居休^高要求的譯文。但是如今的翻譯需求日漸多元化,翻譯服務(wù)更加行業(yè)化、生活化,因此有必要針對(duì)不同需求提出多元化的翻譯標(biāo)準(zhǔn),讓不同類型、具有不同精確度的翻譯發(fā)揮不同的作用。針對(duì)機(jī)器翻譯,建立行業(yè)評(píng)測(cè)標(biāo)準(zhǔn),形成機(jī)器自動(dòng)評(píng)測(cè)、人機(jī)互助評(píng)測(cè)與人工評(píng)測(cè)相結(jié)合的翻譯評(píng)測(cè)體系。
二是對(duì)等問題。可以說,翻譯學(xué)的發(fā)展歷史始終圍繞原文與譯文關(guān)系這一主線,出現(xiàn)無數(shù)種類型的對(duì)等。但是,上述一些新的翻譯現(xiàn)象引發(fā)我們思考:對(duì)等還是原文與譯文之間的真實(shí)關(guān)系嗎?是一切翻譯的內(nèi)在屬性嗎?以大數(shù)據(jù)為基礎(chǔ)的翻譯引發(fā)翻譯思維方式的變革,原文與譯文的關(guān)系屬性從“對(duì)等”變?yōu)椤跋嚓P(guān)性對(duì)應(yīng)”更為合理,或者可以中性化地界定為“相關(guān)性對(duì)等”,以消解“對(duì)等”概念對(duì)多種翻譯形態(tài)的制約。
技術(shù)進(jìn)步正在主導(dǎo)翻譯學(xué)研究方法的不斷更新。研究方法的更新在翻譯認(rèn)知過程研究方面已有顯著發(fā)展,呈現(xiàn)出研究工具革新、跨學(xué)科性深入、研究規(guī)模擴(kuò)大的趨勢(shì)。在此背景下,一方面,翻譯學(xué)研究要從其他學(xué)科,特別是大數(shù)據(jù)工程、計(jì)算機(jī)與信息科學(xué)、認(rèn)知科學(xué)等與大數(shù)據(jù)驅(qū)動(dòng)的翻譯研究密切相關(guān)的領(lǐng)域吸收借鑒技術(shù)手段和研究方法,構(gòu)建符合翻譯學(xué)研究需要的方法論體系。另一方面,要對(duì)新的技術(shù)手段和方法開展方法論研究,考察其有效性和可靠性,構(gòu)建大數(shù)據(jù)時(shí)代翻譯研究方法評(píng)估和比照模式,對(duì)不同研究對(duì)象與目標(biāo)的翻譯研究設(shè)計(jì)做出方法論指導(dǎo)。
總之,大數(shù)據(jù)時(shí)代的到來及其引發(fā)的科學(xué)范式轉(zhuǎn)變帶動(dòng)翻譯形態(tài)和翻譯模式的深刻變化。對(duì)于這些變化,樂觀主義者高估技術(shù)的作用,鼓吹“機(jī)器翻譯有望消除語(yǔ)言之間的界限,實(shí)現(xiàn)巴別塔的重建”。悲觀主義者則表現(xiàn)出對(duì)機(jī)器翻譯及其衍生品的隱憂,擔(dān)心人工翻譯被機(jī)器取代,或者因譯文準(zhǔn)確性不足而唱衰其實(shí)用價(jià)值。我們認(rèn)為,科學(xué)第四范式不僅是新的研究范式,更是新的思維方式。在這一浪潮中,翻譯研究須要轉(zhuǎn)變思維方式,正視翻譯領(lǐng)域出現(xiàn)的新現(xiàn)象、新手段和新模式,更新理論觀念和研究方法,對(duì)新范式下的各種問題作出理性思考,充分利用大數(shù)據(jù)及相關(guān)技術(shù)的優(yōu)勢(shì),真正讓大數(shù)據(jù)成為翻譯以及翻譯研究的“金礦”。