北京外國語大學(xué) 姚 斌
《語料庫口譯研究的墾拓》評介*
北京外國語大學(xué) 姚 斌
Francesco Straniero Sergio & Caterina Falbo (eds.). 2012. Breaking Ground in Corpus-based Interpreting Studies. Bern: Peter Lang. 254 pp.
語料庫口譯研究是近些年口譯研究方面逐漸興起的研究視角。Shlesinger(1998)首次提出要將語料庫方法應(yīng)用于口譯研究,以解決口譯研究的一系列核心問題。相較筆譯研究,語料庫方法應(yīng)用于口譯研究面臨諸多挑戰(zhàn),其關(guān)鍵在于口譯材料的獲取、轉(zhuǎn)寫和數(shù)據(jù)加工,通常數(shù)倍或數(shù)十倍于筆譯語料庫建設(shè)的工作量。《語料庫口譯研究的墾拓》一書,匯集了7位學(xué)者在口譯語料庫建設(shè)方面的理論思考與實際運用。7篇論文加上導(dǎo)論較為完整地展現(xiàn)了語料庫口譯研究的前沿領(lǐng)域與研究現(xiàn)狀。在內(nèi)容上,此書既有對語料庫口譯研究的詳盡回顧,亦有利用語料庫針對具體口譯問題開展的案例研究,體現(xiàn)了近10年來該領(lǐng)域的最新進展。
此書作者多為既從事學(xué)術(shù)研究、又進行口譯實踐的“實踐–研究者”。因此無論是對不同場景下口譯活動特征的理解,還是利用語料庫進行口譯研究的選題挖掘都表現(xiàn)出較強的針對性??梢哉f,此書不僅是對此前歐洲語料庫口譯研究的總結(jié),也體現(xiàn)出該領(lǐng)域研究的未來動向。該書對國內(nèi)語料庫口譯研究一定有其積極的借鑒價值。本文將首先簡要介紹該書的內(nèi)容要點,并在此基礎(chǔ)上展望語料庫口譯研究的未來發(fā)展趨勢。
該書有3大主題:口譯語料庫的現(xiàn)狀與展望、口譯語料庫的建設(shè)方法及口譯語料庫研究案例,共8個章節(jié)(含導(dǎo)論)。以下分述相關(guān)章節(jié)內(nèi)容。
2.1 語料庫口譯研究的現(xiàn)狀與展望
該書編者Francesco Sergio和Caterina Falbo撰寫了題為“通過語料庫研究口譯”的導(dǎo)論,實為對語料庫口譯研究的回顧與展望。導(dǎo)論首先勾勒了從語料庫語言學(xué)到語料庫翻譯學(xué)的一些核心問題,如語料的代表性及翻譯共性等。之后作者重點探討了口譯語料庫的建設(shè)要點??谧g語料庫創(chuàng)建之所以滯后于筆譯語料庫,是因為口譯具有不同于筆譯的諸多特征。作者指出了口譯與筆譯在認(rèn)知、倫理、社會文化及意識形態(tài)層面的不同特征。正是由于這些不同特征的存在,語料庫口譯研究的問題意識也有別于以筆譯為對象的語料庫翻譯學(xué)??谧g活動中所特有的問題,如面子保全策略、非言語交流及譯員的角色變化等,都必須融入到口譯語料庫的創(chuàng)建中。在展望未來發(fā)展時,作者指出,語料庫口譯研究的最大挑戰(zhàn)仍是數(shù)據(jù)的可比性。目前對特定語料庫的研究已經(jīng)產(chǎn)出了一些成果,但如何實現(xiàn)跨語料庫的協(xié)同研究和共性研究仍有待于加強研究變量和分析方法的互通性。要實現(xiàn)研究的“生態(tài)效力”,不僅要求確保數(shù)據(jù)的獲取和數(shù)量,而且要求方法論的統(tǒng)一及研究結(jié)果的可比性。
2.2 口譯語料庫的創(chuàng)建方法
共有5篇論文有關(guān)口譯語料庫的創(chuàng)建,它們分別涉及EPIC、DIRSI-C、CorIT、FOOTIE口譯語料庫和法庭聽證語料庫,其中法庭聽證語料庫主要介紹的是語料的獲取方法。
Mariachira Russo, Claudio Bendazzoli, Annalisa Sandrelli和Nicoletta Spinolo介紹了EPIC的研制進展。創(chuàng)建于2004年的EPIC,其主要目標(biāo)是收集大量真實同傳語料,并將實證研究的成果用于改善口譯培訓(xùn)。對該語料庫的建設(shè)方法國內(nèi)已有學(xué)者進行過較詳細(xì)的介紹(如王克非、黃立波 2012),這里不再贅述。基于該語料庫已經(jīng)開展的研究有口譯譯文中的詞匯密度(lexical density)和詞匯變化(lexical variety)、口譯中的非流利現(xiàn)象、演講原文主題、語速及方式對譯員表現(xiàn)的影響及文本處理模式等。另外該語料庫也給口譯博士論文的選題與撰寫帶來了莫大便利。在EPIC的最新進展方面,除了語料數(shù)量的擴增,作者還提及通過SpeechIndexer和Transana 2.41等工具對文本/音頻以及文本/視頻所作的對齊工作。
Claudio Bendazzoli著重介紹了DIRSI-C口譯語料庫。該語料庫收集了3次國際醫(yī)學(xué)會議的意英同傳資料。語料庫基于EPIC的理論與方法框架,但由于語料來源與前者完全不同,因而具有自身特征。Claudio重點描述了該語料庫所收語料的特征及語料庫創(chuàng)建的具體方法。該語料庫有四個子庫,分別是意大利語和英語的原語庫和譯語庫,因此可以同時被用作可比和平行語料庫。目前語料庫的規(guī)模是136,000詞。Claudio借用“交際理論”,從會議結(jié)構(gòu)、演講事件、會議參與方等角度詳盡分析了國際會議的“交際情境”,并在此基礎(chǔ)上舉例說明DIRSI-C文本頭文件的結(jié)構(gòu)與內(nèi)容。Claudio研究的主要目的在于剖析“譯員為媒介的國際會議”的基本構(gòu)成要素,并將之轉(zhuǎn)化為可以用語料庫技術(shù)分析的語料。
Annalisa Sandrelli介紹的是2008年歐洲足球錦標(biāo)賽期間每項賽事前后所有新聞發(fā)布會同傳語料的FOOTIE口譯語料庫。作者本人也是參與賽事活動的同傳譯員之一。建設(shè)該語料庫的目標(biāo)是:(1)建設(shè)足球賽事中以譯者為媒介的新聞發(fā)布會語料庫;(2)分析足球賽事條件下的對話溝通要素;(3)描述同傳譯員如何處理口譯過程中遇到的挑戰(zhàn)。該語料庫與EPIC和DIRSI-C都不相同,因為它是對話性質(zhì)的,而非演講性質(zhì)。該語料庫包含16場新聞發(fā)布會,涉及意、英、法、西等四種語言,同時可用于可比和平行語料庫研究。
作者首先介紹了足球翻譯的特點,描述了足球賽事譯員的工作場景、地點及形式等,隨后具體介紹了2008年歐錦賽的翻譯情況,之后是對FOOTIE語料庫數(shù)據(jù)獲取、轉(zhuǎn)寫等具體情況的介紹。她特別提到,雖然譯者本人參與翻譯有可能導(dǎo)致研究中的偏見,但這仍是目前獲得真實會議數(shù)據(jù)的最佳途徑之一。在轉(zhuǎn)寫方面,她特別強調(diào),轉(zhuǎn)寫的語料特征應(yīng)根據(jù)研究目的而定,避免標(biāo)注不相關(guān)的特征。為確??缯Z料庫的銜接與協(xié)同研究,采用了EPIC的轉(zhuǎn)寫方法,但未作詞性標(biāo)注,因為研究目的是溝通以及特定的詞匯模式。由于其對話特征,因此采用了特殊的轉(zhuǎn)寫方式。轉(zhuǎn)寫時生成兩個文件,一個是不含任何標(biāo)注的txt版本,可以用于WordSmith工具。另一個是Excel版本,其中一頁是新聞發(fā)布會的文本頭,另外一頁為兩種(或三種)語言的平行對照版本。文本頭記錄了所有與特定新聞發(fā)布會相關(guān)的信息。該文最后一部分,作者從“機構(gòu)性溝通”1的角度分析了新聞發(fā)布會的溝通特征,包括其語言特點、參與者角色、權(quán)力關(guān)系、視角、議題選擇等。作者還指出,未來的研究方向是譯員在面對語速挑戰(zhàn)時采用的口譯策略。
Caterina Falbo介紹的是CorIT(意大利電視口譯語料庫)的分類標(biāo)準(zhǔn)。CorIT語料庫主要收集的是意大利國有電視臺RAI自1960年代以來的全部口譯語料,同時還加入了來自其他商業(yè)電視臺的語料,時間跨度大、收集內(nèi)容多。該庫時間跨度達(dá)50年之久,包括2700多場口譯,為多種外語譯入意大利語的交傳和同傳。該語料庫被定義為開放式、多媒體平行語料庫,并不斷更新。該庫建設(shè)的重點是:研究CorIT的主要特征及其對“語料庫”、“分類標(biāo)準(zhǔn)”等既有概念重新定義的影響,以及如何重新定義研究中的核心概念,如口譯模式、互動類型以及電視特征等。
本章主要了介紹該語料庫的分類方法。首先介紹了文本頭設(shè)計。該庫文本頭設(shè)計非常細(xì)致,包括:譯員姓名、口譯模式、互動類型、交際事件參與方姓名、日期、意大利節(jié)目名稱及播放頻道、外國電視臺頻道、語體風(fēng)格、電視風(fēng)格及文本類型(原文/譯文)。具體到電視口譯的特征,作者指出電視交傳更類似于聯(lián)絡(luò)口譯,譯員一般是不帶紙筆的,不記筆記,因此發(fā)言人的講話也會比較簡明。而在電視同傳中,譯員往往與講話人不在同一現(xiàn)場,甚至有時與現(xiàn)場溝通無關(guān)。另外作者還提到話輪轉(zhuǎn)換在源語和譯語之間的差異,并通過戛納電影節(jié)上多人發(fā)言變?yōu)樽g員兩人之間的順序翻譯這一案例說明,電視語體風(fēng)格的分類結(jié)構(gòu)不再固定,而是靈活和開放的,可以不斷更新。在轉(zhuǎn)寫方面,作者強調(diào)應(yīng)保持文本文件與聲音/視頻文件之間的永久性聯(lián)系,建議使用的工具為winpitch。CorIT采用正字法的轉(zhuǎn)寫方式,去除了所有標(biāo)點,以顯示與書面文本的不同??梢杂盟_展翻譯、互動及語言層面的各種研究。
Marta Biagini主要介紹了法庭口譯的數(shù)據(jù)收集。他從對話口譯的特點談起,提到數(shù)據(jù)的收集并非中立,而是與研究者的研究目標(biāo)相關(guān)。他研究的是在法庭這樣一個高度形式化和儀式化的場景中,以譯員為媒介的互動行為如何發(fā)生并產(chǎn)生什么影響。他發(fā)現(xiàn)在對譯員角色的規(guī)定與譯員實際行為之間存在差距。在簡要介紹意大利的法庭口譯情況后,作者主要介紹了數(shù)據(jù)收集的情況。一種是法庭提供影像資料,可能不符合研究者要求;一種是研究者自己現(xiàn)場錄制,但存在審訊時間很長、高品質(zhì)錄像設(shè)備昂貴等問題。作者現(xiàn)已收集6名譯員9小時法語–意大利語的對話口譯視頻。他指出今后的研究目標(biāo)應(yīng)為:(1)從語料中觀察到的行為能否被普遍化,并成為規(guī)范,還應(yīng)只是被視為個人行為?(2)有沒有可能思考對“中立”概念的重構(gòu),分析所謂的“中立性的影響”?
2.3 口譯語料庫研究案例
本書有兩個章節(jié)是應(yīng)用語料庫進行口譯研究的實際案例,分別研究了“主題連貫性”(topical coherence)和“譯員風(fēng)格”問題。
Eugenia Dal Fovo呈現(xiàn)了一個利用電視口譯語料庫研究主題連貫性的案例。這是她正在進行的博士研究。利用的是1988-2004年美國總統(tǒng)大選辯論的口譯版本,共計640分鐘。其研究目的是探討譯員如何處理對話型及問答結(jié)構(gòu)的原文,及其對譯員的影響。
她首先介紹了碩士論文的研究。她將原文中出現(xiàn)的問題分為4大類:(1)Yes/No問題;(2)特殊問句問題;(3)引導(dǎo)性問題;(4)陳述性問題。她對每一種問題在語料庫中出現(xiàn)的頻次及其譯文實現(xiàn)的連貫性程度都作出量化統(tǒng)計。譯文分析主要從問題類型、譯文連貫性程度、譯員采用策略、原文結(jié)構(gòu)保留程度及譯文具體內(nèi)容這幾項入手。
她提出將在博士研究中就文本語言學(xué)和互動與對話分析等方法論問題進行更加深入的探討,希望能夠解決對話題連貫性的定義問題。由于電視口譯的特殊性,譯員不在現(xiàn)場,現(xiàn)場溝通也不依賴于譯員,因此對于話題連貫性也需有新的定義。她將聚焦于在聽眾并不知道原文的情況下譯員對譯文的話題重建問題。
Francesco Straniero Sergio利用CorIT語料庫進行了對譯員風(fēng)格的探索性研究。他指出,與利用筆譯語料庫研究譯者風(fēng)格相比,利用語料庫研究口譯員風(fēng)格的研究極少,但較之口譯研究中常見的定性研究,基于語料庫的譯員風(fēng)格研究更符合描寫性譯學(xué)的原則。他利用前述CorIT電視口譯語料庫從詞匯選擇、語言使用、話語標(biāo)志及聽說時間差的角度研究了幾名意大利譯員的傳譯風(fēng)格,通過大量實例證明譯員在從事電視口譯時的確存在獨特風(fēng)格,例如常用語匯、比喻、結(jié)構(gòu)及語域等。
口譯語料庫的建設(shè)與研究一向被學(xué)術(shù)界視為畏途。很多研究與其說是對語料庫的研究,倒不如說是對口譯語料庫建設(shè)困難的研究。在我國,對于口譯語料庫的語料加工、對齊級別等問題探討較多,而對口譯活動自身的特點研究較少。其原因可能是多數(shù)從事相關(guān)研究者并非口譯的實際從業(yè)者。
本文集的特點之一便是多數(shù)研究者均為口譯從業(yè)者,這既使得他們可以較為便利地獲取研究數(shù)據(jù),又使得他們能夠?qū)⒆陨韺嵺`中的問題帶入研究中,從而在很大程度上跨越了實踐與理論的鴻溝。本文集的另一特點是非常強調(diào)跨庫研究及方法論的一致性。這一點值得推薦。目前不少語料庫研究往往各行其道,不能實現(xiàn)跨庫共享,缺少像文集中幾位意大利學(xué)者這樣的協(xié)同協(xié)作研究。例如DIRSI-C就明確采用了EPIC所使用的分類方法,以便實現(xiàn)研究成果的可比性。
正如本文集中不少學(xué)者指出的那樣,口譯語料庫研究的難點在于口譯語料發(fā)生場景的多樣性和復(fù)雜性。因此研究中首先要對“以譯員為媒介”的交際事件特點進行分析,考察特定場景下的交際事件特點。例如,文集中涉及的EPIC(歐洲議會)、DIRSI-C(醫(yī)學(xué)會議)、FOOTIE(歐洲足球賽事)、CorIT(電視口譯)等都是不同場景下的口譯語料,因此具有不同特征。我們注意到,文集作者均不惜筆墨地分析特定場景下交際事件的特點。而對此,國內(nèi)相關(guān)研究作得還比較少。國內(nèi)研究更多關(guān)注點是在語料收集、語料加工和標(biāo)注及檢索工具開發(fā)上。然而,正如文集多位作者所強調(diào)的那樣,口譯語料庫的建設(shè)及語料的加工標(biāo)注,均應(yīng)以語料庫的研究目的而定,因此在建設(shè)口譯語料庫及開展基于語料庫的口譯研究時,首先需要詳盡分析的是口譯語料的發(fā)生場景及其特征。在這方面,需要跨學(xué)科理論,如言語行為理論、交際理論等的適時介入。
如前所述,本文集除介紹語料庫構(gòu)建過程,包括數(shù)據(jù)收集方法等,也展示了基于語料庫進行口譯譯文及譯員研究分析的實例。這兩項研究都利用了CorIT,即意大利電視媒體口譯語料庫。該語料庫時間跨度大、涉及譯員多,提供了不可多得的研究數(shù)據(jù)。兩項研究都體現(xiàn)了量化與質(zhì)性研究相結(jié)合的特征,尤其是譯者風(fēng)格研究。在語料庫翻譯學(xué)中,譯者風(fēng)格研究已經(jīng)比較普遍,但在語料庫口譯研究中尚屬罕見。可以說,這兩項研究為未來基于語料庫的口譯研究提供了方法和操作層面的參考方案。
本文集還提出了對一些核心概念的再認(rèn)識,這是由口譯交際的場景特殊性所決定的。例如,電視口譯的特點就使得“以譯員為媒介的交際事件”有了新的定義。通常情況下,譯員是交際雙方之間溝通的媒介。然而,在電視口譯中,譯員往往不在現(xiàn)場,而只是針對收看電視節(jié)目的本國聽眾。文集作者對譯員的此種角色定位進行了重新定義。又如,在法庭口譯數(shù)據(jù)的收集過程中,研究者發(fā)現(xiàn)“中立”這一口譯職業(yè)道德中的核心概念在口譯規(guī)范與口譯實踐之間存在差距,由此嘗試對口譯中的這個核心問題進行語料庫的探索。
從文集內(nèi)容來看,對比國外口譯語料庫發(fā)展情況,國內(nèi)語料庫的語料來源比較單一、加工方法與層次比較初級(張威 2012)。僅就語料來源而言,國內(nèi)目前的口譯語料庫主要有學(xué)習(xí)者語料庫、記者招待會語料庫和英??谧g考試語料庫,新近還出現(xiàn)了小型的電視口譯語料庫。以上幾種語料庫雖有其個性特征,也值得研究,但從使用范圍和頻率來看,占據(jù)目前口譯市場90%以上比例的會議口譯卻幾乎沒有成規(guī)模的語料庫。記者招待會語料庫的場合比較特殊,譯員身份也有特殊性,其語料的代表性不足。而國內(nèi)電視口譯語料庫與國外也有差異,國內(nèi)電視口譯員幾乎沒有專職者,都是臨時為之,他們的口譯策略和風(fēng)格,應(yīng)該是在會議口譯實踐中養(yǎng)成的,尚未形成獨特的電視口譯特征。對口譯市場的核心群體,即職業(yè)會議口譯員的語料庫建設(shè)也才剛剛起步。
來自文集的另一啟示是,由于實際會議存在多種類型,如金融、環(huán)保、醫(yī)療、專業(yè)技術(shù)等,而各種類型會議的口譯又各有特征,因此都有建設(shè)語料庫進行研究的必要。但在語料庫建設(shè)過程中,首要問題應(yīng)該是對這些特定場景下的交際行為進行深入細(xì)致的分析,同時還要注意到跨庫研究的可行性和協(xié)調(diào)性。
本文集中的語料庫建設(shè)與研究也還存在一些值得進一步推進的地方。例如,不少研究還處于未完成狀態(tài)。其實口譯語料庫的研究大有用武之地。對于從事譯員培養(yǎng)的人來說,最關(guān)心的還是語料庫研究可以給口譯教學(xué)帶來什么。對于口譯學(xué)習(xí)者,在學(xué)習(xí)過程中,關(guān)注的是有哪些可以從語料庫中得到的經(jīng)驗。未來值得探索的問題還有,在譯員口譯策略的習(xí)得和口譯風(fēng)格的形成方面,語料庫研究究竟可以帶來什么樣的啟示?對比職業(yè)譯員語料庫和學(xué)習(xí)者語料庫,結(jié)合專家–新手研究又能呈現(xiàn)出怎樣的差異化特征?語料庫研究如何做到描寫與解釋互補,通過將量化和質(zhì)性研究相結(jié)合的方法,跨越理論與實踐的鴻溝,構(gòu)建一種口譯研究的新范式?這些都是我們心中的問題,有待語料庫口譯研究的進一步墾拓,并給出答案。
注釋
1. Galatolo (2002:137)將“機構(gòu)性溝通”定義為“在溝通中至少有一方通過特定的溝通行為扮演了機構(gòu)性的角色”。
Shlesinger, M. 1998. Corpus-based interpreting studies as an offshoot of corpus-based translation studies [J]. Meta 43(4): 486-493.
王克非、黃立波,2012,國外雙語庫研制與應(yīng)用評析 [J],《外語電化教學(xué)》(6):3-10。
黃立波,2013,《語料庫翻譯學(xué):研究與應(yīng)用》評介 [J],《外語教學(xué)與研究》(4):623-628。
張 威,2012,近十年來口譯語料庫研究現(xiàn)狀及發(fā)展趨勢 [J],《浙江大學(xué)學(xué)報(人文社會科學(xué)版)》(2):193-205。
通訊地址:100089 北京市北京外國語大學(xué)高級翻譯學(xué)院
* 本文寫作得到北京市支持中央高校共建項目青年英才計劃(YETP0842)及北京外國語大學(xué)2015年基本科研業(yè)務(wù)費院系自主項目支持。