陳 拔 萃
(嶺南師范學(xué)院 外國語學(xué)院,廣東 湛江524048)
【外語教學(xué)與語言文化研究】
淺談本科翻譯專業(yè)口譯語料庫的構(gòu)建
陳 拔 萃
(嶺南師范學(xué)院 外國語學(xué)院,廣東 湛江524048)
作為有效整合計(jì)算機(jī)技術(shù)與口譯教學(xué)與研究的形式之一,口譯語料庫的建設(shè)目前在國內(nèi)得到初步的發(fā)展。本科院校翻譯專業(yè)建設(shè)面向?qū)W生的口譯語料庫能對口譯教學(xué)、口譯研究和口譯實(shí)踐起到促進(jìn)作用。文章探討了建設(shè)本科翻譯專業(yè)口譯語料庫的必要性和可操作性,對建庫的主要框架和步驟作出規(guī)劃。最后,對本科翻譯專業(yè)口譯語料庫的使用潛力做出了分析。
翻譯專業(yè);口譯;語料庫
(一) 口譯語料庫
在語言學(xué)研究中,語料庫(corpus)指的是“應(yīng)用計(jì)算機(jī)技術(shù),按照一定的語言學(xué)原則,根據(jù)特定的語言研究目的,大規(guī)模收集并貯存在計(jì)算機(jī)中的真實(shí)語料,這些語料經(jīng)過一定程度的標(biāo)注,便于檢索,可用于描述研究和實(shí)證研究”[1]9。自20世紀(jì)90年代以來,語料庫得到了較快速的發(fā)展,例如平行/雙語語料庫、口語和筆頭語語料庫、學(xué)習(xí)者語料庫等的相繼建立,使得語料庫在語言描寫和語言分析中的作用和優(yōu)勢越來越顯著。事實(shí)上,語料庫語言學(xué)的興起是20世紀(jì)以來語言學(xué)領(lǐng)域的重大變革之一,在研究對象的真實(shí)性、研究方法的系統(tǒng)性、研究結(jié)果的可復(fù)制和可驗(yàn)證性等方面有著其他語言研究范式所不可比擬的巨大優(yōu)勢,正在成為“語言學(xué)研究的主流趨勢”[2]7。
(二)建立本科翻譯專業(yè)口譯語料庫的必要性
目前,在本科院校翻譯專業(yè)中還鮮有面向?qū)W生的口譯語料庫。建立此庫,我們認(rèn)為至少基于以下三方面的考慮:
1.口譯教學(xué)的輔助工具
口譯教學(xué)目前在全國方興未艾。自2006年教育部批準(zhǔn)全國三所院校(復(fù)旦大學(xué)、廣東外語外貿(mào)大學(xué)、河北師范大學(xué))試辦翻譯本科專業(yè)學(xué)位以來,截至2014年,全國共有152所高校獲教育部批準(zhǔn),試辦翻譯本科專業(yè)學(xué)位,嶺南師范學(xué)院正是其中一所。隨著社會對口譯人才需求的進(jìn)一步增加,許多高校都在準(zhǔn)備開設(shè)或已經(jīng)開設(shè)口譯課。幾年來,全國范圍內(nèi)的口譯教學(xué)與培訓(xùn)取得了很大進(jìn)步,但同時(shí)在口譯教學(xué)實(shí)踐中依然呈現(xiàn)出一系列急需解決的研究課題,即如何科學(xué)有效地編寫口譯教學(xué)大綱、完善口譯課程體系和教學(xué)方法等等。
2.口譯研究的堅(jiān)實(shí)基礎(chǔ)
相比口譯教學(xué)而言,口譯研究在很多高校還處于初始階段。以嶺南師范學(xué)院為例,在翻譯系教師公開發(fā)表的關(guān)于口譯研究的論文中,往往是基于個(gè)人教學(xué)或?qū)嵺`經(jīng)驗(yàn)的反思和總結(jié),或是對理論的比較和評析,而缺乏系統(tǒng)的描寫性研究。然而一門學(xué)科的創(chuàng)立和發(fā)展需要一個(gè)“描寫”(description)的基礎(chǔ)[3],一般口譯教師所做研究中還缺乏系統(tǒng)獲取描寫型數(shù)據(jù)和采用科學(xué)有效分析方法進(jìn)行研究的成果。而建立口譯語料庫正是希望彌補(bǔ)這一缺陷,為下一步進(jìn)行口譯理論的研究采集可靠的數(shù)據(jù)打下堅(jiān)實(shí)的基礎(chǔ)。
3.口譯實(shí)踐的理想平臺
目前國內(nèi)外針對外語學(xué)習(xí)開發(fā)的軟件平臺早已顯示出強(qiáng)大的市場生命力。但據(jù)公開資料顯示,針對口譯學(xué)習(xí)者的口譯訓(xùn)練軟件的研發(fā),國內(nèi)目前尚處于初始階段。而目前翻譯本科學(xué)生參加口譯實(shí)踐活動(dòng)的機(jī)會日益增多,如各類展覽會、交易會等等,如果現(xiàn)場語料加以轉(zhuǎn)寫收集進(jìn)入語料庫,將會成為口譯課堂教學(xué)中自主學(xué)習(xí)實(shí)施的理想平臺。學(xué)生口譯語料庫不僅方便口譯學(xué)習(xí)者進(jìn)行自我練習(xí),也可以使合作式學(xué)習(xí)成為可能。此外,通過口譯語料庫,學(xué)生可以更加客觀清晰地認(rèn)識自己口譯中的失誤現(xiàn)象,使口譯教學(xué)更加有效率和具有針對性。
目前,整體來看,國外在口譯語料庫的建設(shè)方面要遠(yuǎn)遠(yuǎn)走在我國前面。普遍認(rèn)為,國外關(guān)于口譯語料庫的討論和建設(shè)起步于20世紀(jì)90年代末,隨著相應(yīng)技術(shù)手段的發(fā)展和成熟,口譯語料庫陸續(xù)被建立并且發(fā)展壯大。其中兩個(gè)最典型的例子為由意大利博洛羅尼亞大學(xué)研究人員Bendazzoli等開發(fā)的“歐洲議會口譯語料庫”(European Parliament Interpreting Corpus, 簡稱EPIC),以及日本名古屋大學(xué)設(shè)計(jì)開發(fā)的面向“自動(dòng)口譯”研究的英日雙語的同聲傳譯語料庫(簡稱CIAIR)。EPIC主要依托于大規(guī)?,F(xiàn)場口譯語料庫的誕生,是對歐洲議會同聲傳譯材料的匯集與撰寫,是一個(gè)包含英語、意大利語、西班牙語的多語平行語料庫。另外,國外還有其他針對專門類別場景的在建口譯語料庫,例如國際健康會議、新聞發(fā)布會等。
在國內(nèi),據(jù)網(wǎng)絡(luò)或公開發(fā)表的論文顯示,目前已經(jīng)建立的大型和口譯相關(guān)的語料庫有“中國大學(xué)生英漢漢英口筆譯語料庫”(Parallel Corpus of Chinese EFL Learners,簡稱PACCEL)。它由北京外國語大學(xué)文秋芳教授等建立,收錄了英語專業(yè)高年級(三、四年級)學(xué)生的口筆譯翻譯測試語料,設(shè)計(jì)總規(guī)模為150萬字詞,實(shí)際收錄210萬字詞。PACCEL有兩個(gè)子庫:口譯平行語料庫(PACCEL-S)和筆譯平行語料庫(PACCEL-W)。其中,口譯部分約50萬字詞[4]4。該語料庫所選語料為全國統(tǒng)一考試專業(yè)八級TEM8,其測試標(biāo)準(zhǔn)科學(xué)、客觀,且通過考試獲取語料質(zhì)量較高,也較容易收集,使得該語料庫在代表性方面有突出的優(yōu)勢,方便了研究者開展多項(xiàng)基于本語料庫的研究。它的建成可以“幫助研究者了解中國學(xué)生學(xué)習(xí)英語的過程,對教學(xué)、研究、測試、培訓(xùn)以及教材編寫、網(wǎng)絡(luò)遠(yuǎn)程教育都有重要意義”[5]。
另一個(gè)在國內(nèi)建成并具一定規(guī)模的語料庫是“漢英會議口譯語料庫”(Chinese-English Conference Interpreting Corpus,簡稱CECIC),由上海交通大學(xué)開發(fā),是以國內(nèi)外新聞發(fā)布會口譯活動(dòng)為對象設(shè)計(jì)的平行語料庫。目前容量約為54萬字,主要包括三個(gè)子庫,其中漢英口譯語料庫與口譯相關(guān)。該庫目前主要用作探索漢英會議口譯中的翻譯共性及其語言特征,并有了初步的研究成果[6]。
廣東外語外貿(mào)大學(xué)王斌華等人通過收集14年(1998—2011年)的中國總理“兩會”記者會漢英交替?zhèn)髯g語料并進(jìn)行轉(zhuǎn)寫,創(chuàng)建了“中國總理‘兩會’記者會漢英交替?zhèn)髯g語料庫”(the Corpus of Chinese-English Interpreting for Premier Press Conference, 簡稱CEIPPC)。該雙語平行語料庫共計(jì)10萬多字[7]。
不可否認(rèn)的是,從Miriam Shlesinger[8]1998年首次提出開展基于語料庫的口譯研究到如今不到20年的時(shí)間,口譯語料庫的建設(shè)及相關(guān)研究取得了階段性的成果,帶來了一種新的口譯研究模式,大大拓展了口譯研究的視野。但同時(shí)口譯語料庫的建設(shè)也面臨著問題和挑戰(zhàn)。例如,語料收集難度較大,真實(shí)場景的口譯語料更是難以有效收集。又如語料的文字轉(zhuǎn)寫、標(biāo)注及過程比較繁雜,而且目前并沒有對副語言(如口譯活動(dòng)中的停頓、支吾等)有很好的標(biāo)注,從而導(dǎo)致對其研究不夠,語料庫的代表性和開放性都受到限制[6]。
值得注意的是,除了某些由大學(xué)院校或研究機(jī)構(gòu)所建立的大型口譯語料庫外,在國外如歐美一些國家亦有研究者專門為某個(gè)研究目的,如研究交傳和同傳中對人名的處理、研究同聲傳譯中的糾正機(jī)制語料庫等[5]自行設(shè)計(jì)建立小型口譯語料庫,并對其公開。這些語料庫針對性強(qiáng),通常有很強(qiáng)的目的性,但容量較小。雖說應(yīng)用范圍和影響力肯定不及大型口譯語料庫,但由于其不是采用傳統(tǒng)口譯研究中經(jīng)驗(yàn)總結(jié)式的思辨、內(nèi)省方法,而是運(yùn)用語料和實(shí)驗(yàn)的方法,可以說開辟了口譯研究的新天地,值得借鑒。然而在國內(nèi),目前通過公開途徑還未能找到小型的與口譯教學(xué)有關(guān)的或者面向?qū)W生的口譯語料庫,在這方面,建立以學(xué)校為單位的本科翻譯專業(yè)口譯語料庫無疑是一次有意義的嘗試。
(一)總體規(guī)劃
參考了國內(nèi)外在口譯語料庫建設(shè)方面的經(jīng)驗(yàn),鑒于翻譯本科專業(yè)的實(shí)際情況,可以在兩年內(nèi)建立一個(gè)學(xué)生口譯語料庫,比較合適的設(shè)置是三個(gè)子庫,分別為學(xué)生課堂練習(xí)語料庫、學(xué)生期末考試語料庫、學(xué)生課外實(shí)踐語料庫,均為雙語平行語料庫。
本語料庫的性質(zhì)屬于翻譯語料庫。這是因?yàn)榭谧g是一種特殊的翻譯活動(dòng),涉及源語與譯語的口頭表達(dá)和轉(zhuǎn)換。同時(shí),根據(jù)語料的對應(yīng)層次,也屬于對應(yīng)語料庫的一種[9]6-7。
本語料庫的語料來源主要是課堂錄音、期末考試學(xué)生的錄音,以及學(xué)生口譯實(shí)踐中的錄音。
本語料庫的語料內(nèi)容主要按照專題進(jìn)行分類,可分為經(jīng)濟(jì)口譯、政治口譯、旅游口譯等。
本語料庫的方向分別有漢—英、英—漢兩大類。
本語料庫的對象為翻譯專業(yè)本科學(xué)生,初步考慮年級為大三和大四。這主要基于一般國內(nèi)高校學(xué)生的英語基礎(chǔ)和口譯課程的設(shè)置來考慮。
語料收集的工作方式和應(yīng)用場合:基于學(xué)生水平、語料收集和研究目的等因素的考慮,在口譯工作方式方面,本語料庫以交替?zhèn)髯g為主;根據(jù)口譯的應(yīng)用場合,主要以聯(lián)絡(luò)口譯、陪同口譯和社區(qū)口譯為主。
(二)建庫步驟
借鑒國內(nèi)外主要口譯語料庫的經(jīng)驗(yàn),結(jié)合各校實(shí)際情況,設(shè)計(jì)主要步驟如下:
1.收集語料
如果收集口譯課堂和期末考試的語料,則使用學(xué)??谧g實(shí)驗(yàn)室或者語言實(shí)驗(yàn)室相關(guān)設(shè)備和軟件,對口譯訓(xùn)練過程和學(xué)生的口譯進(jìn)行錄音。這類材料一方面可以用于學(xué)生自主進(jìn)行課后口譯學(xué)習(xí),一方面還可用作教師口譯教學(xué)研究的真實(shí)素材。如果是在口譯實(shí)踐現(xiàn)場,應(yīng)注意的是,須在活動(dòng)組織方、講者、譯員等都允許的前提下,方可進(jìn)行錄音或者錄影。由于本研究主要對象為交替?zhèn)髯g,在錄音上屬于單聲道,相對比較簡單,現(xiàn)有的設(shè)備可完全覆蓋。但如果可以把錄音過程設(shè)法轉(zhuǎn)為錄影過程,視頻的信息可為日后的研究提供更為重要的分析材料。
2.語料的數(shù)字化
通過現(xiàn)有設(shè)備所獲取的音頻或視頻材料,一般需要用軟件進(jìn)行處理,才可成為計(jì)算機(jī)可讀取或分析的音視頻材料??谧g材料的數(shù)字化通常由聲音編輯軟件實(shí)現(xiàn),例如:Cooledit-Pro 2.0,格式為.wav;采樣速率為32 k;聲道為單聲道;采樣分別率達(dá)到8 Bit。 在語料收集階段需要盡可能收集到好的音質(zhì)的音視頻,這樣才可以為研究副語言特征,如停頓、猶豫等提供可能性。[6]
3.語料的文字轉(zhuǎn)寫
由于所采集語料多為音頻或者視頻模式,因此需要進(jìn)行文字轉(zhuǎn)寫。雖然在技術(shù)層面上,可以利用某些軟件包進(jìn)行語言識別,但目前此類技術(shù)還不完全成熟,結(jié)果并不可靠。因此,只適合用來獲得初稿。文字轉(zhuǎn)寫的大部分工作還是要依靠人工完成,并且在轉(zhuǎn)寫完成后還需要反復(fù)精聽,進(jìn)行核對。在理想的狀態(tài)下,轉(zhuǎn)寫時(shí)除了要求寫出文字以外,還需要注意對副語言(如停頓、支吾等) 的標(biāo)注,但如何對副語言進(jìn)行標(biāo)注,是下一步在研究中探討的難點(diǎn)[10]。
4.文本標(biāo)注
在轉(zhuǎn)寫完成以后,下一步是對文字材料進(jìn)行標(biāo)注,為以后的分析語料打下基礎(chǔ)。參考王斌華、葉亮[3]對口譯教學(xué)語料庫的語料標(biāo)注參數(shù)的分類,結(jié)合學(xué)生實(shí)際情況,本語料庫的標(biāo)注參數(shù)擬分為六個(gè)類別:(1)按口譯主題,分為政治、經(jīng)濟(jì)、社會等;(2)按口譯場合,分為新聞發(fā)布會現(xiàn)場口譯、導(dǎo)游口譯、商務(wù)談判口譯等;(3)按專業(yè)難度,可分為專業(yè)化、一般化、大眾化三個(gè)級別;(4)按語速,可分為快、中、慢三個(gè)等級;(5)時(shí)長及字?jǐn)?shù)(具體語篇具體分析)。
5. 語料入庫及檢索統(tǒng)計(jì)
接著前面幾個(gè)步驟,下一步是把語料導(dǎo)入平行語料庫軟件,從而進(jìn)行檢索統(tǒng)計(jì)分析。本口譯語料庫擬采用國內(nèi)比較通行也比較多借鑒經(jīng)驗(yàn)的ParaConc。經(jīng)過對文本的處理后,將漢語和英語文本分批導(dǎo)入,點(diǎn)擊平行文本對齊,即可建成平行語料庫。在建成以后,既可以對所標(biāo)注的信息進(jìn)行檢索和統(tǒng)計(jì),也可以批量提取相關(guān)語料。
該語料庫建立的使用潛力主要在于對本科翻譯專業(yè)口譯教學(xué)與研究的新突破。近年來,隨著全國翻譯專業(yè)的蓬勃發(fā)展,地區(qū)院校的口譯教學(xué)與研究亦呈現(xiàn)興旺發(fā)展的勢頭。然而在多數(shù)院校里,口譯教學(xué)教師之間僅僅是停留在“經(jīng)驗(yàn)傳授”的階段,并沒有一個(gè)“口譯教學(xué)資源庫”,也沒有將現(xiàn)有口譯教學(xué)資源進(jìn)行很好的整合??谧g語料庫建成以后,在口譯教學(xué)實(shí)際操作中,可以把該語料庫的音頻或視頻作為口譯現(xiàn)場模擬材料,或者把某些譯得好的口譯片段作為范本,從而使學(xué)生通過比較,提高對自己口譯質(zhì)量和存在問題的認(rèn)識。其次,基于本庫,學(xué)生可以在其中選取來自于真實(shí)場景的語料作為口譯自主練習(xí)材料,教師也可以直接運(yùn)用其中的某些錄音或通過音頻剪輯軟件(如cooledit)對語料進(jìn)行切分加工,或調(diào)整語速,使其符合學(xué)生的實(shí)際口譯學(xué)習(xí)水平。
在研究方面,目前口譯研究多數(shù)基于經(jīng)驗(yàn)總結(jié)、主觀內(nèi)省,或是對翻譯理論的比較和評析。此類研究往往缺乏口譯研究本該有的“生態(tài)效度”(ecological validity)[11]48。另外,鑒于目前大多數(shù)口譯研究幾乎都是例證或者以某幾個(gè)學(xué)生的語料為研究對象,而科學(xué)研究中的假設(shè)和求證均需要規(guī)模較大的有效數(shù)據(jù)才可得出具有普遍意義的研究結(jié)論,而這正是目前口譯研究所缺乏的。要改變以上的情況,必須要在研究視角和方法上有新的突破,才會使口譯研究再上一個(gè)臺階。目前國內(nèi)外都比較認(rèn)可的突破口是,建立高校翻譯專業(yè)學(xué)生口譯語料庫。對學(xué)生現(xiàn)場口譯的真實(shí)語料進(jìn)行系統(tǒng)描寫,再采用科學(xué)認(rèn)可的方法進(jìn)行轉(zhuǎn)寫入庫,探究具有院校特色的學(xué)生的口譯現(xiàn)象以及尋找內(nèi)在的規(guī)律和存在問題,以此作為逐步建構(gòu)口譯研究理論的基礎(chǔ)。
[1] 王克非.語料庫翻譯學(xué)探討[M].上海:上海交通大學(xué)出版社,2012.
[2] 張威.口譯語料庫的建設(shè)與應(yīng)用——理論、方法與實(shí)踐[M].北京:北京語言大學(xué)出版社,2013.
[3] 王斌華,葉亮.面向教學(xué)的口譯語料庫建設(shè):理論與實(shí)踐[J].外語界,2009,(2):23-32.
[4] 文秋芳,王金銓.全國大學(xué)生英漢漢英口筆譯語料庫[M].北京:外語教學(xué)與研究出版社,2008.
[5] 李靖,李德超.基于語料庫的口譯研究:回顧與展望[J].中國外語(中英文版),2010,(3):100-111.
[6] 胡開寶,陶慶.漢英會議口譯語料庫的創(chuàng)建與應(yīng)用研究[J].中國翻譯,2010,(5):49-56.
[7] 王斌華.語料庫口譯研究——口譯產(chǎn)品研究方法的突破[J].中國外語(中英文版),2012,(3):94-100.
[8] M.Shlesinger.Corpus-based Interpreting Studies as an Offshoot of Corpus Translation Studies[J].Translator’Journal,1998,43(4):486-493.
[9] 王克非.雙語對應(yīng)語料庫研制與應(yīng)用[M].北京:外語教學(xué)與研究出版社,2004.
[10] 鄒兵,王斌華.口譯語料庫中副語言信息的轉(zhuǎn)寫及標(biāo)注:現(xiàn)狀、問題與方法[J].山東外語教學(xué),2014,(4):17-23.
[11] P?chhacker F. Introducing interpreting studies[M]. London,New York:Routledge,2009.
【責(zé)任編輯 賀 晴】
On the Construction of Interpreting Corpus for Undergraduate Translation Majors
CHEN Ba-cui
(School of Foreign Languages, Lingnan Normal University, Zhanjiang 524048, China)
Constructing a corpus for translation students is an effective way to integrate information technology into interpretation teaching and research. An interpreting corpus for undergraduate translation majors can benefit not only interpretation teaching, but also interpretation research and practice. This paper attempts to investigate the necessity as well as some practical issues of constructing an interpreting corpus, and lay out the frame and some essential procedures. It is hoped the construction of this corpus will have a great potential for practical use.
translation major; interpretation; corpus
2015-03-02
嶺南師范學(xué)院科研計(jì)劃項(xiàng)目:嶺南師范學(xué)院翻譯專業(yè)口譯語料庫建設(shè)——翻譯本科專業(yè)人才培養(yǎng)模式創(chuàng)新實(shí)驗(yàn)區(qū)之口譯研究(QW1408)
陳拔萃(1986—),女,廣東信宜人,嶺南師范學(xué)院外國語學(xué)院教師,文學(xué)碩士,主要從事口譯研究。
H315
A
1009-5128(2015)16-0071-04
渭南師范學(xué)院學(xué)報(bào)2015年16期