文任彬
自上世紀(jì)50年代以來,以計算機技術(shù)為依托的語料庫研究開始出現(xiàn)并快速發(fā)展,最初主要集中于語言學(xué)、詞匯學(xué)、詞典編撰等領(lǐng)域,進入20世紀(jì)90年代末,語料庫開始與翻譯研究結(jié)合,為翻譯研究注入了新的靈感和活力,而21世紀(jì)以來,基于語料庫的翻譯研究的相關(guān)主題受到了越來越多翻譯學(xué)者和大學(xué)教師的偏愛,大家開始嘗試將語料庫應(yīng)用于各個具體領(lǐng)域的翻譯實踐中,例如:建筑英語語料庫建設(shè),人工智能背景下金融領(lǐng)域的語料庫建設(shè),《黃帝內(nèi)經(jīng)》英譯語料庫建設(shè)等等。
在此基礎(chǔ)上,很多學(xué)者也將目光轉(zhuǎn)向了語料庫研究的微觀方向和技術(shù)層面。語料庫是按照一定的語言原則,運用隨機抽樣方法,收集自然出現(xiàn)的連續(xù)的語言,運用文本或話語片段而建立的具有一定容量的大型電子文本庫。因此最重要的幾個關(guān)鍵因素就是對語料的選擇,對詞頻的準(zhǔn)確把握和對文本的標(biāo)識和賦碼。首先在語料的選擇上,雙語語料庫建設(shè)者應(yīng)選擇高質(zhì)量的,權(quán)威的英漢翻譯素材,例如專業(yè)課的雙語教材;國家官方新聞網(wǎng)站的文章;著名翻譯家的譯著等。根據(jù)英語和漢語的特點,選擇合適的句子做為數(shù)據(jù)存儲的最小單位,設(shè)定對齊類型為一對多(原文對應(yīng)多段譯文)和多對一(譯文對應(yīng)多段原文),最大限度地滿足檢索者對翻譯學(xué)習(xí)和研究的要求。除了對語料文本的挑選和處理,翻譯語料庫的主要建設(shè)工作還包括檢索平臺的搭建。語言處理人員在導(dǎo)入語料和對語料進行對齊標(biāo)注之后,軟件支持人員設(shè)計高性能的檢索語言。以目前使用較多的語料庫檢索語言SQL為例,需要將語料庫建設(shè)者導(dǎo)入的素材轉(zhuǎn)化為可以用計算機執(zhí)行的SQL語句。經(jīng)過語料庫使用者的檢索之后,在最終的用戶界面顯示檢索的結(jié)果,并且能夠進行排序、導(dǎo)出、保存等操作。
由于近年來高校大學(xué)英語課程改革的推進,翻譯教學(xué)被大學(xué)英語教師們重視,并成為課程體系中重要的一部分。在大學(xué)英語四六級考試中,翻譯題型占據(jù)相當(dāng)一部分比例的分值,并且學(xué)生在走上工作崗位之后,需要具備一定的英語翻譯技能,這些都要求我們不斷轉(zhuǎn)變和豐富現(xiàn)有的翻譯教學(xué)手段,然而目前的大學(xué)英語翻譯教學(xué)仍然存在一定的問題。首先體現(xiàn)在課上部分,由于課堂教學(xué)時間受課程規(guī)劃的嚴(yán)格限制,不可能給學(xué)生很多的時間進行思考和分析,翻譯教學(xué)主要是以教師為中心來進行,教師盡可能多的將所準(zhǔn)備的翻譯理論知識和經(jīng)典范例講解給學(xué)生,而學(xué)生在整個教學(xué)過程中的大部分情況下只是一個被動的接受者,能夠發(fā)揮主觀能動性的時間很少。
在課下部分,我們會使用超星學(xué)習(xí)通和U校園平臺為學(xué)生布置各種形式的線上翻譯作業(yè),例如四六級真題練習(xí),學(xué)生之間互相批改對方的翻譯篇章,對常用漢英翻譯表達方式的積累等。但由于沒有一個相應(yīng)的客觀評價體系,學(xué)生無法正確地對自己的翻譯水平做出評價,從而不能達到翻譯練習(xí)的預(yù)期目的。并且大部分的翻譯練習(xí)為主觀題,教師需要一個批閱和反饋的周期,由于翻譯本身的難度,學(xué)生翻譯水平的提高也是個耗費漫長時間的過程,綜述以上因素,部分學(xué)生難以堅持翻譯練習(xí),慢慢的也就失去了課后進行翻譯練習(xí)的興趣。
因此我們亟需尋找新的教學(xué)方法來改變翻譯教學(xué)的現(xiàn)狀,由于語料庫自身強大的功能和語料庫教學(xué)具有的自主性、開放性的特點,我們相信將語料庫這一工具引入大學(xué)英語課程可以極大地促進學(xué)生的學(xué)習(xí)自主性。目前國內(nèi)外最具代表性和影響力的大型語料庫主要有:英國的翻譯英語語料庫(TEC);英國國家語料庫(British National Corpus,BNC);布朗語料庫(Brown Corpus);我國上海交通大學(xué)的JD-EST 語料庫等,但是這些大型語料庫或因為網(wǎng)絡(luò)壁壘的原因,或因為不對公眾開放的原因,目前尚且無法被普通大學(xué)教師使用。建立大型語料庫需要輸入至少5000萬詞以上的素材,這需要投入大量的人力和資源,普通學(xué)校短期內(nèi)難以做到這一點,因此本篇文章主要研究面向本校師生的,小型雙語語料庫的建設(shè)。在本語料庫投入使用并不斷完善之后,將面向大眾開放,并尋求同類院校的合作,不斷擴大該語料庫的規(guī)模。
在語料庫設(shè)計之初,我們首先明確該語料庫的規(guī)模和服務(wù)對象。由于人力和資金投入的限制,目前該語料庫主要服務(wù)對象為我校本科階段全體非英語專業(yè)學(xué)生,目的是幫助學(xué)生們在大學(xué)英語四六級考試中的翻譯部分取得理想的成績,并且具備所學(xué)專業(yè)的基本翻譯實踐能力。語料庫的內(nèi)容主要分為2013年12月份(題型改革之后)-2022年6月共計18場次108套大學(xué)英語四六級翻譯真題,以及結(jié)合我校的專業(yè)特色所總結(jié)的建筑工程、金融財會、機械智能、法律、文史哲五大板塊,我們最終的目標(biāo)詞條為100萬詞左右,預(yù)測可以基本滿足教學(xué)研究與學(xué)生翻譯學(xué)習(xí)的需要。
其次建設(shè)語料庫最重要的部分之一就是對語料素材進行篩選和存儲。由于目前我們的語料庫容量有限,所以跳過了抽樣的環(huán)節(jié),更多地關(guān)注輸入語料的來源和質(zhì)量。例如目前的四六級翻譯真題為漢譯英,我們除了選取官方公布的參考答案,本著一對多的對齊原則,我們也篩選了一些英語培訓(xùn)機構(gòu)和網(wǎng)絡(luò)上發(fā)布的質(zhì)量高的英譯版本,每篇被選定的篇章都由至少三名教師進行檢查核對,杜絕任何翻譯錯誤和用語不規(guī)范現(xiàn)象。而其他五大專業(yè)方向的板塊,素材主要來源于權(quán)威出版社出版的專業(yè)課雙語教材,相關(guān)行業(yè)的新聞網(wǎng)站和權(quán)威專家的譯著等。為了保證所選素材的實用性和前沿性,我們咨詢了學(xué)校相關(guān)專業(yè)的專業(yè)課教師,聽取了他們對于行業(yè)教材和著作選取的建議。
將語料庫素材轉(zhuǎn)換為計算機執(zhí)行語言是語料庫建設(shè)最復(fù)雜和繁瑣的步驟之一。在此主要介紹需要大學(xué)英語教師完成的部分:分詞和賦碼。與英語單詞不同,中文單詞是由一個或多個漢字組成。一個漢字可能代表一個音節(jié),但它不一定構(gòu)成一個單詞。所以對中英文素材進行恰當(dāng)?shù)姆衷~是非常必要的。目前,中文文本可以使用Autotag 或 ICTCLAS 3.0 進行單詞分詞。前者由臺灣中文信息處理集團開發(fā),后者由中國科學(xué)院計算技術(shù)研究所開發(fā)。為了促進該語料庫的長期發(fā)展和提高學(xué)生的使用體驗,賦碼也是非常必要的,綜合比較幾種賦碼方式,我們最后選擇了更適合小型語料庫的詞類賦碼。目前自動詞類賦碼技術(shù)已經(jīng)基本成熟,對英語基本上可以通過計算機自動賦碼,且賦碼正確率在96%~97%左右。不管是分詞還是賦碼過程,都需要語料庫創(chuàng)建者們層層把關(guān),并對數(shù)據(jù)庫進行定期的備份與維護。
近年來,我校不斷進行包括英語課程在內(nèi)的課程體系改革,語料庫在大學(xué)英語課堂的引入就是我們的一次嘗試和探索,具體分為課上和課下兩個部分。首先在課堂講授和練習(xí)部分,語料庫的引入能夠使翻譯教學(xué)的內(nèi)容更加深入和全面,使學(xué)生的課堂學(xué)習(xí)更有效率。教師設(shè)置相應(yīng)的任務(wù),學(xué)生通過檢索語料庫快速獲取信息。而語料庫中積累的大量翻譯教學(xué)素材,能夠使翻譯學(xué)習(xí)者們充分利用英漢雙語平行對應(yīng)的語料觀察翻譯語言,掌握英漢兩種語言在翻譯過程中的轉(zhuǎn)換規(guī)律,了解某些特定詞或結(jié)構(gòu)的轉(zhuǎn)換原則。翻譯語料庫的語料都是來源于真實的譯本語言,所以具有時效性,客觀性和真實性,學(xué)生在學(xué)習(xí)過程中不僅能獲得翻譯表達方式的積累,并且可以潛移默化地掌握翻譯理論及認(rèn)識翻譯的本質(zhì)。
學(xué)生在接觸一個新詞匯的用法時,大部分是通過老師的講解或查閱詞典。但詞典所能提供的例句數(shù)量有限,并且語言情境相對單一,語料庫的引入可以填補這部分的空白。例如2021年12月四級翻譯真題中的句子:“長久以來,大運河對中國的經(jīng)濟發(fā)展發(fā)揮了重要作用,有力地促進了……?!边@句話中出現(xiàn)了四級考試中的高頻詞匯“促進了”,通過對語料庫的檢索,學(xué)生不僅可以掌握例如promote;improve;enhance;facilitate;advance;boost等詞的具體用法,還可以了解到在其他試卷中這些詞匯的考察情況。
語料庫在課下部分引入的最大優(yōu)勢就是能充分調(diào)動學(xué)生翻譯學(xué)習(xí)的自主性和積極性。根據(jù)我們問卷調(diào)查的結(jié)果顯示,在四六級考試中相對于閱讀和聽力題型,翻譯和寫作兩個部分是大部分學(xué)生都認(rèn)為非常重要,但是短時間內(nèi)又很難提高分?jǐn)?shù)的。翻譯不僅需要學(xué)生具備相當(dāng)數(shù)目的英漢表達方式的儲備,還需要熟悉各種句型的銜接,并且四六級考試對單詞的拼寫和語法細(xì)節(jié)都有很高的要求。這需要平時的積累和不間斷的練習(xí),因此課下學(xué)習(xí)時間的利用變得尤為重要。教師在向?qū)W生詳細(xì)介紹語料庫的使用方法之后,通過小組合作和翻轉(zhuǎn)課堂的形式,以5-8人小組為單位布置開放性作業(yè),例如:漢譯英時某些情況下選擇主動或被動表達式的深層原因;通過詞頻統(tǒng)計出特定體裁和語境下最常用的翻譯詞匯;四六級考試和你所學(xué)專業(yè)在句子解構(gòu)和句子復(fù)雜程度方面的偏好等等。學(xué)生通過使用語料庫完成任務(wù)之后,教師隨機抽取小組在課堂上向同學(xué)們分享自己的觀點。
翻譯語料庫可以使翻譯教學(xué)的內(nèi)容更具真實性和時效性,使教學(xué)的形式更加豐富多樣,提升了學(xué)生翻譯學(xué)習(xí)的積極性和學(xué)習(xí)效率。語料庫的創(chuàng)建涉及到語料庫的設(shè)計,素材的采集、整理和加工,以及創(chuàng)建語料庫之后的分詞、賦碼、后期維護和管理。目前本校語料庫的建設(shè)仍然處于初級階段,作為語料庫的建設(shè)人員任重而道遠,之后我們會尋求與同類院校進行合作,以共享共建為目標(biāo),將語料庫進行橫向和縱深的拓展。我們相信,隨著語料庫翻譯研究的深入,會促進更多語料庫的創(chuàng)建以及計算機技術(shù)的發(fā)展,語料庫將在高校翻譯教學(xué)中發(fā)揮更大的作用。