北京航空航天大學(xué) 錢多秀
語料庫(kù)(corpus)指語言數(shù)據(jù)的集合,而語料庫(kù)語言學(xué)(corpus linguistics)以語料庫(kù)為基礎(chǔ)對(duì)真實(shí)文本中的語言進(jìn)行觀察和分析,結(jié)合自然語言中的一些抽象規(guī)則,探討某種語言及雙語或多語之間的關(guān)系,并根據(jù)真實(shí)發(fā)生的語言現(xiàn)象得出比較可靠的分析結(jié)果。顧曰國(guó)(2003)認(rèn)為語料庫(kù)語言學(xué)的研究有兩層主要含義。一是利用語料庫(kù)對(duì)語言的某個(gè)方面進(jìn)行研究,即它并不是一個(gè)新學(xué)科的名稱,而僅僅反映了一個(gè)新的研究手段。二是依據(jù)語料庫(kù)所反映出來的語言事實(shí)對(duì)現(xiàn)行語言學(xué)理論進(jìn)行批判,提出新的觀點(diǎn)或理論。前者正是本文關(guān)注之處。
在20世紀(jì)30年代現(xiàn)代計(jì)算機(jī)出現(xiàn)之前,語料庫(kù)研究通常是手工完成。而計(jì)算機(jī)的出現(xiàn)使得大規(guī)模自動(dòng)化處理語言成為可能。至于是否對(duì)語料進(jìn)行標(biāo)注,則可以根據(jù)研究目的分別對(duì)待。比如,Sinclair(1992)認(rèn)為對(duì)語料無需進(jìn)行過多處理,因?yàn)槲谋颈旧砭湍苷f明問題,但Wallis(2007)卻提倡標(biāo)注,認(rèn)為這樣可以提高語言理解和處理的質(zhì)量。后者的觀點(diǎn)基于以Quirk (1960: 40-61)為首進(jìn)行的英語用法調(diào)查(Survey of English Usage),這項(xiàng)調(diào)查是歐洲范圍內(nèi)進(jìn)行的第一次有關(guān)語料的研究。
經(jīng)歷了第一代計(jì)算機(jī)處理的語料庫(kù)和第二代電子計(jì)算機(jī)處理的語料庫(kù)兩個(gè)發(fā)展階段后(王建新1998, 1999),進(jìn)入20世紀(jì)80 年代,現(xiàn)代科技的迅猛發(fā)展促使語料庫(kù)及語料庫(kù)語言學(xué)也進(jìn)入快速發(fā)展期,各國(guó)家、各語種語料庫(kù)的庫(kù)容動(dòng)輒以百萬字詞甚至千萬字詞為計(jì)。根據(jù)建庫(kù)目的和功能,語料庫(kù)的分類多種多樣,如單語/雙語/多語語料庫(kù)、雙語/多語平行(或類比)語料庫(kù)、書面文本語料庫(kù)、口語語料庫(kù)、歷時(shí)語料庫(kù)、共時(shí)語料庫(kù)、動(dòng)態(tài)語料庫(kù)、靜態(tài)語料庫(kù)、各種文體/專業(yè)領(lǐng)域的語料庫(kù),等等。
在中國(guó),1986年,上海交通大學(xué)完成了交通大學(xué)科技英語語料庫(kù)( JDEST)。經(jīng)過近30年的努力,語料庫(kù)獲得了長(zhǎng)足進(jìn)展,建成了一批可與國(guó)際同類語料庫(kù)相比的專門語料庫(kù)(如JDEST)、學(xué)習(xí)者口筆語語料庫(kù)(如文秋芳等 2009)以及數(shù)量眾多的各種平行語料庫(kù)等。
事實(shí)上,幾乎語言學(xué)的各個(gè)領(lǐng)域都可以從語言使用的角度進(jìn)行研究,語料庫(kù)數(shù)據(jù)正是所使用語言的樣本,它所提供的海量語料使研究者能夠系統(tǒng)地對(duì)大量的文本語料進(jìn)行審視,使人們有可能發(fā)現(xiàn)一些以前從未發(fā)現(xiàn)的語言事實(shí)(Sinclair 1991)。因此,語料庫(kù)作為研究手段可用于語言學(xué)研究的諸多領(lǐng)域,如詞匯學(xué)、語法學(xué)、語言教學(xué)、文體學(xué)、對(duì)比語言學(xué)、翻譯等。目前,語料庫(kù)語言學(xué)的研究話題已經(jīng)從詞匯、語法和詞典學(xué)擴(kuò)展到語言教學(xué)、二語習(xí)得、翻譯、自然語言處理、話語分析、認(rèn)知語言,乃至抽象的理論語言學(xué)問題探索等廣泛的領(lǐng)域(甄鳳超 2010)。這些研究成果,根據(jù)所基于的語料庫(kù),可以分為單語研究、雙語/多語對(duì)比研究、翻譯研究、機(jī)器翻譯研究、教學(xué)研究等多個(gè)類別。
作為一種研究方法,語料庫(kù)在對(duì)比研究、翻譯研究和翻譯技術(shù)研發(fā)這三個(gè)與其顯著相關(guān)的領(lǐng)域得到了尤其突出的使用,本文將簡(jiǎn)要介紹這些應(yīng)用,分析它們?cè)趹?yīng)用時(shí)所體現(xiàn)的共性和個(gè)性,并對(duì)其未來走勢(shì)做一定展望。
對(duì)比(語言)研究是語言學(xué)研究的重要分支(許余龍 1992),但高度抽象是20 世紀(jì)語言研究的總特點(diǎn)(顧曰國(guó) 2003),需要向具體化靠攏。在語言研究由高度抽象轉(zhuǎn)向語言的實(shí)際使用這個(gè)過渡中,語料庫(kù)和語料庫(kù)語言學(xué)起著十分重要的作用,體現(xiàn)為幾個(gè)方面:一是提供真實(shí)語料;二是提供統(tǒng)計(jì)數(shù)據(jù);三是驗(yàn)證現(xiàn)行的理論;四是構(gòu)建新的理論(顧曰國(guó) 2003)。
對(duì)比語言研究與其他語言學(xué)學(xué)科一樣,其研究日益成為基于數(shù)據(jù)的或數(shù)據(jù)驅(qū)動(dòng)的,依靠對(duì)語料數(shù)據(jù)的統(tǒng)計(jì)來驗(yàn)證假設(shè)或揭示語言之間的相似和差異。這些數(shù)據(jù)從句法、模態(tài)、語篇、語法化、語用功能、修辭功能等(參見Marzoetal. 2012)多個(gè)維度提供定性研究的證據(jù),說明定量與定性研究之間是一種互補(bǔ)關(guān)系。利用語料庫(kù)方法的語言對(duì)比研究取得了豐碩成果,以語言具體層次的比較為主,如詞匯(連帶語義韻)層面,短語層面,語法層面等,同時(shí)輔以個(gè)案研究,說明具體問題,陳述研究發(fā)現(xiàn)及其在教學(xué)應(yīng)用上的意義。
通過總結(jié)概括大量的個(gè)案研究,可以進(jìn)一步深入探討語言表面背后的原因,如民族思維習(xí)慣和文化心態(tài)(許文勝、張柏然 2006;McEnery & Xiao 2010),也可以找到它們?cè)谄渌I(lǐng)域的啟發(fā)意義,如語言和翻譯教學(xué)(趙世開 1990;衛(wèi)乃興 2006, 2011)等。
但是,語料庫(kù)語言學(xué)有其局限性。語料庫(kù)數(shù)據(jù)提供的只是所使用語言的事實(shí)例證,它本身無法對(duì)數(shù)據(jù)進(jìn)行解釋和對(duì)語料庫(kù)數(shù)據(jù)進(jìn)行推理。這些數(shù)據(jù)在輔助人們的語言直覺和內(nèi)省判斷的時(shí)候,離不開研究者本人的語言直覺和內(nèi)省(馮志偉 2007: 15)。這也是對(duì)20世紀(jì)以高度主觀抽象為特征的語言學(xué)研究的一種重要補(bǔ)充和返璞歸真。
這個(gè)領(lǐng)域的研究以Baker(1993)的文章《語料庫(kù)語言學(xué)與翻譯研究:?jiǎn)⑹竞蛻?yīng)用》為始,各國(guó)學(xué)者將語料庫(kù)研究方法迅速推廣應(yīng)用到各自語境下的翻譯研究和理論闡述,使語料庫(kù)翻譯研究得到大發(fā)展,逐步成為一種連貫、綜合和豐富的研究范式,使其成為描述翻譯研究中的一種新范式(Laviosa 1998, 2002; 王克非 2006)。
國(guó)內(nèi)的語料庫(kù)翻譯研究起步并不晚。早期的規(guī)模較大的雙語對(duì)應(yīng)語料庫(kù)是北京外國(guó)語大學(xué)開發(fā)研制的3000萬字/詞的“通用漢英對(duì)應(yīng)語料庫(kù)”。此后,基于語料庫(kù)的翻譯研究一直吸引了國(guó)內(nèi)廣大學(xué)者的興趣,研究成果主要集中在翻譯語料庫(kù)的建設(shè)及研究,翻譯普遍性/共性研究,翻譯過程研究和翻譯文體研究。
就語料庫(kù)對(duì)翻譯研究的貢獻(xiàn),Tymoczko(1998)的觀點(diǎn)頗具代表性,她認(rèn)為,語料庫(kù)方法是一種強(qiáng)有力的工具,是翻譯學(xué)保持活力和動(dòng)力的核心途徑。它可以使人們充分認(rèn)識(shí)到翻譯轉(zhuǎn)換中所產(chǎn)生的差異,這種差異性經(jīng)歸納總結(jié)后發(fā)現(xiàn)的規(guī)律還能起到形成規(guī)范的作用。
近年來通過大量的實(shí)例,基于語料庫(kù)的翻譯研究促使了翻譯研究方法從規(guī)約式轉(zhuǎn)向描述式,使翻譯研究從最初的語言學(xué)和對(duì)比語言學(xué)的角度,發(fā)展到后來從社會(huì)、政治、文化等多角度來解讀譯文的內(nèi)外特點(diǎn),標(biāo)志著翻譯研究從單純的描述研究向描述、闡釋研究發(fā)展。黃忠廉(2009)認(rèn)為,翻譯研究要在理論和實(shí)踐層面處理和解決跨語言、跨文化交際問題,翻譯語料庫(kù)是譯論研究現(xiàn)代化的有效手段,其定量研究可催生譯論觀點(diǎn)的萌發(fā),可對(duì)譯論觀點(diǎn)證實(shí)或證偽。
但對(duì)比后可以發(fā)現(xiàn),國(guó)內(nèi)語料庫(kù)實(shí)證研究的范圍與國(guó)外相比還相對(duì)狹窄(劉康龍、穆雷2006)。自Baker(2000)提出用語料庫(kù)方法研究譯者文體以來,國(guó)外目前基于語料庫(kù)的譯者文體研究不僅有對(duì)譯者偏愛的語言模式的研究,還有對(duì)構(gòu)成譯者文體的宏觀因素的量化分析,如翻譯選材、翻譯策略、敘事結(jié)構(gòu)、意識(shí)形態(tài)等等。但國(guó)內(nèi)基于語料庫(kù)的與文體相關(guān)的研究還不是很多,對(duì)翻譯過程的研究仍顯不足(周小玲、蔣堅(jiān)松 2010)。
一般說來,翻譯是一種語言轉(zhuǎn)換成另一種語言的活動(dòng),目的是求得源語與譯入語的最大限度的對(duì)等對(duì)應(yīng),人工翻譯和機(jī)器翻譯都是如此。機(jī)器翻譯是按照指定的程序讓計(jì)算機(jī)進(jìn)行自動(dòng)化的對(duì)比操作,從而自動(dòng)產(chǎn)生譯文(王挺等 1996)。但鑒于機(jī)器翻譯技術(shù)研發(fā)至今所遇到的各種困難,全自動(dòng)高質(zhì)量的自動(dòng)翻譯系統(tǒng)一直未能實(shí)現(xiàn)。目前,機(jī)器翻譯包含在翻譯技術(shù)(translation technology)這個(gè)更廣義的概念里。
翻譯技術(shù)包括機(jī)器翻譯技術(shù)、計(jì)算機(jī)輔助翻譯技術(shù)以及其他各種各樣能夠在翻譯過程中給譯者提供幫助的技術(shù)手段(Chan 2004: 139)。對(duì)于機(jī)器翻譯的研究和開發(fā)而言,早期的基于句法/規(guī)則、基于概率、基于知識(shí)、基于轉(zhuǎn)換等方法,幾十年的實(shí)踐均未能產(chǎn)生令人滿意的自動(dòng)譯文。從20世紀(jì)80年代開始,隨著計(jì)算機(jī)輔助翻譯概念的普及和翻譯記憶(translation memory)處理技術(shù)的快速發(fā)展,研究者發(fā)現(xiàn),基于統(tǒng)計(jì)以及基于例句/語料的途徑可以使翻譯系統(tǒng)生成的譯文更加可靠,后期編輯和處理的工作量大幅減少。而翻譯記憶就是雙語或多語的平行語料庫(kù),該技術(shù)能夠在翻譯過程中通過檢索、匹配等手段,給譯者提供產(chǎn)出譯文的提示,這些提示可以是術(shù)語、短語、短句或整句,甚至也可以是段落。因此,語料庫(kù),尤其是雙語/多語平行語料庫(kù)在翻譯技術(shù)研發(fā)領(lǐng)域也有了用武之地。
為此目的而建立和使用的語料庫(kù)一般需要語言學(xué)意義上的標(biāo)注,目前還處在比較基礎(chǔ)的層面,如語音、詞匯、句法等。
1993年,W. J. Hutchins在第四屆機(jī)器翻譯高峰會(huì)議(MT Summit IV)上指出,自1989年以來,機(jī)器翻譯的發(fā)展進(jìn)入了一個(gè)新紀(jì)元。這個(gè)新紀(jì)元的重要標(biāo)志是,在基于規(guī)則的技術(shù)中引入了語料庫(kù)方法,其中包括統(tǒng)計(jì)方法、基于實(shí)例的方法、通過語料加工手段使語料庫(kù)轉(zhuǎn)化為語言知識(shí)庫(kù)的方法(馮志偉 2010)。目前,主流的翻譯技術(shù)就是基于雙語/多語平行語料的翻譯記憶數(shù)據(jù)庫(kù)。
同年,楊惠中(1993)發(fā)表了《語料庫(kù)語言學(xué)與機(jī)器翻譯》一文,表明中國(guó)的語料庫(kù)翻譯研究與國(guó)外幾乎同步。根據(jù)楊梅、白楠(2010)的考察,過去20年來語料庫(kù)在機(jī)器翻譯中的應(yīng)用研究主要有三類,即語料庫(kù)在機(jī)器翻譯中的應(yīng)用;利用語料庫(kù)設(shè)計(jì)機(jī)器翻譯系統(tǒng)或翻譯數(shù)據(jù)庫(kù),通過自建語料庫(kù)設(shè)計(jì)專門用于英語詞典翻譯出版的動(dòng)態(tài)機(jī)器翻譯系統(tǒng)或機(jī)器輔助翻譯系統(tǒng)等;利用語料庫(kù)消除詞的歧義來選擇譯文或獲取等價(jià)的翻譯單位等機(jī)器翻譯中的一些具體問題。
基于語料庫(kù)的機(jī)器翻譯方法大致有基于統(tǒng)計(jì)和基于實(shí)例兩種,兩者都使用語料庫(kù)作為譯文的來源。在基于統(tǒng)計(jì)的機(jī)器翻譯方法中,知識(shí)的表示是統(tǒng)計(jì)數(shù)據(jù),而不是語料庫(kù)本身;翻譯知識(shí)的獲取是在翻譯之前完成,翻譯的過程中不再使用語料庫(kù);而在基于實(shí)例的機(jī)器翻譯方法中,雙語語料庫(kù)本身就是翻譯知識(shí)的一種表現(xiàn)形式,翻譯知識(shí)的獲取在翻譯之前沒有全部完成,在翻譯的過程中還要查詢并利用語料庫(kù)(馮志偉 2010)。
“語料庫(kù)語言學(xué)已經(jīng)成為語言研究的主流。基于語料庫(kù)的研究不再是計(jì)算機(jī)專家的獨(dú)有領(lǐng)域,它正在對(duì)語言研究的許多領(lǐng)域產(chǎn)生愈來愈大的影響?!边@是1996 年Jenny Thomas等人在UsingCorporaforLanguageResearch:StudiesinHonourofGeoffreyLeech一書中的開場(chǎng)白(黃昌寧、李娟子 2002: 1)。根據(jù)筆者對(duì)中國(guó)知網(wǎng)(CNKI)的檢索,在中國(guó)語境下的情況大致如此。筆者發(fā)現(xiàn),僅2013年一年,在CSSCI級(jí)別期刊上發(fā)表的論文中,篇名中含“語料庫(kù)”的就有75篇,大部分主題均與語言各角度的研究有關(guān),探討了語料庫(kù)作為一種方法在各個(gè)領(lǐng)域的應(yīng)用,以微觀層面居多。
Granger(2003)也曾指出,語料庫(kù)方法尤其適用于對(duì)比語言研究和翻譯研究?,F(xiàn)在,隨著語料庫(kù)尤其是多語語料庫(kù)的創(chuàng)建和應(yīng)用,對(duì)比研究、翻譯研究、翻譯技術(shù)研發(fā)之間的關(guān)系日益密切。它們的共同之處在于都是處理兩種或兩種以上的語言。無論在理論或在應(yīng)用層面, 它們都對(duì)兩種或多種語言之間的異同問題感興趣,甚至可以說,它們都是專門處理語言異同問題的學(xué)科,主要表現(xiàn)為三者都使用相似或相同的雙語或多語語料庫(kù)從事研究或開發(fā),語料創(chuàng)建和使用時(shí)也遇到并處理大致相似的問題。
比如,大多數(shù)語料庫(kù)翻譯研究跟對(duì)比研究關(guān)系密切,集中研究譯文與原文的詞法和句法的特征差異,如譯文所體現(xiàn)出的明晰化、簡(jiǎn)略化、標(biāo)準(zhǔn)化等普遍性。有代表性的研究(參見陳偉 2007)涉及到了類比構(gòu)詞現(xiàn)象、名詞化現(xiàn)象、詞語多樣性、詞頻分析、類型/標(biāo)記比、平均句長(zhǎng)和敘事結(jié)構(gòu)特點(diǎn)、搭配規(guī)律和語義韻、男女譯者的風(fēng)格差異、語義場(chǎng)和文化信息差異等。這些統(tǒng)計(jì)數(shù)據(jù)不僅能幫助定量分析,也對(duì)定性研究者在分析社會(huì)、文化、意識(shí)形態(tài)等背后因素時(shí),帶來諸多驚喜。
在翻譯技術(shù)的研發(fā)方面,基于語料庫(kù)的翻譯系統(tǒng)具有明顯優(yōu)勢(shì),它結(jié)合最新的人工智能技術(shù),可以實(shí)現(xiàn)翻譯質(zhì)量、數(shù)量和速度的大幅度提高。但是,由于尚有理論問題和技術(shù)難題未能解決,也缺乏綜合性人才,比較理想的基于語料庫(kù)的成熟翻譯系統(tǒng)在短期之內(nèi)恐難以實(shí)現(xiàn)(李亮 2004)。
近年來,三者在對(duì)語料庫(kù)的使用和借鑒中所體現(xiàn)出來的共性尤為突出,這些語料庫(kù)的類型有雙語、多語、平行或類比(可比)。一方面,在機(jī)器翻譯中,平行語料庫(kù)所搜集的數(shù)據(jù)能為翻譯模式提供訓(xùn)練材料,也能為計(jì)算語言學(xué)的相關(guān)問題提供數(shù)據(jù),如多語語法推理和自動(dòng)詞典生成等。另一方面,翻譯研究的學(xué)者利用語料來對(duì)翻譯過程進(jìn)行實(shí)證研究,包括翻譯策略或翻譯文本的特定屬性。對(duì)職業(yè)譯者而言,多語語料庫(kù)給譯者提供參考性資料,幫助譯者快速找到所需信息。而語料庫(kù)在對(duì)比研究中,可以為研究設(shè)想及發(fā)現(xiàn)提供實(shí)證數(shù)據(jù),同時(shí)還能發(fā)現(xiàn)之前未被關(guān)注的跨語言差異。
由此可見,它們有著共同的基礎(chǔ)和性質(zhì),有互補(bǔ)作用,最終目的都是為了跨文化和跨語言的交際。如果能將三者結(jié)合得更為緊密,使之互動(dòng)性更強(qiáng),將有可能幫助翻譯技術(shù)研發(fā)突破目前的瓶頸,即語義理解和確定翻譯對(duì)等單位等方面的問題,促進(jìn)技術(shù)工具的進(jìn)一步改善。
但不容置疑,由于對(duì)比研究、翻譯研究和翻譯技術(shù)研發(fā)都有著各自獨(dú)特之處,有著各自不同的出發(fā)點(diǎn)和關(guān)注點(diǎn),因此在使用語料庫(kù)作為研究方法方面,三個(gè)領(lǐng)域之間的交流不夠。例如,對(duì)比研究和翻譯技術(shù)研發(fā)都使用平行語料庫(kù),但翻譯方向、翻譯屬性、翻譯策略這些因素都沒有得到考慮。尤其是翻譯關(guān)鍵技術(shù)的研發(fā),基本不考慮文本類型或者語域因素(巢文涵 2008)。同時(shí),在對(duì)比語言研究和翻譯研究中,通常只使用多語語料庫(kù)最基本的標(biāo)注加工和查詢功能,不太重視這些功能對(duì)翻譯技術(shù)研發(fā)的潛在價(jià)值。因此,三者之間又有一定程度的疏離。
通過上述語料庫(kù)在三個(gè)領(lǐng)域中應(yīng)用的簡(jiǎn)要說明,可以看出語料庫(kù)方法為相關(guān)研究提供了數(shù)據(jù)來源、方法問題、分析工具、分析步驟等,對(duì)提高研究結(jié)論的可靠性和客觀性都有巨大的作用。
對(duì)于語料庫(kù)及語料庫(kù)語言學(xué)的前景,特別是在本世紀(jì)的發(fā)展方向(參見張政 2010: 81),Svartvik(1992)就曾預(yù)言,計(jì)算機(jī)將運(yùn)行更快,體積更小,價(jià)格更低;語料庫(kù)將規(guī)模更大,質(zhì)量更好,利用率更高。McEnery(1993)則認(rèn)為語料庫(kù)語言學(xué)今后的發(fā)展將主要受語料庫(kù)規(guī)模、類型、國(guó)際關(guān)注和計(jì)算機(jī)發(fā)展等四方面因素的影響。而丁信善(1998)則認(rèn)為,語料庫(kù)語言學(xué)的發(fā)展方向?qū)⒅饕w現(xiàn)在三個(gè)方面:基礎(chǔ)語料庫(kù)更加發(fā)展,包括各種介質(zhì)的語料庫(kù)(口語、書面、多媒體視聽資料),語料標(biāo)注將超越目前的基本層次(語音、詞匯、句法等),會(huì)出現(xiàn)立體式標(biāo)注(含語義和語用),語料分析工具的功能將會(huì)更加復(fù)雜和全面,滿足各種研究的具體需要。
盡管語料庫(kù)仍然在研究方法、研究廣度和深度等方面有一定局限性(胡開寶 2011),但上述各領(lǐng)域內(nèi)越來越多的研究者意識(shí)到語料庫(kù)的優(yōu)勢(shì)和價(jià)值,在自己的研究領(lǐng)域(如心理語言學(xué)、社會(huì)語言學(xué)等)中不斷使用各種類型的語料庫(kù)來豐富研究手段,進(jìn)行“三角驗(yàn)證”(梁茂成 2012)。這種實(shí)證研究趨勢(shì)的持續(xù)發(fā)展將會(huì)使基于語料庫(kù)的研究成為語言及其相關(guān)研究的主流范式。
近30年來, 語料庫(kù)和語料庫(kù)語言學(xué)飛速發(fā)展,但在與翻譯技術(shù)研發(fā)方面,仍明顯需進(jìn)一步發(fā)展,需要建立大型雙語或多語數(shù)據(jù)庫(kù),尤其是面向?qū)I(yè)領(lǐng)域的平行對(duì)齊語料庫(kù),以使目前廣泛使用的計(jì)算機(jī)輔助翻譯技術(shù)能夠在特定領(lǐng)域?qū)崿F(xiàn)自動(dòng)化處理,在處理過程中對(duì)人的依賴程度進(jìn)一步降低,最終實(shí)現(xiàn)翻譯全過程的計(jì)算機(jī)化(張政 2006: 163-188;錢多秀 2011: 297-300)。
通過梳理語料庫(kù)及語料庫(kù)語言學(xué)的發(fā)展,可以發(fā)現(xiàn),目前語料庫(kù)研究在類型、應(yīng)用范圍、本體論和相關(guān)軟件等方面都發(fā)生了顯著變化(秦洪武、王克非 2006;何中清、彭宣維 2011;彭宣維等 2012)。未來的語料庫(kù)語言學(xué)將更多以溫和的經(jīng)驗(yàn)主義和實(shí)證主義為指導(dǎo)(梁茂成 2012),為各種相關(guān)研究提供方法。按照目前的發(fā)展態(tài)勢(shì),可以預(yù)見,語料庫(kù)容量將會(huì)更大,類型更加多樣化,語料庫(kù)方法將會(huì)與其他語言相關(guān)的理論研究、應(yīng)用(教學(xué))研究和技術(shù)開發(fā)進(jìn)一步融合,并將有更多、更激動(dòng)人心的發(fā)現(xiàn)和應(yīng)用。
Baker, M. 1993. Corpus linguistics and translation studies: Implications and applications[A]. M. Baker (ed.).TextandTechnology:InHonourofJohnSinclair[C]. Amsterdam: John Benjamins. 233-250.
Baker, M. 2000. Towards a methodology for investigating the style of a literary translator[J].Target(12): 241-266.
Chan, S. W. 2004.ADictionaryofTranslationTechnology[K]. Hong Kong: The Chinese University of Hong Kong Press.
Granger, S. 2003. The corpus approach: A common way forward for contrastive linguistics and translation studies[A]. S. Grangeretal. (eds.).Corpus-basedApproachestoContrastiveLinguisticsandTranslationStudies[C]. Amsterdam/New York: Rodopi. 17-29.
Laviosa, S. 1998. The corpus-based approach: A new paradigm in translation studies [J].Meta43 (4): 474-479.
Laviosa, S. 2002.Corpus-basedTranslationStudies:Theory,FindingsandApplications[M]. Amsterdam: Rodopi.
Marzo, S.etal. 2012.CorpusStudiesinContrastiveLinguistics [M]. Amsterdam/Philadelphia: Benjamins Publishing House.
McEnery, T. & A. Wilson. 2013. Corpora and Translation: Uses and Future Prospects(1993) [OL]. [07-01]. http: //dilbilim.info/yukseklisans/Corpus%20Based/Corpora%20and%20Translation.pdf.
McEnery, T. & R. Xiao. 2010.Corpus-BasedContrastiveStudiesofEnglishandChinese[M]. (Routledge Advances in Corpus Linguistics). London/New York: Routledge.
Quirk, R. 1960. Towards a description of English usage [J].TransactionsofthePhilologicalSociety59(1): 40-61.
Sinclair, J. 1991.Corpus,ConcordanceandCollocation[M]. Oxford: Oxford University Press.
Sinclair, J. 1992. The automatic analysis of corpora [A]. J. Svartvik (ed.).DirectionsinCorpusLinguistics(ProceedingsofNobelSymposium82) [C]. Berlin/New York: Mouton de Gruyter. 379-397.
Svartvik, J. 1992. Corpus linguistics comes of agen [A]. J. Svartvik (ed.).DirectionsinCorpusLinguistics[C]. Berlin/New York: Mouton de Gruyter. 7-12.
Tymoczko, M. 1998. Computerized corpora and the feature oftranslation studies [J].Meta43 (4): 652-660.
Wallis, S. 2007. Annotation, retrieval and experimentation [A]. A. Meurman-Solin & A. A. Nurmi (eds.).AnnotatingVariationandChange[C]. Helsinki: Varieng University of Helsinki. http://www.helsinki.fi/varieng/series/volumes/01/wallis/.
陳 偉. 2007. 翻譯英語語料庫(kù)與基于翻譯英語語料庫(kù)的描述性翻譯研究[J]. 外國(guó)語(1): 67-73.
巢文涵. 2008. 基于雙語語料庫(kù)的機(jī)器翻譯關(guān)鍵技術(shù)研究[D]. 博士學(xué)位論文. 國(guó)防科學(xué)技術(shù)大學(xué).
丁信善. 1998. 語料庫(kù)語言學(xué)的發(fā)展及研究現(xiàn)狀[J]. 當(dāng)代語言學(xué)(5): 5-13.
馮志偉. 2007. 《應(yīng)用語言學(xué)中的語料庫(kù)》導(dǎo)讀[M]. 北京: 世界圖書出版公司.
馮志偉. 2010. 基于語料庫(kù)的機(jī)器翻譯系統(tǒng)[J]. 術(shù)語標(biāo)準(zhǔn)化與信息技術(shù)(1): 28-35.
顧曰國(guó). 2003. 語料庫(kù)語言學(xué)的發(fā)展[N]. 中國(guó)社會(huì)科學(xué)院院報(bào). 03-04.
何中清, 彭宣維. 2011. 英語語料庫(kù)研究綜述: 回顧、現(xiàn)狀與展望[J]. 外語教學(xué)(1): 6-10.
胡開寶. 2011. 語料庫(kù)翻譯學(xué)概論[M]. 上海:上海交通大學(xué)出版社.
黃昌寧, 李娟子. 2002. 語料庫(kù)語言學(xué)[M]. 北京: 商務(wù)印書館.
黃忠廉. 2009. 翻譯研究——翻譯語料庫(kù): 深化譯論研究的有效工具[J]. 外語學(xué)刊(1): 101.
李 亮. 2004. 基于語料庫(kù)的機(jī)器翻譯[J]. 上海科技翻譯(2): 59-62.
梁茂成. 2012. 語料庫(kù)語言學(xué)研究的兩種范式: 淵源、分歧及前景[J]. 外語教學(xué)與研究(3): 323-335.
劉康龍,穆 雷. 2006. 語料庫(kù)語言學(xué)與翻譯研究[J]. 中國(guó)翻譯(1): 59-64.
彭宣維等. 2012. 漢英對(duì)應(yīng)評(píng)價(jià)意義語料庫(kù)[J]. 外語電化教學(xué)(5): 3-10.
錢多秀. 2011. 計(jì)算機(jī)輔助翻譯[M]. 北京:外語教學(xué)與研究出版社.
秦洪武,王克非. 2006. 《基于語料庫(kù)的語言對(duì)比和翻譯研究》評(píng)介[J]. 外語電化教學(xué)(6): 75-78.
王建新. 1998. 語料庫(kù)語言學(xué)發(fā)展史上的幾個(gè)重要階段[J]. 外語教學(xué)與研究(4): 53-59.
王建新. 1999. 我國(guó)在語料庫(kù)語言學(xué)研究方面的部分進(jìn)展(概述) [J]. 外語與外語教學(xué)(3): 18-20, 57.
王克非. 2006. 語料庫(kù)翻譯學(xué)——新研究范式[J]. 中國(guó)外語(3): 8-9.
王 挺等. 1996. 語料庫(kù)和機(jī)器翻譯[J]. 計(jì)算機(jī)科學(xué)(2): 52-55.
衛(wèi)乃興. 2006. 基于語料庫(kù)學(xué)生英語中的語義韻對(duì)比研究[J]. 外語學(xué)刊(5): 50-54.
衛(wèi)乃興. 2011. 基于語料庫(kù)的對(duì)比短語學(xué)研究[J]. 外國(guó)語(4): 32-42.
文秋芳等. 2009. 中國(guó)學(xué)生英語口筆語語料庫(kù)1.0(修訂版) [M]. 北京: 外語教學(xué)與研究出版社.
許文勝,張柏然. 2006. 基于英漢名著語料庫(kù)的因果關(guān)系連詞對(duì)比研究[J]. 外語教學(xué)與研究(4): 292-296.
許余龍. 1992. 對(duì)比語言學(xué)概論[M]. 上海: 上海外語教育出版社.
楊惠中. 1993. 語料庫(kù)語言學(xué)與機(jī)器翻譯[J]. 上海交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版) (1): 98-111.
楊 梅,白 楠. 2010. 國(guó)內(nèi)語料庫(kù)翻譯研究現(xiàn)狀調(diào)查——基于國(guó)內(nèi)學(xué)術(shù)期刊的數(shù)據(jù)分析(1993-2009)[J]. 中國(guó)翻譯(6): 46-50.
張 政. 2006. 計(jì)算機(jī)翻譯研究[M]. 北京: 清華大學(xué)出版社.
張 政. 2010. 計(jì)算語言學(xué)與機(jī)器翻譯導(dǎo)論[M]. 北京: 外語教學(xué)與研究出版社.
趙世開. 1990. 對(duì)比語言學(xué)研究的發(fā)展和展望[J]. 世界漢語教學(xué)(3): 145-147.
甄鳳超. 2010. 語料庫(kù)語言學(xué)在中國(guó)的成長(zhǎng)與發(fā)展[J]. 當(dāng)代外語研究(3): 36-41.
周小玲,蔣堅(jiān)松. 2010. 近十年國(guó)外基于語料庫(kù)的譯者文體研究的發(fā)展(2000-2009) [J]. 外語與外語教學(xué) (3): 54-58.