長春光華學(xué)院 張 健
語料庫的發(fā)展歷經(jīng)三個主要階段,一是20 世紀(jì)60 年代,以布朗語料庫為代表的機讀語料庫。布朗語料庫容量為100 萬詞,收集了20 世紀(jì)60 年代有代表性的美國英語語料,語料選自各種出版物,建庫時照顧到了各種文體的平衡,嚴(yán)格按照隨機原則抽樣,是一個標(biāo)準(zhǔn)語料庫,也是第一個現(xiàn)代語料庫。1975 年,Jan Svartvik 開始創(chuàng)建倫敦—隆德語料庫,這兩個語料庫奠定了現(xiàn)代語料庫的基礎(chǔ)。二是20 世紀(jì)80 年代,以計算機硬件技術(shù)為依托的數(shù)字語料庫快速發(fā)展,相繼如LOB語料庫、COBUILD語料庫、國際英語語料庫(ICE)、赫爾辛基歷史英語語料庫及各不同語種、不同用途類型的語料庫。三是20 世紀(jì)90 年代,語料庫的發(fā)展進入了億級詞匯時代。語料庫的種類體現(xiàn)了多元化趨勢,先進的計算機文字處理技術(shù)廣泛應(yīng)用。對比數(shù)量繁多且日益成熟的文本語料庫,口語語料庫的發(fā)展相對滯后。國內(nèi)較有影響力的口語語料庫包括上海交大大學(xué)英語學(xué)習(xí)者口語語料庫COLSEC(5萬)、南京大學(xué)中國英語學(xué)習(xí)者口語語料庫SECCL(100 萬)。部分高校和機構(gòu)則專注于雙語平行語料庫的研制,如北京外國語大學(xué)漢英平行語料庫(PCCE)、東北大學(xué)英漢雙語語料庫(100 萬)等。另有專門用途英語語料庫和漢語語料庫等其他領(lǐng)域的語料庫相繼建成。
漢英口語平行語料庫的建設(shè)目前存在以下問題:首先,發(fā)展規(guī)模有限。受諸多客觀因素影響,漢英口語語料庫的建設(shè)推進緩慢,研究團隊稀缺,意愿低迷。其次,資源開放性不足。語料庫的建設(shè)會耗費巨大人力、物力、財力,資源利用率明顯不足。各建設(shè)單位敝帚自珍,各自為戰(zhàn),消極分享研究成果,導(dǎo)致重復(fù)成果過多、資源嚴(yán)重浪費。最后,語料庫容量尚需擴充。平行語料庫語料采集數(shù)量缺乏,不能體現(xiàn)語言的完整性和系統(tǒng)性。語料標(biāo)記和注釋同樣較為粗放,不利于成果的現(xiàn)實應(yīng)用。
雙語平行語料庫的興起,依托于快速發(fā)展的計算機應(yīng)用技術(shù),為語言研究、語言教學(xué)、辭書編纂等提供了一個廣闊的平臺,其應(yīng)用前景不言而喻。平行語料庫將兩種迥然有異的語言“一肩挑”,不僅充當(dāng)了交流的橋梁,更是文化的橋梁。雙語平行語料庫的語料是語言天然的對比資源庫。源語言和目標(biāo)語言的平行對應(yīng)對外語學(xué)習(xí)而言更是稀缺的資源寶庫。AI 機器翻譯技術(shù)在雙語平行語料庫的加持之下,譯文變得更為通暢、地道。漢英口語平行語料庫聚焦口語語料文本的采集,其專注于語言本身的原生形態(tài),強調(diào)語言的初始功能,可以更加如實、準(zhǔn)確地體現(xiàn)出語言的本真與原貌,能為口語學(xué)習(xí)、口譯教學(xué)、語言對比、語言演化甚至維系民族記憶等提供可靠的數(shù)據(jù),增加上述研究的可信度,為語言翻譯的共時和歷時比較研究提供具備可行性的分析和研究平臺。以教學(xué)為目的的自建口語平行語料庫,對參與建設(shè)的教師團隊而言,可以提升其專業(yè)技能,增強其科研實力,是自我提升、自我超越的良好契機;對參與語料采集的學(xué)生團隊而言,可以提升其語言敏感度、擴充知識儲備、探索自身語言學(xué)習(xí)的突破口。
現(xiàn)行英語口語類教材種類繁多,良莠不齊,全無系統(tǒng)性可言,各類英語等級考試的共存也對考生的口語能力提出了不同要求。因缺乏統(tǒng)一的指導(dǎo)和規(guī)范,市場上口語類教材往往只關(guān)注個別生活情境下的語言交際(如問候、道謝、致歉),語言輸出維度過于單一,語料文本取樣粗放,句式表達千篇一律。這種“管中窺豹”的學(xué)習(xí)方式割裂了語言本身的內(nèi)在聯(lián)系和語言邏輯,而且一來一往、一個回合的語言交互也并不能稱之為一個完整的情境。一套優(yōu)秀的口語教材至少應(yīng)該涵蓋基礎(chǔ)語音、高頻詞匯、核心句式、主題演講、自由表達、非語言交際等多個層面。
在聽、說、讀、寫、譯五項英語語言能力中,讀、寫、譯技巧性和策略性較強。學(xué)生經(jīng)過教師指導(dǎo),有序進行強化性訓(xùn)練,教學(xué)過程易見成效,教師對該方向的研究意愿高漲,教學(xué)理念、方法不斷革新。反觀聽、說教學(xué),學(xué)生受語音差異、性格差異、知識內(nèi)化水平差異、物理性口腔肌肉訓(xùn)練差異等諸多因素限制,個體學(xué)習(xí)效果難以保證,學(xué)習(xí)成果差異巨大,教學(xué)成果亦難以保證,教學(xué)探索難以為繼。國內(nèi)口語課堂多采用的任務(wù)型教學(xué)法尚處于初級階段,即簡單布置任務(wù),小組合作完成。在教學(xué)過程中,教師對學(xué)生提供的語言指導(dǎo)缺乏有力支撐,多數(shù)學(xué)生領(lǐng)到任務(wù)后茫然無措,口語表達邏輯混亂,語體不分,詞匯粗糲,語法雜糅??谡Z教學(xué)應(yīng)該從生活中的細微入手,衣、食、住、行無所不至。要將“學(xué)以致用”“學(xué)而能用”貫徹到口語學(xué)習(xí)的始終,鼓勵學(xué)生結(jié)交“語伴”,積極打造個人的微觀語言生態(tài)系統(tǒng),倡導(dǎo)“浸入”式體驗。
眾所周知,國內(nèi)的英語口語教學(xué)起步較晚,不具備先天優(yōu)勢,口語課一直在各學(xué)科的“夾縫中生存”。除英語專業(yè)以外,其他專業(yè)罕有開設(shè)英語口語課程,多以選修課形式存在,這導(dǎo)致只有少量的非英語專業(yè)學(xué)生有機會接受英語口語的專門培訓(xùn)。顯然,這種資源不均和現(xiàn)行英語教學(xué)的體制有關(guān),偏于應(yīng)試的教育模式必然導(dǎo)致基于能力導(dǎo)向的教學(xué)行為日趨式微。因此,適時調(diào)整略有偏倚的英語教學(xué)體系對口語教學(xué)意義重大。
漢英口語平行語料庫與口語教學(xué)存在天然的契合,語料庫可為教師、學(xué)生提供直接、有效的經(jīng)驗數(shù)據(jù)和情境支撐。借助平行語料庫,學(xué)生不再單一依賴教材或教師有限的語言指導(dǎo),而是依據(jù)個人需要在海量語料中自由檢索、自主學(xué)習(xí),將個人語言學(xué)習(xí)的潛能最大化,從而顯著提升學(xué)習(xí)效度。在此過程中,學(xué)生的主觀能動性占據(jù)學(xué)習(xí)活動的主流。對詞句的檢索和提取絕非簡單、生硬地攫取信息,而是歷經(jīng)甄選、對比、反思后的成果產(chǎn)出。在任務(wù)型小組活動模式下,學(xué)生產(chǎn)出的成果可供課堂研討和辯論,從而進一步激發(fā)學(xué)生學(xué)習(xí)興趣。借助平行語料庫,教師無限擴大對學(xué)生學(xué)習(xí)資源的補給,就教學(xué)內(nèi)容提供針對性的指導(dǎo),注重嚴(yán)謹(jǐn)工作作風(fēng)和批判性思維能力的培養(yǎng),重視學(xué)生自主學(xué)習(xí)能力的塑造,積極促成了語言學(xué)習(xí)的縱深和外延。教學(xué)形態(tài)的改變勢必驅(qū)動教學(xué)理念的不斷優(yōu)化與革新。
語料不同于傳統(tǒng)教材,語料形態(tài)對教學(xué)模式、教學(xué)環(huán)境提出了新要求。語料庫資源輔助語言教學(xué)的教學(xué)模式,即數(shù)據(jù)驅(qū)動學(xué)習(xí)模式,是一種理論上可行的理想的英語學(xué)習(xí)方法,無論是功能強大的大型語料庫,還是微觀規(guī)模的自建語料庫,就教學(xué)活動而言,其存在意義和長遠影響不言而喻。數(shù)據(jù)驅(qū)動學(xué)習(xí)模式的基本原理是引導(dǎo)學(xué)生借助海量語料庫數(shù)據(jù),檢索、對比、歸納詞句的呈現(xiàn)方式與使用情境,自我發(fā)現(xiàn)、獨立探索詞匯意義表達和語用特征。在這種模式下,協(xié)作互助的師生關(guān)系讓學(xué)生大大減輕了傳統(tǒng)課堂的“壓迫感”,在自由、放松的狀態(tài)下探索新知。由此可見,數(shù)據(jù)驅(qū)動學(xué)習(xí)模式與“以學(xué)生為中心”的教學(xué)理念不謀而合。然而,數(shù)據(jù)驅(qū)動學(xué)習(xí)模式自身同樣存在痼疾,如課堂約束力有所削減、課堂活動拖沓冗長、課堂研討膠著耗時、自主學(xué)習(xí)缺乏后勁等。這表明,單一的數(shù)據(jù)驅(qū)動模式盡管優(yōu)勢顯著,但必須與其他的教學(xué)方法、手段相結(jié)合才能發(fā)揮出最大功用。