丁自華
(江蘇海事職業(yè)技術(shù)學(xué)院,南京 211170)
自20世紀(jì)60年代,美國布朗語料庫的建成使用標(biāo)志著世界上第一個(gè)機(jī)器可讀語料庫的問世,并且隨著計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的發(fā)展,語料庫的研究日益深入、規(guī)模越來越大,其在語言研究、語言教學(xué)和語言工程等方面也得到了廣泛的應(yīng)用。語料庫語言學(xué)研究的一項(xiàng)重大成果就是語境共現(xiàn)(concordance),它是語料庫最基本的分析手段之一。語境共現(xiàn)最常用的形式KW IC (Key-Words in Context,帶語境的關(guān)鍵詞搜索)技術(shù)為每個(gè)搜索到的關(guān)鍵詞提供所在行固定數(shù)量的語境詞,并以該關(guān)鍵詞為中心在屏幕上顯示出來。
ESP (English for Special Purpose,專門用途英語或?qū)I(yè)英語)不同于EGP (English for General Purposes,通用英語或公共英語)。ESP是與某種特定行業(yè)和學(xué)科相關(guān)的英語, 是語言學(xué)的分支。因此, ESP理論與語言學(xué)發(fā)展息息相關(guān),那么專業(yè)英語語料庫的開發(fā)運(yùn)用將使大規(guī)模、多學(xué)科的專業(yè)英語研究成為可能,并且可以有效地促進(jìn)專業(yè)英語研究。
由于歷史原因以及ESP在大學(xué)英語教學(xué)中的定位不明確,導(dǎo)致我國的ESP教學(xué)曾經(jīng)出現(xiàn)了很多問題,尤其在“文革”期間甚至中斷,根本談不上相關(guān)研究。改革開放以后,隨著國家經(jīng)濟(jì)和科技事業(yè)的發(fā)展,國際交流的日益頻繁,切實(shí)提高大學(xué)生特別是理工類院校大學(xué)生及工程技術(shù)人員的專業(yè)英語水平和直接使用英語從事科研的能力已成為各高校英語教學(xué)改革的主要任務(wù)。
每個(gè)學(xué)科由于其自身的專業(yè)性太強(qiáng)及所涉及的詞匯極其豐富等,均具有其相應(yīng)的專業(yè)英語。以航海類專業(yè)英語為例,由于航海行業(yè)的特點(diǎn),要求從事航海工作的人員不但要具有扎實(shí)的專業(yè)理論知識(shí)和技能,而且還要具備良好的專業(yè)英語綜合運(yùn)用能力,其涉及航海、儀器、設(shè)備、氣象、積載、法規(guī)、船舶操縱、避碰、主輔機(jī)、防污染等多學(xué)科。
通過對(duì)江蘇海事職業(yè)技術(shù)學(xué)院114名相關(guān)專業(yè)教師進(jìn)行問卷調(diào)查,結(jié)果發(fā)現(xiàn)專業(yè)英語教學(xué)與運(yùn)用的實(shí)際效果與教學(xué)的預(yù)期目標(biāo)存在一定的差距(見表1,表2)。他們對(duì)專業(yè)英語的運(yùn)用有較高的希望,且對(duì)專業(yè)英語的學(xué)習(xí)有一定的目標(biāo);然而詞匯、語匯的限制導(dǎo)致對(duì)語篇的理解存在很大的局限性。他們認(rèn)為如果有一套完整的詞匯或語匯系統(tǒng),對(duì)于專業(yè)英語學(xué)習(xí)將會(huì)有極大的幫助。
表1 ESP教學(xué)的預(yù)期目標(biāo)(可以多選)
表2 ESP教學(xué)實(shí)際效果(可以多選)
此外,目前各高校,特別是理工類院校,外語教學(xué)往往被忽視和被邊緣化,不能融入學(xué)校的學(xué)科群建設(shè)中,只是服務(wù)于其他學(xué)科,在課程安排上常產(chǎn)生脫節(jié)。如專業(yè)英語課程在相應(yīng)的專業(yè)課之前開課,學(xué)員對(duì)相應(yīng)的專業(yè)語匯還不了解,導(dǎo)致教學(xué)難度加大。而ESP教學(xué)最終目的是培養(yǎng)學(xué)生良好的專業(yè)語言運(yùn)用能力,教會(huì)學(xué)生用活專業(yè)英語,以便更好地運(yùn)用英語進(jìn)行實(shí)際工作。ESP教學(xué)是大學(xué)英語教學(xué)改革的大勢所趨,因此,克服ESP詞匯、語匯及語篇理解等方面所存在的缺陷,就使得專業(yè)英語語料庫的開發(fā)運(yùn)用顯得尤為迫切。
1.語料庫在專業(yè)英語運(yùn)用中的主要作用
語料庫最早運(yùn)用于語言數(shù)據(jù)的頻率統(tǒng)計(jì)方面,如字頻、詞頻、詞類等的統(tǒng)計(jì)。目前已發(fā)展成為一個(gè)由大量在真實(shí)情況下使用的語言信息集成的、可供計(jì)算機(jī)檢索的、專門做研究使用的巨型資料庫。它不僅涉及詞匯、語言結(jié)構(gòu)、語篇結(jié)構(gòu)、話語行為、文學(xué)作品分析等各個(gè)層次,而且與語法、口語、寫作、翻譯等具體教學(xué)密切相關(guān)。語料庫以其容量大、語料真實(shí)、檢索快捷準(zhǔn)確等優(yōu)勢在現(xiàn)代語言學(xué)研究和語言教育中日益發(fā)揮著越來越重要的作用?;谡Z料庫的學(xué)習(xí)活動(dòng)有利于培養(yǎng)語料庫的使用者發(fā)揮他們的主觀能動(dòng)性進(jìn)行探究型學(xué)習(xí)。使用者可以圍繞一個(gè)問題,對(duì)其所涉及的語料所呈現(xiàn)的語境共現(xiàn)進(jìn)行觀察、思考、分析、歸納,從而獨(dú)立自主地完成對(duì)某一語言現(xiàn)象的探索和研究,有利于其多層次、多角度地分析問題,提高分析問題和解決問題的能力。學(xué)習(xí)者可以親自參與解決問題的全部過程, 使其在對(duì)問題的探究中找到問題的答案,充分表現(xiàn)出現(xiàn)代學(xué)習(xí)方式的體驗(yàn)性,從而解決問題。因此,開發(fā)運(yùn)用專業(yè)英語語料庫對(duì)專業(yè)英語教學(xué)與研究,培養(yǎng)專業(yè)人士語言認(rèn)知能力和自主學(xué)習(xí)能力勢在必行,特別是對(duì)突破專業(yè)詞匯瓶頸、彌補(bǔ)專業(yè)知識(shí)匱乏及提高語言理解和應(yīng)用極其重要。
2.專業(yè)英語語料庫的開發(fā)應(yīng)用
D.Biber,S.Conrad,R.Reppen在Corpus Linguistics一書中指出語料庫的規(guī)模分為詞次(tokens)、庫文本數(shù)量(number of texts)、層間樣本數(shù)量 (number of samples)和庫樣本容量(sample size)四個(gè)層次,各層次間比例要合理,并且要對(duì)各層次的語料信息如專業(yè)領(lǐng)域、難度及來源等作出詳細(xì)標(biāo)注。因此,專業(yè)英語語料庫(ESPC)的開發(fā)運(yùn)用,首先,要確定其語料庫建設(shè)目標(biāo)、標(biāo)本分布原則和采樣途徑;其次,要確定其規(guī)模、庫容,使其可以滿足該專業(yè)英語教學(xué)及語言運(yùn)用與研究的需要;再次,要考慮語料的針對(duì)性、代表性、采樣的隨機(jī)性和各種語體比例的合理性及檢索軟件的使用性等。在語料搜集完成后,對(duì)于所涉及的語料文本進(jìn)行編目,并設(shè)計(jì)該詞意義及詞性標(biāo)注程序進(jìn)行機(jī)器自動(dòng)分詞和詞性標(biāo)注;然后進(jìn)行人工校對(duì),形成附碼語料庫。
(1)語料采集。語料采集對(duì)于任何語料庫來說都是至關(guān)重要的。語料庫的建設(shè)要有針對(duì)性、代表性和一定的規(guī)模性。作為專業(yè)英語語料庫應(yīng)該包括標(biāo)注語料庫(annotated corpora)、詞匯語料庫、句法樹庫、語篇語料庫、口語語料庫、語音語料庫及語料庫相關(guān)軟件。為保證語料的真實(shí)性,根據(jù)Krashen(1981)的輸入假說, 在選擇最佳語言輸入時(shí), 可理解性尤為重要。因此語料要符合“可理解輸入”或“i+1”原則(i指習(xí)得者的能力水平)。同時(shí)要考慮到專業(yè)英語語料庫的使用對(duì)象主要是從事專業(yè)英語教育的英語教師、學(xué)生以及該行業(yè)的工作人員。所以該語料庫要兼顧知識(shí)性、時(shí)效性、教育性;語料采集還應(yīng)針對(duì)不同層次的使用者突出它的平衡性,并且能夠充分體現(xiàn)專業(yè)語言的語域特點(diǎn)。
因此,語料的選擇要以專業(yè)文獻(xiàn)為主,如航海類專業(yè)英語語料庫的語料主要從專業(yè)英語教材、IMO國際航海英語示范教程、工具書及詞典、航海專業(yè)期刊或著作、與航海行業(yè)相關(guān)的國際公約、IMO組織的相關(guān)規(guī)定及相關(guān)的專業(yè)教材等資料中采集,同時(shí)兼顧專業(yè)基礎(chǔ)文獻(xiàn)。該語料庫的宗旨是向?qū)W員介紹相關(guān)語料在行業(yè)領(lǐng)域的具體運(yùn)用,所以內(nèi)容要盡可能貼近專業(yè),覆蓋整個(gè)行業(yè)的所有具有代表性的詞匯、語句及語篇,并且確保語料能不斷更新擴(kuò)展,反映時(shí)代變化,貼近生活,使之具有開放性和時(shí)效性的特點(diǎn)。
(2)高頻專業(yè)詞匯的提取及運(yùn)用。將所收集的專業(yè)英語相關(guān)語料轉(zhuǎn)換成文本形式。如,首先使用最常用的WELC TOOLSV1.0語料庫分析軟件對(duì)其進(jìn)行分析處理。將出現(xiàn)頻率較高的詞匯(如設(shè)定出現(xiàn)20次以上為有效次數(shù))組成生詞表,然后使用該軟件分析CLAWS賦碼的語料文件,使其能夠方便準(zhǔn)確地從語料文件中提取數(shù)十種統(tǒng)計(jì)數(shù)據(jù),并實(shí)現(xiàn)檢索和數(shù)據(jù)匯總功能,排除那些語料庫之間差異性極弱的功能詞,收集那些專業(yè)核心詞匯,使之對(duì)專業(yè)文章的語境理解具有極為重要的幫助作用。然后,由資深的專業(yè)人員或相關(guān)專家根據(jù)經(jīng)驗(yàn)進(jìn)行人工篩選、提取、合并,再按照研究目的對(duì)其進(jìn)行附碼(tagging)或分割(parsing),進(jìn)一步提取和翻譯語料庫內(nèi)的專業(yè)類詞匯及相關(guān)資料,注明其在專業(yè)英語中以及在通用英語中的含義和運(yùn)用,使之不僅能保證文本信息提取的準(zhǔn)確性,也使語料庫的使用變得更加方便快捷。這樣才能幫助英語教師、學(xué)員以及從事具體行業(yè)的工作人員進(jìn)行對(duì)比學(xué)習(xí),盡快掌握并理解該詞的運(yùn)用,更有效地突破專業(yè)詞匯和專業(yè)知識(shí)匱乏的瓶頸,同時(shí)確保被篩選出來的詞匯和語句具有一定的典型性和專業(yè)代表性。軟件還提供數(shù)據(jù)導(dǎo)出和打印功能,為使用者保存數(shù)據(jù)和將分析數(shù)據(jù)與其他軟件相結(jié)合進(jìn)行二次分析提供了極大方便。
如航海英語語料系統(tǒng)所生成的語匯必須既要符合語言學(xué)的基本要求,又要符合該課程教學(xué)大綱及國家海事局制定的《中華人民共和國海船船員適任考試、評(píng)估和發(fā)證規(guī)則》及STCW公約對(duì)船員對(duì)英語語言能力的要求,同時(shí)還必須符合各級(jí)各類職務(wù)船員英語運(yùn)用的具體要求。因此,該語料庫應(yīng)根據(jù)行業(yè)對(duì)英語語言的要求和目標(biāo)并結(jié)合人工篩選的經(jīng)驗(yàn),將各語料中最重要的指標(biāo)根據(jù)需要可歸納為意義(meanings)、知識(shí)點(diǎn)編號(hào)(knowledge)、難度系數(shù)(difficulty)、區(qū)分度(distinction)、詞性(vocabulary)、詞源(etymology)、歧義對(duì)比(ambiguity)、語料使用頻率(frequency)等多個(gè)基本指標(biāo)。一張語料由m個(gè)指標(biāo)組成,每個(gè)語料存在多個(gè)屬性,那么該語料文本就構(gòu)成了一個(gè)m×x的矩陣。
(3)檢索軟件的開發(fā)和應(yīng)用。語料庫建設(shè)以計(jì)算機(jī)技術(shù)為基礎(chǔ),因此具有一定的計(jì)算機(jī)技術(shù)和相應(yīng)的檢索軟件才能對(duì)大量的航海專業(yè)語匯和文本信息進(jìn)行分析處理。目前,檢索工具被大量開發(fā),出現(xiàn)了很多成功的共享軟件,如Wordsmith Tols v4,Concordance v3,Monooncord 和Wordcruncher等;還有很多免費(fèi)軟件如Mireooncord,Tact 2.1(基于DOS平臺(tái)),Wconcord,Concapp,Mlet-concordancer,Word.pilot,Antconc,Pamconc等。
語料庫索引利用計(jì)算機(jī)技術(shù)和專用軟件,通過在語料庫電子文本中進(jìn)行關(guān)鍵詞搜索,檢索以關(guān)鍵詞為中心,即以KWIC索引技術(shù)為核心功能,以該詞所處的行為為場景,按預(yù)定設(shè)計(jì)在屏幕上顯示出來。同時(shí)具有詞表的詞性、意義統(tǒng)計(jì)和搭配統(tǒng)計(jì)等功能,適合基于詞匯的(word-based analysis)分析研究。該類軟件可直接檢索生成語料,進(jìn)行詞串、短語、語言學(xué)等屬性檢索,亦可進(jìn)行詞頻統(tǒng)計(jì),檢索方式靈活,檢索快速準(zhǔn)確,檢索結(jié)果可以多種方式排序。然后,使用工具軟件(如Acrobat)提取出PDF文件中的圖片,并將文字材料轉(zhuǎn)換為純文本或Word格式,再編程或使用文本處理工具去除文字材料中的雜碼。還可以對(duì)處理好的文本材料進(jìn)行簡單的信息標(biāo)注,如內(nèi)容、分類、意義、日期、主題等。這樣就基本建成了一個(gè)語料庫。
可以借鑒相關(guān)語料庫的成功經(jīng)驗(yàn),如BNC,COBUILD,LOB,JDEST,CLEC,還有許多如Cambridge Learners’ Corpus,English Translation Corpus、HKUST Learner Corpus,SWECCL等, 自主開發(fā)研究適合航海專業(yè)英語的語料庫檢索軟件,如 Maritime ESP小助手等,以幫助語料庫的使用者盡快理解并掌握該語料的核心詞匯、語境、語言特點(diǎn)、語言風(fēng)格及同一詞匯在不同語境中的不同含義等。在設(shè)計(jì)Maritime ESP小助手等檢索軟件時(shí),可以采用KWIC語料檢索或CLAWS 賦碼檢索。如以航海專業(yè)英語中的disengage一詞為例,首先輸入或點(diǎn)擊該詞,語料庫中就能顯示該詞、相關(guān)的短語意義以及例句及該詞在某些特定語境中的意義;同時(shí)在在下方附近位置顯示以該詞為中心的短語并以其所使用的頻次多少為序顯示,如disengaged channel (切斷通道),disengaged side(下風(fēng)舷),disengaged vapor(釋放汽),disengaging hooks(脫纜鉤),disengaging latch (分離鍵),disengaging shaft(分離軸)等,并且要充分利用語料庫標(biāo)注工具的作用,采用計(jì)算機(jī)自動(dòng)處理和人工校對(duì)相結(jié)合,這樣,在語料庫的建立過程中既可以提高軟件工具的標(biāo)注精度,又可以節(jié)約資源。同時(shí)還可以設(shè)計(jì)一個(gè)用于鏈接的友好界面,便于專業(yè)術(shù)語及其語境搭配的瞬間查找。
通過語料庫檢索來確定該專業(yè)領(lǐng)域的常用詞匯、語匯并將統(tǒng)計(jì)所得的信息,包括專業(yè)語匯的重復(fù)、搭配、出現(xiàn)頻率、文章常用的特定句法與篇章結(jié)構(gòu)、文體及修辭風(fēng)格等告訴語料庫的使用者,以此提高他們的專業(yè)語言綜合運(yùn)用能力。如,在編寫專業(yè)英語教材過程中,也可以利用先進(jìn)的語料庫檢索手段對(duì)教材中可以根據(jù)大規(guī)模的ESP語料對(duì)專業(yè)詞匯根據(jù)上下文逐一進(jìn)行KWIC語料檢索或CLAWS 賦碼檢索,對(duì)出現(xiàn)較多的專業(yè)詞匯進(jìn)行詞頻統(tǒng)計(jì)(frequency counts)和定位索引(concordance)。這樣就能科學(xué)地判斷語篇的難度和題材以取舍語料,并在教材編寫中體現(xiàn)高頻語言現(xiàn)象優(yōu)先原則,克服以往教材編寫基本上根據(jù)編寫者的直覺和教學(xué)經(jīng)驗(yàn)進(jìn)行編寫,缺乏客觀的科學(xué)依據(jù)的缺陷。還可以利用其進(jìn)行備課、講課以及根據(jù)語料庫中的語料提供的例句或語境編寫習(xí)題和測試題。語料庫不僅可以為試題的編寫提供依據(jù),而且可以對(duì)試題的難易程度作評(píng)估和調(diào)整。用語料庫來分析和評(píng)估試題客觀準(zhǔn)確,易于調(diào)整、修補(bǔ),穩(wěn)定、可靠、安全和易于操作。如上海交通大學(xué)在楊惠中教授的主持下建成了JDEST(上海交大科技英語語料庫),JDEST文件夾由檔案學(xué)等41個(gè)子文件夾組成,每個(gè)子文件夾中有若干個(gè)TXT文件。通過該軟件來檢索JDEST中包含program一詞的所有索引行。具體操作步驟為:打開Tool菜單中Con—cord后選中待檢索的語料文件,然后輸入program關(guān)鍵詞開始檢索,出現(xiàn)對(duì)話界面,然后根據(jù)對(duì)話框進(jìn)行操作,這便于學(xué)員查閱學(xué)習(xí)。它是國際上第一代語料庫,為我國大學(xué)英語教學(xué)大綱的制定和詞表統(tǒng)計(jì)作出了積極的貢獻(xiàn)。
(4)語料庫應(yīng)用效果的評(píng)估分析。對(duì)已建成的語料庫的應(yīng)用效果要進(jìn)行跟蹤評(píng)估,分析其所存在的問題,并為修改完善該語料庫提供科學(xué)依據(jù)。對(duì)語料庫的評(píng)估主要針對(duì)以下幾個(gè)方面進(jìn)行:一是通過檢索母語來選擇合適的表達(dá)或判斷學(xué)習(xí)者的理解,并且能激發(fā)學(xué)生批判性思維的學(xué)習(xí)活動(dòng)。學(xué)生可以借助語料庫的大量語言實(shí)例,根據(jù)語境特征異同進(jìn)行分類和歸納,逐步發(fā)現(xiàn)其語言特點(diǎn)。這種通過分析歸類自主學(xué)習(xí)的方法,可以激發(fā)學(xué)生的好奇心、批判精神和反思精神,符合現(xiàn)代教育提倡發(fā)展的方向。二是通過尋找語料庫存在的問題并進(jìn)行分析、評(píng)估語料庫語匯的深度、廣度。讓學(xué)習(xí)者根據(jù)語料庫的評(píng)判參照標(biāo)準(zhǔn)進(jìn)行語言失誤標(biāo)注,可以使學(xué)習(xí)者在自我標(biāo)注過程中增進(jìn)語料意識(shí),提高對(duì)語言失誤的分析。三是評(píng)估分析所使用的檢索工具,確保該檢索工具能使語料庫正常運(yùn)行,做到有效提高學(xué)習(xí)者的使用效率。
隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的發(fā)展和語料庫開發(fā)應(yīng)用方面的資源共享與橫向合作,語料庫的建設(shè)速度有了很大的提高。語料庫的研究和建設(shè)使可共享的語料資源、網(wǎng)絡(luò)語料資源和語料分析工具軟件越來越豐富。專業(yè)英語語料庫的開發(fā)應(yīng)用不僅標(biāo)志著ESP研究手段已獲得重大技術(shù)進(jìn)步,而且標(biāo)志著ESP研究思想的可喜轉(zhuǎn)變。
存儲(chǔ)于計(jì)算機(jī)的充分、真實(shí)的語料并可利用計(jì)算機(jī)進(jìn)行檢索、查詢、分析語料總體是最重要的語言研究資源。基于專業(yè)英語語料庫的分析方法是對(duì)傳統(tǒng)基于規(guī)則的語言分析方法的一個(gè)重要補(bǔ)充,并為專業(yè)英語研究提供大量真實(shí)、準(zhǔn)確、形象的素材。充分利用語料庫“大規(guī)模”和“真實(shí)”兩大特點(diǎn),使其直接成為服務(wù)于語言文字的最理想的語言知識(shí)資源。在具體開發(fā)應(yīng)用的過程中要盡量使語言運(yùn)用和專業(yè)能力有效融合。借鑒國內(nèi)外一些語料庫建設(shè)的經(jīng)驗(yàn),揚(yáng)長避短,建設(shè)適合本行業(yè)的專業(yè)英語語料庫??傊? 充分開發(fā)與運(yùn)用語料庫,使其在專業(yè)英語運(yùn)用及研究中發(fā)揮日益強(qiáng)大的作用,同時(shí)也成為語料庫語言學(xué)研究的有益補(bǔ)充。
參考文獻(xiàn):
[1] BIBER D,CONRAD S,REPPEN R.Corpus linguistics[M].Cambridge: Cambridge University Press,1998:26.
[2] HUSTON S.Corpora in applied linguistics[M].北京:世界圖書出版社,2006.
[3] Stephen D Krashen Second Language Acquisition and Second Language Learning Pergamom [M].Press Inc. 1981.
[4] 桂詩春,楊惠中.中國學(xué)習(xí)者英語語料庫[M].上海:上海外語教育出版社,2003.
[5] 何安平.語料庫語言學(xué)與英語教學(xué)[M].北京:北京外語教學(xué)與研究出版社,2007.
[6] 教育部高等教育司.大學(xué)英語教學(xué)要求[M].北京:北京外語教學(xué)與研究出版社,2007.
[7] 教育部語言文字應(yīng)用研究所計(jì)算語言學(xué)研究室.國家語委語料庫科研成果簡介[EB/OL].(2011-04-01).http://www.docin.com/p-35035164.html.
[8] 靳光瑾.基于語料庫的辭書編纂平臺(tái)的應(yīng)用[C]//對(duì)外漢語學(xué)習(xí)詞典學(xué)國際研討會(huì)論文集.香港:香港城市大學(xué)出版社,2005.
[9] 靳光瑾,肖航,富麗,等.現(xiàn)代漢語語料庫建設(shè)及深加工[J].語言文字應(yīng)用,2005(2):111-120.
[10] 李文中,濮建忠,衛(wèi)乃興.2003上海語料庫語言學(xué)國際會(huì)議述評(píng)[J].解放軍外國語學(xué)院學(xué)報(bào),2004(1):56-59.
[11] 王建平,李新江.航海英語[M].大連:大連海事大學(xué)出版社,2001.
[12] 楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002:170.
[13] 張濟(jì)華,王蓓蕾,高欽.基于語料庫的大學(xué)基礎(chǔ)階段ESP教學(xué)探討[J].外語電化教學(xué),2009(4):38-42.