亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        試論“商務英語語料庫”的建設及其應用*

        2010-11-27 05:52:40周玉林
        外語與翻譯 2010年1期
        關鍵詞:商務英語語言研究

        周玉林

        (1.深圳職業(yè)技術學院應用外國語學院,廣東深圳518055;2.新西蘭奧克蘭大學應用語言研究與語言學系,新西蘭奧克蘭0600)

        試論“商務英語語料庫”的建設及其應用*

        周玉林1,2

        (1.深圳職業(yè)技術學院應用外國語學院,廣東深圳518055;2.新西蘭奧克蘭大學應用語言研究與語言學系,新西蘭奧克蘭0600)

        語料庫語言學作為一門新興的語言學分支已在國內(nèi)外語言研究中得到了長足的發(fā)展,尤其是近十年來,其影響已遍及語言學研究的各領域。但如何將語料庫與語言教學結(jié)合起來,使語料庫走進課堂,在日常語言教學中得到實際應用,仍然處在探索階段。本文探討“商務英語語料庫”的建設及其在商務英語教學大綱設計與教材開發(fā)、商務英語教學、測試和翻譯中的應用,以期語料庫語言學為商務英語教學帶來更多成果。

        商務英語;語料庫;數(shù)據(jù)驅(qū)動學習

        一、前言

        (一)語料庫語言學的興起

        縱觀語言學研究的歷史,各種理論、學說和流派眾說紛紜,但就其方法論來說,可劃分為兩大派別。一是理性主義(rationalis m),二是經(jīng)驗主義(empiricis m)。理性主義以喬姆斯基(Noam Chomsky)為代表。喬氏根據(jù)數(shù)學中的公理化方法來研究自然語言,從形式描述的高度,建立了“普遍語法(Universal Grammar)。喬氏不關心語言的實證研究,有關語言的論述都基于內(nèi)心反省和人為編造的例子,目標是通過研究人類獲得和識別語言的內(nèi)在能力,建立對語言規(guī)則演繹推導的解釋程序。與此相反,經(jīng)驗主義則認為語言學的研究必須以語言事實作為根據(jù),詳盡地、大量地占有材料,才有可能在理論上得出比較可靠的結(jié)論。二十世紀下半葉,計算機功能逐漸完善、強大,使得語言學家可以高效地進行大量語言材料的搜集、整理和加工,從而催生了一門新的語言學學科——語料庫語言學(corpus linguistics)的誕生。

        (二)語料庫語言學的研究方法及重要意義

        語料庫語言學研究自然語言文本的采集、存儲、加工和統(tǒng)計分析,憑借大規(guī)模語料庫提供的客觀翔實的語言證據(jù),運用到語言學研究和自然語言信息處理系統(tǒng)的開發(fā)。語料庫的使用,為語言學的研究提供了一種新的思維方式,輔助人們的語言“直覺”和“內(nèi)省”判斷,從而克服研究者本人的主觀性和片面性,現(xiàn)已逐漸成為語言學研究的主流方法(Svartvik 2001)。如同天文學家利用望遠鏡來研究天文學,生物學家利用顯微鏡來研究生物學一樣,語言學家利用語料庫來研究語言學,可以擴展眼界,看得更遠,看得更細,從而發(fā)現(xiàn)更多的語言現(xiàn)象,挖掘出更多的語言事實,把語言學的研究推向一個新的階段,取得語言學研究中革命性的進步(馮志偉2006)。

        目前,語料庫語言學主要研究機器可讀自然語言文本的采集、存儲、檢索、統(tǒng)計并對之進行詞性、語法、語義和語用等方面的標注,建設各類語料庫并研究其在詞匯研究、語法研究、語域變異與體裁分析、方言特點與語言變體、語言比較與翻譯研究、語言歷時與語言變化研究、語言習得與語言教學、語義學、語用學、社會語言學、話語分析、文體學與文學研究、法律語言學(forensic linguistics)、詞典編纂、自然語言理解和機器翻譯等領域中應用(McEnery,Xiao&Tonio 2006)。

        二、“商務英語語料庫”概況及其應用

        (一)“商務英語語料庫”概況

        “商務英語語料庫”作為針對于商務英語教學和商務英語研究專門用途英語(English for Specific Purposes,簡稱ESP)語料庫,由深圳職業(yè)技術學院應用外國語學院于2006年3月,作為北京外國語大學中國外語教育基金項目啟動。該語料庫原始語料選自具有實用性和權威性的英語/英漢商務材料,包括國內(nèi)外商務企業(yè)商業(yè)信函、電子郵件、年度報告、國內(nèi)外商務書籍與教材及互聯(lián)網(wǎng)上的商務材料等。目前,該語料已近千萬形符數(shù)(tokens)。與國外著名的超大型語料庫,如英國國家語料庫(The British NationalCorpus,簡稱BNC)、美國國家語料庫(The American National Corpus,簡稱ANC)和“英語銀行”(Bank of English)相比,“商務英語語料庫”規(guī)模較小,但作為專門用途用語的專業(yè)語料庫,具有大型綜合性語料庫不具備的專業(yè)特性,“最為適合理解像商務英語之類的專門用途語言”(Flowerdew 2004),對于商務英語語言研究、教學與翻譯等具有重要意義。

        該語料庫建設過程中涉及下列關鍵問題:1)總體規(guī)劃與設計——包括語料庫的類型、用途、規(guī)模、各類語料的平衡性及可語料庫擴展性等;2)語料的采集——包括語料獲取、數(shù)據(jù)格式、字符編碼、語料分類、文本描述等;3)語料的加工——包括標記集和標注規(guī)范標注項目(詞語單位、詞性、句法、語義、語體和篇章結(jié)構(gòu)等);4)語料管理系統(tǒng)的建設——包括數(shù)據(jù)維護(語料輸入、校對、修改、存儲及語料描述信息管理)、語料自動加工(分詞、標注、文本分割、合并等)和終端用戶功能(查詢、檢索、統(tǒng)計和打印等);5)語料庫的應用——針對語言學理論和應用領域中的各種問題,研究和開發(fā)處理語料的軟件工具及檢索平臺(query package)。

        以下是該語料庫采用CLAWS7和USAS標注系統(tǒng)(http://ucrel.lancs.ac.uk/wmatrix/)標注詞性和語義附碼后的幾例樣本及說明:

        1)附有詞性標注的商務英語語料庫樣本

        BLC3:05:00016 If_CS you_PPY need_VV0 any_RR help_NN1 or_CC resources_NN2,_,be_VB I sure_JJ to_TO let_VV I us_PP IO2 know_VV I._.

        BLC3:02:03221 We_PPIS2 are_VBR proud_JJ of_ IO your_APPGE success_NN1 and_CC know_VV0 that_CST this_DD1 appoin tment_NN1 will_VM bring_VV I you_PPY much_RR personal_JJ satisfaction_NN1._.

        這是從作了詞性標記的商務英語語料庫選取的兩個片斷,其原始語料文字為:1)If you need any help or resources,be sure to let us know.2)We are proud of your success and know that this appointment will bring you much personal satisfaction.行首的BLC3:02和BLC3:05為語料庫分類號,03221和00016等為語句序號,每個單詞_之后的大寫字母為詞性的代碼,如CS表示從屬連詞,PPY表示第二人稱單數(shù),VV0表示動詞原形,NN表示普通名詞,CC為并列連詞,VB I表示be,VBR表示are,PP IO2表示第一人稱復數(shù)賓格等等。

        2)附有語義標注的商務英語語料庫樣本

        BLC3:03:00254 Thanks_S1.2.4+for_Z5 responding_S1.1.2+to_Z5 my_Z8 voice_Q2.1 mail_Q1.2._PUNC The_Z5 new_T3-[i2.2.1 model_T3-[i2.2.2 year_T1.3 of_Z5 automobiles_M3 is_A3+only_A14 a_Z5 month_T1.3 away_M6[i3.2.1 from_M6[i3.2.2 being_Z5 released_A1.7-,_PUNC and_Z5 car_M3fn dealerships_I2.2 are_Z5 looking_X2.4[i4.2.1 for_X2.4[i4.2.2 ways_X4.2 to_Z5 make_A1.1.1 room_H2 for_Z5 the_Z5 new_T3-cars_M3fn and_Z5 trucks_M3fn that_Z8 are_A3+on_T1.1.3[i5.3.1 the_T1.1.3[i5.3.2 way_T1.1.3[i5.3.3!_PUNC

        這是從作了語義標記的商務英語語料庫選取的一個片斷,其原始語料文字為:Thanks for responding to my voice mail.The new model year of automobiles is only a month away from being released,and car dealerships are looking for ways to make room for the new cars and trucks that are on the way!其中,每個單詞_之后是語義標注,如:S1.2.4+表示禮貌,Z5表示語法倉(Grammatical bin),S1.1.2+表示指向,Z8表示代詞,Q 2.1表示話語交流,Q1.2表示紙質(zhì)文件寫作,T3表示時間:新舊與幼長,A14表示排它詞/特定化詞(Exclusivizers/particularizers)。

        (二)“商務英語語料庫”在商務英語教學中的應用

        Leech(1997)將語料庫在語言教學的應用劃分為直接應用和間接應用。前者指語料庫能幫助確定教什么、何時教,后者指學生和教師在語言課堂上使用語料庫輔助教學,從而影響教與學的方式。這兩種應用圖示如下:

        圖1 語料庫在語言學習與教學中的應用

        目前,“商務英語語料庫”作為商務英語專用語料庫,采用常用的語料庫軟件,如MonoConc Pro,ParaConc,WordSmith和Wmatrix等,可對該語料庫中大量商務英語語料,通過中心詞索引(concordancing)、關鍵詞分析(key word analysis)、語塊分析(cluster analysis)、詞匯-語法概況(lexical-grammatical profile)、語義韻律分析(semantic prosody analysis)等方法進行詞語、詞頻、短語、搭配、句型、語義和語用等方面的研究,這些功能在商務英語語言大綱設計、教學、測試、教材編寫及教師發(fā)展等方面都可得到直接和間接的應用。

        1.大綱設計與教材開發(fā)

        教學大綱的編寫應當以實證為依據(jù),而不是以直覺為基礎(Mindt 2001)。以語料庫中大量的實際語言使用的頻率數(shù)據(jù)可為大綱設計提供科學指導,使教學內(nèi)容先后順序的安排更為合理。

        通過檢索手段進行頻率統(tǒng)計(Frequency Count),語料庫語言學將語言的不對稱性分布特征清楚地展現(xiàn)在人們面前:大部分書面文章的95%由4000-5000次高頻詞構(gòu)成,而在其中前1000個高頻詞又占據(jù)了文章的85%;在口語中,50個高頻功能詞就占據(jù)了60%。這種不對稱性分布特征也同樣表現(xiàn)在詞的多義、語法結(jié)構(gòu)、詞組和詞匯搭配等語言現(xiàn)象上。從統(tǒng)計學的觀點來看,頻率較高的語言項目一般都是學習者在語言使用中最有可能遇到和需要學習的語言項目。這就要求在教學中區(qū)別對待不同的語言現(xiàn)象,如高頻詞、高頻詞的低頻義、低頻詞的高頻義、高頻語法結(jié)構(gòu)和高頻詞匯搭配模式等等(肖忠華,許家金2008)。

        “商務英語語料庫”可以對商務英語使用進行描述,研究商務英語詞匯的詞頻、覆蓋面和分布情況,制定商務英語詞匯表,使之成為商務英語教學大綱設計、教材編寫的重要依據(jù)。運用MonoConc Pro可以方便制作“商務英語語料庫”詞頻統(tǒng)計表,還可通過引入stop-list剔除其中的功能詞,得到實義詞(contentwords)詞頻表(Barlow 2004)。

        2.語料庫與商務英語語言教學

        “商務英語語料庫”除了可為大綱設計、教材開發(fā)提供依據(jù)之外,還可直接應用到商務英語語言教學中去,其步驟主要有以下三個:

        1)把“語料庫語言學”作為“教師發(fā)展”的一個重要內(nèi)容,通過辦進修班、學術講座和網(wǎng)絡課程等形式,使教師掌握語料庫語言學理論與方法。這是其它三種途徑的前提條件,也是教師面臨的新挑戰(zhàn)。根據(jù)最近的一項調(diào)查,英語教師常常需要向以英語為母語者請教語言點,而英語語料庫被形容為“孜孜不倦的告知者(informant[s]),語言知識比一般以英語為母語者潛力更大”(Lüdeling,Anke&Kyt,Merja.2008)。中心詞索引可以幫助教師創(chuàng)造一個數(shù)據(jù)豐富的學習環(huán)境,“豐富他們自身的語言知識”(Barlow 1996:30)及學生的語言知識。

        2)向?qū)W生傳授語料庫使用的基本技能。這包括兩方面的技能,即語料庫、語料庫軟件工具的使用技能和使用語料庫進行數(shù)據(jù)分析的能力。學生一旦掌握了語料庫研究的使用技能,就可通過語料庫進行商務英語與通用英語詞匯、句法等方面的比較、進行詞語搭配、主題分析、例句援引、詞素分析、詞匯語義學和話語分析等,從而自己駕馭語言學習,將學習模式轉(zhuǎn)化為以學習者為中心,根據(jù)客觀語言事實來形成解決語言學習問題的方案。

        3)將“商務英語語料庫”直接應用到課堂上,即采用基于語料庫的語言教學法。首先,由學生運用于語料庫軟件,觀察真實語料,從大量語料中看到對某一語言現(xiàn)象的呈示(Illustration),然后討論和分享在語料中的發(fā)現(xiàn),形成與語料庫的互動(Interaction),接著對某個語言現(xiàn)象的規(guī)則進行歸納(Induction),并在教師的指導下通過觀察更多語料,逐步修正完善規(guī)則。這種“數(shù)據(jù)驅(qū)動學習(Data Driven Learning)”的教學模式,體現(xiàn)了建構(gòu)主義、人本主義教育思想,值得大力探索和提倡。例如,在商務英語中“appreciate”一詞用法甚多,可與不同的詞搭配使用,學生通過檢索語料庫即可清楚觀察到該詞搭配情況(表1),并對之進行甄別、歸納。試題的代表性和真實性,使考題內(nèi)容即實際工作的內(nèi)容,保障試題的效度。以“market”一詞為例,表2顯示了該詞在“商務英語語料庫”中的44條語境共現(xiàn)例句。其中,有market充當句子成分的分布、類聯(lián)接(colligation)、語義搭配(collocation)及強搭配、弱搭配和零搭配等搭配關系等信息。

        表1 “appreciate”在商務書信的部分搭配情況

        3.商務英語測試

        語言測試是語料庫應用的一個新領域。語料庫最強有力的工具——中心詞索引和詞頻統(tǒng)計工具,可展示“商務英語語料庫”中的詞匯在不同商務語境中的使用頻度極其豐富用例和細微差別,對一些疑難用法、慣用搭配和語篇結(jié)構(gòu)特征進行排序、歸類,便捷地查找出編制試題所需要的真實素材,確保

        表2 “market”一詞語境共現(xiàn)情況

        語料庫已廣泛用于國際大型英語測試中,如美國教育考試服務中心(ETS)建立了The T2K-S WAL Corpus為托福、GRE、G MAT等考試服務;英國劍橋大學英語認證測試考試委員會(UCLES)建立了Cambridge Learner Corpus,Business English Text Corpus等,為劍橋大學英語認證測試等服務。同樣,“商務英語語料庫”也擬用于設在深圳職業(yè)技術學院的“全國國際商務英語考試中心”主持的“全國國際商務英語考試”,為該考試發(fā)揮以下功能:1)用作測試文本庫,開發(fā)試題材料;2)從語料庫檢索商務英語搭配情況、真實的題干和合理的干擾項分析,提高測試的效度;3)使測試標準化和規(guī)范化,優(yōu)化測試流程,改善評分質(zhì)量;4)建立考生試卷語料庫,研究學生中介語特點。

        4.商務英語語言研究

        以往語料庫的應用多局限在詞匯、語法研究方面。但近年來,已有極大的突破,利用語料庫對較大的語言單位的研究已相當普遍(Biber,Connor&Upton 2007)。利用相關軟件,如MonoConc,可對“商務英語語料庫”中的商務信件、電子郵件、傳真、memo及商務報告等內(nèi)容進行文體(style)、體裁(genre)、語步(moves)、語義關聯(lián)(semantics associations)、語義韻律(semantic prosody)、語篇構(gòu)建及禮貌策略等進行分析,從而找出商務英語作為一種專門用途用語(ESP)的特點。

        5.商務英語翻譯

        20世紀90年代以來,基于語料庫的翻譯研究已成為翻譯研究領域中一種新的研究范式,發(fā)展勢頭迅猛,在理論、描寫和應用等層面對翻譯研究和翻譯教學中發(fā)揮越來越重要的作用?!吧虅沼⒄Z語料庫”平行語料庫部分可用于商務英語翻譯研究與教學。將國際商務英語放在翻譯語料庫層面上進行研究,可為國際商務翻譯者提供一個學習的平臺,通過比較譯語文本和其對應的母語中的語言特征及其出現(xiàn)的頻率來研究翻譯過程,對商務譯文風格特點進行量化分析,挖掘翻譯規(guī)律,促進國際商務和對外貿(mào)易的發(fā)展。利用對應語料庫還可搜尋大量的對應詞語、短語,豐富商務英-漢、漢-英商務、貿(mào)易詞典的編纂,并為商務英語機器翻譯(Machine Translation)和機器助譯(Machine-aided Translation)等提供支持。

        三、“商務英語語料庫”建設與應用的困難與發(fā)展前景

        “商務英語語料庫”建設及其應用是一項龐大、復雜和艱辛的工作,不可能一蹴而就,需要投入大量的時間和人力;也涉及到語料庫建設中普遍存在的版權等問題,包括語料庫采用的書刊的版權、第一手商務資料的保密、與語料庫配套使用的軟件的授權等,需要與相關出版商、開發(fā)商洽談版權等問題。

        自1964年第一個可用計算機處理的語料庫Brown Corpus在美國Brown大學問世以來,經(jīng)過四十多年幾經(jīng)曲折的發(fā)展,語料庫正逐漸成為語言學理論研究、應用研究和語言工程不可缺少的基礎資源。目前,世界各國許多語言學家和外語教師都在探求語料庫在各領域中的應用,發(fā)展前景十分良好。始建于2003年的新加坡教育研究語料庫(Singapore Corpus of Research in Education,簡稱SCoRE),是一個對課堂師生互動、教材和學生作業(yè)等錄像、錄音和文字材料進行了多模態(tài)、多層次(multimodal,multilevel)標注的語料庫,代表了語料庫發(fā)展的新方向(Hong.2007)。在“商務英語語料庫”應用中,既要注重發(fā)揮中心詞索引、關鍵詞分析等核心功能的作用,也需要向使之在多模態(tài)、多層次方向發(fā)展,只有這樣才能取得語料庫語言學作為語言學研究中革命性的進步的成果。

        [1]Barlow,Michael.Corpora for theory and practice[J].International Journal of Corpus Linguistics,1996,(1):1-37.

        [2]Barlow,Michael.Software for corpus access and analysis,In:J.Sinclair(ed.),How to use corpora in language teaching[C].Amsterdam,John Ben jam ins,2004.

        [3]Biber,Douglas,Susan Conrad,Randi Reppen.Corpus Linguistics:Investigating Language Structure And Use[M].Beijing:Foreign Language Teaching and Research Press,2000.

        [4]Biber,Douglas,Ulla Connor and Thomas A.Upton,Discourse on the Move:Using corpus analysis to describe discourse structure[M].Amsterdam:John Ben jam ins Publishing Company,2007.

        [5]Flowerdew,Lynne.The argument for using English specialized corpora[C].In:Ulla Connor Tho mas A.Upton(ed.),Discourse in the Professions:Perspectives from Corpus linguistics,Amsterdam:John Benjamins Publishing Company,2004.

        [6]Hong,Huaqing.Score:A Multimodal Corpus Database of Education Discourse in Singapore Schools[EB/OL].http://www.corpus.bham.ac.uk/pclc/ScopeHong.pdf.2007.Accessed on Oct.10,2009.

        [7]Leech,Geoffrey.Teaching and Language Corpora:A Convergence.In:W ichmann,A.Teaching and Language Corpora[M].London:Longman,1997.

        [8]Lüdeling,Anke&Merja Kyt,Corpus linguistics:an international handbook[M].Berlin and New York:Walter de Gruyter,2008.

        [9]McEnery,Tony.Richard Xiao,&Yukio Tonio,Corpus-based language studies:An advanced resource book[M].New York:Routledge,2006.

        [10]Mindt,Dieter.English corpus linguistics and the foreign language teaching syllabus.In:Jenny Thomas&MichaelH.Short(eds.).U-sing Corpora for language Research[C].Beijing:Foreign Language Teaching and Research Press,2001.

        [11]Svartvik,Jan.Corpora are becoming mainstream.In:Jenny Thomas&Michael H.Short(eds.).Using corpora for language research[C].Beijing:Foreign Language Teaching and Research Press,2001.

        [12]馮志偉.《應用語言學中的語料庫》導讀[A].Susan Hunston.Corpora in Applied Linguistics[C].北京:世界圖書出版公司,劍橋大學出版社,2006.

        [13]肖忠華,許家金.語料庫與語言教育[J].中國外語教育,2008,(2).

        2009-12-16

        周玉林(1963-),男,江西信豐人,博士研究生,副教授。

        猜你喜歡
        商務英語語言研究
        FMS與YBT相關性的實證研究
        遼代千人邑研究述論
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        視錯覺在平面設計中的應用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        “任務型”商務英語教學法及應用
        時代人物(2019年29期)2019-11-25 01:35:20
        EMA伺服控制系統(tǒng)研究
        基于SPOC的商務英語混合式教學改革研究
        讓語言描寫搖曳多姿
        累積動態(tài)分析下的同聲傳譯語言壓縮
        基于圖式理論的商務英語寫作
        欧美最猛性xxxx| 免费一区二区三区久久| 精品人妻无码中文字幕在线| 成年女人在线观看毛片| 亚洲av日韩av天堂久久不卡| 国产精品亚洲第一区二区三区 | 人妻无码中文字幕免费视频蜜桃| 国产高潮流白浆免费观看不卡 | 成人国产av精品麻豆网址| 2018天天躁夜夜躁狠狠躁| 日本精品无码一区二区三区久久久 | 国产国拍亚洲精品永久69| 免费观看成人稀缺视频在线播放| 国产精品女同二区五区九区| 精品天堂色吊丝一区二区| 久久aⅴ人妻少妇嫩草影院| 久久久精品人妻一区亚美研究所| 动漫av纯肉无码av在线播放| 久久久精品国产亚洲av网麻豆 | 色综合av综合无码综合网站| 四虎国产精品永久在线无码| 视频在线观看一区二区三区| 一本色道久久综合狠狠躁中文 | 国产极品裸体av在线激情网| 国产精品久久久久免费观看| 中年熟妇的大黑p| 亚洲无码a∨在线视频| 国产精品日本一区二区三区在线| 亚洲av五月天一区二区| av无码精品一区二区三区宅噜噜| 亚洲欧洲日产国码无码AV一| 麻豆成年人视频在线观看| 二区三区三区视频在线观看| 人妻少妇精品无码专区二区 | 欧美乱大交xxxxx潮喷| 四虎影视永久在线精品| 久久国产影视免费精品| 日本在线免费不卡一区二区三区| 国产一区高清在线观看| 亚洲精品aa片在线观看国产| 中日韩欧美成人免费播放|