譚 芳
(哈爾濱理工大學,哈爾濱 150040)
【責任編輯孫 穎】
高校基礎(chǔ)階段通用英語課堂話語語料庫的生成*
譚 芳
(哈爾濱理工大學,哈爾濱 150040)
雖然語料庫以其信息存儲量大、資料真實、檢索快捷準確的優(yōu)勢日益受到各個領(lǐng)域?qū)W者的青睞,但是耗時費力、程序復(fù)雜的口語語料庫建設(shè)卻不多。迄今,專文詳述中國國內(nèi)高校英語課堂話語語料庫建庫的論文尚未見。本文介紹歷時3年建成的高?;A(chǔ)階段通用英語課堂話語語料庫,首先說明該口語語料庫研究項目的、研究背景及選題緣起,然后回顧國內(nèi)外代表性課堂話語語料庫的建設(shè),最后介紹高校基礎(chǔ)階段通用英語課堂話語語料庫的語料收集過程和處理方法等,討論該庫的特點、功能及其對高校英語教育改革的意義。
高校;基礎(chǔ)階段;通用英語;課堂話語;口語語料庫
隨著語料庫研究視域日益寬泛,基于語料庫的課堂話語“語篇分析、會話分析、社會建構(gòu)學習理論的應(yīng)用和批評性話語分析”逐漸受到重視(O’Keeffe et al.2007:244)。國內(nèi)也涌現(xiàn)出一些基于語料庫的課堂話語研究,但主要集中在初、中等教育階段的英語課堂(何安平 2003, 劉永兵 張會平 2011),高校英語課堂研究仍舊主要采用量表、問卷或個案話語分析等常規(guī)研究方法(許宏晨 田野 常洪艷 2004)。這在一定程度上會影響高校英語課堂話語研究,高校英語課堂改革難于形成規(guī)模效應(yīng)。
口語語料庫最能直接真實反映語言本質(zhì),具有寶貴的研究價值(Kennedy 1998),但是其建設(shè)耗力、耗時、耗資且構(gòu)建程序復(fù)雜,在數(shù)量上遠不及筆語語料庫多;已有的口語語料庫又以學習者語料庫居多,課堂話語語料庫并不多見。課堂話語語料庫能夠為課堂話語研究提供具有概括性的檢索與量化統(tǒng)計,適應(yīng)以教育改革為目的的課堂話語規(guī)?;芯啃枨?。因此,建立高校英語課堂話語語料庫十分必要。它是本土化外語教育改革必不可少的重要組成部分,也是高校英語教育改革治標、治本的重要事實依據(jù),對于中國高校英語教育的改革與發(fā)展具有重要現(xiàn)實意義。
國外的語料庫建設(shè)起步雖早,但是迄今為止,建成的課堂話語語料庫并不多,特別是作為外語的英語課堂話語語料庫更為少見。較具代表性的課堂話語語料庫包括:(1)Biber等人建立的“TOEFL 2000口筆語學術(shù)語言語料庫”(TOEFL 2000 Spoken and Written Academic Language,簡稱T2K-SWAL)的課堂話語子語庫,語料源自美國的大學課堂,涵蓋商學、教育、工程、人類學、自然科學和社會科學6大學科,容量約125萬詞次(Biber et al.2006)。(2) TalkBank國際數(shù)據(jù)庫的“ClassBank語料庫”,創(chuàng)建于2004年。其英語語料大多源自美國、澳大利亞和日本等國家和中國香港,涵蓋小學、中學和大學,包括數(shù)學、醫(yī)學和科學等課堂話語,由James Stigler, Rich Lehrer和Elizabeth Warren等錄制并轉(zhuǎn)寫,容量40余萬詞次。(3)“弗倫斯堡英語課堂語料庫”(Flensburg English Classroom Corpus,簡稱FLECC),由J?kel于2003-2007年創(chuàng)建,語料源自高級英語學習者在學校實習時授課的課堂,包括德國北部的小學 (Grundschule)、職業(yè)預(yù)校(Hauptschule)、實科中學(Realschule)和綜合中學(Gesamtschule),共39節(jié)完整英語課的課堂話語語料,容量逾56,000詞次(J?kel 2010)。(4)“新加坡教育語料庫”(Singapore Corpus of Research in Education,簡稱SCoRE)課堂話語子語庫,由洪華清于2004-2009年主持建設(shè),其英語語料源自英語授課的數(shù)學、科學、社會學和英語課堂,包括新加坡小學和中學122位教師一個單元的完整授課,共455節(jié),時長565小時,容量逾230萬詞次(Doyle 2009)。
我國英語課堂話語語料庫主要有3個:(1)何安平主持建設(shè)的“英語教育教學語料庫”中的“課堂教學實況語庫”,容量105萬詞次。其中,中國英語教師教學語料庫自20世紀90年代末開始創(chuàng)建,容量逾96萬詞次,(小學英語教師教學語料庫8.4萬詞次、初中英語教師教學語料庫33.7萬詞次、高中英語教師教學語料庫27萬詞次),大學英語教師教學語料庫27.3萬詞次 (何安平2012)。(2)“英語師范生課堂話語語料庫”收集南京師范大學2005屆教學實習過程中的實習生課堂話語語料建成,首批40,000詞次 (劉學惠 2006)。(3)劉永兵主持建設(shè)的“中學英語課堂話語語料庫”,2007-2010年收集東北10個市縣21所中學 (初中和高中),57個單元276節(jié)英語課的課堂語料,容量逾14萬詞次 (劉永兵 林正軍 王冰 2010)。
國內(nèi)英語課堂話語語料庫建設(shè)主要集中于初、中等教育階段,“課堂教學實況語庫”中,初中英語課堂話語語料最多,其中優(yōu)質(zhì)課語料又占相當大的比例(何安平 2012),而優(yōu)質(zhì)課反映近年來中國內(nèi)地較為優(yōu)秀的英語課堂話語面貌 (何安平 2003)?!爸袑W英語課堂話語語料庫”的英語話語量、詞匯量和詞匯復(fù)雜度等較為有限。英語師范生課堂話語語料庫由于授課者不是在職教師,不能完全反映高校英語課堂的真實會話情況。如果建成一個大規(guī)模的高校英語課堂話語語料庫,將能展現(xiàn)給研究者高校英語課堂話語的真實面貌,能為相關(guān)研究提供持續(xù)不斷的數(shù)據(jù)支持,更可避免一次或幾次小規(guī)模取樣而導致研究結(jié)果的片面性與局限性。
在大規(guī)模課堂話語語料收集正式開始前,我們在黑龍江和吉林兩省收集6節(jié)高校通用英語課的課堂錄音,進行先導性研究。根據(jù)研究結(jié)果,在規(guī)模性語料收集工作正式開始前,改進調(diào)查工具和數(shù)據(jù)收集過程,設(shè)備使用、實際方式和文本處理等更趨合理。由于篇幅所限,此處僅介紹調(diào)查點及樣本確定、語料收集、語料庫生成和語料庫描述。
3.1調(diào)查點及樣本的確定
在調(diào)查點取樣過程中,我們最關(guān)心樣本的典型性,影響樣本典型性的主要因素是高校的地理分布和高校類型。我國幅員遼闊,各地英語課堂教學受區(qū)域經(jīng)濟、地方文化等因素影響而差異較大。黑龍江和吉林兩省地處東北老工業(yè)基地,兩省經(jīng)濟發(fā)展水平相當,地方文化相近,因此調(diào)查點集中于兩省的高校。高校類型則涉及所選取調(diào)查樣本中的學生語言水平、教師教育背景和教學經(jīng)歷等,關(guān)涉語料信度。為了盡可能保證語料的代表性,本研究采集樣本的覆蓋面包括黑龍江和吉林兩省教育部直屬985或 (及) 211高校、省屬高校、獨立學院3種類型 (以前兩種類型為主)。
取樣過程中,項目組成員嚴格按照取樣論證時制定的取樣準則取樣,未加任何人工干預(yù)。調(diào)查點高校共12所,涵蓋理工類、師范類、財經(jīng)類、醫(yī)學類及綜合類,包括教育部直屬985或 (及) 211高校3所 (黑龍江1所、吉林2所)、省屬高校8所 (黑龍江6所、吉林2所)、獨立學院1所 (吉林1所)。其中,黑龍江省 (哈爾濱6所、綏化1所) 共7所,吉林省 (長春4所、吉林1所) 共5所。
本項目針對高?;A(chǔ)階段 (一、二年級) 的通用英語課堂話語進行采樣,對高校英語專業(yè)的基礎(chǔ)英語和非英語專業(yè)的大學英語課堂話語進行錄音。入庫樣本的篩選遵循4條原則:(1)錄音清晰可識別:這為轉(zhuǎn)寫提供方便,也保證語料庫包含盡可能多的話語量;(2)一個完整單元 (unit) 的授課錄音:這保證反映課堂會話的全貌;(3)英文授課時長累計1/2以上的錄音:本研究調(diào)查英語課堂話語,暫不將漢語納入研究范圍,為避免浪費時間,只轉(zhuǎn)寫有效錄音樣本,教師英文授課時長達到總授課時長1/2以上的錄音樣本方可采用;(4)師生的許可:語料庫建設(shè)應(yīng)該得到作者許可,再把文本轉(zhuǎn)換成電子版形式(Mc-Enery, Hardie 2012)。本項目計劃入庫20位英語教師的課堂錄音轉(zhuǎn)寫語料,為防止個別樣本不符合上述篩選原則,我們按超出預(yù)計入庫樣本總數(shù)約25%的比例進行語料收集,對于收集到的錄音語料“多則轉(zhuǎn)寫,少則補充”。
3.2 語料收集
國內(nèi)有些研究針對英語優(yōu)質(zhì)課的課堂話語展開(何安平 2003),但是這種條件下師生的課堂表現(xiàn)受許多因素干擾,無法體現(xiàn)英語課堂會話的真實情況。為呈現(xiàn)自然狀態(tài)下高校基礎(chǔ)階段通用英語課堂話語的全貌,本項目采用自然調(diào)查法,收集常態(tài)下的自然、真實英語課堂話語語料,而不是內(nèi)省語料或誘導式語料(Meyer, Nelson 2006; Xiao 2009)。為避免“霍桑效應(yīng)”,將課堂干擾降至最低,盡可能使語料呈現(xiàn)自然狀態(tài)下的英語課堂師生話語,本項目使用高清錄音筆對高?;A(chǔ)階段的通用英語課堂話語錄音。錄音筆由授課教師帶入課堂,放在教室前方講臺上較隱蔽的地方,英語課堂話語在完全自然狀態(tài)下被錄音,學生未被提前告知課堂話語要錄音,教師也并未被要求特別配合本研究而改變各自常規(guī)教學方式及專門注意自己的授課語言。
自2011年6月至2014年6月,本項目共對26位教師的英語課授課實況進行錄音。經(jīng)過篩選,刪除4位教師的授課錄音文件,其中兩位教師的授課錄音由于錄音設(shè)備出現(xiàn)故障,每節(jié)課只收錄課堂前十幾分鐘的話語錄音,另外兩位教師的授課錄音均因教師上課半數(shù)以上時間使用漢語授課,22個有效樣本來自9所高校(黑龍江省5所和吉林省4所),其中10個源自教育部直屬985 或 (及) 211高校,11個源自省屬高校,1個源自獨立學院。
截至2014年6月項目結(jié)項,入庫語料包括22位高校英語教師 (黑、吉兩省各11位) 講授一個單元教學內(nèi)容的完整課堂錄音。其中,英語專業(yè)和公共英語教師各11位,兩位為男性,其余皆為女性,教師平均年齡約32歲,平均教齡約7年半;其中1位教師獲得英語語言文學專業(yè)博士學位,兩位教師為英語語言文學專業(yè)在讀博士,1位教師正在攻讀英語教育碩士,其余18位教師都已獲得文學碩士學位 (此信息以課堂錄音時為準)。
3.3 語料庫的生成
我們對收集的錄音語料進行數(shù)據(jù)儲存、文本轉(zhuǎn)寫、校對、清理、切分、標記、詞性標注和人工糾誤,初步建立起一個高校基礎(chǔ)階段通用英語課堂話語語料庫(UFS-EGPCDC)。
限于篇幅,此處簡要介紹本項目的語料轉(zhuǎn)寫、文本整理、清潔與命名及語料庫的標記與標注。
(1)語料轉(zhuǎn)寫
轉(zhuǎn)寫規(guī)范與研究者的研究問題、理論立場及分析方法密切相關(guān),它將影響其后分析和結(jié)果闡釋(Lapadat 2000)。高?;A(chǔ)階段通用英語課堂話語語料庫在外語對話課堂理論(譚芳 2014, 2015)指導下,從微觀、中觀、宏觀層面入手,研究高校通用英語課堂話語的語言使用、語篇結(jié)構(gòu)與從中折射的社會行為和意識形態(tài)的重要組成部分(譚芳 2015)。在設(shè)計語料轉(zhuǎn)寫規(guī)范時,轉(zhuǎn)寫設(shè)計改編自Dressler和Kreuz (2000) 的轉(zhuǎn)寫模型,包括3個范疇:①語碼轉(zhuǎn)換:包括中英語碼轉(zhuǎn)換、中法語碼轉(zhuǎn)換、未知語言語碼轉(zhuǎn)換等,②聲音和言語事件:包括背景噪音、笑聲、掌聲、口吃、無法分辨或完全聽不清的詞、短語和句子等,③臨時事件:包括停頓、重疊等。同時,轉(zhuǎn)寫規(guī)范設(shè)計遵循兩條原則:①易用性原則:將轉(zhuǎn)寫符號盡可能減少;②關(guān)聯(lián)性原則:轉(zhuǎn)寫符號均與研究問題相關(guān) (Lahlali 2003:92)。
此外,課堂內(nèi)閑話包括在轉(zhuǎn)寫范圍內(nèi),但是課休時英文對話不納入轉(zhuǎn)寫范圍。錄音中的數(shù)字、年代按照口語產(chǎn)出時的讀法轉(zhuǎn)寫。對英國英語和美國英語拼寫不同的單詞,如centre/center,neighbour/neighbor,fulfil/fulfill,favour/favor等,采用英式拼寫轉(zhuǎn)寫。Er和hmm等填充詞按猶豫、懷疑等不同話語功能區(qū)別處理。避免OK和HK等縮寫或是sb,sth一類的簡寫,按照口語產(chǎn)出時的讀法轉(zhuǎn)寫成okay,Hong Kong, somebody,somethin等。遇到 can’t,cannot 縮略式與非縮略式讀音相同的情況,統(tǒng)一按縮略式can’t 轉(zhuǎn)寫,等等。
(2)文本的整理、清潔與命名
在文本整理過程中,按教師開始講課到宣布下課為止生成一個文檔。一般而言,一課時 (lesson) 為40至50分鐘,高校通用英語課多為一次課兩課時,課間休息10分鐘,調(diào)查點的高校中有一所高校進行課改,通用英語課一次授課僅一課時 (40分鐘),還有個別高校通用英語課兩課時中間無休息,教師將兩課時合并授課。因此,在生成獨立文檔時,我們以教師宣布一堂課結(jié)束為界。在對文本進行包括格式轉(zhuǎn)換、非法字符替換、糾錯等一系列清潔整理工作后,采用對漢英混排文本非常經(jīng)濟的UTF-8編碼存儲語料庫的轉(zhuǎn)寫文本。
文檔命名均被賦予特定代碼,代碼的順序為:省份-城市-學校類別-學校名稱-專業(yè)/公外-年級-教師性別-教師姓名-文件代號。省份包含兩個代碼:H(黑龍江)、J(吉林),城市名按拼音首字母縮寫,如HRB(哈爾濱)、CC(長春);學校類別包括3個代碼:1代表教育部直屬985或 (及) 211高校、2代表省屬高校、3代表獨立學院;學校名稱采用從1至9的代碼分別代表目前入庫語料來源的9所高校;專業(yè)/公外代碼分別為:E(英語專業(yè))和N(非英語專業(yè));年級代碼用1和2分別表示大一和大二;教師性別用F表示女,M表示男;教師姓名采用姓和名首字母縮合;文件代號為從1起的阿拉伯數(shù)字,代號順序與教師完成一個單元的授課順序一致。但為保護調(diào)查點及授課教師隱私,在實際研究中 (如在后文的索引行示例時)文檔命名代碼會稍做處理。
(3)語料庫標記與標注
對文本進行分詞處理后,我們把文本存儲為兩份:一份轉(zhuǎn)換為成品文本,為下一步標記和標注做準備;另一份作為原始語料備份,以供未來研究需要源文本時隨時調(diào)出。我們先在轉(zhuǎn)寫文本的頭部對錄音時間、授課教師姓名、性別、年齡、授課時長和課程名稱等元信息進行標注;同時,為使庫容統(tǒng)計和相關(guān)信息分析相對準確與方便,我們對語料庫中每位講話者的身份、話輪順序、話輪起止和學生姓名等都做標記。雖然語料庫標注可在語音、形態(tài)、詞匯、句法和語篇等多層面進行,但是使用最為廣泛的是詞性標注,本項目使用TreeTagger軟件對課堂話語的文本語料在詞匯層面進行詞性標注。在標記和(詞性) 標注后,進行人工復(fù)查和糾誤。針對其它層面,如話步等不能實現(xiàn)全自動標注的信息,根據(jù)不同研究目的設(shè)計與之相對應(yīng)的標注系統(tǒng),未來我們將結(jié)合具體研究問題完成相應(yīng)標注,并將標注后的文本導入數(shù)據(jù)庫,利用數(shù)據(jù)庫強大技術(shù)支持,對課堂話語語料進行綜合處理,以服務(wù)于多角度、深層次的課堂話語分析。
3.4 語料庫描述
(1)容量:該項目前期準備始于2011年初,項目設(shè)計期限為3年,2011年6月正式啟動。截止2014年6月,已將黑、吉兩省4個城市9所大學22位英語教師講授一個教學單元的通用英語課的課堂錄音全部轉(zhuǎn)寫完畢并建庫。轉(zhuǎn)寫記錄每節(jié)英語課中教師的獨白話語、教師與全班 (或某一組) 學生的對話,教師與單個學生的對話以及兩名或多名學生之間的當眾對話。入庫語料總時長4,958分鐘,約82.6個小時,我們將語料庫中的漢語去除后,利用AntConc 3.2.4w計算庫容,語料庫容量為英文類符8,902個,型符 284,523個。
(2)特點與功能:本項目建立的高?;A(chǔ)階段通用英語課堂話語語料庫不同于大型、通用語料庫,它是中小型專門語料庫,為英語教師專業(yè)發(fā)展、二語習得、應(yīng)用語言學等研究提供事實依據(jù);可以服務(wù)于多方面研究:1)課堂教學分析,包括分析課堂教學的話語模式、知識建構(gòu)方法和教師教學策略等;2)課堂話語分析,課堂話語分析是多層面、多角度的,僅以句法層面的分析為例,可從語用角度分析課堂話語,如研究課堂中的禮貌、情態(tài)和師生權(quán)勢關(guān)系等;3)中介語研究,英語在中國屬于外語,課堂中師生的英語產(chǎn)出均是中介語,該語料庫可為中介語研究提供語言特征和會話互動特征等多方面例證;4)外語教學理論與實踐分析,課堂是中國學生學習英語的主要場所,因此真實自然的英語課堂話語語料為驗證不斷涌現(xiàn)的外語教學理論提供客觀事實與數(shù)據(jù)支持。
為展示高?;A(chǔ)階段通用英語課堂話語語料庫的部分特點與功能,此處僅以功能詞of為節(jié)點詞對本語料庫進行檢索,概括并列舉索引行中of短語使用錯誤。其中,較具代表性的錯誤包括:
① N1+of+N2結(jié)構(gòu)中,本應(yīng)是復(fù)數(shù)的N2卻用作單數(shù)形式。如:
<034>
<033>
或者本應(yīng)是復(fù)數(shù)的N1用作單數(shù),如:
<100>
② of的冗余,如:
<018>
<015>
③ of 的濫用,導致語義不清,如:
<068>
濫用的of短語實則為本族語者在口筆語中皆少用或不用的短語,如:
<125>
其中的the same of,在美國楊百翰大學 BNC 語料庫(BYU-BNC: The British National Corpus)中的頻數(shù)僅為33次,其中1例還是...not exactly the sameofcourseer partly because we...如果不算這例,the same of 的頻數(shù)僅為32次;而我們熟悉的the same as在BYU-BNC中的頻數(shù)則是2,548次。
④ of 的誤用,如:
<145>
其中本應(yīng)用in卻用of <023>
這些索引行示例使我們直觀、清晰地發(fā)現(xiàn)英語課堂話語中of短語的一些不易發(fā)現(xiàn)也很少提及的使用錯誤,體現(xiàn)本語料庫中介語語料庫的特點與功能。
目前,高?;A(chǔ)階段通用英語課堂話語語料庫的數(shù)據(jù)查詢還只能在離線狀態(tài)下進行。研究人員利用一些第三方查詢工具查詢數(shù)據(jù)進行統(tǒng)計。后續(xù)階段,我們將建立網(wǎng)絡(luò)檢索平臺,在解決虛擬空間、語料庫版權(quán)和后臺服務(wù)器等問題后計劃將語料庫與網(wǎng)絡(luò)相連,供更多研究者使用。
高?;A(chǔ)階段通用英語課堂話語語料庫建立在自然語料基礎(chǔ)上,是國內(nèi)少有的常規(guī)教學狀態(tài)下的高校英語課堂話語語料庫。該庫的調(diào)查點及采樣相對集中,能夠提供給研究者高校基礎(chǔ)階段通用英語課堂教學和課堂會話等最新實況,有利于研究者取得客觀、可供檢測的結(jié)論。目前,該口語語料庫的擴建工作正在圍繞兩個方面進行:(1)在樣本內(nèi)容上,正在收集高校英語專業(yè)3、4年級的高級英語課堂話語錄音,將建成包括大學英語、基礎(chǔ)英語和高級英語3個子語庫的高校通用英語課堂話語語料庫;(2)在采樣范圍上,正在收集并整理遼寧省高校英語課堂話語的錄音語料,預(yù)計再用3年左右可建立東北3省高校通用英語課堂話語語料庫。
何安平.基于語料庫的英語教師話語分析[J].現(xiàn)代外語, 2003 (2).
何安平.華南師范大學外國語言文化學院英語教育教學語料庫 (CEEC) 使用手冊[OL].http://www.docin.com/p-398932537.html, 2012.
劉學惠.英語師范生課堂話語的建庫、分析和應(yīng)用[J].外語電化教學, 2006 (5).
劉永兵 林正軍 王 冰.基礎(chǔ)英語課堂話語語料庫的建構(gòu)與研究功能[J].當代外語研究, 2010 (8).
劉永兵 張會平.中學英語教師課堂話語語法復(fù)雜度——一項基于課堂話語語料庫的對比研究[J].外語電化教學, 2011 (3).
譚 芳.對話與課堂——回顧、反思與重構(gòu)[J].外語學刊, 2014 (4).
譚 芳.巴赫金理論視域下的外語對話課堂理論探究[M].長春:吉林大學出版社, 2015.
許宏晨 田 野 常洪艷.一次對多媒體輔助外語教學態(tài)度的調(diào)查分析[J].外語電化教學, 2004 (2).
Biber, D., Conard, S., Reppen, R., Byrd, P., Helt, M.The Spoken and Written Academic Language (T2K-SWAL) Corpus[A].In: Biber, D.(Ed.),UniversityLanguage:ACorpus-basedStudyofSpokenandWrittenRegisters[C].Amsterdam: John Benjamins Publishing Company, 2006.
Doyle, P.Language Development in Singapore Classrooms: A Corpus-based Description of the ‘School Variety’[A].In: Silver, R.E., Goh, C.C.M., Alsagoft, L.(Eds.),LanguageLearninginNewEnglishContexts:StudiesofAcquisitionandDevelopment[C].London: Continuum, 2009.
Dressler, R.A., Kreuz, R.J., Transcribing Oral Discourse: A Survey and a Model System [J].DiscourseProcesses, 2000(1).
J?kel, O.Working with Authentic ELT Discourse Data: The Flensburg English Classroom Corpus [A].In: Vogel, R., Sahel, S.(Eds.),NLKProceedings[C].Bielefeld: Bielefeld University, 2010.
Kennedy, G.AnIntroductiontoCorpusLinguistics[M].London: Longman, 1998.
Lahlali, E.M.Moroccan Classroom Discourse and Critical Discourse Analysis: The Impact of Social and Cultural Practice[D].The University of Leeds, 2003.
Lapadat, J.C.Problematizing Transcription: Purpose, Paradigm and Quality[J].InternationalJournalofSocialResearchMethodology, 2000(3).
McEnery, T., Hardie, A.CorpusLinguistics:Method,TheoryandPractice[M].Cambridge: Cambridge University Press, 2012.
Meyer, C., Nelson, G.Data Collection[A].In: Aarts, B., McMahon, A.(Eds.),TheHandbookofEnglishLinguistics[C].Oxford: Blackwell Publishing, 2006.
O’Keeffe, A.McCarthy, M., Carter, P.FromCorpustoClassroom:LanguageUseandLanguageTeaching[M].Cambridge: Cambridge University Press, 2007.
Xiao, R.Theogardry-driven Corpus Research: Using Corpora to Inform Aspect Theory[A].In: Lüdeling, A., Kyt?, M.(Eds.),CorpusLinguistics:AnInternationalHandbook[C].Berlin: Mouton de Gruyter, 2009.
TheCompilationofUFS-EGPCDC
Tan Fang
(Harbin University of Science and Technology, Harbin 150040, China)
Corpus is increasingly favoured by researchers of different fields due to its advantages such as the huge storage, real data and fast search.However, few numbers of spoken corpus have been built because of its high cost, technical complication and time-consuming process.Until now, no publication has specified the construction of English classroom discourse corpus of tertiary education in the domestic academic circle.This paper briefly introduces the compilation of EGP Classroom Discourse Corpus of the university fundamental stage (UFS-EGPCDC) over the past three years.After an overview of the research background, this paper reviews the construction of the typical classroom discourse corpus both at home and abroad, and then focuses on the research methodology of data collection, data processing et cetera, as well as the discussion about the features and functions of this corpus together with its implications for the English education reformation of higher education in China.
university; fundamental stage; EGP; classroom discourse; spoken corpus
定稿日期:2015-06-21
H030
A
1000-0100(2015)05-0042-5
* 本文系國家留學基金項目“高校通用英語課堂話語的現(xiàn)狀調(diào)查與多維分析”(2011823149)、黑龍江省人文社科研究項目“社會認知視域下外語對話課堂的構(gòu)建——基于黑龍江、吉林兩省英語課堂語料庫的研究”(12512047)和黑龍江省社科基金項目“高校通用英語課堂話語的現(xiàn)狀調(diào)查與多維分析”(15YYD04)的階段性成果。
10.16263/j.cnki.23-1071/h.2015.05.009