趙曉平 王巧寧
(西安理工大學,陜西西安)
外語學習者在寫作中面臨的一個主要問題是詞匯的貧乏或語法使用的不準確。這也是中國的英語學習者作文中普遍存在的問題,在一定程度上妨礙了他們產(chǎn)出高質(zhì)量的作文。Yoon(2008:45)認為,正確掌握詞匯和準確使用語法能夠“增加學習者的自信并有可能提高他們的整體寫作質(zhì)量?!比欢投嗄甑膶懽鹘虒W實踐看,給學習者直接提供準確的語言形式并未有效地減少他們寫作中所犯的語言或語法錯誤,反而導致學習者懶惰和缺乏主動性,不利于其寫作能力的發(fā)展。因此,對外語學習者和老師而言最有效的方法可能是“促使學習者自己去發(fā)現(xiàn)正確的語言形式”(Corder,1981:11)。
Johns(1991)提出的數(shù)據(jù)驅(qū)動式學習一直被認為是解決這一問題的有效途徑,因為該學習方法基于語料庫的使用,提倡歸納式、發(fā)現(xiàn)式為導向的學習。首先,語料庫為學習者提供了足量真實的語言輸入;其次,學習者可以使用語料庫檢索到高頻使用的語法化的詞匯(Flowerdew,2015);并且,學習者通過觀察和分析檢索到的語料,歸納檢索詞的使用規(guī)則,進行自主探索式的學習。所以從理論上說,語料庫對外語學習者而言是一種有用的參考工具,幫助他們寫出更地道、更準確的作文。實際上,在過去十多年里,許多二語/外語研究者把語料庫融入寫作課堂,他們的研究證明了基于語料庫的數(shù)據(jù)驅(qū)動式學習是一種可行的方式,它能夠幫助學習者習得語法化的詞匯,從而提高他們的寫作質(zhì)量(Coxhead&Byrd,2007;Tribble,2009;Flowerdew,2010)。
然而,在英語作為外語的中國,有關如何把語料庫融入到寫作從而幫助學習者提高他們的寫作質(zhì)量的實證研究非常少。究其原因,主要有三點:首先,語料庫作為檢索工具不易為學習者掌握(Kosem,2008),或者檢索到的語料文本不易被學習者理解(Kennedy&Miceli,2010);其次,許多英語老師缺乏對語料庫的認識和培訓,老師自身需要花大量時間了解語料庫的使用;最后學生習慣于以老師為中心的教學方式,習慣于基于老師的糾錯反饋修改作文。為了解決這些問題,選擇合適的語料庫與充分的語料庫培訓非常必要。本研究首先回顧了語料庫應用到二語/外語寫作課堂的相關研究與使用語料庫所要考慮的問題,然后設計和討論了實證研究,旨在探討語料庫應用到大學本科基礎英語寫作課堂對學習者寫作能力發(fā)展過程帶來的影響。
語料庫應用于二語/外語寫作的相當一部分研究著重于語料庫檢索對寫作中改錯的影響。在這些研究中,學習者經(jīng)過一段時間的語料庫檢索培訓后首先完成研究者布置的寫作任務,然后通過查詢語料庫對作文中的錯誤進行修改,錯誤來自研究者的糾錯反饋或者學習者自己的發(fā)現(xiàn)。例如,Chambers和O’Sullivan(2004)與O’Sullivan和Chambers(2006)的兩次研究關注基于語料庫的數(shù)據(jù)驅(qū)動式學習對不同類型錯誤的修改產(chǎn)生的效果,結(jié)果表明該方法在強化學習者對語法化詞匯用法的意識和提高改錯的準確率方面有著明顯的優(yōu)勢。Gilmore(2009)利用BNC和COBUILD語料庫來幫助日本學生修正英文寫作中的語法錯誤,結(jié)果表明,修改后61.14%的學生的語言準確性得到了提高。
同時,由于詞匯學習和寫作是相互關聯(lián)的兩個領域,所以有必要在此回顧一下使用語料庫對詞匯學習影響的實證研究。Stevens(1991)最早研究學習者進行查詢書面語料活動對詞匯學習的影響。在他的研究中,一組大學生被指導做填空練習,填空材料是一個單句或者是一組索引行。學生在這兩組練習中的表現(xiàn)表明他們在后一組練習中更成功地從記憶中提取詞匯。Cobb(1997)進一步擴展了這一研究。他對比了在線詞匯索引練習與傳統(tǒng)詞匯練習對詞匯習得的影響,一個學期中每周的詞匯測驗結(jié)果表明前者更有效地幫助學習者習得詞匯。Boulton(2008,2010)基于書面語料庫的索引材料,檢驗和討論了數(shù)據(jù)驅(qū)動學習對低水平英語學習者詞匯習得的影響。兩次研究結(jié)果都表明基于語料庫的詞匯索引練習比傳統(tǒng)詞匯練習更有助于詞匯學習。以上研究揭示了把語料庫應用到二語/外語寫作可以提高學習者對語法化詞匯的意識,應用到詞匯學習則可以有助于學習者習得詞匯,從而提高他們寫作中詞匯使用的準確性。
其次,許多研究者都強調(diào)在學習者成功使用語料庫之前需要對他們進行語料庫培訓。比如,Granath(2009)發(fā)現(xiàn)高水平的學習者更能從數(shù)據(jù)驅(qū)動學習方法中受益,但是經(jīng)過充分的培訓,低水平學習者也能像高水平的學習者一樣從語料庫中受益,由此,他得出結(jié)論:為了幫助學習者掌握語料庫使用技巧,教師需要付出很大的努力,同時培訓需要花大量時間。Chang和Sun(2009)在他們的研究中發(fā)現(xiàn)在有老師引導的培訓后學生在改錯任務中表現(xiàn)得更好。Kennedy和 Miceli(2010)則強調(diào)了語料庫培訓過程的復雜性并研究了學習者語料庫使用發(fā)展的過程。為了了解語料庫使用的過程并最終找出有效培訓的方法,他們把語料庫使用過程分為四個步驟,即列出查詢詞、找到檢索方法、解讀檢索結(jié)果、得出結(jié)論。他們認為,解讀檢索詞所在的拓展文本對于學習者而言是最難的,也是導致語料庫使用時出現(xiàn)問題的主要原因。據(jù)此,他們強調(diào)正規(guī)的語料庫培訓需要花費大量的時間和努力。Vannestal和Lindquist(2007)也提到學生在獨立使用語料庫之前有必要花費大量的時間進行反復的操作練習。
最后,語料庫的類型和大小可能會決定數(shù)據(jù)驅(qū)動式學習的效果。語料庫在學術英語寫作中使用的研究表明研究者越來越多地對專業(yè)性的語料庫感興趣,因為這些語料庫與學習者寫作的題材和領域高度相關,更直接地適應了學習者的寫作需求(Lee&Swales,2006;Kennedy&Miceli,2010)。然而,這些專業(yè)性的語料庫由于一些實際的因素并沒有在二語/外語研究或者課堂實踐中廣泛應用(Yoon,2008;Park,2010;Charles,2014)。首先,許多專業(yè)性的語料庫是針對個別學術英語課程或者研究項目編寫的,本身沒有被專業(yè)以外的學習者所使用;其次,大型語料庫的編寫耗時并需要豐富的知識和高超的技巧。所以,現(xiàn)成的一般性語料庫如英語國家語料庫(BNC)、柯林斯COUBUILD語料庫經(jīng)常被應用在不少研究中(比如,Yoon和Hirvela,2004;Yoon,2008;Gilmore,2009)。實際上,隨著互聯(lián)網(wǎng)的高速發(fā)展,出現(xiàn)了更多對使用者界面友好并且操作起來方便的語料庫如美國當代語料庫(COCA),它為普通的學生和老師提供了更好的選擇。
以上的分析首先表明語料庫無論是對于學習者的詞匯習得還是寫作修改都是一種有益的研究或參考工具??紤]到在中國大學基礎英語教學寫作依附于閱讀課程的這一實際情況,本研究擬把語料庫應用到閱讀中詞匯學習部分和寫作修改部分來探索該方法對學生寫作發(fā)展情況的影響。其次,許多研究都是局限于一次性、限時的改錯任務,而且只有語料庫作為學習者唯一的參考工具。結(jié)合上述分析中語料庫培訓中出現(xiàn)的問題,本研究把語料庫培訓融于課堂教學,進行歷時一學年的研究,把在線雙語詞典與COCA結(jié)合起來進行語料庫培訓,并且研究中學生完成的寫作任務不是為研究目的專門設計的,而是實際教學中布置的一系列寫作作業(yè)。
本研究設計了如何把語料庫融入大學基礎英語寫作課堂,主要解決以下問題:
基于COCA的數(shù)據(jù)驅(qū)動式學習方法對學生的寫作質(zhì)量有沒有產(chǎn)生顯著的影響?
基于COCA的數(shù)據(jù)驅(qū)動式學習方法與傳統(tǒng)的學習方法相比,哪種更有助于促進學生的寫作發(fā)展?
受試為某高校大一非英語專業(yè)兩個平行班的學生,來自不同的理工科專業(yè),平均年齡18歲,有至少6年的英語學習經(jīng)歷。最先參與實驗的學生共有116名,其中有15名學生因為沒能準時完成布置的寫作作業(yè)而被剔除,最終參與實驗的人數(shù)101名,兩個班分別是49和52人。參照入學英語分級考試的成績,所有的受試都是中低水平的學習者,并且兩個班的英語分級測試相近,測試結(jié)果沒有顯著性差異(F=.145,p=.532)。筆者隨機選取一個班為實驗組(49人),另外一班為對照組(52人)。兩班由筆者任教并使用相同教材,教學方法相當。所有的受試被告知他們要準時完成所布置的寫作和修改作業(yè),這些表現(xiàn)將被記為平時成績的考核。
3.3.1 寫作測試
本研究在前測與后測中采用同樣的作文題目,即手機對生活帶來的影響。限時30分鐘,字數(shù)不限。
3.3.2 COCA
COCA是由美國Brigham Young University的Mark Davies教授開發(fā)的高達5.2億詞匯的美國最新當代英語語料庫,是當今世界上最大的英語平衡語料庫。它有三大優(yōu)勢:第一,它具備了一個好語料庫的三項最基本條件∶規(guī)模、速度以及詞性標注,并且每年都增加約2000萬詞的新語料;第二,它已收集過去20年(從1990年起)美國境內(nèi)多個領域的語料,涵蓋美國的口語、小說、流行雜志、報紙和學術期刊五大類型的語料;第三,用戶可以免費注冊使用。
3.3.3 雙語詞典
本研究中使用的中英雙語詞典為有道詞典與金山詞霸。首先,它們是兩款基于搜索引擎技術的全能免費語言詞典軟件,都收錄了完整的柯林斯高級英漢雙解詞典,詞庫大而全,查詞快且準;其次,它們都有手機版與桌面版,有自動取詞和劃詞功能,方便用戶使用。
3.3.4 句酷批改網(wǎng)
句酷批改網(wǎng)是由北京詞網(wǎng)科技有限公司開發(fā)的基于語料庫和云計算技術自動在線批改作文系統(tǒng),通過測算學生作文與語料庫建模作文的“距離”遠近來給樣本給作文綜合打分。本研究使用它的主要原因有三個:一是它給出的分數(shù)和人工分一致率可以達92.03%(張金福,2012);二是它逐句點評,指出作文每個句子中的拼寫、搭配、用詞等錯誤,并給出修改意見,學生可以在線多稿修改;三是它自動計算出了每篇作文的長度,類符形符比,提供了衡量寫作流利度和詞匯復雜度的數(shù)據(jù)。
實驗從2015年9月開始到2016年6月結(jié)束,歷時一個學年。實驗過程分成三個階段:實驗前準備階段、實驗階段和實驗后階段。
在實驗前準備階段,即在學期第二周,筆者首先就作文格式如標點符號和空格的使用對學生做簡單說明,因為這些問題會影響計算機對作文的統(tǒng)計分析,導致統(tǒng)計數(shù)據(jù)不準確或統(tǒng)計錯誤;之后,分別對實驗班和對比班進行前測;在接下來的三周,筆者利用課堂時間,分三次(每次2小時)對實驗班進行了語料庫知識的培訓。培訓材料參照汪興富(2008)列出的兩個關于COCA檢索功能的表格,結(jié)合筆者使用COCA的親身經(jīng)歷,提前制定。培訓材料主要包含:COCA主界面不同區(qū)域功能介紹、單詞/短語/句型的檢索、詞性(POS)標簽的使用、同義詞檢索、近義詞比較、詞的搭配檢索。每一個檢索功能的講解都由筆者用實例操作,用投影儀向?qū)W生展示,學生同步用自己的手機、筆記本或ipad當堂練習。
實驗階段分為兩個小階段。第一個階段為第一學期的6到15周,在老師指導下,學生利用COCA進行修改作文的練習。第二個階段在第二學期的2到15周,在沒有老師的指導下,學生課下利用COCA進行修改作文的練習。每個階段都分為兩部分:詞匯學習和作文修改。具體操作流程為:用COCA查詢學習《新視野大學英語讀寫課程》(1、2冊)課文A重點單詞→課后完成與單元話題相關的作文(要求使用所學的重點單詞)→提交到批改網(wǎng)→老師講解重點語言錯誤(參照批改網(wǎng)提供的錯誤分布)→老師課堂示范用COCA改錯,學生課后使用COCA修改剩余錯誤(參照批改網(wǎng)的錯誤報告)→學生把修改稿發(fā)給老師存檔(修改的錯誤要求做出標注)。需要說明的是,老師課堂示范用COCA修改作文這一步驟在第二學期取消。此外,學生在理解中心詞所在的索引行或拓展文本遇到生詞時,要求他們利用在線雙語詞典幫助理解。對于對照組,教學進程和要求同實驗組一樣;不同的是,采用傳統(tǒng)的方法來進行詞匯學習和改錯,不引入語料庫輔助的方法。兩個組在第一學期完成4篇作文,第二學期完成6篇。
實驗后階段在第二學期的最后一周進行,對兩個組進行了后測,題目同前測作文相同。
本實驗屬于定量研究。為了回答兩個研究問題,對在前測與后測中收集的學生作文從流利度、準確度和復雜度三個變量進行了對比。首先,流利度通過計算作文的平均字數(shù)來衡量(Storch,2005),數(shù)據(jù)從批改網(wǎng)上學生作文的體驗報告中獲取。其次,準確度通過計算無錯T單元和T單元數(shù)量之比(EFT/T)以及錯誤率(錯誤總數(shù)/文章長度*100,簡稱E/W*100)來衡量。一個T單元被Larsen-Freeman(2006)定義為“一個帶有從屬句和修飾成分的最小終止單位或者獨立句”。參照這一定義,筆者與課題組成員把學生作文中的T單元做出標注,統(tǒng)計了無錯T單元和所有T單元數(shù)量。錯誤總數(shù)由批改網(wǎng)自動計算出,然后人工剔除了拼寫錯誤。最后,復雜度通過計算詞匯復雜性和語法復雜性衡量。詞匯復雜性取決于類符形符(Larsen-Freeman,2006),相關數(shù)據(jù)也從批改網(wǎng)提供的維度概述中獲取。語法復雜性通過計算每T單元中平均從句數(shù)量來衡量。筆者與課題組成員對學生作文中所有從句做出標注并統(tǒng)計其數(shù)量。
為了檢驗COCA輔助的學習方法對實驗組學生寫作質(zhì)量產(chǎn)生的影響,運用了SPSS17.0對從實驗組作文中獲取的數(shù)據(jù)進行配對樣本T檢驗,結(jié)果如表1所示。統(tǒng)計結(jié)果顯示,在寫作的流利性和準確性方面,學生在前測中的作文與在后測中的作文有著顯著差異。平均字數(shù)增加了31,p值為.000。從這一點可以推測,學生可能在使用COCA學習詞匯和修改作文的過程中擴大了他們的詞匯量,因為普遍認為大的詞匯量有助于學生產(chǎn)出長的作文。另一方面,后測作文中的EFT/T值同前測作文中的數(shù)值相比增加了將近0.2,每100詞中的錯誤數(shù)量從11.1758減少到了7.9296。這兩點表明經(jīng)過一個學年使用COCA進行的詞匯學習和寫作修改活動后,學生能夠?qū)懗龈鄿蚀_的句子,犯更少的語言錯誤。然而,從復雜性的兩個指標來看,COCA輔助的學習方法對學生寫作的發(fā)展沒有產(chǎn)生明顯的影響。
表1 實驗組寫作質(zhì)量配對樣本T檢驗
為了檢驗實驗組和對照組寫作質(zhì)量的差異,對獲取的相關數(shù)據(jù)進行了獨立樣本T檢驗,結(jié)果如表2所示。首先,統(tǒng)計數(shù)字表明,實驗組與對照組在后測作文的流利性方面有著顯著性的差異(p=0.040),而在前測作文的這一指標上則無很大差異(p=0.615)。這一點證明了基于COCA的數(shù)據(jù)驅(qū)動學習方法在提高寫作的流利性方面比傳統(tǒng)的學習方法更有效。其次,在準確性的兩個指標上,兩組在前測作文中的表現(xiàn)沒有顯著差異,但在后測作文中的表現(xiàn)均達到了統(tǒng)計上的顯著差異,EFT/T的p值為0.005,每100詞中的錯誤數(shù)量的p值為0.008。這一結(jié)果表明實驗組使用不同的學習方法后產(chǎn)出了更多準確的句子,更大地減少了寫作中的錯誤。因此,在提高寫作的準確性上,COCA輔助的學習方法同傳統(tǒng)的學習方法相比產(chǎn)生了更積極的影響。最后,關于復雜性兩個指標的統(tǒng)計數(shù)據(jù)顯示實驗組與對照組在前測寫作與后測寫作中的表現(xiàn)均無明顯差異。這一結(jié)果說明,與傳統(tǒng)的學習方法相比,COCA輔助的學習方法在提高寫作的復雜性方面沒有明顯的優(yōu)勢。
表2 實驗組與對照組寫作質(zhì)量獨立樣本T檢驗
研究結(jié)果表明輔助的詞匯學習和寫作修改對學習者寫作發(fā)展的流利性和準確性產(chǎn)生了積極的影響。此外,與傳統(tǒng)的以老師為中心的灌輸式的方法相比,基于COCA的學習方法更有效地提高了學習者寫作的準確性和流利性,但是在提高寫作的復雜性方面沒有明顯的優(yōu)勢。
流利性是衡量學習者寫作能力的一個重要指標。為了進一步探究實驗組與對照組在這一指標統(tǒng)計數(shù)據(jù)上顯著差異的原因,筆者在批改網(wǎng)上分別檢索了兩組后測作文中關于常用詞“make”的搭配,剔除掉“also make”、“l(fā)ater make”之類的搭配后,發(fā)現(xiàn)實驗組使用“make”與名詞搭配的短語31次,對照組則使用了19次。顯然,基于COCA的學習方法提高了學生使用搭配的意識。這證明了Chambers和O’Sullivan(2004)與O’Sullivan和Chambers(2006)的研究結(jié)果,即寫作中使用語料庫有助于學習者注意并學會使用語法化的詞匯。這可能促使在規(guī)定的時間內(nèi)實驗組比對照組寫出更長作文的原因。此外,在與語料庫數(shù)據(jù)的互動中,學習者可能無意識中習得了一些新詞,擴大了詞匯量,一定程度上提高了寫作的流利性。
準確性往往是影響老師評價寫作質(zhì)量的一個重要因素(Canagarajah,2002;Hegelheimer,2006;Yoon,2008)。詞語使用不夠準確和地道是外語學習者在寫作中遇到的一大問題。本研究中,實驗組比對照組在寫作的準確性方面取得了明顯的進步。在使用COCA進行修改寫作的過程中,學生花費了較多的時間找到正確的語言表達并進行改錯,這可能加強了他們對語言錯誤以及正確語言表達的記憶,在后來的寫作中他們很自然地提取了正確的語言表達,避免了犯同樣的錯誤。正如Corder(1981)認為,促使學習者自己去發(fā)現(xiàn)正確的語言表達對他們更為有益。而對照組的學生在寫作中遇到問題時通過查字典或者搜索百度很直接地得到了答案,沒有經(jīng)過仔細的思考。Reynolds和Anderson(2015)在他們的研究中曾說到,被動的學習者很少去回顧修改過的錯誤,而回顧對于內(nèi)化所學到的語言很有必要。因此,他們可能在下次寫作中犯同樣的錯誤。此外,基于COCA的數(shù)據(jù)驅(qū)動式學習方法讓學習者了解并掌握了高頻使用的真實的語言表達,這無疑有助于他們產(chǎn)出更準確、更地道的作文。
復雜性是評估學習者寫作水平的另外一個重要因素。本研究的結(jié)果表明,基于COCA的數(shù)據(jù)驅(qū)動式學習方法對寫作的詞匯復雜性和語法復雜性都沒有產(chǎn)生顯著的影響。究其原因,可能有兩個:首先,學生可能無法掌握所有的語料庫查詢技巧,尤其是對pos標簽的使用無法熟練運用,這一定程度上影響了他們查到更復雜的句式表達。Sabti和Chaichan’s(2014)在他們的研究中陳述到,計算機技能是阻礙計算機技術在語言學習中使用的最大障礙;其次,詞匯和語法知識的產(chǎn)出性使用能力的提高需要花相當長的時間。一學期的語料庫培訓可能不足以讓學生課后獨立地使用語料庫進行學習。
本研究探討了基于COCA的數(shù)據(jù)驅(qū)動式學習方法對中國的英語學習者寫作的流利性、準確性和復雜性發(fā)展的影響。結(jié)果證實了把語料庫應用到詞匯學習和寫作修改中對提高寫作的流利性和準確性產(chǎn)生了積極的影響,而對寫作的復雜性的發(fā)展的影響則沒有達到統(tǒng)計上的顯著效果。此外,語料庫輔助的學習方法比傳統(tǒng)的學習方法更有效地提高了學習者寫作的流利性和準確性。然而,這并不意味著語料庫輔助的學習方法對提高寫作的復雜性沒有一點作用,只是寫作的復雜性的提高需要花相當長的時間。因此,有關語料庫輔助的學習方法對寫作水平特別是復雜性的影響需要進行更多的縱向研究。
最后,需要花費多少時間和努力才能讓學習者獨立的熟練使用語料庫值得進一步探討。本研究中的一個學年顯然不足以幫助學習者成為高超的語料庫使用者,或許,語料庫的使用應該長期融入到英語寫作課堂中,與其它的參考工具如詞典一起幫助學習者提高他們的寫作水平。所以,需要更多的外語研究者與老師通過課堂實踐去探討語料庫與其它參考資源結(jié)合起來對學習者的寫作發(fā)展帶來什么樣的影響。