尹元(山西傳媒學(xué)院基礎(chǔ)部,山西榆次,030619)
?
英語寫作中同伴互評(píng)評(píng)分量表設(shè)計(jì)初探
尹元
(山西傳媒學(xué)院基礎(chǔ)部,山西榆次,030619)
[摘要]按照五個(gè)步驟為英語專業(yè)寫作課堂同伴互評(píng)設(shè)計(jì)評(píng)分量表:制定評(píng)分細(xì)則;設(shè)定量表等級(jí),描述各等級(jí)并賦值;分配權(quán)重;修訂評(píng)分細(xì)則;效驗(yàn)評(píng)分標(biāo)準(zhǔn)。結(jié)果表明,設(shè)計(jì)的三級(jí)二十項(xiàng)分析性評(píng)分量表具有一定有效性和可行性。
[關(guān)鍵詞]同伴互評(píng);課堂評(píng)分標(biāo)準(zhǔn);英語寫作
同伴互評(píng)是過程寫作教學(xué)法的必要環(huán)節(jié)之一,指的是在寫作過程中同伴之間相互審閱,并提出反饋意見的一種教學(xué)活動(dòng)。近年來,同伴互評(píng)因其特有的優(yōu)勢已被廣泛應(yīng)用到英語寫作教學(xué)中。不少研究者探討了同伴互評(píng)在大學(xué)英語寫作中實(shí)施的有效性和可行性。研究表明,同伴互評(píng)能夠提高學(xué)生的自主學(xué)習(xí)能力(Lee,1998)[1],激發(fā)學(xué)生的寫作興趣(張春玲,2008)[2];學(xué)生通過閱讀同伴作文發(fā)現(xiàn)問題的過程,可以幫助他們樹立文本輸出過程中的讀者意識(shí)(Keh,1990)[3];實(shí)施同伴互評(píng)可促使學(xué)生在討論、反思過程中分析問題、解決問題,有利于培養(yǎng)學(xué)生的思辨能力(劉建達(dá),2013)[4]。此外,同伴互評(píng)可以極大地減輕教師批閱作文的工作負(fù)擔(dān)。
在實(shí)施寫作同伴互評(píng)活動(dòng)的過程中,評(píng)分標(biāo)準(zhǔn)是不可或缺的一部分。一方面,作為評(píng)閱者的學(xué)生需要一個(gè)統(tǒng)一的、便于操作的評(píng)分標(biāo)準(zhǔn),以保證評(píng)分過程的客觀公正、有據(jù)可依;另一方面,被評(píng)閱者通過評(píng)分標(biāo)準(zhǔn)及評(píng)分報(bào)告,能清楚地了解自己作文的優(yōu)點(diǎn)和問題,進(jìn)而采取相應(yīng)修正訓(xùn)練,不斷提高寫作水平。然而,目前已有的英語寫作評(píng)分標(biāo)準(zhǔn)是針對(duì)大規(guī)模測試的,不適用于課堂測試。白麗茹(2012)[5]嘗試編制了針對(duì)大學(xué)英語基礎(chǔ)寫作中記敘文和說明文的同伴互評(píng)反饋模式測量評(píng)價(jià)表。本研究設(shè)計(jì)的英語寫作課堂評(píng)分標(biāo)準(zhǔn)為師生提供了清晰完整的教學(xué)反饋信息,且易于理解、便于操作。
Weigle(2002)[6]從信度、結(jié)構(gòu)效度、實(shí)用性、作用和真實(shí)性等方面總結(jié)了整體評(píng)分量表和分析評(píng)分量表的優(yōu)缺點(diǎn)。根據(jù)比較結(jié)果,我們認(rèn)為分析評(píng)分量表能提供較詳細(xì)的診斷信息,更適用于課堂測試。因此,我們?yōu)閷懽魍榛ピu(píng)設(shè)計(jì)了分析性評(píng)分量表,設(shè)計(jì)過程包括五個(gè)步驟:制定評(píng)分細(xì)則;確定量表等級(jí),描述各等級(jí)并賦值;分配權(quán)重;修訂評(píng)分細(xì)則;效驗(yàn)評(píng)分標(biāo)準(zhǔn)。
(一)評(píng)分細(xì)則的制定
在制定評(píng)分量表細(xì)則過程中,我們著重考慮了兩個(gè)方面的因素一是英語專業(yè)寫作教學(xué)大綱(2000)[7]的要求。大綱除對(duì)字?jǐn)?shù)、寫作速度及應(yīng)用文和畢業(yè)論文的要求外,明確說明了英語短文寫作方面的入學(xué)要求(無嚴(yán)重語法錯(cuò)誤,意義表達(dá)清楚)、二級(jí)要求(內(nèi)容切題,條理清楚,語言正確)、四級(jí)要求(內(nèi)容切題,結(jié)構(gòu)嚴(yán)謹(jǐn),條理清楚,語法正確,語言通順,表達(dá)得體)、六級(jí)要求(語言正確,表達(dá)得體,具有一定的思想深度)和八級(jí)要求(內(nèi)容充實(shí),語言通順,用詞恰當(dāng),表達(dá)得體)。由此,我們概括出英語專業(yè)寫作教學(xué)的目標(biāo)是從內(nèi)容、結(jié)構(gòu)、語法和語言等方面來設(shè)定的。二是英語專業(yè)四、八級(jí)作文評(píng)分標(biāo)準(zhǔn)。從評(píng)分標(biāo)準(zhǔn)可以看出,國內(nèi)較為權(quán)威英語測試寫作評(píng)分標(biāo)準(zhǔn)包括:能夠按照題目要求完成內(nèi)容相關(guān)、體裁正確的文章;能夠按照英語語言習(xí)慣合理組織文章;能夠?qū)懗稣Z法正確的句子;能夠根據(jù)寫作目的和目標(biāo)讀者選擇恰當(dāng)?shù)谋磉_(dá);能夠正確使用標(biāo)點(diǎn)符號(hào)、大小寫及拼寫等。綜合考慮,我們提煉出寫作評(píng)分的五條標(biāo)準(zhǔn):內(nèi)容、組織、語言、體裁和機(jī)制。
結(jié)合英語寫作課堂教學(xué)及文章基本構(gòu)成要素,我們從詞匯、語句、段落、篇章、任務(wù)要求、對(duì)讀者的吸引力和寫作格式等方面具體描述了五條標(biāo)準(zhǔn),共25條細(xì)則?;谶@些細(xì)則,我們?cè)O(shè)計(jì)了五分制量表調(diào)查問卷,邀請(qǐng)了17名大學(xué)英語教師參與問卷調(diào)查,要求他們結(jié)合自己的作文評(píng)改經(jīng)驗(yàn),根據(jù)細(xì)則的重要程度進(jìn)行打分。得分相對(duì)低(平均分低于3.00)的細(xì)則被剔除(第3、12、25項(xiàng)),其余22條細(xì)則的描述性統(tǒng)計(jì)見表1。
表1 22條評(píng)分細(xì)則的描述性統(tǒng)計(jì)數(shù)據(jù)(N=17)
(二)評(píng)分細(xì)則等級(jí)的確定
考慮到該評(píng)分量表主要為學(xué)生互評(píng)設(shè)計(jì),而學(xué)生的等級(jí)區(qū)分能力遜于有經(jīng)驗(yàn)的專業(yè)教師,三級(jí)評(píng)分量表更易于學(xué)生把握,因此,每項(xiàng)評(píng)分細(xì)則被劃分為優(yōu)、中、差三個(gè)等級(jí)。在描述評(píng)分細(xì)則時(shí),我們采用了《Classroom Assessment for Student Learning》(R.J. Stiggins, et al.,2004)一書中提到的方法。具體做法如下:從山西省五所高校隨機(jī)選取150名學(xué)生就同一題目(My View on Online Shopping)完成作文,再請(qǐng)兩名有教學(xué)經(jīng)驗(yàn)的英語教師將這些文章按22條細(xì)則粗略分成優(yōu)、中、差三類,并提供每篇文章的歸類依據(jù)。我們將分類依據(jù)整理、合并、修改,形成了21條評(píng)分細(xì)則、三個(gè)不同等級(jí)的描述。
該評(píng)分標(biāo)準(zhǔn)擬用于不同體裁的英語作文評(píng)分。英語作文體裁根據(jù)語篇形式,可以分為記敘文、描寫文、說明文和議論文(Weigle,2002)[6],四種體裁在功能、組織和語言上均有不同,具體差別見表2。在寫作評(píng)分中,我們應(yīng)根據(jù)體裁的不同,調(diào)整評(píng)分細(xì)則。本研究以議論文為例。
表2 四種作文體裁之間的區(qū)別
注:引自Designing Tasks for the Assessment of Writing (Ruth & Murphy,1988)。
(三)權(quán)重
關(guān)于寫作評(píng)分標(biāo)準(zhǔn)的權(quán)重,學(xué)界有不同的觀點(diǎn)。Hamp-Lyons(1991)認(rèn)為,如果同一標(biāo)準(zhǔn)中某一評(píng)分細(xì)則的權(quán)重高于其他評(píng)分細(xì)則,采用整體評(píng)分法更合適。Weigle(2002)[6]認(rèn)為,給寫作評(píng)分細(xì)則分配不同的權(quán)重可能會(huì)給最終得分帶來不利影響,并給基于分?jǐn)?shù)的決策以及數(shù)據(jù)分析帶來問題。另一種較為普遍的觀點(diǎn)認(rèn)為,與形式、規(guī)范等相比,評(píng)判性思考技能(如內(nèi)容)應(yīng)被賦予更大的權(quán)重(Jacobs,et al.,1981)。
作文評(píng)分標(biāo)準(zhǔn)的權(quán)重體現(xiàn)的是各細(xì)則的重要程度。在實(shí)際應(yīng)用中,我們建議教師根據(jù)不同教學(xué)內(nèi)容來確定權(quán)重,這樣最終成績更能體現(xiàn)課堂教學(xué)的實(shí)效。為了方便采集數(shù)據(jù),我們采用的是等值權(quán)重。
(四)評(píng)分細(xì)則的修訂
該評(píng)分量表擬應(yīng)用到同伴互評(píng)中。在最后階段,我們考慮了學(xué)生評(píng)分員使用該量表的感受和建議,隨機(jī)選取了山西某高校10名英語專業(yè)二年級(jí)學(xué)生參與修訂實(shí)驗(yàn)。我們將評(píng)分標(biāo)準(zhǔn)、評(píng)分報(bào)告和一份學(xué)生作文樣本分別發(fā)給10名學(xué)生參與者。在沒有進(jìn)行培訓(xùn)的前提下,要求學(xué)生根據(jù)所給標(biāo)準(zhǔn)對(duì)作文進(jìn)行評(píng)分,并填寫評(píng)分報(bào)告。評(píng)分完成后,要求學(xué)生書面回答:在使用評(píng)分標(biāo)準(zhǔn)過程中是否遇到困難?如有,請(qǐng)說明。根據(jù)學(xué)生的反饋意見,我們對(duì)評(píng)分標(biāo)準(zhǔn)作了如下修改:刪除了“內(nèi)容創(chuàng)新性”這一細(xì)則;“用詞恰當(dāng)”這一細(xì)則表述不夠明確,進(jìn)一步補(bǔ)充了“在特定語境下能從近義詞中做出正確選擇”。
初步成型的評(píng)分標(biāo)準(zhǔn)需要進(jìn)行最終定稿前的試測,以此來判斷該標(biāo)準(zhǔn)是否具有信度和效度。我們主要效驗(yàn)了量表的評(píng)分效度(信度)、效標(biāo)關(guān)聯(lián)效度和結(jié)果效度。
(一)參與者描述
參與效驗(yàn)量表的是山西某高校英語專業(yè)大三的30名學(xué)生,他們已經(jīng)通過英語專業(yè)四級(jí)考試,且在寫作教師指導(dǎo)下進(jìn)行過同伴互評(píng)訓(xùn)練。
(二)評(píng)分員的培訓(xùn)
由于寫作評(píng)分是主觀性評(píng)分,評(píng)分員之間和評(píng)分員內(nèi)部不可避免會(huì)出現(xiàn)不一致。Bachman和Palmer(1996)認(rèn)為,導(dǎo)致這種不一致性的主要原因在于:(1)對(duì)評(píng)分量表的理解不同;(2)對(duì)評(píng)分標(biāo)準(zhǔn)的寬嚴(yán)把握不同;(3)對(duì)評(píng)分標(biāo)準(zhǔn)以外因素的考慮不同。他們提出,解決這個(gè)問題最有效的方式之一是對(duì)評(píng)分員進(jìn)行培訓(xùn)。我們對(duì)評(píng)分員進(jìn)行了兩小時(shí)的培訓(xùn),幫助其理解和熟悉評(píng)分量表。我們?yōu)樵u(píng)分員逐一詳細(xì)解釋了每條細(xì)則的含義,評(píng)分員根據(jù)評(píng)分標(biāo)準(zhǔn)獨(dú)立為同一篇習(xí)作評(píng)分,并按要求給出每條細(xì)則的分?jǐn)?shù)和總分,同時(shí)記錄評(píng)分依據(jù)。若在評(píng)分過程中遇到問題,評(píng)分員可以與教師和同學(xué)討論。學(xué)生評(píng)分完成后,我們給出教師的評(píng)分結(jié)果,并做出相應(yīng)解釋。最后,學(xué)生評(píng)分員和我們共同討論評(píng)分差異。通過培訓(xùn),評(píng)分員進(jìn)一步明確和統(tǒng)一了評(píng)分量表的使用。
(三)數(shù)據(jù)的收集與分析
受試的30名學(xué)生在課后完成我們布置的作文題目(My View on Income Gap),作文樣本收集后,統(tǒng)一編號(hào),但不署名。數(shù)據(jù)的收集過程,具體分為三個(gè)階段。第一步,將評(píng)分量表(附錄1)、評(píng)分報(bào)告(附錄2)和作文樣本隨機(jī)分發(fā)給受試者(要避免學(xué)生拿到自己的作文),每人一份。要求學(xué)生在50分鐘內(nèi)按照評(píng)分量表為作文評(píng)分,并填寫評(píng)分報(bào)告。在評(píng)分過程中,允許學(xué)生互相討論或者請(qǐng)教老師,但不許在原稿上標(biāo)注任何評(píng)論和分?jǐn)?shù)。評(píng)分完成后,與同桌互換作文,再評(píng)一份。這樣,每份作文有兩個(gè)評(píng)分,兩個(gè)成績的平均分為最終學(xué)生評(píng)分。第二步,30份作文樣本分別由兩位英語教師按專業(yè)英語四級(jí)作文評(píng)分標(biāo)準(zhǔn)評(píng)分,兩位教師的平均分為最終教師評(píng)分。第三步,選取其中15名學(xué)生,按專業(yè)四級(jí)考試成績分為三組,每組5名。75分以上為高分組,67-75分為中等成績組,67分以下為低分組。三組學(xué)生按第一步評(píng)分要求為30份作文樣本評(píng)分。所收集的數(shù)據(jù)通過SPSS15.0軟件進(jìn)行處理。
(四)效驗(yàn)結(jié)果與討論
1.描述性統(tǒng)計(jì)。從表3可以看出,作文樣本中修辭平均分最低(0.95),標(biāo)點(diǎn)和大小寫最高(4.9);標(biāo)準(zhǔn)差顯示,各細(xì)則離散趨勢較小,因?yàn)槊織l細(xì)則只有三個(gè)等級(jí),且各等級(jí)間分差較??;偏值和峰值顯示,除主題句、篇題句、修辭和標(biāo)點(diǎn)及大小寫外,其他各項(xiàng)都呈正態(tài)分布。忽略樣本大小的影響,我們認(rèn)為原因在于受試學(xué)生對(duì)主題句、篇題句、標(biāo)點(diǎn)及大小寫掌握較好,對(duì)于修辭的應(yīng)用較差。
表3 評(píng)分細(xì)則的描述性統(tǒng)計(jì)(N=30)
2.內(nèi)部信度,即評(píng)分員內(nèi)部一致性。本研究中,信度是通過計(jì)算阿爾法系數(shù)效驗(yàn)的,表4顯示了高、中、低三組學(xué)生評(píng)分員的相關(guān)性。平均分從低分組評(píng)分員到高分組評(píng)分員逐漸增加,而標(biāo)準(zhǔn)差逐漸降低。三個(gè)學(xué)生評(píng)分組之間的相關(guān)系數(shù)(0.984 8)較高,原因有三方面:一是因?yàn)槿M學(xué)生均通過了專業(yè)英語四級(jí)考試,英語水平相差不大,由自身語言能力對(duì)評(píng)分造成的影響不大;二是由于評(píng)分前進(jìn)行了認(rèn)真、充分的培訓(xùn),一定程度上減小了評(píng)分誤差;三是說明所設(shè)計(jì)的評(píng)分量表細(xì)則表述詳盡,有效減少了學(xué)生評(píng)分員在理解量表時(shí)的不一致。
表4 不同水平學(xué)生評(píng)分的相關(guān)性(N=30)
3.效標(biāo)關(guān)聯(lián)效度。效標(biāo)關(guān)聯(lián)效度是指測驗(yàn)分?jǐn)?shù)與某一外部效標(biāo)間的一致性程度,即測驗(yàn)結(jié)果能夠代表或預(yù)測效標(biāo)行為的有效性和準(zhǔn)確性程度(Bachman & Palmer,1996)。本研究中,我們檢測的是所設(shè)計(jì)的評(píng)分量表與專業(yè)四級(jí)評(píng)分標(biāo)準(zhǔn)之間的一致程度。使用SPSS15.0計(jì)算教師評(píng)分和學(xué)生評(píng)分的斯皮爾曼相關(guān)系數(shù)(見表5),其中,教師使用的是英語專業(yè)四級(jí)作文評(píng)分標(biāo)準(zhǔn),學(xué)生使用本研究設(shè)計(jì)的評(píng)分量表。效驗(yàn)結(jié)果表明,相關(guān)系數(shù)為0.767(p<0.01),相關(guān)度較高。這表明,兩個(gè)評(píng)分標(biāo)準(zhǔn)所測量的內(nèi)部特質(zhì)基本一致,兩者具有較高的效標(biāo)關(guān)聯(lián)效度。
4.后果效度。后果效度用以度量測試對(duì)于社會(huì)、學(xué)校和個(gè)人的作用及影響。本研究中,我們與參與實(shí)驗(yàn)的兩位教師和六名同學(xué)進(jìn)行了訪談。教師們認(rèn)為,使用新的評(píng)分量表后,學(xué)生評(píng)分過程更加順利;通過閱讀評(píng)分報(bào)告單,他們能夠明確學(xué)生寫作中存在的問題;詳細(xì)的評(píng)分報(bào)告有助于為下一步教學(xué)提供診斷信息;學(xué)生的評(píng)分態(tài)度和責(zé)任心會(huì)影響評(píng)分結(jié)果。學(xué)生們普遍認(rèn)為,使用評(píng)分量表參與評(píng)分過程使他們進(jìn)一步明確了寫作要求,發(fā)現(xiàn)同伴寫作存在問題的同時(shí),對(duì)照檢查自己是否存在同樣問題;通過對(duì)照量表,和老師及同學(xué)討論解決問題,思路更清晰,印象更深。
表5 教師評(píng)分和學(xué)生評(píng)分的相關(guān)性
從效驗(yàn)結(jié)果可以看出,不同英語水平的學(xué)生使用該量表評(píng)分并未出現(xiàn)較大不一致,即內(nèi)部信度較高。師生評(píng)分的相關(guān)系數(shù)較高,表明研究設(shè)計(jì)的寫作評(píng)分量表與英語專業(yè)四級(jí)寫作評(píng)分標(biāo)準(zhǔn)所測的寫作特質(zhì)基本一致。訪談結(jié)果進(jìn)一步說明,使用新評(píng)分量表的同伴互評(píng)可以產(chǎn)生積極的后效。總之,新設(shè)計(jì)的評(píng)分標(biāo)準(zhǔn)在一定程度上是有效可信的。
新評(píng)分標(biāo)準(zhǔn)對(duì)英語寫作教學(xué)和測試改革有重要意義。首先,它能為師生提供更完整詳實(shí)的反饋信息,有助于學(xué)生了解自己寫作的長處和問題,教師可利用獲得的反饋有針對(duì)性施教。其次,它能提高學(xué)生寫作互評(píng)的能力,使課堂寫作互評(píng)成為可能,既減輕教師評(píng)改負(fù)擔(dān),又使學(xué)生成為課堂活動(dòng)的中心,從而提高英語課堂寫作教學(xué)和評(píng)價(jià)的效率。盡管設(shè)計(jì)力求考慮周密,但本研究仍是探索性的,有必要對(duì)不同實(shí)驗(yàn)對(duì)象進(jìn)一步進(jìn)行大樣本的實(shí)證研究,從而避免對(duì)研究結(jié)果的誤用。
[參考文獻(xiàn)]
[1]I.Lee.Supporting greater autonomy in language teaching[J].ELT Journal,1998(4):282-289.
[2]張春玲.在英語教學(xué)中開展同伴互評(píng)的探索性研究[J].首都經(jīng)濟(jì)貿(mào)易大學(xué)學(xué)報(bào),2008(2):126-128.
[3]C.L.Keh.Feedback in the Writing Process:a Model and Methods for Implementation[J].ELT Journal,1990(44):294-304.
[4]劉建達(dá).創(chuàng)新英語專業(yè)測評(píng)體系,引領(lǐng)學(xué)生思辨能力發(fā)展[J].中國外語,2013(1): 4-9.
[5]白麗茹.大學(xué)英語寫作中同伴互評(píng)反饋模式測量評(píng)價(jià)表的編制[J].現(xiàn)代外語,2012(2): 184-192.
[6]Weigle,S.C.Assessing Writing[M].Cambridge:Cambridge University Press,2002:95-142.
[7]高等學(xué)校外語專業(yè)教學(xué)指導(dǎo)委員會(huì)英語組.高等學(xué)校英語專業(yè)英語教學(xué)大綱[Z].北京:外語教學(xué)與研究出版社,2000:8-11.
[責(zé)任編輯:康光磊]
The Design of a Rating Scale for Peer Assessment in EFL Writing Classroom
YIN Yuan
(Department of Basic Courses, Communication Universityof Shanxi, Yuci 030619, China)
Key Words:peer assessment; rating criteria in classroom; EFL writing
Abstract:This paper intends to design a rating scale for peer assessment in EFL writing classroom. It’s was developed through five phases: formulating the detailed rating rules of writing; setting the number of rates, describing their performance standards and assigning a numerical value; assigning the weight properly; making the revision; making the validation. The research shows that the three-level analytic rating scale that including twenty items is reliable and practical to some extent.
[中圖分類號(hào)]G642
[文獻(xiàn)標(biāo)識(shí)碼]A
[文章編號(hào)]2095-106X(2016)01-0062-04
DOI編碼:10.13782/j.cnki. 2095-106X.2016.01.014
[收稿日期]2016-01-20
[基金項(xiàng)目]山西省軟科學(xué)研究項(xiàng)目“通識(shí)教育理念下英語專業(yè)綜合英語教材處理研究”(507)
[作者簡介]尹元(1985-),女,山西原平人,山西傳媒學(xué)院基礎(chǔ)部教師,主要研究方向是應(yīng)用語言學(xué)及語言測試。
統(tǒng)計(jì)學(xué)報(bào)2016年1期