葉俊++陳佑林
【摘要】反撥效應(yīng)是語言測試研究中一個不可或缺的部分。本研究針對武漢理工大學(xué)2013級進行大學(xué)英語學(xué)習(xí)的105名非英語專業(yè)學(xué)生展開,綜合定性分析和定量分析的研究方法探究成就測試對學(xué)生自主學(xué)習(xí)動機和學(xué)習(xí)效果的影響。結(jié)果表明,成就測試對學(xué)生的自主學(xué)習(xí)反撥效應(yīng)趨于正面。
【關(guān)鍵詞】成就測試 反撥作用 自主學(xué)習(xí)
一、理論背景
學(xué)校教育的目的,不僅是傳授知識,更應(yīng)是“授人以漁”,培養(yǎng)學(xué)生獨立思考、自我管理的能力,因此,培養(yǎng)大學(xué)生自主學(xué)習(xí)能力應(yīng)是高等教育的重要目標(biāo)。語言測試除了有檢查學(xué)業(yè)的功能以外,還能反過來影響教與學(xué),這就是測試的反撥作用(backwash)。本文旨在探討成就測試是否對大學(xué)英語課外自主學(xué)習(xí)存在反撥作用。
成就測試的目的是檢查學(xué)生在某一課程中的學(xué)習(xí)進展。成就測試在大學(xué)英語教學(xué)過程中非常普遍,教師參與設(shè)計和命題的期中測試和期末測試都屬于這個類型。成就測試首要的功能是學(xué)業(yè)檢查功能,因為它是基于教學(xué)大綱內(nèi)容上的測試,能夠檢驗教學(xué)目標(biāo)是否實現(xiàn)。然而,語言測試還能反過來影響教學(xué),教育界把這種影響稱為反撥效應(yīng)(backwash或washback)。這種反撥效應(yīng)可能是正面的,也可能是負(fù)面的。
對反撥效應(yīng)進行大量而深入的研究是近二十幾年的事。楊惠中、詩桂春指出“從語言測試發(fā)展的歷史看,語言測試工作者的研究重點逐步從提高測試信度和改進測試效度發(fā)展到關(guān)注測試的后效(2007)。”美國著名語言測試專家 Bachman & Palmer也認(rèn)為,設(shè)計一個考試首要考慮的問題,是考試結(jié)果的使用對涉考者(stakeholders)會產(chǎn)生怎樣的影響和后果,怎樣才能使他們從中受益(2010)??梢姡磽苄?yīng)在測試領(lǐng)域受到高度重視。對語言測試的種種探討為相應(yīng)的實證研究奠定了理論基礎(chǔ),而國外的實證研究一定程度拓寬了反撥效應(yīng)研究的領(lǐng)域,可以幫助我們從更廣泛的視角考察教學(xué)和測試以及測試和其他變量之間的關(guān)系,但總的來說,研究數(shù)量和質(zhì)量還比較有限。張建珍(2012)通過對我國9種主要外語期刊的統(tǒng)計分析,回顧了我國學(xué)者對語言測試反撥作用的研究,發(fā)現(xiàn)近十幾年刊登在我國9種主要外語類期刊的反撥效應(yīng)研究的文章數(shù)量相當(dāng)?shù)厣?。我國英語語言測試反撥效應(yīng)研究發(fā)展非常緩慢。
作為工作在教學(xué)一線的大學(xué)英語教師,筆者開展了學(xué)期末成就測試對大學(xué)英語課外自主學(xué)習(xí)反撥作用的實證研究,試圖站在考試主體,即學(xué)生的視角看待測試的反撥作用,也是從實踐的角度出發(fā)挖掘成就測試所能發(fā)揮的更大作用。該實驗設(shè)計原因有:1.成就測試作為檢測學(xué)生一個學(xué)期學(xué)習(xí)成果的檢查,受到老師和學(xué)生的高度重視。命題工作在考試前兩個月展開,命題完成后由相關(guān)教師進行審核、修訂。題型仿照四級標(biāo)準(zhǔn),結(jié)合該學(xué)期學(xué)習(xí)內(nèi)容,根據(jù)考生的程度作相應(yīng)調(diào)整,較好地確保了測試的效度。全校性的大規(guī)??荚?,由教務(wù)處統(tǒng)一安排考場,英語教師監(jiān)考,有效保證了施測過程的公平性。最后由大英教師集體人工閱卷,輔以機器閱卷,更是進一步確保了考試分?jǐn)?shù)的信度。因此,期末測試可以客觀、真實地反應(yīng)學(xué)生階段性的英語水平。2.盡管從命題到施測,再到閱卷,都嚴(yán)格把關(guān),分?jǐn)?shù)也能夠代表學(xué)生的真實狀況,但是學(xué)期結(jié)束后,學(xué)生從網(wǎng)上教務(wù)系統(tǒng)中所得到的只是一個簡單的數(shù)字,即卷面原始分。從這個兩位數(shù)的分?jǐn)?shù)中,他們無法了解自己單項大題的得分,無法得知自己英語的聽力、閱讀和寫作水平的相對高低,更無法從一個孤立的分?jǐn)?shù)中了解自己在全班、全年級的排名水平。在考試后的第二個學(xué)期,一切從零開始,學(xué)生依然缺乏對自身英語水平的全面客觀的了解。這無疑浪費了期末測試的重要成果,學(xué)生也缺乏制定自己英語學(xué)習(xí)的依據(jù),無視了測試成績對學(xué)生可能發(fā)揮的正面反撥作用。
二、研究問題
本研究擬回答以下問題:
成就測試是否會對大學(xué)英語課外自主學(xué)習(xí)產(chǎn)生正面反撥作用?成就測試的分?jǐn)?shù)解釋與報道的方法對反撥作用大小的影響。
三、研究方法
1.被試。2016級武漢理工大學(xué)本科生通過新生英語入學(xué)測試后按照測試成績由自然班重新分配成快班和慢班,所有快班均為平行班,被試是從快班中隨機挑選的3個平行班,挑選快班是因為學(xué)生成績較好,自我約束和自我評價能力較強,受到變量帶來的影響會更大。學(xué)生共105人,其中男生57名,女生48名,年齡18-20歲,生源多為本省,也有來自全國其他地區(qū)。
2.工具。自主學(xué)習(xí)能力調(diào)查采用以徐錦芬(2004)編制的自主學(xué)習(xí)調(diào)查問卷為框架,參照Figura&Jarvis(2007)編制的“自主學(xué)習(xí)與策略調(diào)查問卷”改編而成的問卷調(diào)查。在問卷調(diào)查實施前,筆者對問卷文本進行逐項審核以檢查內(nèi)容,然后根據(jù)結(jié)果對問卷調(diào)查進行了修訂。最終,問卷調(diào)查由四個維度組成,共25個題項,其中,學(xué)習(xí)目標(biāo)的確立與學(xué)習(xí)計劃的制定情況(1-4),學(xué)習(xí)策略使用(5-9),對策略使用的監(jiān)控情況(10-16),對英語學(xué)習(xí)過程的監(jiān)控與評估情況(17-25),采用里克特量表計分,從“5=完全同意”到“1=完全不同意”五個等級,得分越高,自主學(xué)習(xí)能力越強。
3.數(shù)據(jù)收集。2017年2月學(xué)期開始后,發(fā)放上學(xué)期英語成績單,由于是全校統(tǒng)考,命題規(guī)范合理,監(jiān)考嚴(yán)格把關(guān),因此考試結(jié)果公正??紤]到原始分報道的諸多弊端,成績單采用標(biāo)準(zhǔn)差的報道形式,報道項目不僅有總分,也涵蓋了聽力、閱讀、寫作等單項成績,由英語任課老師解釋成績單的組成及標(biāo)準(zhǔn)差分?jǐn)?shù)所代表的意義,幫助同學(xué)了解自己的英語單項和總分在總體學(xué)生中的水平,明確努力方向。6月學(xué)期末結(jié)束前發(fā)放問卷調(diào)查,了解本學(xué)期學(xué)生的自主學(xué)習(xí)情況。
四、調(diào)查結(jié)果與分析
1.成就測試對大學(xué)生英語自主學(xué)習(xí)的反撥效應(yīng)。問卷共4個維度,以了解學(xué)生自主學(xué)習(xí)的情況,調(diào)查數(shù)據(jù)如圖1,分析結(jié)果如下:
(1)信度檢驗。問卷的信度(reliability)是指測量數(shù)據(jù)和結(jié)論的可靠性和一致性程度。正常的問卷測評,其信度系數(shù)因該高于0.7且一般低于0.95。本文采用Cronbach α系數(shù)(同質(zhì)性信度)進行信度檢驗。Devellis提出,Cronbach α值在0.8 至0.9 之間的信度是非常好的。本輪測試中=0.877,信度非常好,得出問卷的題目設(shè)計和問卷的結(jié)果數(shù)據(jù)都沒有問題,說明他們內(nèi)部各自的可靠性還比較理想。endprint
(2)描述性分析。對數(shù)據(jù)進行集中趨勢、離散程度和分布形態(tài)的描述性統(tǒng)計刻畫得出:總體影響度為4.788,說明學(xué)生普遍認(rèn)為對語言測試結(jié)果的充分了解對自主學(xué)習(xí)能力的影響是較大的。其中,對學(xué)習(xí)計劃制定的影響最大,因為測試各分項所得分?jǐn)?shù)能幫助學(xué)生了解自己的強項和弱項,因此在制定學(xué)習(xí)計劃時更能有的放矢,加強弱項訓(xùn)練,保持強項優(yōu)勢。而對過程監(jiān)控與評估的影響相對較小,這是因為制定的計劃是否真正落實到學(xué)習(xí)行動還受到個人的自制力和意志力的影響,因此,測試結(jié)果對過程監(jiān)控與評估的影響是有限的。
圖1
2.成就測試的分?jǐn)?shù)解釋與報道的方法探索。傳統(tǒng)大規(guī)模標(biāo)準(zhǔn)化考試的分?jǐn)?shù)通常以原始分的形式報道,即閱卷教師根據(jù)評分說明與標(biāo)準(zhǔn)答案,對其作答直接評出的分?jǐn)?shù)。它是一種絕對分?jǐn)?shù),反映了考生在本次考試中答對題目的個數(shù),或作答正確的程度。原始分是未經(jīng)過任何處理或轉(zhuǎn)換的分?jǐn)?shù),是考生在一份試卷中所得的卷面分?jǐn)?shù)。它從通過率方面較好地反映了考生水平,但確也存在不少局限性,歸納起來主要有四點。第一,原始分的位置含義不明確。原始分的實質(zhì)是答對率。例如,一份試卷的滿分是100分,得到75分就意味著答對75%,單從這個分?jǐn)?shù)既不能知道成績的優(yōu)劣,也不能知道優(yōu)劣的程度,因為沒有一個穩(wěn)定的參照點。如果全體考生的平均分為90分,則75分就是一個較低的分?jǐn)?shù); 如果平均分為60分,則75分又是一個較高的分?jǐn)?shù)。原始分?jǐn)?shù)很難準(zhǔn)確地說明分?jǐn)?shù)所反映水平的高低,以及分?jǐn)?shù)在這個群體中所處的位置。第二,原始分?jǐn)?shù)不穩(wěn)定和不可比。原始分往往受到試題難度和區(qū)分度大小的影響。試題難了,原始分就低。第三,原始分不具有簡單可加性。不同科目的原始分,就像體育競賽中十項全能的各項成績一樣不能直接相加。這是因為各項原始成績的標(biāo)準(zhǔn)不同、內(nèi)容不同,所反映的意義也不同。原始分的這些局限性,限制了考試作用的發(fā)揮。因此,在發(fā)放給學(xué)生的新生入學(xué)考試成績單中,摒棄了以往原始分的成績報道形式,改用了標(biāo)準(zhǔn)差的方式報道成績。
為了標(biāo)準(zhǔn)分報道的可行性,在調(diào)查學(xué)生自主學(xué)習(xí)情況的同時也詢問了他們對兩種分?jǐn)?shù)報道方法的想法,用來了解考生對待不同分?jǐn)?shù)報道方式的態(tài)度差異,具體結(jié)果如圖2:
通過考生對原始分報道和對標(biāo)準(zhǔn)分報道態(tài)度結(jié)果進行配對樣本T檢驗結(jié)果顯示,學(xué)生對于兩種分?jǐn)?shù)報道方式有顯著差異(t=-2.276,df=9,p<0.05),學(xué)生明顯傾向于以標(biāo)準(zhǔn)分或以標(biāo)準(zhǔn)分輔助原始分報道測試成績。
在接受調(diào)查的105名學(xué)生中,50%的學(xué)生在選項“我覺得成績報告單中各單項成績足夠說明自己各單項水平”中選擇“完全不同意”、“基本不同意”或“不了解”,說明原始分報道是存在問題的,考生面對各題得分,往往無法正確認(rèn)識和了解自己各方面英語能力的強弱情況,而在學(xué)習(xí)中存在盲目下功夫的現(xiàn)象。80%的學(xué)生在選項“我覺得英語考試可以采取原始分輔以標(biāo)準(zhǔn)分的形式來報道”中選擇了“完全同意”或“基本同意”,說明學(xué)生有強烈希望考試主辦方出示比單純原始分報道更有效的形式來說明他們的測試具體情況。數(shù)據(jù)充分說明,傳統(tǒng)的分?jǐn)?shù)報道形式已經(jīng)不能滿足考生的需要,而可以考慮提供更詳實的信息幫助他們客觀認(rèn)識自己的能力水平,更好地發(fā)揮測試的反撥作用。
五、結(jié)語
總之,語言測試和教學(xué)相輔相成,語言測試服務(wù)于外語教學(xué),既是獲取教學(xué)反饋信息的主要來源和改進教學(xué)工作的重要依據(jù),也是促進大學(xué)生英語自主學(xué)習(xí)的重要手段,幫助學(xué)生自我反思、自我評價,發(fā)現(xiàn)學(xué)習(xí)過程中的問題,即使采取補救措施,調(diào)整學(xué)習(xí)方法與方向,幫助學(xué)生培養(yǎng)良好的學(xué)習(xí)習(xí)慣,實現(xiàn)教學(xué)和諧發(fā)展。因此,成就測試作為大學(xué)英語階段性測試,是教學(xué)工作中必不可少而且極其重要的環(huán)節(jié),值得繼續(xù)研究,不斷探索。
參考文獻:
[1]鄒申.語言測試[M].上海:上海外語教育出版社,2005:26-28.
[2]楊惠中,桂詩春.語言測試的社會學(xué)思考[J].現(xiàn)代外語,2007 (4):368-373.
[3]Bachman,L.&A.S.Palmer.Language Assessment in the Real World:Developing Language Tests and Justifying Their Use.[M]Oxford:Oxford University Press.2010.
[4]張建珍.國內(nèi)英語語言測試反撥效應(yīng)研究回顧與展望[J].外語測試與教學(xué),2012(3):27-33.
[5]徐錦芬,彭仁忠,吳衛(wèi)平.非英語專業(yè)大學(xué)生自主性英語學(xué)習(xí)能力調(diào)查與分析[J].外語教學(xué)與研究,2004,(1):64-68.
[6]Klaudia Figura,Huw Jarvis,Computer-based materials_ A study of learner autonomy and strategies.System,2007,35(4):448-468.
【基金項目】本文為武漢理工大學(xué)校級教改項目“成就測試對大學(xué)生英語自主學(xué)習(xí)的正面反撥作用”(項目編號:2013102)的研究成果。
作者簡介:
葉俊,華中師范大學(xué)語言研究所,博士在讀,武漢理工大學(xué)外國語學(xué)院,講師,研究方向:應(yīng)用語言學(xué),語言測試。
陳佑林,華中師范大學(xué)語言研究所,教授,博士生導(dǎo)師,研究方向:應(yīng)用語言學(xué),語言測試。endprint