劉雪英
[摘要]多項(xiàng)選擇是一項(xiàng)廣泛使用的測(cè)試手段,常見(jiàn)于各類英語(yǔ)語(yǔ)言考試當(dāng)中。本文通過(guò)分析多項(xiàng)選擇測(cè)試的特點(diǎn),探討在英語(yǔ)寫作課程開始時(shí),多項(xiàng)選擇測(cè)試作為一種用來(lái)測(cè)試學(xué)習(xí)者語(yǔ)法知識(shí)掌握情況的手段,并論述了多項(xiàng)選擇測(cè)試各方面的信度與效度,以此來(lái)評(píng)估該測(cè)試手段對(duì)英語(yǔ)寫作課程的作用與局限性。
[關(guān)鍵詞]多項(xiàng)選擇 測(cè)試 信度 效度
一、多項(xiàng)選擇測(cè)試的特點(diǎn)
多項(xiàng)選擇是一項(xiàng)廣泛使用的測(cè)試手段。根據(jù)杰納西(1996)的觀點(diǎn),多項(xiàng)選擇是一種封閉測(cè)試,不需要應(yīng)試者給出反應(yīng)。布朗(2004)認(rèn)為多項(xiàng)選擇是一種接受性和選擇性的手段,而且評(píng)判時(shí)按照客觀標(biāo)準(zhǔn)進(jìn)行,不涉及閱卷者的主觀態(tài)度。此外,多項(xiàng)選擇構(gòu)成緊湊,非常適合初學(xué)者。因此多項(xiàng)選擇通常不用來(lái)測(cè)試口語(yǔ)和寫作能力,而是用于測(cè)試獨(dú)立的語(yǔ)法知識(shí)和詞匯量(普爾普拉,2004)。
多項(xiàng)選擇因其極高的信度而享有盛譽(yù),因?yàn)閼?yīng)試者與閱卷者都不會(huì)受到主觀因素的影響,評(píng)卷也十分省時(shí)省力迅速便捷。然而設(shè)計(jì)多項(xiàng)選擇題目卻要花費(fèi)許多時(shí)間力氣和專業(yè)知識(shí),而且在設(shè)計(jì)過(guò)程中會(huì)出現(xiàn)這樣那樣的漏洞,比如沒(méi)有正確選項(xiàng),或者在題干中出現(xiàn)線索(修斯,2003)。有時(shí)要為一篇用來(lái)測(cè)試速讀技巧的文章設(shè)計(jì)足夠數(shù)目質(zhì)量滿意的多項(xiàng)選擇題目是非常困難和耗時(shí)的(威爾,1990)。威爾認(rèn)為多項(xiàng)選擇測(cè)試語(yǔ)言的某個(gè)非常具體的方面因而缺乏開放式的格式。測(cè)試設(shè)計(jì)者的意圖非常明顯,就是要避免參試者的主觀性和疑慮。
威爾同時(shí)指出多項(xiàng)選擇的一些弊端,其一是應(yīng)試者的答案并不能反映題目選項(xiàng)中可能挫折的錯(cuò)誤:其二是不能確定應(yīng)試者是否具備選擇正確答案應(yīng)具備的知識(shí)或技能。因此有可能出現(xiàn)猜測(cè)的行為,以至于影響到該測(cè)試的效度。此外,多項(xiàng)選擇不能反映應(yīng)試者應(yīng)對(duì)真實(shí)環(huán)境下的應(yīng)對(duì)技巧。修斯(2003)指出,多項(xiàng)選擇可能會(huì)促進(jìn)考場(chǎng)作弊行為,因?yàn)榇鸢缚梢酝ㄟ^(guò)非語(yǔ)言交流方式來(lái)傳遞。
布朗(2004)對(duì)診斷性測(cè)試的定義是為診斷學(xué)習(xí)者對(duì)語(yǔ)言知識(shí)某一特定方面的掌握情況而設(shè)計(jì)的測(cè)試,該類測(cè)試以兩種方式著眼未來(lái)。首先,幫助學(xué)習(xí)者意識(shí)到他們的錯(cuò)誤和需要努力之處;其次,幫助教師確定將來(lái)的教學(xué)活動(dòng)中著重于語(yǔ)言的哪些方面。修斯(1989)也表明同樣的觀點(diǎn),即診斷性測(cè)試檢測(cè)學(xué)習(xí)者在語(yǔ)言知識(shí)方面的強(qiáng)弱項(xiàng)并且明確在將來(lái)的學(xué)習(xí)中要學(xué)習(xí)什么,因此對(duì)于未來(lái)的教學(xué)具有重要意義:因此通常在課程開始期間按照課程設(shè)計(jì)進(jìn)行診斷性測(cè)試。
二、多項(xiàng)選擇測(cè)試在英語(yǔ)寫作課程初期的適用情況
多項(xiàng)選擇測(cè)試用來(lái)診斷學(xué)習(xí)者在英語(yǔ)寫作課初期對(duì)于語(yǔ)法知識(shí)的掌握情況,可以用來(lái)精確地測(cè)試學(xué)習(xí)者從構(gòu)詞法知識(shí)到詞序等方面語(yǔ)法知識(shí)的掌握情況。以下是一些范例。
例1、用來(lái)測(cè)試形態(tài)詞法知識(shí)
There has been a great increase in retail sales____?
A.does there B.isn't there C.hasn't there D.isn'tit(答案:C)
該題目測(cè)試反義疑問(wèn)句,即句法準(zhǔn)確性。四個(gè)選項(xiàng)中即有否定形式也有肯定形式,帶有不同的助動(dòng)詞。該題目的目標(biāo)是測(cè)試學(xué)習(xí)者是否掌握了反義疑問(wèn)句的構(gòu)成,是否能夠準(zhǔn)確使用助動(dòng)詞和否定。
例2、用來(lái)測(cè)試句法
These people once had fame and fortune,now is left to them isutter poverty。
A.all that B.all what C.all which D.thatall(答案:A)
該題目用來(lái)測(cè)試學(xué)習(xí)者是否掌握了引導(dǎo)詞“that+all”用來(lái)引導(dǎo)主語(yǔ)從句。
通過(guò)上述諸例可以看出,多項(xiàng)選擇測(cè)試可以準(zhǔn)確地診斷學(xué)生對(duì)于語(yǔ)法知識(shí)點(diǎn)的掌握情況。教師可以看出學(xué)習(xí)者掌握語(yǔ)法點(diǎn)的情況并且可以據(jù)此做出判斷,來(lái)確定將來(lái)的教學(xué)活動(dòng)中應(yīng)該做什么。教師也可以為將來(lái)的寫作課程設(shè)計(jì)多項(xiàng)選擇題目。例如,該寫作課程如果涉及旅游交流和廣告應(yīng)用的話,常用的語(yǔ)法點(diǎn)知識(shí)寶庫(kù)一般現(xiàn)在時(shí),現(xiàn)在進(jìn)行體,描述與比喻性的語(yǔ)言,文體風(fēng)格和語(yǔ)域知識(shí)等等。教師一旦確定教學(xué)目標(biāo),就可以著手涉及機(jī)關(guān)的多項(xiàng)選擇題目。根據(jù)該多項(xiàng)選擇測(cè)試的結(jié)果,教師就可以對(duì)學(xué)習(xí)者的相關(guān)語(yǔ)法知識(shí)水平有一個(gè)總體的了解。教師可以對(duì)相關(guān)語(yǔ)法點(diǎn)的正確使用進(jìn)行強(qiáng)化,糾正錯(cuò)誤,或者給予明確的解釋說(shuō)明。然后教師可以布置作業(yè)以鞏固上述語(yǔ)法知識(shí)。
然而,多項(xiàng)選擇測(cè)試并不能完全為將來(lái)的教學(xué)提供所有的基礎(chǔ)。比如,多項(xiàng)選擇測(cè)試可以揭示學(xué)習(xí)者對(duì)哪些語(yǔ)法點(diǎn)掌握與否,但是卻不能描述學(xué)習(xí)者對(duì)該語(yǔ)法點(diǎn)知識(shí)的使用情況。多項(xiàng)選擇測(cè)試只能用來(lái)辨識(shí)錯(cuò)誤和評(píng)估對(duì)語(yǔ)法知識(shí)的認(rèn)知情況,然而在知識(shí)與實(shí)際運(yùn)用之間是有差距的。此外,多項(xiàng)選擇測(cè)試不僅與實(shí)際使用的語(yǔ)言有出入,而且是脫離實(shí)際語(yǔ)境的。大多數(shù)多項(xiàng)選擇題目與現(xiàn)實(shí)生活脫節(jié),干擾項(xiàng)可能在實(shí)際上從來(lái)不會(huì)發(fā)生,并且實(shí)際上會(huì)有不止一個(gè)正確答案。考慮到上述兩點(diǎn),多項(xiàng)選擇測(cè)試并不能幫助教師來(lái)確定將來(lái)寫作課程的發(fā)展。
三、多項(xiàng)選擇測(cè)試的作用與局限性
多項(xiàng)選擇測(cè)試對(duì)于學(xué)習(xí)者英語(yǔ)語(yǔ)法知識(shí)掌握情況的評(píng)估可以從以下方面進(jìn)行。
1、實(shí)用性
根據(jù)杰納西(1996)和布朗(2004)的觀點(diǎn),此類多項(xiàng)選擇測(cè)試的實(shí)用性比較高,因?yàn)樗鷥r(jià)低廉,有充足的時(shí)間和空間進(jìn)行此類測(cè)試,管理比較方便,不需要額外的設(shè)備設(shè)施來(lái)進(jìn)行此類測(cè)試,因此降低了成本,并且閱卷程序比較便捷省時(shí)。該類測(cè)試可以在某個(gè)或某些特定的學(xué)習(xí)者群體內(nèi)進(jìn)行,不需要大規(guī)模的管理,因此比較省時(shí)和節(jié)省物力與資源。
2、信度
在評(píng)分方面多項(xiàng)選擇測(cè)試享有較高的信度。一方面,每—個(gè)題目都有標(biāo)準(zhǔn)答案,閱卷者甚至不需要專業(yè)知識(shí)或進(jìn)行判斷。評(píng)判內(nèi)與評(píng)判間信度都不會(huì)受到主觀因素的影響。而諸如測(cè)試長(zhǎng)度、環(huán)境影響等因素可以通過(guò)教師和管理安排來(lái)避免。然而,有可能因?yàn)椴荒苷业阶銐虻母蓴_項(xiàng)或情景內(nèi)容而使受測(cè)項(xiàng)目不能充分得到測(cè)試,因此多項(xiàng)選擇在一定情況下的信度是受到影響的,因而使用場(chǎng)合是受到限制的。另一方面,如果設(shè)計(jì)該多項(xiàng)選擇的教師沒(méi)有很好的設(shè)計(jì)該題目,那么信度也會(huì)受到影響。不過(guò)這一點(diǎn)可以通過(guò)使用同一階段同一課程先前使用過(guò)的多項(xiàng)選擇題目來(lái)避免。對(duì)于學(xué)習(xí)者而言,信度可能會(huì)因?yàn)樵摐y(cè)試是在課程開始時(shí)進(jìn)行,而學(xué)習(xí)者有可能因?yàn)樵诜偶僦笸浟嗽S多知識(shí)點(diǎn)。同時(shí),學(xué)習(xí)者有可能在有限的時(shí)間下經(jīng)過(guò)測(cè)試而感覺(jué)緊張。應(yīng)試表現(xiàn)有可能在不同時(shí)間段出現(xiàn)差異。endprint
3、效度
內(nèi)容效度:多項(xiàng)選擇題目由教師設(shè)計(jì),根據(jù)為寫作課程的將來(lái)發(fā)展和診斷學(xué)習(xí)者語(yǔ)法知識(shí)的綜合考慮。因此測(cè)試的內(nèi)容與教師將來(lái)欲進(jìn)行的教學(xué)內(nèi)容息息相關(guān)。因此,該測(cè)試享有較高的內(nèi)容效度。
結(jié)構(gòu)效度:僅僅依靠多項(xiàng)選擇來(lái)測(cè)試學(xué)習(xí)者的語(yǔ)法知識(shí)水平不是一個(gè)完善的方法。根據(jù)普爾普拉(2004)的觀點(diǎn),應(yīng)該有一系列的測(cè)試方法來(lái)衡量學(xué)習(xí)者的語(yǔ)法知識(shí)水平。因而有足夠的空間來(lái)測(cè)試學(xué)習(xí)者語(yǔ)法知識(shí)的獨(dú)立因素和在實(shí)際生活中的語(yǔ)法能力。因此要使用多種測(cè)試手段來(lái)衡量學(xué)習(xí)者的語(yǔ)法知識(shí)水平。然而,在多項(xiàng)選擇題目中表現(xiàn)良好的學(xué)習(xí)者卻未必能夠準(zhǔn)確和正確運(yùn)用語(yǔ)法知識(shí)進(jìn)行寫作和口語(yǔ)。在這種情況想,考試成績(jī)與實(shí)際能力的關(guān)系并未能得到證實(shí)。因此,多項(xiàng)選擇題的得分并不能作為唯一的學(xué)習(xí)者語(yǔ)法能力的指標(biāo)。而這種缺陷嚴(yán)重影響了多項(xiàng)選擇作為測(cè)試手段的結(jié)構(gòu)效度(修斯,2003)。
效標(biāo)效度:如果學(xué)習(xí)者在多項(xiàng)選擇測(cè)試中的成績(jī)可以與其他類似能作為衡量標(biāo)準(zhǔn)的測(cè)試成績(jī)相比,用來(lái)測(cè)試其相同或相似的語(yǔ)法知識(shí),那么該多項(xiàng)選擇測(cè)試是具有效標(biāo)效度的。因此可以在課程開始時(shí)的相同階段用該多項(xiàng)選擇測(cè)試來(lái)比對(duì)程度測(cè)試。我認(rèn)為多項(xiàng)選擇測(cè)試與程度測(cè)試相比具有更低的同時(shí)效度,而后者能夠?qū)W(xué)習(xí)者合理歸置而享有較高的結(jié)構(gòu)效度:此兩類測(cè)試在效標(biāo)效度方面有一些共同之處。
表面效度:多項(xiàng)選擇測(cè)試有較高的表面效度,因?yàn)樗铝τ跍y(cè)試學(xué)習(xí)者某方面的語(yǔ)法知識(shí),并且與將來(lái)寫作課程的進(jìn)行密切相關(guān)。盡管可能包含類似的測(cè)試題目任務(wù)而損害其結(jié)構(gòu)效度,但是在規(guī)定時(shí)間內(nèi)進(jìn)行該類型測(cè)試的可能性是很高的。測(cè)試題目是否清晰復(fù)雜取決于題目設(shè)計(jì)者是否將之按照一定的標(biāo)準(zhǔn)進(jìn)行設(shè)計(jì)。測(cè)試的目標(biāo)應(yīng)該很明確,因?yàn)閷W(xué)習(xí)者們一般都很熟悉此類測(cè)試。因此,多項(xiàng)選擇測(cè)試享有較高的內(nèi)容效度,相應(yīng)的也有較高的表面效度。
4、反撥作用與真實(shí)可靠性
多項(xiàng)選擇測(cè)試有可能因?yàn)榇龠M(jìn)猜測(cè)和作弊而具有負(fù)面的反撥作用。測(cè)試必須貼近真實(shí)生活場(chǎng)景才能夠具備真實(shí)可靠性。多項(xiàng)選擇測(cè)試主要集中在測(cè)試語(yǔ)法知識(shí)點(diǎn)的掌握情況而非這些知識(shí)點(diǎn)的實(shí)際使用情況,因此并不能夠代表真實(shí)生活場(chǎng)景。而且此類測(cè)試的條目也很難內(nèi)部關(guān)聯(lián),盡管可以采用場(chǎng)景相關(guān)的段落作為鋪墊,但是與真實(shí)場(chǎng)景的聯(lián)系畢竟有限。因此多項(xiàng)選擇測(cè)試與語(yǔ)言使用環(huán)境關(guān)聯(lián)不大,于是對(duì)于學(xué)習(xí)者缺乏有意義的吸引力。
四、結(jié)論
多項(xiàng)選擇測(cè)試的目標(biāo)是在英語(yǔ)寫作課程開始時(shí)診斷學(xué)習(xí)者特定語(yǔ)法知識(shí)點(diǎn)的掌握情況。此類測(cè)試因?yàn)槠湓u(píng)分簡(jiǎn)單客觀、管理方便、時(shí)間與資源浪費(fèi)少而容易實(shí)施。此類測(cè)試能夠衡量學(xué)習(xí)者對(duì)特定語(yǔ)法知識(shí)點(diǎn)的掌握情況,但是僅限于提供學(xué)習(xí)者是否掌握了語(yǔ)法知識(shí)點(diǎn)的信息,而該信息是接納性信息,不能夠表明學(xué)習(xí)者是否能夠應(yīng)用這些語(yǔ)法知識(shí)點(diǎn)進(jìn)行產(chǎn)出性活動(dòng)。不考慮可能的設(shè)計(jì)失誤、情景影響和學(xué)習(xí)者的個(gè)人因素,此類測(cè)試不能為寫作課程這一產(chǎn)出性的語(yǔ)言活動(dòng)提供足夠的信息:但是可以提醒教師注意某些語(yǔ)法錯(cuò)誤并尋求對(duì)策。多項(xiàng)選擇測(cè)試的效度和真實(shí)可靠性有限,不能為教師提供充足的信息用來(lái)進(jìn)行寫作課程大綱的制定。endprint