劉雪英
[摘要]多項選擇是一項廣泛使用的測試手段,常見于各類英語語言考試當(dāng)中。本文通過分析多項選擇測試的特點,探討在英語寫作課程開始時,多項選擇測試作為一種用來測試學(xué)習(xí)者語法知識掌握情況的手段,并論述了多項選擇測試各方面的信度與效度,以此來評估該測試手段對英語寫作課程的作用與局限性。
[關(guān)鍵詞]多項選擇 測試 信度 效度
一、多項選擇測試的特點
多項選擇是一項廣泛使用的測試手段。根據(jù)杰納西(1996)的觀點,多項選擇是一種封閉測試,不需要應(yīng)試者給出反應(yīng)。布朗(2004)認為多項選擇是一種接受性和選擇性的手段,而且評判時按照客觀標準進行,不涉及閱卷者的主觀態(tài)度。此外,多項選擇構(gòu)成緊湊,非常適合初學(xué)者。因此多項選擇通常不用來測試口語和寫作能力,而是用于測試獨立的語法知識和詞匯量(普爾普拉,2004)。
多項選擇因其極高的信度而享有盛譽,因為應(yīng)試者與閱卷者都不會受到主觀因素的影響,評卷也十分省時省力迅速便捷。然而設(shè)計多項選擇題目卻要花費許多時間力氣和專業(yè)知識,而且在設(shè)計過程中會出現(xiàn)這樣那樣的漏洞,比如沒有正確選項,或者在題干中出現(xiàn)線索(修斯,2003)。有時要為一篇用來測試速讀技巧的文章設(shè)計足夠數(shù)目質(zhì)量滿意的多項選擇題目是非常困難和耗時的(威爾,1990)。威爾認為多項選擇測試語言的某個非常具體的方面因而缺乏開放式的格式。測試設(shè)計者的意圖非常明顯,就是要避免參試者的主觀性和疑慮。
威爾同時指出多項選擇的一些弊端,其一是應(yīng)試者的答案并不能反映題目選項中可能挫折的錯誤:其二是不能確定應(yīng)試者是否具備選擇正確答案應(yīng)具備的知識或技能。因此有可能出現(xiàn)猜測的行為,以至于影響到該測試的效度。此外,多項選擇不能反映應(yīng)試者應(yīng)對真實環(huán)境下的應(yīng)對技巧。修斯(2003)指出,多項選擇可能會促進考場作弊行為,因為答案可以通過非語言交流方式來傳遞。
布朗(2004)對診斷性測試的定義是為診斷學(xué)習(xí)者對語言知識某一特定方面的掌握情況而設(shè)計的測試,該類測試以兩種方式著眼未來。首先,幫助學(xué)習(xí)者意識到他們的錯誤和需要努力之處;其次,幫助教師確定將來的教學(xué)活動中著重于語言的哪些方面。修斯(1989)也表明同樣的觀點,即診斷性測試檢測學(xué)習(xí)者在語言知識方面的強弱項并且明確在將來的學(xué)習(xí)中要學(xué)習(xí)什么,因此對于未來的教學(xué)具有重要意義:因此通常在課程開始期間按照課程設(shè)計進行診斷性測試。
二、多項選擇測試在英語寫作課程初期的適用情況
多項選擇測試用來診斷學(xué)習(xí)者在英語寫作課初期對于語法知識的掌握情況,可以用來精確地測試學(xué)習(xí)者從構(gòu)詞法知識到詞序等方面語法知識的掌握情況。以下是一些范例。
例1、用來測試形態(tài)詞法知識
There has been a great increase in retail sales____?
A.does there B.isn't there C.hasn't there D.isn'tit(答案:C)
該題目測試反義疑問句,即句法準確性。四個選項中即有否定形式也有肯定形式,帶有不同的助動詞。該題目的目標是測試學(xué)習(xí)者是否掌握了反義疑問句的構(gòu)成,是否能夠準確使用助動詞和否定。
例2、用來測試句法
These people once had fame and fortune,now is left to them isutter poverty。
A.all that B.all what C.all which D.thatall(答案:A)
該題目用來測試學(xué)習(xí)者是否掌握了引導(dǎo)詞“that+all”用來引導(dǎo)主語從句。
通過上述諸例可以看出,多項選擇測試可以準確地診斷學(xué)生對于語法知識點的掌握情況。教師可以看出學(xué)習(xí)者掌握語法點的情況并且可以據(jù)此做出判斷,來確定將來的教學(xué)活動中應(yīng)該做什么。教師也可以為將來的寫作課程設(shè)計多項選擇題目。例如,該寫作課程如果涉及旅游交流和廣告應(yīng)用的話,常用的語法點知識寶庫一般現(xiàn)在時,現(xiàn)在進行體,描述與比喻性的語言,文體風(fēng)格和語域知識等等。教師一旦確定教學(xué)目標,就可以著手涉及機關(guān)的多項選擇題目。根據(jù)該多項選擇測試的結(jié)果,教師就可以對學(xué)習(xí)者的相關(guān)語法知識水平有一個總體的了解。教師可以對相關(guān)語法點的正確使用進行強化,糾正錯誤,或者給予明確的解釋說明。然后教師可以布置作業(yè)以鞏固上述語法知識。
然而,多項選擇測試并不能完全為將來的教學(xué)提供所有的基礎(chǔ)。比如,多項選擇測試可以揭示學(xué)習(xí)者對哪些語法點掌握與否,但是卻不能描述學(xué)習(xí)者對該語法點知識的使用情況。多項選擇測試只能用來辨識錯誤和評估對語法知識的認知情況,然而在知識與實際運用之間是有差距的。此外,多項選擇測試不僅與實際使用的語言有出入,而且是脫離實際語境的。大多數(shù)多項選擇題目與現(xiàn)實生活脫節(jié),干擾項可能在實際上從來不會發(fā)生,并且實際上會有不止一個正確答案??紤]到上述兩點,多項選擇測試并不能幫助教師來確定將來寫作課程的發(fā)展。
三、多項選擇測試的作用與局限性
多項選擇測試對于學(xué)習(xí)者英語語法知識掌握情況的評估可以從以下方面進行。
1、實用性
根據(jù)杰納西(1996)和布朗(2004)的觀點,此類多項選擇測試的實用性比較高,因為它代價低廉,有充足的時間和空間進行此類測試,管理比較方便,不需要額外的設(shè)備設(shè)施來進行此類測試,因此降低了成本,并且閱卷程序比較便捷省時。該類測試可以在某個或某些特定的學(xué)習(xí)者群體內(nèi)進行,不需要大規(guī)模的管理,因此比較省時和節(jié)省物力與資源。
2、信度
在評分方面多項選擇測試享有較高的信度。一方面,每—個題目都有標準答案,閱卷者甚至不需要專業(yè)知識或進行判斷。評判內(nèi)與評判間信度都不會受到主觀因素的影響。而諸如測試長度、環(huán)境影響等因素可以通過教師和管理安排來避免。然而,有可能因為不能找到足夠的干擾項或情景內(nèi)容而使受測項目不能充分得到測試,因此多項選擇在一定情況下的信度是受到影響的,因而使用場合是受到限制的。另一方面,如果設(shè)計該多項選擇的教師沒有很好的設(shè)計該題目,那么信度也會受到影響。不過這一點可以通過使用同一階段同一課程先前使用過的多項選擇題目來避免。對于學(xué)習(xí)者而言,信度可能會因為該測試是在課程開始時進行,而學(xué)習(xí)者有可能因為在放假之后忘記了許多知識點。同時,學(xué)習(xí)者有可能在有限的時間下經(jīng)過測試而感覺緊張。應(yīng)試表現(xiàn)有可能在不同時間段出現(xiàn)差異。endprint
3、效度
內(nèi)容效度:多項選擇題目由教師設(shè)計,根據(jù)為寫作課程的將來發(fā)展和診斷學(xué)習(xí)者語法知識的綜合考慮。因此測試的內(nèi)容與教師將來欲進行的教學(xué)內(nèi)容息息相關(guān)。因此,該測試享有較高的內(nèi)容效度。
結(jié)構(gòu)效度:僅僅依靠多項選擇來測試學(xué)習(xí)者的語法知識水平不是一個完善的方法。根據(jù)普爾普拉(2004)的觀點,應(yīng)該有一系列的測試方法來衡量學(xué)習(xí)者的語法知識水平。因而有足夠的空間來測試學(xué)習(xí)者語法知識的獨立因素和在實際生活中的語法能力。因此要使用多種測試手段來衡量學(xué)習(xí)者的語法知識水平。然而,在多項選擇題目中表現(xiàn)良好的學(xué)習(xí)者卻未必能夠準確和正確運用語法知識進行寫作和口語。在這種情況想,考試成績與實際能力的關(guān)系并未能得到證實。因此,多項選擇題的得分并不能作為唯一的學(xué)習(xí)者語法能力的指標。而這種缺陷嚴重影響了多項選擇作為測試手段的結(jié)構(gòu)效度(修斯,2003)。
效標效度:如果學(xué)習(xí)者在多項選擇測試中的成績可以與其他類似能作為衡量標準的測試成績相比,用來測試其相同或相似的語法知識,那么該多項選擇測試是具有效標效度的。因此可以在課程開始時的相同階段用該多項選擇測試來比對程度測試。我認為多項選擇測試與程度測試相比具有更低的同時效度,而后者能夠?qū)W(xué)習(xí)者合理歸置而享有較高的結(jié)構(gòu)效度:此兩類測試在效標效度方面有一些共同之處。
表面效度:多項選擇測試有較高的表面效度,因為它致力于測試學(xué)習(xí)者某方面的語法知識,并且與將來寫作課程的進行密切相關(guān)。盡管可能包含類似的測試題目任務(wù)而損害其結(jié)構(gòu)效度,但是在規(guī)定時間內(nèi)進行該類型測試的可能性是很高的。測試題目是否清晰復(fù)雜取決于題目設(shè)計者是否將之按照一定的標準進行設(shè)計。測試的目標應(yīng)該很明確,因為學(xué)習(xí)者們一般都很熟悉此類測試。因此,多項選擇測試享有較高的內(nèi)容效度,相應(yīng)的也有較高的表面效度。
4、反撥作用與真實可靠性
多項選擇測試有可能因為促進猜測和作弊而具有負面的反撥作用。測試必須貼近真實生活場景才能夠具備真實可靠性。多項選擇測試主要集中在測試語法知識點的掌握情況而非這些知識點的實際使用情況,因此并不能夠代表真實生活場景。而且此類測試的條目也很難內(nèi)部關(guān)聯(lián),盡管可以采用場景相關(guān)的段落作為鋪墊,但是與真實場景的聯(lián)系畢竟有限。因此多項選擇測試與語言使用環(huán)境關(guān)聯(lián)不大,于是對于學(xué)習(xí)者缺乏有意義的吸引力。
四、結(jié)論
多項選擇測試的目標是在英語寫作課程開始時診斷學(xué)習(xí)者特定語法知識點的掌握情況。此類測試因為其評分簡單客觀、管理方便、時間與資源浪費少而容易實施。此類測試能夠衡量學(xué)習(xí)者對特定語法知識點的掌握情況,但是僅限于提供學(xué)習(xí)者是否掌握了語法知識點的信息,而該信息是接納性信息,不能夠表明學(xué)習(xí)者是否能夠應(yīng)用這些語法知識點進行產(chǎn)出性活動。不考慮可能的設(shè)計失誤、情景影響和學(xué)習(xí)者的個人因素,此類測試不能為寫作課程這一產(chǎn)出性的語言活動提供足夠的信息:但是可以提醒教師注意某些語法錯誤并尋求對策。多項選擇測試的效度和真實可靠性有限,不能為教師提供充足的信息用來進行寫作課程大綱的制定。endprint