郜 娜
(保定電力職業(yè)技術(shù)學(xué)院,河北 保定 071051)
語言測(cè)試?yán)碚撆c大學(xué)英語測(cè)試
郜 娜
(保定電力職業(yè)技術(shù)學(xué)院,河北 保定 071051)
[1] 李清華. 外語測(cè)試:歷史、現(xiàn)狀與展望[J]. 四川外語學(xué)院學(xué)報(bào),2001,3.
[2] 武尊民. 英語測(cè)試的理論與實(shí)踐[M]. 外語教學(xué)與研究出版社,2002.
語言測(cè)試是檢驗(yàn)學(xué)生語言習(xí)得成果的重要手段,而信度與效度是評(píng)價(jià)英語語言測(cè)試的兩個(gè)重要依據(jù)。本文回顧了語言測(cè)試的發(fā)展歷程,分析了大學(xué)英語測(cè)試中的信度與效度,及其二者對(duì)大學(xué)英語測(cè)試的指導(dǎo)作用。
語言測(cè)試?yán)碚?;大學(xué)英語測(cè)試;信度;效度
現(xiàn)代語言測(cè)試(1anguage Testing,LT)是隨著20世紀(jì)初教育測(cè)量學(xué)的獨(dú)立與發(fā)展而逐漸發(fā)展、成熟起來的,它是應(yīng)用語言學(xué)的一個(gè)重要分支。英語語言測(cè)試是英語教師專業(yè)知識(shí)和技能的一個(gè)重要組成部分。語言測(cè)試作為外語教師教育的一個(gè)重要課程,在形成性評(píng)價(jià)或終結(jié)性評(píng)價(jià)過程中必不可少。
2.1 前科學(xué)語言測(cè)試或傳統(tǒng)語言測(cè)試階段
目前把20世紀(jì)40年代以前的語言測(cè)試統(tǒng)稱為前科學(xué)語言測(cè)試。把語言看作一門知識(shí),是這個(gè)時(shí)期外語教學(xué)和測(cè)試體系的語言觀的內(nèi)涵。在這個(gè)時(shí)期,語言教師只是把語言作為一門包括語法知識(shí)、詞匯知識(shí)、語音知識(shí)的符號(hào)體系去教。測(cè)試中對(duì)技巧、技能的考查沒有量度依據(jù),測(cè)試結(jié)果主要依據(jù)教師的主觀判斷。
2.2 心理測(cè)量一結(jié)構(gòu)主義語言測(cè)試或現(xiàn)代語言測(cè)試階段
20世紀(jì)40年代以后,以Bloomfield為首的結(jié)構(gòu)主義語言學(xué)家第一次提出了語言是一套形式結(jié)構(gòu),是一套習(xí)慣。而以Skinner為首的行為主義心理學(xué)家認(rèn)為語言行為是一連串的刺激—反應(yīng)過程。在語言測(cè)試方法上結(jié)合了當(dāng)時(shí)心理語言學(xué)中的心理測(cè)量學(xué),從而形成了心理測(cè)量學(xué)—結(jié)構(gòu)主義語言測(cè)試。著名的語言測(cè)試權(quán)威Lado在《語言測(cè)試》一書中強(qiáng)調(diào)采用分離性題型,信度較高。但這一時(shí)期的語言測(cè)試卻沒有關(guān)注效度問題。
2.3 心理語言學(xué)—社會(huì)語言學(xué)語言測(cè)試或后現(xiàn)代語言測(cè)試階段
1956年Chomsky提出了語言能力和語言行為的概念。1972年,社會(huì)語言學(xué)家Hymes又提出了交際能力的概念,強(qiáng)調(diào)了語言的社會(huì)功能。在決定語言測(cè)試范圍和效度的語言能力假說中,最重要的就是L. F. Bachman提出的交際語言能力模型,他認(rèn)為交際語言能力包括以下三個(gè)部分:語言能力、策略能力和心理生理機(jī)制。此時(shí)的語言測(cè)試由第二階段的一味追求測(cè)試的信度轉(zhuǎn)向信度與效度的綜合考慮,并趨向更高的信度和效度。
3.1 信度(reliability)
信度信度可以被定義為一致性(consistency)。從理論上來講,如果一個(gè)考試具有較高的信度的話,無論在什么情況下對(duì)同組學(xué)生施考多少次,學(xué)生各次的考試成績(jī)都應(yīng)該一致。它體現(xiàn)了分?jǐn)?shù)與試題,試題與應(yīng)試者之間的關(guān)系,它受試題質(zhì)量、考試組織、試卷評(píng)判等因素影響。換句話說,有信度的試題應(yīng)在任何時(shí)間、地點(diǎn)下通過測(cè)試都能夠得到一致的結(jié)果。
3.2 效度(validity)
效度就是考試達(dá)到其預(yù)期測(cè)試意圖的程度。也就是說,考試是否測(cè)量了它所想要測(cè)量的東西。效度是一種相關(guān)性,用以表明測(cè)試與測(cè)試目標(biāo)的關(guān)聯(lián)程度;也是一項(xiàng)考試的核心問題。如果一項(xiàng)考試信度很高,但并沒有考到應(yīng)考的內(nèi)容,這樣的考試效度就不高。效度是與某一特定目的相聯(lián)系的,這是效度的一個(gè)基本屬性。
3.3. 確保測(cè)試信度、效度,完善大學(xué)英語測(cè)試
信度和效度是衡量一份考卷的重要標(biāo)尺。如前文所述,效度是考試達(dá)到其預(yù)期測(cè)試意圖的程度。因此,要保證考試內(nèi)容和考試目的一致和樣本的充足性(覆蓋面)。同時(shí)還要保證測(cè)試有的放矢。如對(duì)于即將從事商業(yè)活動(dòng)的被測(cè)試者,我們想通過閱讀測(cè)試來預(yù)測(cè)考生在未來工作中能否勝任,那么該閱讀考試的材料應(yīng)主要與商務(wù)活動(dòng)有關(guān),如廣告、信函、會(huì)議紀(jì)要等。這樣的材料選擇才能體現(xiàn)出被測(cè)試者未來的語言交際需求,測(cè)試得出的分?jǐn)?shù)才具有更好的效度。又如單元測(cè)試就要考核本單元的主題基本單元中的重點(diǎn)知識(shí)信息;口語測(cè)試就是要考核學(xué)生的口語水平及如何控制話題、如何表達(dá)自己觀點(diǎn)的能力,而不要把口語測(cè)試變相演變成閱讀或?qū)懽髂芰Φ臏y(cè)試。像這樣測(cè)試行為比較具體,其欠缺的卻是作為抽樣的外推性,信度也就難以落實(shí)。但是,并不是說主觀性測(cè)試就一定沒有信度,制定和采取有效措施就可以提高評(píng)分信度。
一般來說,與主觀題型相比,客觀多項(xiàng)選擇題型因其衡量標(biāo)準(zhǔn)明確,評(píng)分標(biāo)準(zhǔn)較客觀而信度較高。而且測(cè)試題量越大,信度就越高,同時(shí)作為考試結(jié)果的分?jǐn)?shù)要有一定的離散度,要呈中間大,兩頭小的IF態(tài)分布。要達(dá)到這個(gè)要求,就意味著試卷的區(qū)分度要高,能將各種不同水平層次的應(yīng)試者區(qū)分開來。同時(shí),提高考試信度還要避免考點(diǎn)二次出現(xiàn)的現(xiàn)象。如2008年6月高等學(xué)校英語應(yīng)用能力考試A級(jí)中1題如下:
Mostof the retired people are happy ____ theiquiet life in the countryside.
A. to B. of C.with D. on
此題考察了be happy with sth.這一固定搭配,但接下來在Task 3閱讀部分第4段中開頭有這樣一句話:Although I have been very happy with mpresent employer and colleagues,…那么之前對(duì)此題所考查結(jié)構(gòu)掌握不好的學(xué)生在閱讀部分看到了答案,這道題目也就失去了其測(cè)試信度。因此,出完考卷后還要再三審讀,以避免這類情況的發(fā)生。
信度和效度的基本關(guān)系是相互依存,卻又互相排斥。信度是保證效度的基礎(chǔ),而撇開效度只談信度是沒有實(shí)際意義的。教師要掌握好測(cè)試信度和效度的關(guān)系,實(shí)屬不易。所以在出題時(shí)尤其要平衡二者關(guān)系,完善英語測(cè)試。
G42
A
1008-7427(2011)07-0125-01
2011-05-12
河北省教育廳人文社會(huì)科學(xué)研究指導(dǎo)計(jì)劃項(xiàng)目(課題編號(hào):SZ2010843)的研究成果。
作者系保定電力職業(yè)技術(shù)學(xué)院基礎(chǔ)部講師。