亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        論語(yǔ)言測(cè)試的信度與效度

        2009-04-29 00:00:00李衛(wèi)真王志華
        考試周刊 2009年34期

        摘要: 語(yǔ)言測(cè)試在一定程度上影響著教學(xué)的方向。本文試從語(yǔ)言測(cè)試的信度與效度角度出發(fā),結(jié)合語(yǔ)言測(cè)試對(duì)語(yǔ)言教學(xué)的反撥作用,探討語(yǔ)言測(cè)試的最佳方案。

        關(guān)鍵詞: 語(yǔ)言測(cè)試信度效度

        一、前言

        語(yǔ)言測(cè)試主要有三個(gè)方面的用途:第一,用于語(yǔ)言教學(xué);第二,用于語(yǔ)言研究和教學(xué)研究;第三,用來(lái)選拔人才(劉潤(rùn)清,1991)。信度和效度是大學(xué)英語(yǔ)學(xué)業(yè)成績(jī)測(cè)試應(yīng)具備的兩個(gè)質(zhì)量特征,“信度涉及測(cè)試結(jié)果的穩(wěn)定性和可靠性,即測(cè)試是否對(duì)學(xué)生的語(yǔ)言水平提供可靠的度量”;“效度則涉及測(cè)試的有效性,即一套訓(xùn)練題所考的是否就是設(shè)計(jì)人想要考的內(nèi)容”(李筱菊,1997)。信度是效度的必要條件,但不是充分條件。一個(gè)測(cè)量工具要有效度必須有信度,沒(méi)有信度就沒(méi)有效度;但是有了信度不一定就有效度。信度低,效度就不可能高。因?yàn)槿绻麥y(cè)量的數(shù)據(jù)不準(zhǔn)確,就不能有效地說(shuō)明所研究的對(duì)象。信度高,效度未必高。例如,如果我們準(zhǔn)確地測(cè)量出某人的英語(yǔ)分?jǐn)?shù),也未必能夠說(shuō)明他的應(yīng)用能力強(qiáng)。效度高,信度也必然高。作為衡量學(xué)生英語(yǔ)水平的一種尺度,考試本身必須可靠有效。

        二、語(yǔ)言測(cè)試中信度與效度的發(fā)展

        信度與效度原是計(jì)量學(xué)中的兩個(gè)重要概念,上世紀(jì)30年代被引入語(yǔ)言測(cè)試領(lǐng)域?!鞍雮€(gè)世紀(jì)以前,傳統(tǒng)的語(yǔ)言學(xué)家把語(yǔ)言作為一種孤立的現(xiàn)象加以研究”(劉潤(rùn)清,1991),在這一基礎(chǔ)上產(chǎn)生了語(yǔ)法翻譯法,它以語(yǔ)法分析、翻譯和短文寫作為主體,“測(cè)試內(nèi)容嚴(yán)重偏重文法,忽視口語(yǔ)”(李筱菊,1997),此時(shí)的測(cè)試毫無(wú)信度可言,雖有一定效度,但因其“測(cè)試形式和評(píng)判標(biāo)準(zhǔn)的極大主觀隨意性而大大減弱”。隨后語(yǔ)言測(cè)試進(jìn)入了心理結(jié)構(gòu)測(cè)試階段,“結(jié)構(gòu)主義語(yǔ)言學(xué)家們把語(yǔ)言看成一個(gè)形式體系,是語(yǔ)音語(yǔ)法和詞匯的總和”(劉潤(rùn)清,1991)。此時(shí)的測(cè)試取消了作文和翻譯,而以多項(xiàng)選擇和人機(jī)對(duì)話的方式取而代之。此時(shí)的測(cè)試內(nèi)容由于考查的語(yǔ)言點(diǎn)覆蓋面廣,且以多項(xiàng)選擇為代表的客觀試題能夠確保評(píng)分的一致性和客觀性,受人為因素影響較小,因而信度較高。從20世紀(jì)60年代起,在喬姆斯基的轉(zhuǎn)換生成語(yǔ)法的理論基礎(chǔ)上產(chǎn)生了綜合測(cè)試法,即把語(yǔ)言化零為整,對(duì)學(xué)生的綜合語(yǔ)言能力進(jìn)行測(cè)驗(yàn),如閱讀理解、完形填空、閱讀改錯(cuò)、會(huì)話等。但后來(lái)的社會(huì)語(yǔ)言學(xué)家海姆斯發(fā)表了《論交際功能》,強(qiáng)調(diào)了語(yǔ)言的社會(huì)功能,在這一理論影響下產(chǎn)生了交際教學(xué)法和交際測(cè)試法,因此,語(yǔ)言交際功能的培養(yǎng)是語(yǔ)言教學(xué)的首要目標(biāo),“同時(shí)衡量語(yǔ)言交際能力也成為語(yǔ)言測(cè)試的首要任務(wù)”(劉潤(rùn)清,1991)。此時(shí)的語(yǔ)言測(cè)試由第二階段的一味追求測(cè)試的信度轉(zhuǎn)向信度與效度的綜合考慮,并趨向更高的信度和效度(羅明姝,2006)??梢哉f(shuō)語(yǔ)言測(cè)試?yán)碚摵蛯?shí)踐上的發(fā)展都是以信度與效度為主線進(jìn)行的,信度與效度是語(yǔ)言測(cè)試的永恒主題。

        三、英語(yǔ)測(cè)試題型信度與效度的分析

        1.客觀性試題的信度與效度

        結(jié)構(gòu)主義測(cè)試學(xué)家稱多項(xiàng)選擇題、判斷正誤題和只有一個(gè)標(biāo)準(zhǔn)答案的題為客觀性試題,因?yàn)檫@些題的評(píng)分不受閱卷人主觀因素的影響,“英語(yǔ)多項(xiàng)選擇題通過(guò)測(cè)試學(xué)生所掌握的語(yǔ)音、詞匯、語(yǔ)法等知識(shí),推斷學(xué)生生成句子和理解句子乃至語(yǔ)篇的能力”(張穎1988)。由于多項(xiàng)選擇題考點(diǎn)層次較低,因此,在有限的測(cè)試時(shí)間內(nèi),多項(xiàng)選擇題通常題量較大,語(yǔ)言點(diǎn)覆蓋面較廣泛,這使閱卷人能夠更精確地推斷出考生語(yǔ)言知識(shí)的掌握程度,因此,“多項(xiàng)選擇題的信度較高”。此外,多項(xiàng)選擇題衡量標(biāo)準(zhǔn)明確,評(píng)分信度(scoring reliability)高,評(píng)分標(biāo)準(zhǔn)較客觀,為學(xué)生的語(yǔ)言水平提供了科學(xué)準(zhǔn)確的度量,從而進(jìn)一步提高了測(cè)試的信度(羅明姝2006)。

        然而,多項(xiàng)選擇題雖然信度較高,但與主觀題型相比,其效度并不高,“影響多項(xiàng)選擇題效度的主要原因有兩種:一是多選題孤立地對(duì)構(gòu)成語(yǔ)言的元素進(jìn)行測(cè)試,忽視了這些元素在實(shí)際語(yǔ)境中的相互作用功能”(張穎1988),而語(yǔ)言的本質(zhì)不僅僅是各元素處于孤立狀態(tài)時(shí)呈現(xiàn)出的特性,更重要的是其在語(yǔ)言整體體系中相互作用時(shí)體現(xiàn)出的功能(羅明姝2006),“因此,多選題考查的只是學(xué)生對(duì)語(yǔ)言形式的識(shí)別能力,而對(duì)其語(yǔ)言知識(shí)的運(yùn)用和產(chǎn)出能力無(wú)從判斷,對(duì)其語(yǔ)言知識(shí)與語(yǔ)境特征相結(jié)合時(shí)的創(chuàng)新能力無(wú)從判斷”(張穎1988)。例如:客觀題只能覆蓋十分有限的能力范圍和較低的學(xué)習(xí)層次。不少客觀題考查的語(yǔ)言知識(shí),只是識(shí)別或回憶學(xué)過(guò)的內(nèi)容。要全面地考查語(yǔ)言能力,要深入地考查交際能力及其他能力,用客觀題就十分勉強(qiáng)。有的多項(xiàng)選擇題,命題者旨在考查理解甚至應(yīng)用、分析、綜合、評(píng)價(jià),但是所有的供選擇的答法都是命題者擬好了的。學(xué)生的反應(yīng)是以命題者的語(yǔ)言和思想為基礎(chǔ)的,并不一定是自己的語(yǔ)言和思想。此外,從答題的情況看不到被試者思維的過(guò)程??陀^題答題常常只需要打鉤、畫圈、劃線、涂黑字母,學(xué)生在整個(gè)測(cè)試過(guò)程中沒(méi)有直接使用英語(yǔ)表達(dá)思想的機(jī)會(huì)(汪先鋒、倪建樂(lè),2000)。

        2.主觀性試題的信度與效度

        主觀題更能引導(dǎo)學(xué)生把注意力放在語(yǔ)言的實(shí)際應(yīng)用方面,有實(shí)用價(jià)值,更有利于學(xué)生在英語(yǔ)方面素質(zhì)的提高。如近年來(lái)考試中出現(xiàn)的聽(tīng)寫、簡(jiǎn)答、翻譯、作文、口試等題型,“一篇試卷中主觀性試題越多,其效度就越高”。例如,一篇英語(yǔ)作文取決于考生英語(yǔ)詞匯、語(yǔ)法、句法、寫作語(yǔ)篇等綜合知識(shí)的運(yùn)用?!胺g與作文是綜合運(yùn)用語(yǔ)言的能力測(cè)試項(xiàng)”,“翻譯、寫作能力的測(cè)試在當(dāng)今英語(yǔ)測(cè)試中仍顯示著其不可替代的作用”;簡(jiǎn)答題重在考查學(xué)生對(duì)于所給材料的理解能力,對(duì)于提出問(wèn)題的分析能力和回答問(wèn)題時(shí)的語(yǔ)言組織能力;“聽(tīng)寫測(cè)試涉及多種綜合技能的練習(xí),包括聽(tīng)力理解、聽(tīng)力記憶、幅度拼寫、識(shí)別音段和熟悉語(yǔ)言的語(yǔ)法和詞匯模式,等等”(余建中,1997)。主觀題的優(yōu)點(diǎn)在于:能夠覆蓋所有的學(xué)習(xí)層次,被試有比較寬闊的空間表達(dá)自己的思想、在句子水平或語(yǔ)篇水平方面表現(xiàn)出應(yīng)用英語(yǔ)表達(dá)思想的能力;考查的深度深,主觀題命題可以根據(jù)總?cè)蝿?wù)用主觀題進(jìn)行綜合性考查。還可以設(shè)置情景,了解交際能力和其他能力,了解應(yīng)用英語(yǔ)的正確程度、流暢程度和得體的程度,并且可以在一定程度上了解被試的思維過(guò)程,有利于發(fā)現(xiàn)問(wèn)題,查找產(chǎn)生問(wèn)題的根源。

        3.信度與效度的價(jià)值取向

        筆者認(rèn)為,在信度與效度難以兼得的情況下,語(yǔ)言測(cè)試應(yīng)首先考慮效度要求,并在此基礎(chǔ)上盡可能地追求信度。最重要的是,語(yǔ)言測(cè)試以效度為主導(dǎo)有助于改善其對(duì)外語(yǔ)教學(xué)的影響。語(yǔ)言測(cè)試給外語(yǔ)教學(xué)帶來(lái)的影響即人們常說(shuō)的反撥效應(yīng),是衡量語(yǔ)言測(cè)試的重要標(biāo)準(zhǔn)之一,因此,也被許多測(cè)試學(xué)家稱為反撥效度(汪先鋒、倪建樂(lè),2000)。語(yǔ)言測(cè)試以效度為主導(dǎo)無(wú)疑將給外語(yǔ)教學(xué)帶來(lái)積極的影響,推動(dòng)外語(yǔ)教學(xué)向培養(yǎng)學(xué)生實(shí)用語(yǔ)言能力的方向發(fā)展。大規(guī)模的語(yǔ)言測(cè)試中測(cè)試內(nèi)容和形式的微小變化都會(huì)給外語(yǔ)教學(xué)帶來(lái)顯著影響(鄒紅英,1997)。在大學(xué)英語(yǔ)考試(CET)閱讀理解部分加入翻譯題給大學(xué)英語(yǔ)教學(xué)帶來(lái)的有利影響是顯而易見(jiàn)的(劉建達(dá),1998)。要提高語(yǔ)言測(cè)試的效度必須設(shè)計(jì)出能有效反映受試者語(yǔ)言能力的題型和努力使主觀題的評(píng)分盡量客觀化。

        現(xiàn)代語(yǔ)言測(cè)試重信度輕效度的傾向的主要表現(xiàn)是測(cè)試內(nèi)容和形式脫離語(yǔ)言運(yùn)用實(shí)際,重知識(shí)識(shí)記、輕能力應(yīng)用。這種偏向在測(cè)試題型上的表現(xiàn)是測(cè)試以客觀題為主,從而導(dǎo)致多項(xiàng)選擇題的泛濫使用。現(xiàn)代語(yǔ)言測(cè)試的這種偏向在應(yīng)試教學(xué)的作用下給外語(yǔ)教學(xué)帶來(lái)了嚴(yán)重的負(fù)面影響,阻礙了外語(yǔ)教學(xué)培養(yǎng)交際能力這一目標(biāo)的實(shí)現(xiàn)。外語(yǔ)學(xué)習(xí)者往往經(jīng)過(guò)多年的學(xué)習(xí),盡管可能以較好的成績(jī)通過(guò)考試,但其語(yǔ)言實(shí)用能力卻很低下。

        沒(méi)有信度意味著測(cè)試結(jié)果不是受試者語(yǔ)言行為的真實(shí)反映,我們就難以藉此測(cè)量任何東西。而沒(méi)有效度只有信度的測(cè)試也毫無(wú)意義,因?yàn)樗鼫?zhǔn)確地測(cè)量了與語(yǔ)言能力不太相關(guān)或毫不相關(guān)的東西。我們同樣無(wú)法從考試結(jié)果中推測(cè)受試者真正的語(yǔ)言能力。

        四、結(jié)語(yǔ)

        從信度與效度等測(cè)試標(biāo)準(zhǔn)出發(fā)來(lái)評(píng)價(jià)或取舍一種測(cè)試模式或測(cè)試題型是必要的,但卻遠(yuǎn)遠(yuǎn)不夠,重要的是要考慮它們對(duì)教學(xué)的深遠(yuǎn)影響,看它是否有利于教學(xué)目標(biāo)的實(shí)現(xiàn);對(duì)學(xué)生是否有一種有利的引導(dǎo)作用和督促作用。一套試題中兼有客觀題與主觀題,且主客觀題的比例適中,才能保證考試的可靠性與準(zhǔn)確性,增強(qiáng)測(cè)試的目的性,起到良好的反撥作用。這是由社會(huì)對(duì)應(yīng)用型人才的要求所決定的。

        參考文獻(xiàn):

        [1]劉潤(rùn)清.語(yǔ)言測(cè)試和它的方法.外語(yǔ)教學(xué)與研究出版社,1991.

        [2]李筱菊.語(yǔ)言測(cè)試的科學(xué)與藝術(shù).湖南教育出版社,1997.

        [3]羅明姝.英語(yǔ)測(cè)試信度與效度的多維分析.鄭州航空工業(yè)管理學(xué)院學(xué)報(bào),2006,(12).

        [4]張穎.多項(xiàng)選擇題的理論依據(jù)和實(shí)際效果.外語(yǔ)教學(xué)與研究,1988,(2).

        [5]汪先鋒,倪建樂(lè).從信度與效度的相互關(guān)系看語(yǔ)言測(cè)試的取向.山東外語(yǔ)教學(xué),2000,(3).

        [6]劉潤(rùn)清.論大學(xué)英語(yǔ)教學(xué).外語(yǔ)教學(xué)與研究出版社,1999.

        [7]余建中.CET聽(tīng)寫填空題的閱卷問(wèn)題研究.外語(yǔ)界,1997,(1).

        [8]鄒紅英.大學(xué)英語(yǔ)測(cè)試新思路.山東外語(yǔ)教學(xué),1997,(1).

        [9]劉建達(dá).測(cè)試方法對(duì)閱讀測(cè)試的影響.外語(yǔ)教學(xué)與研究,1998,(2).

        手机免费高清在线观看av| 久久久久亚洲女同一区二区| 美女窝人体色www网站| 国产诱惑人的视频在线观看| 国产精品国产三级国产av剧情| 欧美日韩国产成人高清视频| 久久99精品久久久久久齐齐百度| 日韩一区二区三区天堂| 男女裸体做爰视频高清| 久久综合狠狠色综合伊人| 男人天堂免费视频| 久久棈精品久久久久久噜噜| 综合激情网站| 福利视频在线一区二区三区| 精品中文字幕在线不卡| 中文字幕色av一区二区三区| 娇妻玩4p被三个男人伺候电影| 亚州五十路伊人网| 久久中文字幕暴力一区| 国产av在线观看久久| 疯狂做受xxxx国产| 亚洲av无码一区二区三区观看| 国产精品九九九无码喷水| 精品少妇一区二区三区四区| 最新国产精品拍自在线观看| 中文字幕av无码免费一区| 国内精品久久久久久久久蜜桃| 免费人成黄页网站在线一区二区 | 免费人成无码大片在线观看| 日本高清在线播放一区二区三区| 国产成人亚洲系列毛片| 亚洲精品色婷婷在线影院| 日本色噜噜| 免费高清日本一区二区| 一个人看的www片免费高清视频| 天美传媒精品1区2区3区| 国产在线高清无码不卡| 偷拍视频网址一区二区| 精品少妇人妻av无码久久| 色综合久久久久综合999| 国产精品一区二区夜色不卡|