宋征
天津美術(shù)學(xué)院,天津300141
測(cè)試信度:Bachman(1996)把信度定義為“測(cè)試的一致性”。簡言之,就是測(cè)試結(jié)果的可信度、可靠度,即考分的一致性。測(cè)試信度是測(cè)試準(zhǔn)確度的一種體現(xiàn),測(cè)試的準(zhǔn)確度越高,信度越高。
影響語言測(cè)試信度的因素主要包括以下幾個(gè)方面。
1.環(huán)境因素。有大量的環(huán)境因素會(huì)對(duì)學(xué)生的考試產(chǎn)生不利影響。如嘈雜的考場(chǎng)環(huán)境和考場(chǎng)的溫度,此外諸如考場(chǎng)的光線、空間、通風(fēng)等因素都會(huì)對(duì)考試的信度造成影響。這里要特別提到的是,嘈雜的考場(chǎng)環(huán)境對(duì)外語語言測(cè)試中的聽力和口語考試影響尤為突出,因?yàn)檫@兩種考試涉及大量聽說內(nèi)容,如果有其它聲音的干擾,會(huì)嚴(yán)重影響測(cè)試效果,進(jìn)而大大降低測(cè)試信度。
2.測(cè)試的管理程序。不同的受測(cè)群體、不同的考試地點(diǎn)和不同的考試時(shí)間等因素會(huì)影響考試信度。
3.測(cè)試項(xiàng)目。首先,測(cè)試的題目數(shù)與測(cè)試的信度是相關(guān)的,題目數(shù)過少會(huì)降低測(cè)試信度。所以在測(cè)試設(shè)計(jì)中,要確保足量的測(cè)試題目數(shù)以保證測(cè)試的信度。Henning(1988)曾指出要保證信度,一次考試的題目數(shù)不應(yīng)少于75題。其次,考試難度也和考試信度息息相關(guān)??荚囘^難過易都會(huì)降低考試信度。最后,考試題目種類的設(shè)計(jì)也很重要。
4.受試者自身的生理、心理因素。受試者本身的一些生理和心理因素也會(huì)對(duì)考試信度造成影響。例如身體不適、心理上對(duì)考試的厭倦、情緒上的波動(dòng)(緊張或焦慮等情緒)等因素都會(huì)導(dǎo)致考試成績無法真實(shí)反映學(xué)生語言能力,進(jìn)而影響測(cè)試信度。在外語語言測(cè)試中,口語和聽力測(cè)試在這方面問題尤為突出。很多國內(nèi)外學(xué)者都對(duì)心理緊張、焦慮和聽力、口語考試之間的關(guān)系進(jìn)行過研究,此方面的專業(yè)論述也頗多。
測(cè)試效度:指 “成功地實(shí)現(xiàn)測(cè)試目的程度”(Clark,1979:35-49)。語言測(cè)試的效度是指測(cè)試是否考查了測(cè)試者想要測(cè)試的語言方面的內(nèi)容,考生所考的成績是否合理地說明了該考生的語言能力。Hughes(1992)指出如果考試與其檢測(cè)的語言技能和結(jié)構(gòu)相匹配,那么就可以說此次考試具備效度了。
影響測(cè)試效度的因素主要包括以下幾個(gè)方面。
1.測(cè)試的目標(biāo)。測(cè)試目標(biāo)的確定,對(duì)于測(cè)試的效度有著重大影響。目標(biāo)一定要定得恰當(dāng),要在測(cè)試能達(dá)到的范圍之內(nèi)。比如剛完成大學(xué)英語第一單元的講授,單元測(cè)試的目標(biāo)就要突出本單元所講知識(shí)點(diǎn)的掌握上。
2.測(cè)試的內(nèi)容。必須使測(cè)試的內(nèi)容盡可能準(zhǔn)確地反映測(cè)試的目標(biāo)。命題實(shí)際上是一個(gè)抽樣的過程,如果抽樣合理,樣本大小合適,就能比較正確地反映整體的情況,就易于達(dá)到測(cè)試的目的。每—次測(cè)試,題項(xiàng)必須有代表性,側(cè)重點(diǎn)要明確。比如要考查名詞性從句的掌握,命題就應(yīng)該緊緊圍繞主語從句、賓語從句、表語從句和同位語從句這四大從句展開,題目數(shù)量的設(shè)置也要依據(jù)這四種從句平均分配。
3.測(cè)試的方法。測(cè)試的方法要與測(cè)試的內(nèi)容相適宜。考口語要用口試法,筆試法無法直接測(cè)量口頭表達(dá)。
4.測(cè)試的組織。測(cè)試需要嚴(yán)格、科學(xué)的組織工作。組織得好,有利于提高測(cè)試的效度和信度。
5.測(cè)試的應(yīng)用。舉個(gè)例子,如果把為大學(xué)英語一年級(jí)考試試卷給高中生做,那么這個(gè)考試就缺乏效度。盡管這個(gè)考試在大學(xué)一年級(jí)學(xué)生測(cè)試時(shí)已證明效度,但受試者變化了,考試的效度就受到損害。
測(cè)試語言輸出能力類試題通俗講就是寫和說的試題。在我們實(shí)際外語測(cè)試中經(jīng)常會(huì)以寫作和口語考試的形式來體現(xiàn)。下面我們將針對(duì)這一類型試題的優(yōu)缺點(diǎn)進(jìn)行探討。
雖然測(cè)試語言輸入能力類試題(讀和聽的試題)作為直接試題也具有一定的效度,但測(cè)試語言輸出能力類試題(寫和說的試題)具有更高的效度。因?yàn)闇y(cè)試語言輸入能力,不一定能測(cè)試出語言輸出能力;而測(cè)試語言輸出能力,一定同時(shí)能測(cè)試出語言輸入能力。例如,在聽力測(cè)試中全部能夠聽懂的內(nèi)容,不一定都能說出來。但反之,口語測(cè)試中全部能說出來的內(nèi)容一定能聽懂。閱讀理解中讀懂的內(nèi)容不一定都能寫出來,而自己寫作的內(nèi)容是肯定能讀懂的。因而聽、讀類試題不一定能考查說、寫的能力,但說、寫類試題一定能考查聽、讀能力。
另外一個(gè)說明測(cè)試語言輸出能力類試題具有更高效度的原因是:這類試題能同時(shí)測(cè)試語言的各個(gè)層次。這里還用讀、聽類試題和寫、說類試題進(jìn)行比較。試想在做一篇閱讀理解時(shí),雖然可能理解了通篇主要內(nèi)容,但對(duì)閱讀文章中的單詞、短語、每個(gè)句子的語法結(jié)構(gòu)和含義不一定都能理解。聽力測(cè)試中也常常出現(xiàn)類似問題,雖然聽力材料中的一些詞匯和句子并未聽懂,但有時(shí)也不影響對(duì)聽力內(nèi)容大意的理解。但寫和說類試題卻不然。寫作考試中所寫的每個(gè)句子的語法結(jié)構(gòu)和含義以及句子中的單詞和短語,受試者必然非常通曉??谡Z考試也是如此。否則就寫不出來、說不出來或者會(huì)寫錯(cuò)、說錯(cuò)。所以寫、說類試題在考語篇的同時(shí),必然也考查了單詞、短語和句子,在考意義表達(dá)的同時(shí),必然也考查了慣用搭配和語法。從這個(gè)角度來講,測(cè)試語言輸出能力類試題具有更高的效度。
由于測(cè)試語言輸出能力類試題都屬于主觀性試題,評(píng)分標(biāo)準(zhǔn)的科學(xué)客觀性相對(duì)客觀性試題會(huì)有一定差距。因此其信度也相對(duì)低。
可行性低也是測(cè)試語言輸出能力類試題的一個(gè)弱點(diǎn)。因?yàn)檫@一類測(cè)試對(duì)考試的時(shí)間、地點(diǎn)、人員及設(shè)備等條件要求較高。寫作考試相對(duì)于口語考試還較易實(shí)施。因?yàn)樵谕粫r(shí)間、同一考場(chǎng)、有紙筆就可以進(jìn)行測(cè)試,而且監(jiān)考人員也不用具備專業(yè)知識(shí)。然而口語考試要求具備的條件就復(fù)雜多了。這也是此類型測(cè)試在很多重大考試中占比例不多的一個(gè)重要原因。例如,TOEFL從1964年開辦,到1986年才增加一個(gè)寫的試題 (TWE—Test of Written English)。TOEFL雖然從1982年開始也增加了一個(gè)口試測(cè)試(TSE—Test of Spoken English),但也只能作為主卷之外自由選考的額外考試。高考英語試卷雖然一直有寫作這項(xiàng)題型,但口語考試一直未能列入高考的項(xiàng)目。大學(xué)英語四六級(jí)考試雖有口試測(cè)試,但也是只有筆試成績達(dá)到優(yōu)秀的少部分學(xué)生才能取得口試資格。這些都說明了此類試題對(duì)考試條件要求苛刻,故可行性就低了。
1.要設(shè)法提高語言測(cè)試的信度和效度。要提高信度和效度,可以從試卷設(shè)計(jì)、考試環(huán)境、受試者三方面著手。第一,試卷設(shè)計(jì)是最重要的,對(duì)測(cè)試信度效度起決定意義。首先,保證題量。題多一些,覆蓋面大一些,題項(xiàng)的代表性好一些,就可以在一定程度上減少測(cè)試誤差。當(dāng)然題目和題型過多也會(huì)引起負(fù)面效應(yīng),所以“度”的把握就顯得尤為關(guān)鍵了。其次,把握好題項(xiàng)的難易程度,提高題項(xiàng)區(qū)分度。題項(xiàng)難易程度適當(dāng),題項(xiàng)區(qū)分程度高,受試者在兩次或多次測(cè)試中成績的一致性和穩(wěn)定性就高,測(cè)試的相關(guān)性就會(huì)提高,測(cè)試的信度也就會(huì)提高。第二,保持良好的考試環(huán)境和考試秩序,把干擾測(cè)試的因素降到最低。第三,幫助受試者在測(cè)試中穩(wěn)定發(fā)揮。如果考生帶著緊張、焦慮的情緒應(yīng)考,那么測(cè)試信度和效度必然大打折扣。教師應(yīng)幫助學(xué)生們樹立正確的考試態(tài)度,不要對(duì)學(xué)生的考試成績期望值過高,也不要在考前給學(xué)生施加太大的壓力。要讓他們以從容的心態(tài),帶著平穩(wěn)的情緒走進(jìn)考場(chǎng),保證在考試中發(fā)揮自己的真實(shí)水平。
2.對(duì)于測(cè)試語言輸出能力類試題的設(shè)計(jì)和使用要有三點(diǎn)注意事項(xiàng)。第一,鑒于高效度是此類試題的優(yōu)勢(shì),在測(cè)試設(shè)計(jì)實(shí)踐中應(yīng)將這一優(yōu)勢(shì)最大化發(fā)揮。要保證高效度,應(yīng)在測(cè)試設(shè)計(jì)中遵循以下幾點(diǎn)原則:以信息的表達(dá)為測(cè)試目的;情景設(shè)計(jì)對(duì)受試者應(yīng)為真實(shí)的情景;應(yīng)將測(cè)試層次保持在語篇層次的高度;試題內(nèi)容應(yīng)為互動(dòng)性行為;試題中語言應(yīng)來自交際情景。第二,提高評(píng)分標(biāo)準(zhǔn)的科學(xué)客觀性,以提高此類試題的信度。首先,評(píng)分標(biāo)準(zhǔn)要以語言學(xué)習(xí)理論(尤其是寫作和口語學(xué)習(xí)的理論)為指導(dǎo)。其次,評(píng)分標(biāo)準(zhǔn)應(yīng)盡可能制定的具體準(zhǔn)確、清晰明了。最后,科學(xué)客觀的評(píng)分標(biāo)準(zhǔn)還要經(jīng)過反復(fù)的測(cè)試實(shí)踐驗(yàn)證,多次修改才能得來。第三,提高此類試題的可行性。這方面既需要測(cè)試設(shè)計(jì)者提高自身水平,更需要社會(huì)、教育主管部門、學(xué)校通力合作,提供充分的人力物力支持。
3.外語語言測(cè)試是一種對(duì)受試者聽、說、讀、寫綜合能力的考核。本文提到了測(cè)試語言輸出能力的試題具有較高的效度,并不是說它可以代替測(cè)試語言輸入能力的試題。在語言測(cè)試實(shí)踐中,應(yīng)將兩者有機(jī)結(jié)合,充分發(fā)揮各自優(yōu)勢(shì)。
[1]蕭春麟,劉清華.英語測(cè)試教程[M].上海:上海交通大學(xué)出版社,2001.
[2]鄒申.英語語言測(cè)試—理論與操作[M].上海:上海外語教育出版社,1998.
[3]孔文,李清華.語言測(cè)試真實(shí)性的多維分析[J].解放軍外國語學(xué)院學(xué)報(bào),2003,(1):55-58.
[4]吳小珊.論英語測(cè)試信度和效度的平衡關(guān)系[J].廣西民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2007,(12).