閱讀測(cè)試一直是各級(jí)各類語(yǔ)言能力測(cè)試的重要組成部分,其一般形式是:受試者在規(guī)定的時(shí)間內(nèi)閱讀若干書面文字材料,并完成依據(jù)該文字材料編制的若干試題。這就意味著閱讀材料是影響閱讀測(cè)試效度的因素之一,閱讀測(cè)試題的編制者在選擇閱讀材料時(shí)往往會(huì)遵循一些基本的原則,以使測(cè)試更為有效。本文試從效度這個(gè)視角,以中外閱讀測(cè)試實(shí)踐為例,來(lái)對(duì)閱讀測(cè)試中閱讀材料的選擇問(wèn)題做一些粗淺的探討。雖然當(dāng)前學(xué)界傾向于將效度作為一個(gè)整體概念來(lái)認(rèn)識(shí),但是出于論述的需要,本文還是細(xì)分了三類效度:表面效度、內(nèi)容效度和結(jié)構(gòu)效度。
一、閱讀測(cè)試材料與測(cè)試的表面效度
“表面效度是指測(cè)驗(yàn)在表面上使被試直覺感到的有效性程度。假如一個(gè)測(cè)驗(yàn)使被試從表面上看來(lái),它能夠測(cè)量出欲測(cè)量的屬性,則認(rèn)為該測(cè)驗(yàn)具有表面效度?!本唧w到閱讀測(cè)試而言,閱讀材料的長(zhǎng)度以及難度常常成為影響表面效度的關(guān)鍵因素。
1 閱讀材料的長(zhǎng)度問(wèn)題。閱讀測(cè)試要想取得較高的表面效度,閱讀材料的長(zhǎng)度應(yīng)該適中,那些過(guò)長(zhǎng)的材料會(huì)使多數(shù)受試者無(wú)法完成測(cè)試,而過(guò)短的材料則讓受試者覺得測(cè)試太容易。一般而言,人們認(rèn)為閱讀能力的高低也決定著閱讀速度的快慢,所以在閱讀測(cè)試中,測(cè)試的編制者傾向于為高年級(jí)的學(xué)生選擇更長(zhǎng)的閱讀材料。我們知道語(yǔ)文課程標(biāo)準(zhǔn)中對(duì)各學(xué)段學(xué)生的閱讀速度有比較明確的要求,其中對(duì)第四學(xué)段的要求是“閱讀一般的現(xiàn)代文每分鐘不少于500字”。但是,需要注意的是,閱讀材料的適宜長(zhǎng)度并非時(shí)間和速度的簡(jiǎn)單乘積。因?yàn)槭茉囌咴陂喿x較長(zhǎng)的文章時(shí),出于維持整體感和尋找目標(biāo)信息的需要,其回視的次數(shù)也會(huì)增加。還有,不同類型的材料,所需要的閱讀時(shí)間也是不同的。所以,閱讀材料的長(zhǎng)度問(wèn)題涉及很多因素,并不存在一個(gè)嚴(yán)格的字?jǐn)?shù)標(biāo)準(zhǔn)。從閱讀測(cè)試實(shí)踐來(lái)看,測(cè)試編制者在選擇材料時(shí),會(huì)考慮長(zhǎng)度問(wèn)題,但主要的措施是確定一個(gè)大致的范圍。相關(guān)統(tǒng)計(jì)表明:近年來(lái)中考語(yǔ)文的閱讀測(cè)試,有90%以上的試卷選擇了2篇或者3篇閱讀材料,其中文學(xué)類的閱讀材料字?jǐn)?shù)多在1100字左右,而說(shuō)明、議論類的材料字?jǐn)?shù)多在600~1000之間。美國(guó)NAEP(NationalAssessment of Educational Proclress) 對(duì)于閱讀材料的長(zhǎng)度有比較明確的說(shuō)明,其中四年級(jí)為250~800字,八年級(jí)為400~1000字,十二年級(jí)則為500~1500字。如果單純從長(zhǎng)度方面考慮,中美閱讀測(cè)試材料的選擇可以說(shuō)是大體一致的,這也是多年測(cè)試經(jīng)驗(yàn)積累的結(jié)果,筆者認(rèn)為可以作為一般的參照標(biāo)準(zhǔn)。
2 閱讀材料的難度問(wèn)題。與閱讀材料的長(zhǎng)短相比,測(cè)試的編制者們更為關(guān)心的是閱讀材料的難度問(wèn)題,他們對(duì)閱讀材料長(zhǎng)度的考慮往往是與難度結(jié)合在一起的。這個(gè)問(wèn)題比較復(fù)雜,因?yàn)橛卸喾N因素影響著閱讀材料的難度,而且難度是一個(gè)相對(duì)的概念。當(dāng)然,這并不意味著難度是完全無(wú)法控制的。
首先,閱讀材料的難度與閱讀材料語(yǔ)言本身的可讀性密切相關(guān)。可讀性是指對(duì)具有一定技能水平的讀者閱讀一篇論文或文章時(shí)困難程度的評(píng)價(jià),現(xiàn)在許多國(guó)家會(huì)采用專業(yè)的公式來(lái)測(cè)量閱讀材料的可讀性,比如在英語(yǔ)國(guó)家廣泛采用的Flesh公式。該公式的計(jì)算方法是:閱讀難易指數(shù)=206.835-(0.864×SYLL/100W)-(1.015×WDS/sEN),其中WDS/SEN是指每句中的平均詞數(shù),SYLL/100W是指每100個(gè)詞的平均音節(jié)數(shù)。此類公式所測(cè)出的可讀性,往往作為英語(yǔ)閱讀測(cè)試中閱讀材料難度選擇的重要參考標(biāo)準(zhǔn)。雖然現(xiàn)在還沒有衡量漢語(yǔ)閱讀材料可讀性的成熟公式,但是從普遍的經(jīng)驗(yàn)來(lái)看,國(guó)內(nèi)目前對(duì)漢語(yǔ)閱讀材料可讀性的研究,主要關(guān)注的也是句子的測(cè)度和詞匯的測(cè)度。句子的測(cè)度主要是測(cè)量句子的復(fù)雜性,一般認(rèn)為句子越長(zhǎng),結(jié)構(gòu)越復(fù)雜,其可讀性也就越低。詞匯的測(cè)度包括詞匯的難度和復(fù)雜性,通常用的指標(biāo)包括材料中常用詞和非常用詞的比例等。正是出于可讀性的考慮,測(cè)試的編制者在選擇閱讀材料時(shí),會(huì)盡量避免生難的詞匯和繁復(fù)的句式對(duì)受試者的閱讀造成不必要的障礙。比如,對(duì)一些比較重要的生難詞匯,中考閱讀測(cè)試中往往會(huì)給予注釋,或者使用相對(duì)簡(jiǎn)單的同義詞匯進(jìn)行替換。
其次,閱讀材料的難度與文本意義的復(fù)雜性,以及讀者相關(guān)背景知識(shí)的掌握程度也密不可分。有些閱讀材料在詞匯、句式等方面可能并沒有什么難度,但是,如果其內(nèi)容比較復(fù)雜,或者具有濃厚的專業(yè)色彩,中學(xué)生閱讀起來(lái)也會(huì)相當(dāng)困難。在多數(shù)情況下,測(cè)試的編制者會(huì)依靠直覺和經(jīng)驗(yàn)來(lái)采取一些措施,控制閱讀材料在內(nèi)容上的難度。常用的策略如下:
一是關(guān)注受試者的背景知識(shí)。如果在閱讀材料中出現(xiàn)過(guò)于深?yuàn)W的道理或者過(guò)多的專業(yè)知識(shí),測(cè)試的編制者就需要評(píng)估這些因素在多大程度上會(huì)對(duì)受試者的閱讀理解造成干擾。如果有些背景知識(shí)很重要。而大多數(shù)的受試者卻并不具備,那么該閱讀材料的難度顯然超出了受試者的接受范圍。二是控制所選擇閱讀材料的題材范圍。例如,中考現(xiàn)代文閱讀測(cè)試中所選擇的閱讀材料,多數(shù)是與中學(xué)生的生活環(huán)境或者思維特性相關(guān)的,比如情感經(jīng)歷、社會(huì)熱點(diǎn)、自然世界等。美國(guó)NAEP閱讀測(cè)試對(duì)選擇閱讀材料的標(biāo)準(zhǔn)有明確的說(shuō)明,他們不僅強(qiáng)調(diào)材料的主題、語(yǔ)言要適合考生,還將考生的興趣及知識(shí)背景納入考慮。
值得注意的是,在實(shí)際生活中。專門為中學(xué)生創(chuàng)作的文章并不多,能切合測(cè)試編選標(biāo)準(zhǔn)的更為稀少。所以,測(cè)試的編制者往往會(huì)面臨強(qiáng)為“無(wú)米之炊”的尷尬。比如,中考的說(shuō)明文往往會(huì)涉及生物、醫(yī)藥、信息技術(shù)等專業(yè)領(lǐng)域,其中有些文章包含較多的專業(yè)術(shù)語(yǔ)和科學(xué)原理。這些閱讀材料常常會(huì)引起抱怨,考生會(huì)認(rèn)為這些材料的內(nèi)容過(guò)難,似乎不是在考語(yǔ)文,而是在考物理、生物等學(xué)科的專業(yè)知識(shí)。要解決這個(gè)問(wèn)題,除了測(cè)試編制者的努力之外,似乎也需要科普作家的參與。除了排除較難的材料之外,控制閱讀材料的難度,實(shí)際上也意味著不能出現(xiàn)過(guò)于簡(jiǎn)單的材料。閱讀材料不應(yīng)是受試者熟悉的材料,曾經(jīng)學(xué)習(xí)過(guò)的材料就更不適合了。前些年,中考語(yǔ)文試卷中還會(huì)選擇教科書中的文章,這很難說(shuō)是測(cè)試閱讀能力還是記憶能力了。
需要指出的是,無(wú)論是閱讀材料的長(zhǎng)度還是難度,都是從受試者的角度而言的。這就意味著,要做到使閱讀測(cè)試具有表面效度,實(shí)際上最基礎(chǔ)的工作是對(duì)受試者的閱讀心理和行為特征進(jìn)行深入研究,其中尤為重要的是對(duì)篇章閱讀的研究。在過(guò)去,研究者比較強(qiáng)調(diào)篇章中的詞匯因素,因而控制詞匯成為控制閱讀難度的主要方法。隨著認(rèn)知心理學(xué)的發(fā)展,用圖式理論來(lái)說(shuō)明閱讀理解過(guò)程成為研究閱讀理解的主流。圖式理論關(guān)于篇章閱讀的一系列觀點(diǎn),也許可以為我們當(dāng)前控制閱讀難度提供新的思路。
二、閱讀測(cè)試材料與測(cè)試的內(nèi)容效度
“所謂內(nèi)容效度就是指測(cè)驗(yàn)內(nèi)容對(duì)所要測(cè)量的內(nèi)容的代表性程度。這種代表性表現(xiàn)為測(cè)驗(yàn)的內(nèi)容范圍、材料與所要測(cè)量的內(nèi)容范圍、教育目標(biāo)是否相符,測(cè)驗(yàn)中測(cè)題所引起的行為是不是所要測(cè)量的屬性的明確反應(yīng),測(cè)驗(yàn)的結(jié)果是不是一個(gè)具有代表性的行為樣本,等等?!本烷喿x測(cè)試而言,測(cè)試不可能讓受試者閱讀所有的文本,只能通過(guò)選擇一些閱讀材料進(jìn)行命題,從而對(duì)他們整體的閱讀能力進(jìn)行推斷。所以,較好的效度意味著測(cè)試中所選擇的閱讀材料要具有一定的代表性。
閱讀測(cè)試材料是否能夠成為代表,首先取決于這些閱讀材料是否具有真實(shí)性。所謂真實(shí),是指受試者在測(cè)試中的閱讀和實(shí)際閱讀情境中的閱讀具有最大程度的相似性,否則閱讀測(cè)試就無(wú)法反映受試者實(shí)際的閱讀能力。也就是說(shuō),閱讀測(cè)試的編制者在選擇閱讀材料的時(shí)候,需要考慮用來(lái)測(cè)試閱讀能力的這些文本,是不是受試者在真實(shí)的閱讀中所遇到的文本形式。從中考閱讀測(cè)試來(lái)看,閱讀材料多來(lái)源于近幾年的報(bào)刊。尤其是《讀者》之類的文摘類雜志。還有一些出自作家的作品集。這些材料一般都保持原文面貌,不會(huì)做大的改動(dòng)。同樣,NAEP也強(qiáng)調(diào)閱讀材料應(yīng)該是學(xué)生日常所讀的普通文本,只會(huì)對(duì)其中個(gè)別生僻或者復(fù)雜的字詞做些改動(dòng),不會(huì)采用經(jīng)過(guò)簡(jiǎn)化、改編或者刪節(jié)的材料。
其次,選擇的閱讀材料要多樣化。在真實(shí)的閱讀情境中,讀者會(huì)遇到各種題材和體裁的文章。在閱讀測(cè)試中,閱讀材料不應(yīng)該只是單一的文本類型。這里討論的多樣性。顯然只能是一個(gè)相對(duì)的概念,畢竟這些材料是測(cè)試編制者主觀選擇的結(jié)果,他們會(huì)基于測(cè)試目的及測(cè)量指標(biāo)的要求,篩選出相應(yīng)的文本類型。至于文本類型的劃分,可以有不同的維度。比如PISA(Programme for InternationalStudent Assessment)閱讀材料的選擇,考慮了四個(gè)題材變量,包括用于私人使用的閱讀活動(dòng)、用于公眾使用的閱讀活動(dòng)、用于工作使用的閱讀活動(dòng),以及用于教育使用的閱讀活動(dòng)。NAEP則區(qū)分了三種閱讀情境:為了獲取文學(xué)體驗(yàn)、為了獲取信息、為了完成任務(wù)。不同閱讀情境對(duì)應(yīng)的文本類型也不同,文學(xué)體驗(yàn)類文本包括小說(shuō)、故事、詩(shī)歌、戲劇、傳記等;信息類文本則是指雜志、報(bào)紙、教科書、講演材料等;任務(wù)類文本則包括列車時(shí)刻表、維修指南、游戲指南、課程表、地圖等。PISA關(guān)注被試是否具有基本的閱讀素養(yǎng),作為將來(lái)參與社會(huì)生活的基礎(chǔ),所以其文本類型的劃分考慮到了被試所充當(dāng)?shù)纳鐣?huì)角色;而NAEP更為關(guān)注被試作為一個(gè)普通讀者在日常閱讀中的能力表現(xiàn),所以其文本類型的劃分淡化了讀者的社會(huì)角色,而采取了閱讀的日常功用這個(gè)角度。相形之下,國(guó)內(nèi)中考的現(xiàn)代文閱讀測(cè)試更為關(guān)注被試在教育領(lǐng)域內(nèi)的表現(xiàn),其文本類型重視和實(shí)際語(yǔ)文教學(xué)的接軌,主要還是基于一般意義上的教學(xué)文體劃分標(biāo)準(zhǔn)。雖然各地試卷所選擇的現(xiàn)代文閱讀材料類型不盡相同,但總體來(lái)說(shuō),散文類或者小說(shuō)類的文學(xué)作品占據(jù)了閱讀材料的半壁江山。除此之外,試卷中出現(xiàn)較多的就是說(shuō)明文以及議論性文章。有統(tǒng)計(jì)表明:在2007年的各地中考語(yǔ)文試卷中,文學(xué)作品在現(xiàn)代文閱讀材料中所占比例為45.7%,說(shuō)明文占了31%,議論文占了23.3%。生活中常見的一些文體類型,諸如新聞報(bào)道、說(shuō)明書、會(huì)議通知、廣告、地圖、時(shí)刻表等,因?yàn)椴皇莻鹘y(tǒng)閱讀教學(xué)的主要內(nèi)容,所以很少作為閱讀測(cè)試的材料。
如果從效度的角度看,無(wú)論是NAEP還是中考,對(duì)內(nèi)容效度的追求是一致的,因而兩者閱讀材料分類的差異,實(shí)質(zhì)是對(duì)測(cè)試內(nèi)容的理解差異。這種差異也體現(xiàn)在學(xué)校課程層面,因?yàn)殚喿x測(cè)試無(wú)論是要實(shí)現(xiàn)診斷功能還是選拔功能,測(cè)量?jī)?nèi)容都必然與閱讀教學(xué)實(shí)踐相適應(yīng)。正是基于這個(gè)原因,中考閱讀測(cè)試對(duì)文本類型的區(qū)分,基本因襲了傳統(tǒng)語(yǔ)文教學(xué)關(guān)于文體的認(rèn)識(shí)框架。與此類似的是,上述NAEP所涉及的文本類型,在美國(guó)的閱讀教學(xué)中也有體現(xiàn)。以俄亥俄州克利夫蘭市的英語(yǔ)課程說(shuō)明為例,其閱讀教學(xué)目標(biāo)具體分為針對(duì)小說(shuō)或非小說(shuō)類文章、一般性或功能性文章等不同類型文本的閱讀要求。我們不難在兩者之間看到某種隱含的分類標(biāo)準(zhǔn):文本的文學(xué)體驗(yàn)價(jià)值及功能性。
三、閱讀測(cè)試材料與測(cè)試的結(jié)構(gòu)效度
“所謂結(jié)構(gòu)效度是指測(cè)驗(yàn)對(duì)于人的假設(shè)屬性或理論概念測(cè)量到的程度?!本唧w到閱讀測(cè)試而言。就是測(cè)試項(xiàng)目對(duì)編制該測(cè)試所依據(jù)的閱讀能力理論的各個(gè)基本方面的反映程度。結(jié)構(gòu)效度的本質(zhì)要求是,閱讀測(cè)試應(yīng)該建立在一種明晰的閱讀能力結(jié)構(gòu)理論基礎(chǔ)之上,并以該閱讀能力框架為標(biāo)準(zhǔn)來(lái)選擇恰當(dāng)?shù)拈喿x材料。一般的測(cè)試研究者更為關(guān)注閱讀題目設(shè)計(jì)與閱讀能力考查之間的關(guān)系,而容易忽略這樣一個(gè)事實(shí):測(cè)試編制者所持有的閱讀能力觀念。實(shí)際上對(duì)閱讀材料的選擇也具有重要影響。我們都知道閱讀測(cè)試的目的是測(cè)試語(yǔ)文閱讀能力,可是“閱讀能力”卻并不是個(gè)不言自明的概念,一種閱讀測(cè)試必然體現(xiàn)了某種對(duì)閱讀活動(dòng)過(guò)程以及閱讀能力的特定理解,而這種理解也決定了某些閱讀材料更適合用來(lái)進(jìn)行測(cè)試。
當(dāng)前國(guó)內(nèi)關(guān)于閱讀能力結(jié)構(gòu)的觀點(diǎn)有很多,其中大多是對(duì)閱讀經(jīng)驗(yàn)的系統(tǒng)化解釋,大體都傾向于認(rèn)為閱讀是“認(rèn)讀—理解—鑒賞—應(yīng)用”的過(guò)程。比如曾祥芹等人認(rèn)為,在基礎(chǔ)教育階段,閱讀能力目標(biāo)可以分為以下五個(gè)層級(jí):
①認(rèn)讀能力:認(rèn)識(shí)漢字、積累詞語(yǔ)、了解文字所表示的意義。
②解讀能力:理解句子、段落的意義和聯(lián)系。理解全篇主旨,體會(huì)作者感情。
③賞讀能力:欣賞課文優(yōu)美、精辟的語(yǔ)句,欣賞文章的內(nèi)容和形式,欣賞文學(xué)作品的形象和描寫,鑒賞其語(yǔ)言和技巧。
④評(píng)讀能力:對(duì)課文的內(nèi)容、語(yǔ)言和寫法提出自己的看法或疑問(wèn),得出自己的見解。
⑤應(yīng)用能力:在說(shuō)話或?qū)懽髦兄苯右米x物的原句,闡述或發(fā)揮讀物的觀點(diǎn),借鑒讀物的形式,或運(yùn)用讀物的方法解決問(wèn)題。
如果要有效地考查這些閱讀能力,一般的閱讀測(cè)試編制者會(huì)對(duì)閱讀材料進(jìn)行精心選擇,也就是看閱讀材料有沒有這些“命題點(diǎn)”或者“考點(diǎn)”。比如,為了考查學(xué)生對(duì)全篇主旨的理解,就會(huì)盡量地選擇那些主旨鮮明的文章;為了考查學(xué)生的賞讀能力,就會(huì)盡量地選擇那些在寫作技巧方面比較突出的文章。當(dāng)前中考試題的編制者對(duì)閱讀能力的理解,可以說(shuō)與上述曾氏所分的前四個(gè)層級(jí)大同小異。以2007年湖北武漢的中考語(yǔ)文試卷為例,該卷現(xiàn)代文閱讀測(cè)試包含兩組材料,其中第二段為一篇散文,標(biāo)題為“海邊荒石”。該段材料設(shè)計(jì)了四道題:
15 第7段說(shuō),離開了海水,“這些石頭分明全死了”,結(jié)合文章內(nèi)容,說(shuō)說(shuō)這里的“死了”是什么意思。
16 文章說(shuō):“面對(duì)傾心或喜愛的東西,我們多么容易犯傻?!边@句話表現(xiàn)了“我”什么樣的心情?這種心情是怎樣產(chǎn)生的?
17 這篇文章的主旨(中心思想)是什么?試作簡(jiǎn)要概括。
18 作者說(shuō),浸潤(rùn)在海水里的石頭像“散發(fā)著靈異之光的寶藏”,離開了海水的石頭“怪模怪樣…‘灰不溜秋”,這是一種什么寫法?文章這樣寫的作用是什么?試從兩個(gè)方面作答。
不難看出這四個(gè)題目所對(duì)應(yīng)的閱讀能力要求是:理解詞語(yǔ)、體會(huì)感情、概括主旨、鑒賞評(píng)價(jià)寫法。這篇文章是時(shí)下典型的抒情散文,題目設(shè)計(jì)也是典型的考題類型。不過(guò),這種與散文相對(duì)應(yīng)的閱讀能力指標(biāo),卻不大容易直接搬用到說(shuō)明文和議論文中,所以中考說(shuō)明文和議論文文章的測(cè)試題目,大多是結(jié)合文體特征來(lái)設(shè)題,比如考說(shuō)明方法和議論方法等,所選材料也是典型的具有該文體特征的文章。究其原因,長(zhǎng)期以來(lái)我們對(duì)于閱讀能力的理解,是閱讀經(jīng)驗(yàn)的系統(tǒng)化解釋,從而形成了將文本類型與閱讀測(cè)試能力指標(biāo)簡(jiǎn)單對(duì)應(yīng)的思路。反過(guò)來(lái),這種閱讀能力觀念,也固化了閱讀材料選擇的標(biāo)準(zhǔn),使得文本的多樣性不夠。
前文所提到的2007年武漢中考試卷中還有一組材料值得注意。這組材料不是我們常見的單篇文章,而是三個(gè)語(yǔ)篇,分別是《安妮日記》的節(jié)選,奧斯特洛夫斯基《理想與幸福》一文的節(jié)選,以及約瑟夫·愛潑斯坦《抱負(fù)》一文的節(jié)選。其中有這樣一個(gè)題目:“[材料二]中奧斯特洛夫斯基在疾病纏身、十分痛苦的情況下,創(chuàng)造了輝煌,獲得了常人難以得到的幸福,靠的是對(duì)人生理想的不懈追求。他的經(jīng)歷證明了[材料三]中哪一句話的觀點(diǎn)?”顯然,測(cè)試編制者有意重點(diǎn)考查綜合、比較閱讀的能力,所以采用了這種組合式的材料。我們從中不難看出這種習(xí)慣思路:將閱讀測(cè)試能力指標(biāo)和特定的文本類型相對(duì)應(yīng),實(shí)在沒有,就造出來(lái)。
盡管NAEP對(duì)于閱讀能力的定義也無(wú)外乎理解、評(píng)價(jià)、應(yīng)用等一些基本要素,但是測(cè)試編制者將閱讀能力分為四個(gè)方面:整體理解、形成解釋、聯(lián)系自身、做出評(píng)價(jià)。為了使得測(cè)試更具有操作性,測(cè)試編制者又將各個(gè)方面的能力細(xì)化為處理問(wèn)題或任務(wù)時(shí)的表現(xiàn),從而形成較為清晰、嚴(yán)整的閱讀能力指標(biāo)體系。從這個(gè)意義上來(lái)說(shuō),NAEP等國(guó)外的閱讀測(cè)試作為“他山之石”的價(jià)值在于:它們是我們映照閱讀能力指標(biāo)體系的一面鏡子。換句話說(shuō),如果要借鑒國(guó)外的閱讀測(cè)試,由于閱讀能力結(jié)構(gòu)認(rèn)識(shí)以及語(yǔ)文教學(xué)實(shí)踐的差異,照搬照抄的結(jié)果必然是“水土不服”,有效的途徑是通過(guò)對(duì)閱讀過(guò)程的研究,來(lái)修正現(xiàn)行測(cè)試的閱讀能力指標(biāo)。反過(guò)來(lái)說(shuō),如果測(cè)試所依據(jù)的指標(biāo)比較零散,測(cè)量的變量增多,有些能力指標(biāo)就會(huì)與整體結(jié)構(gòu)不相關(guān),結(jié)構(gòu)效度自然大打折扣。而閱讀能力指標(biāo)的模糊,則可能會(huì)產(chǎn)生兩個(gè)后果:一個(gè)是隨意選擇閱讀材料,有什么材料命什么題;另一個(gè)則是選擇特定的某類文章,依據(jù)此類文章的命題經(jīng)驗(yàn)來(lái)避免測(cè)試信度和效度的降低。
眾所周知,測(cè)試編制者選擇閱讀測(cè)試材料的工作是一個(gè)復(fù)雜的過(guò)程,要考慮包括測(cè)試效度在內(nèi)的諸多因素??墒?,我們當(dāng)前對(duì)這個(gè)問(wèn)題的認(rèn)識(shí)還主要停留在經(jīng)驗(yàn)和直覺的層面,當(dāng)務(wù)之急是在測(cè)試學(xué)以及閱讀心理學(xué)的基礎(chǔ)上,確定閱讀材料選擇的理性原則。唯有如此,閱讀測(cè)試才能更為成熟和有效。