趙棟
摘 要: 隨著心理測(cè)量理論的發(fā)展,統(tǒng)計(jì)方法和計(jì)算機(jī)技術(shù)的更新,以及人們對(duì)于考試維權(quán)意識(shí)的增強(qiáng),效度概念的內(nèi)涵和外延在不斷發(fā)展變化。效度在考試質(zhì)量評(píng)價(jià)中的地位不斷得到提升,已經(jīng)成為測(cè)量評(píng)價(jià)中最重要的方面。本文通過(guò)對(duì)Messick的統(tǒng)一構(gòu)念效度理論的闡釋,總結(jié)統(tǒng)一構(gòu)念效度在實(shí)際運(yùn)用中所具有的特性,以加強(qiáng)對(duì)統(tǒng)一構(gòu)念效度的理解與運(yùn)用。
關(guān)鍵詞: 效度 構(gòu)念 構(gòu)念效度
構(gòu)念效度的出現(xiàn)是在二十世紀(jì)五十年代初期美國(guó)心理學(xué)會(huì)為彌補(bǔ)心理測(cè)量中概念的不足而引入的(Cronbach,1988),構(gòu)念是指具有個(gè)體差異而又不可捉摸的特征和能力的理論抽象。構(gòu)念是一種能力,指成功完成特定任務(wù)所要求的人類特性(Wiley,2002)。構(gòu)念不是一種客觀存在,而是為了某種測(cè)量目的而假設(shè)的抽象概念。Bachman(1990)對(duì)構(gòu)念效度做出了如下定義:構(gòu)念效度是關(guān)于測(cè)試表現(xiàn)與此測(cè)試基于某種能力理論或構(gòu)念理論所做出的預(yù)測(cè)的一致程度。Messick從測(cè)量構(gòu)念的本質(zhì)做出了定義:構(gòu)念效度即測(cè)量個(gè)體擁有或能展現(xiàn)出多少構(gòu)念。而Heppner,Kivlighan和Wampold(1992)對(duì)構(gòu)念效度的定義則體現(xiàn)了其測(cè)量假設(shè)檢驗(yàn)的性質(zhì),即測(cè)試者所選取的測(cè)量變量能在多大程度上體現(xiàn)出其假設(shè)構(gòu)念的本質(zhì)特性,換言之,即所測(cè)量的變量是否能夠代表其假設(shè)的構(gòu)念。Chapelle(1999)也對(duì)語(yǔ)言測(cè)試的假設(shè)檢驗(yàn)本質(zhì)指出:語(yǔ)言測(cè)試中的檢驗(yàn)假設(shè)是指一項(xiàng)測(cè)試所能測(cè)量的(即從測(cè)試分?jǐn)?shù)所得出的推論)及所得測(cè)量分?jǐn)?shù)的應(yīng)用(即基于測(cè)試分?jǐn)?shù)的決定)之間的假設(shè)。
將構(gòu)念效度提升成為在心理測(cè)量與語(yǔ)言測(cè)試學(xué)界核心地位的是由Messick所提出的效度框架,在此效度框架中Messick(1995)主張引入價(jià)值含義(value implication)和社會(huì)影響(social consequences)方面。他認(rèn)為,統(tǒng)一構(gòu)念效度的本質(zhì)是,分?jǐn)?shù)推斷要恰當(dāng)(appropriateness)、有意義(meaningfulness)和有用(usefulness),這三方面具有不可分割性;這種綜合解釋力來(lái)源于以實(shí)證數(shù)據(jù)為支持的分?jǐn)?shù)解釋(p747)。Messick(1995)設(shè)計(jì)并闡述了被稱為效度層面漸進(jìn)矩陣(facets of validity as a progressive matrix),區(qū)分統(tǒng)一構(gòu)念框架下,相互聯(lián)系的效度層面(facets)。隨著統(tǒng)一構(gòu)念框架的提出,構(gòu)念效度對(duì)測(cè)試分?jǐn)?shù)的合理解釋已具有核心作用。統(tǒng)一效度概念即把內(nèi)容效度、效標(biāo)關(guān)聯(lián)效度作為證據(jù)支撐,而將構(gòu)念效度置于核心地位。Messick(1998:1015)對(duì)構(gòu)念效度的地位做出了總結(jié):構(gòu)念效度的確是一個(gè)統(tǒng)一概念,它將效標(biāo)與內(nèi)容效度融合到一個(gè)共同框架之中,為基于某理論的假設(shè)提供證據(jù)支持,因此統(tǒng)一效度即指構(gòu)念效度。
Messick(1998:3)指出效度是一個(gè)統(tǒng)一的概念,即只有一種效度——構(gòu)念效度,而非傳統(tǒng)意義上對(duì)效度進(jìn)行的多種定義。統(tǒng)一意味著在效度檢驗(yàn)中分?jǐn)?shù)所具有的意義體現(xiàn)在基于分?jǐn)?shù)所做出的推斷之中。構(gòu)念效度作為統(tǒng)一效度的代名詞,Linn和Gronlund(2000:75-6)總結(jié)了統(tǒng)一效度的一些特性。
首先,效度是對(duì)測(cè)試結(jié)果解釋和使用的一種屬性,而不是測(cè)試和分?jǐn)?shù)本身的性質(zhì)。Cronbach(1971)指出效度并不是測(cè)試本身的特性,而是分?jǐn)?shù)所蘊(yùn)含的意義,他進(jìn)一步指出被認(rèn)為有效的并不是測(cè)試或觀察的手段,而是從分?jǐn)?shù)或其他指標(biāo)中所獲得的推斷。即便如此,也經(jīng)常能看到或聽(tīng)到有某一測(cè)試的效度或某一分?jǐn)?shù)的效度的說(shuō)法,Bachmann(2004:260)指出這種用法是不準(zhǔn)確的,更確切的說(shuō)法應(yīng)是測(cè)試分?jǐn)?shù)作為有效的指標(biāo)或者作為某一能力的有效測(cè)量。其次,對(duì)使用的某一測(cè)試的效度只是一個(gè)程度問(wèn)題。一個(gè)特定的測(cè)試分?jǐn)?shù)一定不能全面準(zhǔn)確地測(cè)量出某個(gè)特定能力,分?jǐn)?shù)解釋和使用的效度要依賴于解釋理論的邏輯理?yè)?jù)和支持這種理?yè)?jù)的實(shí)證依據(jù)的充足程度。因此,Bachman(2004:260)強(qiáng)調(diào)我們無(wú)法證明我們對(duì)分?jǐn)?shù)的解釋和使用是有效的,我們最多能提供依據(jù)說(shuō)明,我們意欲進(jìn)行的解釋和使用比其他可能的解釋和使用是更有道理的。再次,效度總是針對(duì)一定的測(cè)量目的而言的,不具有普遍性。當(dāng)一個(gè)測(cè)驗(yàn)被設(shè)計(jì)和使用時(shí),測(cè)驗(yàn)的使用者總是對(duì)分?jǐn)?shù)的解釋和使用有一系列的目的。因此,特定測(cè)試的分?jǐn)?shù)并不適用于其他情況和其他目的。對(duì)分?jǐn)?shù)的特定解釋取決于測(cè)試設(shè)計(jì)者如何定義所測(cè)能力或構(gòu)念,并且針對(duì)不同的使用目的和不同的受測(cè)者,對(duì)于特定能力的定義也會(huì)不同。最后,效度是一個(gè)關(guān)于整體的評(píng)價(jià)性判斷。首先,效度是一種評(píng)價(jià)性判斷。Cronbach(1988)指出效度是對(duì)測(cè)量意義和結(jié)果的實(shí)證性評(píng)價(jià)。實(shí)證性評(píng)價(jià),Messick解釋道,是指效度驗(yàn)證過(guò)程既是科學(xué)性的又是說(shuō)理性的,都需要有證據(jù)和論點(diǎn)的支撐。其次,實(shí)證性評(píng)價(jià)并不是單方面的。典型的效度論證需要好幾部分,并且需要各種不同的論據(jù)支撐,單獨(dú)的論據(jù)并不能有效地驗(yàn)證對(duì)于某個(gè)特定測(cè)試所期望的解釋和使用。
Messick(1995)區(qū)分出效度是統(tǒng)一概念的六個(gè)方面,是教育與心理測(cè)量中效度評(píng)判的標(biāo)準(zhǔn)。這六個(gè)方面為解決驗(yàn)證分?jǐn)?shù)解釋和使用中所涉及的多種類相互聯(lián)系的效度驗(yàn)證問(wèn)題提供了方法。