【摘要】語(yǔ)言測(cè)試是檢驗(yàn)應(yīng)試者語(yǔ)言水平的重要手段。效度的高低是衡量語(yǔ)言測(cè)試最重要的指標(biāo)。構(gòu)念效度研究又處于效度研究的核心地位,也是測(cè)驗(yàn)代表語(yǔ)言學(xué)習(xí)基本理論程度的指標(biāo)。本文主要從語(yǔ)言測(cè)試的角度闡述構(gòu)念效度的概念以及影響構(gòu)念效度的因素。
【關(guān)鍵詞】效度 構(gòu)念效度 語(yǔ)言測(cè)試
【基金項(xiàng)目】2015年黑龍江大學(xué)研究生創(chuàng)新科研項(xiàng)目,“基于社會(huì)建構(gòu)主義理論的本科翻譯專業(yè)教學(xué)模式研究” 項(xiàng)目編號(hào):YJSCX2016-012HLJU,本項(xiàng)目由“黑龍江省外語(yǔ)教育學(xué)術(shù)交流研究基地”資助。
【中圖分類號(hào)】G64 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2016)08-0025-02
1.引言
語(yǔ)言測(cè)試是檢驗(yàn)應(yīng)試者語(yǔ)言水平的重要手段。效度指測(cè)試是否考查了設(shè)計(jì)者想要考查的內(nèi)容,或者說(shuō)在多大程度上考查了想要考查的內(nèi)容,效度的高低是衡量語(yǔ)言測(cè)試最重要的指標(biāo),它是語(yǔ)言測(cè)試的基本出發(fā)點(diǎn)。什么是構(gòu)念效度?影響構(gòu)念效度最常見(jiàn)的因素有哪些?
2.構(gòu)念效度及影響因素
2.1構(gòu)念效度
在教育測(cè)量領(lǐng)域,內(nèi)容效度、準(zhǔn)則關(guān)聯(lián)效度和構(gòu)念效度這三種類型效度都是作為整體構(gòu)念效度的不同方面。語(yǔ)言測(cè)試者認(rèn)為這種把構(gòu)念效度作為整體觀點(diǎn)是一種新的發(fā)展。理論界對(duì)構(gòu)念(construct)的定義有不同的看法,因此,通過(guò)識(shí)別他們是如何解釋應(yīng)答一致性來(lái)定義構(gòu)念(Messick 1981) 。Loevinger(1957:636)最早提出要把構(gòu)念效度作為整體效度來(lái)看待。在80 年代, 這一觀點(diǎn)逐漸得到人們的認(rèn)同: 構(gòu)念效度不再作為效度的一種證據(jù),而應(yīng)包括內(nèi)容和標(biāo)準(zhǔn)證據(jù)、信度及其它與理論驗(yàn)證有關(guān)的方法 (Messick 1989; Anastasi 1986)。一些測(cè)量學(xué)家主張把構(gòu)念效度作為惟一的效度概念(Cronbach1988; Anastasi 1988; Messick 1988, 1989)。
2.2 影響因素
根據(jù)Brown (1996:188-192)指出影響信度的五種類別問(wèn)題是由于測(cè)試環(huán)境、管理程序、考生、評(píng)分過(guò)程和測(cè)試結(jié)構(gòu)造成的。造成效度問(wèn)題的因素是可能是由于缺乏項(xiàng)目數(shù)量、項(xiàng)目編寫、對(duì)測(cè)試的引導(dǎo)、項(xiàng)目分析過(guò)程、可靠性研究以及效度分析等造成。
影響構(gòu)念效度的因素有很多,主要分為“構(gòu)念代表不足”(construct under-representation)和“構(gòu)念無(wú)關(guān)方差”(construct irrelevant variance)兩類。在教育領(lǐng)域中進(jìn)行評(píng)估的時(shí)候,我們總是會(huì)考慮到真實(shí)性(authenticity)和直接性(directness),因?yàn)樗鼈儗?duì)教與學(xué)產(chǎn)生積極的效果(Resnick and Resnick,1991)。同樣,真實(shí)性和直接性也構(gòu)成了效度的兩個(gè)標(biāo)準(zhǔn)(Messick,1996:243)。在對(duì)真實(shí)性進(jìn)行測(cè)量的時(shí)候最重要的是一定要考慮到構(gòu)念的評(píng)估(Messick,1994),這是最小構(gòu)念代表不足的效度標(biāo)準(zhǔn)。然而,盡管真實(shí)性暗示了最小構(gòu)念代表不足,但是確是不可觀測(cè)的。直接性評(píng)估涉及的往往是開(kāi)放式任務(wù),這樣做的目的也是使應(yīng)試者行為不受限制,這個(gè)就與構(gòu)念無(wú)關(guān)方差相關(guān)。因此,再考慮到直接性的測(cè)量問(wèn)題時(shí)就是不要加上任何不相關(guān)因素或是污染了構(gòu)念評(píng)估(Messick,1994)。構(gòu)念代表不足體現(xiàn)在是否對(duì)測(cè)試真實(shí)性構(gòu)成威脅,而構(gòu)念無(wú)關(guān)方差體現(xiàn)在對(duì)測(cè)試直接性的威脅。
構(gòu)念代表不足指測(cè)量指操作或測(cè)量方式未能涵蓋該構(gòu)念的全部層面,即不能代表構(gòu)念所包含的某些種類的內(nèi)容、所負(fù)載的某些心理過(guò)程,或者是排除了應(yīng)有的某些方式的反應(yīng)(Messick,1989、1995),因而會(huì)對(duì)測(cè)試分?jǐn)?shù)的解釋會(huì)產(chǎn)生不良影響。某一測(cè)試如果構(gòu)念體現(xiàn)不足,那么該測(cè)試就沒(méi)有涵蓋相關(guān)構(gòu)念的若干重要方面,也可以說(shuō)構(gòu)念體現(xiàn)的范圍太窄了。構(gòu)念無(wú)關(guān)方差指測(cè)試包含與擬測(cè)構(gòu)念無(wú)關(guān)的、額外并且相對(duì)穩(wěn)定的因素。此時(shí),測(cè)試的構(gòu)念比擬測(cè)的構(gòu)念更寬泛,因?yàn)闇y(cè)試己經(jīng)包括了其他構(gòu)念或者測(cè)量方法因素的影響,測(cè)試分?jǐn)?shù)可能受到這些因素的影響而在某種程度上系統(tǒng)地波動(dòng)。與擬測(cè)構(gòu)念無(wú)關(guān)的因素會(huì)導(dǎo)致測(cè)試構(gòu)念無(wú)效,成為測(cè)量偏差的主要來(lái)源。這會(huì)影響到對(duì)考試分?jǐn)?shù)的解釋,會(huì)對(duì)測(cè)試的構(gòu)念效度產(chǎn)生負(fù)面影響。這兩方面在所有的評(píng)估中都是存在的。然而,在測(cè)試的效度中,最重要的問(wèn)題就是要搜集足夠多的有說(shuō)服力的證據(jù)來(lái)反駁對(duì)效度構(gòu)成威脅的兩個(gè)因素。
3.結(jié)語(yǔ)
構(gòu)念效度驗(yàn)證研究測(cè)試所測(cè)量的能力,為測(cè)試提供理論基礎(chǔ)。效度檢驗(yàn)的過(guò)程是一個(gè)假設(shè)檢驗(yàn)的過(guò)程。它同時(shí)也是一個(gè)持續(xù)不斷的研究過(guò)程。因此我們要更好地了解影響構(gòu)念效度的主要因素。
參考文獻(xiàn):
[1]APA. 1966. Standards for Educational and Psychological Tests and Manuals [M]. Washington, DC: Author.
[2]Messick, S. 1996. Validity and washback in language testing [J]. Language Testing 13( 3): 241-56.
作者簡(jiǎn)介:
王天予(1989-),女,黑龍江伊春人,博士在讀,研究方向:語(yǔ)言測(cè)試,翻譯教學(xué)。