劉瀟
摘 要 本文從國內(nèi)近年來對于標(biāo)準(zhǔn)參照測驗(yàn)的一系列探索出發(fā),對國內(nèi)學(xué)者對于標(biāo)準(zhǔn)參照測驗(yàn)的相關(guān)理論和評價(jià)指標(biāo)做的研究和陳述主要包括標(biāo)準(zhǔn)參照測驗(yàn)的評價(jià)指標(biāo)如信效度,測驗(yàn)長度以及分?jǐn)?shù)體系做了一個(gè)綜合述評。
關(guān)鍵詞 標(biāo)準(zhǔn)參照測驗(yàn) 評價(jià)指標(biāo) 分?jǐn)?shù)體系
中圖分類號:O212 文獻(xiàn)標(biāo)識碼:A
1標(biāo)準(zhǔn)參照測驗(yàn)的定義與作用
1.1標(biāo)準(zhǔn)參照測驗(yàn)的定義
匹斯堡大學(xué)的Glaser首次提出標(biāo)準(zhǔn)參照測驗(yàn),將測驗(yàn)分成標(biāo)準(zhǔn)參照測驗(yàn)和常模參照測驗(yàn)。后來許多學(xué)者將內(nèi)容參照、領(lǐng)域參照等解釋為標(biāo)準(zhǔn)參照。
標(biāo)準(zhǔn)參照測驗(yàn)又稱準(zhǔn)則參照測驗(yàn)。是一種精心編制的,在一定的行為領(lǐng)域上按照具體標(biāo)準(zhǔn)水平對測驗(yàn)結(jié)果作出直接解釋的測驗(yàn)。是一種與以經(jīng)典測驗(yàn)理論為基礎(chǔ)的與常模參照測驗(yàn)相對的測驗(yàn)類型。
1.2標(biāo)準(zhǔn)參照測驗(yàn)的作用
了解個(gè)體在所規(guī)定的測量內(nèi)容上的行為水平,其出發(fā)點(diǎn)是個(gè)體本身的絕對水平,而不是個(gè)體間的差異。
2標(biāo)準(zhǔn)參照測驗(yàn)與常模參照測驗(yàn)的不同
常模參照測驗(yàn)的分?jǐn)?shù)反應(yīng)了一個(gè)人在所屬群體中的相對位置,常模代表了某一群體的真正水平,而標(biāo)準(zhǔn)參照測驗(yàn)的分?jǐn)?shù)標(biāo)志一個(gè)人能力或知識的絕對水平,不與其他人的分?jǐn)?shù)比較,標(biāo)準(zhǔn)是希望達(dá)到的目標(biāo),對個(gè)體作出是否達(dá)標(biāo)或達(dá)到什么程度的判斷,有很大的人為性。
3標(biāo)準(zhǔn)參照測驗(yàn)的評價(jià)指標(biāo)
3.1標(biāo)準(zhǔn)參照測驗(yàn)的信度估計(jì)
標(biāo)準(zhǔn)參照測驗(yàn)的信度估計(jì)方法很多,如克龍巴赫 系數(shù)或CTT中的其它信度指標(biāo)。標(biāo)準(zhǔn)參照測驗(yàn)一定程度上有別于常模參照測驗(yàn),許多的學(xué)者對其信度估計(jì)做了很多的闡述和研究。
香港中文大學(xué)的楊志明教授用概化理論中的可靠性指數(shù) 和 ( )公式,分別針對交叉設(shè)計(jì)和嵌套設(shè)計(jì),就標(biāo)準(zhǔn)參照性測驗(yàn)的整體信度和等級分?jǐn)?shù)線決策信度的估計(jì)問題進(jìn)行了探討。用數(shù)據(jù)演示的方法比較了交叉設(shè)計(jì)與嵌套設(shè)計(jì)在估計(jì)標(biāo)準(zhǔn)參照性測驗(yàn)整體信度方面的差異,展示了等級決策分?jǐn)?shù)線決策信度的估計(jì)方法。
安徽師大的趙必華教授在《標(biāo)準(zhǔn)參照測驗(yàn)信度的估計(jì)方法及其驗(yàn)證》中列舉了四種標(biāo)準(zhǔn)參照測驗(yàn)信度的估計(jì)方法,分別是斯旺明內(nèi)森方法;惠恩方法;薩伯考維克方法;瑪希爾方法。
3.2標(biāo)準(zhǔn)參照測驗(yàn)的效度估計(jì)
對標(biāo)準(zhǔn)參照測驗(yàn)的效度估計(jì)主要是內(nèi)容效度的估計(jì),主要從以下兩方面入手:一是測題的正確性即指測題正確地反映測量目標(biāo)所欲測量的知識、技能的程度。檢驗(yàn)主要包括:測題的技術(shù)質(zhì)量和測題與測量目標(biāo)之間的一致性程度;二是測題的代表性,即要求組成標(biāo)準(zhǔn)參照測驗(yàn)的測題必須對測驗(yàn)領(lǐng)域總體有一定的代表性,從而使測驗(yàn)具有較高的內(nèi)容效度。為了保證測題的代表性,標(biāo)準(zhǔn)參照測驗(yàn)編制中往往需要制訂雙向細(xì)目表;同時(shí)人們也提出了利用“重復(fù)實(shí)驗(yàn)”方法。
3.3標(biāo)準(zhǔn)參照測驗(yàn)的長度
在標(biāo)準(zhǔn)參照測驗(yàn)中,測驗(yàn)長度的決策不僅要結(jié)合特定的測驗(yàn)分界分?jǐn)?shù),而且要以降低錯(cuò)誤肯定和錯(cuò)誤拒絕的誤差概率為原則。因此,標(biāo)準(zhǔn)參照測驗(yàn)長度的確定不是以常模參照測驗(yàn)中的斯皮爾曼布朗信度估計(jì)理論為基礎(chǔ),而是采用米爾曼的二項(xiàng)式概率模型法、威爾克森的不肯定區(qū)域法以及項(xiàng)目反應(yīng)理論下的信息函數(shù)值法。
這些研究方法進(jìn)行長度決策時(shí)的基本宗旨是:在符合測量誤差標(biāo)準(zhǔn)要求的前提下,尋求最符合經(jīng)濟(jì)原則的測驗(yàn)長度和合格分?jǐn)?shù)的優(yōu)化組合方式,將測驗(yàn)對被試掌握程度的錯(cuò)誤分類降低到最低限度。
針對標(biāo)準(zhǔn)參照測驗(yàn)長度的研究方法使用范圍最廣、理論基礎(chǔ)最成熟是米爾曼的二項(xiàng)式概率模型、威爾克斯的不肯定區(qū)域模型和項(xiàng)目反應(yīng)理論的擬合估計(jì)法。每種方法都有各自的適用條件,在具體情境中可以根據(jù)情況進(jìn)行方法選擇。
4標(biāo)準(zhǔn)參照測驗(yàn)的分?jǐn)?shù)體系
標(biāo)準(zhǔn)參照測驗(yàn)分?jǐn)?shù)的報(bào)告和解釋還存在誤區(qū),許多考試仍沿用經(jīng)典測驗(yàn)理論中的常模參照方法來對其分?jǐn)?shù)報(bào)告和解釋。目前國內(nèi)有學(xué)者從國內(nèi)外的重大考試入手,通過探討分?jǐn)?shù)體系的共同點(diǎn)以找到適合于標(biāo)準(zhǔn)參照測驗(yàn)的分?jǐn)?shù)體系,為以后的一些標(biāo)準(zhǔn)參照測驗(yàn)的分?jǐn)?shù)體系提供參考。
國內(nèi)外有許多重大教育考試在使用標(biāo)準(zhǔn)參照測驗(yàn),每套測驗(yàn)都會有一個(gè)相對成熟的分?jǐn)?shù)體系。國內(nèi)常見的標(biāo)準(zhǔn)參照測驗(yàn)有大學(xué)英語四六級考試,漢語水平考試HSK等;國外的比如美國研究生入學(xué)考試GRE,美國大學(xué)水平考試CLEP等等。
盡管上述一些國內(nèi)外重大考試采用的分?jǐn)?shù)體系比較完善。但目前使用的一些標(biāo)準(zhǔn)參照測驗(yàn)的分?jǐn)?shù)體系仍存在大量的問題。首先分?jǐn)?shù)的報(bào)告和解釋過分依賴于標(biāo)準(zhǔn)樣本的分布;其次不同的等值方法和等值設(shè)計(jì)將造成了不同的等值誤差,且差異較大。但是樣本容量限制等現(xiàn)實(shí)情況使得許多測驗(yàn)不得不采用一些誤差較大的等值方案;再次,樣本選擇代表性受到了一定的限制,另外由各專家評定的標(biāo)準(zhǔn)試卷同樣無法避免其主觀性;最后,盡管采用了專家評定方法和樣本分布共同來確定分界線,但是具體的分?jǐn)?shù)線的確定因人的能力是連續(xù)變量而仍具有一定的主觀性。
5小結(jié)
隨著教育水平的不斷提高,標(biāo)準(zhǔn)參照測驗(yàn)在教育考試以及其他考試方面的重要性也逐漸凸顯,關(guān)于測驗(yàn)的編制和評估,以及分?jǐn)?shù)解釋等的完善也越來越重要,以往沿用常模參照測驗(yàn)的方式進(jìn)行的信度估計(jì),分?jǐn)?shù)解釋等工作已經(jīng)顯示出許多的局限性,對于新的理論方法的探索是迫切而十分有必要的,大量有待解決的問題需要人們在以后的工作中進(jìn)行進(jìn)一步的探索,希望以后有更多更好的辦法來解決這些問題,而為日后一些標(biāo)準(zhǔn)參照測驗(yàn)分?jǐn)?shù)體系的設(shè)計(jì)提供切合實(shí)際的參考。
參考文獻(xiàn)
[1] 甘良梅,余嘉元.標(biāo)準(zhǔn)參照測驗(yàn)分?jǐn)?shù)體系的探討研究.心理學(xué)探新,2006(3):79-83.
[2] 趙必華.標(biāo)準(zhǔn)參照測驗(yàn)信度的估計(jì)方法及其驗(yàn)證.寧波大學(xué)學(xué)報(bào)(理工版),2002(3):99-102.
[3] 楊志朋.標(biāo)準(zhǔn)參照測驗(yàn)及其等級線信度的概化理論分析.心理學(xué)探新,2003(3):52-56.
[4] 柴省三.標(biāo)準(zhǔn)參照測驗(yàn)長度研究方法探析.教育測量與評價(jià),2013(2):9-15.