亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        非參數(shù)項(xiàng)目反應(yīng)理論回顧與展望

        2013-07-05 09:19:14康春花鐘曉玲
        中國(guó)考試 2013年6期
        關(guān)鍵詞:理論方法模型

        陳 婧 康春花 鐘曉玲

        1 引言

        20世紀(jì)60年代,測(cè)驗(yàn)理論經(jīng)歷了從經(jīng)典測(cè)驗(yàn)理論(Classical Test Theory,CTT)到項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)的巨大變革,IRT克服了CTT的種種局限,實(shí)現(xiàn)了對(duì)被試能力與其在特定項(xiàng)目上正確反應(yīng)概率之間關(guān)系的模型化,這使得20世紀(jì)60~70年代以來(lái),IRT成為心理計(jì)量學(xué)研究的核心內(nèi)容。然而,IRT的應(yīng)用與許多心理或教育測(cè)驗(yàn)的實(shí)際并不相符的,并在實(shí)際應(yīng)用中給研究人員造成了困難。首先,IRT的基本假設(shè)難以滿足。IRT理論基于能力的單維性、局部獨(dú)立性和單調(diào)性這三條強(qiáng)假設(shè)。當(dāng)所選擇的參數(shù)模型支持這些假設(shè)時(shí),所擬合的模型能夠提供大量關(guān)于項(xiàng)目和被試的信息。而在實(shí)際應(yīng)用中,所收集的數(shù)據(jù)往往難以滿足IRT的基本假設(shè)。其次,IRT要求在大樣本的基礎(chǔ)上才會(huì)有較好的精確性。但是,在實(shí)踐中,收集的數(shù)據(jù)往往達(dá)不到IRT對(duì)大樣本的要求,則IRT參數(shù)估計(jì)的精確性必然受到影響。正因?yàn)槿绱耍琁RT的理論研究一般以模擬研究居多,而應(yīng)用研究則在大尺度測(cè)評(píng)中才顯現(xiàn)優(yōu)勢(shì),在日常教學(xué)及學(xué)?;蛘n堂的小樣本測(cè)試中則無(wú)用武之地。因此,當(dāng)實(shí)際測(cè)評(píng)中的數(shù)據(jù)并不能完全吻合IRT的強(qiáng)假設(shè)以及樣本容量較小時(shí),非參數(shù)項(xiàng)目理論反應(yīng)理論(Non-parametric Item Response Theory,NIRT)為突破此困境提供了原理和方法。這是因?yàn)橄啾菼RT,NIRT除了提供了與實(shí)際日常情景更適應(yīng)更有彈性的理論框架,還發(fā)展出適宜小樣本數(shù)據(jù)的更簡(jiǎn)便易行的分析方法(Junker&Sijtsma,2001)。因此,在項(xiàng)目反應(yīng)理論蓬勃發(fā)展的同時(shí),更適于日常教學(xué)及其測(cè)評(píng)情境的非參數(shù)項(xiàng)目反應(yīng)理論應(yīng)該得到更多的關(guān)注及實(shí)踐應(yīng)用。

        2 非參數(shù)項(xiàng)目反應(yīng)理論的數(shù)學(xué)模型

        非參數(shù)項(xiàng)目理論的提出更加完善了參數(shù)項(xiàng)目反應(yīng)理論。在實(shí)際的測(cè)量中并不是所有的題目都能夠擬合項(xiàng)目項(xiàng)目反應(yīng)理論中的各個(gè)參數(shù),但是這些題目卻在測(cè)量中同樣起十分重要的作用,非參數(shù)項(xiàng)目反應(yīng)理論就很好地解決了這一問(wèn)題(Sijtsma,1998)。非參數(shù)項(xiàng)目反應(yīng)理論假設(shè)被試的能力水平與答對(duì)題目的概率相關(guān),能力水平越高的被試其答對(duì)的概率就越高,這點(diǎn)與參數(shù)項(xiàng)目反應(yīng)理論的假設(shè)是相同的。與參數(shù)項(xiàng)目反應(yīng)理論不同的是被試不以特質(zhì)值θ和題目的參數(shù)a、b描述被試的特質(zhì)水平,而是直接從被試在測(cè)試中所得的分?jǐn)?shù)進(jìn)行排序得出被試特質(zhì)水平的高低(雷新勇,2006)。根據(jù)理論假設(shè)的不同,可以將非參數(shù)項(xiàng)目反應(yīng)理論分為單調(diào)均質(zhì)模型(Monotone Homogeneity Model,MHM)和雙單調(diào)模型(Double Monotonicity Model,DMM)。

        2.1 單調(diào)均質(zhì)模型

        Mokken在1971年提出單調(diào)均質(zhì)模型(MHM),以單維性、局部獨(dú)立和項(xiàng)目反應(yīng)函數(shù)單調(diào)性假設(shè)為基礎(chǔ)(Sijtsma,1998)。單維性假設(shè)所有題目測(cè)量的是相同的潛在特質(zhì)。局部獨(dú)立性是假設(shè)被試本身應(yīng)答的獨(dú)立性和被試之間應(yīng)答的局部獨(dú)立性,所有的變化都是由被試的潛在特質(zhì)引起的,題目與被試之間也是獨(dú)立的。項(xiàng)目反應(yīng)理論的單調(diào)性假設(shè)說(shuō)明被試答對(duì)的概率是與其能力有關(guān)的,被試能力高答對(duì)的概率就高,根據(jù)被試在試題的得分對(duì)被試的潛在特質(zhì)進(jìn)行排序。

        設(shè)θ是一個(gè)固定的X+值,s和t是兩個(gè)不同的X+值,令0<s<t<k,則有

        說(shuō)明被試的測(cè)試得分與其能力值成正相關(guān),測(cè)試總分為s的被試其能力值低于測(cè)試總分為t的被試。

        2.2 雙單調(diào)模型

        雙單調(diào)模型也是Mokken在1971年在單調(diào)均質(zhì)模型的理論假設(shè)上提出的。DMM比MHM具有更嚴(yán)格的理論假設(shè),它在MHM的基礎(chǔ)上再加上項(xiàng)目反應(yīng)函數(shù)非相交性為基礎(chǔ)的非參數(shù)項(xiàng)目反應(yīng)理論模型,即對(duì)潛在特質(zhì)為θ的所有取值,k道項(xiàng)目反應(yīng)函數(shù)不相交,也可以說(shuō)單調(diào)均質(zhì)模型是雙單調(diào)模型的一個(gè)特例。對(duì)于所有的試題,其期望的條件試題得分等于項(xiàng)目反應(yīng)函數(shù)值:

        對(duì)于所有的θ取值有:

        在θ的所有取值范圍內(nèi),按照試題的平均分進(jìn)行排序,排序結(jié)果不變。通過(guò)P值對(duì)題目排序,則可以得到題目順序?yàn)椋篜1≤P2≤…≤Pk。

        3 非參數(shù)項(xiàng)目反應(yīng)理論研究

        3.1 非參數(shù)項(xiàng)目反應(yīng)理論的理論研究

        3.1.1 非參數(shù)與參數(shù)估計(jì)方法的比較

        對(duì)非參數(shù)項(xiàng)目反應(yīng)理論的理論研究主要集中在對(duì)非參數(shù)估計(jì)方法和參數(shù)估計(jì)方法的比較研究上,大部分對(duì)非參數(shù)估計(jì)方法的研究都是基于核平滑(kernel smoothing)方法而展開(kāi)。如Ferrando(2004)在未限制曲線單調(diào)性的前提下,采用RISE作為擬合優(yōu)度指標(biāo),比較了kernel方法與線性的連續(xù)反應(yīng)模型對(duì)于連續(xù)的人格量表項(xiàng)目的特征曲線的估計(jì)。研究發(fā)現(xiàn)kernel方法能夠提供與參數(shù)模型相當(dāng)?shù)臄M合精度。同時(shí),Lei,Dunbar和Kolen(2004)在釋放曲線單調(diào)性假設(shè)的前提下,基于WtRMS、Wt-MABS指標(biāo),比較了kernel方法與參數(shù)方法對(duì)于多項(xiàng)選擇題的項(xiàng)目特征曲線估計(jì)的差異。該研究還探討了非參數(shù)方法中小樣本對(duì)于參數(shù)方法與非參數(shù)方法的影響。研究發(fā)現(xiàn),非參數(shù)方法在小樣本的條件下仍顯示出較好的擬合優(yōu)度,kernel方法對(duì)于干擾選項(xiàng)的特征曲線的估計(jì)能夠提供項(xiàng)目編制質(zhì)量的有效信息。

        3.1.2 非參數(shù)估計(jì)方法之間的比較

        近幾年來(lái),國(guó)內(nèi)外對(duì)非參數(shù)項(xiàng)目理論的研究,除了對(duì)非參數(shù)估計(jì)方法與參數(shù)估計(jì)方法的比較研究之外,也有研究者在考察非參數(shù)估計(jì)方法和參數(shù)估計(jì)方法之間的差異的同時(shí),還考察了不同的非參數(shù)估計(jì)方法之間的差異。如Lee(2007)使用RMSD作為擬合優(yōu)度指標(biāo),比較了保序回歸、平滑的保序回歸和kernel方法與參數(shù)方法對(duì)于二分項(xiàng)目的項(xiàng)目特征曲線的估計(jì)。該研究在限制曲線單調(diào)性的前提下進(jìn)行,并探討了違背單調(diào)性的題目數(shù)量這一因素對(duì)曲線擬合度的影響。研究發(fā)現(xiàn),平滑保序回歸在使用相應(yīng)的內(nèi)核函數(shù)時(shí)能夠提供更準(zhǔn)確的估計(jì)并滿足嚴(yán)格的單調(diào)性條件。而當(dāng)項(xiàng)目數(shù)量以及樣本大小增加時(shí),在各種條件下的平滑保序回歸和kernel方法對(duì)項(xiàng)目特征曲線(Item Characteristic Curve,ICC)的估計(jì)會(huì)產(chǎn)生相似的結(jié)果。而當(dāng)違背單調(diào)性的題目數(shù)目增加時(shí),參數(shù)方法估計(jì)的擬合優(yōu)度會(huì)受到較為嚴(yán)重的影響。

        此外,也有研究者使用不同非參數(shù)估計(jì)的方法評(píng)估了參數(shù)項(xiàng)目反應(yīng)理論擬合優(yōu)度的差異。如Manuel J.Sueiro&Francisco J.Abad(2011)認(rèn)為,非參數(shù)項(xiàng)目特征曲線和參數(shù)項(xiàng)目特征曲線之間的距離可以以根的綜合誤差指數(shù)為指標(biāo),并能夠?qū)⒅鳛轫?xiàng)目反應(yīng)理論擬合優(yōu)度的一種索引。所以他們將潛在特質(zhì)的后驗(yàn)分布作為非參數(shù)模型,與另一個(gè)基于核平滑(kernel-smoothing,KS)方法的模型之間進(jìn)行了性能的比較。對(duì)錯(cuò)誤率和效率的評(píng)估使用了 2PLM(two-parameter logistic model)和三種類型的實(shí)際不擬合項(xiàng)目。研究發(fā)現(xiàn),對(duì)于擬合的項(xiàng)目,參數(shù)和非參數(shù)項(xiàng)目特征曲線之間的距離在兩種方法上都會(huì)隨著樣本的增大而下降。KS的綜合誤差平方根會(huì)隨著測(cè)驗(yàn)長(zhǎng)度的增加而下降。而在效率方面,后驗(yàn)分布的方法在小樣本方面更有優(yōu)勢(shì),而短測(cè)驗(yàn)也同樣在此方面表現(xiàn)出了優(yōu)勢(shì)。另外,Alexandra A.H.等(2004)對(duì)不同的非參數(shù)維度評(píng)估程序進(jìn)行了比較研究。研究者使用2×2×6×4×3×4的研究設(shè)計(jì)模擬數(shù)據(jù)以比較MSP、DETECT、HCA/CCPROX以及DIMTEST這四個(gè)軟件在默認(rèn)設(shè)置下對(duì)維度評(píng)估的異同點(diǎn)。結(jié)果發(fā)現(xiàn),使用潛在特質(zhì)的協(xié)方差矩陣數(shù)據(jù)位基礎(chǔ)的分析軟件(DETECT&HCA/CCPROX)在擬合模型方面優(yōu)于使用標(biāo)準(zhǔn)無(wú)條件方差矩陣數(shù)據(jù)的軟件(MSP)。同時(shí),研究者還對(duì)DETECT和DIMTEST進(jìn)行了接受或拒絕能力的單維性假設(shè)的正確性研究。研究發(fā)現(xiàn),這兩個(gè)軟件并不能一直正確反映題庫(kù)的真實(shí)維度。

        3.1.3 非參數(shù)模型與數(shù)據(jù)的擬合驗(yàn)證

        除了參數(shù)估計(jì)方法上的比較研究,還有一些學(xué)者對(duì)非參數(shù)項(xiàng)目反應(yīng)理論其他方面進(jìn)行了一些研究。如 George Karabatsos&Ching-Fan Sheu(2004)研究了NIRT的單調(diào)均質(zhì)模型和雙單調(diào)模型在順序限制的貝葉斯推理體系中(order-constrained Bayes inference framework)分析二級(jí)反應(yīng)向量的實(shí)用性。研究使用NAEP測(cè)試的實(shí)踐數(shù)據(jù)分析了用以估計(jì)順序限制參數(shù)的Gibbs抽樣的實(shí)施,并用后驗(yàn)分布來(lái)對(duì)NIRT的項(xiàng)目單調(diào)性、項(xiàng)目排序的不變性以及局部獨(dú)立性假設(shè)進(jìn)行了驗(yàn)證。結(jié)果表明,無(wú)論是NIRT的單調(diào)均質(zhì)模型還是雙單調(diào)模型都能夠?qū)崿F(xiàn)和NAEP測(cè)試的實(shí)踐數(shù)據(jù)較好的擬合。Wilco H.M.Emons(2008)對(duì)多級(jí)計(jì)分的項(xiàng)目反應(yīng)得分進(jìn)行了非參數(shù)個(gè)人擬合分析的研究。研究者認(rèn)為,個(gè)人擬合方法通常被用來(lái)揭露非典型性的測(cè)驗(yàn)表現(xiàn),以此來(lái)反應(yīng)一個(gè)測(cè)驗(yàn)中個(gè)別項(xiàng)目的分?jǐn)?shù)的樣本。而和參數(shù)個(gè)人擬合統(tǒng)計(jì)不同,非參數(shù)個(gè)人擬合統(tǒng)計(jì)并不需要一個(gè)參數(shù)模型。研究者在研究中調(diào)查了非參數(shù)個(gè)人擬合統(tǒng)計(jì)對(duì)多級(jí)計(jì)分項(xiàng)目數(shù)據(jù)概括的有效性,并使用了模擬研究研究了不同的測(cè)試和項(xiàng)目參數(shù),研究發(fā)現(xiàn)在檢測(cè)嚴(yán)重的不擬合時(shí),對(duì)古德曼錯(cuò)誤(Guttman errors)的計(jì)數(shù)是有效的。這個(gè)模擬研究更進(jìn)一步發(fā)現(xiàn),在大多數(shù)情況下,非參數(shù)個(gè)人擬合統(tǒng)計(jì)在檢測(cè)異常的項(xiàng)目分?jǐn)?shù)向量時(shí)和常用的參數(shù)個(gè)人擬合統(tǒng)計(jì)是同樣有效的。

        3.2 非參數(shù)項(xiàng)目反應(yīng)理論的應(yīng)用研究

        3.2.1 量表制定

        目前對(duì)NIRT的應(yīng)用研究相對(duì)理論研究而言比較少,大部分的研究主要集中在對(duì)量表的制定上。如Klaas Sijtsma等(2008)使用非參數(shù)估計(jì)方法分析了生活質(zhì)量量表并將之在在世界衛(wèi)生組織的研究中進(jìn)行了應(yīng)用。研究者調(diào)查了非參數(shù)同質(zhì)單調(diào)模型衡量和構(gòu)建生活質(zhì)量量表的有效性,此生活質(zhì)量量表是由多岐項(xiàng)目組成,并將非參數(shù)同質(zhì)單調(diào)模型和常用的參數(shù)等級(jí)反應(yīng)模型進(jìn)行了比較。結(jié)果發(fā)現(xiàn),非參數(shù)單調(diào)同質(zhì)模型高度適合對(duì)與健康相關(guān)的生活質(zhì)量情況的數(shù)據(jù)分析,而參數(shù)等級(jí)反應(yīng)模型也為模型擬合添加了有趣的特性。研究者同時(shí)使用了單調(diào)同質(zhì)化模型和等級(jí)反應(yīng)模型對(duì)世界衛(wèi)生組織生命質(zhì)量量表數(shù)據(jù)進(jìn)行了分析,并以單調(diào)同質(zhì)模型為基準(zhǔn)分析取得了每個(gè)內(nèi)容域的一維尺度??蓴U(kuò)展性系數(shù)進(jìn)一步表明,一些項(xiàng)目在其他同等尺度的其他項(xiàng)目上具有有限的可擴(kuò)展性。而參數(shù)估計(jì)方法可能會(huì)導(dǎo)致一些項(xiàng)目被否決。

        國(guó)內(nèi)也有研究者展開(kāi)了對(duì)非參數(shù)項(xiàng)目反應(yīng)理論在制定量表方面的應(yīng)用研究,如王鵬(2005)研究了NIRT在公共管理中的應(yīng)用,將其與經(jīng)典測(cè)驗(yàn)理論(Classical Test Theory,CTT)和IRT在公共管理量表制定的實(shí)例中進(jìn)行了比較研究,該研究發(fā)現(xiàn),CTT對(duì)樣本的依賴性很高;IRT幾乎不受被試變化的影響,但是會(huì)受到樣本數(shù)量的影響;而NIRT在小樣本中保持了較高的測(cè)驗(yàn)精度,且測(cè)驗(yàn)結(jié)果也比較穩(wěn)定。張軍(2010)使用了非參數(shù)項(xiàng)目反應(yīng)理論的Mokken量表及其構(gòu)建程序MSP,探索性地分析HSK[初中等]聽(tīng)力、語(yǔ)法結(jié)構(gòu)和閱讀三個(gè)部分中40個(gè)題的潛在維度,并籍此評(píng)價(jià)此方法的優(yōu)劣。研究表明:題組是多維的,閱讀題的區(qū)分能力和一致性最強(qiáng),能有效地聚合成一類;聽(tīng)力題次之,語(yǔ)法結(jié)構(gòu)題最差;同時(shí),他還發(fā)現(xiàn),使用NIRT進(jìn)行維度分析存在很多不足,尤其是題目區(qū)分能力對(duì)分類的干擾與界定分類階段的標(biāo)準(zhǔn)存在較大的問(wèn)題。

        3.2.2 個(gè)性數(shù)據(jù)及項(xiàng)目功能差異分析

        除了在量表制定方面的研究,也有研究者應(yīng)用非參數(shù)項(xiàng)目反應(yīng)理論展開(kāi)了其他方面的研究。如Rob R.Meijer&Joost J.Baneke(2004)對(duì)NIRT在個(gè)性和精神病理學(xué)尺度的建立和心理測(cè)量分析的適用性方面進(jìn)行了研究,并和三個(gè)參數(shù)IRT模型進(jìn)行了比較研究。他們以MMPI中的抑郁量表為研究對(duì)象,發(fā)現(xiàn)在分析個(gè)性數(shù)據(jù)時(shí),非參數(shù)IRT模型要優(yōu)于參數(shù)IRT模型,并且非參數(shù)IRT模型更便于應(yīng)用,同時(shí)可以避免參數(shù)IRT模型在分析數(shù)據(jù)時(shí)的失誤。

        雷新勇(2006)研究了NIRT在教育考試中的應(yīng)用,用單調(diào)均質(zhì)模型從16道聽(tīng)力試題中選出11道題組成了單維量表,再利用雙單調(diào)模型對(duì)單維量表進(jìn)行功能偏差研究發(fā)現(xiàn),有5道試題在女生子群體中的排序與在男生子群體以及整個(gè)群體排序不同,顯示女生子群體作出正確應(yīng)答的概率明顯高于男生子群體作出正確應(yīng)答的概率。這種差異至少部分是由兩個(gè)子群體聽(tīng)力能力上的差異引起的。

        4 非參數(shù)項(xiàng)目反應(yīng)理論的新發(fā)展:非參數(shù)認(rèn)知診斷理論

        4.1 非參數(shù)認(rèn)知診斷理論的興起

        在近二三十年來(lái)發(fā)展的新一代測(cè)量理論中,把個(gè)體任務(wù)完成所需要的知識(shí)、認(rèn)知加工技能等稱為認(rèn)知屬性(Cognitive Attribute),把對(duì)個(gè)體任務(wù)完成中認(rèn)知過(guò)程、加工技能或知識(shí)結(jié)構(gòu)中優(yōu)勢(shì)與不足的診斷稱為認(rèn)知診斷評(píng)估(Cognitive Diagnosis Assessment,CDA),其中用于對(duì)學(xué)生知識(shí)結(jié)構(gòu)進(jìn)行診斷評(píng)估的心理測(cè)量模型稱為認(rèn)知診斷模型(Cognitive Diagnosis Model,CDM)。Fu和Li總結(jié)出60多種常見(jiàn)的診斷模型,其中,應(yīng)用較為廣泛的核心模型有邏輯斯蒂潛在特質(zhì)模型(LLTM,(Fischer,1973))、規(guī)則空間模型(RSM,(Tatsuoka,1983))、屬性層級(jí)模型(AHM,(Leighton,Gierl,&Hunka,2004))、DINA模型((Junker&Sijtsma,2001))、融合模型(FM,(Hartz,2002))、DINO 模型((Templin&Henson,2006))等(Fu&Li,2007)。

        以上認(rèn)知診斷模型都屬于參數(shù)模型,目前對(duì)這些參數(shù)認(rèn)知診斷模型的參數(shù)估計(jì)主要包括邊際最大似然估計(jì)以及貝葉斯估計(jì),而這種以參數(shù)項(xiàng)目反應(yīng)理論為基礎(chǔ)發(fā)展起來(lái)參數(shù)估計(jì)方法在進(jìn)行認(rèn)知診斷模型的參數(shù)估計(jì)時(shí),尚且存在較多的不足。首先,當(dāng)所測(cè)的認(rèn)知屬性較多,樣本量較大的時(shí)候,參數(shù)估計(jì)的時(shí)間很長(zhǎng),給研究者帶來(lái)很多不便(已有研究表明,當(dāng)屬性個(gè)數(shù)在8個(gè)時(shí),EM算法和MCMC估計(jì)都需要耗費(fèi)很長(zhǎng)的時(shí)間);其次,當(dāng)進(jìn)行短測(cè)驗(yàn)或小樣本施測(cè)時(shí),樣本容量達(dá)不到進(jìn)行參數(shù)數(shù)據(jù)分析的要求,又會(huì)造成較大的估計(jì)誤差,致使所估計(jì)的參數(shù)精確性很低。而在實(shí)際教學(xué)和測(cè)評(píng)中,所涉及的認(rèn)知屬性往往是較多且關(guān)系復(fù)雜,而參加測(cè)評(píng)的對(duì)象也不是成千上萬(wàn)的(比如某校學(xué)科組或任課老師想要了解四年級(jí)學(xué)生在數(shù)學(xué)應(yīng)用題或圖形與幾何問(wèn)題解決中的情況),此時(shí),相對(duì)于參數(shù)認(rèn)知診斷模型,非參數(shù)認(rèn)知診斷模型可能更加適宜。在此背景下,非參數(shù)認(rèn)知診斷模型應(yīng)運(yùn)而生。

        4.2 非參數(shù)認(rèn)知診斷模型

        Henson、Templin&Douglas在2007年提出,在DINA模型數(shù)據(jù)下,對(duì)于一個(gè)給定的Q矩陣,其觀察總分為他們認(rèn)為,在聯(lián)合模型下,Wik能夠提供被試的能力信息。

        Chiu在2008年的研究發(fā)現(xiàn),可以使用K-MEANS算法以及等級(jí)聚類法對(duì)總分進(jìn)行聚類。

        Chiu的這個(gè)研究被認(rèn)為是關(guān)于非參數(shù)認(rèn)知診斷的第一個(gè)原理性的成果,他表示,在恰當(dāng)?shù)募夹g(shù)條件下,只要每一個(gè)屬性都存在非零比例的單一項(xiàng)目,那么當(dāng)項(xiàng)目j增加時(shí),可以涵蓋所有的掌握模式。

        Ayers、Nugent&Dean(2008)使用正態(tài)分布的數(shù)據(jù)進(jìn)行了研究,

        從經(jīng)驗(yàn)上來(lái)講,相對(duì)于對(duì)總分向量的聚類分析法,使用能力向量的聚類分析法所估計(jì)的能力參數(shù)更接近擬合的DINA模型,尤其在數(shù)據(jù)缺失的情況下。

        4.3 非參數(shù)認(rèn)知診斷研究

        Brian在2011年展開(kāi)了對(duì)非參數(shù)項(xiàng)目反應(yīng)理論的認(rèn)知診斷研究。他認(rèn)為之所以要展開(kāi)非參數(shù)認(rèn)知診斷的研究,一方面是因?yàn)榉菂?shù)項(xiàng)目反應(yīng)理論在心理學(xué)研究中是可以應(yīng)用的,并且還在被不斷地研究。通過(guò)非參數(shù)項(xiàng)目反應(yīng)理論,研究者可以考慮以最低限度的假設(shè)來(lái)了解項(xiàng)目反應(yīng)理論模型的基本結(jié)構(gòu)以及一般的能力變量的測(cè)量模型。另一方面,在研究認(rèn)知診斷模型時(shí),就像參數(shù)項(xiàng)目反應(yīng)理論一樣,研究者都會(huì)需要通過(guò)估計(jì)項(xiàng)目參數(shù)來(lái)評(píng)估項(xiàng)目的質(zhì)量以及通過(guò)能力值來(lái)估計(jì)被試掌握或者未掌握某種認(rèn)知屬性。

        Brain(2011)在文章中介紹了兩種非參數(shù)的方法來(lái)處理認(rèn)知診斷模型的數(shù)據(jù)。一種方法是提供聯(lián)合結(jié)構(gòu)的假設(shè)以及正確的Q矩陣,用聚類分析將有相同模式的認(rèn)知屬性或技能的被試分成不同的組別來(lái)處理作答數(shù)據(jù)(Ayers et al.,2008;Chiu,2008;Nugent et al.,2009)。另一種方法是將被觀測(cè)到的項(xiàng)目之間的聯(lián)合結(jié)構(gòu)作為發(fā)現(xiàn)推測(cè)的第一步或者將項(xiàng)目之間的關(guān)系作為等價(jià)的前提條件,然后將之作為構(gòu)成Q矩陣結(jié)構(gòu)的可能成分來(lái)分析(Desmarais&Pu,2005;Tucker,2009)。這兩種方法都還處于其研究的初期階段,但是它們都指向了非參數(shù)方法可能存在的重要優(yōu)勢(shì)。當(dāng)面臨龐大的數(shù)據(jù)庫(kù)時(shí),它們開(kāi)發(fā)了簡(jiǎn)單而便于應(yīng)用的數(shù)據(jù)處理算法,而且它們還開(kāi)始促成一些具有操作性特征的認(rèn)知診斷模型的產(chǎn)生。

        綜上所述,我們可以看到,雖然對(duì)非參數(shù)認(rèn)知診斷研究已經(jīng)展開(kāi),一些特殊的非參數(shù)方法也開(kāi)始初具規(guī)模,但總體而言,研究還是相對(duì)較少,目前為止,還沒(méi)有開(kāi)展關(guān)于非參數(shù)認(rèn)知診斷的應(yīng)用研究。這些都有待于后續(xù)的研究者進(jìn)一步研究。

        5 總結(jié)與展望

        5.1 非參數(shù)項(xiàng)目反應(yīng)理論研究?jī)?yōu)勢(shì)

        非參數(shù)項(xiàng)目反應(yīng)理論作為一種在參數(shù)項(xiàng)目反應(yīng)理論的基礎(chǔ)上發(fā)展起來(lái)的測(cè)量理論,它為參數(shù)項(xiàng)目反應(yīng)模型適應(yīng)的局限性提出了更適應(yīng)更有彈性的框架,因非參數(shù)項(xiàng)目反應(yīng)模型對(duì)數(shù)據(jù)的要求更寬松而比參數(shù)項(xiàng)目反應(yīng)模型應(yīng)用的范圍更廣。同時(shí),非參數(shù)項(xiàng)目反應(yīng)理論不像參數(shù)項(xiàng)目反應(yīng)理論那樣通過(guò)對(duì)項(xiàng)目參數(shù)的估計(jì),以期獲得更為精確的測(cè)量結(jié)果,而是通過(guò)對(duì)樣本數(shù)據(jù)的估計(jì)來(lái)獲得一個(gè)從高到低或從低到高的排序,不僅簡(jiǎn)化了復(fù)雜而繁瑣的參數(shù)估計(jì)的運(yùn)算過(guò)程,而且也為廣大的測(cè)量人員提供了方便,比較簡(jiǎn)便容易操作,實(shí)用性更強(qiáng)。而在以非參數(shù)項(xiàng)目反應(yīng)理論基礎(chǔ)上發(fā)展起來(lái)的非參數(shù)認(rèn)知診斷,成為對(duì)參數(shù)認(rèn)知診斷的重大補(bǔ)充。因?yàn)樗鼮閷捤傻倪m用環(huán)境,使其在實(shí)際應(yīng)用中,更吻合實(shí)際,應(yīng)用性更高,從而能更好地吻合新課程背景下老師想要了解學(xué)生問(wèn)題解決過(guò)程的需要。

        5.2 非參數(shù)項(xiàng)目反應(yīng)理論的研究展望

        回顧幾十年來(lái)研究者對(duì)非參數(shù)項(xiàng)目反應(yīng)理論的研究,我們可以發(fā)現(xiàn),雖然非參數(shù)項(xiàng)目反應(yīng)理論自產(chǎn)生以來(lái),一直有研究者對(duì)其進(jìn)行研究。但總體而言,目前的非參數(shù)項(xiàng)目反應(yīng)理論的研究研究隊(duì)伍依然小而分散,后備力量相對(duì)不足。NIRT研究自興起至今,研究人員隊(duì)伍一直處于一種相對(duì)分散的狀態(tài),研究力量也不是很集中,因此研究很難系統(tǒng)深入,對(duì)其理論的研究還不像參數(shù)項(xiàng)目反應(yīng)理論那樣涉及測(cè)驗(yàn)等值、題庫(kù)建設(shè)、多級(jí)評(píng)分模型、計(jì)算機(jī)自適應(yīng)考試、DIF等各個(gè)方面。

        同時(shí),我們還發(fā)現(xiàn),盡管對(duì)NIRT的研究已經(jīng)取得了一些成果,但是其理論研究領(lǐng)域偏窄,研究主要集中在對(duì)非參數(shù)項(xiàng)目反應(yīng)理論尤其是對(duì)非參數(shù)估計(jì)方法與參數(shù)估計(jì)方法的比較研究上,且這些研究大多數(shù)都是模擬研究,對(duì)其應(yīng)用研究展開(kāi)的極少。從總體趨勢(shì)上來(lái)看,對(duì)NIRT的理論研究仍處于初級(jí)階段,相對(duì)于參數(shù)項(xiàng)目反應(yīng)理論的蓬勃發(fā)展,非參數(shù)項(xiàng)目反應(yīng)理論還有待于今后展開(kāi)更多的研究。

        此外,就目前的文獻(xiàn)來(lái)看,盡管有一些研究者如Klaas Sijtsma、雷新勇等對(duì)非參數(shù)項(xiàng)目反應(yīng)理論在應(yīng)用方面展開(kāi)了研究,但我們可以明顯看到,NIRT應(yīng)用研究簡(jiǎn)直是鳳毛麟角,且更多的集中于認(rèn)知、情感測(cè)驗(yàn)開(kāi)發(fā),比較少涉足技能領(lǐng)域,而在認(rèn)知領(lǐng)域中也偏重于教育領(lǐng)域,較少心理認(rèn)知加工模式上的應(yīng)用,這使得NIRT的應(yīng)用范圍相當(dāng)狹窄,許多NIRT的優(yōu)良功能尚未充分開(kāi)發(fā)。

        綜上所述,我們可以看到,非參數(shù)項(xiàng)目反應(yīng)理論無(wú)論是在理論研究還是在應(yīng)用研究方面都有比較好的發(fā)展前景,未來(lái)還需要更多的研究人員投入到對(duì)其的研究中,以期獲得更大的發(fā)展。

        [1] 雷新勇.非參數(shù)項(xiàng)目反應(yīng)理論模型及其在教育考試中的應(yīng)用[J].考試研究,2006(2):53-71.

        [2] 王鵬.NIRT在公共管理中的應(yīng)用及與CTT和IRT在實(shí)例中的比較[D].東北大學(xué)碩士學(xué)位論文,2005.

        [3] 張軍.非參數(shù)項(xiàng)目反應(yīng)理論在維度分析中的運(yùn)用及評(píng)價(jià)[J].心理學(xué)探新,2010(30):80-83.

        [4] Ayers,E.,Nugent,R.,&Dean,N.Skill set pro fi le clustering based on student capability vectors computed from online tutoring data.In R.S.J.d.Baker,T.Barnes,&J.E.Beck(Eds.),Educational data mining 2008:1st International Conference on Educational Data Mining,Proceedings,2008:210-217.

        [5] Brian,W.Junker.The Role of Nonparametric Analysis in Assessment Modeling:Then and Now,2011:67-82.

        [6] Chiu,C.Cluster analysis for cognitive diagnosis:Theory and applications.Unpublished doctoral dissertation,Department of Educational Psychology,University of Illinois at Urbana Champaign,2008.

        [7] De Jong.A.&Molenaar,I.W.An application of Mokken’S model for stochastic Cumulative scaling in psychiatric research.Journal of Psychiatric Research,1987,21.

        [8] Edward E.Roskam,Arnold L.van den Wollenberg and Paul G.W.Jansen.The Mokken Scale:A Critical Discussion Applied Psychological Measurement,1986,10:265.

        [9] Fischer,Gerhard H..The linear logistic test model as an instrument in educational research.Acta psychologica,1973,37(6):359-374.

        [10] Fu,J.,&Li,Y.Cognitively diagnostic psychometric models:An integrative review.Paper presented at the The annual meeting of the National Council on.Measurement in Education,Chicago,IL,2007.

        [11]George Karabatsos&Ching-Fan Sheu.Order-constrained Bayes inference for dichotomous models of unidimensional nonparametric IRT,2004.

        [12] Hartz,S.M.A Bayesian framework for the unified model for assessing cognitive abilities:Blending theory with practicality.Unpublished doctoral dissertation,University of Illinois at Urbana-Champaign,Urbana-Champaign,IL,2002.

        [13] John Sachs.Yin kum Law.Carol K K Chan.A nonpararnetric item analysis of a selected item subset of the Learning Process Questionnaire,2003,73.

        [14] Junker.B.W.&Sijtsma.K.Nonparametric Item Response Theory in Action:An Overview of the Special Issue.Applied Psychological Measurement,2003,25(3):211-220.

        [15] Junker,B.W.,&Sijtsma,K.Cognitive assessment models with few assumptions,and connections with nonparametric item response theory.Applied Psychological Measurement,2001,25(3):258-272.

        [16] Kristin A Duncan&Steven N MacEachern.Nonparametric Bayesian modelling for item response,2008.

        [17] Klass Sijtsma.Ivo W Molenaar Introduction to Nonparametric Item Response TheoryM.London:International Educational and Professional Publisher,2003,60.

        [18] Klaas Sijtsma,Wilco H.M.Emons,Samantha Bouwmeester,Ivan Nyklí?ek,and Leo D.Roorda.Nonparametric IRT analysis of Quality-of-Life Scales and its application to the World Health Organization Quality-of-Life Scale(WHOQOL-Bref),2008.

        [19] Klaas Sijtsma.Methodology Review:Nonparametric IRT Approaches to the Analysis of Dichotomous Item Scores Applied Psychological Measurement,1998,22(3).

        [20] Leighton,J.P.,Gierl,M.J.,&Hunka,S.M..The Attribute Hierarchy Method for Cognitive Assessment:A Variation on Tatsuoka's Rule-Space Approach.Journal of Educational Measurement,2004,41(3):205-237.

        [21] Manuel J.Sueiro,Francisco J.Assessing Goodness of Fit in Item Response Theory With Nonparametric Models:A Comparison of Posterior Probabilities and Kernel-Smoothing Approaches,2001.

        [22] Molenaar,I.W.&Sijtsm,K.Users manual MSP5 for Windows[M].Crroningen:lee-ProGA~I(xiàn)MA,2000,23.

        [23] Nichols,P.D.,Chipman,S.F.&Brennan,R.L.Cognitively diagnostic assessment.Hilldale,NJ:Lawrence Erlbaum,1995.

        [24] Pui-Walei,Stephen B.Dunbar and Michael.J.Kolen A Comparison of Parametric and Nonparametric Approaches to Item Analysis for Multiple-Choice Tests,2004.

        [25] Ramsay.J.Kernel Smoothing approaches to nonparametric item characteristic Curve estimation,1997.

        [26] Rob R.Meijer,Joost J.Baneke.Analyzing psychopathology items a case for nonparametric item response theory modeling,2004.

        [27] Tatsuoka,K.K.Rule space:An approach for dealing with misconceptions based on item response theory.Journal of Educational Measurement,1983,20(4):345-354.

        [28] Templin,J.L.,&Henson,R.A.Measurement of psychological disorders using cognitive diagnosis models.Psychological Methods,2006,11(3):287.

        [29] Young-Sun Lee.A Comparison of Methods for Nonparametric Estimation of Item Characteristic Curves for Binary Items,2007.

        猜你喜歡
        理論方法模型
        一半模型
        堅(jiān)持理論創(chuàng)新
        神秘的混沌理論
        理論創(chuàng)新 引領(lǐng)百年
        相關(guān)于撓理論的Baer模
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        国产精品高潮无码毛片| 久久伊人少妇熟女大香线蕉| 黑人大群体交免费视频| 中文天堂国产最新| 中文成人无字幕乱码精品区| 又黄又爽又高潮免费毛片| 五月综合高清综合网| 日韩久久免费精品视频 | 白色白色视频在线观看| 亚洲av老熟女一区二区三区 | 98bb国产精品视频| 岛国熟女一区二区三区| 亚洲中文字幕有综合久久| 亚洲中文字幕久久在线| 乱子轮熟睡1区| 久久精品国产色蜜蜜麻豆 | 蜜臀av一区二区三区精品 | 国产一区二区三区视频大全| 香蕉蜜桃av一区二区三区| 性色av一二三天美传媒| 国产成+人欧美+综合在线观看 | 99re6在线视频精品免费| 久久亚洲私人国产精品| 精品人妻潮喷久久久又裸又黄| 亚洲精品自拍视频在线观看| 高清中文字幕一区二区三区| 又黄又刺激的网站久久| 久久亚洲色www成人欧美| 93精91精品国产综合久久香蕉| 在线亚洲精品国产成人二区| 精品人妻一区二区三区狼人| 欧美多人片高潮野外做片黑人 | 无码国内精品人妻少妇蜜桃视频| 亚洲色欲久久久久综合网| 日韩永久免费无码AV电影 | 久久久精品亚洲一区二区国产av| 97夜夜澡人人双人人人喊| 亚洲AV无码精品呻吟| 国产不卡一区二区av| 亚洲视频免费一区二区| 日本无码欧美一区精品久久|