韓雪,吳銳,陳藝心
(貴州師范大學(xué)教育科學(xué)學(xué)院,貴州貴陽(yáng)550001)
IRT框架下的大學(xué)生自卑感問(wèn)卷單維性檢驗(yàn)
韓雪,吳銳,陳藝心
(貴州師范大學(xué)教育科學(xué)學(xué)院,貴州貴陽(yáng)550001)
本文以大學(xué)生自卑感問(wèn)卷為例,采用項(xiàng)目反應(yīng)理論框架下的等級(jí)反應(yīng)模型對(duì)其進(jìn)行參數(shù)估計(jì)和項(xiàng)目分析,對(duì)分析得出的問(wèn)卷進(jìn)行模型-數(shù)據(jù)擬合分析.結(jié)果表明:該問(wèn)卷符合單維性假設(shè)和局部獨(dú)立性假設(shè)條件,該問(wèn)卷在模型-數(shù)據(jù)擬合分析中,單項(xiàng)目完全擬合,項(xiàng)目對(duì)于項(xiàng)目組部分?jǐn)M合.
項(xiàng)目反應(yīng)理論;單維性檢驗(yàn);局部獨(dú)立性檢驗(yàn);模型——數(shù)據(jù)擬合
項(xiàng)目反應(yīng)理論(ItemResponseTheory,IRT)已成為當(dāng)今心理測(cè)量理論的核心發(fā)展內(nèi)容,IRT在測(cè)驗(yàn)編制和測(cè)驗(yàn)質(zhì)量分析中,很大程度地彌補(bǔ)了經(jīng)典測(cè)量理論(ClassicalTest Theory,CTT)所存在的缺點(diǎn),針對(duì)0、1計(jì)分的學(xué)績(jī)測(cè)驗(yàn)以及多級(jí)計(jì)分的人格、態(tài)度等量表,研究者開(kāi)發(fā)出了不同類(lèi)型的模型.通常,研究者通過(guò)項(xiàng)目特征曲線(ItemCharacteristic Curve,ICC)和項(xiàng)目信息函數(shù)曲線(ItemInformationCurve, IIC),修訂或刪除未達(dá)理論要求的項(xiàng)目.分析具有順序性的多級(jí)評(píng)分量表的主要有三種IRT模型,即分部計(jì)分模型[1]、廣義分部計(jì)分模型[2]以及等級(jí)反應(yīng)模型(GradedResponse Model,GRM)[3].因此,本文采用等級(jí)反應(yīng)模型對(duì)大學(xué)生自卑感問(wèn)卷進(jìn)行參數(shù)估計(jì).
在IRT測(cè)量框架中,有兩條基本假設(shè),也是量表得以運(yùn)用IRT進(jìn)行分析的先驗(yàn)條件,即潛在特質(zhì)空間的單維性假設(shè)和局部獨(dú)立性假設(shè).單維性是指被試在作答一個(gè)量表中所有項(xiàng)目的反應(yīng)只受到單一因素,即所測(cè)潛在特質(zhì)的影響.主成分分析用于檢驗(yàn)量表的單維性,檢驗(yàn)數(shù)據(jù)包括碎石圖,因子特征根以及所有項(xiàng)目在提取的單一因子上的載荷.局部獨(dú)立性是相同能力水平的被試在各個(gè)項(xiàng)目上的答對(duì)機(jī)率是獨(dú)立的,即影響被試作答反應(yīng)的唯一因素是量表所測(cè)的潛在特質(zhì),當(dāng)排除這個(gè)因素的影響后,不同項(xiàng)目間的作答反應(yīng)不會(huì)有任何關(guān)系.對(duì)于多級(jí)計(jì)分的量表進(jìn)行局部獨(dú)立性假設(shè)檢驗(yàn),一般采用驗(yàn)證性因素分析,模型擬合后,所得到的所有項(xiàng)目間殘差協(xié)方差均值接近于零,說(shuō)明該量表符合局部獨(dú)立性假設(shè)[6].問(wèn)卷符合這兩個(gè)假設(shè),才能夠選擇IRT模型對(duì)其進(jìn)行分析.然而,國(guó)內(nèi)大多數(shù)運(yùn)用IRT修訂問(wèn)卷的研究當(dāng)中,多數(shù)研究者只對(duì)問(wèn)卷進(jìn)行單維性檢驗(yàn),忽略了局部獨(dú)立性這一理論假設(shè),認(rèn)為只要驗(yàn)證了問(wèn)卷單維性就可以直接進(jìn)行IRT分析[7-9].這種分析的結(jié)果有待進(jìn)一步驗(yàn)證.
本文將首先對(duì)大學(xué)生自卑感問(wèn)卷進(jìn)行單維性和局部獨(dú)立性檢驗(yàn),然后采用等級(jí)反應(yīng)模型進(jìn)行項(xiàng)目分析,刪除無(wú)效項(xiàng)目,探討項(xiàng)目選項(xiàng)的合理性,最后再對(duì)修正后的問(wèn)卷進(jìn)行模型擬合檢驗(yàn).從多個(gè)方面討論問(wèn)卷的單維性.
1.1 研究工具
本文的測(cè)量工具是由賈遠(yuǎn)娥編制的大學(xué)生自卑心理問(wèn)卷.問(wèn)卷共29個(gè)項(xiàng)目.量表包括交往自卑、素養(yǎng)自卑、形象自卑、家庭自卑和學(xué)業(yè)自卑5個(gè)維度,問(wèn)卷采用4級(jí)評(píng)分,選項(xiàng)從非常不符合到非常符合.整個(gè)問(wèn)卷內(nèi)部一致信度為0.93,通過(guò)探索性和驗(yàn)證性因素分析均表明問(wèn)卷具有較好的效度[10].
1.2 被試
采用隨機(jī)抽樣方法,從貴州大學(xué)、貴州師范大學(xué)、貴陽(yáng)醫(yī)學(xué)院、貴陽(yáng)交通職業(yè)學(xué)院4所院校抽取學(xué)生400人,發(fā)放問(wèn)卷400份,回收試卷389,其中剔除無(wú)效試卷49,獲得有效被試340人,有效試卷回收率85%.
2.1 問(wèn)卷的單維性檢驗(yàn)和局部獨(dú)立性檢驗(yàn)
采用SPSS16.0對(duì)數(shù)據(jù)進(jìn)行處理,對(duì)整個(gè)問(wèn)卷進(jìn)行主成分分析,得出因子碎石圖,如圖1所示.
圖1 因子碎石圖
分析中所提取出的第一個(gè)因子特征根為9.06,第二個(gè)因子特征根為2.46,第一個(gè)因子與第二個(gè)因子特征根比值為3.68,大于3,說(shuō)明該問(wèn)卷符合單維性假設(shè)[11].除項(xiàng)目1外,第一個(gè)因子在所有項(xiàng)目上的載荷均在在[0.356,0.744]之間.其中,除項(xiàng)目1、3、23、24、25之外,其余項(xiàng)目均在第一因子上的載荷最高.
對(duì)單一因子的模型進(jìn)行驗(yàn)證性因素分析的結(jié)果得到模型擬合值:χ2/df=2.34,GFI=0.85,CFI=0.85,RMSEA=0.063,說(shuō)明模型基本達(dá)到擬合標(biāo)準(zhǔn).擬合后所得29個(gè)項(xiàng)目間的殘差協(xié)方差均值為0.01,說(shuō)明該問(wèn)卷符合局部獨(dú)立性假設(shè)[12].
因此,該問(wèn)卷達(dá)到IRT的先驗(yàn)條件,可采用等級(jí)反應(yīng)模型(GRM)對(duì)其進(jìn)行分析.
2.2 項(xiàng)目參數(shù)分析
通過(guò)MULTILOG7.03軟件中的GRM對(duì)大學(xué)生自卑感問(wèn)卷進(jìn)行項(xiàng)目分析,得到各項(xiàng)目參數(shù)值.
項(xiàng)目1區(qū)分度(α)為0.3,說(shuō)明該項(xiàng)目沒(méi)有良好的區(qū)分度.一般來(lái)說(shuō),0.3<α≤3為可接受的區(qū)分度范圍[13].從各項(xiàng)目閾值來(lái)看,項(xiàng)目1與項(xiàng)目23的閾值估計(jì)較為極端(絕對(duì)值大于4[14]).從項(xiàng)目最大信息量來(lái)看,項(xiàng)目1的信息量最低僅達(dá)到0.03,第12題信息量最高達(dá)到了1.42.因此,根據(jù)參數(shù)指標(biāo),考慮刪除項(xiàng)目1.
2.3 MODFIT模型——數(shù)據(jù)擬合指數(shù)
采用等級(jí)反應(yīng)模型(GRM)對(duì)刪除項(xiàng)目1后的大學(xué)生自卑感問(wèn)卷進(jìn)行擬合分析,得到單項(xiàng)目、項(xiàng)目對(duì)、項(xiàng)目組的矯正χ2/df指標(biāo).該指標(biāo)小于3.0,顯示模型與數(shù)據(jù)擬合度良好[16].經(jīng)統(tǒng)計(jì),28個(gè)單項(xiàng)目的矯正χ2/df均小于3,符合擬合要求;30個(gè)項(xiàng)目對(duì)中有12個(gè)項(xiàng)目對(duì)符合擬合要求;12個(gè)項(xiàng)目組中只有兩個(gè)項(xiàng)目組符合擬合要求.至今為止,采用單項(xiàng)目、項(xiàng)目對(duì)和項(xiàng)目組矯正χ2/df統(tǒng)計(jì)量來(lái)評(píng)價(jià)模型對(duì)數(shù)據(jù)的絕對(duì)擬合時(shí),多數(shù)研究結(jié)果顯示項(xiàng)目對(duì)和項(xiàng)目組矯正χ2/df很難達(dá)到完全小于3的標(biāo)準(zhǔn)[17-19].
<11<22<33<44<55<7>7平均值標(biāo)準(zhǔn)差單項(xiàng)目261100000.160.522項(xiàng)目對(duì)64225564.4654.057項(xiàng)目組10124225.8874.616
自卑感是由于個(gè)人對(duì)自我評(píng)價(jià)不當(dāng)而產(chǎn)生的一類(lèi)消極的心理體驗(yàn).個(gè)體心理學(xué)理論中將自卑心理描述為自我評(píng)價(jià)偏低,當(dāng)個(gè)體面對(duì)一個(gè)他無(wú)法適當(dāng)應(yīng)付的問(wèn)題時(shí),他表示他絕對(duì)無(wú)法解決這個(gè)問(wèn)題[20].對(duì)于大學(xué)生來(lái)說(shuō),自卑感更可能的是某一特定情境的產(chǎn)物,由小環(huán)境到大環(huán)境的過(guò)度過(guò)程中,與大環(huán)境下不斷出現(xiàn)的“優(yōu)秀個(gè)體”對(duì)比受挫經(jīng)歷,可能是引起這個(gè)情境性自卑感的最大原因,而這種自卑感可能是暫時(shí)的,階段性的體驗(yàn).挫折經(jīng)歷帶來(lái)的負(fù)性體驗(yàn)越消極,個(gè)體越傾向于選擇自卑感越強(qiáng)烈的作答結(jié)果.IRT模型假設(shè)當(dāng)被試心理特質(zhì)水平在特質(zhì)尺度上的位置高于題目的位置時(shí),被試會(huì)贊同題目;當(dāng)被試位置低于題目的位置時(shí),被試則會(huì)不贊同題目[21].通過(guò)等級(jí)反應(yīng)模型分析數(shù)據(jù)來(lái)看,該問(wèn)卷大多數(shù)項(xiàng)目有著良好的區(qū)分度,閾值跨度較為寬泛,用于測(cè)量大學(xué)生群體所獲取的信息量也基本達(dá)到標(biāo)準(zhǔn).其中,項(xiàng)目1的區(qū)分度,閾值以及最大信息量都未能達(dá)到測(cè)量學(xué)要求.從該項(xiàng)目?jī)?nèi)容來(lái)看,即“英語(yǔ)不如其他人好”,英語(yǔ)單科成績(jī)用于測(cè)試被試整個(gè)學(xué)業(yè)因子的自卑感過(guò)于片面,并且,對(duì)貴州學(xué)生來(lái)說(shuō),英語(yǔ)成績(jī)不良是普遍現(xiàn)象,不論是自卑傾向高的被試還是自卑傾向低的被試均易于選擇英語(yǔ)不好的選項(xiàng).因此,該項(xiàng)目對(duì)于區(qū)分被試自卑感高低的意義不大.因此,結(jié)合項(xiàng)目?jī)?nèi)容和項(xiàng)目分析的數(shù)據(jù)結(jié)果將項(xiàng)目1刪除.其余信息量較小的項(xiàng)目,即項(xiàng)目3、23、24、25、27最大信息量均在[0.2,0.3]之間,根據(jù)已有研究[15],這些項(xiàng)目應(yīng)該在內(nèi)容上加以改動(dòng),以便獲得更高的信息量.
本文用MODFIT模型—數(shù)據(jù)擬合指標(biāo)首先對(duì)原問(wèn)卷進(jìn)行了分析,模型—數(shù)據(jù)擬合是專(zhuān)屬于IRT理論框架下的數(shù)據(jù)與模型是否擬合的分析方法,是相較于常用的主成分分析和驗(yàn)證性因素分析更為嚴(yán)格的單維性檢驗(yàn)方法.本文所探討的問(wèn)卷當(dāng)中,只有單項(xiàng)目的χ2/df均達(dá)到擬合標(biāo)準(zhǔn),項(xiàng)目對(duì)和項(xiàng)目組的χ2/df未達(dá)到擬合標(biāo)準(zhǔn)的較多,目前為止關(guān)于模型—數(shù)據(jù)擬合的研究中只有少部分存在絕對(duì)擬合的情況.無(wú)論是人格、態(tài)度還是其他一些心理體驗(yàn),從其內(nèi)容上來(lái)說(shuō),都是復(fù)雜多向度的.盡管有學(xué)者提出過(guò)測(cè)量學(xué)意義上的單維性與心理學(xué)意義上的單維性存在差異,但是這種嚴(yán)格的單維性標(biāo)準(zhǔn)所產(chǎn)生的分析是否能夠全方面的驗(yàn)證出量表所測(cè)量的這一單一心理特質(zhì)本身涵蓋的多個(gè)方面,是值得研究者們深入探討的問(wèn)題.近年來(lái),關(guān)于多維IRT的發(fā)展和研究日益熱烈,多維IRT認(rèn)為項(xiàng)目和特質(zhì)之間不是一種簡(jiǎn)單的線性關(guān)系,而是非線性.因此,未來(lái)在對(duì)自卑感這類(lèi)心理體驗(yàn)的測(cè)量研究中,可以考慮運(yùn)用多維IRT的理論和方法,這或許可以得到更為理想的模型—數(shù)據(jù)擬合.
此外,本文所測(cè)被試數(shù)為340人,被試數(shù)較少,且僅限于測(cè)試貴州的大學(xué)生群體.這在一定程度上影響了IRT對(duì)項(xiàng)目參數(shù)估計(jì)的精確性.在以后的研究過(guò)程中,可以盡可能廣泛的尋找更多大學(xué)生進(jìn)行施測(cè),以便得到更有效的結(jié)果.
〔1〕MastersGN.ARaschmodelforpartialcreditscoring [J].Psychometrika.1982,47:149-174.
〔2〕MurakiE.Ageneralizedpartialcreditmodel:ApplicationofanEM-algorithm[J].AppliedPsychological Measurement.1992,16:159.
〔3〕SamejimaF.Estimationoflatentabilityusingaresponse patternofgradedscores[J].PsychometrikaMonograph Supplement.1969,17.
〔4〕MariaOrlandoEdelenBBR.Applyingitemresponse theory(IRT)modelingtoquestionnairedevelopment,evaluation,andrefinement[J].QualityofLifeResearch. 2007,16(1):5-18.
〔5〕薛雯.用項(xiàng)目反應(yīng)理論分析人際親密能力量表[J].經(jīng)營(yíng)管理者,2010(6):2-5.
〔6〕范曉玲,吳志勇,韓喆.IRT展開(kāi)模型在“大學(xué)生學(xué)習(xí)自主性量表”中的應(yīng)用[J].中國(guó)臨床心理學(xué)雜志,2009(3):333-336.
〔7〕楊業(yè)兵苗丹民田建全肖利軍.應(yīng)用項(xiàng)目反應(yīng)理論對(duì)<中國(guó)士兵人格問(wèn)卷>的項(xiàng)目分析[J].心理學(xué)報(bào),2008,40(5): 611-617.
〔8〕賈遠(yuǎn)娥.大學(xué)生的自卑心理[D].廣西師范大學(xué),2008.
〔9〕LindenWHRK.HandbookofModernItemResponseTheory[M].NewYork:SpringerVerlagIne, 1997.向:心理測(cè)量與咨詢(xún).
B841.7
A
1673-260X(2013)11-0091-02
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2013年21期