鄧穩(wěn)根 戴海琦 黃海等
摘要調(diào)查了拓廣等級(jí)展開(kāi)模型(GGUM)對(duì)EPQ反應(yīng)數(shù)據(jù)的擬合情況。結(jié)果發(fā)現(xiàn):(1)E量表最符合GGUM單維性的假設(shè),即得到2個(gè)線性主成分,項(xiàng)目在這2個(gè)主成分上的負(fù)荷略微呈現(xiàn)一個(gè)半圓形的模式;(2)約束GGUM的閾限參數(shù)在項(xiàng)目間相等而得到的模型A在對(duì)EPQ的數(shù)據(jù)進(jìn)行分析時(shí)是最簡(jiǎn)潔而有效的;(3)模型A和2PLM相比,前者在E和P上的擬合顯著優(yōu)于后者,在N上,兩個(gè)模型提供了相似的擬合度。結(jié)果表明展開(kāi)模型比優(yōu)勢(shì)模型更適合用于分析EP0的數(shù)據(jù)。
關(guān)鍵詞拓廣等級(jí)展開(kāi)模型,人格,EPQ,模型一數(shù)據(jù)擬合。
分類(lèi)號(hào)G449.1
1引言
項(xiàng)目反應(yīng)理論(IRT)當(dāng)前在國(guó)外廣泛用于包括才能、成就、熟練性、入學(xué)和職業(yè)資格考試的認(rèn)知能力評(píng)估中,但在態(tài)度、人格等領(lǐng)域中的應(yīng)用并不普遍。原因之一是大部分IRT模型是建立在反應(yīng)過(guò)程的優(yōu)勢(shì)假設(shè)基礎(chǔ)之上,即認(rèn)為個(gè)體在特質(zhì)連續(xù)體上的位置越高于項(xiàng)目的位置,作答正確的可能性就越大。而Andrich和Luo以及Roberts等人則認(rèn)為態(tài)度測(cè)量中的不贊成一贊成反應(yīng)是和理想點(diǎn)假設(shè)相關(guān)聯(lián)的,即只有當(dāng)個(gè)體在態(tài)度連續(xù)體上的位置與項(xiàng)目位置接近時(shí),才最可能贊成項(xiàng)目,當(dāng)遠(yuǎn)離項(xiàng)目位置,無(wú)論是高于還是低于項(xiàng)目位置時(shí),個(gè)體贊成項(xiàng)目的概率都較低。采用優(yōu)勢(shì)模型對(duì)態(tài)度陳述的反應(yīng)數(shù)據(jù)進(jìn)行分析會(huì)降低處于態(tài)度連續(xù)體兩個(gè)極端位置上的個(gè)體的特質(zhì)水平的測(cè)量效度。Chernyshenko等人和Stark等人認(rèn)為人格項(xiàng)目本質(zhì)上是關(guān)于人們自身的行為態(tài)度陳述,因而人格測(cè)驗(yàn)的數(shù)據(jù)更適用于使用展開(kāi)模型而不是優(yōu)勢(shì)模型進(jìn)行分析。
目前研究者提出了多種展開(kāi)模型,既有參數(shù)式的模型,例如PARELLA模型、雙曲余弦模型(日CM)、等級(jí)展開(kāi)模型(GUM)和拓廣等級(jí)展開(kāi)模型(GGUM),也有非參數(shù)式的模型。非參數(shù)模型由于容易受到項(xiàng)目或被試抽樣的影響,在實(shí)際研究中使用較少。而參數(shù)模型由于提供了參數(shù)不變性的測(cè)量。有利于計(jì)算機(jī)自適應(yīng)測(cè)試(CAT)、題庫(kù)建設(shè)和項(xiàng)目參數(shù)的鏈接或等值,因而為大多數(shù)量表建構(gòu)和數(shù)據(jù)分析所采用。
在已有的幾個(gè)展開(kāi)模型中,使用最多的是Roberts等人提出的一族展開(kāi)模型,該族模型的最一般形式是GGUM問(wèn)。GGUM允許區(qū)分度和閾限參數(shù)在項(xiàng)目間變化,適用于不贊成一贊成反應(yīng)類(lèi)別的數(shù)據(jù)。對(duì)GGUM的項(xiàng)目區(qū)分度和閾限參數(shù)進(jìn)行不同形式的約束可以得到其余7個(gè)約束模型(詳細(xì)情況可參閱文獻(xiàn)),目前已經(jīng)有一些研究者開(kāi)始探索GGUM在EPQ、16PF、大五人格問(wèn)卷以及情感能力問(wèn)卷的數(shù)據(jù)中的擬合性。在這些研究中,沒(méi)有直接調(diào)查數(shù)據(jù)是否滿(mǎn)足單維性的假設(shè),研究的重點(diǎn)僅放在優(yōu)勢(shì)模型和GGUM對(duì)項(xiàng)目反應(yīng)數(shù)據(jù)擬合的差異比較上,而沒(méi)有研究Roberrs等人提出的8個(gè)展開(kāi)模型中哪個(gè)模型擬合最優(yōu)。本研究將采用主成分方法和平行分析程序直接檢驗(yàn)EPQ各分量表反應(yīng)數(shù)據(jù)是否滿(mǎn)足單維性條件,并比較GGUM和它的三個(gè)約束模型在EPQ各分量表反應(yīng)數(shù)據(jù)上的擬合差異,最后將前一步得到的擬合最優(yōu)模型與2PLM進(jìn)行比較,以便獲得展開(kāi)模型與優(yōu)勢(shì)模型在人格測(cè)量數(shù)據(jù)中擬合優(yōu)劣的證據(jù)。
2方法
采用陳仲庚修訂的EPQ問(wèn)卷對(duì)某大學(xué)的1947名本科生進(jìn)行施測(cè),其中男生1181人,女生766人,所有被試的平均年齡為18.6歲,標(biāo)準(zhǔn)差為1.08。
采用O'Connor編制的SPSS程序進(jìn)行主成分分析和平行分析。采用GGUM2004和BILOG-MG計(jì)算機(jī)程序估計(jì)項(xiàng)目和個(gè)人參數(shù),采用MODFIT計(jì)算擬合統(tǒng)計(jì)量的值。GGUM2004和MODFIT均可以從互聯(lián)網(wǎng)上獲得。
3結(jié)果
3.1單維性檢驗(yàn)
Davision等人證實(shí)了當(dāng)數(shù)據(jù)擬合一個(gè)單維展開(kāi)模型時(shí),采用主成分分析將得到2個(gè)主成分,并且項(xiàng)目在這2個(gè)主成分上的負(fù)荷形成一個(gè)扇形的模式。Nandakumar等人在GGUM的模擬研究中發(fā)現(xiàn)因素主軸分析不適用于展開(kāi)模型的維度檢驗(yàn),而采用主成分分析則顯得較為合理。他結(jié)合主成分分析和bootstrapped法平行分析也得到了2個(gè)線性主成分,各項(xiàng)目在這兩個(gè)成分上的負(fù)荷在第1和第1V象限內(nèi)形成一個(gè)半圓形的扇形模式。
本研究的結(jié)果如圖1和圖2所示。從圖1中可以看出,E和P量表的平行分析結(jié)果保留了兩個(gè)線性主成分。E量表的2個(gè)線性主成分的特征值分別為5,21和1.32。第一和第二主成分的負(fù)荷相差達(dá)3倍以上。P量表第一主成分和第二主成分的特征值相差并不大,分別為2.00和1.61。N量表保留了3個(gè)線性主成分。這三個(gè)線性主成分的特征值分別為5.66、1.44和1.30,第一主成分的特征值比第二第三主成分的特征值約高4倍或更多。進(jìn)一步以2個(gè)成分?jǐn)?shù)目進(jìn)行主成分抽取,分別得到各量表下的項(xiàng)目在這兩個(gè)主成分上的負(fù)荷(未旋轉(zhuǎn))散點(diǎn)圖(如圖2)。從散點(diǎn)圖可以看出,除E量表的成分負(fù)荷略呈半圓形的模式外,N和P量表的成分負(fù)荷均未呈現(xiàn)這種模式。綜合兩個(gè)方面的結(jié)果,本文認(rèn)為E量表較符合展開(kāi)反應(yīng)型數(shù)據(jù)單維性假設(shè),相對(duì)其它兩個(gè)量表可能更適合采用展開(kāi)模型來(lái)分析,而N量表由于第一主成分有足夠大;可能更符合優(yōu)勢(shì)反一應(yīng)型數(shù)據(jù)單維性的假設(shè),采用展開(kāi)模型進(jìn)行分析并不會(huì)比累積模型有更大的優(yōu)勢(shì)。P量表對(duì)于兩種類(lèi)型數(shù)據(jù)的單維性假設(shè)都不太滿(mǎn)足,采用兩種模型來(lái)分析都有可能不太擬合數(shù)據(jù)。
3.2四個(gè)展開(kāi)模型之間的比較
Roberts等人提出,似然比統(tǒng)計(jì)量可以用來(lái)檢驗(yàn)嵌套模型的整體擬合差異。方法是首先通過(guò)約束特定的項(xiàng)目參數(shù)得到一個(gè)嵌套的約束模型,然后將該約束模型的反應(yīng)似然(L*)和一個(gè)受更少約束(或無(wú)約束)模型的反應(yīng)似然(L)進(jìn)行比較。似然比統(tǒng)計(jì)量(LR)等于-2[1n(L*)1n(L)]。該統(tǒng)計(jì)量服從自由度等于2個(gè)模型中待估項(xiàng)目參數(shù)數(shù)量之差的)(分布。本研究中考察了GGUM的3個(gè)約束模型,其中模型A是將GGUM項(xiàng)目間的閾限參數(shù)(Tik)固定為常數(shù)而得到的模型,模型B是將項(xiàng)目間的區(qū)分度參數(shù)固定為1.0,模型C對(duì)這2個(gè)參數(shù)都進(jìn)行了固定。這三個(gè)約束模型都是GGUM的嵌套模型,而模型C又嵌套于模型A或B,因而可以使用似然比統(tǒng)計(jì)量來(lái)評(píng)價(jià)增加的模型擬合。表l概括了在EPQ上,這些模型的比較結(jié)果。從表中可以看出,和GGUM相比,模型B和C都導(dǎo)致顯著減少的擬合值,而模型A擬合值的減少并不大,表明EPQ問(wèn)卷的反應(yīng)數(shù)據(jù)采用模型A來(lái)分析是最簡(jiǎn)潔而有效的。
3.3模型A和2PLM的項(xiàng)目擬合情況比較
GGUM2004計(jì)算機(jī)程序中使用的項(xiàng)目擬合統(tǒng)計(jì)量是從優(yōu)勢(shì)模型中拓廣過(guò)來(lái)的,DeMars應(yīng)用它們到展開(kāi)模型中時(shí),發(fā)現(xiàn)它們的I型錯(cuò)誤率都有些問(wèn)題,所以在人格測(cè)量中。經(jīng)常采用單個(gè)項(xiàng)目、
兩項(xiàng)目對(duì)和三項(xiàng)目組的x2/df指數(shù)來(lái)考察項(xiàng)目的捌合情況。Drasgow等人認(rèn)為這個(gè)統(tǒng)計(jì)量對(duì)比較幾個(gè)競(jìng)爭(zhēng)的IRT模型是非常有用的,最佳擬合的模型對(duì)單個(gè)項(xiàng)目和兩項(xiàng)目對(duì)以及三項(xiàng)目組都有較小(低于3)的校正的x2/df。如果校正的)x2/df>3則表明項(xiàng)目/選項(xiàng)反應(yīng)函數(shù)的參數(shù)形式被違背了,或者數(shù)據(jù)是多維的,這兩種情況都顯示所選的IRT模型不擬合數(shù)據(jù)。本研究將比較2PLM和模型A的校正)x2/df之所以選擇2PLM和模型A進(jìn)行比較,是因?yàn)榇蠖鄶?shù)研究發(fā)現(xiàn)2PLM在優(yōu)勢(shì)模型中是擬合人格數(shù)據(jù)最優(yōu)的。比較的結(jié)果如表2所示。從表2中可以看出,模型A在E和P量表,特別是在P量表上的擬合顯著優(yōu)于2PLM。在N量表上兩個(gè)模型的擬合相類(lèi)似,且擬合都比較優(yōu)良。
4討論
本研究結(jié)果表明,總體來(lái)看,展開(kāi)模型比優(yōu)勢(shì)模型更擬合EPQ反應(yīng)數(shù)據(jù),這說(shuō)明個(gè)體對(duì)人格項(xiàng)目的反應(yīng)更可能是基于理想過(guò)程假設(shè)而不是優(yōu)勢(shì)過(guò)程假設(shè)的。展開(kāi)模型之間的比較結(jié)果顯示,盡管GGUM對(duì)項(xiàng)目參數(shù)的考慮更為完備,但并沒(méi)有因此導(dǎo)致模型對(duì)數(shù)據(jù)擬合的顯著改善,而更為簡(jiǎn)潔的模型A(即限制閾限參數(shù)在項(xiàng)目間是固定的)提供了和GGUM一樣有效的結(jié)果,原因可能是現(xiàn)有的EPQ問(wèn)卷的項(xiàng)目?jī)?nèi)容一致性較強(qiáng),導(dǎo)致這些項(xiàng)目的反應(yīng)閾限比較接近,從而限制各項(xiàng)目的閾限相等并不會(huì)導(dǎo)致模型的擬合變差。
本研究發(fā)現(xiàn)展開(kāi)模型對(duì)E量表的項(xiàng)目反應(yīng)擬合最好,該結(jié)果印證了Nandakumar等人模擬研究的結(jié)果,即當(dāng)數(shù)據(jù)顯示出2個(gè)線性主成分,并且項(xiàng)目在這2個(gè)線性主成分上的負(fù)荷符合一個(gè)半圓形的扇形模式時(shí),最適合采用展開(kāi)模型進(jìn)行分析。本研究也發(fā)現(xiàn),當(dāng)?shù)?主成分遠(yuǎn)遠(yuǎn)大于第2主成分時(shí),例如E和N量表,采用合適的優(yōu)勢(shì)模型和展開(kāi)模型進(jìn)行分析。結(jié)果都比較良好。而當(dāng)?shù)趌主成分和第2主成分相差不大,且有2個(gè)主成分被保留時(shí),例如P量表,展開(kāi)模型的擬合顯著優(yōu)于優(yōu)勢(shì)模型。該結(jié)果是否具有一般性還需要進(jìn)一步研究。
本研究的結(jié)果顯示P量表第1和第2主成分的特征值相差并不大,表明該量表可能存在多維性。原因可能與該維度的確定缺乏一定的依據(jù)有關(guān)。目前已有實(shí)驗(yàn)證據(jù)確定了E維度和N維度神經(jīng)機(jī)制的存在,但P維度存在的機(jī)制尚缺乏足夠的證據(jù)支持,導(dǎo)致該量表項(xiàng)目?jī)?nèi)容的編制缺乏明確的界定,從而無(wú)法保證這些項(xiàng)目的同質(zhì)性,也就很難確保該量表的單維性。
5結(jié)論
本研究可以得出這樣的結(jié)論,即Roberts的展開(kāi)模型比2PLM更適用于EPQ的數(shù)據(jù)分析,且EPQ問(wèn)卷的E量表最適合采用他提出的展開(kāi)模型進(jìn)行分析。本研究深化了Nandakumar等人的研究,即當(dāng)數(shù)據(jù)擬合單維展開(kāi)模型時(shí),不僅要求在采用主成分分析時(shí)能得到2個(gè)線性主成分,而且要求這2個(gè)主成分的差異要足夠大,這樣才有可能使得項(xiàng)目在這2個(gè)主成分上的負(fù)荷呈現(xiàn)半圓形的扇形模式。本研究中也發(fā)現(xiàn),當(dāng)一些人格變量的數(shù)據(jù)并不完全符合單維性假設(shè)時(shí),采用單維展開(kāi)模型也能較好地?cái)M合它。