亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        項(xiàng)目反應(yīng)理論在健康相關(guān)量表中的應(yīng)用現(xiàn)狀及展望*

        2018-09-20 06:48:14哈爾濱醫(yī)科大學(xué)大慶護(hù)理學(xué)院163319王偉梁周郁秋
        關(guān)鍵詞:樣本量參數(shù)估計(jì)獨(dú)立性

        哈爾濱醫(yī)科大學(xué)(大慶)護(hù)理學(xué)院(163319) 王偉梁 周郁秋

        項(xiàng)目反應(yīng)理論(item response theory,IRT)屬于現(xiàn)代測(cè)量理論的一種,是針對(duì)經(jīng)典測(cè)量理論(classic test theory,CTT)在實(shí)踐中的局限性而提出的,其主要優(yōu)點(diǎn)為參數(shù)和能力估計(jì)的不變性[1]。除此之外,IRT在量表編制中優(yōu)于CTT的三個(gè)特點(diǎn):CTT注重量表的整體特性,而IRT則關(guān)注構(gòu)成量表的每一條目的特性;根據(jù)待測(cè)潛在特質(zhì)水平選擇項(xiàng)目;對(duì)項(xiàng)目和量表特性的視覺(jué)化表示[2]。其在健康相關(guān)領(lǐng)域中的應(yīng)用,使量表在評(píng)估被試潛在特質(zhì)的精確度及臨床應(yīng)用的簡(jiǎn)潔性、效率化上有一定的提高。鑒于以上優(yōu)點(diǎn),近年來(lái)IRT在量表編制和評(píng)價(jià)中得以廣泛應(yīng)用。本文通過(guò)檢索國(guó)內(nèi)關(guān)于IRT應(yīng)用于健康相關(guān)領(lǐng)域的研究,分析其在健康相關(guān)量表編制和評(píng)價(jià)中的應(yīng)用現(xiàn)狀,并總結(jié)IRT在應(yīng)用過(guò)程中存在的問(wèn)題以及最新的應(yīng)用動(dòng)態(tài)。

        本文通過(guò)檢索知網(wǎng)、萬(wàn)方和維普數(shù)據(jù)庫(kù),共篩選出86篇相關(guān)文獻(xiàn),文獻(xiàn)的基本信息見(jiàn)表1。結(jié)合數(shù)據(jù)分析可以看出,近年來(lái)文獻(xiàn)數(shù)量有了很大的增長(zhǎng),2010年至今,相關(guān)文獻(xiàn)達(dá)74篇(86%),從這一發(fā)展趨勢(shì)看,今后IRT勢(shì)必會(huì)成為量表編制和評(píng)價(jià)中的應(yīng)用熱點(diǎn)。但在文獻(xiàn)數(shù)量增加的同時(shí),文獻(xiàn)質(zhì)量也呈現(xiàn)出參差不齊。存在的主要問(wèn)題為:一是部分研究只根據(jù)經(jīng)驗(yàn)來(lái)選擇模型,而缺少統(tǒng)計(jì)學(xué)的評(píng)價(jià);二是研究中未重視IRT的基本假設(shè)檢驗(yàn);三是部分研究樣本量未達(dá)要求。這樣得出的結(jié)果就會(huì)有很大的誤差。IRT的理論基礎(chǔ)較為難懂,限制了其廣泛應(yīng)用,同時(shí)國(guó)內(nèi)相關(guān)應(yīng)用相對(duì)較少,缺少參照標(biāo)準(zhǔn),均導(dǎo)致大多研究者未意識(shí)到或忽略上述問(wèn)題對(duì)于IRT分析的重要性。

        IRT在量表編制和評(píng)價(jià)中的應(yīng)用

        1.條目篩選

        IRT的條目篩選是通過(guò)一系列的參數(shù)估計(jì)來(lái)實(shí)現(xiàn)的,具體包括區(qū)分度參數(shù)(a)、難度參數(shù)(b)、項(xiàng)目信息量(information function,IF)和項(xiàng)目功能差異(differential item functioning,DIF)。從檢索到的文獻(xiàn)來(lái)看,應(yīng)用最多的是a、b和IF,但不同研究所依據(jù)的參數(shù)參考范圍有很大差別。

        表1 IRT在國(guó)內(nèi)健康相關(guān)量表研究中的應(yīng)用現(xiàn)況

        *:量表再評(píng)價(jià)包括已有量表?xiàng)l目質(zhì)量評(píng)價(jià)、簡(jiǎn)化和DIF;CAT:計(jì)算機(jī)適應(yīng)性測(cè)驗(yàn);MIRT:多維項(xiàng)目反應(yīng)理論;NIRT:非參數(shù)項(xiàng)目反應(yīng)理論。

        (1)難度和區(qū)分度:難度和區(qū)分度的理論取值范圍均為[-∞,+∞],但在實(shí)踐中通常采用的參考值范圍分別為∈[-3,+3],a[-2.80,+2.80][3]。也有研究表明:在健康相關(guān)領(lǐng)域中,由于測(cè)量的潛在特質(zhì)概念界定相對(duì)狹窄,應(yīng)用IRT參數(shù)估計(jì)出的區(qū)分度值總體偏高,此時(shí)仍參照[-2.80,+2.80]已無(wú)實(shí)際意義,為挑選最佳量表?xiàng)l目,會(huì)在其研究中對(duì)區(qū)分度范圍重新界定[4-5],但不應(yīng)超出以上范圍;(2)信息量:一般認(rèn)為量表信息量>25表明條目質(zhì)量良好;信息量16~25表明測(cè)評(píng)條目有待改進(jìn);信息量<16表明測(cè)評(píng)條目很差。16和25與條目個(gè)數(shù)的比值即為每個(gè)條目的平均信息量參考范圍,條目信息量小于平均信息量的建議刪除[6-7];(3)項(xiàng)目功能差異:質(zhì)量高的量表?xiàng)l目被認(rèn)為其對(duì)不同亞組人群(年齡、性別等)的潛在特質(zhì)鑒別上應(yīng)沒(méi)有差別。當(dāng)同一條目在兩個(gè)亞組中的平均閾值差異大于0.5,則可認(rèn)為該條目存在DIF,考慮刪除[8]。

        檢索到的相關(guān)文獻(xiàn)中,23篇(72%)采用IRT結(jié)合CTT進(jìn)行條目篩選。CTT注重的是量表的宏觀評(píng)價(jià),即量表的整體特性,IRT注重的是量表的微觀評(píng)價(jià),即每一條目的測(cè)量學(xué)特質(zhì),所以在量表?xiàng)l目篩選中,建議結(jié)合IRT和CTT對(duì)量表?xiàng)l目進(jìn)行綜合評(píng)價(jià),評(píng)價(jià)結(jié)果一致,則為條目的取舍提供更強(qiáng)的說(shuō)服力;評(píng)價(jià)結(jié)果不同,則有助于我們從不同角度分析問(wèn)題,找出原因所在,為條目的篩選提供更寬的視角。

        2.量表再評(píng)價(jià)

        量表簡(jiǎn)化:IRT在量表編制中的一大特點(diǎn)為用最精簡(jiǎn)的條目反映最大的信息量。一些基于CTT編制的量表,有必要在IRT下進(jìn)行進(jìn)一步的簡(jiǎn)化,提高臨床和科研效率,減輕被試負(fù)擔(dān),增強(qiáng)其臨床適用性[9-10]。量表結(jié)構(gòu)和條目質(zhì)量評(píng)價(jià):為使量表整體和條目質(zhì)量達(dá)到最優(yōu)化,許多研究者將已有量表在IRT的基礎(chǔ)上對(duì)其維度結(jié)構(gòu)和條目質(zhì)量再次評(píng)價(jià),使其更好地應(yīng)用于臨床實(shí)踐[11-13]。

        3.計(jì)算機(jī)適應(yīng)性測(cè)驗(yàn)(computerized adaptive testing,CAT)

        CAT主要是根據(jù)受試者的答題反應(yīng),利用計(jì)算機(jī)選出符合受試者程度值的題目讓其作答,因此只需要少數(shù)題目就能達(dá)到與傳統(tǒng)非適應(yīng)性測(cè)驗(yàn)相當(dāng)?shù)臏y(cè)量精準(zhǔn)度[14]。CAT一般應(yīng)用于大型的人格或能力測(cè)驗(yàn),在健康相關(guān)量表中的應(yīng)用很少,在檢索到的國(guó)內(nèi)相關(guān)文獻(xiàn)中,僅有Yang等[15]在其研究中對(duì)急性壓力反應(yīng)量表臨床測(cè)評(píng)應(yīng)用了CAT,而國(guó)外近幾年將CAT應(yīng)用于健康相關(guān)量表評(píng)價(jià)的研究則較多[16-19]。

        IRT近年來(lái)在量表編制和評(píng)價(jià)中的應(yīng)用逐漸受到重視,而臨床廣泛使用的量表評(píng)價(jià)工具都是在CTT的基礎(chǔ)上發(fā)展而來(lái)的,往往帶有CTT固有的局限性,所以有必要在現(xiàn)代測(cè)量理論的基礎(chǔ)上進(jìn)行量表特性的再分析評(píng)價(jià),使其更好地應(yīng)用于臨床實(shí)踐;量表簡(jiǎn)化和CAT在科學(xué)的基礎(chǔ)上,保證測(cè)量精準(zhǔn)度不變的情況下,大大提高臨床和科研效率,更加符合實(shí)踐應(yīng)用的要求。

        IRT在應(yīng)用中需注意的問(wèn)題

        IRT是建立在復(fù)雜的數(shù)學(xué)模型基礎(chǔ)上的,其應(yīng)用條件相對(duì)嚴(yán)格,只有數(shù)據(jù)符合IRT的基本要求時(shí),其優(yōu)越性才能體現(xiàn)出來(lái),否則,IRT的參數(shù)估計(jì)就無(wú)實(shí)際參考意義。結(jié)合IRT在國(guó)內(nèi)健康相關(guān)量表中的應(yīng)用狀況分析,其主要問(wèn)題為樣本量和假設(shè)檢驗(yàn)。

        1.模型擬合檢驗(yàn)

        選擇合適的模型是保證IRT數(shù)據(jù)分析結(jié)果準(zhǔn)確性的前提。從檢索到的文獻(xiàn)來(lái)看,僅1篇(1.2%)從統(tǒng)計(jì)學(xué)角度評(píng)估模型適配程度,大多數(shù)模型的選擇是依據(jù)相關(guān)經(jīng)驗(yàn)或文獻(xiàn)回顧,而缺少統(tǒng)計(jì)學(xué)的評(píng)價(jià)指標(biāo)。除Rasch模型外,其他模型的擬合檢驗(yàn)均是通過(guò)嵌套模型之間的對(duì)比間接評(píng)價(jià)的,常用的統(tǒng)計(jì)評(píng)價(jià)指標(biāo)為對(duì)數(shù)似然函數(shù)值(-2 Log Likelihood),其值越小,表明模型-數(shù)據(jù)擬合越好,目前IRTPRO、BIOLOG、MUITILOG、PARSCALE及Stata14.0等軟件均可進(jìn)行這一參數(shù)估計(jì)。除此之外,還有S-G2、S-χ2等也可用于評(píng)價(jià)模型擬合的好壞[20]。除模型擬合檢驗(yàn)外,往往還需要進(jìn)行條目擬合檢驗(yàn),在條目水平上評(píng)估模型與實(shí)際資料是否相吻合,可用于篩選量表中的個(gè)別條目[8,21]。

        2.假設(shè)檢驗(yàn)

        IRT建立在很強(qiáng)的假設(shè)基礎(chǔ)上,要滿足相應(yīng)的假設(shè)檢驗(yàn),得出的參數(shù)估計(jì)才有意義,否則,會(huì)出現(xiàn)很大的誤差。項(xiàng)目反應(yīng)理論的兩個(gè)重要的基本假設(shè)即單維性和局部獨(dú)立性。目前檢索到的文獻(xiàn)中,共30篇(34.0%)進(jìn)行了單維性檢驗(yàn),而僅3篇(3.4%)文獻(xiàn)中進(jìn)行了局部獨(dú)立性檢驗(yàn)。

        (1)單維性檢驗(yàn)

        單維性即所有量表?xiàng)l目反映的是同一潛在特質(zhì)。所有的IRT模型(除MIRT)均需要單維性檢驗(yàn),而大多數(shù)的研究中往往忽略這一點(diǎn),一是因?yàn)椴糠盅芯空呶匆庾R(shí)到單維檢驗(yàn)對(duì)數(shù)據(jù)分析的重要性,二是相關(guān)統(tǒng)計(jì)方法不明確。參考國(guó)內(nèi)外相關(guān)研究,單維性檢驗(yàn)的方法有:特征根比值法[22-24]、主成分分析[25]、平行分析[26]和殘差分析[27]。其中特征根比值法最為常用。

        (2)局部獨(dú)立性檢驗(yàn)

        局部獨(dú)立性即被試的潛在特質(zhì)是影響被試反應(yīng)的唯一因素,此假設(shè)是建立在單維性假設(shè)的基礎(chǔ)上的,只有單維性假設(shè)成立,該假設(shè)才有可能成立。

        局部獨(dú)立性檢驗(yàn)的方法有(1)殘差相關(guān):驗(yàn)證性因子分析的殘差相關(guān)來(lái)檢驗(yàn)條目間獨(dú)立性,殘差相關(guān)絕對(duì)值≤0.3,表示局部獨(dú)立性假設(shè)成立[28];(2)X2檢驗(yàn):Chen和Thissen建議局部獨(dú)立性χ2值≥10,表示假設(shè)成立[29]。此外還有G2檢驗(yàn)、Q3檢驗(yàn)等[30]。

        局部獨(dú)立性檢驗(yàn)是IRT應(yīng)用的一個(gè)前提,然而諸多學(xué)者建議,在認(rèn)為能力是單維的情況下,局部獨(dú)立性和單維性假定是等價(jià)的,即數(shù)據(jù)只要滿足單維性檢驗(yàn),就一定符合局部獨(dú)立性[24,31-32]。因此,建議在實(shí)際應(yīng)用中,若數(shù)據(jù)很好地滿足單維的標(biāo)準(zhǔn),則可以認(rèn)為單維性和局部獨(dú)立性是等價(jià)的。

        3.樣本量

        IRT的不同模型對(duì)樣本量的需求尚無(wú)統(tǒng)一標(biāo)準(zhǔn),模型越復(fù)雜,需要的樣本量越大。Linacre等[33]建議Rasch模型(1PL)參數(shù)估計(jì)時(shí)樣本量至少100例,而Wright等[34]則建議至少要達(dá)到200才能得出穩(wěn)定結(jié)果;Hulin等[35]建議雙參數(shù)模型(2PL)至少需要500被試,參數(shù)估計(jì)才具有準(zhǔn)確性;對(duì)于三參數(shù)模型(3PL),樣本量則至少要達(dá)到1000。而等級(jí)反應(yīng)模型(GRM)至少需要250例數(shù)據(jù)才能得出準(zhǔn)確的參數(shù)估計(jì)[36]。

        總的來(lái)說(shuō),樣本量越大,條目的參數(shù)估計(jì)越準(zhǔn)確,得分的標(biāo)準(zhǔn)誤差越小[37]。本研究檢索到的86篇相關(guān)文獻(xiàn)中,樣本量范圍為133~7229例,其中20篇(23%)存在樣本量過(guò)小的問(wèn)題,最小的樣本量?jī)H133例(非Rasch模型),這樣估計(jì)出來(lái)的參數(shù)顯然是不可靠的。在健康相關(guān)領(lǐng)域中,由于某些疾病本身特點(diǎn)的影響,使樣本量的可及性受到一定的限制,在模型和基本檢驗(yàn)較好的情況下,樣本量可適當(dāng)縮小,但不應(yīng)低于最低要求。

        項(xiàng)目反應(yīng)理論的發(fā)展

        IRT的參數(shù)估計(jì)依賴于一系列的假設(shè)基礎(chǔ),而實(shí)際的數(shù)據(jù)往往難以滿足IRT的基本假設(shè),給實(shí)踐應(yīng)用造成很大的不便,這就使得近年來(lái)在IRT基礎(chǔ)上發(fā)展的多維項(xiàng)目反應(yīng)理論(multidimensional item response theory,MIRT)和非參數(shù)項(xiàng)目反應(yīng)理論(nonparametric item response theory,NIRT)受到更多的關(guān)注。

        1.多維項(xiàng)目反應(yīng)理論

        對(duì)于不滿足單維性假設(shè)的數(shù)據(jù),MIRT為其提供了替代方案。對(duì)于健康相關(guān)量表而言,測(cè)量的潛在特質(zhì)往往是多維的,且量表維度跨度較大,維度之間同質(zhì)性較差,所以較難滿足單維假設(shè)。目前,對(duì)于不滿足單維假定的數(shù)據(jù)有兩種處理方法:整體量表不滿足單維性,分每個(gè)維度進(jìn)行單維性檢驗(yàn),若滿足,進(jìn)行進(jìn)一步分析[38-39];應(yīng)用MIRT處理數(shù)據(jù)[15,40]。然而若將每個(gè)維度單獨(dú)進(jìn)行檢驗(yàn)和參數(shù)估計(jì),則忽略了量表整體之間的相關(guān)性,測(cè)量結(jié)果也會(huì)受影響。所以在數(shù)據(jù)不滿足單維時(shí),MIRT應(yīng)作為首選。

        2.非參數(shù)項(xiàng)目反應(yīng)理論

        NIRT不是通過(guò)一系列的參數(shù)估計(jì)來(lái)評(píng)價(jià)被試的潛在特質(zhì)水平,而是直接按被試在測(cè)試中所得的分?jǐn)?shù)進(jìn)行排序,從而得出被試特質(zhì)水平的高低[41]。由于其對(duì)基本假設(shè)和樣本量要求相對(duì)寬泛,國(guó)外已有諸多研究將NIRT應(yīng)用于健康相關(guān)量表的評(píng)價(jià)[9,11]。

        展 望

        IRT因其在量表應(yīng)用中的顯著優(yōu)點(diǎn),近年來(lái)相關(guān)研究日漸增多。在條目篩選中,IRT結(jié)合CTT將從不同角度為量表?xiàng)l目篩選提供更加全面的依據(jù);量表再評(píng)價(jià)、簡(jiǎn)化以及CAT將大大提高量表測(cè)量工具在臨床應(yīng)用和研究中的效率,以最簡(jiǎn)潔、優(yōu)質(zhì)的條目準(zhǔn)確地評(píng)估被試特征,在今后的相關(guān)研究中應(yīng)更多地引入IRT。同時(shí),IRT建立在復(fù)雜的數(shù)學(xué)模型基礎(chǔ)上,依賴于較強(qiáng)的假設(shè),對(duì)數(shù)據(jù)要求比較嚴(yán)格,所以國(guó)外研究近年來(lái)較為推崇MIRT和NIRT,而國(guó)內(nèi)在這方面的應(yīng)用則非常有限。本文對(duì)IRT在我國(guó)健康相關(guān)量表中的應(yīng)用現(xiàn)狀進(jìn)行了分析總結(jié),并對(duì)應(yīng)用中存在的問(wèn)題及近年來(lái)國(guó)外研究中的應(yīng)用熱點(diǎn)進(jìn)行了介紹,為今后IRT在我國(guó)量表編制和評(píng)價(jià)中更為廣泛的應(yīng)用提供參考。

        猜你喜歡
        樣本量參數(shù)估計(jì)獨(dú)立性
        事件的相互獨(dú)立性題型例講
        基于新型DFrFT的LFM信號(hào)參數(shù)估計(jì)算法
        醫(yī)學(xué)研究中樣本量的選擇
        培養(yǎng)幼兒獨(dú)立性的有效策略
        甘肅教育(2020年12期)2020-04-13 06:25:10
        航空裝備測(cè)試性試驗(yàn)樣本量確定方法
        Sample Size Calculations for Comparing Groups with Binary Outcomes
        Logistic回歸模型的幾乎無(wú)偏兩參數(shù)估計(jì)
        基于向前方程的平穩(wěn)分布參數(shù)估計(jì)
        基于競(jìng)爭(zhēng)失效數(shù)據(jù)的Lindley分布參數(shù)估計(jì)
        考慮誤差非獨(dú)立性的電力系統(tǒng)參數(shù)辨識(shí)估計(jì)
        亚洲AV无码乱码1区久久| 天天爽夜夜爽夜夜爽| 真实夫妻露脸自拍视频在线播放| 在线观看视频日本一区二区| 亚洲国产色一区二区三区| 蜜桃视频一区二区在线观看| 最近中文字幕国语免费| 女女互揉吃奶揉到高潮视频| 日本老熟妇50岁丰满| 欧美日韩精品一区二区在线观看| 伊人久久综合影院首页| 国模无码视频专区一区| 无码国产一区二区色欲| 日本大片在线一区二区三区| 麻豆精品国产免费av影片| 第一九区另类中文字幕| 伊人久久综合无码成人网| 久久久无码精品亚洲日韩蜜臀浪潮 | 日本中文字幕乱码中文乱码| 亚洲精品第一页在线观看 | 在线亚洲精品中文字幕美乳色| 99精品视频69v精品视频| 日韩av东京社区男人的天堂| 亚洲精品无播放器在线播放| 香蕉色香蕉在线视频| 乱人伦中文字幕在线不卡网站 | 风骚人妻一区二区三区| 人妻中文字幕乱人伦在线| 午夜精品久久久久久中宇| 一区欧美在线动漫| 青青草视全福视频在线| 亚洲精品98中文字幕| 亚洲精品国偷拍自产在线| 曰本无码人妻丰满熟妇啪啪| 国产成人亚洲精品无码h在线| 亚洲乱在线播放| 在线日本国产成人免费精品| 成年丰满熟妇午夜免费视频 | 边做边流奶水的人妻| 亚洲h视频| 亚洲国产香蕉视频欧美|