亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于三參數(shù)Logistic模型Gibbs抽樣方法的敏感度分析

        2022-05-05 06:21:38付志慧
        關(guān)鍵詞:樣本容量區(qū)分度先驗(yàn)

        付志慧, 周 末

        (沈陽師范大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院, 沈陽 110034)

        0 引 言

        項(xiàng)目反應(yīng)理論(item response theory, IRT)[1]是在經(jīng)典測量理論受到了局限性限制的背景下逐漸發(fā)展起來的一種新的現(xiàn)代測量理論[2]。模型參數(shù)估計(jì)問題是IRT中比較重要的部分,當(dāng)前主要采用的估計(jì)方法是期望最大化(expectation maximization,EM)算法[3-5]和馬爾可夫鏈蒙特卡羅(Markov chain Monte Carlo, MCMC)算法[6],最簡單的MCMC算法之一是Gibbs抽樣[7-8],相比于其它算法具有幾何遍歷性和收斂速度快等優(yōu)點(diǎn)。Albert(1992)[9]首次將Gibbs抽樣應(yīng)用于IRT模型中。Fu等(2009)[10]基于增加數(shù)據(jù)的Gibbs抽樣方法,提出了一種估計(jì)多維3PL模型的貝葉斯方法。然而,針對3PL模型,關(guān)于項(xiàng)目參數(shù)的先驗(yàn)分布對該抽樣方法的估計(jì)效果的影響研究甚少。本文基于增加數(shù)據(jù)的Gibbs抽樣方法針對3PL模型討論了項(xiàng)目參數(shù)取不同的先驗(yàn)分布時對估計(jì)結(jié)果的影響,并進(jìn)一步研究了不同的樣本容量(N)及不同的測試長度(n)下估計(jì)結(jié)果的差異。

        1 3PL模型介紹和先驗(yàn)假設(shè)

        假設(shè)N個被試,n個題目,yij表示第j個被試回答第i個題目的得分,當(dāng)回答正確時等于1,回答錯誤時等于0。令pij為第j個被試對于第i個題目正確作答的概率,3PL模型的表達(dá)式為

        其中:i=1,2,…,n;j=1,2,…,N;θj為第j個被試的能力參數(shù);ai為題目i的區(qū)分度參數(shù);bi為題目i的難度參數(shù);ci為題目i的猜測度參數(shù),是模型的下漸近線。令

        則有

        (1)

        2 引進(jìn)潛變量和Gibbs抽樣過程

        Gibbs抽樣是常用的MCMC方法之一,主要適用于模型聯(lián)合分布比較復(fù)雜而無法直接得出每個參數(shù)后驗(yàn)分布的情形。在本文研究的3PL模型中,對于反應(yīng)數(shù)據(jù)yij,通過引進(jìn)2個互相獨(dú)立的隨機(jī)變量rij和uij,其中rij~Binomial(1,ci),uij~Uniform(0,1),從而模型各個參數(shù)的滿條件分布都簡單易得。具體地,令

        (2)

        又由

        可把式(2)取期望即得到式(1)。令ξ=(θj,ai,bi,ci),隨著潛變量rij和uij的引入,(ξ,rij,uij)的聯(lián)合后驗(yàn)密度為

        由此可得出uij,rij,ci,bi,θj,ai的滿條件分布(具體過程參見附錄,詳見[12])。

        3 模擬實(shí)驗(yàn)

        按照上述抽樣過程,在本節(jié)模擬分析中考慮以下3個影響因素,即樣本容量N(N=1 000,2 000,5 000),測試長度n(n=10,20,40),項(xiàng)目參數(shù)的先驗(yàn)分布(假定共2×3=6種先驗(yàn),詳見表1),

        總計(jì)3×

        表1 項(xiàng)目參數(shù)的先驗(yàn)分布Table 1 Prior distribution of item parameters

        3×6=54種模擬條件。進(jìn)一步,能力參數(shù)(θ)和難度參數(shù)(b)的真值從標(biāo)準(zhǔn)正態(tài)分布N(0,1)中產(chǎn)生,區(qū)分度參數(shù)(a)的真值從對數(shù)正態(tài)分布中產(chǎn)生,即lna~N(0,0.2),猜測度參數(shù)(c)的真值從貝塔分布中產(chǎn)生,即c~Beta(8,32)。上述每種情形重復(fù)進(jìn)行R=20次實(shí)驗(yàn)。

        在估計(jì)結(jié)果匯報中,使用均方根誤差(rootmeansquarederror,RMSE)和偏差(bias)評估項(xiàng)目參數(shù)估計(jì)的準(zhǔn)確性[13]。RMSE和bias的定義如下:

        其中:τ為項(xiàng)目參數(shù)(ai,bi,ci)的真值;tr為第r(r=1,…,R)次重復(fù)實(shí)驗(yàn)的估計(jì)值。

        表2 區(qū)分度參數(shù)(a)的RMSE和biasTable 2 RMSE and bias of discrimination parameter (a)

        表3 難度參數(shù)(b)的RMSE和biasTable 3 RMSE and bias of difficulty parameter (b)

        表4 猜測度參數(shù)(c)的RMSE和biasTable 4 RMSE and bias of guessing parameter (c)

        4 結(jié)果分析

        1) 對于題目區(qū)分度參數(shù)(a),隨著樣本容量N的增加,RMSE的值逐漸減小。例如:當(dāng)先驗(yàn)分布為N(0,1)I(a>0),測試長度n=10時,樣本容量N=(1 000,2 000,5 000),對應(yīng)的RMSE值為(0.306 9,0.231 2,0.126 1),同時,隨著測試長度n的增加,RMSE的值也逐漸減小。例如:當(dāng)先驗(yàn)分布為N(0,1)I(a>0),樣本容量N=1 000時,測試長度n=(10,20,40),對應(yīng)的RMSE值為(0.306 9,0,291 4,0.243 0)。

        2) 對于題目難度參數(shù)(b),隨著樣本容量N的增加,RMSE的值也逐漸減小。例如:當(dāng)先驗(yàn)分布為N(0,1),測試長度n=20時,樣本容量N=(1 000,2 000,5 000),對應(yīng)的RMSE值為(0.444 5,0.287 5,0.154 9),同時,隨著測試長度n的增加,RMSE的值也逐漸減小。例如:當(dāng)先驗(yàn)分布為N(0,1),樣本容量N=2 000時,測試長度n=(10,20,40),對應(yīng)的RMSE值為(0.290 7,0.287 5,0.277 6)。

        3) 同樣地,對于題目猜測度參數(shù)(c),隨著樣本容量N的增加,RMSE的值也逐漸減小。例如:當(dāng)先驗(yàn)分布為Beta(5,17),測試長度n=40時,樣本容量N=(1 000,2 000,5 000),對應(yīng)的RMSE值為(0.064 9,0.059 3,0.045 3),同時,隨著測試長度n的增加,RMSE的值也逐漸減小。例如:當(dāng)先驗(yàn)分布為Beta(5,17),樣本容量N=5 000時,測試長度n=(10,20,40),對應(yīng)的RMSE值為(0.059 8,0.051 1,0.045 3)。

        4) 在不同的先驗(yàn)假定下,隨著先驗(yàn)方差的增大,對應(yīng)參數(shù)的RMSE值逐漸增加。例如:對于題目區(qū)分度參數(shù)(a),當(dāng)測試長度n=10,樣本容量N=1 000時,取先驗(yàn)為N(0,1)I(a>0)的RMSE值為0.306 9,取先驗(yàn)為N(0,25)I(a>0)的RMSE值為0.423 9;對于題目難度參數(shù)(b),當(dāng)測試長度n=20,樣本容量N=2 000時,取先驗(yàn)為N(0,1)的RMSE值為0.287 5,取先驗(yàn)為N(0,25)的RMSE值為0.303 0;同樣地,對于題目猜測度參數(shù)(c),當(dāng)測試長度n=40,樣本容量N=5 000時,取先驗(yàn)為Beta(5,17)的RMSE值為0.045 3,取先驗(yàn)為Beta(1,1)的RMSE值為0.056 4。

        5) 對于題目區(qū)分度參數(shù)(a),bias的絕對值最大為0.143 9,最小為0.000 1;對于題目難度參數(shù)(b),bias的絕對值最大為0.301 1,最小為0.002 7;對于題目猜測度參數(shù)(c),bias的絕對值最大為0.076 4,最小為0.000 1。在本文的模擬設(shè)置下,得出的這些估計(jì)結(jié)果都在可接受的范圍內(nèi)。

        5 結(jié) 語

        本文基于增加數(shù)據(jù)的Gibbs抽樣方法針對3PL模型探討了在不同模擬設(shè)置條件下的估計(jì)效果。模擬實(shí)驗(yàn)結(jié)果表明,隨著樣本容量或測試長度的增加,估計(jì)結(jié)果的準(zhǔn)確性將會有所提高,并且對于項(xiàng)目參數(shù)的先驗(yàn)分布采用方差較小的先驗(yàn)時,獲得的估計(jì)結(jié)果比較準(zhǔn)確。本文只考慮了樣本容量為1 000,2 000和5 000的情況,對于小樣本(比如500)和大樣本(比如10 000)的情況還有待研究。進(jìn)一步的,這種數(shù)據(jù)增加的Gibbs抽樣方法也可以推廣到4PL模型[14]和多級評分模型[15]中。

        附錄

        在給定yij,rij,ξ下,uij的滿條件分布為

        在給定yij,uij,ξ下,rij的滿條件分布為

        在給定rij下,ci的滿條件分布為

        給定其他所有參數(shù)和uij,rij,yij下,bi的滿條件分布為

        其中

        同理,θj的滿條件分布為

        (a5)

        其中

        給定其他所有參數(shù)和uij,rij,yij下,ai的滿條件分布為

        (a6)

        其中

        具體的Gibbs抽樣步驟為從(a1)~(a6)中依次抽取uij,rij,ci,bi,θj,ai。

        猜你喜歡
        樣本容量區(qū)分度先驗(yàn)
        采用無核密度儀檢測壓實(shí)度的樣本容量確定方法
        基于無噪圖像塊先驗(yàn)的MRI低秩分解去噪算法研究
        淺談試卷分析常用的幾個參數(shù)及其應(yīng)用
        圖形推理測量指標(biāo)相關(guān)性考察*
        江淮論壇(2018年4期)2018-08-24 01:22:30
        基于自適應(yīng)塊組割先驗(yàn)的噪聲圖像超分辨率重建
        淺觀一道題的“區(qū)分度”
        單維參數(shù)型與非參數(shù)型項(xiàng)目反應(yīng)理論項(xiàng)目參數(shù)的比較研究*
        基于平滑先驗(yàn)法的被動聲信號趨勢項(xiàng)消除
        先驗(yàn)的廢話與功能的進(jìn)路
        廣義高斯分布參數(shù)估值與樣本容量關(guān)系
        測繪通報(2013年2期)2013-12-11 07:27:44
        A阿V天堂免费无码专区| 亚洲成av人片在线观看www| 亚洲色欲久久久久综合网| 国产亚洲精品福利在线| 自拍av免费在线观看| 四虎永久在线精品免费网址| 五级黄高潮片90分钟视频| 国产一区二区三区啪| 亚洲天堂色婷婷一区二区| 一本色道久久亚洲综合| 国产一区二区波多野结衣| 日韩免费小视频| 久久久一本精品久久久一本| 国精产品一区一区三区有限在线| 中文字幕一区二区三区乱码| 97在线视频免费| 亚洲天堂一区二区三区| 亚洲综合激情另类小说区| 无码少妇一区二区三区芒果| 人妻少妇精品无码系列| 亚洲av高清不卡免费在线 | 久青草国产视频| 国产成人美涵人妖视频在线观看| 国产人妻久久精品二区三区老狼| 国产av久久久久精东av| 国产亚洲av手机在线观看| 亚洲AV手机专区久久精品| 99久久婷婷国产一区| 欧美又大又色又爽aaaa片| 国产小视频网址| 亚洲综合偷拍一区二区| 一本无码中文字幕在线观| 内射精品无码中文字幕| www久久久888| 久久国产成人午夜av免费影院| 亚洲日本一区二区一本一道| 国产精品亚洲一区二区杨幂| 久久99免费精品国产| 亚洲高清乱码午夜电影网| 国产喷水福利在线视频| 国产一区二区三区视频了 |