亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        BP神經(jīng)網(wǎng)絡(luò)估計(jì)IRT參數(shù)的比較研究

        2013-11-08 08:06:02邊玉芳陳玲麗陽碧云
        中國考試 2013年2期
        關(guān)鍵詞:參數(shù)估計(jì)向量神經(jīng)網(wǎng)絡(luò)

        劉 文 邊玉芳 陳玲麗 陽碧云

        1 引言

        與經(jīng)典測量理論相比,項(xiàng)目反應(yīng)理論(IRT)采用非線性的模型建立被試在項(xiàng)目上的得分與潛在特質(zhì)之間的關(guān)系,具有題目參數(shù)的跨群體不變性、能力參數(shù)與項(xiàng)目難度參數(shù)定義在同一個(gè)量表上等優(yōu)良性質(zhì),這為項(xiàng)目反應(yīng)理論的推廣應(yīng)用奠定堅(jiān)實(shí)的基礎(chǔ)。但是由于項(xiàng)目反應(yīng)理論模型的復(fù)雜性,帶來相應(yīng)的參數(shù)(題目參數(shù)、能力參數(shù))估計(jì)相對(duì)困難,在進(jìn)行參數(shù)估計(jì)時(shí)通常要經(jīng)過多次復(fù)雜的迭代運(yùn)算,進(jìn)行運(yùn)算時(shí)通常要求較大的樣本容量,并且還有可能的情況是得到的結(jié)果不收斂。

        人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)也稱為“神經(jīng)網(wǎng)絡(luò)”或類神經(jīng)網(wǎng)絡(luò),是一種應(yīng)用類似于人類大腦神經(jīng)突觸聯(lián)接的方式進(jìn)行信息處理的數(shù)學(xué)模型,它是以對(duì)大腦的勝利研究成果為基礎(chǔ),通過模擬大腦的某些機(jī)制,從而實(shí)現(xiàn)特定的功能,它是當(dāng)前國內(nèi)外研究的一個(gè)前沿領(lǐng)域。人工神經(jīng)元是人工神經(jīng)網(wǎng)絡(luò)基本的信息處理單元,人工神經(jīng)網(wǎng)絡(luò)通過對(duì)大量人工神經(jīng)元按照一定的拓?fù)浣Y(jié)構(gòu)組織起來,形成群體并行式處理的計(jì)算結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)已經(jīng)應(yīng)用于模式識(shí)別、圖像處理、控制和優(yōu)化、預(yù)報(bào)和智能信息管理、通信、空間科學(xué)等領(lǐng)域,顯示出無可比擬的優(yōu)勢和應(yīng)用前景。BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋型神經(jīng)網(wǎng)絡(luò),可以實(shí)現(xiàn)從輸入值到輸出值的任意非線性映射,其權(quán)值的調(diào)整采用反向轉(zhuǎn)播學(xué)習(xí)算法,目前在神經(jīng)網(wǎng)絡(luò)的實(shí)際應(yīng)用中,絕大部分的神經(jīng)網(wǎng)絡(luò)模型都采用BP網(wǎng)絡(luò)及其變化形式。在IRT參數(shù)估計(jì)時(shí),也有學(xué)者運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行IRT的參數(shù)估計(jì)[1-4],神經(jīng)網(wǎng)絡(luò)對(duì)于小樣本的參數(shù)估計(jì)也能適用[5,6],這些方法在使用神經(jīng)網(wǎng)絡(luò)時(shí)通常以經(jīng)典測量理論中的通過率P作為難度的輸入值、點(diǎn)二列相關(guān)系數(shù)rpb作為區(qū)分度的輸入值、題目平均得分作為能力的輸入值,相應(yīng)的IRT參數(shù)b、a、θ作為神經(jīng)網(wǎng)絡(luò)的輸出值來訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)進(jìn)行新項(xiàng)目的參數(shù)估計(jì),采用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)進(jìn)行IRT的參數(shù)估計(jì)也能達(dá)到一定的誤差要求。

        文中提出根據(jù)經(jīng)典測量理論計(jì)算的難度、區(qū)分度進(jìn)行相應(yīng)的轉(zhuǎn)換,在BP神經(jīng)網(wǎng)絡(luò)中運(yùn)用與前人研究不同的輸入值估計(jì)IRT的項(xiàng)目參數(shù)的新方法,試圖減少參數(shù)估計(jì)的誤差,提高參數(shù)估計(jì)的精度。

        2 IRT模型

        項(xiàng)目反應(yīng)理論通常使用一定的數(shù)學(xué)模型來刻畫被試的得分與潛在特質(zhì)的關(guān)系,項(xiàng)目反應(yīng)理論模型通常分為二值記分的模型和多值記分的模型,其中最常用的是二值記分(0-1)的模型,二值記分的模型又分為單參數(shù)、雙參數(shù)和三參數(shù)模型,二值記分的三參數(shù)的 logistic 模型為:pi(θ)=ci+(1-ci)/(1+exp[-Dai(θ-bi)]),這里D=1.702,θ為被試的能力值,ai表示項(xiàng)目 i的區(qū)分度、bi表示項(xiàng)目 i的難度、ci表示項(xiàng)目i的猜測參數(shù),pi(θ)表示能力為θ的被試答對(duì)區(qū)分度為a、難度為b、猜測參數(shù)為c的項(xiàng)目i的概率,當(dāng)被試答對(duì)該題時(shí),得分為1,否則為0。在該模型中,當(dāng)ci=0時(shí)為雙參數(shù)模型,當(dāng)ci=0、ai=1時(shí)為單參數(shù)模型。假設(shè)有N個(gè)考生參加由m個(gè)項(xiàng)目組成的測驗(yàn),所有考生對(duì)各個(gè)項(xiàng)目的反應(yīng)就組成一個(gè)Nm的得分矩陣U,參數(shù)估計(jì)就是尋找一組項(xiàng)目參數(shù)和被試的能力參數(shù),代入IRT模型后,能夠與項(xiàng)目反應(yīng)得分矩陣U擬合得很好,在該矩陣中有N+3m個(gè)參數(shù)需要估計(jì),這顯然是一件非常困難的事情。伯恩鮑姆(1968)建議先計(jì)算能力參數(shù)、項(xiàng)目參數(shù)的初值,然后分兩步進(jìn)行迭代計(jì)算[7]:第一步,先假定能力參數(shù)為已知,求出項(xiàng)目參數(shù)的估計(jì)值;第二步,將項(xiàng)目參數(shù)的估計(jì)值看做項(xiàng)目參數(shù)的“真值”,求能力參數(shù)的估計(jì)值,這樣前后兩步稱為一輪。如果滿足收斂準(zhǔn)則,則得到的項(xiàng)目參數(shù)和能力參數(shù)為所求的結(jié)果;否則,將這些值看做新一輪的初值,再進(jìn)行下一輪的兩步迭代,直到結(jié)果滿足收斂準(zhǔn)則為止。目前的參數(shù)估計(jì)方法例如MLE、EM、MCMC等都是根據(jù)伯恩鮑姆的這一思想進(jìn)行的。

        3 基于神經(jīng)網(wǎng)絡(luò)的IRT參數(shù)估計(jì)方法

        文中設(shè)a、b、θ服從如下分布:能力參數(shù)θ~N(0,1),即生成被試的能力參數(shù)θ服從均值為0,方差為1的正態(tài)分布;ln a~N(0,1),b~N(0,1)。使用MATLABR2007b軟件模擬生成N個(gè)被試作答m個(gè)項(xiàng)目的數(shù)據(jù),a、b、θ滿足上述條件。研究中采用四層的神經(jīng)網(wǎng)絡(luò),節(jié)點(diǎn)數(shù)依次為10、7、3、1,前三層采用S型函數(shù)(tansig),最后一層采用線性函數(shù)(purelin)[2]。為了便于描述,以下只分兩種方法進(jìn)行介紹,方法一為分別以經(jīng)典測量理論的通過率、點(diǎn)二列相關(guān)系數(shù)和平均得分作為網(wǎng)絡(luò)輸入估計(jì)a、b、θ,方法二為分別以IRT模型參數(shù)估計(jì)的初值作為網(wǎng)絡(luò)輸入估計(jì)a、b、θ。

        3.1 能力參數(shù)θ的估計(jì)

        方法一:利用平均得分率作為網(wǎng)絡(luò)輸入,IRT的θ為輸出值,訓(xùn)練并測試網(wǎng)絡(luò)。

        (1)模擬。根據(jù)模擬生成的N個(gè)被試能力參數(shù)和m個(gè)項(xiàng)目參數(shù)計(jì)算 pi(θ),使用蒙特卡羅方法生成被試得分矩陣U,當(dāng)rij≤pij時(shí),uij=1,否則uij=0。隨機(jī)生成30個(gè)得分矩陣。

        (2)降維。根據(jù)得分矩陣U,計(jì)算每名被試對(duì)m個(gè)項(xiàng)目的平均得分(x/m)作為神經(jīng)網(wǎng)絡(luò)的輸入向量,以模擬被試的能力θ為神經(jīng)網(wǎng)絡(luò)的輸出值訓(xùn)練神經(jīng)網(wǎng)絡(luò)。將30個(gè)平均得分向量作為網(wǎng)絡(luò)輸入訓(xùn)練30個(gè)網(wǎng)絡(luò)。

        (3)測試。模擬生成N1個(gè)被試能力參數(shù)和m1個(gè)項(xiàng)目參數(shù)計(jì)算,生成得分矩陣,計(jì)算每名被試對(duì)m1個(gè)項(xiàng)目反應(yīng)的平均得分(x1/m1)作為神經(jīng)網(wǎng)絡(luò)的輸入向量,測試訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)進(jìn)行被試能力輸出。分別測試訓(xùn)練好的30個(gè)神經(jīng)網(wǎng)絡(luò)。計(jì)算每次測試網(wǎng)絡(luò)輸出值與模擬數(shù)據(jù)的能力值的誤差,即error=yy-θT,yy為神經(jīng)網(wǎng)絡(luò)的輸出值,θT為模擬生成的N1個(gè)被試的能力值。

        方法二:利用N-R迭代求能力參數(shù)的極大似然估計(jì)的初值θ0作為網(wǎng)絡(luò)輸入,IRT的θ為輸出值,訓(xùn)練并測試網(wǎng)絡(luò)。

        (1)模擬。與3.1.1方法一模擬相同。

        (2)降維。與3.1.1方法一的區(qū)別是輸入向量不同,輸入向量為每名被試對(duì)m個(gè)項(xiàng)目的得分(x)與失分(m-x)之比的自然對(duì)數(shù)ln[ ]x/(m-x)作為神經(jīng)網(wǎng)絡(luò)的輸入向量(對(duì)總分為滿分和零分的被試進(jìn)行預(yù)處理,依據(jù)Conquest軟件的處理方法,滿分則減去0.3,0分則加上0.3)。

        (3)測試。與3.1.1方法一的區(qū)別是輸入向量不同,ln[x1/(m1-x1)]作為神經(jīng)網(wǎng)絡(luò)的輸入向量進(jìn)行測試。

        項(xiàng)目參數(shù)a、b的兩種估計(jì)方法與能力的兩種估計(jì)方法類似。

        3.2 項(xiàng)目參數(shù)a的估計(jì)

        方法一:利用每個(gè)項(xiàng)目與總分的點(diǎn)二列相關(guān)系數(shù)作為網(wǎng)絡(luò)輸入,IRT的a為輸出值,訓(xùn)練并測試網(wǎng)絡(luò)。

        (1)模擬。與3.1.1方法一模擬相同。

        (2)降維。計(jì)算項(xiàng)目得分矩陣U中每個(gè)項(xiàng)目與總分的點(diǎn)二列相關(guān)系數(shù)

        (3)測試。與3.1.1方法一的區(qū)別是輸入向量不同,點(diǎn)二列相關(guān)作為神經(jīng)網(wǎng)絡(luò)的輸入向量進(jìn)行測試。

        方法二:利用IRT參數(shù)估計(jì)的初值aj作為網(wǎng)絡(luò)輸入,IRT的a為輸出值,訓(xùn)練并測試網(wǎng)絡(luò)。

        (1)模擬。與3.1.1方法一模擬相同。

        (2)降維。與3.2.1方法一的區(qū)別是網(wǎng)絡(luò)輸入的初值為aj,aj通過點(diǎn)二列相關(guān)轉(zhuǎn)化得到,具體為:根據(jù)得分矩陣U計(jì)算每個(gè)項(xiàng)目的通過率pj,并根據(jù)通過率pj轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)zj,即根據(jù)計(jì)算出zj。再把點(diǎn)二列相關(guān)rpb轉(zhuǎn)化為二列相關(guān)rb,其公式為最后,求得輸入向量aj,即利用aj作為網(wǎng)絡(luò)輸入向量訓(xùn)練網(wǎng)絡(luò)。

        (3)測試。與3.2.1方法一的區(qū)別是輸入向量不同,aj作為神經(jīng)網(wǎng)絡(luò)的輸入向量進(jìn)行測試。

        3.3 項(xiàng)目參數(shù)b的估計(jì)

        方法一:利用每個(gè)項(xiàng)目的通過率作為網(wǎng)絡(luò)輸入,IRT的b為輸出值,訓(xùn)練并測試網(wǎng)絡(luò)。

        方法二:區(qū)別在于計(jì)算網(wǎng)絡(luò)輸入向量bj時(shí),公式為bj=zj/rbj,利用bj作為網(wǎng)絡(luò)輸入,IRT的b為輸出值,訓(xùn)練并測試網(wǎng)絡(luò)。

        4 實(shí)驗(yàn)結(jié)果

        評(píng)價(jià)參數(shù)估計(jì)精確性的指標(biāo)通常采用均方根誤差(Root Mean Squared Error,RMSE)(有些文獻(xiàn)稱為RMSD)和平均絕對(duì)偏差(Mean Absolute Bias,MAB)(有些文獻(xiàn)稱為ABS)這兩個(gè)指標(biāo),表示估計(jì)值的個(gè)數(shù),r表示網(wǎng)絡(luò)數(shù)。MAB指標(biāo)反映了估計(jì)值與真值的絕對(duì)偏差的平均。MAB值越小,估計(jì)的準(zhǔn)確性越高;RMSE指標(biāo)反映的是估計(jì)值與真值偏差的離散程度。RMSE值也是越小越好。

        實(shí)驗(yàn)中訓(xùn)練網(wǎng)絡(luò)時(shí),訓(xùn)練項(xiàng)目數(shù)分別取10、20、30、…、590、600(共60種實(shí)驗(yàn)條件),訓(xùn)練人數(shù)為100人;測試網(wǎng)絡(luò)時(shí),測試時(shí)項(xiàng)目數(shù)為20題,人數(shù)為100人。每種實(shí)驗(yàn)條件是循環(huán)30次后結(jié)果的平均值。

        以MAB和RMSE作為不同方法估計(jì)精確度的指標(biāo),分別比較兩種方法在估計(jì)IRT兩參數(shù)模型中能力參數(shù)和項(xiàng)目參數(shù)的差異。

        4.1 MAB指標(biāo)分析結(jié)果

        神經(jīng)網(wǎng)絡(luò)不同輸入向量對(duì)能力參數(shù)和項(xiàng)目參數(shù)估計(jì)的MAB指標(biāo)分析結(jié)果見表1。

        表1 能力參數(shù)和項(xiàng)目參數(shù)估計(jì)的MAB指標(biāo)描述統(tǒng)計(jì)分析結(jié)果

        從表1可以看出,對(duì)于難度的估計(jì)以通過率作為神經(jīng)網(wǎng)絡(luò)的輸入值比經(jīng)過轉(zhuǎn)換后的輸入值能得到更好的結(jié)果,而區(qū)分度和能力值的估計(jì)則是經(jīng)過轉(zhuǎn)換后的輸入值的結(jié)果更精確。

        4.2 RMSE指標(biāo)分析結(jié)果

        神經(jīng)網(wǎng)絡(luò)不同輸入向量對(duì)能力參數(shù)和項(xiàng)目參數(shù)估計(jì)的RMSE指標(biāo)分析結(jié)果見表2。

        表2 能力參數(shù)和項(xiàng)目參數(shù)估計(jì)的RMSE指標(biāo)描述統(tǒng)計(jì)分析結(jié)果

        從表2可以看出,對(duì)于難度的估計(jì)以通過率作為神經(jīng)網(wǎng)絡(luò)的輸入值比經(jīng)過轉(zhuǎn)換后的輸入值能得到更好的結(jié)果,而區(qū)分度和能力值的估計(jì)則是經(jīng)過轉(zhuǎn)換后的輸入值的結(jié)果更精確。

        綜合表1、表2的結(jié)果,表明MAB和RMSE的結(jié)論具有一致性。

        5 結(jié)束語

        實(shí)驗(yàn)表明,基于經(jīng)典測量理論基礎(chǔ)上轉(zhuǎn)換后的輸入值的區(qū)分度和能力參數(shù)的估計(jì),神經(jīng)網(wǎng)絡(luò)參數(shù)估計(jì)的方法具有較高的精確度與穩(wěn)定性;而難度參數(shù)的估計(jì)則是通過率占優(yōu)。但對(duì)于神經(jīng)網(wǎng)絡(luò)模型來說,估計(jì)的精確性不僅與網(wǎng)絡(luò)的輸入值有關(guān)同時(shí)還與神經(jīng)網(wǎng)絡(luò)的類型也有關(guān)系,例如采用徑向基網(wǎng)絡(luò)進(jìn)行模擬訓(xùn)練可能會(huì)得到不同的實(shí)驗(yàn)結(jié)論,這些需要進(jìn)一步的研究證據(jù)支持。由于研究中主要探討兩參數(shù)的項(xiàng)目反應(yīng)模型,這個(gè)結(jié)論是否適用于三參數(shù)的項(xiàng)目反應(yīng)模型仍需相關(guān)證據(jù)。同時(shí),研究采用的是簡單的0-1評(píng)分的模型,對(duì)于多值評(píng)分的模型如何使用神經(jīng)網(wǎng)絡(luò)進(jìn)行估計(jì)也值得探討。

        [1]譚云蘭,丁樹良,辛銳銘,等.基于IRT模型參數(shù)的BP神經(jīng)網(wǎng)絡(luò)估計(jì)[J].計(jì)算機(jī)工程與應(yīng)用,2004(17):56-57,108.

        [2]譚云蘭,丁樹良,辛銳銘.基于IRT模型的BP神經(jīng)網(wǎng)絡(luò)降維法參數(shù)估計(jì)及其應(yīng)用[J].江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,28(6):485-488.

        [3]汪存友,余嘉元.一種新的基于神經(jīng)網(wǎng)絡(luò)的IRT項(xiàng)目參數(shù)估計(jì)模型[J].計(jì)算機(jī)應(yīng)用,2006,26(4):992-994.

        [4]余嘉元,陳淑燕.運(yùn)用徑向基網(wǎng)絡(luò)估計(jì)項(xiàng)目反應(yīng)模型參數(shù)的研究[J].中國考試(研究版),2005(4):24-26.

        [5]余嘉元,汪存友.小樣本標(biāo)準(zhǔn)參照測驗(yàn)中項(xiàng)目參數(shù)估計(jì)的GRNN方法[J].廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,24(4):107-110.

        [6]朱隆尹,丁樹良,涂冬波,等.基于小樣本容量的IRT參數(shù)估計(jì)方法比較研究[J].心理學(xué)探新,2009,113(5):72-76.

        [7]漆書青,戴海崎,丁樹良.現(xiàn)代教育與心理測量學(xué)原理[M].北京:高等教育出版社.2002.

        猜你喜歡
        參數(shù)估計(jì)向量神經(jīng)網(wǎng)絡(luò)
        向量的分解
        基于新型DFrFT的LFM信號(hào)參數(shù)估計(jì)算法
        聚焦“向量與三角”創(chuàng)新題
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        Logistic回歸模型的幾乎無偏兩參數(shù)估計(jì)
        基于向前方程的平穩(wěn)分布參數(shù)估計(jì)
        向量垂直在解析幾何中的應(yīng)用
        基于競爭失效數(shù)據(jù)的Lindley分布參數(shù)估計(jì)
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        向量五種“變身” 玩轉(zhuǎn)圓錐曲線
        最好看2019高清中文字幕视频| 亚洲av天堂免费在线观看| 水蜜桃在线观看一区二区国产| 中国一级黄色片久久久| 成人美女黄网站色大免费的| 亚洲欧美日韩精品久久亚洲区| 9999毛片免费看| 97国产精品麻豆性色| 亚洲无人区乱码中文字幕动画| 在线观看日本一区二区三区四区| 日韩人妻少妇一区二区三区| 四虎影视永久在线观看| 精品国产制服丝袜高跟| 亚洲AV无码一区二区三区性色学| 青青草视频原手机在线观看| 亚洲白嫩少妇在线喷水 | 一区二区三区视频在线免费观看 | 丰满少妇愉情中文字幕18禁片| 樱花AV在线无码| 中文字幕人妻少妇精品| 李白姓白白又白类似的套路 | 青青草视频在线播放81| 巨爆中文字幕巨爆区爆乳| 伊伊人成亚洲综合人网香| 69av视频在线观看| 偷柏自拍亚洲综合在线| 国产免费三级av在线| 日本公妇在线观看中文版| 人妻精品久久中文字幕| 亚洲av专区一区二区| 蜜桃一区二区三区| 欧美午夜a级精美理论片| 亚洲AV秘 无码一区二区久久| 日本一区二区三级在线| 亚洲av高清在线观看一区二区| 亚洲精品92内射| 免费AV一区二区三区无码| 色综合久久五月天久久久 | 97精品国产一区二区三区| 国内大量揄拍人妻在线视频| 国产精品亚洲一区二区三区正片 |