曲 爽, 顧希媛, 張軼男
(1.長春師范大學 數(shù)學學院, 長春 130000; 2.牡丹江市第三高級中學, 黑龍江 牡丹江 157000;3.長春財經(jīng)學院, 長春 130000)
稱名反應模型項目參數(shù)的打折似然估計方法
曲 爽1*, 顧希媛2, 張軼男3
(1.長春師范大學 數(shù)學學院, 長春 130000; 2.牡丹江市第三高級中學, 黑龍江 牡丹江 157000;3.長春財經(jīng)學院, 長春 130000)
項目反應理論(Item response theory, IRT)是教育心理測量理論中發(fā)展較快的理論之一,稱名反應模型是IRT中一個基本的項目反應模型. 該文借助2015年de la Torre提出的一種參數(shù)估計方法—打折似然方法,將它與擬牛頓法中的BFGS方法結合對稱名反應模型的參數(shù)進行估計. 模擬研究表明:新的估計方法可有效地減少計算量.
稱名反應模型; 打折似然估計; 擬牛頓法; BFGS方法
項目反應理論(Item Response Theory, IRT)是近年來發(fā)展較快的教育測量理論方法之一,受到眾多教育專家和研究者的關注[1]. IRT中的一些基本的模型(如兩參數(shù)模型、三參數(shù)模型等)的參數(shù)估計均可通過極大似然估計、EM算法實現(xiàn). IRT中的多元兩參數(shù)項目反應模型——稱名反應模型(Nominal Response Model, NRM),因其特殊的性質和重要的作用,也越來越受到研究者們的重視,稱名反應模型的參數(shù)估計也是關注的問題之一. 由于傳統(tǒng)的極大似然估計過程中對參數(shù)的一階導數(shù)和二階導數(shù)的計算,大大增加了計算難度及計算時間,因此要找尋其他更簡便的估計方法.
本文給出NRM打折似然估計方法, 并利用計算機軟件Matlab進行編程實現(xiàn)與模擬比較研究.
不同被試對項目的反應是不同的,我們根據(jù)被試的能力θj可得到每個項目反應選項特征曲線. 能力為θj的被試選擇項目選項ν的概率Pν(θj)具有如下形式:
2.1 打折似然估計
Jimmy de la Torre (2015)提出了一種新的打折似然方法(Discounted Likelihood Method,DLM),該方法的基本思想是:在所有項目的完全似然的基礎上進行項目分離,找到項目i的打折似然實現(xiàn)單個項目參數(shù)的估計運算,然后重復進行得到所有項目的參數(shù)估計. DLM執(zhí)行的是擬牛頓最優(yōu)化運算——Broyden-Fletcher-Goldfarb-Shanno (BFGS)算法,它忽略了對數(shù)似然的形式,不需要二階導數(shù),直接通過函數(shù)對參數(shù)進行處理,進一步迭代得到精確結果,這與傳統(tǒng)的極大似然相比大大減少了計算量;同時在利用BFGS方法進行估計的過程中,能夠從完全項目參數(shù)協(xié)方差矩陣中直接得到標準誤差,從BFGS算法中的泛對角矩陣的標準誤差找到參數(shù)估計值, 并得到較為精確的結果.
2.2 打折似然估計的基本步驟
步驟1:給出所有項目的初始值并找到完全似然函數(shù);
步驟2:分解完全似然函數(shù),找到項目i的打折似然;
步驟3:對打折似然函數(shù)進行參數(shù)估計,得到估計值;
步驟4:更新完全似然函數(shù),重復步驟2和3;
步驟5:重復步驟2~4,直至項目參數(shù)估計收斂,且前后兩次迭代差值滿足設定的收斂條件.
轉化為對參數(shù)
的估計問題.
接下來利用打折似然的估計方法對稱名反應模型的參數(shù)進行估計.
2.2.1 完全似然函數(shù) 完全似然函數(shù)具有如下形式:
在完全似然函數(shù)中包括了N個項目,Q個正交節(jié)點和J個被試的相關信息.一共有2×N個項目參數(shù)需要估計.
2.2.2 打折似然 因為N個項目之間是獨立的,根據(jù)DLM將項目參數(shù)分成N組,每次只估計兩個參數(shù),即每次僅估計一個項目的難度參數(shù)及項目區(qū)分度參數(shù).完全似然函數(shù)確定后,可進行項目參數(shù)的估計[2].將所有被試j對項目i的反應概率分離:
則對數(shù)似然可寫為:
上式即為項目i的打折似然形式.
2.2.3 估計方法 利用BFGS方法對項目i的項目參數(shù)進行估計,為了形式簡便,我們僅對單一項目的參數(shù)估計進行計算.如對項目i進行估計,即估計
根據(jù)上式得到打折似然函數(shù)的梯度
以m=3為例,
l(x(t)+atdt)≤l(x(t))+δat(l(x(t)))Tdt,
l(x(t)+atdt)Tdt≥σ(l(x(t)))Tdt,
當步長和搜索方向均確定后,得到近似解x(t+1)=x(t)+atdt,并求出BFGS矩陣[6]:
其中yt=l(x(t+1))-l(x(t)),st=x(t+1)-x(t).
以上步驟可以得到項目i的項目參數(shù)估計值,之后更新打折似然函數(shù),對其他項目分別進行估計,直到所有項目參數(shù)估計完成,得到項目參數(shù)矩陣
設被試總數(shù)為7 000人, 項目數(shù)為10,且每個項目有3個選項,使用Matlab軟件編程進行模擬研究[3].采用均方誤差(MSE)及偏(Bias)兩個指標來評價估計結果的準確性及偏度.初值選取如下:被試的能力服從均勻分布θ~U(-3.5,3.5);項目參數(shù)ζi1~U(-1.5,1.5),ζi2~U(-1.5,1.5),ζi3=-ζi1-ζi2,λi1~U(-1.5,1.5),λi2~U(-1.5,1.5),λi3=-λi1-λi2. 將被試分為7組,每組1 000人,在給定能力值的情況下每組的能力用中點值代替,再進行項目參數(shù)的估計.模擬進行1 000次,得到最大似然估計與打折似然估計的實驗結果見表1[8].
表1 稱名反應模型的項目參數(shù)估計精度Tab.1 The precision of estimating item parameters
續(xù)表
模擬研究表明,DLM的Bias值在[-5×10-3,5×10-3]內進行波動,估計結果均在精度允許的范圍內. 若要提高精度, 需進一步研究其相關的影響因素;此外,使用BFGS方法進行參數(shù)估計時,對步長的計算求解也可以更加優(yōu)化,這些將在以后的研究中不斷改進,預期可以得到更加理想的實驗結果. 總的來看,打折似然估計方法在估計稱名反應模型的參數(shù)時,相對極大似然估計而言既降低了計算強度,也使得參數(shù)估計更易實現(xiàn).
[1] BAKER F B, KIM S H. Item Response Theory: Parameter Estimation Techniques[M] . New York: Marcel Dekker, 2004.
[2] DARRELL B R. Estimating item parameters and latent ability when responses are scored in two or more nominal categories[J]. Psychometrika, 1972,37(1):29-51.
[3] 陳根永. 數(shù)值計算方法與MATLAB應用[M]. 鄭州:鄭州大學出版社,2010.
[4] 張 恒, 何 偉. 基于新擬牛頓方程的改進BFGS方法[J].淮海工學院學報(自然科學版),2007,16(3): 10-12.
[5] HAN J Y, LIU G H. Global convergence analysis of a new nonmonotone BFGS algorithm on convex objective functions[J]. Computational Optimization and Applications, 1997,7(2): 277-289.
[6] 周偉軍. 擬牛頓法及其收斂性[D].湖南:湖南大學數(shù)學與計量經(jīng)濟學院,2006.
[7] CHENG W Y, LI D H. Spectral scaling BFGS method[J]. Journal of Optimization Theory and Applications, 2010,146(2), 305-319.
[8] 顧希媛. 稱名反應模型的參數(shù)估計方法[M].長春:東北師范大學出版社, 2016.
Discountedlikelihoodestimationmethodforitemparameterinnominalresponsemodel
QU Shuang1, GU Xiyuan2, ZHANG Yinan3
(1.Faculty of Mathematics, Changchun Normal University, Changchun 130000;2.The No. Three Senior High School of Mudanjiang, Mudanjiang Heilongjiang 157000;3.Changchun University of Finance and Economics, Changchun 130000)
Item response theory (IRT) has been widely used in educational and psychological measurement. Nominal response model (NRM) is one of the IRT models. In this paper, we propose a new parameter estimation method——discounted likelihood method (DLM), in which a type of quasi-Newton methods, BFGS method, is used to estimate item parameters. Simulation results indicate that the DLM is a less computationally demanding method and can fit the NRM well.
nominal response model; discounted likelihood estimate; quasi-Newton method; BFGS method
O212
A
2017-06-14.
數(shù)學天元青年基金項目(11626044);長春師范大學自然科學基金項目(長春師范大學自科合字[2014]第002號).
*E-mail: qus687@nenu.edu.cn.
10.19603/j.cnki.1000-1190.2017.05.002
1000-1190(2017)05-0574-04