摘要:認(rèn)知診斷中要實(shí)現(xiàn)項目屬性標(biāo)定的完全自動化還有很大的距離,目前大多采用有監(jiān)督的學(xué)習(xí),專家先標(biāo)定部分項目的屬性(即Q陣),再實(shí)現(xiàn)對其它項目的屬性標(biāo)定,然后擴(kuò)充至Q矩陣,如果Q矩陣不是最大化,那么從Q矩陣中得到的信息可能不完整,如果已經(jīng)最大化,那就沒必要再進(jìn)行屬性的標(biāo)定了。所以,Q矩陣是否是最大化也即是否充分顯得尤為重要。本文擬采用迭代法實(shí)現(xiàn)對原始項目屬性自動標(biāo)定的最大化。
關(guān)鍵詞:Q矩陣;概念格;充分Q矩陣
中圖分類號:B841 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9599 (2012) 24-0070-02
1 Q矩陣
認(rèn)知診斷一定意義上就是找出診斷對象的優(yōu)點(diǎn)以及某些方面的欠缺和不足,并進(jìn)行補(bǔ)救。就教育領(lǐng)域而言,目前的考試結(jié)果只有一個分?jǐn)?shù),只能反應(yīng)考生對知識總體的掌握排名,而且如果考卷的出題水平不高的話,還不能反應(yīng)考生的真實(shí)水平,所以要診斷出考生的知識結(jié)構(gòu),首先需要知道考題到底包含哪些知識點(diǎn)。
在認(rèn)知診斷中,屬性(attribute)是一個重要的概念,J.P.Leighto[1]等人指出,屬性表示測驗項目的特征,它是正確解決特定項目時所需要的認(rèn)知加工和技能。
假設(shè)認(rèn)知診斷中所有的屬性的集合為S,所有項目的集合為I,對 , ,若有項目j中包含屬性i,則稱j和i有關(guān)系R,有iRj。R對應(yīng)的關(guān)系矩陣我們記為Q,Q=( ),若有iRj,則 =1,否則 =0??梢钥吹絈矩陣為0-1矩陣。
另外,屬性集和被試的知識狀態(tài)之間的關(guān)系矩陣也是一種Q矩陣。記屬性集合為S,被試集合為K,對 , ,若被試知識狀態(tài)j包含屬性i,則認(rèn)為j和i有關(guān)系R,即jRi。R對應(yīng)的矩陣就是此Q矩陣,也是0-1矩陣。
2 屬性的自動標(biāo)定
認(rèn)知診斷模型[2]:DINA模型項目反應(yīng)函數(shù)(de la Torre, 2008; Junker et al.,2001):
表示知識狀態(tài) 的被試i在項目j上的理想的作答模式, 為失誤參數(shù), 為猜測參數(shù),而 為項目j的屬性向量。
本文的屬性的自動標(biāo)定方法采用極大似然估計方法(MLE)[2]。根據(jù)被試在專家已經(jīng)標(biāo)定的原始題上的作答得到得分陣 ,然后估計被試的知識狀態(tài) ,然后讓被試在未標(biāo)定的原始題上作答,得到原始題的屬性向量, 為約簡Q矩陣, 為 中的列,項目j的屬性向量 的項目反應(yīng)概率為 ,
,(汪文義,丁書良等2011)。
可以簡化為對數(shù)函數(shù):
,
其中 和 為正確和錯誤作答頻數(shù)。(汪文義,丁書良等2011)。
3 Q矩陣的最大化
為驗證Q矩陣是否充分,這里將其和概念格結(jié)合起來,采用迭代法的思想,將Q矩陣看做形式概念分析的形式背景,采用漸進(jìn)式的思想建造概念格,若兩次建造的概念格的距離足夠小的時候,我們認(rèn)為此Q矩陣式充分的。
首先談一下概念格理論,形式概念分析又稱為概念格理論,是由德國的數(shù)學(xué)家Wille教授1982年作為一種數(shù)學(xué)理論首先提出的[6],它是一種基于概念和概念層次的數(shù)學(xué)化表達(dá)的應(yīng)用數(shù)學(xué)的一個分支,在應(yīng)用形式概念分析理論時,需要用數(shù)學(xué)的思維方式進(jìn)行概念數(shù)據(jù)分析和知識的處理[7]。近年來,形式概念分析的應(yīng)用得到了迅速發(fā)展,廣泛應(yīng)用于機(jī)器學(xué)習(xí)、軟件配置、信息獲取、知識管理和軟件工程等領(lǐng)域[8]。
由于是要多次建格,所以選擇漸進(jìn)式建格算法。漸進(jìn)式算法的主要思想就是:將要插入的對象和原油概念格進(jìn)行對比(交運(yùn)算),根據(jù)結(jié)果的不同,分為不變節(jié)點(diǎn),更新節(jié)點(diǎn)和新增節(jié)點(diǎn),然后再進(jìn)行相應(yīng)的操作。漸進(jìn)式算法有很多,例如經(jīng)典的Godin算法,以及很多對Godin算法的改進(jìn)。這里給出Godin算法的簡要步驟。
Godin算法[3](汪文義,丁書良等2011):
Begin
If inf(L)= Then
將 inf(L)用({ },f({ }))來替代;
exit algorithm;
EndIf
IF ({ }) Inte
IF Extent(inf(L)) = Then
Intent(inf(L)) ← Intent(inf(L)) ∪ ({ })
ELSE
增加新的格節(jié)點(diǎn) H :( ,Intent(inf(L)) ∪ ({ })),使H成為inf(L);
增加從原 inf(L)到H的連接;
EndIf
EndIf
將格L中所有內(nèi)涵數(shù)相同的格節(jié)點(diǎn)C歸為同一組,
記為B[i]←{C:|Intent(C)|= i};
size←max(i) ;
初始化所有更新格節(jié)點(diǎn)和所有新生成的格節(jié)點(diǎn)的集合 B′[i] ← ;
For i←0 To size DO
For each pair C in B[i]
IF Intent(C) ? f({ })) THEN
{說明格節(jié)點(diǎn) C 是一個更新格節(jié)點(diǎn)}
Extent(C)←Extent(C) ∪ { } ;
把 C 加到 B′[|C|]中去;
IF Intent(C) = f({ })) Then exit algorithm;
Else
Int ← Intent(C) ∩ f({ }));
IF 不存在 C1 ∈ B′[|Int|] 使得 Intent(C1) = Int Then
{說明格節(jié)點(diǎn) C 是產(chǎn)生子格節(jié)點(diǎn)}
Begin
新增格節(jié)點(diǎn) Cn ← (Extent(C) ∪ { }, int);
同時把 Cn 加到 B′[|int|]中去;
更新邊;
End
EndIF
EndFor
EndFor
End
最大化算法中迭代思想主要分為三個步驟,迭代的初始值,迭代的方法,迭代的終止條件。接下來,逐個討論這三個步驟。
首先迭代的初始值,選取由專家標(biāo)定的屬性構(gòu)成的Q矩陣,將其作為概念格構(gòu)造的形式背景。
然后,有被試在未標(biāo)定的原始題上作答,得出項目的屬性向量,驗證合理后添加到Q矩陣中,建造新的概念格,如此迭代構(gòu)造概念格。
最后,迭代的終止條件,可以選擇迭代的次數(shù)限制,或者格之間的距離,當(dāng)兩次構(gòu)建的概念格之間的距離足夠小的時候,就認(rèn)為這此時的Q矩陣是充分的。
當(dāng)然我們還要考慮到迭代的收斂程度以及收斂的速度。
4 總結(jié)
本文討論了對原始題屬性標(biāo)定是如何判定Q矩陣是否充分,將其和概念格集合起來,將Q矩陣作為概念格構(gòu)建的形式背景,然后進(jìn)行構(gòu)建概念格,當(dāng)兩次的概念格的距離足夠小的時候,就認(rèn)為Q矩陣式充分的。采用的是迭代法實(shí)現(xiàn)對原始項目屬性自動標(biāo)定的最大化。迭代法需要考慮初值、迭代的方法與終止條件,專家給出了Q矩陣的初值,汪文義和丁樹良(2011)給出一種在線屬性標(biāo)定的方法,以此作為迭代的方法,終止條件按照步驟的次數(shù),或者定義Q矩陣的距離,當(dāng)兩步結(jié)果的距離足夠小的時候終止。當(dāng)然,還要考慮迭代的收斂性與收斂速度。
丁樹良和羅芬(2005)給出求哈斯圖對應(yīng)關(guān)系陣的方法,充分Q矩陣的形式背景構(gòu)造的概念格是哈斯圖,由哈斯圖可挖掘出其序關(guān)系,便可挖掘出屬性關(guān)聯(lián),下一步的工作就是考慮從充分Q矩陣中找出屬性的層級關(guān)系。
參考文獻(xiàn):
[1]Leighton J P, Gierl M J, Hunka S M. The attribute hierarchy method for cognitive assessment: a variation on Tatsuoka's rule-space approach [J].Journal of Educational Measurement,2004,41(3):205-237.
[2]汪文義,丁書良,游曉峰.計算機(jī)化自適應(yīng)診斷測驗中原始題的屬性標(biāo)定.心理學(xué)報.2011,Vol.43,No.8,964?976.
[3]Godin R. Incremental concept formation algorithm bases on Galois (concept) lattices.Computational Intelligen ce,1995,11(2):246-267.
[4]謝志鵬,劉宗田.概念格的快速漸進(jìn)式構(gòu)造算法.計算機(jī)學(xué)報.第二卷第5期491-495.
[5]Nourine.L,Raynaud O.A fast algorithm for building lattice. Workshop on Computational Graph Theory and Combinatorics. Victoria, Canada,1999.
[6]Wille R.Restructuring lattice theory:An approach based on hierarchies of concepts[C]//Rival I.Ordered Sets.Dordreeht—Boston:Reidel.1982:445—470.
[7]盧明,胡成全,齊紅,趙亮.一種使用屬性表的快速概念聚類算法[J].復(fù)旦學(xué)報(自然科學(xué)版),2004,43(5):823-825.
[8]Mao Hua, Li Bin. Formal Concept analysis of attributes constrained by equivalent relation. Computer Engineering and Applications,2010,46(36):158-160.