郗閩
關(guān)鍵詞: 學(xué)生教學(xué); 認(rèn)知診斷; 貝葉斯網(wǎng)絡(luò); 結(jié)構(gòu)學(xué)習(xí); 層級(jí)關(guān)系; 分類性能
中圖分類號(hào): TN711?34; TP393 ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2018)24?0079?03
Research on BN?based generalized cognitive diagnosis model for students
XI Min
(Xian Aeronautical University, Xian 710077, China)
Abstract: In allusion to the disadvantage that only score values are given for measurement and diagnosis of students′ psychological change and generalized cognition, and different knowledge structures with the same score value cannot be explained in the traditional teaching, the Bayesian network (BN) is introduced into the generalized cognitive diagnosis of students on the basis of the fact that, as for the current task of student cognitive diagnosis, information feedback of student test results is more important. The Bayesian structure learning is conducted for the data obtained from the test, so as to obtain hierarchical relationships between attributes. The BN network classifier is constructed to classify the students′ cognitive states. A verification was conducted for the constructed BN?based generalized cognitive diagnosis model of students. The results show that the obtained hierarchical relationships between attributes are reasonable, the classification performance is good, and the model has a broad application prospect.
Keywords: student teaching; cognitive diagnosis; Bayesian network; structure learning; hierarchical relationship; classification performance
在教學(xué)與學(xué)生考試評(píng)估中,評(píng)估結(jié)果的分?jǐn)?shù)值并不能揭示隱藏其背后的認(rèn)知過程與結(jié)構(gòu)信息,而評(píng)估通常的主要任務(wù)為反饋信息[1],以有利于對(duì)學(xué)生思想政治教育的促進(jìn)。針對(duì)此缺點(diǎn),本文構(gòu)造了基于BN網(wǎng)絡(luò)的學(xué)生廣義認(rèn)知診斷模型,將貝葉斯網(wǎng)絡(luò)(Bayesian Network,BN)引入學(xué)生廣義認(rèn)知診斷中。在此主要進(jìn)行了兩方面的研究,分別為測(cè)驗(yàn)所得數(shù)據(jù)進(jìn)行貝葉斯結(jié)構(gòu)的學(xué)習(xí)得到屬性間的層級(jí)關(guān)系與構(gòu)建BN網(wǎng)絡(luò)分類器對(duì)學(xué)生認(rèn)知狀態(tài)進(jìn)行分類,從而更好的為教育服務(wù)。
1.1 ?認(rèn)知診斷
新一代健康教育理論的核心:認(rèn)知診斷雖處于發(fā)展初期,但已成為國(guó)內(nèi)外心理研究的熱點(diǎn)[2]。在教育中,期待得出學(xué)生認(rèn)知過程中的具體信息,以指導(dǎo)不同學(xué)生有針對(duì)性的學(xué)習(xí)。認(rèn)知診斷最早可追溯至20世紀(jì)六七十年代,提出為掌握而學(xué)的布魯姆認(rèn)為測(cè)驗(yàn)不僅要提供篩選功能,更能提供具體信息,以提高測(cè)驗(yàn)效度[3]。基于心理學(xué)模型,認(rèn)知診斷采用心理學(xué)的各種方法分析測(cè)驗(yàn)任務(wù)中所涵蓋的技能、知識(shí)等分量,從而獲得模型并進(jìn)行設(shè)計(jì)測(cè)驗(yàn)。最終采用測(cè)量模型獲得測(cè)量數(shù)據(jù),也即融合各種變量于測(cè)量模型,并利用統(tǒng)計(jì)方法對(duì)個(gè)體特征進(jìn)行揭示。
1.2 ?貝葉斯網(wǎng)絡(luò)概念
1985年提出的貝葉斯網(wǎng)絡(luò)(BN)已在機(jī)器學(xué)習(xí)、專家系統(tǒng)與人工智能等領(lǐng)域得到廣泛的應(yīng)用,其是統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘等多個(gè)領(lǐng)域的交叉學(xué)科[4]。BN基于概率論圖形模式,采用概率分布將不確定性設(shè)計(jì)成模型以用于分析不確定事物并做出推理[5]。BN包括兩部分:條件概率分布(Conditional Probability Distribution,CPT)與有向無環(huán)圖(Directed Acyclic Graph,DAG),分別表示變量與變量之間的關(guān)系。有向無環(huán)圖又包括測(cè)試狀態(tài)、屬性等抽象成的節(jié)點(diǎn)與表示節(jié)點(diǎn)間相依關(guān)系的有向邊,條件概率表示節(jié)點(diǎn)間的聯(lián)系程度[6]。圖1為BN網(wǎng)絡(luò)圖的一個(gè)實(shí)例,列表中表示了預(yù)測(cè)任意實(shí)例的概率分布。式(1)為貝葉斯定理,其為貝葉斯網(wǎng)絡(luò)建立的依據(jù)。
[PAiB=PBAiPAij=1nPAjPBAj,i=1,2,…,n] (1)
式中,[A1,A2,…,An]為A的n個(gè)不相容狀態(tài),且為必然事件;[PAi,PBAi,PAiB]分別為先驗(yàn)概率、條件概率與后驗(yàn)概率。
1.3 ?貝葉斯網(wǎng)絡(luò)學(xué)習(xí)與分類器
1) BN網(wǎng)絡(luò)學(xué)習(xí)
BN網(wǎng)絡(luò)的推論需基于BN網(wǎng)絡(luò)學(xué)習(xí)構(gòu)造的模型。BN網(wǎng)絡(luò)學(xué)習(xí)即通過數(shù)據(jù)以構(gòu)造其網(wǎng)絡(luò),其既可定性又可定量,包括參數(shù)與結(jié)構(gòu)學(xué)習(xí)兩個(gè)過程[7]。結(jié)構(gòu)學(xué)習(xí)是構(gòu)建模型,將數(shù)據(jù)的因果關(guān)系圖形化,參數(shù)學(xué)習(xí)則是求得網(wǎng)絡(luò)結(jié)構(gòu)中節(jié)點(diǎn)概率分布。
2) BN網(wǎng)絡(luò)分類器
BN網(wǎng)絡(luò)建立后,采用BN公式根據(jù)被試學(xué)生作答情況進(jìn)行信息的預(yù)測(cè)與能力的推斷分類。BN分類器選取已知類別的訓(xùn)練樣本,通過模式識(shí)別判斷測(cè)試樣本所屬類別。BN分類器模型可分為樸素、樹增廣的樸素、增廣BN網(wǎng)的樸素BN分類器等。
認(rèn)知診斷的目的是通過學(xué)生的作答情況,以分析其心理狀態(tài)與知識(shí)技能掌握情況。因此,Q矩陣被應(yīng)用其中。其是測(cè)試項(xiàng)目與認(rèn)知屬性的關(guān)聯(lián)陣,是可觀察與不可觀察間的橋梁[8]?;谑孪仍O(shè)定的屬性層級(jí)關(guān)系得到Q矩陣、鄰接矩陣,化簡(jiǎn)得到Qr矩陣,從而基于Dr編寫題目進(jìn)行測(cè)試,得到最為接近被試者屬性掌握模式以使得BN結(jié)構(gòu)學(xué)習(xí)結(jié)果更加可靠。
本文的屬性結(jié)構(gòu)學(xué)習(xí)采用K2算法,設(shè)變量[X1,X2,…,Xn]的完整數(shù)據(jù)為D,K2算法在被正整數(shù)與排序變量所限制的空間中找尋最優(yōu)模型,其過程為:計(jì)算排序中父節(jié)點(diǎn)集合為空時(shí)的節(jié)點(diǎn)結(jié)構(gòu)分?jǐn)?shù),然后將排序在前的節(jié)點(diǎn)組合為其父節(jié)點(diǎn),形成新網(wǎng)絡(luò)結(jié)構(gòu)并對(duì)其進(jìn)行評(píng)分;在評(píng)分最高的網(wǎng)絡(luò)結(jié)構(gòu)中找到該節(jié)點(diǎn)的父節(jié)點(diǎn),重復(fù)進(jìn)行該過程,直到找出所有節(jié)點(diǎn)的父節(jié)點(diǎn),進(jìn)而找到屬性間的層級(jí)關(guān)系。認(rèn)知診斷中的變量包括學(xué)生心理狀態(tài)、知識(shí)技能、試題等的認(rèn)知屬性。
在認(rèn)知診斷中需要依據(jù)項(xiàng)目反映情況識(shí)別原理[9]。BN分類器基于數(shù)據(jù),所有屬性均參與分類,且判斷對(duì)象的類是通過其概率值。因此,其為優(yōu)良的分類方法,被廣泛地應(yīng)用在醫(yī)療、故障診斷等領(lǐng)域。
本文中所用到的分類器為樸素、增廣樸素BN分類器,樸素BN模型節(jié)點(diǎn)結(jié)構(gòu)為一個(gè)父節(jié)點(diǎn)、多個(gè)子節(jié)點(diǎn),分別為類別與屬性變量,表示為C,[X1,X2,…,Xn],即表示學(xué)生理想掌握模式類別與題目。分類器原理為基于屬性變量值,計(jì)算后驗(yàn)概率分布,該組類別則為得到最大的C值[10]。樸素BN分類公式為:
[PCiX=PCiPXj=1nPxjCi] ? ?(2)
增廣樸素BN模型則是在節(jié)點(diǎn)間增加邊,以彌補(bǔ)樸素BN模型不符合實(shí)際的變量間獨(dú)立的假設(shè),其分類公式為:
[PCiX=PCiPXj=1nPxjπXj] ? (3)
分類器性能評(píng)價(jià)標(biāo)準(zhǔn)為復(fù)雜度、簡(jiǎn)潔度與準(zhǔn)確度,本文采用最為常用的準(zhǔn)確度對(duì)分類器進(jìn)行評(píng)價(jià),準(zhǔn)確度的指標(biāo)有:正確率、錯(cuò)誤率、精度與召回率。本文對(duì)分類器模型評(píng)估采用交叉驗(yàn)證法,包含hold out,K?fold,leave?one?out三種交叉驗(yàn)證方法。本文采用其中10?fold法,數(shù)據(jù)會(huì)被分成10個(gè)等級(jí),共進(jìn)行10次驗(yàn)證,每次取數(shù)據(jù)集中1個(gè)數(shù)據(jù)集為測(cè)試集,9個(gè)為訓(xùn)練集。通過題目的細(xì)致編制,分析與報(bào)告每個(gè)學(xué)生的掌握情況,并將其分類到特定的模式中。建立BN分類器的步驟為:
1) 標(biāo)識(shí)類與屬性變量及其值;
2) 搜集含有一系列屬性變量與一個(gè)類別變量的數(shù)據(jù);
3) 進(jìn)行BN網(wǎng)絡(luò)參數(shù)與結(jié)構(gòu)學(xué)習(xí),從而構(gòu)造出含有概率分布表與有向無環(huán)圖的BN網(wǎng)絡(luò)分類器。
4 ?實(shí)驗(yàn)驗(yàn)證
4.1 ?屬性層級(jí)關(guān)系
在學(xué)生心理狀態(tài)中選擇6個(gè)知識(shí)點(diǎn)屬性,初步設(shè)定其層級(jí)關(guān)系,如圖2所示。通過將學(xué)生的觀察反應(yīng)模式與屬性層級(jí)模式作為訓(xùn)練數(shù)據(jù)集,得到BN學(xué)習(xí)結(jié)果圖如圖3所示。比較圖2與圖3可得出,兩者結(jié)構(gòu)變化較小,僅在有變化處做出分析可進(jìn)一步在細(xì)節(jié)處了解學(xué)生心理狀態(tài)。
4.2 ?分類器性能評(píng)價(jià)
為了驗(yàn)證本文所設(shè)計(jì)的分類器性能,對(duì)樸素、增廣樸素BN分類器分別運(yùn)用實(shí)證數(shù)據(jù)進(jìn)行驗(yàn)證,表1為其分類效果。從表中可看出,兩個(gè)分類器效果相差較小,分類正確率可以達(dá)到88%,分類效果良好,結(jié)構(gòu)簡(jiǎn)單,因而其為有效的分類工具。
本文針對(duì)傳統(tǒng)教學(xué)中對(duì)學(xué)生心理變化和廣義認(rèn)知的測(cè)量與診斷只給出分?jǐn)?shù)值,而無法對(duì)分?jǐn)?shù)值相同的不同知識(shí)結(jié)構(gòu)進(jìn)行解釋的缺點(diǎn),基于目前學(xué)生認(rèn)知診斷的任務(wù)更多的是學(xué)生測(cè)試結(jié)果的反饋信息,將具有堅(jiān)實(shí)數(shù)學(xué)理論基礎(chǔ)、數(shù)據(jù)挖掘理論與算法支持的貝葉斯網(wǎng)絡(luò)引入學(xué)生廣義認(rèn)知診斷中。文中最后對(duì)所構(gòu)造的基于BN網(wǎng)絡(luò)的學(xué)生廣義認(rèn)知診斷模型進(jìn)行驗(yàn)證,結(jié)果表明其得到的屬性層級(jí)關(guān)系合理,分類性能良好且結(jié)構(gòu)簡(jiǎn)潔,能夠較好地應(yīng)用在認(rèn)知診斷中,具有廣闊的應(yīng)用前景。
參考文獻(xiàn)
[1] 朱天宇,黃振亞,陳恩紅,等.基于認(rèn)知診斷的個(gè)性化試題推薦方法[J].計(jì)算機(jī)學(xué)報(bào),2017,40(1):176?191.
ZHU Tianyu, HUANG Zhenya, CHEN Enhong, et al. Cognitive diagnosis based personalized question recommendation [J]. Chinese journal of computers, 2017, 40(1): 176?191.
[2] 毛秀珍.基于屬性掌握概率的認(rèn)知診斷模型[J].四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,37(3):437?443.
MAO Xiuzhen. The attribute mastery probability cognitive diagnostic model [J]. Journal of Sichuan Normal University (Natural science), 2014, 37(3): 437?443.
[3] 王郁.基于HO?DINA模型的學(xué)生心理多級(jí)評(píng)分認(rèn)知診斷模型研究[J].現(xiàn)代電子技術(shù),2018,41(2):53?55.
WANG Yu. Research on multi?level scoring cognitive diagnosis model for students′ psychology based on HO?DINA model [J]. Modern electronics technique, 2018, 41(2): 53?55.
[4] SINGH P K, CHERUKURI A K. A note on bipolar fuzzy graph representation of concept lattice [J]. International journal of computing science & mathematics, 2014, 5(4): 381?393.
[5] 王郁.基于G?AHM模型的群體水平評(píng)估認(rèn)知診斷模型研究[J].現(xiàn)代電子技術(shù),2018,41(10):105?107.
WANG Yu. Research on group?level evaluation cognitive diagnosis model based on G?AHM model [J]. Modern electronics technique, 2018, 41(10): 105?107.
[6] GLYKAS M. Fuzzy cognitive strategic maps in business process performance measurement [J]. Expert systems with applications, 2013, 40(1): 1?14.
[7] LIU Q, WU R, CHEN E, et al. Fuzzy cognitive diagnosis for modelling examinee performance [J]. ACM transactions on intelligent systems & technology, 2018, 9(4): 1?26.
[8] 丁樹良,王文義,羅芬.認(rèn)知診斷中Q矩陣和Q矩陣?yán)碚揫J].江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,36(5):441?445.
DING Shuliang, WANG Wenyi, LUO Fen. Q matrix and Q matrix theory in cognitive diagnosis [J]. Journal of Jiangxi Normal University (Natural sciences edition), 2012, 36(5): 441?445.
[9] NIESINK P, POULIN K, ?AJNA M. Computing transitive closure of bipolar weighted digraphs [J]. Discrete applied mathematics, 2013, 161(1): 217?243.
[10] SINGH P K, KUMAR C A. Bipolar fuzzy graph representation of concept lattice [J]. Information sciences, 2014, 288: 437?448.