蔣冬梅
(北京市海淀區(qū)職工大學(xué),北京 100083)
隨著基于Web的現(xiàn)代遠(yuǎn)程教育的發(fā)展,模擬教師的智能,按學(xué)習(xí)者的學(xué)習(xí)行為和學(xué)習(xí)狀態(tài)動(dòng)態(tài)導(dǎo)航學(xué)習(xí)內(nèi)容,提供個(gè)性化教學(xué)服務(wù),已成為開(kāi)發(fā)遠(yuǎn)程教育系統(tǒng)的需求。
目前,國(guó)內(nèi)外研究人員已開(kāi)展了學(xué)習(xí)系統(tǒng)的自適應(yīng)性研究,并取得了一定的成果。系統(tǒng)自適應(yīng)性的關(guān)鍵是實(shí)現(xiàn)對(duì)學(xué)習(xí)者學(xué)習(xí)情況的診斷和資源推薦,通常采用分析學(xué)習(xí)者的學(xué)習(xí)特征與資源特征間關(guān)系的方式。Brusilovsky[1]開(kāi)發(fā)的自適應(yīng)學(xué)習(xí)系統(tǒng),根據(jù)學(xué)習(xí)者的學(xué)習(xí)能力進(jìn)行學(xué)習(xí)情況診斷和資源推薦。CHEN C M等[2]開(kāi)發(fā)的自適應(yīng)學(xué)習(xí)系統(tǒng),根據(jù)學(xué)習(xí)者能力和學(xué)習(xí)資料的難度推薦資源。WANG H C等[3]開(kāi)發(fā)的自適應(yīng)學(xué)習(xí)系統(tǒng),根據(jù)學(xué)習(xí)者特征和學(xué)習(xí)資源特征的最大相似度匹配策略進(jìn)行學(xué)習(xí)者情況的診斷和資源推薦。知識(shí)是分層次的,以知識(shí)點(diǎn)來(lái)推進(jìn)整個(gè)學(xué)習(xí)過(guò)程,更符合認(rèn)知規(guī)律。但上述系統(tǒng)未考慮某一知識(shí)點(diǎn)對(duì)整個(gè)單元知識(shí)體系的影響,忽略了從流媒體對(duì)象的角度考察學(xué)習(xí)者交互式請(qǐng)求的學(xué)習(xí)特征,不能充分反映學(xué)習(xí)者的學(xué)習(xí)適應(yīng)性。此外,由客觀題測(cè)試得到的測(cè)試結(jié)果并不能充分反映學(xué)習(xí)者的學(xué)習(xí)情況。因此,本文從學(xué)習(xí)者學(xué)習(xí)特征、知識(shí)點(diǎn)類(lèi)別和測(cè)試結(jié)果出發(fā),預(yù)測(cè)學(xué)習(xí)者的學(xué)習(xí)情況和知識(shí)水平,并根據(jù)學(xué)習(xí)者的學(xué)習(xí)情況與學(xué)習(xí)者的知識(shí)水平最大匹配策略推薦學(xué)習(xí)資源。
對(duì)于學(xué)習(xí)者學(xué)習(xí)某一單元的流媒體課件后是否能進(jìn)入下一單元的預(yù)測(cè)屬于數(shù)據(jù)挖掘和人工智能的范疇。
自適應(yīng)點(diǎn)播系統(tǒng)模型如圖1所示。系統(tǒng)定期或觸發(fā)式地檢查服務(wù)器日志,從服務(wù)器向用戶流化數(shù)據(jù)時(shí)產(chǎn)生的流化日志條目和用戶對(duì)流化到緩存的數(shù)據(jù)進(jìn)行訪問(wèn)時(shí)產(chǎn)生的播放日志條目中了解用戶訪問(wèn)流媒體課件的情況,如用戶的IP地址、訪問(wèn) ID、訪問(wèn)的視頻名稱、起始時(shí)間、觀看視頻的時(shí)間以及前跳、暫停、后跳交互請(qǐng)求等[4]。經(jīng)過(guò)一個(gè)單元的學(xué)習(xí)后,得到一張學(xué)習(xí)過(guò)程記錄表,其形式如表1所示。系統(tǒng)根據(jù)學(xué)習(xí)特征自動(dòng)診斷學(xué)習(xí)者學(xué)習(xí)情況,即內(nèi)容容易、內(nèi)容較難、內(nèi)容難。
圖1 自適應(yīng)點(diǎn)播系統(tǒng)模型圖
表1 學(xué)習(xí)過(guò)程記錄表
學(xué)習(xí)者學(xué)習(xí)一個(gè)單元后進(jìn)入單元測(cè)試,并自動(dòng)生成單元成績(jī)測(cè)試表,如表2所示。系統(tǒng)根據(jù)各類(lèi)知識(shí)點(diǎn)成績(jī)預(yù)測(cè)學(xué)習(xí)者擁有該單元的知識(shí)水平,即水平高、水平一般、水平較低、水平極低。
表2 單元成績(jī)表
系統(tǒng)自適應(yīng)地設(shè)置視頻點(diǎn)播導(dǎo)航及相關(guān)資源的調(diào)整策略如下:
R1:IF學(xué)習(xí)者感覺(jué)學(xué)習(xí)內(nèi)容難and(學(xué)習(xí)者當(dāng)前的知識(shí)水平極低or低)THEN點(diǎn)播導(dǎo)航為前驅(qū)視頻單元及提供相應(yīng)學(xué)習(xí)資源鏈接。
R2:IF學(xué)習(xí)者感覺(jué)學(xué)習(xí)內(nèi)容難and(學(xué)習(xí)者當(dāng)前的知識(shí)水平一般or高)THEN導(dǎo)航為當(dāng)前單元練習(xí)測(cè)試及提供相應(yīng)學(xué)習(xí)資源鏈接。
R3:IF(學(xué)習(xí)者感覺(jué)學(xué)習(xí)內(nèi)容較難 or容易)and(學(xué)習(xí)者當(dāng)前的知識(shí)水平極低)THEN點(diǎn)播導(dǎo)航為當(dāng)前視頻單元及提供相應(yīng)學(xué)習(xí)資源鏈接。
R4:IF(學(xué)習(xí)者感覺(jué)學(xué)習(xí)內(nèi)容較難 or容易)and(學(xué)習(xí)者當(dāng)前的知識(shí)水平較低)THEN導(dǎo)航為當(dāng)前單元練習(xí)測(cè)試及提供相應(yīng)學(xué)習(xí)資源鏈接。
R5:IF(學(xué)習(xí)者感覺(jué)學(xué)習(xí)內(nèi)容較難 or容易)and(學(xué)習(xí)者當(dāng)前的知識(shí)水平一般or高)THEN點(diǎn)播導(dǎo)航為后繼視頻單元及提供相應(yīng)學(xué)習(xí)資源鏈接。
對(duì)學(xué)習(xí)者學(xué)習(xí)情況和知識(shí)水平分類(lèi)診斷需要進(jìn)行數(shù)據(jù)挖掘。常用的分類(lèi)預(yù)測(cè)方法很多,貝葉斯分類(lèi)法因簡(jiǎn)單易行、分類(lèi)效果較好而被廣泛應(yīng)用。
樸素貝葉斯分類(lèi)基于類(lèi)條件獨(dú)立性假設(shè),在已知先驗(yàn)概率與條件概率情況下進(jìn)行分類(lèi)識(shí)別。令U={X1,X2,……,Xn,C}是有n個(gè)屬性的離散型隨機(jī)變量的有限集,具有 m 個(gè)類(lèi)的類(lèi)集 C={Ci,i=1,2, ……,m}, 類(lèi) Ci發(fā)生的概率P(Ci)是先驗(yàn)概率,由訓(xùn)練集數(shù)據(jù)計(jì)算所得。由于拾取了觀測(cè)數(shù)據(jù)X,對(duì)分類(lèi)結(jié)果有了新的認(rèn)識(shí),根據(jù)式(1)找到具有最大概率P(Cj|X)的類(lèi)作為分類(lèi)預(yù)測(cè)的結(jié)果,這就是貝葉斯估計(jì)。
其中,P(Cj)=Sj/S=類(lèi)Cj的訓(xùn)練集樣本數(shù)/訓(xùn)練集樣本總數(shù);P(Xk|Cj)=Sjk/Sj=屬于 Cj類(lèi)且屬性 Ak取值 a的訓(xùn)練樣本數(shù)/屬于類(lèi)Cj的訓(xùn)練樣本數(shù)。
由于某單元各類(lèi)知識(shí)點(diǎn)的分?jǐn)?shù)段與預(yù)測(cè)類(lèi)別之間存在或大或小的關(guān)聯(lián),需嘗試對(duì)屬性與類(lèi)別之間的關(guān)聯(lián)進(jìn)行量化,放松樸素貝葉斯中條件獨(dú)立假設(shè),以提高貝葉斯分類(lèi)器的準(zhǔn)確度和分類(lèi)效率。特征加權(quán)的貝葉斯分類(lèi)的模型如式(2)、(3)所示。
[5]提出了通過(guò)有序加權(quán)算子作為概率乘積的權(quán)重辦法,參考文獻(xiàn)[6]提出用ID3信息增益的決策樹(shù)技術(shù)確定權(quán)重,參考文獻(xiàn)[5]和參考文獻(xiàn)[6]忽略了特征屬性與其他各個(gè)類(lèi)別間的相關(guān)度,并需要考慮權(quán)值為0的問(wèn)題。參考文獻(xiàn)[7]用互信息可信度的方式標(biāo)識(shí)條件屬性與類(lèi)別之間相互關(guān)聯(lián)的強(qiáng)弱程度,進(jìn)一步提高分類(lèi)準(zhǔn)確率,但它的計(jì)算時(shí)間長(zhǎng)。為此,將特征權(quán)值改進(jìn)為式(4):
其中,S′k為訓(xùn)練集中屬性 Ak取值 a的樣本數(shù)。
由于 Wkj≥1,所以用式(3)比式(2)更能突顯重要屬性對(duì)分類(lèi)的影響?;诟怕始訖?quán)的樸素貝葉斯分類(lèi)算法如下:
(1)數(shù)據(jù)預(yù)處理,從成績(jī)表中選取訓(xùn)練樣本和測(cè)試樣本。
(2)掃描訓(xùn)練集生成統(tǒng)計(jì)表,統(tǒng)計(jì)具備某種知識(shí)水平時(shí)各類(lèi)知識(shí)點(diǎn)的不同分?jǐn)?shù)段的樣本數(shù),以及各類(lèi)知識(shí)點(diǎn)的不同分?jǐn)?shù)段的樣本數(shù)。
(3)概率參數(shù)學(xué)習(xí),生成概率表。
(4)權(quán)值參數(shù)學(xué)習(xí),計(jì)算屬性 Xk的權(quán) Wkj。
(5)生成加權(quán)貝葉斯分類(lèi)器,按式(3)生成概率表及權(quán)值列表。
(6)調(diào)用概率表及權(quán)值列表得分類(lèi)結(jié)果。
根據(jù)學(xué)習(xí)者操作媒體的特征預(yù)測(cè)學(xué)習(xí)者的學(xué)習(xí)情況是容易、較難或難,可使用樸素貝葉斯分類(lèi)的方法實(shí)現(xiàn)。貝葉斯分類(lèi)是在某一指定的時(shí)刻進(jìn)行的。在流媒體課件的播放過(guò)程中,學(xué)習(xí)者對(duì)媒體的操作是不斷變化的,它與時(shí)間t有關(guān),因此,學(xué)習(xí)者的學(xué)習(xí)情況集要用時(shí)序狀態(tài)集來(lái)表示,即 C={Ci,i=1,……,m(m=3)}t={容易,較難,難}t,t=1,2,3……,T。 學(xué)習(xí)情況 Ci的概率 Pt(Ci)表示它們的統(tǒng)計(jì)特征。這里,t為廣義時(shí)間單位,即定期診斷或檢測(cè)次數(shù)乘以間隔時(shí)間得到的實(shí)時(shí)時(shí)間[7]。相應(yīng)地,任何時(shí)刻學(xué)習(xí)情況Ci的后驗(yàn)概率公式為:
加入時(shí)序t的樸素貝葉斯分類(lèi)過(guò)程如下:
(1)初始化先驗(yàn)信息:t=0,根據(jù)歷史數(shù)據(jù)計(jì)算 P0(Ci)(i=1,2,……,m)。
(2)以 Pt(Ci)為先驗(yàn)概率,按式(5)計(jì)算 t=t+1時(shí)刻的后驗(yàn)概率 Pt(Ci|Xj)。
(3)若 t≤T,則返回(2),否則輸出預(yù)測(cè)結(jié)果。
為了驗(yàn)證算法的有效性,基于校園局域網(wǎng)環(huán)境,對(duì)23名學(xué)習(xí)者學(xué)習(xí)網(wǎng)絡(luò)基礎(chǔ)、C#程序設(shè)計(jì)兩門(mén)課程流媒體課件的部分?jǐn)?shù)據(jù),用樸素貝葉斯分類(lèi)法NB、概率加權(quán)的貝葉斯分類(lèi)法PWNB、加入時(shí)序的貝葉斯分類(lèi)法TNB進(jìn)行測(cè)試,結(jié)果如表3所示。結(jié)果表明,上述貝葉斯分類(lèi)器預(yù)測(cè)學(xué)習(xí)者的學(xué)習(xí)情況和知識(shí)水平的算法簡(jiǎn)單有效,根據(jù)學(xué)習(xí)者的學(xué)習(xí)情況與學(xué)習(xí)者的知識(shí)水平最大匹配策略推薦資源的方法可行。
以上討論了學(xué)習(xí)系統(tǒng)中自適應(yīng)流媒體點(diǎn)播系統(tǒng)的實(shí)現(xiàn)過(guò)程及學(xué)習(xí)者學(xué)習(xí)情況、知識(shí)水平的診斷流程,設(shè)計(jì)了一個(gè)自適應(yīng)流媒體點(diǎn)播系統(tǒng)模型,重點(diǎn)討論了貝葉斯分類(lèi)算法,并應(yīng)用于實(shí)際教學(xué)。通過(guò)學(xué)習(xí)者學(xué)習(xí)過(guò)程中反饋的數(shù)據(jù),評(píng)估系統(tǒng)及算法設(shè)計(jì)的合理性、科學(xué)性。
表3 實(shí)驗(yàn)結(jié)果表
參考文獻(xiàn)
[1]BRUSILOVSKY P.Layered evaluation of adaptive learning systems[J].Int.J.Cont.Engineering Education and Life Long Learning, 2004,14(4):402-421.
[2]CHEN C M,LEE H M,CHEN Y H.Personalized E-learning System Using Item Response Theory[J].Computers&Education, 2005, 44(3):237-155.
[3]WANG H C, LI T Y, CHANG C Y.A Web-based tutoring system with styles-matching strategy for spatial geometric transformation[J].Interacting with Computers, 2006,18(3):331-355.
[4]Huseyin Koyun.Logging model for windows media services[EB/OL].http://www.microsoft.com/ardcles/LoggingModel.Aspx September.2007.
[5]YAGER R R.An extension of the naive Bayesian classifier[J].Information Sciences,2006,176(5):577-588.
[6]HALL M.A decision tree-based attribute weighting filter for Na?ve Bayes[J].Knowledge-Based Systems,2007,20(1):120-126.
[7]令狐紅英,陳梅,王翰虎,等.基于互信息可信度的貝葉斯網(wǎng)絡(luò)入侵檢測(cè)研究 [J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30(14):3288-3290.
[8]吳今培.模糊診斷理論及其應(yīng)用[M].北京:科學(xué)出版社,1995.
網(wǎng)絡(luò)安全與數(shù)據(jù)管理2011年17期