朱玉全, 石 亮, 李 雷
(江蘇大學 計算機科學與通信工程學院, 江蘇 鎮(zhèn)江 212013)
課程是實施教學的基本單位,其教學效果直接決定著人才培養(yǎng)質量.通常情況下,每門課程是由功能相對獨立且相互間有聯(lián)系的知識點構成,如《程序設計基礎》課程包含了200多個知識點.知識點邏輯結構與知識點線性表之間存在著前繼關系.知識點是學習者學習的對象,是知識在意識層面的抽象集合.在線下教學環(huán)境中,學習者對知識點的學習過程就是任課老師課堂知識點的傳授過程,老師根據(jù)個人理解和課程的知識體系將知識點連成一條路徑,這種學習方法方便、快捷、直觀性強,易于初學者循序漸進地學習課程知識.但學習者無法根據(jù)各自已有知識制定個性化的知識學習路徑,不適應(超前或跟不上)老師節(jié)奏的現(xiàn)象時有發(fā)生,線上課程教學為改變這種情況提供了一個很好的機會.為了避免線上課程教學中出現(xiàn)“一抓就死,一放就亂” 的尷尬局面,需要為每個(每類)學習者推薦適合其自身特點的學習路徑,知識網(wǎng)推薦已成為線上課程教學中的一個重要技術支撐.
對于知識網(wǎng)構建和知識推薦技術,P. BRUSILOVSKY[1]用平面地圖來描述所有知識,學習者通過地圖獲得與學習課程內容相關的學習指南.O. C. SANTOS等[2]通過測試學習者的學習等級來推薦與其等級相對應的知識.王麗萍[3]提出了一種基于學習者當前知識點水平的學習路徑推薦方法,推薦合適的知識點、學習對象、學習路徑等內容.PAN L. M.等[4]將學習路徑規(guī)劃問題分解為先后序學習問題,進而將其形式化為二分類問題進行解決,該方法只考慮了學習對象本身對學習路徑推薦的影響,但未考慮學習者的個性化因素.陳娬[5]給出一種知識構建方法,將知識構建評價效果反饋到知識構建中,能及時掌握學生的學習變化情況.黃亞澎[6]給出一種基于知識模式的個性化學習路徑推薦方法,構建了刻畫學生學習行為特征和學習狀態(tài)特征的學習特征模型,具有一定的有效性和適應性.翟域等[7]提出一種基于知識狀態(tài)的個性化學習資源推薦方法,通過知識圖譜構造、待學習知識點向量生成、相似性迭代算法設計等過程,從學習資源庫中推薦最適合學習者的學習資源.蘇慶等[8]構建一個基于學習情況的個性化學習推薦模型LS-PLRM(learning situation based personalized learning recommendation model),為學習者推薦一種個性化學習方案.劉真等[9]提出了一種知識聚合和遷移相結合的跨領域推薦算法ATCF(aggregation and transfer collaborative filtering algorithm),融合了輔助域和目標域的知識,通過基于矩陣分解的兩級矩陣拼接和兩次矩陣填充,得到在群集矩陣及評分矩陣上的共性知識表示,通過知識遷移構建了重疊用戶和非重疊用戶的個性知識表示,有效避免了負遷移.周炫余等[10]提出一種基于聯(lián)合知識圖譜和時間特性的數(shù)學知識自動推薦方法,該方法利用自注意力機制和前饋神經(jīng)網(wǎng)絡獲取帶有時間特性的學習者表示,根據(jù)知識圖譜三元組中知識點與知識點的高階連通特性和學習者特性深層次表征知識點,計算學習者與知識點交互的概率,并根據(jù)概率進行推薦.羅莘濤等[11]提出基于評論特征提取和隱因子模型的評分預測推薦模型,使用自適應感受野的卷積神經(jīng)網(wǎng)絡提取局部特征,同時使用門控循環(huán)單元提取全局特征,將不同特征融合為評論的嵌入表達,再結合隱因子模型對用戶的特征偏好和商品的特征屬性進行整合.
由此可見,目前已提出了許多知識網(wǎng)構建和知識推薦方法,這些方法或多或少為知識推薦提供了一種有效的解決方案.然而,這些推薦方法未能充分考慮學習者的學習目的,而學習目的的不同會導致不同的知識需求.如學習某一編程語言,計算機專業(yè)的學生需要進行深入研究,而其他專業(yè)的學生只需了解即可,需要根據(jù)學習者的目的來推薦知識和學習路徑.另外,在學習某課程知識時,學習者對某一知識點的現(xiàn)有了解程度也會影響知識點的學習次序.
文中擬提出一種基于模糊規(guī)則的知識網(wǎng)推薦方法,將課程老師的教學經(jīng)驗和已學過該課程學習者的學習路徑分別組成知識網(wǎng);融合匹配度和認知水平來計算知識網(wǎng)之間的相似度,采用模糊C均值聚類方法對知識網(wǎng)進行聚類;將聚類隸屬度最大的知識網(wǎng)推薦給學習者,或將各聚類隸屬度最大的知識網(wǎng)優(yōu)化組合成一個新的知識網(wǎng)推薦給學習者.
借鑒圖形結構的思想,將每門課程的知識點以及相互之間的關系組織成一個知識網(wǎng).另外,根據(jù)課程知識網(wǎng)和每位學習者的學習習慣,將每位學習者學習過的知識點按照認知水平和學習次序組織成一條學習路徑,按照不同的知識模塊將學習路徑組織成一個學習者知識網(wǎng),該知識網(wǎng)基本繼承了課程知識網(wǎng)中的包含和遞進關系.在此,知識模塊可以按照某門課程的章節(jié)劃分,或對知識點進行聚類得到知識模塊.知識網(wǎng)結構見圖1,不同學習者的知識網(wǎng)可能有所不同.
圖1 知識網(wǎng)結構圖
知識網(wǎng)的構建過程如下:
1) 把某一課程中的知識點按照章節(jié)組織成各個知識模塊,或使用聚類方法將知識點組織成不同的知識模塊.
2) 把各個知識模塊按照樹形結構組織成知識框圖,根據(jù)某個知識點構造根節(jié)點,根節(jié)點的孩子節(jié)點即為根節(jié)點所對應知識點的進一步細化,葉子節(jié)點即為最小的知識點,非葉子節(jié)點的孩子節(jié)點即為該節(jié)點所對應知識點的進一步細化.
每個學習者的學習路徑都與某知識網(wǎng)有一定的對應關系,每個知識網(wǎng)有不同的知識模塊,學習者選擇適合其學習目的的學習路徑就是對知識網(wǎng)的選擇.
將學習者的認知水平融合到知識網(wǎng)的匹配度計算中,分別從質和量兩方面來定義知識網(wǎng)的相似性.
2.1.1知識網(wǎng)的匹配度
匹配度用來衡量兩個知識網(wǎng)之間的匹配程度.設知識網(wǎng)U和V中最底層的知識點集分別為PU、PV,PU={Pu1,Pu2,…,Pum},PV={Pv1,Pv2,…,Pvn},其中m、n分別為PU和PV中所包含的知識點個數(shù).設Pui中知識點的個數(shù)為lui(i=1,2,…,m),Pvj中知識點的個數(shù)為lvj(j=1,2,…,n).PU與Pvj具有相同知識點的個數(shù)為lvj,U,PV與Pui具有相同知識點的個數(shù)為lui,V,U和V的匹配度為
2.1.2學習者的認知水平
認知水平是指學習者對知識的掌握程度,是判斷學習者對知識掌握程度的主要指標.一般情況下,人腦對知識的記憶隨時間的推進而逐漸減退.
當學習者需要學習某知識模塊時,與該知識模塊相匹配的知識網(wǎng)并不一定適合學習者的目的,學習者希望采納具有相近認知水平學習者的知識網(wǎng)來指導其學習.
2.1.2.1認知水平
根據(jù)布魯姆認知理論,認知水平可分為6個等級,從低到高分別為知道(知識)、領會(理解)、應用、分析、綜合、評價.由于學習者的認知水平具有較大的不確定性,采用模糊集來表示其認知水平;用隸屬度uk(i)表示各個級別的值,i=1,2,…,6,模糊集計算式為
2.1.2.2模糊推理及其模糊化
模糊推理是指從不精確前提集中推出可能不精確結論的推理過程,文中采用Mamdani模糊推理方法,具體計算如下:
式中:M為模糊規(guī)則總數(shù);uA′(x)為論域U上的一個模糊集.在實際應用中,還需進行解模糊化,常用的解模糊化方法有中心法、重心法等.文中采用重心法,計算式為
2.1.2.3記憶量
試驗表明人腦有一套容量有限的記憶系統(tǒng),隨著時間的推移,有些信息會被遺忘.所謂遺忘是指識記過的內容在一定條件下不能或錯誤地恢復和提取,按照信息加工的觀點,遺忘就是信息提取不出或被錯誤提取.研究成果表明記憶的保持和遺忘是時間的函數(shù),即記憶量是時間的函數(shù),文中采用的記憶量計算式為
式中:Mt為學習者對知識點的記憶量;a和b為權重參數(shù),a+b=1;t、t0為第1、2次的學習時間,d;lt為本次學習所用的時間,d.
在現(xiàn)實學習環(huán)境中,學習者對知識的認知水平隨著學習次數(shù)的增加而不斷提高.在某一認識水平上,隨著學習次數(shù)的增加,學習者對此知識的記憶時間也會延長,同時認知水平等級提高的概率也會隨之增加.為了使記憶量模型遵循這一規(guī)律,在此進一步完善了記憶模型,具體修改如下:
式中:R為認知水平等級;T為學習知識的次數(shù).
2.1.2.4做題時間
學習者的做題時間是其對知識掌握程度的一個重要體現(xiàn),文中將做題時間劃分為兩個時段,即正常時段和非正常時段.在正常時段內正確答題,表示學習者熟練掌握試題所體現(xiàn)的知識點.而在非正常時段內完成,則認為其對知識不了解、不熟練.由于學習者對某一知識的熟練程度具有一定的模糊性,文中用隸屬度函數(shù)來表示其熟悉程度,采用F(t)函數(shù)來計算學習者的做題時間,計算式為
式中:t≤α為正常時段;t≥γ為非正常時段;β=(α+γ)/2.
2.1.2.5隸屬度函數(shù)及模糊規(guī)則庫
隸屬度函數(shù)的確定方法有指派法、模糊專家法、二元對比排序法等.文中結合指派法和模糊專家法來確定隸屬度函數(shù),建立試題難度分別為小、中、大的3個模糊集,設定其對應的模糊隸屬度函數(shù).同樣建立試題難度貢獻率為很少、少、適中、多、很多的5個模糊集,設定其對應的模糊隸屬度函數(shù).
模糊規(guī)則庫是一系列模糊IF-THEN規(guī)則的集合,是模糊推理的基礎.在采納有關專家經(jīng)驗的基礎上建立規(guī)則庫,表1-3分別給出了記憶量多、中、少時所采用的模糊規(guī)則,其中的上一級、本級、次一級是相對于學習者當前的認知水平等級而言的.
表1 模糊規(guī)則(記憶量多)
表2 模糊規(guī)則(記憶量中)
表3 模糊規(guī)則(記憶量少)
續(xù)表
由表1可見,當學習者的記憶量高時,其認知水平等級(知道、領會、應用、分析、綜合、評價)上升的可能性較大.學習者做對次一級別試題時,次一級的做題時間貢獻率要比本級和上一級低.做對本級試題時,其做題時間貢獻率要高于次一級而低于上一級.做對上一級的試題時,其做題時間的貢獻率要高于次一級和本級.同理可解釋表2、3中的模糊規(guī)則.
2.1.2.6學習者認知水平估算方法
認知水平估算方法綜合考慮做題時間、試題難度和記憶量等因素,通過模糊規(guī)則和模糊推理推出認知等級的影響參數(shù),以此估算出認知水平的等級隸屬度,隸屬度最大的等級即為學習者的最新認知水平等級.具體估算過程如下:
1) 根據(jù)歷史數(shù)據(jù)計算出學習者的當前記憶量.
2) 當前記憶量模糊化.
3) 選擇相應的水平等級分為6個不同的等級,分別用1、2、…、6來表示,在此基礎上對認知水平等級進行規(guī)格化.
2.1.3知識網(wǎng)的相似度
由于知識網(wǎng)之間的層次結構不同,即使兩個知識網(wǎng)的匹配度和認知水平完全相同,仍不能說明它們是相同的.
文中綜合考慮知識網(wǎng)的質、量及層次結構等因素,給出知識網(wǎng)相似度的計算方法,計算式為
式中:αui、lui、μui和βvj、lvj、μvj分別為知識點pui和pvj所處的知識網(wǎng)層次、知識數(shù)、認知水平.
綜上所述,基于模糊規(guī)則的知識網(wǎng)推薦方法的基本思想如下:
1) 計算知識網(wǎng)之間的相似度,由此得到知識網(wǎng)的相似度矩陣.
2) 利用模糊C均值聚類算法對學習者知識網(wǎng)進行聚類.
3) 將聚類中隸屬度最大的知識網(wǎng)推薦給學習者.
4) 將每個聚類中隸屬度最大的知識網(wǎng)優(yōu)化組合成一個新的知識網(wǎng),并將之推薦給學習者.
5) 設學習者需求的知識網(wǎng)為W,計算W與每個聚類中隸屬度最大的知識網(wǎng)之間的相似度.
6) 將相似度最大的知識網(wǎng)作為參考知識網(wǎng)推薦給學習者.
從《數(shù)據(jù)庫系統(tǒng)原理》課程知識點模塊的學習信息中提取15名學習者的學習路徑,組成知識網(wǎng),并將之作為文中的試驗數(shù)據(jù).
下面以知識網(wǎng)W1和W2為例來展示知識網(wǎng)之間相識度的計算過程,W1和W2結構見圖2、3.
圖2 知識網(wǎng)W1
W1和W2中最底層的知識點集分別為
PW1={a1,a2,a3,a4,a5,a6,a7},
PW2={b1,b2,b3,b4,b5,b6,b7},
式中:a1包括實體、屬性、聯(lián)系、E-R圖等;a2包括ISA聯(lián)系、基數(shù)約束等;b5包括關系、元組、屬性、分量等.
圖3 知識網(wǎng)W2
利用前面所述方法估算出學習者對各知識點的認知水平,利用函數(shù)y=x/6將認知水平等級值規(guī)格化.如W1中學習者對知識點a1的認知水平估算值為5,規(guī)格化后為0.833.由此得到W1和W2的模糊化認知水平分別為
uW1=(0.833,0.833,0.501,0.501,0.334,0.668, 0.334),
uW2=(0.997,0.833,0.668,0.501,0.334,0.501, 0.501).
計算W1和W2之間的相似度,計算式為
式中:
A=2×0.997+2×0.833+2×0.668+3×0.501+2×0.334+2×0.501+3×0.501;
B=2×0.833+3×0.833+2×0.501+2×0.501+2×0.334+2×0.668+3×0.334;
C=2×( 3×0.997+2×0.668+3×0.501+3×0.334).
采用與3.1同樣的方法計算出W1-W15的模糊化認知水平,具體如表4所示.
表4 知識網(wǎng)模糊化認知水平
同理計算出15個知識網(wǎng)的相似度,構建相似矩陣,具體如表5所示,顯然相似度矩陣為對稱矩陣.
表5 知識網(wǎng)相似矩陣
續(xù)表
采用模糊C均值聚類(FCM)方法對知識網(wǎng)進行聚類,設置聚類數(shù)為3,模糊化因子為 2,迭代終止條件為隸屬度最小變化量≤10-5.計算結果如表6所示.
表6 知識網(wǎng)隸屬度
由表6可知:W2對聚類C1的隸屬度最大,W3對C2的隸屬度最大,W10對C3的隸屬度最大,可以將W2、W3、W10對應的學習方法、學習知識點的次序推薦給學習者,并優(yōu)先推薦W2.另外,可以將隸屬度最大的知識網(wǎng)優(yōu)化組合成一個新的知識網(wǎng),即將W2、W3、W10組合形成一條新的學習路徑推薦給學習者.
若學習者學習過一段時間,有屬于自己的學習路徑,此時可以根據(jù)學習者的學習路徑組織成知識網(wǎng),通過和其他知識網(wǎng)進行相似度匹配,選擇匹配度最大的知識網(wǎng)作為學習者下一步學習的目標路徑.
提出了一種基于模糊規(guī)則的知識網(wǎng)推薦方法,該方法將課程老師的教學經(jīng)驗和已學過該課程學習者的學習路徑分別組成知識網(wǎng),融合匹配度和認知水平來計算知識網(wǎng)的相似矩陣;采用模糊C均值聚類(FCM)方法對知識網(wǎng)進行聚類,將聚類隸屬度最大的知識網(wǎng)推薦給學習者,或將各聚類屬度最大的知識網(wǎng)優(yōu)化組合成一個新的知識網(wǎng)推薦給學習者.學習者的學習風格也是學習者個性化的重要體現(xiàn),下一步工作將綜合考慮學習者的學習風格和認知水平等因素,對學習者學習資源和學習路徑進行推薦,使推薦效果更符合學習者的個性化需求.