羅中凱,張立波
(中國(guó)科學(xué)院軟件研究所 智能軟件研究中心, 北京 100190) (2021年10月25日收稿; 2022年6月10日收修改稿)
在傳統(tǒng)學(xué)習(xí)過(guò)程中,呈現(xiàn)給學(xué)習(xí)者的學(xué)習(xí)內(nèi)容及其先后順序,是由專家或教師根據(jù)學(xué)習(xí)內(nèi)容的難易程度并結(jié)合自身實(shí)踐經(jīng)驗(yàn)進(jìn)行定義,因此,所有學(xué)習(xí)者均以相同的順序?qū)W習(xí)相同的內(nèi)容[1]。然而不同學(xué)習(xí)者的學(xué)習(xí)能力、學(xué)習(xí)目標(biāo)和已掌握的背景知識(shí)可能存在較大差別,使用這種無(wú)差異的教學(xué)方式無(wú)法達(dá)到因材施教的效果。越來(lái)越多的學(xué)習(xí)者渴望通過(guò)個(gè)性化和智能化的方式來(lái)獲取知識(shí)[1]。此外,科技的發(fā)展和互聯(lián)網(wǎng)的廣泛普及促進(jìn)了在線教育的發(fā)展,為學(xué)習(xí)者打破了學(xué)習(xí)的時(shí)空障礙,學(xué)習(xí)者可以方便快捷地獲取各種學(xué)習(xí)資源并進(jìn)行自主學(xué)習(xí)。特別是2019年新冠疫情大流行以來(lái),進(jìn)一步促進(jìn)了學(xué)習(xí)方式從傳統(tǒng)課堂向互聯(lián)網(wǎng)學(xué)習(xí)環(huán)境轉(zhuǎn)移。然而互聯(lián)網(wǎng)中學(xué)習(xí)資源數(shù)量巨大,海量學(xué)習(xí)資源給學(xué)習(xí)者造成了較大的認(rèn)知負(fù)荷[1]。同時(shí),學(xué)習(xí)者有限的學(xué)習(xí)時(shí)間和無(wú)限的學(xué)習(xí)資源之間存在巨大矛盾,因此如何高效學(xué)習(xí)顯得尤為重要。學(xué)習(xí)者高效學(xué)習(xí)的關(guān)鍵在于,能為學(xué)習(xí)者提供符合其個(gè)性化條件(學(xué)習(xí)偏好、學(xué)習(xí)能力等)的學(xué)習(xí)材料,并合理規(guī)劃這些材料學(xué)習(xí)的先后順序。已有研究表明,合理有序的學(xué)習(xí)資源序列對(duì)學(xué)習(xí)者的學(xué)習(xí)進(jìn)程和學(xué)習(xí)效果具有促進(jìn)作用:Durand等[2]通過(guò)實(shí)驗(yàn)證明,學(xué)習(xí)材料的呈現(xiàn)順序?qū)W(xué)習(xí)者快速準(zhǔn)確地掌握知識(shí)有較大影響;Chen[3]通過(guò)研究指出,通過(guò)學(xué)習(xí)當(dāng)前知識(shí)的先驗(yàn)和后驗(yàn)知識(shí),有助于學(xué)習(xí)者理解當(dāng)前知識(shí)。因此,如何快速有效地從海量資源中檢索出滿足學(xué)習(xí)者需求的學(xué)習(xí)資源,并將其規(guī)劃生成排列有序的學(xué)習(xí)路徑,成為在線學(xué)習(xí)過(guò)程中需要解決的關(guān)鍵問(wèn)題。
學(xué)習(xí)路徑規(guī)劃方法能夠很好地解決上述問(wèn)題。學(xué)習(xí)路徑規(guī)劃方法可以針對(duì)每個(gè)學(xué)習(xí)者特定的學(xué)習(xí)需求,為學(xué)習(xí)者量身定制特定的學(xué)習(xí)內(nèi)容,并能適應(yīng)學(xué)習(xí)者在學(xué)習(xí)過(guò)程中不斷變化的需求,從而提高學(xué)習(xí)者的學(xué)習(xí)表現(xiàn),優(yōu)化學(xué)習(xí)者的學(xué)習(xí)體驗(yàn),幫助學(xué)習(xí)者在更短的時(shí)間內(nèi),以更低的成本,更高效地達(dá)到學(xué)習(xí)目標(biāo)。因此,學(xué)習(xí)路徑規(guī)劃方法具有較高的研究意義與實(shí)用價(jià)值。
自20世紀(jì)60年代末以來(lái),面向?qū)W習(xí)路徑規(guī)劃方法問(wèn)題,涌現(xiàn)出大量研究成果,包括基于進(jìn)化算法的學(xué)習(xí)路徑規(guī)劃方法、基于圖的學(xué)習(xí)路徑規(guī)劃方法、基于數(shù)據(jù)挖掘的學(xué)習(xí)路徑規(guī)劃方法、基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)路徑規(guī)劃方法等。這些成果在一定程度上解決了學(xué)習(xí)路徑規(guī)劃問(wèn)題。然而,大多數(shù)研究成果仍然還局限于理想條件下的研究型項(xiàng)目中,在教育與生活中的實(shí)際應(yīng)用依然具有局限性,該領(lǐng)域的發(fā)展存在很大的提升空間。
學(xué)習(xí)路徑規(guī)劃擁有巨大的應(yīng)用前景,為便于后續(xù)研究人員在現(xiàn)有研究工作的基礎(chǔ)上得到更好的研究成果,我們查閱整理了近年來(lái)學(xué)術(shù)界的相關(guān)研究成果,對(duì)這些研究成果按照使用的算法技術(shù)進(jìn)行分類,對(duì)每類算法的優(yōu)缺點(diǎn)進(jìn)行分析,并對(duì)該領(lǐng)域的數(shù)據(jù)集、評(píng)估方法、主要挑戰(zhàn)以及未來(lái)發(fā)展方向做了系統(tǒng)性的論述。本文主要內(nèi)容如圖1所示。
圖1 本文主要內(nèi)容Fig.1 The main content of this paper
為實(shí)現(xiàn)某個(gè)特定的學(xué)習(xí)目標(biāo),需要向?qū)W習(xí)者提供系統(tǒng)學(xué)習(xí)的知識(shí),將這些知識(shí)由易到難、由簡(jiǎn)單到復(fù)雜、由部分到整體,編排形成一條有先后學(xué)習(xí)順序的知識(shí)序列,使學(xué)習(xí)者以較小的代價(jià)達(dá)到學(xué)習(xí)目標(biāo)。這條有先后學(xué)習(xí)順序的知識(shí)序列就稱為一條學(xué)習(xí)路徑。它強(qiáng)調(diào)學(xué)習(xí)過(guò)程中知識(shí)之間的相互關(guān)聯(lián),通過(guò)對(duì)學(xué)習(xí)內(nèi)容的選擇與組織,建立學(xué)習(xí)的基本框架,達(dá)到學(xué)習(xí)目標(biāo)。即學(xué)習(xí)路徑是一條有先后學(xué)習(xí)順序的學(xué)習(xí)資源序列。
學(xué)習(xí)路徑規(guī)劃方法是,為實(shí)現(xiàn)學(xué)習(xí)者特定的學(xué)習(xí)目標(biāo),根據(jù)學(xué)習(xí)者的學(xué)習(xí)能力、學(xué)習(xí)偏好、學(xué)習(xí)節(jié)奏、現(xiàn)有知識(shí)儲(chǔ)備等個(gè)性化特點(diǎn),為學(xué)習(xí)者篩選合適的學(xué)習(xí)資源并規(guī)劃生成學(xué)習(xí)路徑的方法。通過(guò)學(xué)習(xí)路徑規(guī)劃方法,可以避免學(xué)習(xí)者在海量的學(xué)習(xí)資源中迷失方向,為學(xué)習(xí)者營(yíng)造個(gè)性化的學(xué)習(xí)環(huán)境,使學(xué)習(xí)者實(shí)現(xiàn)個(gè)性化、差異化學(xué)習(xí)。一般地,學(xué)習(xí)路徑規(guī)劃問(wèn)題可以看作是一個(gè)函數(shù)f:U×L×C→S,其中學(xué)習(xí)者特征U、學(xué)習(xí)材料特征L、學(xué)習(xí)者學(xué)習(xí)目標(biāo)C為該函數(shù)的參數(shù)。S表示函數(shù)f依據(jù)輸入?yún)?shù)生成的學(xué)習(xí)路徑。學(xué)習(xí)路徑規(guī)劃方法的一般架構(gòu)如圖2所示。
圖2 學(xué)習(xí)路徑規(guī)劃方法的一般框架Fig.2 General framework of learning path planning method
如1.1節(jié)所述,在學(xué)習(xí)路徑規(guī)劃之前,必須收集學(xué)習(xí)者的學(xué)習(xí)目標(biāo)、學(xué)習(xí)者個(gè)性化參數(shù)以及學(xué)習(xí)材料的描述信息等相關(guān)要素[4]。學(xué)習(xí)者特征U和學(xué)習(xí)材料特征L是學(xué)習(xí)路徑規(guī)劃問(wèn)題的核心要素,這些參數(shù)描述了學(xué)習(xí)者與學(xué)習(xí)材料的特征,是學(xué)習(xí)路徑規(guī)劃方法中的重要組成部分。下面對(duì)這些參數(shù)進(jìn)行介紹。
1.2.1 學(xué)習(xí)者特征參數(shù)
學(xué)習(xí)路徑規(guī)劃以學(xué)習(xí)者為核心開(kāi)展研究[5],因此,如何定義學(xué)習(xí)者特征是學(xué)習(xí)路徑規(guī)劃方法中需要研究的重要問(wèn)題。
學(xué)習(xí)者特征參數(shù)可以分為學(xué)習(xí)者固有參數(shù)和學(xué)習(xí)者外部參數(shù)兩大類別。學(xué)習(xí)者固有參數(shù)是用來(lái)表征一個(gè)學(xué)習(xí)者的獨(dú)特屬性,與學(xué)習(xí)者之外的其他因素?zé)o關(guān)。學(xué)習(xí)者外部參數(shù)是指與學(xué)習(xí)者所處學(xué)習(xí)環(huán)境或者與知識(shí)領(lǐng)域相關(guān)的學(xué)習(xí)者的外在特征。學(xué)習(xí)者固有參數(shù)和學(xué)習(xí)者外部參數(shù)及其描述如表1所示。
表1 學(xué)習(xí)者特征參數(shù)Table 1 Learner characteristic parameters
1.2.2 學(xué)習(xí)材料特征參數(shù)
學(xué)習(xí)材料是學(xué)習(xí)內(nèi)容的最小單元,在一些文獻(xiàn)中,學(xué)習(xí)材料又稱為學(xué)習(xí)對(duì)象、知識(shí)單元或?qū)W習(xí)資源。在學(xué)習(xí)路徑規(guī)劃過(guò)程中,對(duì)學(xué)習(xí)材料進(jìn)行正確分類與建模是需要考慮的重要問(wèn)題。學(xué)習(xí)材料特征參數(shù)及其描述如表2所示。
表2 學(xué)習(xí)材料模型參數(shù)Table 2 Learning material model parameters
給定學(xué)習(xí)材料集合,學(xué)習(xí)路徑規(guī)劃方法的主要任務(wù)是根據(jù)學(xué)習(xí)者的學(xué)習(xí)目標(biāo)和學(xué)習(xí)偏好等特征,自動(dòng)生成滿足學(xué)習(xí)者個(gè)性化需求的學(xué)習(xí)路徑。
為解決學(xué)習(xí)路徑規(guī)劃問(wèn)題,學(xué)術(shù)研究領(lǐng)域出現(xiàn)了多種方法。根據(jù)使用算法的不同,可將學(xué)習(xí)路徑規(guī)劃方法劃分為基于進(jìn)化算法的學(xué)習(xí)路徑規(guī)劃、基于數(shù)據(jù)挖掘的學(xué)習(xí)路徑規(guī)劃、基于圖的學(xué)習(xí)路徑規(guī)劃、基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)路徑規(guī)劃[6]。在工業(yè)領(lǐng)域,基于學(xué)習(xí)路徑規(guī)劃方法的電子教學(xué)平臺(tái)蓬勃發(fā)展。本節(jié)將分別介紹各個(gè)類別的學(xué)習(xí)路徑規(guī)劃算法,并對(duì)其優(yōu)缺點(diǎn)進(jìn)行分析。
根據(jù)學(xué)習(xí)者學(xué)習(xí)目標(biāo)、學(xué)習(xí)偏好等特征,從學(xué)習(xí)材料庫(kù)中篩選并生成合理的學(xué)習(xí)材料序列可以抽象為一個(gè)組合與排序問(wèn)題。由于學(xué)習(xí)材料的爆炸式增長(zhǎng),這個(gè)組合排序問(wèn)題落在NP-hard問(wèn)題范圍內(nèi)。進(jìn)化算法是NP-hard問(wèn)題的經(jīng)典解法。進(jìn)化算法是一個(gè)“算法簇”,它們產(chǎn)生的靈感都來(lái)自大自然的生物進(jìn)化。在學(xué)習(xí)路徑規(guī)劃方法研究的早期,很多研究者使用進(jìn)化算法來(lái)解決學(xué)習(xí)路徑規(guī)劃問(wèn)題,其中,最廣泛使用的進(jìn)化算法包括蟻群優(yōu)化算法[7-14]、遺傳算法[6,15-19]、粒子群優(yōu)化算法[20-22]等。
2.1.1 基于蟻群優(yōu)化算法的學(xué)習(xí)路徑規(guī)劃方法
蟻群優(yōu)化算法是求解組合優(yōu)化問(wèn)題的一種元啟發(fā)式算法。蟻群優(yōu)化算法已被成功應(yīng)用于解決很多難度較大的優(yōu)化問(wèn)題,這是研究人員將蟻群優(yōu)化算法應(yīng)用于學(xué)習(xí)路徑規(guī)劃問(wèn)題的主要原因。
隨著學(xué)習(xí)進(jìn)程的推進(jìn),學(xué)習(xí)者的學(xué)習(xí)能力、知識(shí)儲(chǔ)備等特征也在不斷變化,蟻群優(yōu)化算法具有較強(qiáng)的魯棒性和自適應(yīng)性,能夠較好地適應(yīng)學(xué)習(xí)者特征的變化,因此蟻群優(yōu)化算法在學(xué)習(xí)路徑規(guī)劃中能取得較好的效果。蟻群優(yōu)化算法也存在其固有的弊端,例如,在使用蟻群優(yōu)化算法求解過(guò)程中,大量的學(xué)習(xí)材料很難組織成一個(gè)有效的螞蟻覓食圖,并且當(dāng)路徑規(guī)劃過(guò)程中存在大量約束條件時(shí),算法不能對(duì)這些約束條件進(jìn)行準(zhǔn)確表示,蟻群優(yōu)化算法無(wú)法適應(yīng)學(xué)習(xí)材料激增的局面。
2.1.2 基于遺傳算法的學(xué)習(xí)路徑規(guī)劃方法
遺傳算法是在達(dá)爾文進(jìn)化論的啟發(fā)下提出的一種搜索技術(shù)。在遺傳算法中,通過(guò)3個(gè)步驟進(jìn)化出一個(gè)候選解群體:1)選擇最優(yōu)的個(gè)體作為親本;2)通過(guò)重組親本和突變產(chǎn)生新的個(gè)體;3)將新的個(gè)體插入到種群中。在搜索解的過(guò)程中,通常采用替換策略來(lái)保持種群大小不變,并使用適度函數(shù)對(duì)候選解進(jìn)行評(píng)估。
Seki等[6]使用學(xué)習(xí)材料難度、學(xué)習(xí)材料之間的關(guān)系構(gòu)建適應(yīng)度函數(shù),并基于分布式遺傳算法生成最優(yōu)學(xué)習(xí)路徑。Samia和Mostafa[17]同時(shí)考慮了學(xué)習(xí)者的個(gè)性化特點(diǎn)與學(xué)習(xí)目標(biāo),使用遺傳算法生成學(xué)習(xí)路徑。Hovakimyan等[19]以達(dá)到教學(xué)目標(biāo)所需要的時(shí)間最小化為目標(biāo),使用遺傳算法為學(xué)習(xí)者尋找最優(yōu)學(xué)習(xí)序列。Dwivedi等[30]開(kāi)發(fā)了基于變長(zhǎng)遺傳算法的個(gè)性化學(xué)習(xí)路徑推薦框架。檀曉紅[31]提出基于遺傳算法的個(gè)性化課程推薦模型。呂琳和韓永國(guó)[32]設(shè)計(jì)了個(gè)性化學(xué)習(xí)路徑規(guī)劃系統(tǒng),該系統(tǒng)首先通過(guò)前測(cè)獲取學(xué)習(xí)者當(dāng)前的知識(shí)水平,然后系統(tǒng)將學(xué)習(xí)者的知識(shí)水平和系統(tǒng)中課件的難度水平進(jìn)行匹配,同時(shí)考慮課件之間的相關(guān)關(guān)系,使用遺傳算法為學(xué)習(xí)者生成最佳學(xué)習(xí)路徑。Salehi等[33]提出“顯式屬性”推薦模塊與“隱式屬性”推薦模塊相混合的推薦方法,并使用遺傳算法進(jìn)行優(yōu)化求解。Wu等[34]基于對(duì)學(xué)習(xí)者掌握知識(shí)程度的評(píng)估,通過(guò)動(dòng)態(tài)編程和遺傳算法為學(xué)習(xí)者生成難度適宜的試卷。Lumbardh和Krenare[35]提出一種新的遺傳算法混合方法,該方法能夠根據(jù)課程難度級(jí)別、持續(xù)時(shí)間、評(píng)分和學(xué)習(xí)對(duì)象之間的關(guān)系程度尋找和生成個(gè)性化的學(xué)習(xí)軌跡。
一些與遺傳算法相似的算法也被應(yīng)用到學(xué)習(xí)路徑規(guī)劃領(lǐng)域。Memetic算法采用與遺傳算法相似的框架和操作流程,并在此基礎(chǔ)上通過(guò)局部鄰域搜索使每個(gè)演化代的所有個(gè)體都達(dá)到局部最優(yōu)。文獻(xiàn)[1]提出一種基于改進(jìn)的Memetic算法的學(xué)習(xí)路徑規(guī)劃算法,并以計(jì)算機(jī)網(wǎng)絡(luò)課程為例進(jìn)行了實(shí)驗(yàn)驗(yàn)證。輪盤(pán)賭算法是一種沒(méi)有交叉算子的遺傳算法的簡(jiǎn)化算法。Ballera等[36]提出了基于輪盤(pán)賭算法的學(xué)習(xí)路徑規(guī)劃方法。
遺傳算法具有易于實(shí)現(xiàn)的優(yōu)點(diǎn),對(duì)解決學(xué)習(xí)路徑規(guī)劃問(wèn)題是有效的。然而,遺傳算法面臨著參數(shù)設(shè)置和算子選擇的問(wèn)題。例如,當(dāng)交叉、變異、重組等參數(shù)設(shè)置不合理時(shí),會(huì)導(dǎo)致進(jìn)化過(guò)程出現(xiàn)不確定性,甚至失控。
因此,只有隨著認(rèn)識(shí)和實(shí)踐的不斷進(jìn)步,充分估計(jì)前進(jìn)道路上的困難和曲折,正確認(rèn)識(shí)當(dāng)前甚至今后一個(gè)時(shí)期高效節(jié)水灌溉發(fā)展的進(jìn)展,在辯證唯物主義認(rèn)識(shí)論的指導(dǎo)下,依靠正確的認(rèn)識(shí)論和方法論,才能有力促進(jìn)高效節(jié)水灌溉的發(fā)展。必須站在新的歷史高度,在馬克思辯證唯物主義及其認(rèn)識(shí)論的指導(dǎo)下,依靠新的認(rèn)識(shí)指導(dǎo)新的實(shí)踐,通過(guò)實(shí)踐認(rèn)識(shí)再實(shí)踐再認(rèn)識(shí)過(guò)程不斷開(kāi)拓進(jìn)取,充分認(rèn)識(shí)發(fā)展高效節(jié)水灌溉的艱巨性,增強(qiáng)發(fā)展高效節(jié)水灌溉的自覺(jué)性、支撐力和自信心,創(chuàng)造條件,因地制宜加快推進(jìn)高效節(jié)水灌溉的健康發(fā)展。
2.1.3 基于粒子群優(yōu)化算法的學(xué)習(xí)路徑規(guī)劃方法
粒子群優(yōu)化算法的靈感來(lái)源于鳥(niǎo)群和魚(yú)群的社會(huì)行為。一個(gè)粒子代表一個(gè)候選解決方案,每個(gè)粒子都保存著關(guān)于其目前達(dá)到的最佳位置的信息,而群則記錄著全局最佳解決方案。
Gao等[37]構(gòu)建了一個(gè)基于多目標(biāo)粒子群算法的學(xué)習(xí)路徑規(guī)劃模型,并將構(gòu)建的模型用于真實(shí)的學(xué)習(xí)系統(tǒng)中,為用戶提供個(gè)性化的學(xué)習(xí)路徑。陳其暉等[38]基于知識(shí)空間理論建立學(xué)習(xí)狀態(tài)空間,引入交換子和交換序的概念對(duì)粒子群算法進(jìn)行改進(jìn),通過(guò)改進(jìn)的粒子群算法對(duì)學(xué)習(xí)狀態(tài)空間中的學(xué)習(xí)路徑進(jìn)行最優(yōu)化控制,并利用死亡懲罰函數(shù)把約束最優(yōu)化學(xué)習(xí)路徑問(wèn)題,轉(zhuǎn)化成無(wú)約束的最優(yōu)化學(xué)習(xí)路徑控制問(wèn)題。吳雷和方卿[39]提出一種改進(jìn)粒子群算法解決在線學(xué)習(xí)系統(tǒng)中的學(xué)習(xí)路徑優(yōu)化問(wèn)題。系統(tǒng)在尋找最優(yōu)學(xué)習(xí)路徑時(shí),采用局部鄰域搜索與禁忌搜索相結(jié)合的方式,從而改進(jìn)了標(biāo)準(zhǔn)粒子群算法的尋優(yōu)性能。李浩君等[40]提出基于多維信息特征映射模型的在線學(xué)習(xí)路徑規(guī)劃算法,使用雙映射二進(jìn)制粒子群優(yōu)化算法對(duì)學(xué)習(xí)路徑規(guī)劃算法進(jìn)行優(yōu)化求解。
粒子群優(yōu)化算法具有參數(shù)較少的特點(diǎn),能夠較好地解決復(fù)雜度高的問(wèn)題,目前已被廣泛應(yīng)用于學(xué)習(xí)路徑規(guī)劃算法中。然而,與遺傳算法相比,粒子群算法容易陷入局部最優(yōu),并且缺乏有效的收斂分析方法。
2.1.4 其他算法
除蟻群優(yōu)化算法、遺傳算法、粒子群算法外,研究人員還使用了DNA計(jì)算、和聲搜索算法、免疫算法、蛙跳算法等來(lái)解決學(xué)習(xí)路徑規(guī)劃問(wèn)題。Debbah和Ben[41]使用DNA計(jì)算解決學(xué)習(xí)路徑規(guī)劃問(wèn)題,DNA計(jì)算可以進(jìn)行大規(guī)模的并行搜索,具有較高的計(jì)算效率。Hnida等[42]提出基于和聲搜索算法的學(xué)習(xí)路徑規(guī)劃方法。Wan和Niu[43]提出基于免疫算法的學(xué)習(xí)路徑規(guī)劃方法,該方法利用抗體適應(yīng)度和濃度移動(dòng)候選解方案,同時(shí)使用2種局部搜索算法提高算法的性能。Gomez-Gonzalez和Jurado[44]提出一種二值混疊蛙跳算法向?qū)W習(xí)者推薦合適的課程學(xué)習(xí)方案,通過(guò)比較實(shí)驗(yàn)的方法證明了基于二值混疊蛙跳算法的學(xué)習(xí)路徑規(guī)劃方法要優(yōu)于部分基于遺傳算法和粒子群算法的學(xué)習(xí)路徑規(guī)劃方法。Wan和Lyu[45]提出基于種群增量學(xué)習(xí)的學(xué)習(xí)路徑規(guī)劃方法,并證明該方法在運(yùn)行時(shí)間上要優(yōu)于基于遺傳算法的學(xué)習(xí)路徑規(guī)劃方法。
隨著數(shù)據(jù)挖掘技術(shù)在商品推薦等領(lǐng)域取得成功應(yīng)用,該技術(shù)逐漸被研究人員應(yīng)用于解決學(xué)習(xí)路徑規(guī)劃問(wèn)題。基于數(shù)據(jù)挖掘的學(xué)習(xí)路徑規(guī)劃方法[46-50]的主要思路是,以學(xué)習(xí)者的歷史學(xué)習(xí)數(shù)據(jù)為基礎(chǔ),通過(guò)挖掘?qū)W習(xí)者學(xué)習(xí)過(guò)程的相關(guān)信息,為后續(xù)的學(xué)習(xí)材料推薦提供決策支持,生成滿足學(xué)習(xí)者個(gè)性化需求的學(xué)習(xí)路徑。常用的數(shù)據(jù)挖掘算法包括聚類、頻繁模式挖掘、協(xié)同過(guò)濾等。
在真實(shí)的教育場(chǎng)景中,相似的學(xué)習(xí)者具有相似的學(xué)習(xí)行為、相似的學(xué)習(xí)路徑?;诖?Chen[3]構(gòu)建了一個(gè)個(gè)性化在線學(xué)習(xí)系統(tǒng),通過(guò)挖掘個(gè)體學(xué)習(xí)者在前測(cè)階段和學(xué)習(xí)過(guò)程中的行為數(shù)據(jù),為學(xué)習(xí)者推薦合適的學(xué)習(xí)路徑。Kla?nja等[51]構(gòu)建了編程教學(xué)系統(tǒng)Protus的一個(gè)推薦模塊,該模塊可以自動(dòng)適應(yīng)學(xué)習(xí)者的學(xué)習(xí)興趣和知識(shí)水平并生成學(xué)習(xí)路徑。首先,該系統(tǒng)根據(jù)學(xué)習(xí)風(fēng)格對(duì)學(xué)習(xí)者進(jìn)行聚類處理;然后,利用Apriori All算法挖掘頻繁序列,分析學(xué)習(xí)者的學(xué)習(xí)習(xí)慣和興趣;最后,根據(jù)Protus系統(tǒng)提供的這些頻繁序列的評(píng)級(jí),完成學(xué)習(xí)內(nèi)容的個(gè)性化推薦。Hsieh和Wang[52]開(kāi)發(fā)了基于網(wǎng)絡(luò)的在線學(xué)習(xí)系統(tǒng),系統(tǒng)首先使用基于Apriori算法的數(shù)據(jù)挖掘方法發(fā)現(xiàn)一些候選課程;然后基于形式概念分析的學(xué)習(xí)路徑構(gòu)建方法,使用從一些選定文檔中提取的關(guān)鍵字構(gòu)建概念格,以形成由關(guān)鍵字表示的所有概念的關(guān)系層次;接著計(jì)算文檔之間的相互關(guān)系,以決定合適的學(xué)習(xí)路徑。Hsu[53]、Chen等[54]基于學(xué)習(xí)者的閱讀行為和閱讀能力,向?qū)W習(xí)者推薦合適的學(xué)習(xí)材料。對(duì)于公司的業(yè)務(wù),通常需要一群人來(lái)完成特定的任務(wù)。但是,小組成員不具備與任務(wù)相關(guān)的同等水平的先驗(yàn)知識(shí),因此,對(duì)于在協(xié)作商業(yè)環(huán)境下工作的員工來(lái)說(shuō),發(fā)現(xiàn)一條群體化的學(xué)習(xí)路徑是非常重要和必要的。針對(duì)這個(gè)問(wèn)題,Feng等[55-56]提出一種基于角色的學(xué)習(xí)路徑發(fā)現(xiàn)算法,使一組員工能夠更高效地掌握與某項(xiàng)業(yè)務(wù)任務(wù)相關(guān)的新知識(shí)。Liu等[57]通過(guò)探索學(xué)生在線學(xué)習(xí)過(guò)程的大數(shù)據(jù),構(gòu)建了一個(gè)在線學(xué)習(xí)路徑模型,該模型根據(jù)學(xué)生的學(xué)習(xí)習(xí)慣,為普通學(xué)生推薦個(gè)性化、相似度高的優(yōu)秀學(xué)習(xí)路徑。Ge等[58]在課件推薦模塊中提出一種將內(nèi)容過(guò)濾和協(xié)同過(guò)濾相結(jié)合的算法,該算法能夠根據(jù)學(xué)習(xí)者的學(xué)習(xí)興趣,為學(xué)習(xí)者生成個(gè)性化的學(xué)習(xí)路徑。Salehi等[59]提出一種基于順序模式挖掘和多維屬性協(xié)同過(guò)濾的學(xué)習(xí)材料推薦系統(tǒng)框架。Fu等[60]提出一種基于二部社區(qū)的協(xié)同過(guò)濾方法,以提高學(xué)習(xí)材料推薦的準(zhǔn)確性和多樣性。AI-Hassan等[61]將基于本體推理的語(yǔ)義相似度和基于項(xiàng)目的協(xié)同過(guò)濾相結(jié)合,提出一種基于混合語(yǔ)義增強(qiáng)的學(xué)習(xí)路徑規(guī)劃方法。Xu等[62]利用社交標(biāo)簽構(gòu)建用戶檔案,用于尋找相似的學(xué)習(xí)者,然后利用貝葉斯公式預(yù)測(cè)大多數(shù)相似學(xué)習(xí)者下一步要學(xué)習(xí)的學(xué)習(xí)材料的概率。針對(duì)團(tuán)隊(duì)學(xué)習(xí)問(wèn)題,Xie等[63]通過(guò)考慮各種與學(xué)習(xí)相關(guān)的因素,提出一種基于輪廓的小組學(xué)習(xí)路徑發(fā)現(xiàn)框架。Li等[64]將基于項(xiàng)目的協(xié)同過(guò)濾和貝葉斯個(gè)性化排名進(jìn)行結(jié)合,用于解決課程推薦問(wèn)題。
隨著計(jì)算機(jī)技術(shù)的發(fā)展,強(qiáng)大的數(shù)據(jù)挖掘技術(shù)能夠挖掘數(shù)據(jù)中的相似特征,并能構(gòu)建相應(yīng)的決策規(guī)則和預(yù)測(cè)模型,這些規(guī)則和模型易于在教育數(shù)據(jù)中使用,且成本較低,具有較強(qiáng)的可移植性和可擴(kuò)展性,能夠適應(yīng)更廣泛的學(xué)習(xí)場(chǎng)景。使用基于數(shù)據(jù)挖掘算法的學(xué)習(xí)路徑規(guī)劃方法,學(xué)習(xí)者能夠獲取系統(tǒng)自動(dòng)推薦的個(gè)性化學(xué)習(xí)材料,不再需要自己組織規(guī)劃學(xué)習(xí)內(nèi)容。但是基于數(shù)據(jù)挖掘的學(xué)習(xí)路徑規(guī)劃方法存在諸多缺點(diǎn):一是使用基于數(shù)據(jù)挖掘的學(xué)習(xí)路徑規(guī)劃方法通常需要較大規(guī)模的學(xué)習(xí)過(guò)程數(shù)據(jù)集,通過(guò)挖掘?qū)W習(xí)者與學(xué)習(xí)材料之間的關(guān)聯(lián)關(guān)系生成學(xué)習(xí)路徑,忽略了學(xué)習(xí)材料之間的潛在依賴關(guān)系;二是基于協(xié)同過(guò)濾的方法存在較嚴(yán)重的冷啟動(dòng)問(wèn)題,即不能向新來(lái)的學(xué)習(xí)者推薦合適的內(nèi)容,也無(wú)法將新加入系統(tǒng)的學(xué)習(xí)材料準(zhǔn)確推薦給學(xué)習(xí)者;三是如果系統(tǒng)中的目標(biāo)用戶數(shù)量巨大,存在較大的計(jì)算開(kāi)銷,并且無(wú)法適應(yīng)學(xué)習(xí)者、學(xué)習(xí)材料激增的情況;四是基于數(shù)據(jù)挖掘的學(xué)習(xí)路徑規(guī)劃方法難以讓教育領(lǐng)域的專家學(xué)者信服。
在一條學(xué)習(xí)路徑中,當(dāng)前學(xué)習(xí)資源與下一個(gè)學(xué)習(xí)資源之間存在先修關(guān)系,在現(xiàn)有的學(xué)習(xí)系統(tǒng)中,學(xué)習(xí)材料的特征以及學(xué)習(xí)材料之間的這種依賴關(guān)系由課程教師或?qū)<忆浫?。由于人類固有的偏?jiàn)性,課程教師或?qū)<覍?duì)相關(guān)概念/課程之間關(guān)系的定義可能是不精確的,甚至可能會(huì)忽略或混淆相互矛盾的需求,那么,據(jù)此得到的學(xué)習(xí)路徑可能缺乏合理的邏輯推理[65]。因此,研究者提出,使用圖的形式組織學(xué)習(xí)資源(課程/概念),并對(duì)其進(jìn)行語(yǔ)義分析,提取學(xué)習(xí)資源之間的依賴關(guān)系或約束關(guān)系,進(jìn)而為學(xué)習(xí)者推薦更匹配的學(xué)習(xí)路徑。在學(xué)習(xí)路徑規(guī)劃領(lǐng)域,常用的圖結(jié)構(gòu)包括概念圖、本體和知識(shí)圖譜。
概念圖是一種組織和表示知識(shí)的工具。在概念圖中,概念用圓圈或方框表示,概念間存在的關(guān)系用圓圈或方框之間的連接線表示。認(rèn)知教育心理學(xué)家?jiàn)W蘇貝爾認(rèn)為,在學(xué)習(xí)者的概念結(jié)構(gòu)中,當(dāng)新概念與已有概念相聯(lián)系時(shí),就會(huì)產(chǎn)生學(xué)習(xí)過(guò)程[28]。陳其暉等[66]發(fā)現(xiàn)不同概念之間的先序依賴關(guān)系對(duì)學(xué)習(xí)過(guò)程有重要影響。Liang等[67]發(fā)現(xiàn),概念之間的前提關(guān)系在許多教育應(yīng)用中都發(fā)揮著重要作用,因此,他們研究了如何從課程依賴中恢復(fù)概念間的前提關(guān)系,并提出一個(gè)框架來(lái)解決這個(gè)問(wèn)題。Pan等[68]基于大規(guī)模開(kāi)放網(wǎng)絡(luò)課程,研究如何提取知識(shí)概念之間的潛在前提關(guān)系,并提出一種基于表示學(xué)習(xí)的課程概念的表示學(xué)習(xí)方法,嘗試?yán)貌煌卣鞑蹲礁拍钪g的先決關(guān)系。Pan等[69]提出一種基于圖的傳播算法,根據(jù)課程概念的學(xué)習(xí)表示對(duì)概念進(jìn)行排序。Liu等[70]將不同的在線課程映射到一個(gè)通用的概念空間,并預(yù)測(cè)概念和課程之間潛在的依賴關(guān)系。Chu等[71]構(gòu)建了一個(gè)基于概念圖的電子學(xué)習(xí)系統(tǒng),該系統(tǒng)根據(jù)知識(shí)元素之間的依賴關(guān)系構(gòu)建概念圖,并根據(jù)概念圖中的關(guān)系生成學(xué)習(xí)路徑。Leung和Li[72]通過(guò)動(dòng)態(tài)概念網(wǎng)絡(luò)機(jī)制,捕捉課程之間的關(guān)系以促進(jìn)學(xué)習(xí)路徑的動(dòng)態(tài)生成。同時(shí),為滿足不同學(xué)習(xí)者的個(gè)性化需求,構(gòu)建了一個(gè)智能知識(shí)庫(kù),幫助了解學(xué)生的個(gè)性化行為,從而為不同的學(xué)習(xí)群體呈現(xiàn)個(gè)性化的結(jié)果。Hung和Hung[73]使用模糊關(guān)聯(lián)規(guī)則挖掘方法找出概念與概念之間的所有先決關(guān)系,并構(gòu)建概念圖,基于此提出自適應(yīng)教學(xué)模型,向?qū)W習(xí)者推薦合適的學(xué)習(xí)材料。Steiner和Albert[74]概述了使用概念圖推導(dǎo)學(xué)習(xí)材料之間的前提關(guān)系和組織結(jié)構(gòu)的方法,這些關(guān)系和結(jié)構(gòu)可以作為個(gè)性化學(xué)習(xí)規(guī)劃的基礎(chǔ)。
概念圖能夠使概念之間的關(guān)系更具組織性和適應(yīng)性,基于概念圖生成的學(xué)習(xí)路徑能夠呈現(xiàn)出合理的概念學(xué)習(xí)順序?;诟拍顖D的學(xué)習(xí)路徑規(guī)劃方法雖然考慮了學(xué)習(xí)材料之間的潛在依賴關(guān)系,但是學(xué)習(xí)材料之間的關(guān)系/依賴關(guān)系的具體分類仍然缺乏考慮,忽略了知識(shí)單元之間的認(rèn)知關(guān)系對(duì)學(xué)習(xí)者學(xué)習(xí)過(guò)程的影響,這對(duì)于有效組織在線學(xué)習(xí)者的學(xué)習(xí)內(nèi)容至關(guān)重要[75]。因此,研究者提出了使用知識(shí)圖譜和本體組織學(xué)習(xí)材料。
Shi等[75]提出一種基于多維知識(shí)圖框架的學(xué)習(xí)路徑推薦模型。首先設(shè)計(jì)一個(gè)多維知識(shí)圖框架來(lái)表示和存儲(chǔ)不同的學(xué)習(xí)對(duì)象,然后基于多維知識(shí)圖框架設(shè)計(jì)了滿足不同學(xué)習(xí)需求的學(xué)習(xí)路徑推薦模型,從而改善網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)體驗(yàn)。Shmelev等[76]將學(xué)習(xí)者模型與學(xué)習(xí)材料的領(lǐng)域知識(shí)本體庫(kù)進(jìn)行匹配結(jié)合,通過(guò)語(yǔ)義推薦算法實(shí)現(xiàn)學(xué)習(xí)路徑的個(gè)性化推薦。Snae和Brückner[77]提出本體驅(qū)動(dòng)的泰語(yǔ)學(xué)習(xí)系統(tǒng)(O-DEST),該系統(tǒng)用本體建立學(xué)習(xí)內(nèi)容的領(lǐng)域模型,并根據(jù)學(xué)習(xí)者的學(xué)習(xí)風(fēng)格為學(xué)生規(guī)劃生成合適的學(xué)習(xí)路徑。Balik和Jelinek[78]提出一個(gè)使用語(yǔ)義表示和本體的自適應(yīng)在線學(xué)習(xí)系統(tǒng)模型,該模型包括2種本體:一種是用于為學(xué)習(xí)者構(gòu)建個(gè)性化學(xué)習(xí)對(duì)象的課程材料本體;另一種是用于評(píng)估學(xué)習(xí)者學(xué)習(xí)進(jìn)度的本體,包括作業(yè)分?jǐn)?shù)、考試分?jǐn)?shù)和出勤率。Wang等[79]發(fā)現(xiàn),學(xué)習(xí)系統(tǒng)中學(xué)習(xí)對(duì)象數(shù)量龐大,學(xué)習(xí)者在選擇合適的學(xué)習(xí)對(duì)象時(shí),可能會(huì)迷失方向。因此,使用本體來(lái)增強(qiáng)在線學(xué)習(xí)系統(tǒng)的推薦功能,使其更容易、更有效地為學(xué)習(xí)者推薦合適的學(xué)習(xí)對(duì)象。Min等[80]提出一種使用本體和推理機(jī)制的自適應(yīng)個(gè)性化在線學(xué)習(xí)系統(tǒng),該系統(tǒng)可以根據(jù)學(xué)習(xí)者不同的學(xué)習(xí)目標(biāo),為其提供合適的學(xué)習(xí)路徑。Pandit[81]實(shí)現(xiàn)了一個(gè)基于本體技術(shù)的在線電子學(xué)習(xí)系統(tǒng),該系統(tǒng)通過(guò)本體來(lái)介紹和描述學(xué)習(xí)材料的結(jié)構(gòu)、內(nèi)容和上下文信息。Ouf等[82]提出基于知識(shí)圖譜的智能在線學(xué)習(xí)生態(tài)系統(tǒng)框架。Wei等[83]開(kāi)發(fā)了一種基于知識(shí)圖譜的個(gè)性化課件推薦系統(tǒng),為同一組學(xué)習(xí)者提供相同的課件樹(shù),以提高學(xué)習(xí)者的學(xué)習(xí)效率。針對(duì)自動(dòng)化專業(yè)知識(shí)的學(xué)習(xí),劉萌等[84]提出基于知識(shí)點(diǎn)網(wǎng)絡(luò)的學(xué)習(xí)路徑推薦方法。該方法首先依據(jù)知識(shí)點(diǎn)以及知識(shí)點(diǎn)之間的關(guān)聯(lián)關(guān)系構(gòu)建有向知識(shí)點(diǎn)網(wǎng)絡(luò),并用鄰接矩陣存儲(chǔ)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)信息;然后基于學(xué)習(xí)者的目標(biāo)知識(shí),通過(guò)可達(dá)矩陣與并行拓?fù)渑判蛩惴▽?shí)現(xiàn)學(xué)習(xí)路徑的提取與優(yōu)化,保證學(xué)習(xí)者“按需所取”知識(shí)點(diǎn);最后針對(duì)選取的目標(biāo)知識(shí)點(diǎn)推薦學(xué)習(xí)路徑。Zhu等[85]考慮到學(xué)習(xí)者在不同的場(chǎng)景中需要不同的學(xué)習(xí)路徑,提出基于知識(shí)圖譜的多約束學(xué)習(xí)路徑推薦算法,該算法根據(jù)學(xué)習(xí)者的先驗(yàn)知識(shí)、學(xué)習(xí)目標(biāo)以及預(yù)設(shè)的學(xué)習(xí)場(chǎng)景,為學(xué)習(xí)者規(guī)劃生成合適的學(xué)習(xí)路徑。
基于圖結(jié)構(gòu)的學(xué)習(xí)路徑規(guī)劃方法具有下列優(yōu)點(diǎn):一是知識(shí)圖譜能以精確的方式表達(dá)知識(shí),可以明確地對(duì)概念、概念的屬性及其之間的關(guān)系進(jìn)行定義,避免學(xué)習(xí)材料描述中的歧義現(xiàn)象;二是根據(jù)不同學(xué)習(xí)者的需求和偏好,使用知識(shí)圖譜能夠進(jìn)行更多細(xì)節(jié)方面的檢索,這反過(guò)來(lái)可以為學(xué)習(xí)者提供更精確的內(nèi)容推薦。因此,知識(shí)圖譜能使學(xué)習(xí)過(guò)程更具個(gè)性化,提高學(xué)習(xí)者在線學(xué)習(xí)的效率;三是使用本體可以構(gòu)建多個(gè)學(xué)習(xí)對(duì)象之間的關(guān)聯(lián)關(guān)系,很好地解決冷啟動(dòng)問(wèn)題;四是知識(shí)圖譜、本體等圖數(shù)據(jù)結(jié)構(gòu)具有可重用性、可推理和支持推薦的機(jī)制,這些機(jī)制有助于更精確地向?qū)W習(xí)者推薦學(xué)習(xí)內(nèi)容?;趫D結(jié)構(gòu)的學(xué)習(xí)路徑規(guī)劃也存在一定的缺點(diǎn),圖結(jié)構(gòu)的設(shè)計(jì)和維護(hù)需要較強(qiáng)專業(yè)知識(shí)的支撐,并且圖數(shù)據(jù)的構(gòu)建具有一定的挑戰(zhàn)性、花費(fèi)昂貴且比較耗時(shí)。
神經(jīng)網(wǎng)絡(luò)是由大量交織在一起的神經(jīng)元或部件組成的,它們協(xié)同工作來(lái)處理信息并解決問(wèn)題。神經(jīng)網(wǎng)絡(luò)是一個(gè)可以接收信息并分析處理信息的系統(tǒng),并能產(chǎn)生比其他信息處理范式復(fù)雜得多的結(jié)果,因此成為模擬人類行為的一種非常有影響力的手段。研究表明,使用基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能技術(shù)進(jìn)行學(xué)習(xí)路徑規(guī)劃與課程推薦,是將人工智能技術(shù)集成到在線學(xué)習(xí)系統(tǒng)中的一個(gè)潛在發(fā)展方向[86]。人工智能技術(shù)具有開(kāi)發(fā)和模仿人類推理和決策過(guò)程的能力,并且具有最大限度地減少人類決策過(guò)程中的不確定性的能力。因此,這類方法逐漸得到研究人員的青睞。
在教育領(lǐng)域,機(jī)器學(xué)習(xí)技術(shù)可以模擬并跟蹤學(xué)習(xí)者認(rèn)知能力的變化過(guò)程,從而為學(xué)習(xí)者推薦合適的學(xué)習(xí)材料。例如,Hussain等[87]使用支持向量機(jī)、邏輯回歸、樸素貝葉斯分類器等機(jī)器學(xué)習(xí)算法,評(píng)估學(xué)生目前所具備的能力,并預(yù)測(cè)后續(xù)學(xué)習(xí)內(nèi)容對(duì)學(xué)習(xí)者當(dāng)前狀況的難易程度,輔助教師及時(shí)調(diào)整教學(xué)內(nèi)容。
循環(huán)神經(jīng)網(wǎng)絡(luò)是一種專門處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),其通過(guò)添加指向自身的回路,使得神經(jīng)網(wǎng)絡(luò)能夠捕獲并記憶輸入數(shù)據(jù)中的序列變化信息,并且,循環(huán)神經(jīng)網(wǎng)絡(luò)可以處理任意變長(zhǎng)的序列數(shù)據(jù)。學(xué)習(xí)者的學(xué)習(xí)路徑可以視為一個(gè)時(shí)間序列數(shù)據(jù),且不同學(xué)習(xí)者的學(xué)習(xí)路徑長(zhǎng)度可能存在較大差異,因此,可以使用循環(huán)神經(jīng)網(wǎng)絡(luò)來(lái)建模學(xué)習(xí)路徑規(guī)劃問(wèn)題。
Saito和Watanobe[88]以一個(gè)在線編程系統(tǒng)——AOJ系統(tǒng)為研究對(duì)象,提出使用學(xué)習(xí)者能力圖構(gòu)建學(xué)習(xí)路徑推薦系統(tǒng)的方法,并基于循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了該系統(tǒng)。學(xué)習(xí)者能力圖能夠直觀反映學(xué)習(xí)者在各個(gè)方面具備的能力分?jǐn)?shù)和期望達(dá)到的目標(biāo)分?jǐn)?shù)。隨著學(xué)習(xí)過(guò)程的推進(jìn),學(xué)習(xí)者能力圖在不斷變化,以跟蹤學(xué)習(xí)者的能力變化。在實(shí)驗(yàn)過(guò)程中,基于學(xué)習(xí)者能力圖構(gòu)建學(xué)習(xí)者特征向量,根據(jù)學(xué)習(xí)者在編程系統(tǒng)中的歷史提交順序,使用循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)下一個(gè)適合幫助學(xué)習(xí)者實(shí)現(xiàn)目標(biāo)的學(xué)習(xí)內(nèi)容,并保證推薦的下一個(gè)問(wèn)題能適應(yīng)學(xué)習(xí)者當(dāng)前的能力。
卷積神經(jīng)網(wǎng)絡(luò)的中心思想是捕捉局部特征,其最初在圖像領(lǐng)域取得了巨大成功,隨后在文本領(lǐng)域也得到了廣泛應(yīng)用。對(duì)于文本來(lái)說(shuō),局部特征就是由若干單詞組成的滑動(dòng)窗口。卷積神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)對(duì)不同滑動(dòng)窗口中的特征進(jìn)行組合和篩選,從而獲得不同抽象層次的語(yǔ)義信息。注意力機(jī)制源于對(duì)人類視覺(jué)的研究,為了合理地利用有限的視覺(jué)信息處理資源,需要選擇視覺(jué)區(qū)域中的特定部分,然后重點(diǎn)關(guān)注它。將注意力機(jī)制融入卷積神經(jīng)網(wǎng)絡(luò),可以增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)的性能,使其可以重點(diǎn)關(guān)注重要特征并抑制不必要的特征。
Wang等[89]提出基于注意力卷積神經(jīng)網(wǎng)絡(luò)的個(gè)性化學(xué)習(xí)材料推薦方法。該神經(jīng)網(wǎng)絡(luò)的輸入包括學(xué)習(xí)者上下文信息、課程上下文信息以及學(xué)習(xí)者學(xué)習(xí)活動(dòng)信息3部分,該神經(jīng)網(wǎng)絡(luò)的輸出是預(yù)測(cè)學(xué)習(xí)者在一門課程中的考試分?jǐn)?shù)。通過(guò)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)分?jǐn)?shù)與學(xué)習(xí)者真實(shí)考試分?jǐn)?shù)之間的差異來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。其中,學(xué)習(xí)者上下文信息包括學(xué)習(xí)者的性別、年齡、專業(yè)、課程注冊(cè)信息、課程點(diǎn)擊信息等內(nèi)容;課程上下文信息包括課程類型、授課教師、課程目標(biāo)、課程時(shí)長(zhǎng)等內(nèi)容;學(xué)習(xí)者學(xué)習(xí)活動(dòng)信息包括學(xué)習(xí)者的學(xué)習(xí)偏好、學(xué)習(xí)者暫停學(xué)習(xí)次數(shù)、學(xué)習(xí)者學(xué)習(xí)次數(shù)等內(nèi)容。作者先用獨(dú)熱向量對(duì)這3部分內(nèi)容分別進(jìn)行編碼;然后使用注意力卷積層和全連接層級(jí)聯(lián)的神經(jīng)網(wǎng)絡(luò)提取學(xué)習(xí)者特征、課程特征、學(xué)習(xí)活動(dòng)特征,以及它們之間的潛在關(guān)聯(lián)關(guān)系,將這3部分特征編碼到一個(gè)向量中;最后使用編碼得到的特征向量進(jìn)行分?jǐn)?shù)預(yù)測(cè)。訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)可以協(xié)助學(xué)生進(jìn)行課程選擇,為學(xué)生推薦其可能得分最高的top-n課程?;谧⒁饬矸e神經(jīng)網(wǎng)絡(luò)的個(gè)性化學(xué)習(xí)材料推薦系統(tǒng)工作流程如圖3所示。
圖3 基于注意力卷積神經(jīng)網(wǎng)絡(luò)的個(gè)性化學(xué)習(xí)材料推薦系統(tǒng)工作流程Fig.3 Workflow of personalized learning material recommendation system based on attention convolutional neural network
目前,在提取歐式空間數(shù)據(jù)的特征方面,傳統(tǒng)深度學(xué)習(xí)方法(卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等)取得了巨大成功,但是許多實(shí)際應(yīng)用場(chǎng)景中的數(shù)據(jù)是從非歐式空間產(chǎn)生的,傳統(tǒng)的深度學(xué)習(xí)方法在處理這類數(shù)據(jù)時(shí)難以產(chǎn)生令人滿意的結(jié)果。例如,由于圖數(shù)據(jù)中節(jié)點(diǎn)之間固有的不規(guī)則鏈接,使得傳統(tǒng)深度學(xué)習(xí)方法在處理圖數(shù)據(jù)時(shí)面臨著巨大挑戰(zhàn),因此,圖神經(jīng)網(wǎng)絡(luò)應(yīng)運(yùn)而生。圖神經(jīng)網(wǎng)絡(luò)的核心思想是通過(guò)保留圖的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和節(jié)點(diǎn)內(nèi)容信息,將圖中的節(jié)點(diǎn)表示為低維向量,以便進(jìn)行分類、回歸等后續(xù)處理操作。
Wang等[90]提出一種基于圖神經(jīng)網(wǎng)絡(luò)的top-n個(gè)性化課程推薦方法。作者通過(guò)研究指出,學(xué)習(xí)者的學(xué)習(xí)偏好可以分為“一般偏好”和“近期偏好”2種類型?!耙话闫谩庇糜诜从硨W(xué)習(xí)者在學(xué)習(xí)過(guò)程中的長(zhǎng)期偏好和一般靜態(tài)行為,“近期偏好”用于反映隨著學(xué)習(xí)進(jìn)程的推進(jìn)。學(xué)習(xí)者學(xué)習(xí)偏好的變化情況,屬于學(xué)習(xí)者的短期和動(dòng)態(tài)偏好。學(xué)習(xí)路徑規(guī)劃問(wèn)題應(yīng)該同時(shí)考慮學(xué)習(xí)者的一般偏好和近期偏好。為此,作者使用在線學(xué)習(xí)平臺(tái)“學(xué)堂在線”中的真實(shí)數(shù)據(jù),構(gòu)建了“學(xué)習(xí)者-課程”交互圖,并將該交互圖進(jìn)一步分解為“學(xué)習(xí)者-課程”二部圖、“學(xué)習(xí)者-學(xué)習(xí)序列”交互圖和“課程-類別”圖3個(gè)子圖。在這3個(gè)子圖中,運(yùn)用圖神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)提取學(xué)習(xí)者特征與課程特征,使提取的學(xué)習(xí)者特征中同時(shí)包含“一般偏好”和“近期偏好”,提取的課程特征中既包含課程類別特征,也包含與該課程相關(guān)的學(xué)習(xí)者信息。接著,基于學(xué)習(xí)者特征和課程特征,使用注意力機(jī)制與貝葉斯個(gè)性化排序算法,為學(xué)習(xí)者推薦下一步學(xué)習(xí)的合適課程。
Kwasnicka等[91]提出一種基于自組織神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)路徑生成方法,該方法會(huì)基于描述學(xué)生和學(xué)習(xí)材料的元數(shù)據(jù)進(jìn)行推理,為學(xué)習(xí)者生成個(gè)性化的學(xué)習(xí)路徑。Zhang等[92]通過(guò)研究發(fā)現(xiàn),現(xiàn)有的在線學(xué)習(xí)系統(tǒng)不能捕捉學(xué)習(xí)者不同訪問(wèn)會(huì)話間的復(fù)雜關(guān)系,并且不能同時(shí)考慮學(xué)習(xí)者對(duì)當(dāng)前課程興趣偏好的變化?;诖?作者提出一種基于會(huì)話的課程推薦神經(jīng)網(wǎng)絡(luò)框架STR-SA,STR-SA使用自注意力模塊,能夠推薦學(xué)習(xí)者感興趣的學(xué)習(xí)內(nèi)容。Wu等[93]提出一種新穎的練習(xí)題推薦方法,首先利用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)預(yù)測(cè)知識(shí)概念的覆蓋率,然后利用深度知識(shí)追蹤,根據(jù)學(xué)生的練習(xí)答案記錄,預(yù)測(cè)學(xué)生對(duì)知識(shí)概念的掌握程度,預(yù)測(cè)結(jié)果用于過(guò)濾練習(xí)題。由此生成練習(xí)庫(kù)的一個(gè)子集。因此,可以通過(guò)解決優(yōu)化問(wèn)題獲得推薦練習(xí)的完整列表。Antony和Arokia[94]提出一種新的學(xué)習(xí)材料推薦系統(tǒng),該系統(tǒng)將嵌入式特征選擇方法與基于模糊時(shí)態(tài)邏輯的決策樹(shù)卷積神經(jīng)網(wǎng)絡(luò)分類器相結(jié)合,能夠根據(jù)學(xué)習(xí)的理解水平向?qū)W習(xí)者推薦合適的學(xué)習(xí)內(nèi)容。
Choi等[95]指出,現(xiàn)有學(xué)習(xí)路徑規(guī)劃方法存在以下3方面缺陷:1)學(xué)習(xí)路徑規(guī)劃方法的決策機(jī)制對(duì)于學(xué)習(xí)者而言是不透明的,即為何要將一個(gè)特定的學(xué)習(xí)材料推薦給學(xué)習(xí)者,學(xué)習(xí)者幾乎一無(wú)所知,學(xué)習(xí)者對(duì)學(xué)習(xí)材料的選擇的參與度較低;2)學(xué)習(xí)者必須完成當(dāng)前推薦的學(xué)習(xí)材料后,才能獲得下一個(gè)學(xué)習(xí)材料,學(xué)習(xí)者沒(méi)有機(jī)會(huì)對(duì)當(dāng)前的學(xué)習(xí)材料給出及時(shí)反饋;3)系統(tǒng)僅基于學(xué)習(xí)者的歷史學(xué)習(xí)過(guò)程數(shù)據(jù)向?qū)W習(xí)者推薦學(xué)習(xí)材料,并沒(méi)有收集和利用學(xué)習(xí)者對(duì)學(xué)習(xí)材料認(rèn)知方面的數(shù)據(jù)。為此,作者提出一個(gè)名為Rocket的在線學(xué)習(xí)系統(tǒng)界面程序,該界面程序是一個(gè)類似于社交軟件Tinder的學(xué)習(xí)界面,該界面可以顯示使用卷積神經(jīng)網(wǎng)絡(luò)提取的學(xué)習(xí)材料的視覺(jué)特征,使學(xué)習(xí)者能夠快速確定當(dāng)前推薦的學(xué)習(xí)材料是否滿足他們的需求。學(xué)習(xí)者可以通過(guò)向左滑動(dòng)拒絕當(dāng)前推薦并獲取新的推薦,或者可以輕觸界面,開(kāi)啟學(xué)習(xí)。Rocket允許學(xué)習(xí)者自由選擇是否使用系統(tǒng)當(dāng)前推薦的學(xué)習(xí)材料,收集學(xué)習(xí)者對(duì)學(xué)習(xí)材料認(rèn)知方面的反饋,從而為個(gè)性化學(xué)習(xí)路徑的生成提供指導(dǎo)信息。
強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,強(qiáng)調(diào)智能代理如何在不確定和復(fù)雜的環(huán)境中行動(dòng),以取得最大化的預(yù)期利益,實(shí)現(xiàn)特定目標(biāo)。Li等[96]提出基于強(qiáng)化學(xué)習(xí)的最優(yōu)分層學(xué)習(xí)路徑規(guī)劃方法,在該方法中,作者假設(shè),在線學(xué)習(xí)系統(tǒng)中的學(xué)習(xí)材料固定不變,將學(xué)習(xí)路徑規(guī)劃問(wèn)題建模為一個(gè)馬爾科夫決策過(guò)程,其狀態(tài)空間是技能屬性,動(dòng)作空間是系統(tǒng)中所有的學(xué)習(xí)材料。具體而言,在線學(xué)習(xí)系統(tǒng)中不同學(xué)習(xí)材料對(duì)應(yīng)不同的技能,這些技能之間存在先序關(guān)系與依賴關(guān)系,作者使用經(jīng)典認(rèn)知診斷模型評(píng)估每個(gè)學(xué)習(xí)者已經(jīng)掌握的技能和掌握的熟練程度,并為其構(gòu)建技能層次化模型。基于該層次化模型,采用強(qiáng)化學(xué)習(xí)方法,為其推薦下一步需要學(xué)習(xí)的材料。當(dāng)學(xué)習(xí)者完成系統(tǒng)推薦的學(xué)習(xí)材料后,會(huì)將其新獲取的技能反饋給學(xué)習(xí)系統(tǒng),學(xué)習(xí)系統(tǒng)據(jù)此更新學(xué)習(xí)者的技能層次化模型,并為其推薦后續(xù)學(xué)習(xí)材料?;趶?qiáng)化學(xué)習(xí)的最優(yōu)分層學(xué)習(xí)路徑規(guī)劃方法示意圖如圖4所示。
圖4 基于強(qiáng)化學(xué)習(xí)的最優(yōu)分層學(xué)習(xí)路徑規(guī)劃方法示意圖Fig.4 Schematic diagram of optimal hierarchical learning path planning method based on reinforcement learning
El等[97]提出一種基于多智能體和強(qiáng)化學(xué)習(xí)的自適應(yīng)電子學(xué)習(xí)系統(tǒng)。該系統(tǒng)使用Q-learning算法向?qū)W習(xí)者推薦符合其特征和偏好的學(xué)習(xí)路徑。該系統(tǒng)側(cè)重于3個(gè)主要特征,即學(xué)習(xí)風(fēng)格、知識(shí)水平和學(xué)生可能存在的殘疾。考慮到3種類型的殘疾,即聽(tīng)力障礙、視力障礙和閱讀障礙。該系統(tǒng)將能夠?yàn)閷W(xué)生提供與他們的個(gè)人資料相匹配的一系列學(xué)習(xí)對(duì)象,使學(xué)生獲得個(gè)性化的學(xué)習(xí)體驗(yàn)。
基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)路徑規(guī)劃方法可以讓網(wǎng)絡(luò)自動(dòng)學(xué)習(xí)學(xué)習(xí)材料間的依賴關(guān)系,捕捉學(xué)習(xí)者與學(xué)習(xí)材料之間的關(guān)聯(lián)關(guān)系,并構(gòu)建學(xué)習(xí)材料推薦模型。構(gòu)建的模型具有一定的可移植性。但是基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)路徑規(guī)劃方法存在諸多缺點(diǎn):一是訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)模型需要大規(guī)模的學(xué)習(xí)過(guò)程數(shù)據(jù),獲取這些數(shù)據(jù)的成本較高;二是模型可解釋性差。神經(jīng)網(wǎng)絡(luò)具有黑盒特征,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的權(quán)重通常很難被人類解釋,神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果也不具有可解釋性,因此該方法不能被教育領(lǐng)域的專家學(xué)者所信服。此外,在前述的top-n課程推薦方法中,由于在線學(xué)習(xí)系統(tǒng)中課程種類繁多、學(xué)習(xí)資源數(shù)量龐大,向?qū)W習(xí)者推薦的top-n課程可能是學(xué)習(xí)者已經(jīng)學(xué)習(xí)過(guò)的課程(知識(shí))或是已學(xué)習(xí)過(guò)的類似課程(知識(shí))。
在學(xué)習(xí)路徑規(guī)劃領(lǐng)域,尚且缺乏標(biāo)準(zhǔn)的驗(yàn)證數(shù)據(jù)集,研究者常用到的數(shù)據(jù)集包括edX、Coursera、XuetangX等在線課程平臺(tái)提供的數(shù)據(jù)集。此外,多數(shù)研究人員會(huì)使用自組織的數(shù)據(jù)集評(píng)估提出的學(xué)習(xí)路徑規(guī)劃方法,并在論文中提供構(gòu)建數(shù)據(jù)集的相關(guān)信息。研究者常用的數(shù)據(jù)集構(gòu)建方法是將領(lǐng)域知識(shí)組織為具有4層結(jié)構(gòu)的層次化知識(shí)表示模型,即目標(biāo)層、子目標(biāo)層、知識(shí)點(diǎn)層、基本素材層[1],層間關(guān)系及其描述見(jiàn)圖5所示。其中,目標(biāo)層是學(xué)習(xí)者將要學(xué)習(xí)的某門課程或者目標(biāo)知識(shí),每個(gè)目標(biāo)均可分解為若干個(gè)子目標(biāo)。子目標(biāo)層即為知識(shí)單元層,知識(shí)單元由若干知識(shí)單元和知識(shí)點(diǎn)組成,屬于同一個(gè)知識(shí)單元的知識(shí)點(diǎn)和知識(shí)單元間具有較強(qiáng)的關(guān)聯(lián)性[1]。這一層的目的是將分散的知識(shí)點(diǎn)關(guān)聯(lián)在一起,使知識(shí)點(diǎn)具有較強(qiáng)的層次和結(jié)構(gòu)關(guān)系。知識(shí)點(diǎn)層是整個(gè)知識(shí)表示模型的核心層,該層重點(diǎn)描述每個(gè)知識(shí)點(diǎn)的難度、重要度、所需預(yù)備知識(shí)集、測(cè)試通過(guò)閾值等。知識(shí)點(diǎn)之間可以存在多種關(guān)系,如前驅(qū)關(guān)系、后繼關(guān)系、兄弟關(guān)系、包含關(guān)系、對(duì)立關(guān)系等。一個(gè)知識(shí)點(diǎn)可以與多個(gè)基本素材之間存在關(guān)聯(lián)關(guān)系。基本素材層為物理上真實(shí)存在的、以教學(xué)為目的的數(shù)字化媒體文件,如文本類、視頻類等。一個(gè)基本素材可以與若干知識(shí)點(diǎn)存在關(guān)聯(lián)。
圖5 數(shù)據(jù)集常用構(gòu)建方法Fig.5 Common construction methods of datasets
葉露[13]使用八爪魚(yú)采集器抓取了在線學(xué)習(xí)平臺(tái)——果殼網(wǎng)MOOC學(xué)院中的計(jì)算機(jī)和數(shù)據(jù)與統(tǒng)計(jì)2個(gè)領(lǐng)域的所有課程,共收集到1 246條課程內(nèi)容,以抓取的課程內(nèi)容作為學(xué)習(xí)材料數(shù)據(jù),驗(yàn)證提出方法的有效性。Shi等[75]將機(jī)器學(xué)習(xí)的領(lǐng)域知識(shí)進(jìn)行整理,構(gòu)建機(jī)器學(xué)習(xí)領(lǐng)域知識(shí)圖譜,該數(shù)據(jù)集包含675個(gè)學(xué)習(xí)對(duì)象和1 033種對(duì)象間關(guān)系,將這個(gè)構(gòu)建的數(shù)據(jù)集作為學(xué)習(xí)路徑規(guī)劃算法的驗(yàn)證數(shù)據(jù)集。周瑩瑩[98]研究初等數(shù)學(xué)領(lǐng)域知識(shí)間的關(guān)聯(lián)關(guān)系,構(gòu)建了初中數(shù)學(xué)領(lǐng)域知識(shí)圖譜,知識(shí)圖譜中共包含知識(shí)點(diǎn)實(shí)體2 225個(gè),由專業(yè)團(tuán)隊(duì)對(duì)知識(shí)點(diǎn)間的關(guān)系進(jìn)行標(biāo)注,得到11 274條關(guān)系數(shù)據(jù),去掉無(wú)關(guān)關(guān)系后,最終得到1 749條有效知識(shí)點(diǎn)關(guān)系數(shù)據(jù),使用該數(shù)據(jù)集驗(yàn)證規(guī)劃算法的有效性。Menai等[99]收集一所大學(xué)在線學(xué)習(xí)系統(tǒng)中的真實(shí)課程數(shù)據(jù)與學(xué)生學(xué)習(xí)數(shù)據(jù),從中隨機(jī)挑選2 000名學(xué)員的學(xué)習(xí)數(shù)據(jù),來(lái)測(cè)試學(xué)習(xí)路徑規(guī)劃方法的性能。Agarwal等[100]使用來(lái)自匿名開(kāi)放大學(xué)中開(kāi)設(shè)的真實(shí)課程數(shù)據(jù)與10 000名學(xué)習(xí)者的學(xué)習(xí)數(shù)據(jù),測(cè)試他們?cè)O(shè)計(jì)的學(xué)習(xí)路徑規(guī)劃算法的性能。
如何對(duì)學(xué)習(xí)路徑規(guī)劃方法進(jìn)行評(píng)估是研究人員需要考慮的重要問(wèn)題。根據(jù)不同的研究目標(biāo),可以將評(píng)估方法分為兩大類別:一類是內(nèi)部評(píng)估,另一類是外部評(píng)估。內(nèi)部評(píng)估試圖證明,研究者提出的學(xué)習(xí)路徑規(guī)劃算法適用于解決學(xué)習(xí)路徑規(guī)劃問(wèn)題,或者在計(jì)算性能方面具有更好的表現(xiàn);外部評(píng)估更關(guān)注學(xué)習(xí)者主觀的學(xué)習(xí)體驗(yàn)與學(xué)習(xí)效果。
3.2.1 內(nèi)部評(píng)估
在內(nèi)部評(píng)估方法中,研究者通常使用信息檢索、機(jī)器學(xué)習(xí)和決策支持系統(tǒng)中常用的評(píng)估方法對(duì)學(xué)習(xí)路徑規(guī)劃方法進(jìn)行評(píng)估,包括準(zhǔn)確率、召回率、靈敏度[101]、均方根誤差、平均絕對(duì)誤差、模型運(yùn)行時(shí)間等。Govindarajan等[101]以學(xué)習(xí)者表現(xiàn)為基礎(chǔ),通過(guò)準(zhǔn)確率和靈敏度2個(gè)指標(biāo)評(píng)估學(xué)習(xí)路徑規(guī)劃算法的性能。作者將學(xué)習(xí)者按照其對(duì)知識(shí)掌握的熟練程度進(jìn)行劃分,準(zhǔn)確率用來(lái)度量當(dāng)課程結(jié)束后,在所有注冊(cè)課程的學(xué)習(xí)者中,對(duì)課程掌握的程度可以達(dá)到“熟練水平”的學(xué)習(xí)者數(shù)量所占的比重。靈敏度用來(lái)度量當(dāng)課程結(jié)束時(shí),對(duì)課程的掌握程度達(dá)到“專家水平”的學(xué)習(xí)者數(shù)量占所有注冊(cè)人員的比重。
文獻(xiàn)[51,102-103]使用平均絕對(duì)誤差評(píng)估學(xué)習(xí)路徑規(guī)劃算法的性能。例如,Kla?nja等[51]將學(xué)習(xí)者滿意程度和平均絕對(duì)誤差相結(jié)合,評(píng)估學(xué)習(xí)路徑規(guī)劃算法的性能。通過(guò)引入學(xué)習(xí)者滿意程度,使學(xué)習(xí)者可以明確地決定算法的效用。即學(xué)習(xí)路徑規(guī)劃算法通過(guò)學(xué)習(xí)者的個(gè)性化特征為學(xué)習(xí)者推薦一條學(xué)習(xí)路徑,并預(yù)測(cè)學(xué)習(xí)者對(duì)當(dāng)前推薦的學(xué)習(xí)路徑的滿意度,記為pi;當(dāng)學(xué)習(xí)結(jié)束后,會(huì)要求學(xué)習(xí)者對(duì)推薦的學(xué)習(xí)路徑的滿意程度進(jìn)行評(píng)分,記為qi。滿意度評(píng)分最低為1,最高為5,評(píng)分越高表示學(xué)習(xí)者對(duì)推薦的學(xué)習(xí)路徑越滿意。記錄學(xué)習(xí)者對(duì)推薦的N條學(xué)習(xí)路徑的真實(shí)評(píng)分與預(yù)測(cè)評(píng)分,并使用平均絕對(duì)誤差來(lái)度量這種偏差,偏差越小,代表學(xué)習(xí)路徑推薦算法性能越好
(1)
Durand等[2]通過(guò)計(jì)算算法生成一條學(xué)習(xí)路徑的平均時(shí)間評(píng)估算法的性能。Li等[104]通過(guò)分析學(xué)習(xí)路徑規(guī)劃算法的執(zhí)行時(shí)間評(píng)估學(xué)習(xí)路徑規(guī)劃算法的性能。Garrido等[105]通過(guò)評(píng)估算法生成的路徑與學(xué)習(xí)者真實(shí)使用的路徑在學(xué)習(xí)材料內(nèi)容和數(shù)量上的差異評(píng)估算法的穩(wěn)定性,通過(guò)統(tǒng)計(jì)生成一條學(xué)習(xí)路徑所花費(fèi)的時(shí)間評(píng)估算法的可擴(kuò)展性。
李浩君等[40]使用相斥度評(píng)估算法性能。相斥度定義為學(xué)習(xí)路徑規(guī)劃算法生成的學(xué)習(xí)路徑與學(xué)習(xí)者需求之間的符合程度。相斥度越小,表明當(dāng)前學(xué)習(xí)路徑越符合當(dāng)前學(xué)習(xí)者的個(gè)性化需求;反之,則越偏離學(xué)習(xí)者需求。學(xué)習(xí)者與學(xué)習(xí)路徑的相斥度函數(shù)由4個(gè)子映射函數(shù)通過(guò)加權(quán)系數(shù)構(gòu)建:
(2)
其中:ωi表示權(quán)重系數(shù),F(i)表示子映射函數(shù)。F(1)表示學(xué)習(xí)資源難度與學(xué)習(xí)者能力差異信息映射函數(shù);F(2)表示學(xué)習(xí)資源間的支出映射函數(shù);F(3)表示學(xué)習(xí)資源與目標(biāo)知識(shí)點(diǎn)匹配度映射函數(shù);F(4)表示學(xué)習(xí)者學(xué)習(xí)風(fēng)格與學(xué)習(xí)資源類型匹配度映射函數(shù)。
Saito和Watanobe[106]將學(xué)習(xí)路徑規(guī)劃問(wèn)題抽象為推薦問(wèn)題,并使用推薦系統(tǒng)中常用的度量指標(biāo)——輪廓系數(shù)衡量算法性能。輪廓系數(shù)計(jì)算同一簇中學(xué)習(xí)材料內(nèi)容的一致性評(píng)估學(xué)習(xí)材料是否被合理分配。輪廓系數(shù)介于-1和1之間,接近1表示處于同一簇中的學(xué)習(xí)材料被正確分配。輪廓系數(shù)由下面的數(shù)字表達(dá)式定義:
(3)
其中:a(i)是簇內(nèi)每個(gè)學(xué)習(xí)材料之間的平均距離,b(i)是每個(gè)學(xué)習(xí)材料到最近的簇的平均距離。
上述評(píng)估方法的優(yōu)點(diǎn)是容易實(shí)現(xiàn),能夠在花費(fèi)較少的前提下比較多種學(xué)習(xí)路徑規(guī)劃算法之間的優(yōu)劣[1]。但是該方法也存在一定的可靠性風(fēng)險(xiǎn),因?yàn)橛脩舻膶W(xué)習(xí)行為或?qū)W習(xí)偏好在學(xué)習(xí)過(guò)程中可能發(fā)生改變,但是上述評(píng)估方法沒(méi)有考慮這些因素的影響。
3.2.2 外部評(píng)估
學(xué)習(xí)路徑規(guī)劃方法的主要目的是提供滿足學(xué)習(xí)者個(gè)性化需求的學(xué)習(xí)材料,提高學(xué)習(xí)者的學(xué)習(xí)效率,針對(duì)該目的,研究人員提出了外部評(píng)估方法。外部評(píng)估方法主要包括對(duì)比分析法和用戶調(diào)研分析法2種。
對(duì)比分析法是目前最廣泛使用的外部評(píng)估方法。在該方法中,學(xué)習(xí)者被分為2組——實(shí)驗(yàn)組和對(duì)照組,其中,實(shí)驗(yàn)組的學(xué)習(xí)者使用學(xué)習(xí)路徑規(guī)劃算法推薦的學(xué)習(xí)路徑進(jìn)行課程學(xué)習(xí),對(duì)照組的學(xué)習(xí)者則自行完成課程學(xué)習(xí)或者使用老師制定的學(xué)習(xí)計(jì)劃完成課程學(xué)習(xí)。通過(guò)比較2組學(xué)習(xí)者對(duì)學(xué)習(xí)內(nèi)容的完成度、完成同一學(xué)習(xí)目標(biāo)所用時(shí)間、學(xué)習(xí)結(jié)束后作答同一測(cè)試試卷獲得成績(jī)的高低等指標(biāo)評(píng)估學(xué)習(xí)路徑規(guī)劃方法的性能。
Kla?nja等[51]通過(guò)統(tǒng)計(jì)發(fā)現(xiàn),實(shí)驗(yàn)組的學(xué)習(xí)者完成一門課程需要的時(shí)間比對(duì)照組用戶少,從而證明學(xué)習(xí)路徑規(guī)劃算法的有效性。Xu等[62]在學(xué)習(xí)結(jié)束后,比較實(shí)驗(yàn)組和對(duì)照組學(xué)習(xí)者編寫(xiě)的程序的性能,驗(yàn)證學(xué)習(xí)路徑規(guī)劃方法的有效性。Feng等[56]、Yang等[107]、Colace等[108]通過(guò)比較實(shí)驗(yàn)組和對(duì)照組學(xué)習(xí)者作答相同試卷的成績(jī),評(píng)估學(xué)習(xí)路徑規(guī)劃算法的有效性。Essalmi等[109]通過(guò)計(jì)算學(xué)習(xí)者的滿意度和用戶忠誠(chéng)度評(píng)估學(xué)習(xí)路徑規(guī)劃算法的性能。
對(duì)比分析法可靠性較高,但是使用該方法比較耗時(shí),需要統(tǒng)計(jì)學(xué)習(xí)者真實(shí)的學(xué)習(xí)數(shù)據(jù),花費(fèi)成本較高。
另一種比較常用的外部評(píng)估方法是用戶調(diào)研分析方法。使用該方法需要研究人員收集與學(xué)習(xí)路徑規(guī)劃算法相關(guān)的一些定性和定量信息。定性信息主要通過(guò)對(duì)學(xué)習(xí)者進(jìn)行問(wèn)卷調(diào)查的方式來(lái)獲取,例如,“你認(rèn)為當(dāng)前推薦的學(xué)習(xí)任務(wù)容易完成嗎?”,“你是否有足夠的時(shí)間來(lái)完成學(xué)習(xí)路徑規(guī)劃算法推薦的學(xué)習(xí)內(nèi)容?”等。定量信息可以統(tǒng)計(jì)用戶在完成學(xué)習(xí)路徑規(guī)劃算法推薦的學(xué)習(xí)內(nèi)容時(shí)花費(fèi)的時(shí)間來(lái)獲得。Kla?nja等[51]通過(guò)非強(qiáng)制性問(wèn)卷的方式,讓用戶對(duì)學(xué)習(xí)系統(tǒng)的速度、準(zhǔn)確性、適應(yīng)性、便利性4個(gè)特征進(jìn)行評(píng)估。Li等[104]設(shè)計(jì)了一份由5個(gè)問(wèn)題組成的問(wèn)卷收集學(xué)習(xí)者真實(shí)的評(píng)估信息。
用戶調(diào)研分析方法可提供一些額外的信息,比如學(xué)習(xí)者真實(shí)滿意度、學(xué)習(xí)者忠誠(chéng)度等,但是完成調(diào)研工作需要消耗較高的時(shí)間和金錢成本。由于用戶調(diào)研方法的難度大、成本高,用戶調(diào)研通常只能針對(duì)少量用戶和特定任務(wù)展開(kāi)。因此,用戶調(diào)研的結(jié)果不能對(duì)所有用戶都具有可信度和概括性。
學(xué)習(xí)路徑規(guī)劃方法雖然已經(jīng)取得了很多重要的研究成果,但是仍然存在很多限制和挑戰(zhàn)。明確這些限制和挑戰(zhàn)可以幫助研究人員在未來(lái)的研究中解決當(dāng)前的缺陷。本文提出以下7個(gè)關(guān)于學(xué)習(xí)路徑規(guī)劃方法存在的不足及未來(lái)的發(fā)展方向:
1)學(xué)習(xí)者參數(shù)的特異性
現(xiàn)有的學(xué)習(xí)路徑規(guī)劃算法中,在構(gòu)建學(xué)習(xí)者模型時(shí),主要考慮所有學(xué)習(xí)者均存在的共性參數(shù),例如學(xué)習(xí)者的學(xué)習(xí)偏好、知識(shí)背景、個(gè)人知識(shí)儲(chǔ)備等,還存在許多與特定學(xué)習(xí)者相關(guān)的因素會(huì)影響學(xué)習(xí)者的學(xué)習(xí)進(jìn)程和學(xué)習(xí)效率,例如學(xué)習(xí)者的第一語(yǔ)言、學(xué)習(xí)者間的文化差異、學(xué)習(xí)者的政治偏見(jiàn)、學(xué)習(xí)者的宗教信仰、學(xué)習(xí)者所處的社會(huì)經(jīng)濟(jì)條件等。這些未被考慮的因素為未來(lái)的研究提供了機(jī)會(huì)?,F(xiàn)存的學(xué)習(xí)路徑規(guī)劃算法研究的目標(biāo)通常是以前述的共性參數(shù)為基礎(chǔ),提出一個(gè)普適的學(xué)習(xí)路徑規(guī)劃方法,以適應(yīng)所有學(xué)習(xí)者,但是并沒(méi)有考慮特定環(huán)境中的特定學(xué)習(xí)者。
2)學(xué)習(xí)對(duì)象的多模態(tài)性
現(xiàn)有的學(xué)習(xí)路徑規(guī)劃方法主要針對(duì)單模態(tài)的學(xué)習(xí)材料展開(kāi)研究,一些研究表明,使用多模態(tài)學(xué)習(xí)材料對(duì)學(xué)習(xí)者的學(xué)習(xí)過(guò)程具有積極的影響。未來(lái)的學(xué)習(xí)路徑規(guī)劃方法應(yīng)該考慮不同知識(shí)領(lǐng)域中學(xué)習(xí)材料的多模態(tài)性,關(guān)注如何對(duì)不同模態(tài)的學(xué)習(xí)資源進(jìn)行準(zhǔn)確豐富的表示,并探索不同內(nèi)容之間更豐富的語(yǔ)義關(guān)系,為用戶提供多模態(tài)學(xué)習(xí)材料融合的學(xué)習(xí)路徑。
3)學(xué)習(xí)材料參數(shù)的生成方式
目前,構(gòu)建學(xué)習(xí)材料模型使用的各種參數(shù)主要由專家來(lái)定義,因此這些參數(shù)可能會(huì)受專家個(gè)人情感、經(jīng)驗(yàn)的影響存在一定偏差,另外隨著學(xué)習(xí)材料規(guī)模不斷擴(kuò)大,這種參數(shù)定義方法需要較大的人力開(kāi)銷。因此,未來(lái)需要研究學(xué)習(xí)材料特征自動(dòng)捕獲和語(yǔ)義注釋的自動(dòng)生成技術(shù),從而自動(dòng)生成學(xué)習(xí)材料的參數(shù)。例如,運(yùn)用深度學(xué)習(xí)技術(shù)從視頻資料中自動(dòng)提取學(xué)習(xí)材料的視覺(jué)特征,自動(dòng)生成學(xué)習(xí)材料的特征參數(shù),提高學(xué)習(xí)材料推薦的準(zhǔn)確性。
4)學(xué)習(xí)路徑規(guī)劃算法的可擴(kuò)展性
隨著學(xué)習(xí)者數(shù)量和學(xué)習(xí)材料的增加,學(xué)習(xí)路徑規(guī)劃算法需要處理的數(shù)據(jù)量同步增長(zhǎng),因此,需要存儲(chǔ)的學(xué)習(xí)者與學(xué)習(xí)材料的交互數(shù)據(jù)可能是巨大的。學(xué)習(xí)路徑規(guī)劃算法需要盡可能快地為學(xué)習(xí)者生成符合其特性的學(xué)習(xí)路徑,因此,在大規(guī)模數(shù)據(jù)量的情況下,如何設(shè)計(jì)具有高度可擴(kuò)展性和適應(yīng)性的學(xué)習(xí)路徑規(guī)劃方法成為一個(gè)值得探索的研究方向。
5)學(xué)習(xí)路徑規(guī)劃算法的評(píng)估標(biāo)準(zhǔn)
目前,尚缺乏一個(gè)統(tǒng)一且全面的評(píng)估標(biāo)準(zhǔn)對(duì)不同的學(xué)習(xí)路徑規(guī)劃算法進(jìn)行比較。一個(gè)統(tǒng)一的評(píng)估標(biāo)準(zhǔn)應(yīng)該擁有可靠的公共數(shù)據(jù)集以及一系列可用于評(píng)估算法結(jié)果的標(biāo)準(zhǔn)度量方法。目前,在學(xué)習(xí)路徑規(guī)劃領(lǐng)域中還沒(méi)有公開(kāi)的可靠公共數(shù)據(jù)集和測(cè)試標(biāo)準(zhǔn),這為未來(lái)的研究人員提供了一個(gè)可行的研究方向。
6)學(xué)習(xí)路徑規(guī)劃算法的實(shí)際應(yīng)用
盡管學(xué)習(xí)路徑規(guī)劃算法已經(jīng)取得了一定的進(jìn)展,并且很多研究已經(jīng)表明,學(xué)習(xí)路徑規(guī)劃方法提供的解決方案在提高學(xué)習(xí)者學(xué)習(xí)效率方面具有積極的影響,但目前大多數(shù)研究成果在教育中的實(shí)際影響仍然還局限于研究項(xiàng)目中。因此,還需要做進(jìn)一步的研究與推廣,以使學(xué)習(xí)路徑規(guī)劃方法在現(xiàn)實(shí)場(chǎng)景中得到有效應(yīng)用。
7)與學(xué)習(xí)路徑規(guī)劃相關(guān)的道德倫理問(wèn)題
目前關(guān)于學(xué)習(xí)路徑規(guī)劃的研究中,并沒(méi)有提及與此相關(guān)的道德倫理問(wèn)題。學(xué)習(xí)路徑規(guī)劃問(wèn)題是一個(gè)涉及人類與智能技術(shù)的問(wèn)題,因此,隨著科技的進(jìn)步,道德倫理問(wèn)題是一個(gè)需要被考慮的重要因素。
學(xué)習(xí)路徑規(guī)劃方法的相關(guān)研究經(jīng)過(guò)漫長(zhǎng)發(fā)展,在學(xué)術(shù)界與工業(yè)界的均取得了一定的成果。本文從研究現(xiàn)狀、評(píng)估方法、未來(lái)發(fā)展方向幾個(gè)方面對(duì)學(xué)習(xí)路徑規(guī)劃方法進(jìn)行綜述,指出學(xué)習(xí)路徑規(guī)劃方法目前存在的問(wèn)題與面臨的挑戰(zhàn),這些問(wèn)題為研究人員揭示了研究機(jī)會(huì)。這些存在的挑戰(zhàn)必須得到解決,從而為學(xué)習(xí)者生成更高質(zhì)量的學(xué)習(xí)路徑,推動(dòng)學(xué)習(xí)路徑規(guī)劃方法更廣泛應(yīng)用于實(shí)際學(xué)習(xí)與生活中。