吳彥文,孫晨輝,李 斌
(華中師范大學(xué)物理科學(xué)與技術(shù)學(xué)院,湖北武漢 430079)
傳統(tǒng)教學(xué)模式由于受時(shí)間和空間限制無法滿足學(xué)習(xí)者日益增長(zhǎng)的個(gè)性化學(xué)習(xí)需求。為此,部分高校紛紛推出適宜于學(xué)生的在線學(xué)習(xí)平臺(tái),用于日常輔助教學(xué),但隨著平臺(tái)資源的日益增長(zhǎng)又出現(xiàn)“資源過載”現(xiàn)象,學(xué)習(xí)者一直處于“碎片化學(xué)習(xí)”狀態(tài),不利于知識(shí)體系構(gòu)建。
康德認(rèn)為,人類記憶中知識(shí)經(jīng)驗(yàn)是以圖的形式存儲(chǔ)的,只有當(dāng)新概念與原有知識(shí)概念建立聯(lián)系才能產(chǎn)生意義[1]。利用知識(shí)元關(guān)聯(lián)可以幫助學(xué)習(xí)者建立知識(shí)體系,通過系統(tǒng)學(xué)習(xí)、實(shí)踐、反思轉(zhuǎn)化,將新知識(shí)與自身已有知識(shí)進(jìn)行整合與關(guān)聯(lián),最終內(nèi)化為能夠獨(dú)立輸出的知識(shí)系統(tǒng)。人工智能發(fā)展到認(rèn)知智能階段,學(xué)科知識(shí)圖譜以其特有的語義關(guān)聯(lián)、知識(shí)推理以及可解釋性等特征,同智慧教育高度切合,在學(xué)習(xí)者模型建立、在線學(xué)習(xí)平臺(tái)、智能答疑系統(tǒng)等方面起著重要作用。與此同時(shí),作為現(xiàn)今主流的學(xué)習(xí)資源推薦方法,協(xié)同過濾算法已在眾多在線教育平臺(tái)中得到運(yùn)用且表現(xiàn)不俗。然而協(xié)同過濾算法只考慮用戶和資源之間的二元關(guān)系,所呈現(xiàn)的推薦結(jié)果欠缺知識(shí)元之間的關(guān)聯(lián)性,大量碎片化知識(shí)學(xué)習(xí)不利于構(gòu)建學(xué)習(xí)者知識(shí)體系。
基于學(xué)習(xí)資源關(guān)聯(lián)的推薦是知識(shí)圖譜和個(gè)性化推薦技術(shù)相互融合的結(jié)果,可以充分發(fā)揮二者雙重優(yōu)勢(shì)。因此,本文通過設(shè)計(jì)基于知識(shí)圖譜的學(xué)習(xí)資源關(guān)聯(lián)推薦模型,結(jié)合模擬電子技術(shù)基礎(chǔ)課堂教學(xué)實(shí)踐經(jīng)驗(yàn)開展實(shí)證研究,以驗(yàn)證該模型在構(gòu)建知識(shí)體系及提升學(xué)習(xí)效果方面的有效性。
協(xié)同過濾算法作為智能領(lǐng)域最成功的一項(xiàng)技術(shù),最早由Palo Alto 研究中心提出[2]。協(xié)同過濾推薦算法主要有基于用戶的協(xié)同過濾算法和基于物品的協(xié)同過濾算法兩種,其本質(zhì)都是基于鄰域的推薦算法[3]。
在線教育平臺(tái)中,基于內(nèi)容的推薦方法和傳統(tǒng)的協(xié)同過濾推薦算法應(yīng)用最為廣泛[4]。近年來,基于協(xié)同過濾算法的推薦系統(tǒng)發(fā)展迅速,是個(gè)性化在線學(xué)習(xí)重點(diǎn)研究方向。熊回香等[5]融合基于內(nèi)容與協(xié)同過濾推薦思想,利用LDA 進(jìn)行相似度計(jì)算得出資源與用戶的近鄰集合,并抽取資源內(nèi)容關(guān)鍵詞進(jìn)行資源推薦,但由于缺乏一些個(gè)性化特征,最后的推薦結(jié)果個(gè)性化程度并不高;何娟[6]綜合分析學(xué)習(xí)者個(gè)人和學(xué)習(xí)者群體閱讀特征,借助用戶畫像,構(gòu)建學(xué)習(xí)者個(gè)人畫像與群體畫像,依據(jù)學(xué)習(xí)者借閱行為特征為其推薦圖書,但模型建立技術(shù)不夠新穎且特征單一;徐海玲等[7]在分析用戶行為屬性的同時(shí)在建模過程中加入需求屬性,通過概念格方法挖掘用戶之間的關(guān)聯(lián),以此提升用戶群體模型構(gòu)建的準(zhǔn)確性,但該模型在構(gòu)建過程中用戶動(dòng)態(tài)數(shù)據(jù)采集不及時(shí),導(dǎo)致模型更新缺乏實(shí)時(shí)性。以上基于協(xié)同過濾算法的學(xué)習(xí)資源推薦大多只利用了用戶—學(xué)習(xí)資源評(píng)分矩陣,在推薦結(jié)果精準(zhǔn)度和召回率方面表現(xiàn)得差強(qiáng)人意。因此,更多的研究采用混合推薦方法進(jìn)行學(xué)習(xí)資源推薦。劉忠寶等[8]參考物理學(xué)的物質(zhì)擴(kuò)散理論設(shè)計(jì)學(xué)習(xí)資源推薦模型,該模型在為學(xué)習(xí)者推薦學(xué)習(xí)資源時(shí)的同時(shí)兼顧資源熱門性、新穎性,但存在一定的數(shù)據(jù)稀疏問題;孫承愛等[9]依據(jù)圖書特點(diǎn)設(shè)計(jì)一種個(gè)性化閱讀系統(tǒng),系統(tǒng)融合興趣標(biāo)簽和協(xié)同過濾算法,充分考慮用戶的興趣特征,但興趣特征信息來源于顯式反饋,對(duì)用戶隱式反饋數(shù)據(jù)缺乏分析;付芬等[10]通過隱式行為反饋方式獲取用戶隱式興趣特征,加入到用戶資源評(píng)分矩陣中,并改進(jìn)傳統(tǒng)的相似度計(jì)算方法,實(shí)現(xiàn)在線學(xué)習(xí)平臺(tái)的資源推薦功能。
協(xié)同過濾推薦算法以及混合推薦算法一直是在線教育領(lǐng)域研究熱點(diǎn),并在學(xué)習(xí)資源推薦方面取得很好效果。然而,這些推薦方法大多只考慮學(xué)習(xí)者與資源之間的二元關(guān)系,沒有對(duì)學(xué)習(xí)資源中的知識(shí)進(jìn)行關(guān)聯(lián)分析。趙國(guó)慶等[11]通過3 種概念構(gòu)圖任務(wù)對(duì)教師學(xué)科知識(shí)進(jìn)行評(píng)價(jià),結(jié)果顯示小學(xué)數(shù)學(xué)教師同樣存在學(xué)科本體知識(shí)不足、知識(shí)碎片化程度嚴(yán)重及知識(shí)結(jié)構(gòu)不甚合理等問題。因此,在學(xué)習(xí)資源推薦過程中加入知識(shí)點(diǎn)關(guān)聯(lián)分析顯得尤為重要。在線學(xué)習(xí)資源大多以文檔、PPT、視頻等多模態(tài)形式存在,這些資源因其數(shù)據(jù)結(jié)構(gòu)的無序性而被定義為非結(jié)構(gòu)化學(xué)習(xí)資源,但這并不代表這類學(xué)習(xí)資源是沒有結(jié)構(gòu)的,事實(shí)上任何學(xué)習(xí)資源內(nèi)部以及資源與資源間都存在聯(lián)系。因此,如何從這些非結(jié)構(gòu)化數(shù)據(jù)中抽取知識(shí)是實(shí)現(xiàn)資源關(guān)聯(lián)和多模態(tài)資源推薦的重要前提。Goole 公司為了提高搜索效率于2012 年5 月提出“知識(shí)圖譜”[12]。知識(shí)圖譜可從非結(jié)構(gòu)化學(xué)習(xí)資源中抽取實(shí)體、關(guān)系等要素,利用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)之間的聯(lián)系,是海量知識(shí)的一種表征形式[13]。知識(shí)圖譜可以運(yùn)用深度學(xué)習(xí)實(shí)現(xiàn)知識(shí)的自動(dòng)推理,避免大量人工操作,在海量學(xué)習(xí)資源處理過程中有著先天優(yōu)勢(shì)。Yang 等[14]提出一種知識(shí)抽取框架,實(shí)現(xiàn)數(shù)字預(yù)組裝階段校驗(yàn)報(bào)告中關(guān)鍵信息的抽取,分享和反饋文本的重要內(nèi)容,大大提高生產(chǎn)效率,節(jié)約成本。領(lǐng)域知識(shí)圖譜構(gòu)建有助于知識(shí)體系構(gòu)建,Kim[15]利用產(chǎn)品知識(shí)圖譜描述電子產(chǎn)品、電子產(chǎn)品標(biāo)準(zhǔn)以及各種產(chǎn)品之間的關(guān)系,為商家展示更有效的產(chǎn)品信息傳遞渠道?;谶@一特性,研究者們期望將知識(shí)圖譜技術(shù)應(yīng)用于在線資源組織與推薦中。如陸星兒等[16]建立基于心理學(xué)課程的知識(shí)圖譜,為MOOC 提供教學(xué)新思路。
本文利用學(xué)科知識(shí)圖譜構(gòu)建方法,對(duì)在線平臺(tái)資源進(jìn)行組織,挖掘資源之間的關(guān)聯(lián)關(guān)系;通過構(gòu)建基于知識(shí)圖譜的學(xué)習(xí)資源關(guān)聯(lián)推薦模型,實(shí)現(xiàn)學(xué)習(xí)者—學(xué)習(xí)資源—知識(shí)元三者關(guān)聯(lián)。在學(xué)習(xí)者模型及學(xué)習(xí)者群體模型構(gòu)建中加入學(xué)習(xí)者偏好屬性,引入學(xué)習(xí)行為等隱式反饋數(shù)據(jù)填充偏好屬性,以此實(shí)現(xiàn)學(xué)習(xí)資源的精準(zhǔn)推薦,幫助學(xué)習(xí)者更系統(tǒng)地學(xué)習(xí)課程,提升學(xué)習(xí)效果。
本文借助知識(shí)圖譜強(qiáng)化知識(shí)元內(nèi)聯(lián),結(jié)合學(xué)習(xí)者畫像構(gòu)建學(xué)習(xí)者—學(xué)習(xí)資源—知識(shí)元(實(shí)體)關(guān)聯(lián),系統(tǒng)構(gòu)建思路如圖1 所示。
圖1 基于知識(shí)圖譜的混合協(xié)同過濾推薦流程
本文通過非結(jié)構(gòu)化學(xué)習(xí)資源的知識(shí)圖譜構(gòu)建,實(shí)現(xiàn)異質(zhì)資源的知識(shí)融合;基于學(xué)習(xí)者資源交互行為構(gòu)建學(xué)習(xí)者動(dòng)態(tài)模型,利用協(xié)同過濾算法為學(xué)習(xí)者推薦學(xué)習(xí)資源;在推薦列表產(chǎn)生過程中借助學(xué)習(xí)資源知識(shí)圖譜的知識(shí)元關(guān)聯(lián)性優(yōu)化推薦列表。
學(xué)習(xí)者畫像構(gòu)建是一個(gè)不斷完善的動(dòng)態(tài)過程,通過對(duì)學(xué)習(xí)行為、學(xué)習(xí)偏好等數(shù)據(jù)分析,突出學(xué)習(xí)者個(gè)體差異,為每個(gè)學(xué)習(xí)者打上標(biāo)簽,從而不斷提高個(gè)性化程度,為學(xué)習(xí)者更加精準(zhǔn)地匹配學(xué)習(xí)資源。本研究通過對(duì)學(xué)習(xí)者學(xué)習(xí)傾向、先前學(xué)習(xí)經(jīng)驗(yàn)、學(xué)習(xí)風(fēng)格、學(xué)習(xí)態(tài)度等分析,描述學(xué)習(xí)者個(gè)體差異。以華中師范大學(xué)云課堂作為知識(shí)庫,在動(dòng)態(tài)學(xué)習(xí)者畫像構(gòu)建過程中整合華中師大云課堂相關(guān)平臺(tái)數(shù)據(jù)。通過對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分類/聚類分析,細(xì)分學(xué)習(xí)者并勾勒出個(gè)體學(xué)習(xí)者及群體學(xué)習(xí)者畫像。
學(xué)習(xí)者畫像構(gòu)建數(shù)據(jù)來源見表1。
表1 學(xué)習(xí)者畫像數(shù)據(jù)來源
動(dòng)態(tài)學(xué)習(xí)者畫像建立步驟:
(1)整合學(xué)習(xí)者數(shù)據(jù),如在云課堂、信息門戶、移動(dòng)信息平臺(tái)以及其它平臺(tái)上的學(xué)習(xí)者個(gè)人信息、課程信息、好友信息、資源交互行為等動(dòng)態(tài)數(shù)據(jù)。
(2)利用數(shù)據(jù)挖掘、數(shù)據(jù)分析等技術(shù)對(duì)這些信息進(jìn)行抓取、清洗、轉(zhuǎn)換、分類、聚類等處理。學(xué)習(xí)者畫像標(biāo)簽即從學(xué)習(xí)者動(dòng)態(tài)行為數(shù)據(jù)中挖掘信息,進(jìn)行聚類操作[17]。通過標(biāo)簽建模分析,進(jìn)一步區(qū)分個(gè)體學(xué)習(xí)者和學(xué)習(xí)者群體。學(xué)習(xí)者群體畫像構(gòu)建過程中需要對(duì)學(xué)習(xí)者群體基本屬性、學(xué)習(xí)者之間社交關(guān)聯(lián)、資源瀏覽、學(xué)習(xí)評(píng)價(jià)等行為進(jìn)行相似度分析,進(jìn)而對(duì)個(gè)體學(xué)習(xí)者聚類分析形成學(xué)習(xí)者群體。除此以外,動(dòng)態(tài)學(xué)習(xí)者畫像模型要求不斷根據(jù)學(xué)習(xí)者基本信息的變化及動(dòng)態(tài)行為數(shù)據(jù)調(diào)整標(biāo)簽。
(3)根據(jù)所建立的學(xué)習(xí)者畫像構(gòu)建預(yù)測(cè)模型,為個(gè)體學(xué)習(xí)者和學(xué)習(xí)者群體提供有針對(duì)性的個(gè)性化服務(wù),并不斷根據(jù)學(xué)習(xí)者反饋調(diào)整畫像。
根據(jù)動(dòng)態(tài)學(xué)習(xí)者畫像形成預(yù)測(cè)模型,該預(yù)測(cè)模型可預(yù)測(cè)學(xué)習(xí)者需求偏好、潛在的學(xué)習(xí)資源需求以及響應(yīng)和服務(wù),將學(xué)習(xí)者感興趣、有知識(shí)關(guān)聯(lián)的學(xué)習(xí)資源呈現(xiàn)給學(xué)習(xí)者,學(xué)習(xí)資源推薦流程如下:首先采集和處理學(xué)習(xí)者畫像數(shù)據(jù)及學(xué)習(xí)資源的知識(shí)元關(guān)聯(lián)數(shù)據(jù),然后建立標(biāo)簽細(xì)分個(gè)體學(xué)習(xí)者和學(xué)習(xí)者群體,最后將學(xué)習(xí)資源在學(xué)習(xí)者之間進(jìn)行匹配、呈現(xiàn),如圖2 所示。系統(tǒng)需要依據(jù)用戶行為數(shù)據(jù)實(shí)時(shí)調(diào)整學(xué)習(xí)者畫像,確保資源推薦的準(zhǔn)確性、有效性。
圖2 動(dòng)態(tài)學(xué)習(xí)者畫像視角下學(xué)習(xí)資源推薦
依據(jù)基于知識(shí)圖譜的學(xué)習(xí)資源關(guān)聯(lián)推薦模型,借助華中師范大學(xué)師大云課堂平臺(tái)進(jìn)行課程教學(xué)設(shè)計(jì),并展開實(shí)證研究。云課堂資源種類涵蓋授課視頻、授課講義(PPT、PDF 文件)、試題題庫及大量的課后拓展資源等,是打破時(shí)空限制的混合式教學(xué)方式。借助師大云課堂移動(dòng)學(xué)習(xí)平臺(tái),筆者結(jié)合近5 年的實(shí)際教學(xué)經(jīng)驗(yàn)開展面向電子信息類專業(yè)的模擬電子技術(shù)基礎(chǔ)課程教學(xué)實(shí)驗(yàn)。
從平臺(tái)獲取學(xué)習(xí)者相關(guān)數(shù)據(jù),根據(jù)線下課程的反饋和測(cè)試成績(jī)驗(yàn)證學(xué)習(xí)效果與推薦模型的有效性。學(xué)習(xí)效果體現(xiàn)在兩個(gè)方面:①直觀的學(xué)業(yè)成績(jī);②課程學(xué)習(xí)的滿意度評(píng)價(jià)[18]。通過文獻(xiàn)分析法可知學(xué)習(xí)效果影響因素主要包括:先驗(yàn)知識(shí)、認(rèn)知風(fēng)格、學(xué)習(xí)態(tài)度、難易評(píng)價(jià)、學(xué)業(yè)成績(jī)、學(xué)習(xí)滿意度6 種。因此,本研究將期末學(xué)習(xí)成績(jī)和學(xué)習(xí)滿意度作為因變量,選取先驗(yàn)知識(shí)、認(rèn)知風(fēng)格、學(xué)習(xí)態(tài)度、難易評(píng)價(jià)4 個(gè)影響因素作為學(xué)習(xí)者畫像特征要素,探究模型的學(xué)習(xí)效果。
(1)數(shù)據(jù)采集。該門課程開設(shè)兩個(gè)班級(jí),選修學(xué)生共84 名。本研究選取A、B 兩個(gè)班級(jí)進(jìn)行對(duì)照實(shí)驗(yàn),其中A班43 人作為平臺(tái)實(shí)驗(yàn)者,B 班41 人作為對(duì)照組。實(shí)驗(yàn)數(shù)據(jù)來源由平臺(tái)數(shù)據(jù)和調(diào)查問卷數(shù)據(jù)兩部分組成。
(2)數(shù)據(jù)分析。根據(jù)學(xué)習(xí)者畫像特征對(duì)A、B 兩個(gè)班級(jí)學(xué)習(xí)群體進(jìn)行分析,然后以學(xué)習(xí)成績(jī)和學(xué)習(xí)滿意度作為評(píng)價(jià)標(biāo)準(zhǔn)檢驗(yàn)學(xué)習(xí)效果。
為了解A、B 兩個(gè)班級(jí)學(xué)習(xí)者群體特征,本研究從先驗(yàn)知識(shí)、認(rèn)知風(fēng)格、學(xué)習(xí)態(tài)度、難易評(píng)價(jià)4 個(gè)角度對(duì)A、B 兩個(gè)班級(jí)進(jìn)行學(xué)習(xí)者畫像特征描述,以期末學(xué)習(xí)成績(jī)和學(xué)習(xí)滿意度作為評(píng)價(jià)標(biāo)準(zhǔn),具體數(shù)據(jù)如表2 所示。
從表2 可知,A 班在先驗(yàn)知識(shí)方面比B 班略有優(yōu)勢(shì),認(rèn)知風(fēng)格方面兩個(gè)班級(jí)都偏好視頻學(xué)習(xí)資源,學(xué)習(xí)態(tài)度方面都表現(xiàn)積極。因此,兩個(gè)班級(jí)在學(xué)習(xí)者特征刻畫方面基本一致。經(jīng)過一個(gè)學(xué)期的教學(xué)實(shí)驗(yàn),A 班學(xué)生在難易評(píng)價(jià)中選擇好學(xué)的比例明顯高于B 班,期末考核后,A 班成績(jī)達(dá)到良好及以上的人數(shù)比B 班多出9 人,沒有出現(xiàn)不合格學(xué)生,同時(shí)有接近91.7% 的學(xué)生在期末評(píng)課環(huán)節(jié)選擇滿意,表明本文基于知識(shí)圖譜的學(xué)習(xí)資源關(guān)聯(lián)推薦方法在一定程度上提高了學(xué)習(xí)效果。
表2 實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)分析
針對(duì)當(dāng)前推薦算法僅關(guān)注學(xué)習(xí)者和資源二者關(guān)系,導(dǎo)致學(xué)生處于“碎片化學(xué)習(xí)”而缺乏系統(tǒng)性學(xué)習(xí)問題,本文提出基于知識(shí)圖譜的學(xué)習(xí)資源關(guān)聯(lián)推薦模型。該模型通過學(xué)習(xí)資源知識(shí)圖譜構(gòu)建,實(shí)現(xiàn)知識(shí)元關(guān)聯(lián)的可視化描述,并借助動(dòng)態(tài)學(xué)習(xí)者畫像進(jìn)行學(xué)習(xí)資源的精準(zhǔn)匹配。選取模擬電子技術(shù)基礎(chǔ)課程在A、B 兩個(gè)班級(jí)進(jìn)行對(duì)照實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果證明,基于知識(shí)圖譜的學(xué)習(xí)資源關(guān)聯(lián)推薦模型能在一定程度上提高學(xué)習(xí)效果。本研究還存在不足之處,如進(jìn)行模電知識(shí)圖譜構(gòu)建過程中,融合異質(zhì)資源數(shù)量不足(僅融合了百度百科和師大云課堂的相關(guān)資源),缺乏資源準(zhǔn)確性審核環(huán)節(jié)。后續(xù)工作重點(diǎn)將著眼于高質(zhì)量學(xué)習(xí)資源知識(shí)圖譜構(gòu)建,確保資源正確性和豐富性。本模型還可應(yīng)用于在線學(xué)習(xí)平臺(tái),但由于在線學(xué)習(xí)平臺(tái)學(xué)習(xí)者體量巨大,學(xué)習(xí)背景不一致且缺乏教師干預(yù)指導(dǎo),需要在模型中加入認(rèn)知診斷機(jī)制,根據(jù)學(xué)習(xí)者認(rèn)知能力推薦學(xué)習(xí)資源。