李超,周泓
北京航空航天大學(xué)經(jīng)濟(jì)管理學(xué)院,北京100191
基于復(fù)合神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)風(fēng)格動(dòng)態(tài)分析與研究
李超,周泓
北京航空航天大學(xué)經(jīng)濟(jì)管理學(xué)院,北京100191
早在2 500年前,中國(guó)古代偉大的教育家孔子就提出了“因材施教”的教育理念,也是至今為止廣大教育工作者所追求的理想目標(biāo)。然而由于資源限制,學(xué)習(xí)者風(fēng)格往往會(huì)隨其先修知識(shí)、學(xué)習(xí)目標(biāo)、狀態(tài)和內(nèi)容的不同而動(dòng)態(tài)發(fā)生變化,因而很難大規(guī)模推行。2012年出現(xiàn)的大規(guī)模在線(xiàn)開(kāi)放課程(Massive Open Online Courses,MOOCs)推動(dòng)了在線(xiàn)學(xué)習(xí)模式的快速發(fā)展,與此同時(shí)還演化出了用于單一教育機(jī)構(gòu)范圍內(nèi)使用的小規(guī)模私有在線(xiàn)課程(Small Private Online Course,SPOC)等不同模式。目前已經(jīng)超過(guò)7 000萬(wàn)人通過(guò)MOOC學(xué)習(xí)全球的優(yōu)質(zhì)課程,為緩解教育資源的緊張和實(shí)現(xiàn)教育公平化提供了一條有效途徑。然而,即使是像MOOC這樣的由優(yōu)秀教師團(tuán)隊(duì)精心設(shè)計(jì)和運(yùn)行的課程還是會(huì)面臨內(nèi)容固定化、對(duì)所有學(xué)習(xí)者一視同仁的“機(jī)械化”教育方法的問(wèn)題,對(duì)于學(xué)習(xí)者的不同需要和特性并未有太多考慮,比如:他們的學(xué)習(xí)動(dòng)機(jī)、先修知識(shí)背景以及所適應(yīng)的學(xué)習(xí)風(fēng)格等,因此還是無(wú)法實(shí)現(xiàn)“因材施教”的本質(zhì)特征,即個(gè)性化教學(xué)。
近年來(lái)有越來(lái)越多的研究聚焦在學(xué)習(xí)者個(gè)性[1]、學(xué)習(xí)風(fēng)格[2]及其對(duì)學(xué)習(xí)過(guò)程的影響[3-4]等相關(guān)領(lǐng)域[5-6],包括學(xué)習(xí)風(fēng)格的有效性[7]、從在校生學(xué)習(xí)行為分析學(xué)習(xí)風(fēng)格[8]以及通過(guò)智能算法將學(xué)習(xí)者根據(jù)其特征進(jìn)行在線(xiàn)協(xié)作學(xué)習(xí)分組[9]等。相關(guān)研究表明,為學(xué)習(xí)者提供適應(yīng)其個(gè)性風(fēng)格的課程內(nèi)容、學(xué)習(xí)路徑以及協(xié)作學(xué)習(xí)分組可以有效提升學(xué)習(xí)效率和效果[10-11]。
本文針對(duì)以上問(wèn)題研究設(shè)計(jì)了一種實(shí)時(shí)的智能分析方法,通過(guò)對(duì)學(xué)習(xí)者學(xué)習(xí)行為的分析,動(dòng)態(tài)地測(cè)量和識(shí)別每個(gè)學(xué)習(xí)者學(xué)習(xí)風(fēng)格,并用來(lái)為學(xué)習(xí)者提供不同的學(xué)習(xí)內(nèi)容,這對(duì)于在大規(guī)模在線(xiàn)學(xué)習(xí)環(huán)境下提升學(xué)習(xí)者學(xué)習(xí)效率具有一定的應(yīng)用和參考價(jià)值。
在傳統(tǒng)的教學(xué)過(guò)程中為了取得良好的效果,教師不僅需要精心準(zhǔn)備教學(xué)內(nèi)容、設(shè)計(jì)教學(xué)過(guò)程,而且更加需要在教學(xué)過(guò)程中關(guān)注學(xué)生的反應(yīng)并適時(shí)地改變教學(xué)路徑和策略。在互聯(lián)網(wǎng)時(shí)代,隨著計(jì)算機(jī)和人工智能的快速發(fā)展,上10萬(wàn)人可以同時(shí)學(xué)習(xí)一門(mén)MOOC課程,大規(guī)模在線(xiàn)學(xué)習(xí)環(huán)境可以為學(xué)習(xí)者提供7×24 h的教學(xué)服務(wù)。然而,相對(duì)于傳統(tǒng)教學(xué)環(huán)境中在某一時(shí)刻的學(xué)習(xí)對(duì)象僅是限定于來(lái)自同一個(gè)班水平基本相當(dāng)?shù)膶W(xué)生而言,大規(guī)模環(huán)境需要同時(shí)為知識(shí)背景、學(xué)習(xí)習(xí)慣、學(xué)習(xí)目的各不相同的學(xué)習(xí)者群體提供學(xué)習(xí)服務(wù)。如何實(shí)現(xiàn)個(gè)性化的教學(xué)服務(wù)和體驗(yàn)就成為一個(gè)十分嚴(yán)峻的問(wèn)題,這將是確保和提升教學(xué)效果的最重要的手段之一。本章將著重介紹實(shí)施個(gè)性化教學(xué)需解決的兩個(gè)關(guān)鍵問(wèn)題:學(xué)習(xí)風(fēng)格的表示與度量。
在過(guò)去50年中出現(xiàn)過(guò)許多學(xué)習(xí)風(fēng)格模型,它們往往是從學(xué)習(xí)者不同的角度出發(fā)提出的,包括學(xué)習(xí)者個(gè)性、情感狀態(tài)、認(rèn)知能力以及所處環(huán)境等。Felder-Silverman學(xué)習(xí)風(fēng)格模型(Felder-Silverman Learning Style Model,F(xiàn)SLSM)是目前被廣泛使用的一種學(xué)習(xí)風(fēng)格模型,它綜合了前期主流的學(xué)習(xí)風(fēng)格模型之長(zhǎng)處,在自適應(yīng)學(xué)習(xí)系統(tǒng)中尤其受到關(guān)注。這個(gè)模型根據(jù)學(xué)習(xí)者感知、輸入、處理和理解四個(gè)維度方面的偏好將其劃分為八種學(xué)習(xí)風(fēng)格,在這四個(gè)維度的各個(gè)方向設(shè)計(jì)中都融入了包括Kolb[12]、Pask[13]以及Myers-Briggs[14]等學(xué)習(xí)風(fēng)格模型的優(yōu)點(diǎn),模型結(jié)構(gòu)如圖1所示。
為了能夠度量FSLSM四個(gè)不同維度的具體數(shù)值,F(xiàn)elder和Soloman同時(shí)開(kāi)發(fā)了一套由44道問(wèn)卷題目組成的學(xué)習(xí)風(fēng)格量表(Index of Learning Styles,ILS)[15],每個(gè)維度由從+11到-11的數(shù)值來(lái)標(biāo)明其偏好的傾向。通過(guò)這樣的量表,不僅可以識(shí)別用戶(hù)的學(xué)習(xí)風(fēng)格,而且還可以評(píng)估學(xué)習(xí)偏好的程度。
圖1 FSLSM的四個(gè)維度和八個(gè)方向
ILS通過(guò)一套問(wèn)卷中的問(wèn)題答案計(jì)數(shù)來(lái)識(shí)別用戶(hù)的學(xué)習(xí)風(fēng)格,這種模式對(duì)于處于小規(guī)?;蚍忾]環(huán)境中的應(yīng)用場(chǎng)景是可行的,正如大多數(shù)教育機(jī)構(gòu)目前使用的學(xué)習(xí)管理系統(tǒng)(Learning Management System,LMS)所使用的方法:讓用戶(hù)在使用之前填寫(xiě)相應(yīng)ILS讓系統(tǒng)記錄和識(shí)別他們的學(xué)習(xí)風(fēng)格。然而這種模式在大規(guī)模在線(xiàn)學(xué)習(xí)環(huán)境的應(yīng)用情況下(如MOOC模式),其使用范圍就受到較多的限制:首先,由于系統(tǒng)是開(kāi)放給大量不同背景、不同學(xué)習(xí)目的的學(xué)習(xí)者使用,在學(xué)習(xí)前要完成2~5 min的測(cè)試問(wèn)卷對(duì)于很多人來(lái)說(shuō)是件價(jià)值不大的事情,導(dǎo)致填寫(xiě)完成率不高,在數(shù)據(jù)質(zhì)量上也存在較多的隱患,無(wú)法準(zhǔn)確得到初始學(xué)習(xí)風(fēng)格狀態(tài)。其次,學(xué)習(xí)是一個(gè)動(dòng)態(tài)的過(guò)程,F(xiàn)SLSM的幾個(gè)維度在學(xué)習(xí)的不同階段可能會(huì)發(fā)生變化[16],比如在課程學(xué)習(xí)過(guò)程比較順暢時(shí),大部分人在“理解”維度將會(huì)是“順序型”,行為上是按照設(shè)計(jì)的學(xué)習(xí)路線(xiàn)順序?qū)W習(xí);而在遇到難點(diǎn)時(shí),從行為上則會(huì)變?yōu)椤叭中汀保S性地往前回顧或往后跳過(guò)難點(diǎn)。
實(shí)現(xiàn)基于FSLSM的學(xué)習(xí)風(fēng)格測(cè)量主要有兩類(lèi)方法:一類(lèi)方法是通過(guò)對(duì)學(xué)習(xí)者學(xué)習(xí)行為進(jìn)行建模,將相關(guān)用戶(hù)行為模式進(jìn)行標(biāo)記,并通過(guò)決策樹(shù)和隱藏馬爾科夫過(guò)程[17]或貝葉斯網(wǎng)絡(luò)[18-19]來(lái)分析和預(yù)測(cè)用戶(hù)可能的學(xué)習(xí)風(fēng)格。這種方法的局限在于每一門(mén)課程對(duì)于每一位學(xué)習(xí)者的學(xué)習(xí)難度和背景知識(shí)都是不同的,固定的參數(shù)體系很難適用于大規(guī)模在線(xiàn)學(xué)習(xí)環(huán)境中的所有課程;另一類(lèi)方法是通過(guò)使用一套規(guī)則體系來(lái)定性衡量某種行為的得分,并將這一類(lèi)行為次數(shù)進(jìn)行累計(jì)后依據(jù)FSLSM推斷該用戶(hù)屬于哪類(lèi)學(xué)習(xí)風(fēng)格。這種方法適用于任何通過(guò)系統(tǒng)記錄學(xué)習(xí)者在線(xiàn)學(xué)習(xí)過(guò)程數(shù)據(jù)的課程,具有一定的適應(yīng)性,但是在不同課程和用戶(hù)的情況下,每種行為所具備的權(quán)重都可能不同,因此在預(yù)測(cè)精度方面存在較大的偏差。
近年來(lái),隨著人工智能和智能分析方法的快速發(fā)展,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)在機(jī)器學(xué)習(xí)領(lǐng)域得到了廣泛應(yīng)用,特別是圖像、語(yǔ)音和語(yǔ)義識(shí)別方面,部分改進(jìn)后的CNN模型在識(shí)別酒店評(píng)論的情感分類(lèi)問(wèn)題中準(zhǔn)確率可達(dá)95.19%[20]。因此通過(guò)智能算法實(shí)時(shí)分析用戶(hù)在LMS中的學(xué)習(xí)行為數(shù)據(jù),動(dòng)態(tài)地識(shí)別用戶(hù)學(xué)習(xí)行為風(fēng)格,系統(tǒng)地為各個(gè)用戶(hù)提供相適應(yīng)的個(gè)性化內(nèi)容、學(xué)習(xí)路徑以及學(xué)習(xí)方法,從而能夠有效提高用戶(hù)的學(xué)習(xí)效率。在上一章中所提到的兩種方法能夠提供一定程度上的識(shí)別和預(yù)測(cè)能力,但在實(shí)際應(yīng)用中也存在非常明顯的限制,例如學(xué)生可能會(huì)根據(jù)其背景知識(shí)和學(xué)習(xí)習(xí)慣而導(dǎo)致在不同的課程表現(xiàn)出完全不同的學(xué)習(xí)行為,而且即便是在同一門(mén)課程中若具有難度顯著不同的章節(jié),學(xué)習(xí)行為和風(fēng)格也會(huì)發(fā)生變化。在有老師面授的情況下,可以由老師根據(jù)學(xué)生的反饋來(lái)調(diào)整教學(xué)進(jìn)度和教學(xué)方法;然而在大規(guī)模在線(xiàn)學(xué)習(xí)環(huán)境下,傳統(tǒng)的學(xué)習(xí)平臺(tái)將無(wú)法為具有不同學(xué)習(xí)習(xí)慣和能力的學(xué)生提供有效的教學(xué)服務(wù),因此動(dòng)態(tài)地識(shí)別學(xué)習(xí)者學(xué)習(xí)風(fēng)格并及時(shí)地為其提供合適的教學(xué)路徑和內(nèi)容是非常核心而重要的功能。
為了識(shí)別每個(gè)用戶(hù)情況,首先需要根據(jù)FSLSM所定義的四個(gè)維度八個(gè)方向?qū)τ脩?hù)的靜態(tài)和動(dòng)態(tài)學(xué)習(xí)風(fēng)格進(jìn)行建模,系統(tǒng)才能動(dòng)態(tài)地為學(xué)習(xí)者提供相應(yīng)的教學(xué)方法。比如,對(duì)反思型的學(xué)習(xí)者應(yīng)該使用基于問(wèn)題的學(xué)習(xí)方法(Problem Based Learning,PBL),利用問(wèn)題去引導(dǎo)學(xué)生學(xué)習(xí)并找到答案;而對(duì)于主動(dòng)型的學(xué)習(xí)者,他們傾向于主動(dòng)去獲取信息,因此可持續(xù)地將課程的在線(xiàn)社區(qū)中的最新帖子推送給他們,這將有助于他們深入而高效地學(xué)習(xí)。
本文設(shè)計(jì)的學(xué)習(xí)風(fēng)格模型可由用戶(hù)在不同時(shí)刻所表現(xiàn)出的狀態(tài)加以刻畫(huà)。第i個(gè)用戶(hù)在t時(shí)刻的狀態(tài)Ui,t定義如下:
其中Di為用戶(hù)i的人口分布數(shù)據(jù)(包含用戶(hù)年齡、性別、所在院校、所學(xué)專(zhuān)業(yè)等四個(gè)維度),學(xué)習(xí)風(fēng)格Li,t由學(xué)習(xí)風(fēng)格的四個(gè)維度及其權(quán)重加以描述:
對(duì)于t=0時(shí)的初始學(xué)習(xí)風(fēng)格,可由該用戶(hù)在其他課程學(xué)習(xí)的最后狀態(tài)加以確定,若不存在前序課程學(xué)習(xí)風(fēng)格,則通過(guò)人口特征初始化賦值。初始化后,將通過(guò)持續(xù)的學(xué)習(xí)行為監(jiān)測(cè)來(lái)動(dòng)態(tài)更新每個(gè)時(shí)刻t的用戶(hù)學(xué)習(xí)風(fēng)格狀態(tài)。
根據(jù)FSLSM體系,用戶(hù)學(xué)習(xí)行為的維度和程度可以通過(guò)不同的學(xué)習(xí)者學(xué)習(xí)行為序列來(lái)反映,F(xiàn)SLSM同時(shí)也提供了一套ILS量表來(lái)進(jìn)行測(cè)量。然而,由于課程結(jié)構(gòu)的不同以及學(xué)生在課程學(xué)習(xí)過(guò)程中所面臨的壓力不同有可能導(dǎo)致學(xué)習(xí)風(fēng)格發(fā)生變化,靜態(tài)的ILS量表將難以準(zhǔn)確刻畫(huà)學(xué)習(xí)者的學(xué)習(xí)風(fēng)格,而通過(guò)對(duì)用戶(hù)行為進(jìn)行歸類(lèi)并且進(jìn)行相應(yīng)分析將會(huì)得出更加有效的結(jié)果。按照FSLSM的維度,本文將用戶(hù)學(xué)習(xí)特征進(jìn)行了歸類(lèi)匯總,如表1所示。
表1 基于FSLSM體系的用戶(hù)行為模式歸類(lèi)
Graf曾提出一種在LMS中通過(guò)分析學(xué)習(xí)行為來(lái)判斷學(xué)習(xí)風(fēng)格的方法:通過(guò)設(shè)定一系列學(xué)習(xí)行為計(jì)數(shù)的閾值來(lái)處理學(xué)習(xí)過(guò)程完成之后的學(xué)習(xí)行為數(shù)據(jù),通過(guò)不同學(xué)習(xí)行為的比例綜合判斷用戶(hù)所屬的學(xué)習(xí)風(fēng)格維度[21]。但是由于需要使用學(xué)習(xí)過(guò)程完成后的數(shù)據(jù)來(lái)進(jìn)行統(tǒng)一分析,因此該方法并不適用于對(duì)用戶(hù)學(xué)習(xí)行為的實(shí)時(shí)分析。然而,可以在這種方法基礎(chǔ)之上通過(guò)將用戶(hù)行為特征映射到學(xué)習(xí)風(fēng)格上,對(duì)用戶(hù)學(xué)習(xí)行為進(jìn)行動(dòng)態(tài)識(shí)別。本文建立的映射關(guān)系如表2所示。
表2 用戶(hù)實(shí)時(shí)行為與學(xué)習(xí)風(fēng)格傾向映射關(guān)系
由于每個(gè)時(shí)刻的用戶(hù)學(xué)習(xí)風(fēng)格可視為一個(gè)時(shí)間狀態(tài)下的行為切片,學(xué)習(xí)風(fēng)格識(shí)別模塊持續(xù)對(duì)輸入的用戶(hù)行為切片進(jìn)行識(shí)別,同時(shí),為刻畫(huà)過(guò)渡過(guò)程還應(yīng)考慮前序狀態(tài)。每一類(lèi)日志被映射為基于時(shí)間的多維序列,序列上的節(jié)點(diǎn)根據(jù)其行為特征不同而具有不同屬性,所有屬性統(tǒng)一進(jìn)行歸一化。以學(xué)習(xí)密度日志為例,序列LEi,j節(jié)點(diǎn)根據(jù)特定用戶(hù)的學(xué)習(xí)時(shí)間和相對(duì)學(xué)習(xí)進(jìn)度映射到按天為單位的學(xué)習(xí)進(jìn)度:
其中,tvi是每一個(gè)學(xué)習(xí)活動(dòng)i的視頻播放時(shí)間,而T是課程的總視頻長(zhǎng)度,ti是學(xué)習(xí)的絕對(duì)時(shí)間長(zhǎng)度,Cj是學(xué)習(xí)內(nèi)容區(qū)塊的索引ID。以某MOOC平臺(tái)課程《數(shù)據(jù)結(jié)構(gòu)》為例,23 000多名學(xué)生進(jìn)行了學(xué)習(xí),這門(mén)課程包含8章,整個(gè)有效學(xué)習(xí)時(shí)長(zhǎng)為74天。將隨機(jī)選擇的兩名學(xué)生的學(xué)習(xí)密度日志進(jìn)行可視化后,得到圖2結(jié)果。
圖2 兩個(gè)隨機(jī)用戶(hù)學(xué)習(xí)行為圖譜對(duì)比
圖2中的兩個(gè)用戶(hù)學(xué)習(xí)行為顯示了兩種完全不同的學(xué)習(xí)風(fēng)格,分別體現(xiàn)在感知維度(主動(dòng)型/反思型)和理解維度(順序型/全局型)。第4441580號(hào)用戶(hù)的順序?qū)W習(xí)行為均勻分布在整個(gè)學(xué)習(xí)過(guò)程中,在學(xué)期即將結(jié)束也進(jìn)行了大量的復(fù)習(xí)行為顯示了明顯的反思型和順序型的特征;而對(duì)應(yīng)的,第6565569號(hào)用戶(hù)密集地在學(xué)期剛開(kāi)始的時(shí)間把所有的課程都學(xué)習(xí)完畢,充分體現(xiàn)了主動(dòng)型和全局型的特征。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一類(lèi)前饋型神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)算法在模式識(shí)別領(lǐng)域的一種有效應(yīng)用。在學(xué)習(xí)風(fēng)格識(shí)別領(lǐng)域,Bernard等曾對(duì)神經(jīng)網(wǎng)絡(luò)、遺傳算法、聚類(lèi)算法和粒子群優(yōu)化算法這四類(lèi)智能分析算法在學(xué)習(xí)風(fēng)格識(shí)別方面的應(yīng)用進(jìn)行了綜合比較,神經(jīng)網(wǎng)絡(luò)以80.7%的精度取得了最好的識(shí)別效果[22]。然而由于CNN一般要求輸入是固定長(zhǎng)度的,因此較為適用于在取得了完整的學(xué)習(xí)記錄后對(duì)學(xué)習(xí)者學(xué)習(xí)風(fēng)格進(jìn)行識(shí)別。那么如何能夠在學(xué)習(xí)過(guò)程中根據(jù)收集到的學(xué)習(xí)行為數(shù)據(jù)動(dòng)態(tài)地識(shí)別學(xué)習(xí)者學(xué)習(xí)風(fēng)格?引入了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)。
RNN是近期研究較多的另外一種神經(jīng)網(wǎng)絡(luò),神經(jīng)元之間既有內(nèi)部的反饋連接又有前饋連接,被設(shè)計(jì)用于處理變長(zhǎng)的序列化數(shù)據(jù),通常用于連續(xù)的自然語(yǔ)言或相關(guān)時(shí)序敏感的處理領(lǐng)域[23]。通過(guò)在卷積層之間增加了一個(gè)隱含狀態(tài)并傳遞到下一次迭代中,實(shí)現(xiàn)對(duì)前序狀態(tài)的記憶和計(jì)算。標(biāo)準(zhǔn)的RNN通常使用如下算法來(lái)更新隱含狀態(tài)ht:
其中,g通常是一個(gè)類(lèi)似sigmoid的平滑閾值函數(shù),xt是t時(shí)刻的輸入單元值。RNN的輸出通常為在給定的狀態(tài)ht下,輸出序列下一個(gè)可能的值及其概率。然而,不同的特征值在輸入序列之間可能間隔較遠(yuǎn)的情況下RNN的隱含層會(huì)逐漸衰減掉對(duì)于這些特征值的記憶,從而導(dǎo)致標(biāo)準(zhǔn)RNN無(wú)法處理具有長(zhǎng)期依賴(lài)特性的序列。在學(xué)習(xí)風(fēng)格識(shí)別問(wèn)題中,由于同一學(xué)習(xí)者的初始和前期的學(xué)習(xí)風(fēng)格特征對(duì)于后期可能的學(xué)習(xí)風(fēng)格變化會(huì)產(chǎn)生一定的影響,因此需要在預(yù)測(cè)過(guò)程中記錄并考慮這些歷史狀態(tài)。由Hochreiter&Schmidhuber在1997年提出的長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)能夠很好地解決這個(gè)問(wèn)題,通過(guò)在RNN的單元結(jié)構(gòu)中增加輸入門(mén)、遺忘門(mén)和輸出門(mén)來(lái)實(shí)現(xiàn)在重復(fù)循環(huán)下對(duì)有效信息的記憶。門(mén)控循環(huán)單元(Gated Recurrent Unit,GRU)則是為了解決在RNN中常見(jiàn)的梯度消失問(wèn)題而對(duì)LSTM做出的改進(jìn)[24],在邏輯上將輸入門(mén)和遺忘門(mén)合成為一個(gè)更新門(mén),由更新門(mén)和輸出門(mén)共同控制新隱藏狀態(tài),在這個(gè)模型中隱含狀態(tài)ht通過(guò)式(5)計(jì)算得出:
其中,更新門(mén)zt定義為:
rt為重置門(mén):
GRU的特點(diǎn)對(duì)于處理學(xué)習(xí)風(fēng)格具有很大優(yōu)勢(shì),前期記憶下來(lái)的學(xué)習(xí)風(fēng)格歷史在識(shí)別和預(yù)測(cè)后續(xù)學(xué)習(xí)風(fēng)格時(shí)能夠被關(guān)聯(lián)進(jìn)來(lái),而且相對(duì)LSTM RNN而言GRU的計(jì)算量也要小,更加適合實(shí)時(shí)計(jì)算。
本文設(shè)計(jì)的動(dòng)態(tài)學(xué)習(xí)風(fēng)格識(shí)別模型結(jié)合了CNN和GRU的優(yōu)勢(shì),由兩個(gè)核心模塊組成:識(shí)別器和推理機(jī)。第一部分核心是“識(shí)別器”,它是一個(gè)典型多層CNN模型,主要用于處理輸入的七類(lèi)用戶(hù)行為序列,輸出所識(shí)別用戶(hù)的相應(yīng)學(xué)習(xí)風(fēng)格。由于學(xué)習(xí)行為序列特征值在某些通道上較為稀疏,且某些部分的行為具有一定的模式性,但在時(shí)間或內(nèi)容上跨度較大的問(wèn)題。為了在較大跨度上提取用戶(hù)行為特征,嘗試引入空洞卷積(Dilated Convolution)??斩淳矸e是通過(guò)在卷積層引入定義卷積核處理數(shù)據(jù)時(shí)各值的間距的“擴(kuò)張率(dilation rate)”,用以調(diào)整卷積核的“疏松”程度。例如:一個(gè)擴(kuò)張率為2的3×3卷積核,感受野與5×5的卷積核相同,而參數(shù)仍為9個(gè),并沒(méi)有增加,因此在相同的計(jì)算條件下,空洞卷積提供了更大的感受野。第二部分是將“識(shí)別器”的輸出連接到“推理機(jī)”模塊,設(shè)計(jì)的推理機(jī)是一個(gè)GRU RNN,通過(guò)給定的Li,t,來(lái)預(yù)測(cè)Li,t+1,由于可以通過(guò)隱含狀態(tài)將學(xué)習(xí)者過(guò)去的學(xué)習(xí)風(fēng)格在多個(gè)GRU層中進(jìn)行記憶和傳遞,因而可以使系統(tǒng)的預(yù)測(cè)結(jié)果更加貼近學(xué)習(xí)者的個(gè)人特征。整個(gè)“識(shí)別-推理”雙層模型邏輯結(jié)構(gòu)示意如圖3。
圖3 “識(shí)別-推理”學(xué)習(xí)者學(xué)習(xí)風(fēng)格動(dòng)態(tài)分析模型
本文采集了使用近3個(gè)月的某MOOC平臺(tái)的部分用戶(hù)行為數(shù)據(jù)進(jìn)行分析,包含153 550名獨(dú)立用戶(hù)在968門(mén)課程上的學(xué)習(xí)行為:7 350 367條學(xué)習(xí)導(dǎo)航及視頻觀看記錄、31 942條課程論壇/發(fā)帖記錄。首先對(duì)學(xué)習(xí)有效長(zhǎng)度小于3的數(shù)據(jù)進(jìn)行了清洗和過(guò)濾,過(guò)濾完成后剩余103 426名用戶(hù)的相關(guān)數(shù)據(jù)。由于訓(xùn)練數(shù)據(jù)集是已經(jīng)存在的歷史數(shù)據(jù),可以按照Sabine Graf的方法[21]根據(jù)FSLSM的相關(guān)定義使用閾值法來(lái)推定各個(gè)用戶(hù)的學(xué)習(xí)風(fēng)格。預(yù)處理完成后的數(shù)據(jù)按課程為組隨機(jī)亂序后按照80%(82 740名用戶(hù))定義為訓(xùn)練數(shù)據(jù)集,而20%(20 686名用戶(hù))定義為測(cè)試數(shù)據(jù)集。
本文模型使用Google推出的TensorFlow 1.2.1實(shí)現(xiàn),使用訓(xùn)練和測(cè)試數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練和測(cè)試。通過(guò)多次試驗(yàn)對(duì)比,CNN模型的輸入層按照輸入向量的特征設(shè)計(jì)由324個(gè)單元組成,隱含層包含128個(gè)單元,使用ReLU激活函數(shù);使用擴(kuò)張率為2的3×3卷積核;輸出層對(duì)應(yīng)為四個(gè)維度的學(xué)習(xí)風(fēng)格輸出Li,t,使用softmax激活函數(shù),應(yīng)用自適應(yīng)時(shí)刻估計(jì)(Adaptive Moment Estimation,Adam)優(yōu)化算法[25],收斂速度最佳。在學(xué)習(xí)批次為10,學(xué)習(xí)率設(shè)定為0.000 1的情況下學(xué)習(xí)效率最佳。
通過(guò)使用測(cè)試數(shù)據(jù)集對(duì)調(diào)試和訓(xùn)練過(guò)的模型進(jìn)行最終測(cè)試,將預(yù)測(cè)結(jié)果與測(cè)試數(shù)據(jù)在學(xué)習(xí)風(fēng)格的四個(gè)維度分別相比,最佳準(zhǔn)確率可以達(dá)到90.765%。相對(duì)Bernard等所使用的LSID-ANN模型[22],本文使用的改進(jìn)CNN模型(I-CNN)模型在隱含節(jié)點(diǎn)數(shù)量和卷積方式等的方面都有一定的優(yōu)化,在學(xué)習(xí)風(fēng)格四個(gè)維度上的識(shí)別精度對(duì)比如圖4。
圖4 I-CNN模型與LSID-ANN模型精度對(duì)比
從測(cè)試數(shù)據(jù)應(yīng)用結(jié)果的分析看,發(fā)現(xiàn)在學(xué)習(xí)過(guò)程中存在用戶(hù)學(xué)習(xí)風(fēng)格發(fā)生變化的情況,如表3所示,一共出現(xiàn)了1 828次學(xué)習(xí)風(fēng)格變化事件,其中1 125次(61.54%)發(fā)生在計(jì)算機(jī)、工程、電子等科學(xué)工程類(lèi)課程中,說(shuō)明課程內(nèi)容的難度和結(jié)構(gòu)設(shè)置會(huì)影響學(xué)習(xí)者學(xué)習(xí)風(fēng)格使之在學(xué)習(xí)過(guò)程中發(fā)生變化,同時(shí)從目前課程結(jié)構(gòu)設(shè)置上看,發(fā)生在科學(xué)及工程類(lèi)課程的偏多一些。
表3 測(cè)試數(shù)據(jù)集中發(fā)生的學(xué)習(xí)風(fēng)格變化事件統(tǒng)計(jì)
另一方面,在輸入維度上可以看出視覺(jué)型/言語(yǔ)型的轉(zhuǎn)化也相對(duì)偏少,這主要是因?yàn)樵贛OOC模式下大部分內(nèi)容本身就是視頻或圖片格式,而基于文字的閱讀內(nèi)容提供較少。明顯看出,從反思型到主動(dòng)型的用戶(hù)較多,從數(shù)據(jù)上推斷主要是由于學(xué)習(xí)者在課程論壇中的活動(dòng)所帶來(lái)的積極影響,這為后續(xù)教學(xué)法的設(shè)計(jì)提供了一定的參考,即通過(guò)課程論壇推送等主動(dòng)推送方式是有可能增加學(xué)生參與度的。但在學(xué)習(xí)路徑的優(yōu)化方面,以及基于視覺(jué)或言語(yǔ)型的學(xué)習(xí)材料如何能夠取得更好的效果,在本階段的研究中的體現(xiàn)還不夠明顯,需要在后續(xù)研究中進(jìn)一步加強(qiáng)內(nèi)容形式以及學(xué)習(xí)路徑的測(cè)試和對(duì)比研究。
本文在對(duì)Felder-Silverman學(xué)習(xí)風(fēng)格模型深入分析基礎(chǔ)之上,提出了一套適用于大規(guī)模在線(xiàn)學(xué)習(xí)環(huán)境中動(dòng)態(tài)分析學(xué)習(xí)者風(fēng)格的模型和方法。主要的研究結(jié)果包括以下幾個(gè)方面:(1)本文所設(shè)計(jì)的復(fù)合神經(jīng)網(wǎng)絡(luò)模型通過(guò)引入空洞卷積等手段,提高了對(duì)學(xué)習(xí)行為特征的識(shí)別精度。(2)學(xué)習(xí)風(fēng)格在同一門(mén)課程中也有可能發(fā)生改變,而非一成不變。實(shí)驗(yàn)表明,即使對(duì)于同一個(gè)學(xué)習(xí)者,由于課程內(nèi)容和難度的變化,其學(xué)習(xí)風(fēng)格在各個(gè)維度上都有可能發(fā)生變化,因此需要?jiǎng)討B(tài)根據(jù)學(xué)習(xí)者的學(xué)習(xí)風(fēng)格為其提供相應(yīng)適應(yīng)的學(xué)習(xí)方法。(3)基于LSTM的GRU設(shè)計(jì)可以幫助模型記憶學(xué)習(xí)者曾經(jīng)有過(guò)的學(xué)習(xí)風(fēng)格,所輸出的結(jié)果更加貼近用戶(hù)個(gè)性?,F(xiàn)階段僅在基于互聯(lián)網(wǎng)的智能教學(xué)方面進(jìn)行了比較初步的探索和嘗試,下一步將在教學(xué)法和教學(xué)內(nèi)容的設(shè)計(jì),應(yīng)用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)線(xiàn)上線(xiàn)下結(jié)合的教學(xué)協(xié)同優(yōu)化等方面進(jìn)行深入研究和實(shí)踐。
[1] Klobas J E.Measuring the success of scaleable open online courses[J].Performance Measurement&Metrics,2014,15(3):145-162.
[2] Viola S R,Graf S,Kinshuk,et al.Analysis of feldersilverman index of learning styles by a data-driven statistical approach[C]//Eighth IEEE International Symposium on Multimedia,2006:959-964.
[3] Gesa R F,Lázaro J L M,Carrillo C I P D.Teaching support units[M]//Computers and Education in the 21st Century.Netherlands:Springer,2000:163-174.
[4] Demirkan H.An inquiry into the learning-style and knowledge-building preferences of interior architecture students[J].Design Studies,2016,44:28-51.
[5] Dissanayake D,Perera T,Elladeniya C,et al.Identifying the learning style of students in MOOCs using video interactions[C]//International Conference on Society,Education and Psychology,2017.
[6] 王若賓,付瑞平,程楠楠,等.學(xué)習(xí)風(fēng)格對(duì)大學(xué)計(jì)算機(jī)課程MOOC學(xué)習(xí)的影響[J].計(jì)算機(jī)教育,2016(10):106-108.
[7] Felder R M,Spurlin J.Application,reliability and validity of the index of learning styles[J].International Journal of Continuing Engineering Education and Life-Long Learning,2005,21(1):103-112.
[8] Bicans J,Grundspenkis J.Student learning style extraction from on-campus learning context data[J].Procedia Computer Science,2017:272-278.
[9] 羅凌,楊有,馬燕.基于模糊C均值的在線(xiàn)協(xié)作學(xué)習(xí)混合分組研究[J].計(jì)算機(jī)工程與應(yīng)用,2017,53(16):68-73.
[10] Felder R M.Reaching the second tier—learning and teaching styles in college science education[J].Journal of College Science Teaching,1993,22(5):286-290.
[11] Graf S.Adaptivity in Learning management systems focussing on learning styles[C]//Proceedings of the 2009 IEEE/WIC/ACM International Conference,Vienna,December 2007:71.
[12] Kolb D.Experiential learning:Experience as the source of learning and development[J].Pearson Schweiz Ag,1984,1(3):16-17.
[13] Pask G.Styles and strategies of learning[J].British Journal of Educational Psychology,1976,46(2):128-148.
[14] Myers I B.Manual:The myers-briggs type indicator[M].Palo Alto,CA:Consulting Psychologists Press,1983.
[15] Felder R M,Soloman B A.Index of learning styles questionnaire[EB/OL].(2007-11-30).http://www.engr.ncsu.edu/learningstyles/ilsweb.html.
[16] Felder R M,Spurlin J E.Applications,reliability and validity of the index of learning styles[J].International Journal of Continuing Engineering Education and Life-Long Learning,2005,21(1):103-112.
[17] Cha H J,Yong S K,Park S H,et al.Learning styles diagnosis based on user interface behaviors for the customization of learning interfaces in an intelligent tutoring system[C]//Proceedings International Conference on Intelligent Tutoring Systems(ITS 2006),Jhongli,Taiwan,China,June 26-30,2006:513-524.
[18] García P,Amandi A,Schiaffino S,et al.Evaluating Bayesian networks’precision for detecting students’learning styles[J].Computers&Education,2007,49(3):794-808.
[19] 王晨煜,管明輝,殷傳濤,等.基于Felder-Silverman學(xué)習(xí)風(fēng)格模型的網(wǎng)絡(luò)學(xué)習(xí)風(fēng)格研究[J].重慶理工大學(xué)學(xué)報(bào),2017,31(2):102-109.
[20] 張綺琦,張樹(shù)群,雷兆宜.基于改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的中文情感分類(lèi)[J].計(jì)算機(jī)工程與應(yīng)用,2017,53(22):111-115.
[21] Graf S,Kinshuk P.An approach for detecting learning styles in learning management systems[C]//IEEE International Conference on Advanced Learning Technologies,2006:161-163.
[22] Bernard J,Chang T W,Popescu E,et al.Learning style Identifier:Improving the precision of learning style identification through computational intelligence algorithms[J].Expert Systems with Applications,2017,75:94-108.
[23] Hidasi B,Karatzoglou A,Baltrunas L,et al.Session-based recommendationswithrecurrentneuralnetworks[J].Computer Science,2015.
[24] Cho K,Merrienboer B V,Bahdanau D,et al.On the properties of neural machine translation:Encoder-decoder approaches[J].Computer Science,2014.
[25] Kingma D P,Ba J.Adam:A method for stochastic optimization[J].Computer Science,2014.
LI Chao,ZHOU Hong.Research on dynamic learning style identification based on hybrid Neural Networks.Computer Engineering andApplications,2018,54(6):150-155.
LI Chao,ZHOU Hong
School of Economics and Management,Beihang University,Beijing 100191,China
The emergence of Massive Open Online Courses(MOOCs)in 2012 has been boomed in recent years,learners’learning behaviors can be recorded and analyzed by the system.According Felder-Silverman learning style model,this paper applies a hybrid Neural Networks(NN)which combines a Convolutional Neural Networks(CNN)and connects with a Gated Recurrent Unit(GRU)based Recurrent Neural Networks(RNN),to detecte learning style dynamically.The model is applied in analyzing the learners’learning behavior,including online-community interaction,learning content browsing log,click and drag the behavior,identifying learning style dynamically,and the using GRU based RNN to process and predict the possible learning styles and provides learning content and path for optimizing learning process efficiency,improving learning experience,supports large-scale,personalized and high quality education.
learning styles;machine learning;Gated Recurrent Unit(GRU);learning management system;Massive Open Online Courses(MOOCs)
近年隨著慕課(MOOC)等新興教育教學(xué)手段的快速發(fā)展,大量的學(xué)習(xí)者學(xué)習(xí)行為可以被系統(tǒng)所記錄和分析,從而為個(gè)性化教學(xué)奠定了重要基礎(chǔ)。在Felder-Silverman學(xué)習(xí)風(fēng)格模型的理論基礎(chǔ)上,通過(guò)引入智能分析算法動(dòng)態(tài)地分析和識(shí)別學(xué)習(xí)者學(xué)習(xí)風(fēng)格,構(gòu)建了一套融合了卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的“識(shí)別-推理”復(fù)合模型,通過(guò)學(xué)習(xí)者的線(xiàn)上學(xué)習(xí)行為、社區(qū)交互行為、學(xué)習(xí)內(nèi)容瀏覽行為、點(diǎn)擊拖動(dòng)行為等學(xué)習(xí)過(guò)程識(shí)別其學(xué)習(xí)行為特征,并使用基于門(mén)控循環(huán)單元(Gated Recurrent Unit,GRU)的循環(huán)神經(jīng)網(wǎng)絡(luò)處理和預(yù)測(cè)其可能的學(xué)習(xí)風(fēng)格及對(duì)學(xué)習(xí)內(nèi)容形式的偏好,以更高效地為學(xué)習(xí)者提供適應(yīng)于其學(xué)習(xí)風(fēng)格的學(xué)習(xí)內(nèi)容和路徑,優(yōu)化學(xué)習(xí)體驗(yàn),為大規(guī)模、個(gè)性化和高質(zhì)量的下一代學(xué)習(xí)平臺(tái)提供技術(shù)支撐。
學(xué)習(xí)風(fēng)格;機(jī)器學(xué)習(xí);門(mén)控循環(huán)單元(GRU);學(xué)習(xí)管理系統(tǒng);大規(guī)模在線(xiàn)開(kāi)放課程(MOOCs)
2018-01-26
2018-02-28
1002-8331(2018)06-0150-06
A
TP18
10.3778/j.issn.1002-8331.1801-0410
“聯(lián)合國(guó)教科文組織國(guó)際工程科技知識(shí)中心”建設(shè)項(xiàng)目。
李超(1978—),男,在讀博士生,研究領(lǐng)域?yàn)楣芾砜茖W(xué)與工程、智能優(yōu)化算法和教育過(guò)程管理,E-mail:lichao.sem@buaa.edu.cn;周泓(1965—),男,教授,研究領(lǐng)域?yàn)楣芾硐到y(tǒng)的優(yōu)化理論與仿真。