吳 強(qiáng)
(安徽建筑大學(xué) 電子與信息工程學(xué)院,合肥 230088)
在素質(zhì)教育理念不斷深化的背景下,計(jì)算機(jī)課程的教學(xué)目標(biāo)不僅要讓學(xué)生掌握計(jì)算機(jī)系統(tǒng)的相關(guān)技術(shù)和應(yīng)用,還要在此基礎(chǔ)上實(shí)現(xiàn)學(xué)生真正意義上的計(jì)算機(jī)知識(shí)學(xué)習(xí)。[1]然而,就目前計(jì)算機(jī)課程的現(xiàn)狀而言,由于傳統(tǒng)教育觀(guān)念的深刻影響,大多數(shù)學(xué)校仍然沿用傳統(tǒng)的整課教學(xué)模式。[2-3]這就導(dǎo)致課堂氣氛沉悶,很難調(diào)動(dòng)學(xué)生參與的積極性,加上計(jì)算機(jī)是一門(mén)操作性很強(qiáng)的課程,僅僅依靠教師講解理論知識(shí),而不允許學(xué)生進(jìn)行實(shí)際操作,學(xué)生很難真正掌握所學(xué)內(nèi)容。[4-5]久而久之,學(xué)生就會(huì)對(duì)學(xué)習(xí)計(jì)算機(jī)課程失去熱情,因此有必要對(duì)當(dāng)前的計(jì)算機(jī)課程進(jìn)行改革。而學(xué)生的文化背景可以通過(guò)影響學(xué)生的內(nèi)隱狀態(tài)對(duì)其學(xué)習(xí)狀況產(chǎn)生直接的影響,對(duì)學(xué)生的教育背景進(jìn)行數(shù)據(jù)挖掘,并且結(jié)合當(dāng)前的計(jì)算機(jī)課程教育,可以了解影響學(xué)生在學(xué)習(xí)過(guò)程中的學(xué)習(xí)心態(tài),并幫助教師及時(shí)調(diào)整教學(xué)方案。[6-7]另外,在現(xiàn)代課程不斷發(fā)展、教育方法不斷創(chuàng)新的背景下,認(rèn)知診斷作為教育數(shù)據(jù)挖掘中的一項(xiàng)重要研究,在學(xué)生評(píng)價(jià)中發(fā)揮著舉足輕重的作用。[8-10]因此,研究將教育背景特征引入學(xué)生在計(jì)算機(jī)課程學(xué)習(xí)中的認(rèn)知狀態(tài)診斷模型,提出了一種新穎的教育情境感知認(rèn)知診斷(Educational context-aware Cognitive Diagnosis,ECD)框架,其中包含教育情境建模階段和診斷增強(qiáng)階段。
教育情境是指與學(xué)生學(xué)習(xí)過(guò)程有關(guān)的各種特征,這些特征可能來(lái)自不同方面,例如父母的受教育程度、班級(jí)的學(xué)習(xí)風(fēng)氣等。以此為基礎(chǔ),研究探討了教育情境感知的認(rèn)知診斷問(wèn)題的具體定義。
假設(shè)在一個(gè)學(xué)習(xí)系統(tǒng)中有N個(gè)學(xué)生,T個(gè)教育背景問(wèn)題和M個(gè)練習(xí),可以表示為S={s1,s2,…,sN} ,Q={q1,q2,…,qT} ,ε={e1,e2,…,eM} 。日志R由教育背景下的問(wèn)題回應(yīng)記錄Rq和練習(xí)回應(yīng)記錄Re組成,被表示為三聯(lián)體的集合(s,e,rq)和(s,e,re),其中s∈S,e∈ε,q∈Q,rq是學(xué)生s對(duì)教育背景問(wèn)題q的回答,re是學(xué)生s對(duì)練習(xí)e的得分。那么這個(gè)問(wèn)題可以正式定義為通過(guò)給出學(xué)生的日志R={Rq,Re} ,推斷出學(xué)生的知識(shí)概念的熟練程度,并進(jìn)行學(xué)生的表現(xiàn)預(yù)測(cè)。
ECD框架的整體架構(gòu)由兩個(gè)階段組成:教育情境建模階段和診斷增強(qiáng)階段。一般來(lái)說(shuō),練習(xí)答題過(guò)程可以表述為式(1)。
式(1)中r指的是學(xué)生的反應(yīng),θ表示學(xué)生的知識(shí)熟練程度,θ表示練習(xí)參數(shù)e。F表示人工設(shè)計(jì)的認(rèn)知行為函數(shù),它對(duì)學(xué)生和練習(xí)參數(shù)之間的相互作用進(jìn)行建模并輸出反應(yīng)。考慮到學(xué)生的教育背景,研究進(jìn)一步將θ分為兩部分,如式(2)。
在式(2)中,其中θcontent是受教育情境影響的學(xué)生外部特質(zhì),θinner是傳統(tǒng)認(rèn)知診斷關(guān)注的學(xué)生內(nèi)在特質(zhì),G表示兩個(gè)學(xué)生特質(zhì)的影響函數(shù)。是學(xué)生的教育背景,H表示教育背景對(duì)學(xué)生外部特質(zhì)的影響函數(shù)θcontent,研究中主要關(guān)注這個(gè)問(wèn)題。
ECD 框架的整體架構(gòu)由兩個(gè)階段組成:教育情境建模階段和診斷增強(qiáng)階段。在教育情境建模階段,研究設(shè)計(jì)了注意網(wǎng)絡(luò)來(lái)模擬教育情境對(duì)θcontent的影響。具體來(lái)說(shuō),研究首先將不同的教育情境分為幾個(gè)領(lǐng)域,并分別用情境過(guò)濾層模擬個(gè)性化的影響。然后,研究在情境交互層中對(duì)不同領(lǐng)域之間的內(nèi)在相關(guān)性進(jìn)行建模。之后,情境聚合層捕捉領(lǐng)域?qū)用娴膫€(gè)性,并生成學(xué)生的外部特征θcontent。在診斷增強(qiáng)階段,研究將θcontent和θinner相結(jié)合,然后用認(rèn)知行為函數(shù)輸出預(yù)測(cè)得分。用學(xué)生的日志進(jìn)行訓(xùn)練后,可以得到每個(gè)學(xué)生的θ作為診斷結(jié)果。
在教育情境建模階段,研究設(shè)計(jì)了注意網(wǎng)絡(luò)來(lái)模擬教育情境對(duì)受教育背景影響的學(xué)生外在特質(zhì)θcontext的影響,整個(gè)網(wǎng)絡(luò)由四層組成:嵌入層、上下文過(guò)濾層、交互層和聚合層。
在嵌入層,該層用于為每個(gè)教育背景條目uj和每個(gè)學(xué)生st分配可訓(xùn)練的仿真標(biāo)簽。為每個(gè)上下文條目分配一個(gè)影響關(guān)鍵向量ck∈和一個(gè)影響值標(biāo)量cv,分別表示該上下文條目的潛在特征及其影響強(qiáng)度。對(duì)于每個(gè)學(xué)生st,指定一個(gè)可訓(xùn)練的學(xué)生潛在特征向量xt∈捕捉st對(duì)不同語(yǔ)境條目的適應(yīng)度。d1是手動(dòng)設(shè)置的向量尺寸。值得注意的是,同一語(yǔ)境特征的不同語(yǔ)境條目不會(huì)出現(xiàn)在一個(gè)學(xué)生身上。因此,對(duì)于m不同的語(yǔ)境特征,每個(gè)學(xué)生最多有m語(yǔ)境條目。在語(yǔ)境過(guò)濾層,教育情境可能涉及不同方面的特征,導(dǎo)致不適合對(duì)其影響進(jìn)行統(tǒng)一建模。因此,研究將教育背景條目U歸入背景字段C={C1,C2,…,CU} ,根據(jù)其內(nèi)容,其中Ci={Ci1,Ci2,…,Cimi} 。一般來(lái)說(shuō),一個(gè)上下文字段Ci包含上下文特征mi的條目。在此基礎(chǔ)上,考慮到對(duì)每個(gè)學(xué)生進(jìn)行個(gè)性化的情境影響,研究利用注意力機(jī)制來(lái)獲得不同情境條目的權(quán)重。圖1顯示了以注意力為基礎(chǔ)的過(guò)濾方法在每個(gè)情境領(lǐng)域的應(yīng)用。
圖1 以注意力為基礎(chǔ)的過(guò)濾方法
研究首先計(jì)算了學(xué)生特征xt和情境影響關(guān)鍵向量之間的余弦相似度,計(jì)算方式如式(1)。
在式(1)中,sim表示余弦相似度函數(shù),wi中的權(quán)重反映了學(xué)生在不同情境條目上的適應(yīng)性。最后,每個(gè)教育情境領(lǐng)域的影響是由該領(lǐng)域不同特征的加權(quán)和產(chǎn)生的,計(jì)算方式如式(2)。
在式(2)中,是中的第j個(gè)權(quán)重。影響強(qiáng)度vi是在考慮不同領(lǐng)域之間的相關(guān)性之前,來(lái)自情境領(lǐng)域Ci對(duì)學(xué)生st的總體影響強(qiáng)度。影響力類(lèi)型ki描述的是Ci的個(gè)性化潛在特征。而在語(yǔ)境互動(dòng)層,為了模擬不同教育情境領(lǐng)域之間的內(nèi)在關(guān)聯(lián)性,研究在交互層中引入了一個(gè)自我關(guān)注模塊。如圖2所示,在情境過(guò)濾層之后,可以得到教育情境場(chǎng)Ci的影響類(lèi)型ki和強(qiáng)度vi,這兩者都是由公式(2)個(gè)性化的。通過(guò)對(duì)ki的自我關(guān)注機(jī)制和對(duì)vi的權(quán)重wi進(jìn)行共享,可以模擬出教育情境領(lǐng)域之間的個(gè)性化的內(nèi)在關(guān)聯(lián)性。
圖2 上下文交互和聚合層
因此式(1)可以改寫(xiě)為式(3)。
在式(3)中,k=(k1,k2,…kU)。而影響類(lèi)型ki的模擬結(jié)果為k'i。在聚合層中,學(xué)生的潛在向量xt被用來(lái)計(jì)算k'i之間的相似性,以確保上下文領(lǐng)域的個(gè)性,同樣通過(guò)計(jì)算余弦相似度來(lái)進(jìn)行。另外,學(xué)生的外部特質(zhì)θcontext是對(duì)學(xué)生認(rèn)知狀態(tài)的全局性和不可察覺(jué)的影響,而從學(xué)生練習(xí)記錄中推斷出的學(xué)生內(nèi)在特質(zhì)θinner是學(xué)生能力或知識(shí)熟練程度的局部反映,因此,研究中需要綜合考慮這兩個(gè)因素。θcontext的計(jì)算方式如式(4)。
在診斷增強(qiáng)階段,研究結(jié)合學(xué)生外在特質(zhì)θcontext和學(xué)生內(nèi)在特質(zhì)θinner然后用認(rèn)知行為函數(shù)輸出預(yù)測(cè)分?jǐn)?shù)。用學(xué)生的日志R訓(xùn)練后,可以得到每個(gè)學(xué)生的θ作為診斷結(jié)果。具體來(lái)說(shuō),研究首先用學(xué)生的潛質(zhì)向量來(lái)表示內(nèi)在特質(zhì)θinner。然后,選擇一種自適應(yīng)優(yōu)化的個(gè)性化加權(quán)方法,將學(xué)生的外部特征和內(nèi)部特征匯總為學(xué)生的最終狀態(tài)θ,計(jì)算方式如式(5)。
在式(5)中,dt是對(duì)每個(gè)學(xué)生st個(gè)性化的可訓(xùn)練權(quán)重,θ是學(xué)生的最終知識(shí)水平。對(duì)學(xué)生在練習(xí)中的反應(yīng)的預(yù)測(cè)可以表述為式(6)。
在式(6)中,CDMethod表示現(xiàn)有的認(rèn)知診斷模型,φe表示采用的傳統(tǒng)認(rèn)知診斷模型中與運(yùn)動(dòng)有關(guān)的參數(shù)(如運(yùn)動(dòng)難度b)。在模型學(xué)習(xí)過(guò)程中,研究在上下文建模中訓(xùn)練參數(shù),權(quán)重變量dt和現(xiàn)有方法中的參數(shù)φe和θinner。研究應(yīng)用多重學(xué)習(xí)方法來(lái)處理。具體來(lái)說(shuō),與二分類(lèi)任務(wù)中的常見(jiàn)方法一樣,研究中使用交叉熵作為損失函數(shù),如式(7)。
在式(7)中,r是模型的預(yù)測(cè)值,label是學(xué)生對(duì)練習(xí)的反應(yīng)的基本事實(shí)。為了使所有的參數(shù)得到良好的訓(xùn)練,研究調(diào)整損失函數(shù)如式(8)。
在式(8)中,rc表示只用來(lái)自教育背景的學(xué)生外部特質(zhì)進(jìn)行預(yù)測(cè),rexist表示只用現(xiàn)有方法進(jìn)行預(yù)測(cè)。α、β是權(quán)衡這三種損失的超參數(shù),loss'是最終損失函數(shù)。
研究使用PISA 2015數(shù)據(jù)集對(duì)所提出模型進(jìn)行訓(xùn)練和測(cè)試。研究主要選取了亞洲、歐洲、美洲三個(gè)地區(qū)的數(shù)據(jù),每個(gè)數(shù)據(jù)集中有300個(gè)與不同教育背景特征相關(guān)的不同問(wèn)題,并分別得到學(xué)生對(duì)總共260個(gè)科學(xué)認(rèn)知練習(xí)的回答記錄。最終,數(shù)據(jù)集中有80%用于訓(xùn)練,另外20%用于測(cè)試。
為了驗(yàn)證ECD模型情境過(guò)濾層的有效性,實(shí)驗(yàn)分析了教育情境特征的關(guān)注權(quán)重和學(xué)生的成績(jī)之間的關(guān)系。圖3中展示了來(lái)自教育情境領(lǐng)域“ESCS”家庭的十個(gè)不同學(xué)生的情境特征的例子??梢钥闯?,前5名學(xué)生(編號(hào)0-4)的平均得分較低,而后5名學(xué)生(編號(hào)5-9)的成績(jī)較高。具體來(lái)說(shuō),“書(shū)籍”指的是“你家里有多少書(shū)?”這個(gè)問(wèn)題,數(shù)字越大表示書(shū)越多。顯然,學(xué)生的答案和他們的表現(xiàn)之間存在著關(guān)聯(lián),即更多的書(shū)對(duì)學(xué)生的表現(xiàn)有更積極的影響。如圖3所示,低分段的學(xué)生對(duì)消極答案(如1、2)的關(guān)注度較高,而積極答案(如4、5、6)在高分段的學(xué)生中比重較大。此外,值得注意的是,對(duì)于一些高分的學(xué)生(8-9分)來(lái)說(shuō),書(shū)并不總是很多。在這種情況下,其他一些特征,如“電視”和“樂(lè)器”,可能會(huì)對(duì)學(xué)生產(chǎn)生積極的影響,與圖3樣本性質(zhì)相似。這說(shuō)明情境過(guò)濾層的關(guān)注機(jī)制可以合理地模擬不同特征對(duì)學(xué)生的個(gè)性化影響。
圖3 情景特征案例
為了說(shuō)明ECD框架的有效性,研究將各地區(qū)的平均診斷結(jié)果與PISA報(bào)告進(jìn)行了比較。具體來(lái)說(shuō),在PISA報(bào)告中,學(xué)生的科學(xué)素養(yǎng)被評(píng)估為區(qū)域?qū)用娴姆謹(jǐn)?shù)。研究以來(lái)自不同大陸的四個(gè)代表性地區(qū)為例,即新加坡、日本、美國(guó)和法國(guó),它們的分?jǐn)?shù)分別為54、53、49、49,在每個(gè)地區(qū),首先計(jì)算出平均知識(shí)熟練度,然后,把在所有知識(shí)概念中的分布情況直觀(guān)地顯示在圖4中??梢园l(fā)現(xiàn),各地區(qū)的順序與PISA的報(bào)告一致。
圖4 各地區(qū)科學(xué)素養(yǎng)評(píng)分診斷結(jié)果對(duì)比
圖5 為三種學(xué)習(xí)成效評(píng)估方法對(duì)比。其中,第一種學(xué)生成績(jī)?cè)u(píng)價(jià)方式為百分制的學(xué)生知識(shí)掌握程度均值,第二種學(xué)生成績(jī)?cè)u(píng)價(jià)方式為ECD模型,第三種學(xué)生成績(jī)?cè)u(píng)價(jià)方式為評(píng)價(jià)分?jǐn)?shù)的加權(quán)平均分??梢钥闯?,以學(xué)生知識(shí)點(diǎn)掌握程度為基礎(chǔ)得到的最終成績(jī)與學(xué)生的期末測(cè)驗(yàn)得分有相似的波動(dòng)趨勢(shì),圖中兩曲線(xiàn)的相關(guān)系數(shù)為0.77,說(shuō)明使用數(shù)據(jù)集進(jìn)行參數(shù)訓(xùn)練后對(duì)學(xué)生真實(shí)作答得分的擬合度高,能反映學(xué)生真實(shí)的知識(shí)狀態(tài)。此外,ECD模型作為基準(zhǔn)的評(píng)估方法與學(xué)生診斷結(jié)果的相關(guān)系數(shù)為0.83,以期末測(cè)驗(yàn)為基礎(chǔ)的評(píng)估方法與總分的相關(guān)系數(shù)為0.71。可見(jiàn)ECD模型可以很好地評(píng)價(jià)學(xué)生的學(xué)習(xí)情況。
圖5 學(xué)習(xí)成效評(píng)估方法對(duì)比
在對(duì)比分析環(huán)節(jié),研究使用了DeepFM以及NFM(Neural Factorization Machines)作為對(duì)比方法。
學(xué)生成績(jī)預(yù)測(cè)的總體表現(xiàn)如表1所示??梢钥闯鲅芯刻岢龅腅CD框架在三個(gè)數(shù)據(jù)集上的表現(xiàn)優(yōu)于Deep-FM或NFM方法對(duì)所有認(rèn)知診斷方法的表現(xiàn)。這說(shuō)明該方法可以更有效地對(duì)教育背景進(jìn)行建模。在三個(gè)數(shù)據(jù)集中,ECD方法對(duì)所有的認(rèn)知診斷方法都有穩(wěn)定的巨大改善,從AUC分值來(lái)看,ECD-NeuralCD的該項(xiàng)分值為0.744,高于其他方法,其他評(píng)價(jià)指標(biāo)的分值顯示了同樣的結(jié)果。而DeepFM和NFM方法的表現(xiàn)則不穩(wěn)定。因此,考慮到所有特征的情境建模有助于發(fā)揮ECD的優(yōu)勢(shì)。
表1 學(xué)生成績(jī)預(yù)測(cè)的總體表現(xiàn)
為了驗(yàn)證ECD 框架中所有三層的有效性,研究進(jìn)行了消融實(shí)驗(yàn),表2 展示了每種情況的結(jié)果,以ECDNeuralCD 的交互層為例,當(dāng)交互層被替換,其AUC 的評(píng)分由0.744 降為0.735,而聚合層被替換該分值降為0.737??梢钥闯?,無(wú)論哪一層被替換,最終的性能都有一定程度的下降。這表明每一層都對(duì)最終表現(xiàn)做出了貢獻(xiàn),即建模的個(gè)性化影響和內(nèi)在的相關(guān)性。而當(dāng)情境聚合層被替換時(shí),最終的性能受到了極大的損害,這表明在情境領(lǐng)域?qū)用娴膫€(gè)性化在教育情境建模中起著非常重要的作用。
表2 學(xué)生成績(jī)預(yù)測(cè)的總體表現(xiàn)
情境和文化通過(guò)影響學(xué)生的內(nèi)隱認(rèn)知狀態(tài)直接影響學(xué)生的學(xué)習(xí)。因此研究對(duì)情境意識(shí)特征進(jìn)行建模,并使其適應(yīng)于更精確地診斷學(xué)生的知識(shí)熟練度。研究首先設(shè)計(jì)了一個(gè)兩階段的解決方案,用一個(gè)層次化的entive 網(wǎng)絡(luò)來(lái)模擬教育背景的影響,并對(duì)學(xué)生的特征進(jìn)行自適應(yīng)優(yōu)化。然后,在該框架下用不同的現(xiàn)有方法實(shí)現(xiàn)了三個(gè)具體模型,即ECD-IRT、ECD-MIRT、ECD-NeuralCD。此外,研究在數(shù)據(jù)集上進(jìn)行了大量的實(shí)驗(yàn),證明了ECD 框架的有效性和可解釋性。結(jié)果顯示經(jīng)模型計(jì)算的學(xué)生平均知識(shí)熟練度與數(shù)據(jù)集中的報(bào)告一致,且ECD模型作為基準(zhǔn)的評(píng)估方法與學(xué)生診斷結(jié)果的相關(guān)系數(shù)為0.83。另外,ECD方法對(duì)所有的認(rèn)知診斷方法都有穩(wěn)定的巨大改善,從AUC 分值來(lái)看,ECD-NeuralCD 的該項(xiàng)分值為0.744,高于其他方法。但是模型還缺乏真實(shí)場(chǎng)景的應(yīng)用結(jié)果分析,而現(xiàn)實(shí)中的教育情境更為復(fù)雜,因此研究還應(yīng)該在廣泛的真實(shí)場(chǎng)景測(cè)試后進(jìn)一步對(duì)模型進(jìn)行優(yōu)化。
湖北第二師范學(xué)院學(xué)報(bào)2023年8期