胡 偉,王子嵐
(黃山職業(yè)技術(shù)學(xué)院 工業(yè)與財貿(mào)系,安徽 黃山 245000)
云計算、大數(shù)據(jù)等新一代信息技術(shù)的突飛猛進使得智慧校園與數(shù)字校園開始快速發(fā)展,將信息技術(shù)和課堂教學(xué)進行相互融合是教育發(fā)展改革的必然趨勢[1]. 在進行線下學(xué)習(xí)時,刷題是學(xué)生鞏固知識點和查漏補缺的常用手段,學(xué)生通過大量刷題的方式加深對知識的記憶程度和理解.隨著智慧學(xué)習(xí)技術(shù)的普及,將在線教育和學(xué)生刷題相結(jié)合的研究日益增加,針對學(xué)生刷題學(xué)習(xí)的新型在線教育軟件不斷涌現(xiàn),但是許多智能學(xué)習(xí)軟件在進行試題推薦時,容易出現(xiàn)推薦偏差的問題,不利于學(xué)生提升學(xué)習(xí)與刷題效率[2]. 有學(xué)者為了提升試題推薦的效率,提出利用協(xié)同過濾和認知判斷設(shè)計試題推薦,結(jié)果表明,在兩種方法影響下,試題推薦測評顯示其效率得到顯著提升[3]. 熊慧君等人也提出利用二次協(xié)同過濾來實現(xiàn)個性化試題推薦,并經(jīng)過實驗得知研究提出的試題推薦測評方案更具個性化和準確性[4]. 從大量研究中可以得知,為了改善試題推薦性能,大量研究將協(xié)同過濾算法應(yīng)用于試題推薦中,但是仍然可以看出部分研究僅是利用協(xié)同過濾算法來實現(xiàn)試題推薦的個性化,并未對其進行測評.鑒于此,研究對傳統(tǒng)的協(xié)同過濾算法進行改進,利用改進協(xié)同過濾算法構(gòu)建試題智能推薦測評模型,期望提升學(xué)生試題的智能推薦效果,并根據(jù)學(xué)生作答情況進行智能評測,減少教師的重復(fù)評卷工作量,使得教師能夠把時間更多地用在教學(xué)備課中,促進教育教學(xué)質(zhì)量的提升.
教育信息化的發(fā)展使得市面上出現(xiàn)了各種類型的教育學(xué)習(xí)軟件,但許多教育軟件都存在一定的不足之處,比如交互性不夠、產(chǎn)品良莠不齊以及不同應(yīng)用之間的集成度過低等問題[5-6].為了提升教育學(xué)習(xí)軟件的實用性,從試題的角度出發(fā),對試題的生成和智能組卷進行研究,實現(xiàn)試題智能推薦與自動評測.智能推薦模型利用推薦算法為學(xué)生提供個性化的試題生成與推薦服務(wù),而試題的自動生成主要依靠的是龐大的數(shù)據(jù)庫,通過設(shè)定試題類型的方式從數(shù)據(jù)庫中選擇和淘汰試題. 由于數(shù)據(jù)庫的試題數(shù)據(jù)體量龐大,在抽取試題時模型會自動將試題庫分為多個子試題庫,從子試題庫抽取試題.通過提取試題知識點特征的方式,對數(shù)據(jù)庫中的試題進行分類,并結(jié)合推薦算法進行過濾,在集合中對過濾后的試題進行整合,以便于后期調(diào)用. 用戶在進行試題測試時,模型會根據(jù)作答情況改變協(xié)同過濾推薦算法中的平衡因素,從而改變從數(shù)據(jù)庫中抽取試題的題型,實現(xiàn)用戶試題的個性化智能推薦.
智能組卷是以滿足教師的出題目的為首要目標(biāo),教師可以根據(jù)出題意圖設(shè)置題目難度、數(shù)量、分數(shù)等要素. 在學(xué)生開始答題時,模型從試題集合中抽取試題,然后按照難度大小排序等規(guī)則對試題進行智能組卷.用m×n的矩陣來表示組成的一份試卷,具體表示如式(1)所示.
(1)
其中,Sg表示目標(biāo)矩陣,矩陣行向量表示試題選擇所要確定的屬性項,n則表示試題所設(shè)置的屬性項數(shù),包括分數(shù)、題型、難度、知識點等屬性,矩陣列向量表示試卷試題數(shù),m為設(shè)置的試題題數(shù),amn表示第m題的第n個屬性.
雖然協(xié)同過濾算法是推薦系統(tǒng)的常用算法,但是仍然存在一定的局限性,其中數(shù)據(jù)系數(shù)問題、冷啟動問題和可擴展性問題較為突出,這些問題導(dǎo)致普通的協(xié)同過濾算法在進行相似性計算時,缺少客觀準確的評價數(shù)據(jù),難以快速為用戶和項目匹配到相似項,并且龐大的矩陣計算大大降低了推薦算法的推薦效率[7-9]. 因此,為了提升學(xué)生試題的推薦準確度,研究從試題推薦的自身特性出發(fā),對基于用戶的協(xié)同過濾推薦算法進行改進優(yōu)化,根據(jù)用戶對項目采取的行為來獲取用戶的興趣愛好,從而實現(xiàn)個性化推薦服務(wù). 智能推薦模型利用學(xué)生平時答題行為的相似性來互相推薦試題,幫助學(xué)生通過練習(xí)系統(tǒng)推薦的試題鞏固學(xué)習(xí)內(nèi)容,提升學(xué)生的學(xué)習(xí)效率. 研究首先對傳統(tǒng)協(xié)同過濾推薦算法的相似度計算進行改進,在傳統(tǒng)的Pearson相關(guān)系數(shù)計算方式的基礎(chǔ)上,對學(xué)生之間相似度計算方法進行改進優(yōu)化.Pearson相關(guān)系數(shù)公式通過評分值和用戶評分均值的差值,來緩解評分標(biāo)準中存在的差異問題. Pearson相關(guān)系數(shù)的表達式如式(2)所示.
sim(ux,uy)=
(2)
Pearson相關(guān)系數(shù)是協(xié)方差和標(biāo)準差的比值,式(2)中,n′表示公共評分項目,r是評分值,ux和uy表示用戶和項目.
對學(xué)生而言,學(xué)生對于推薦試題的需求是不斷變化的,而內(nèi)部信息對推薦結(jié)果質(zhì)量的影響最大,除去一些相對穩(wěn)定的信息之外,如何把握其他部分不斷變化的信息很重要[10]. 所以在推薦時應(yīng)當(dāng)優(yōu)先考慮最新的信息,在計算時賦予新信息更高的權(quán)重,通過時間權(quán)重對學(xué)生歷史數(shù)據(jù)進行加權(quán)改進,具體時間加權(quán)方法如圖1所示.
圖1 時間權(quán)重示意圖
從圖1可以看出,學(xué)生歷史數(shù)據(jù)為0到1天時,權(quán)重值為1,參考價值最大;當(dāng)時間間隔在五天之內(nèi)時,權(quán)重值高于0.6,處于完全可參考的范圍內(nèi);時間間隔處于5到10天時,權(quán)重值處于0.3到0.6之間,參考價值一般;當(dāng)時間間隔在10天到20天之間時,權(quán)重值為0.1到0.3之間,可酌情考慮是否作為參考因素;時間間隔大于20天后,參考價值就極低了,學(xué)生的歷史數(shù)據(jù)可以忽略不計.
分析時間權(quán)重示意圖,給出時間權(quán)重的計算方法如式(3)所示
(3)
其中,ω表示最終結(jié)果反映出的學(xué)生內(nèi)部信息的能力,Δtj是當(dāng)前時間和學(xué)生答題時間的時間差,0≤Δtj≤T,T表示有效時間,L表示學(xué)生在有效時間內(nèi)進行答題的總時長,α表示時間權(quán)重變化指數(shù),其取值影響學(xué)生作答記錄反映其內(nèi)部信息能力隨著時間變化的速率,α值越大,作答記錄反應(yīng)學(xué)生內(nèi)部信息的能力下降速率越大,最終改進之后的公式如式(4)所示.
sim(ux,uy)=
(4)
式(4)在原始的Pearson相關(guān)系數(shù)中引入了時間差Δtj和有效時間T作為平衡因子,答題時間超出有效時間T,參考價值較低,對學(xué)生相似度的計算造成的誤差較大,Δtj的大小代表相似學(xué)生和目標(biāo)學(xué)生共同錯題的時間早晚,學(xué)生中時間對題目的掌握程度的變化尚未可知,所以其影響較小,α表示時間權(quán)重變化指數(shù).改進之后的算法具體計算模式如圖2所示,改進算法根據(jù)時間的推移,將歷史用戶信息分為過時用戶信息和有效用戶信息兩個樣本,只針對有效時間內(nèi)的數(shù)據(jù)進行相似度計算,有效地避免了無效樣本對相似度計算帶來的無效化負面影響.
圖2 改進算法推薦方式
對評分預(yù)測推薦算法進行改進,傳統(tǒng)的評分預(yù)測推薦算法所采用的是TOP-N算法,TOP-N是對目標(biāo)用戶形成TOP-N形式的推薦集,通過統(tǒng)計用戶所要了解的知識點,取排在前N的試題形成推薦集[11]. 為了使結(jié)果更精確,在此基礎(chǔ)上加入平衡項如式(5).
(5)
教師對學(xué)生知識點掌握程度的了解對教學(xué)尤為重要,學(xué)生通過智能推薦的試題進行答題練習(xí)之后,教師可以使用智能組卷進行線上考試來測試學(xué)生對知識點的掌握程度和運用能力,通過對考試結(jié)果的智能評測,幫助教師了解學(xué)生的學(xué)習(xí)進度和對知識點的掌握程度[12].智能評測分析主要從三個方面著手,分別是成績分析、得分分析和學(xué)生問題分析.成績分析是對學(xué)生考試的各科成績進行統(tǒng)計和分析,按照成績結(jié)果進行數(shù)據(jù)整理、數(shù)據(jù)分析并生成報告單.針對數(shù)據(jù)源的不同,統(tǒng)計分析又分為單班級成績分析和多班級成績分析.單班級測評分析所需要的數(shù)據(jù)源只有一個表,而多班級測評分析則需要多個數(shù)據(jù)源.整理完的成績數(shù)據(jù)就需要繼續(xù)統(tǒng)計,根據(jù)教師設(shè)定好的及格線和優(yōu)秀線,報告單統(tǒng)計時就按照分數(shù)高低以及所劃分的各項指標(biāo)線一一表示出來.得分分析的目的是在總成績的基礎(chǔ)上對各個試題的得分情況進行詳細分析,通過整合所有學(xué)生在每一道題上面的得分情況來計算得分率,進行得分對比分析.得分率計算方法如式(6)所示.
(6)
其中n表示樣本中學(xué)生人數(shù),xn表示第n個學(xué)生在某道試題上的得分,Z表示該試題的總分數(shù).
學(xué)生問題分析是分析學(xué)生的測評分數(shù)與試卷的答題情況,能夠準確地獲得學(xué)生對于試題知識點的認知水平.學(xué)生作答結(jié)果轉(zhuǎn)化公式如式(7)所示.
(7)
公式(7)表示,將某次選擇題的答案規(guī)定為A,若回答結(jié)果為A,則賦予1值,若不為A,則賦予0值.對于主觀題而言,A就規(guī)定為答對60%以上,作答結(jié)果為A,賦予1值;作答結(jié)果不為A,也就是所寫答案的正確率低于60%,賦予0值.根據(jù)這一項規(guī)定設(shè)計將學(xué)生答題情況最終結(jié)果用0或1表示,借此也能計算出答題學(xué)生對每道題目知識點的掌握率.得到結(jié)果為1的學(xué)生對所學(xué)知識點已經(jīng)基本掌握;結(jié)果為0的學(xué)生就會被判定為不熟悉該知識點,推薦算法就會在學(xué)生做題過程中盡可能多的推薦該知識點所代表的試題,直到最終結(jié)果為1.
實驗首先收集了某中學(xué)各年級所有學(xué)生的作答記錄,經(jīng)過數(shù)據(jù)整理之后,選取了20名目標(biāo)用戶對其進行推薦,從推薦結(jié)果的命中率來判斷推薦算法的優(yōu)劣性.改進協(xié)同過濾推薦算法和傳統(tǒng)協(xié)同過濾推薦算法的命中率對比結(jié)果如圖3所示.
圖3 改進算法對命中率的影響
根據(jù)圖3中內(nèi)容可知,傳統(tǒng)協(xié)同過濾算法命中率最高值為51%,低于20%的用戶有19個,平均命中率為10.2%;改進協(xié)同過濾算法命中率的最大值為89%,命中率低于20%的有16個,平均命中率為15.6%.改進協(xié)同過濾算法比傳統(tǒng)協(xié)同過濾算法的命中率提高了5.4%,說明改進推薦算法相較于傳推薦算法在準確度方面得到了提高.
在學(xué)生樣本中隨機抽取部分學(xué)生作為測評對象,組成臨時班級,然后為每位學(xué)生分別編號,學(xué)生成績分析結(jié)果如圖4所示.
圖4 學(xué)生成績結(jié)果
圖4中數(shù)據(jù)顯示,樣本中最高分為98分,最低分為62分,及格率100%,平均分為81.2.其中達到90分以上(包含90分)的人數(shù)有6個, 80~<90分之間的人數(shù)有6個, 70~<80分之間的人數(shù)有5個,60~<70分之間的人數(shù)有3個,達優(yōu)人數(shù)共有12人,達優(yōu)率達到了60%.
將樣本中學(xué)生平均分為四組,進行各試題得分情況對比分析,每個小組得分率的具體對比分析情況如圖5所示.
從圖5中看出第四組整體得分率較高,所有試題中得分率最高的是第五題和第九題,所有組的得分率都在80%以上,而第三題得分率較低,有三個組都只有60%,只有第四組的得分率達到了80%,第二組在第七題的得分率僅有20%,也就是只有1人答對,第三組在第八題的得分率也只有20%.
最后,通過學(xué)生各試題的得分情況分析學(xué)生存在的問題,分析結(jié)果如圖6所示.
圖5 各組得分率
圖6 學(xué)生問題分析結(jié)果
從圖6(a)中可以看出,學(xué)生學(xué)習(xí)問題評測結(jié)果中,學(xué)習(xí)不足的人數(shù)只有1人,占總?cè)藬?shù)的5%,需要加強輔導(dǎo);學(xué)習(xí)不穩(wěn)定的人數(shù)占15%,有3人,需要加強溝通;學(xué)習(xí)較穩(wěn)定的人數(shù)占總?cè)藬?shù)的35%,有7人;偶爾粗心人數(shù)占總?cè)藬?shù)的20%,有4人,需要時刻提醒學(xué)生注意細致問題;學(xué)習(xí)好且穩(wěn)定的人數(shù)占總?cè)藬?shù)的15%,有3人;得分高但錯題簡單,粗心丟分的人數(shù)占總?cè)藬?shù)的10%,有2人.從圖6(b)中可以看出,對10道試題難度進行評測,試題難度較大的題目有1題,難度處于適宜度的有4題,有3題較為簡單,還有2題知識點雜糅,容易混淆.以上結(jié)果表明,線上考試能夠清晰地對學(xué)生答題結(jié)果所表現(xiàn)出來的問題進行歸納總結(jié),還能分析考試題目難度大小,有利于后續(xù)進行試題智能推薦.
隨著計算機和移動設(shè)備的發(fā)展,在線學(xué)習(xí)已經(jīng)成為一種趨勢,在這樣的大環(huán)境中,學(xué)生線上學(xué)習(xí)時的試題智能推薦就顯得極為重要.本文對傳統(tǒng)協(xié)同過濾算法中的相似度計算和評分預(yù)測算法進行改進,得到更加靈活和精確的新型協(xié)同過濾推薦算法.通過改進協(xié)同過濾推薦算法與傳統(tǒng)協(xié)同過濾推薦算法的比較,驗證改進算法的優(yōu)越性,實驗結(jié)果表明改進算法的命中率較傳統(tǒng)協(xié)同過濾算法的命中率提高了5.4%,推薦效果更加明顯.針對學(xué)生答題情況的評測,改進算法對學(xué)生的總成績和單題得分情況都進行了分析總結(jié),并根據(jù)學(xué)生失分所存在的問題做了評測分析,為教師進一步的教學(xué)提供方案.本次研究在相似度算法改進時,只考慮了有效時間作為影響因素,未來可以對如何平衡其他因素進行進一步研究.