年晴
摘要:為了實(shí)現(xiàn)漢語(yǔ)言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類(lèi)分析,針對(duì)FCM聚類(lèi)結(jié)果易受其初始聚類(lèi)中心選擇的影響,提出一種基于IHSFCM的漢語(yǔ)言學(xué)習(xí)用戶學(xué)習(xí)行為聚類(lèi)分析。選擇參與維度、專(zhuān)注維度、規(guī)律維度、交互維度和學(xué)習(xí)成績(jī)等作為學(xué)習(xí)行為的分析指標(biāo),學(xué)習(xí)者層次分為5個(gè)等級(jí),分別為優(yōu)秀、良好、中、合格和差。與HSFCM、SVM和決策樹(shù)對(duì)比發(fā)現(xiàn),文中算法IHSFCM具有更高的聚類(lèi)準(zhǔn)確率和更快的收斂速度以及更低的適應(yīng)度,為學(xué)習(xí)者層次劃分和優(yōu)化課程學(xué)習(xí)提供了新的方法。
關(guān)鍵詞:在線學(xué)習(xí);漢語(yǔ)言;學(xué)習(xí)行為;模糊均值聚類(lèi);和聲搜索算法
中圖分類(lèi)號(hào):TP391
文獻(xiàn)標(biāo)志碼:A
StudyontheLearningBehaviorModelofChineseLanguage
LearnersBasedonImprovedFuzzyCmeansClustering
NIANQing
(
SchoolofHumanitiesManagement,ShanxiUniversityofTraditionalChineseMedicine,Xian712046,China
)
Abstract:InordertoanalyzethelearningbehaviorofChineselanguageonlinelearners,duetoFCMclusteringresultsareeasilyaffectedbytheinitialclustercenterselection,thispaperpresentsaclusteringanalysisofChineselanguagelearningbehaviorbasedonIHSFCM.Participationdimension,attentiondimension,regularitydimension,interactiondimensionandlearningachievementareselectedastheanalysisindexesoflearningbehavior.Thelearners'levelisdividedinto5grades,i.e.,excellent,good,medium,qualifiedandpoor.ComparedwithHSFCM,SVManddecisiontree,theIHSFCMhashigherclusteringaccuracy,fasterconvergencespeedandlowerfitness.Itprovidesanewmethodforlearnerstodivideandoptimizecourselearning.
Keywords:onlinelearning;Chineselanguage;learningbehavior;fuzzyCmeansclustering;harmonysearchalgorithm
0引言
隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展和綜合國(guó)力的不斷上升,對(duì)外交流和對(duì)外貿(mào)易的深度和規(guī)模不斷加深和擴(kuò)大以及網(wǎng)絡(luò)教學(xué)和在線課程的飛速發(fā)展,漢語(yǔ)言學(xué)習(xí)的人數(shù)和規(guī)模不斷增加和擴(kuò)大,積累了大量的學(xué)習(xí)數(shù)據(jù),如何利用這些學(xué)習(xí)數(shù)據(jù)挖掘出學(xué)習(xí)數(shù)據(jù)的內(nèi)在價(jià)值更好地服務(wù)于漢語(yǔ)言的教與學(xué),引起了廣泛關(guān)注和研究[12]。因此研究漢語(yǔ)言學(xué)習(xí)用戶的學(xué)習(xí)行為對(duì)優(yōu)化課程教學(xué)和完善課程評(píng)估具有重要意義。
模糊C均值(FuzzyCmean,F(xiàn)CM)聚類(lèi)[3]是運(yùn)用隸屬度確定每個(gè)數(shù)據(jù)樣本類(lèi)別的方法,具有效率高、計(jì)算量小的優(yōu)點(diǎn),然而FCM聚類(lèi)結(jié)果易受其初始聚類(lèi)中心選擇的影響,本文將和聲搜索算法(HarmonySearch,HS)應(yīng)用于FCM初始聚類(lèi)中心的選擇,提出一種基于IHSFCM的漢語(yǔ)言學(xué)習(xí)用戶學(xué)習(xí)行為聚類(lèi)分析。研究結(jié)果表明,IHSFCM具有更快的收斂速度和更低的適應(yīng)度,效果較HSFCM更優(yōu),為漢語(yǔ)言課程學(xué)習(xí)優(yōu)化提供科學(xué)決策的依據(jù)。
1改進(jìn)的HS算法
(1)隨機(jī)位置更新
若HS算法中最差和最好和聲分別為xworst以及xbest,將xworst視為基向量,則較優(yōu)和聲通過(guò)學(xué)習(xí)xbest調(diào)節(jié)出來(lái),本文提出一種基于隨機(jī)位置更新的方法如式(1)—式(2)。
xnewi=xri+rand×(xd-xri)
(1)
xd=F×xbesti-xri,r∈(1,2,…,HMS)
(2)
若xr
(2)反向?qū)W習(xí)
為擴(kuò)大HS算法的搜索空間,將反向?qū)W習(xí)[45]引入HS算法,反向?qū)W習(xí)策略如式(3)。
xnewi=
xUi+xLi-xri,rand≤0.5
xri,其他
(3)
(3)小概率變異
HS算法中的小概率變異操作如式(4)。
xnewi=xLi+rand×(xUi-xLi)
(4)
如果rand≤Pm,則進(jìn)行小概率變異,取Pm=0.005。
(4)修正音調(diào)微調(diào)概率
音調(diào)微調(diào)概率PAR可設(shè)計(jì)如式(5)。
PARt+1=PARmax-PARminT·t+PARmin
(5)
式(5)中,PARmax、PARmin為音調(diào)微調(diào)概率的最大值和最小值;PARt+1為第t+1次的音調(diào)微調(diào)概率。
改進(jìn)HS算法流程,如圖1所示。
2基于IHSFCM聚類(lèi)
2.1學(xué)習(xí)行為分析指標(biāo)
為實(shí)現(xiàn)漢語(yǔ)言學(xué)習(xí)用戶學(xué)習(xí)行為的分析,在參考文獻(xiàn)[68]基礎(chǔ)上,選擇參與維度、專(zhuān)注維度、規(guī)律維度、交互維度和學(xué)習(xí)成績(jī)等作為評(píng)價(jià)指標(biāo),詳細(xì)評(píng)價(jià)指標(biāo),如表1所示。
2.2FCM聚類(lèi)
假設(shè)樣本數(shù)據(jù)x={x1,x2,…,xn},樣本數(shù)據(jù)為n個(gè),每個(gè)元素包含d個(gè)屬性。FCM聚類(lèi)數(shù)目為C(2≤C≤n),聚類(lèi)中心W={w1,w2,…,wC}。由于FCM模糊聚類(lèi)的每個(gè)元素類(lèi)別不能被嚴(yán)格劃分到具體的某一類(lèi)別之中,所以令μik為第k個(gè)元素屬于第i類(lèi)的隸屬度,其中
∑Ci=1μik=1,μik∈[0,1]。
FCM模糊均值聚類(lèi)的目標(biāo)函數(shù)定義為:
minJm(U,W)=∑nk=1
∑Ci=1μbikd2ik
(6)
式中,b為指數(shù)權(quán)重,文中取b=2;U為隸屬度矩陣;dik=||xk-wi||表示元素xk與類(lèi)中心wi二者之間的歐式距離。FCM模糊均值聚類(lèi)的中心思想就是不斷調(diào)整(U,W)使得目標(biāo)函數(shù)Jm(U,W)最小。FCM模糊均值聚類(lèi)的迭代步驟為:
Step1:設(shè)定聚類(lèi)數(shù)目C(2≤C≤n)和指數(shù)權(quán)重b,并隨機(jī)初始化聚類(lèi)中心矩陣W(0),令迭代次數(shù)l=0;
Step2:計(jì)算隸屬度矩陣U;
u(l)ik=
1/∑Cj=1(dik/djk)2b-1,dik>0
1,dik=0
(7)
Step3:修正聚類(lèi)中心W;
w(l+1)i=∑nk=1(μ(l)ik)bxk∑nk=1(μ(l)ik)b
(8)
Step4:對(duì)于給定閾值ε>0,若J(l)m-J(l-1)m≤ε,則FCM算法結(jié)束,此時(shí)對(duì)應(yīng)的最優(yōu)聚類(lèi)中心W(l)=w(l)1,w(l)2,…,w(l)C;反之,l=l+1,返回Step2。
2.3IHSFCM聚類(lèi)
IHSFCM聚類(lèi)思想:先隨機(jī)產(chǎn)生幾組聚類(lèi)中心點(diǎn),運(yùn)用IHS算法的思想變化區(qū)域中心點(diǎn)計(jì)算適應(yīng)度,淘汰適應(yīng)度低的中心點(diǎn)和產(chǎn)生新的中心點(diǎn),重新迭代計(jì)算,如此反復(fù),直到滿足結(jié)束條件為止,算法流程圖,如圖2所示。
基于IHSFCM的漢語(yǔ)言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類(lèi)分析算法可以具體詳細(xì)地描述為:
Step1:讀取漢語(yǔ)言在線學(xué)習(xí)用戶學(xué)習(xí)行為分析指標(biāo)數(shù)據(jù);
Step2:初始化HS算法參數(shù):創(chuàng)作的次數(shù)T、聲記憶庫(kù)的個(gè)數(shù)HMS、音調(diào)微調(diào)的概率PAR、音調(diào)微調(diào)的帶寬bw以及和聲記憶庫(kù)保留的概率HMCR;
Step3:初始化和聲記憶庫(kù);
Step4:生成新和聲;
Step4:更新和聲記憶庫(kù):根據(jù)適應(yīng)度函數(shù)(6)評(píng)價(jià)Step3中的新解,若比HM中的函數(shù)值最差的一個(gè)好,則更新至HM中;
Step5:重復(fù)Step3和Step4,直到滿足終止條件,輸出FCM最優(yōu)聚類(lèi)中心,并將FCM最優(yōu)聚類(lèi)中心帶入FCM模型進(jìn)行漢語(yǔ)言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類(lèi)。
3實(shí)證分析
3.1數(shù)據(jù)來(lái)源
為了驗(yàn)證本文算法的有效性,選擇網(wǎng)易公開(kāi)課《漢語(yǔ)言文字學(xué)類(lèi)課程導(dǎo)論》在線課程學(xué)習(xí)數(shù)據(jù)為研究對(duì)象[1213],將學(xué)習(xí)者層次分為5個(gè)等級(jí),分別為優(yōu)秀、良好、中、合格和差,不同學(xué)習(xí)者類(lèi)型數(shù)據(jù)分布,如表2所示。
3.2評(píng)價(jià)指標(biāo)
為了說(shuō)明漢語(yǔ)言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類(lèi)分析的效果,評(píng)價(jià)指標(biāo)選擇聚類(lèi)
準(zhǔn)確率T和誤判率F。
(1)準(zhǔn)確率T:如果學(xué)習(xí)者類(lèi)型被正確聚類(lèi)的數(shù)量為A,而學(xué)習(xí)者類(lèi)型的實(shí)際數(shù)量為B,則學(xué)習(xí)者類(lèi)型聚類(lèi)的準(zhǔn)確率如式(9)。
T=AB×100%
(9)
(2)誤判率F:如果學(xué)習(xí)者類(lèi)型是第i類(lèi)的實(shí)際數(shù)量為H,而將第i類(lèi)學(xué)習(xí)者類(lèi)型誤判為第j類(lèi)學(xué)習(xí)者類(lèi)型的數(shù)量為G,則學(xué)習(xí)者類(lèi)型判斷的誤判率如式(10)。
Fij=GH×100%
(10)
3.3實(shí)驗(yàn)結(jié)果
為了驗(yàn)證漢語(yǔ)言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類(lèi)算法的效果,將本文算法IHSFCM和HSFCM[14]、SVM[15]和決策樹(shù)[1617]進(jìn)行對(duì)比,如表3和圖3圖7所示。
IHS算法參數(shù)設(shè)置為:種群規(guī)模為10,最大迭代次數(shù)為100,聚類(lèi)結(jié)果如表3所示。IHSFCM和HSFCM收斂曲線
對(duì)比如圖7所示,由圖7可知,IHSFCM具有更快的收斂速度和更低的適應(yīng)度,效果較HSFCM更優(yōu)。
圖3圖7中,“*”表示學(xué)習(xí)者層次的預(yù)測(cè)類(lèi)別,“○”表示學(xué)習(xí)者層次的實(shí)際類(lèi)別,通過(guò)對(duì)比展示可以直觀地顯示學(xué)習(xí)者層次聚類(lèi)結(jié)果和實(shí)際學(xué)習(xí)者層次類(lèi)別,其中1、2、3、4、5分別表示學(xué)習(xí)者層次為優(yōu)秀、良好、中、合格和差。當(dāng)“*”和“○”重合時(shí),學(xué)習(xí)者層次的預(yù)測(cè)類(lèi)別和實(shí)際類(lèi)別一致,說(shuō)明聚類(lèi)正確;當(dāng)“*”和“○”不重合時(shí),學(xué)習(xí)者層次的預(yù)測(cè)類(lèi)別和實(shí)際類(lèi)別不一致,此時(shí)學(xué)習(xí)者層次聚類(lèi)錯(cuò)誤。由表3和圖3圖6可知,IHSFCM的聚類(lèi)準(zhǔn)確率和誤判率分別為99.42%和0.58%,優(yōu)于HSFCM的96.27%和3.73%,SVM的96.40%和3.55%和決策樹(shù)的92.30%和2.70%。與HSFCM、SVM和決策樹(shù)對(duì)比發(fā)現(xiàn),本文算法IHSFCM具有更高的聚類(lèi)準(zhǔn)確率,為學(xué)習(xí)者層次劃分和優(yōu)化課程學(xué)習(xí)提供了新的方法。
4總結(jié)
為了實(shí)現(xiàn)漢語(yǔ)言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類(lèi)分析,針對(duì)FCM聚類(lèi)結(jié)果易受其初始聚類(lèi)中心選擇的影響,提出一種基于IHSFCM的漢語(yǔ)言學(xué)習(xí)用戶學(xué)習(xí)行為聚類(lèi)分析。研究結(jié)果表明,IHSFCM具有更快的收斂速度和更低的適應(yīng)度,效果較HSFCM更優(yōu),為漢語(yǔ)言課程學(xué)習(xí)優(yōu)化提供科學(xué)決策的依據(jù)。然而,由于本文學(xué)習(xí)行為分析指標(biāo)可能考慮不夠全面,導(dǎo)致聚類(lèi)效果存在適應(yīng)性較差的缺點(diǎn),后續(xù)將考慮更多因素的在線學(xué)習(xí)行為聚類(lèi)分析,從而提高學(xué)習(xí)行為分析模型的準(zhǔn)確性和適用性。
參考文獻(xiàn)
[1]
胡藝齡,顧小清,趙春.在線學(xué)習(xí)行為分析建模及挖掘[J].開(kāi)放教育研究,2014,20(2):102110.
[2]范潔,楊岳湘,溫璞.C4.5算法在在線學(xué)習(xí)行為評(píng)估系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2016(6):946948.
[3]王法玉,姜妍.基于自組織神經(jīng)網(wǎng)絡(luò)和模糊聚類(lèi)的校園無(wú)線網(wǎng)用戶學(xué)習(xí)興趣度行為分析[J].計(jì)算機(jī)應(yīng)用研究,2018,35(1):1115.
[4]劉思遠(yuǎn).一種新的多目標(biāo)改進(jìn)和聲搜索優(yōu)化算法[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(34):2730.
[5]陳春,汪沨,劉蓓,等.基于基本環(huán)矩陣與改進(jìn)和聲搜索算法的配電網(wǎng)重構(gòu)[J].電力系統(tǒng)自動(dòng)化,2014,38(6):5560.
[6]李爽,王增賢,喻忱,等.在線學(xué)習(xí)行為投入分析框架與測(cè)量指標(biāo)研究——基于LMS數(shù)據(jù)的學(xué)習(xí)分析[J].開(kāi)放教育研究,2016,22(2):7990.
[7]曹建芳,郝耀軍.基于并行AdaboostBP網(wǎng)絡(luò)的大規(guī)模在線學(xué)習(xí)行為評(píng)價(jià)[J].計(jì)算機(jī)應(yīng)用與軟件,2017,34(7):267272.
[8]陳志雄.基于藍(lán)墨云班課的語(yǔ)文在線學(xué)習(xí)行為數(shù)據(jù)分析——中職語(yǔ)文混合式學(xué)習(xí)在線學(xué)習(xí)行為的數(shù)據(jù)挖掘與學(xué)習(xí)分析[J].現(xiàn)代職業(yè)教育,2018(11):2426.
[9]李小娟,梁中鋒,趙楠.在線學(xué)習(xí)行為對(duì)混合學(xué)習(xí)績(jī)效的影響研究[J].現(xiàn)代教育技術(shù),2017(2):8086.
[10]吳林靜,勞傳媛,劉清堂,等.網(wǎng)絡(luò)學(xué)習(xí)空間中的在線學(xué)習(xí)行為分析模型及應(yīng)用研究[J].現(xiàn)代教育技術(shù),2018,28(6):4754.
[11]劉冰,李彥敏.SPOC學(xué)習(xí)者在線學(xué)習(xí)行為特征分析——基于互動(dòng)視角[J].集美大學(xué)學(xué)報(bào)(教育科學(xué)版),2019,20(1):3338.
[12]陳鵬宇,馮曉英,孫洪濤,等.在線學(xué)習(xí)環(huán)境中學(xué)習(xí)行為對(duì)知識(shí)建構(gòu)的影響[J].中國(guó)電化教育,2015(8):5963.
[13]宗陽(yáng),陳麗,鄭勤華,等.基于在線學(xué)習(xí)行為數(shù)據(jù)的遠(yuǎn)程學(xué)習(xí)者學(xué)業(yè)情緒分析研究——以Moodle平臺(tái)為例[J].開(kāi)放學(xué)習(xí)研究,2017(6):1120.
[14]宗陽(yáng),鄭勤華,陳麗.中國(guó)MOOCs學(xué)習(xí)者價(jià)值研究——基于RFM模型的在線學(xué)習(xí)行為分析[J].現(xiàn)代遠(yuǎn)距離教育,2016(2):2128.
[15]孔麗麗,馬志強(qiáng),易玉何,等.在線學(xué)習(xí)行為影響因素模型研究——基于行為科學(xué)理論的評(píng)述[J].開(kāi)放學(xué)習(xí)研究,2017,22(5):4653.
[16]王士霞.基于決策樹(shù)的在線學(xué)習(xí)行為分析[J].河南科技學(xué)院學(xué)報(bào)(自然科學(xué)版),2015,43(5):6770.
[17]顧倩頤.基于在線學(xué)習(xí)行為的個(gè)性化學(xué)習(xí)需求智能挖掘技術(shù)研究[J].軟件導(dǎo)刊,2015,14(12):1214.
(收稿日期:2020.03.24)