蔣海鋒
摘要當(dāng)前我國(guó)的職業(yè)教育正面臨大改革,國(guó)家把職業(yè)教育提升到與本科同等重要的地位,同時(shí)職業(yè)教育也將進(jìn)行大幅度的擴(kuò)招,不僅面向中職、高中生,還面向各類社會(huì)人員,在師資力量有限、知識(shí)技能更新迅速的職業(yè)教育現(xiàn)狀下,要實(shí)現(xiàn)高質(zhì)量的人才培養(yǎng),需要借助機(jī)器學(xué)習(xí)算法來(lái)輔助教師開展教學(xué),通過設(shè)計(jì)符合機(jī)器學(xué)習(xí)算法的題目,可以有效的減少教師出題的負(fù)擔(dān),實(shí)現(xiàn)分層的個(gè)性化教學(xué)效果。本文研究層次聚類算法在學(xué)生動(dòng)態(tài)分組及推薦中的應(yīng)用,以輔助教師實(shí)施補(bǔ)救性教學(xué),并有效緩解學(xué)生學(xué)習(xí)需要及教師精力有限的矛盾。
關(guān)鍵詞 層次聚類算法 推薦系統(tǒng) 輔助教學(xué)
中圖分類號(hào):G712文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.16400/j.cnki.kjdk.2021.29.012
Application of Hierarchical Clustering Algorithm in Realizing Higher Vocational Teaching Recommendation System
JIANG Haifeng
(Guangdong Polytechnic of Science and Technology, Zhuhai, Guangdong, 519090)
AbstractAt present, China’s vocational education is facing major reforms. The country has promoted vocational education to the same important status as undergraduates. At the same time, vocational education will also undergo a substantialexpansion,notonly forsecondaryvocational and highschoolstudents,butalsoforallkinds ofsocialperson. Under the current situation of vocational education with limited teachers and rapid updating of knowledge and skills, to achieve high-quality talent training, machine-learning algorithms need to be used to assist teachers in teaching. By designing topics that conform to machine learning algorithms, teachers can effectively reduce the number of questions and achieve hierarchical personalized teaching effects. This paper studies the application of hierarchical clustering algorithmin students’dynamicgroupingandrecommendation toassistteachers in implementingremedialteaching,and effectively alleviate the contradiction between students’ needs and teachers’ limited energy.
Keywordshierarchical clustering algorithm; recommended system; assisted teaching
引言
2019年,國(guó)家推出《國(guó)家職業(yè)教育改革實(shí)施方案》,為未來(lái)職業(yè)指明了方向,提升了職業(yè)教育的地位。未來(lái)職業(yè)教育將覆蓋更廣的人群,包括農(nóng)村務(wù)工人員、退伍軍人、下崗工人、返鄉(xiāng)農(nóng)民工等,對(duì)于基礎(chǔ)知識(shí)和認(rèn)知能力均有較大差異的學(xué)生,教師的課題教學(xué)將面臨更大的挑戰(zhàn)。大數(shù)據(jù)和人工智能的發(fā)展,為個(gè)性化培養(yǎng)學(xué)生提供了技術(shù)支持。智能推薦系統(tǒng),可以動(dòng)態(tài)跟蹤學(xué)生的學(xué)習(xí)情況,為每個(gè)學(xué)生智能推送練習(xí)題,實(shí)現(xiàn)以學(xué)生為中心的教學(xué)活動(dòng)。本論文研究一種基于層次聚類算法的智能推薦系統(tǒng)的實(shí)現(xiàn)方法,可快速進(jìn)行學(xué)生多層次的分類,為不同分類的學(xué)生推薦不同的練習(xí)題,實(shí)現(xiàn)動(dòng)態(tài)分類和分組互助學(xué)習(xí),有利于提升職業(yè)教育的效率和效果。本文將以H5課程教學(xué)為例,研究層次聚類的實(shí)現(xiàn)方法和效果。
1層次聚類算法的原理
聚類算法是一種無(wú)監(jiān)督的機(jī)器學(xué)習(xí)算法,可根據(jù)特征進(jìn)行自動(dòng)分類,聚類算法分類中常用的有基于劃分的聚類、基于密度聚類,基于層次聚類等。對(duì)于具體應(yīng)用,聚類算法的選擇取決于數(shù)據(jù)的類型、聚類的目的。而每一類聚類算法也有多種算法,例如:劃分方法中的k-means聚類算法、層次方法中的凝聚型層次聚類算法、基于模型方法中的神經(jīng)網(wǎng)絡(luò)聚類算法等。
本文研究并應(yīng)用層次聚類算法來(lái)對(duì)學(xué)生進(jìn)行動(dòng)態(tài)分組。層次聚類算法的核心思想是通過對(duì)數(shù)據(jù)集按照層次,把數(shù)據(jù)劃分到不同層的族,從而形成一個(gè)樹形的聚類結(jié)構(gòu)。層次聚類算法可以揭示數(shù)據(jù)的分層結(jié)構(gòu),在樹形結(jié)構(gòu)上不同層次進(jìn)行劃分,可以得到不同粒度的聚類結(jié)果。
假設(shè)有A、B、C、D、E、F、G共7個(gè)學(xué)生,通過測(cè)試進(jìn)行層次聚類,一個(gè)模擬的結(jié)果圖1:
根據(jù)不同的層次粒度,可以劃分不同的聚類結(jié)果,例如(AF)、(BC)、(DE)、G,如果在實(shí)際應(yīng)用中,太細(xì)的粒度不適合,可以進(jìn)行更高層次的劃分,例如:(AFBC)、(DEG)。
2算法的應(yīng)用流程
教學(xué)是“評(píng)估-教育-再評(píng)估”的循環(huán)過程,應(yīng)用算法的基本要求是精心設(shè)計(jì)測(cè)試題目,對(duì)學(xué)生完成情況自定分析結(jié)果,發(fā)現(xiàn)學(xué)生的弱點(diǎn),提出學(xué)習(xí)能力的建議。然后,改善自己的弱點(diǎn)之后,進(jìn)行另一個(gè)遞進(jìn)的測(cè)試,重新完成分析和推薦過程。
圖2展示了一個(gè)通用的教學(xué)推薦系統(tǒng)架構(gòu)。
應(yīng)用框架的主要過程說(shuō)明:
教師根據(jù)算法要求,編制一定數(shù)量的分類測(cè)試題目,形成測(cè)試庫(kù);學(xué)生完成測(cè)試庫(kù),收集學(xué)生對(duì)各個(gè)知識(shí)點(diǎn)的掌握程度的數(shù)據(jù);應(yīng)用機(jī)器學(xué)習(xí)算法,進(jìn)行學(xué)生的層次聚類,每個(gè)類別包含共享相似犯錯(cuò)特征的學(xué)生;根據(jù)聚類結(jié)果,為不同層次的學(xué)生推薦不同的學(xué)習(xí)內(nèi)容,為教師提供決策指導(dǎo)。
以上基本應(yīng)用流程由應(yīng)用系統(tǒng)自動(dòng)循環(huán),直至學(xué)生對(duì)知識(shí)點(diǎn)的掌握程度達(dá)到一個(gè)預(yù)設(shè)的閾值。其意義在于分層、分組實(shí)施,采用較少量的學(xué)習(xí)內(nèi)容實(shí)現(xiàn)更高效的全育人。
3算法的應(yīng)用示例
分層的核心是研究每個(gè)學(xué)生對(duì)各個(gè)知識(shí)點(diǎn)的掌握程度,因此算法的首要任務(wù)是收集學(xué)生對(duì)知識(shí)點(diǎn)的掌握情況,教師首先需要?dú)w納羅列待檢測(cè)的n個(gè)知識(shí)點(diǎn),編制一定數(shù)量的題目,每個(gè)題目對(duì)應(yīng)考查若干個(gè)知識(shí)點(diǎn),構(gòu)成題目與知識(shí)點(diǎn)的關(guān)系對(duì)應(yīng)表。
教師根據(jù)對(duì)應(yīng)關(guān)系統(tǒng)計(jì)表設(shè)計(jì)一定數(shù)量的題目,每個(gè)知識(shí)點(diǎn)覆蓋的總數(shù)應(yīng)該滿足一個(gè)最小值,以降低算法誤判的概率。
系統(tǒng)收集學(xué)生的測(cè)試結(jié)果,測(cè)試的結(jié)果統(tǒng)計(jì)每個(gè)學(xué)生應(yīng)用各個(gè)知識(shí)點(diǎn)的錯(cuò)誤次數(shù),形成一個(gè)學(xué)生與知識(shí)點(diǎn)錯(cuò)誤數(shù)量統(tǒng)計(jì)二維矩陣表。(表2)
本示例中,給出的測(cè)試包含18個(gè)知識(shí)點(diǎn)共70道題目。試驗(yàn)對(duì)象包含不同生源的學(xué)生共50人,包括統(tǒng)招生、退伍軍人、社招人員等。在這50名學(xué)生中,有25名是實(shí)驗(yàn)組,其余25名是對(duì)照組。實(shí)驗(yàn)組按照系統(tǒng)提供的推薦計(jì)劃進(jìn)行補(bǔ)救性自學(xué),對(duì)照組則以正常方式進(jìn)行教學(xué)。
對(duì)第一輪的測(cè)試結(jié)果進(jìn)行從下而上的層次聚類,得到聚類結(jié)果并進(jìn)行模型可視化(模型化采用Ward策略,即讓所有類簇中的方差最小化),得到聚類圖見圖3。
從聚類圖中,教師可以根據(jù)實(shí)在教學(xué)需要,在不同的層級(jí)進(jìn)行學(xué)生分組,同一個(gè)組的學(xué)生具有相似的犯錯(cuò)特征,通過對(duì)分組進(jìn)行補(bǔ)救性輔導(dǎo),可有效提升教學(xué)效率和效果。
經(jīng)過十幾輪補(bǔ)救性教學(xué),同樣對(duì)這批學(xué)生進(jìn)行一次測(cè)試,測(cè)試結(jié)果表明,實(shí)驗(yàn)組的學(xué)生平均成績(jī)有20%的提升,而對(duì)照組的平均成績(jī)波動(dòng)不大。
測(cè)試結(jié)果表明,遵循系統(tǒng)的補(bǔ)救性教學(xué)推薦計(jì)劃,可以有效提升學(xué)生的學(xué)習(xí)效果,系統(tǒng)的應(yīng)用不僅能發(fā)現(xiàn)學(xué)生的問題和弱點(diǎn),還能提供補(bǔ)救性建議,為學(xué)生規(guī)劃更高效的補(bǔ)習(xí)策略。
4總結(jié)
基于層次聚類的分類算法,可以快速地基于知識(shí)點(diǎn)的掌握情況進(jìn)行學(xué)生分類,從而實(shí)現(xiàn)動(dòng)態(tài)分類與推薦,有助于緩解學(xué)生水平參差不齊、職業(yè)教學(xué)內(nèi)容更新迭代快與教師精力有限等矛盾。高職教育中,分組學(xué)習(xí)是很有效的一種課堂教學(xué)方法,層次聚集的結(jié)果與該方法吻合,實(shí)現(xiàn)了動(dòng)態(tài)分組學(xué)習(xí),有利于快速提升學(xué)生的整體水平。但是基于多輸入特征、更細(xì)粒度的個(gè)性化學(xué)習(xí)及基于時(shí)序的動(dòng)態(tài)跟蹤,需要我們進(jìn)一步融合多種機(jī)器學(xué)習(xí)算法,共同構(gòu)建多應(yīng)用目標(biāo)的智能推薦系統(tǒng),進(jìn)一步發(fā)揮大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法在智能輔助教學(xué)方面的優(yōu)勢(shì)。
基金項(xiàng)目:廣東科學(xué)技術(shù)職業(yè)學(xué)院校級(jí)科研項(xiàng)目“SOM聚類算法在智能教學(xué)系統(tǒng)中的研究與應(yīng)用實(shí)施”(項(xiàng)目編號(hào):XJJS202106);廣東科學(xué)技術(shù)職業(yè)學(xué)院校級(jí)教改項(xiàng)目“媒體融合視域下高職網(wǎng)絡(luò)新聞與傳播專業(yè)人才培養(yǎng)模式的研究與實(shí)踐”(項(xiàng)目編號(hào):JG202102)
參考文獻(xiàn)
[1]席運(yùn)江,杜蝶蝶,廖曉,等.基于超網(wǎng)絡(luò)的企業(yè)微博用戶聚類研究及特征分析[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2020(08).
[2]張海濤,唐詩(shī)曼,魏明珠,等.多維度屬性加權(quán)分析的微博用戶聚類研究[J].圖書情報(bào)工作,2018(24).
[3]陳娟,吳卓青,鄧勝利.基于層次聚類法的“知乎”用戶細(xì)分與行為分析[J].情報(bào)理論與實(shí)踐,2018(07).
[4]張琳,謝忠紅.基于聚類的微博用戶類型與影響力研究[J].情報(bào)科學(xué),2016(08).
[5]楚志凱.智能推薦系統(tǒng)在網(wǎng)絡(luò)學(xué)習(xí)空間中的應(yīng)用[J].福建電腦, 2020,36(07):120-121.