郭玉棟,左金平,王溢琴
(晉中學(xué)院信息技術(shù)與工程學(xué)院,山西晉中030619)
在教育信息化2.0背景下,基于人才培養(yǎng)模式的教學(xué)改革如火如荼,特別是混合教學(xué)模式的教學(xué)改革更為突出.混合教學(xué)模式[1]的教學(xué)改革是基于線上學(xué)習(xí)和線下教學(xué)相結(jié)合的教學(xué)模式,更加注重學(xué)生學(xué)習(xí)的主動性和積極性,教學(xué)的重心由教師的“教”向?qū)W生的“學(xué)”轉(zhuǎn)變.學(xué)生“學(xué)”的主要形式就是利用移動技術(shù)和信息技術(shù)手段進(jìn)行線上學(xué)習(xí),教師通過對知識點(diǎn)的設(shè)計(jì),把各種學(xué)習(xí)視頻及課件資源以一定的組織形式部署到學(xué)習(xí)平臺,學(xué)生通過學(xué)習(xí)平臺進(jìn)行自我學(xué)習(xí),通過對學(xué)生學(xué)習(xí)情況的分析,把難點(diǎn)和重點(diǎn)問題通過多種線下教學(xué)模式進(jìn)行再次學(xué)習(xí).混合教學(xué)模式模型如圖1所示.
圖1 混合教學(xué)模式模型
混合教學(xué)模式一方面可提升學(xué)生的學(xué)習(xí)能力,符合人才培養(yǎng)的新模式;另一方面減少了教學(xué)資源的重復(fù)浪費(fèi),減輕了教師的教學(xué)工作量.混合教學(xué)模式對教師提出了更高的要求,在這種模式下教師的角色發(fā)生了較大的轉(zhuǎn)變,即以課程教學(xué)為主,轉(zhuǎn)化為以設(shè)計(jì)教學(xué)為主,教學(xué)模式設(shè)計(jì)的好與壞直接關(guān)系到學(xué)生的學(xué)習(xí)效果.混合教學(xué)模式將知識點(diǎn)進(jìn)行碎片化[2],把課程內(nèi)容碎片為一個個小的知識點(diǎn),更易于學(xué)生理解和掌握.通過學(xué)生的線上學(xué)習(xí),自我檢測,完成知識點(diǎn)的學(xué)習(xí).
在混合教學(xué)模式中,教師對于線上知識點(diǎn)學(xué)習(xí)效果的評價是一個比較復(fù)雜的問題,不能單純依賴學(xué)生的成績?nèi)ピu定教師對于知識點(diǎn)學(xué)習(xí)設(shè)計(jì)的好與壞.影響學(xué)生學(xué)習(xí)效果的因素很多,例如學(xué)生僅看了一遍學(xué)習(xí)視頻,還沒思考和消化就參加學(xué)習(xí)測試,學(xué)生投入的學(xué)習(xí)時間不夠而且還沒有專心學(xué)習(xí),知識點(diǎn)組織設(shè)計(jì)不合理等因素都會影響學(xué)生的測評成績.
針對混合教學(xué)改革中出現(xiàn)的設(shè)計(jì)評價問題,本文提出了K-means均值聚類算法[3].該算法是針對學(xué)生線上學(xué)習(xí)成績進(jìn)行挖掘分析,對不同知識點(diǎn)的學(xué)習(xí)效果進(jìn)行聚類分組,并對最終聚類進(jìn)行分析,獲取需要改進(jìn)的知識點(diǎn)設(shè)計(jì)的一種方法.
聚類分析是數(shù)據(jù)挖掘[4]領(lǐng)域的重要技術(shù)之一,聚類分析處理的數(shù)據(jù)對象是未知的,聚類分析的過程就是把給定集合中的數(shù)據(jù)對象分組為多個簇的過程,同一簇內(nèi)的數(shù)據(jù)對象相似性很強(qiáng),而不同簇之間的數(shù)據(jù)對象具有相異性,把集合中數(shù)據(jù)對象分成多個聚簇,這個過程就叫聚簇分析.聚簇分析被廣泛應(yīng)用于氣象分析、金融分析、實(shí)驗(yàn)分析等的數(shù)據(jù)處理過程中.
K-means聚類算法是聚簇分析中最流行的算法,基于K-means的聚類算法又派生出很多算法,如standardK-means、ScalableK-means、EM等,目的是使得聚類分析的結(jié)果能達(dá)到最優(yōu).在K-means均值聚類算法中,以K為參數(shù),作為簇的數(shù)量,即把n個數(shù)據(jù)對象劃分為K個簇,使簇內(nèi)的數(shù)據(jù)對象具有較高的相似度,而簇間的數(shù)據(jù)對象相似度最低.
在數(shù)據(jù)集B中包含n個數(shù)據(jù)點(diǎn),即B{x1,x2…xn},k為預(yù)期聚類的數(shù)量值,M1,M2,M3…MK是M的K個子集,且Mi∩Mi=Φ.在K-means聚類算法中,使用歐幾里得距離來獲取離xi點(diǎn)最近的質(zhì)心Cj.
算法輸入:(1)聚簇的數(shù)量K;(2)具有n個數(shù)據(jù)對象的數(shù)據(jù)集.
算法功能:K-means算法計(jì)算基于簇中對象的平均值.
算法輸出:形成K個簇,使得每個簇中數(shù)據(jù)對象間距離均值最小.
1)在數(shù)據(jù)集中的n個數(shù)據(jù)對象中,選取K個隨機(jī)數(shù)據(jù)對象作為K個聚類的質(zhì)心.
2)將其余數(shù)據(jù)對象分配給與其距離最近的質(zhì)心所屬的類,形成K個類,使用聚類準(zhǔn)則函數(shù)[5]:
通過該聚類準(zhǔn)則函數(shù)來進(jìn)行距離的計(jì)算,其中K值是類的數(shù)量,Mi是類Ci的代表,是類Ci中其余的數(shù)據(jù)對象O與類Ci的代表Mi的歐幾里得距離的平方.
3)計(jì)算各個類的重心,將這些重心作為各個類的代表,具體算法為:
4)不斷重復(fù)步驟(2)和(3),直到所有的數(shù)據(jù)對象不再被分配或者是達(dá)到最大的迭代次數(shù),或達(dá)到函數(shù)收斂,結(jié)果是導(dǎo)致準(zhǔn)則函數(shù)最小的K個簇的劃分.
1)從數(shù)據(jù)集 B 中隨機(jī)選取 K 個不同的數(shù)據(jù)對象作為 K 個類 C1,C2,C3…Ck的代表 H1,H2,H3…Hk.
2)repeat for B中每個數(shù)據(jù)對象O.
For每個類Cj(1≤j≤k)
3)until K個類代表不再變化.
一般聚類效果的優(yōu)劣通過平均量化誤差q(c)來測評,具體如下:
當(dāng) xi∈Dj,q(c)的值很小時,效果較佳.
知識點(diǎn)分布在學(xué)習(xí)平臺上,學(xué)生對于每個知識點(diǎn)的學(xué)習(xí)情況及測評成績都已經(jīng)在平臺的數(shù)據(jù)庫中有記錄,可以運(yùn)用K-means均值聚類算法對平臺上學(xué)生的知識點(diǎn)學(xué)習(xí)成績進(jìn)行挖掘分析,形成不同學(xué)習(xí)效果的K個簇,在對每個知識點(diǎn)測評學(xué)習(xí)情況進(jìn)行數(shù)據(jù)挖掘分析的基礎(chǔ)上,可以得知哪些測試成績的知識點(diǎn)需要進(jìn)行改進(jìn)設(shè)計(jì)并找出知識點(diǎn)設(shè)計(jì)需要改進(jìn)的地方.
在學(xué)習(xí)平臺記錄學(xué)生對于知識點(diǎn)的學(xué)習(xí)情況,記錄主要如下:
知識點(diǎn)的記錄格式為(知識點(diǎn)學(xué)號,知識點(diǎn)名稱,視頻時長,……);
學(xué)生知識點(diǎn)學(xué)習(xí)數(shù)據(jù)記錄格式(知識點(diǎn)序號,學(xué)生學(xué)號,測評成績,……);
學(xué)生登錄平臺學(xué)習(xí)知識點(diǎn)信息(時間,知識點(diǎn)序號,學(xué)號,學(xué)習(xí)時長,……).
決定學(xué)生學(xué)習(xí)知識點(diǎn)的因素很多,線上學(xué)習(xí)過程中要考慮的因素主要為學(xué)習(xí)次數(shù)、學(xué)習(xí)時長,對于一個知識點(diǎn)的學(xué)習(xí)過程至少應(yīng)該在1次以上,假如是視頻資源,至少應(yīng)該大于視頻的播放時長.假如一個學(xué)生對某知識點(diǎn)學(xué)習(xí)次數(shù)為1次,但是學(xué)習(xí)時長還不及視頻時長的1/3,考試成績差是合理的,不能計(jì)作是學(xué)習(xí)資源設(shè)計(jì)不合理.因此對于學(xué)習(xí)平臺數(shù)據(jù)庫中的存儲信息應(yīng)該有選擇地選取,同時,由于知識點(diǎn)是碎片化的,假設(shè)碎片化的知識點(diǎn)難度系數(shù)忽略不計(jì),因此本文對于平臺資源的數(shù)據(jù)選取需要符合兩個條件:
1)Times>=1(Times是知識點(diǎn)的學(xué)習(xí)次數(shù));
現(xiàn)以晉中學(xué)院在超星學(xué)習(xí)平臺[6]部署的《軟件工程》線上知識點(diǎn)學(xué)習(xí)的數(shù)據(jù)為例進(jìn)行挖掘分析.平臺共有2017~2019年三年的數(shù)據(jù),其中學(xué)生學(xué)習(xí)本課程的人數(shù)共計(jì)約300人,《軟件工程》課程線上知識點(diǎn)86個,現(xiàn)在通過對符合要求的學(xué)習(xí)數(shù)據(jù)采用K-means均值聚類[7]算法進(jìn)行挖掘.通過對線上學(xué)習(xí)數(shù)據(jù)的挖掘與分析,預(yù)期得出至少三類知識點(diǎn):第一為設(shè)計(jì)較優(yōu)的知識點(diǎn),體現(xiàn)為學(xué)生測試成績較高;第二為需要改進(jìn)設(shè)計(jì)的知識點(diǎn),體現(xiàn)在學(xué)生測試成績?yōu)橹械龋坏谌秊樵O(shè)計(jì)較差的知識點(diǎn),體現(xiàn)為學(xué)生測試成績較差.
首先對于線上知識點(diǎn)的學(xué)習(xí)數(shù)據(jù)進(jìn)行整理,符合條件的數(shù)據(jù)記錄條數(shù)約26000條,具體數(shù)據(jù)見表1.
預(yù)期對知識點(diǎn)進(jìn)行劃分為3類,因此K-means均值聚類算法中定義K值為3.
本文將上述整理后的線上學(xué)習(xí)數(shù)據(jù)在Matlab中采用K-means均值聚類算法進(jìn)行模擬計(jì)算,計(jì)算結(jié)果如圖2所示,圖上展現(xiàn)出上述數(shù)據(jù)聚類分析以后的聚類分布,按照預(yù)期要求,把知識點(diǎn)分為三個聚類,每個聚類代表一類知識點(diǎn)的學(xué)習(xí)效果,其中第一類聚類點(diǎn)表示此類知識點(diǎn)學(xué)習(xí)效果良好,第二類聚類點(diǎn)代表學(xué)
表1 整理后的線上學(xué)習(xí)數(shù)據(jù)
習(xí)效果次之,知識點(diǎn)的設(shè)計(jì)需要改進(jìn),紅色聚類點(diǎn)表示知識點(diǎn)設(shè)計(jì)效果不好,學(xué)生成績不佳,需深入改進(jìn).
圖2 聚類后聚類分布
獲取聚類分析的結(jié)果,結(jié)合線上學(xué)習(xí)平臺數(shù)據(jù)庫中的關(guān)聯(lián)信息,得出需要深入改進(jìn)的知識點(diǎn),見表2.
表2 通過對聚類結(jié)果分析后需要改進(jìn)的知識點(diǎn)
根據(jù)對需要改進(jìn)的知識點(diǎn)的分析,發(fā)現(xiàn)這些知識點(diǎn)都是實(shí)踐性很強(qiáng)的內(nèi)容,一些知識點(diǎn)確實(shí)需要進(jìn)一步改進(jìn),但是也從側(cè)面得知,不是所有的知識點(diǎn)都適合進(jìn)行線上學(xué)習(xí),特別是一些實(shí)踐性很強(qiáng)的知識點(diǎn),還是需要進(jìn)行線下學(xué)習(xí),以提升其實(shí)踐性.采用K-means均值聚類算法在對線上學(xué)習(xí)數(shù)據(jù)的挖掘分析中得到滿意的聚類結(jié)果,那么《軟件工程》線上知識點(diǎn)學(xué)習(xí)數(shù)據(jù)符合設(shè)計(jì)要求.
線上學(xué)習(xí)是當(dāng)前教育教學(xué)改革中非常重要的一種形式,特別是2020年冠狀病毒爆發(fā)以來,線上學(xué)習(xí)已經(jīng)成為大、中、小學(xué)學(xué)生學(xué)習(xí)的一種主要形式,突顯了這種教學(xué)模式強(qiáng)大的生命力,也將成為今后教學(xué)中最主要的一種形式,線上學(xué)習(xí)資源的建設(shè)以及知識點(diǎn)的設(shè)計(jì)變得非常重要.
本文提出的采用K-means均值聚類算法對學(xué)生線上學(xué)習(xí)信息和數(shù)據(jù)挖掘分析,來獲取需要進(jìn)行改進(jìn)的知識點(diǎn)的方法,進(jìn)一步提高線上學(xué)習(xí)的效果.學(xué)習(xí)效果的影響因素很多,通過知識點(diǎn)學(xué)習(xí)效果的聚類分析,雖然不能準(zhǔn)確地說明知識點(diǎn)設(shè)計(jì)不合理之處,但是最起碼能說明該知識點(diǎn)在學(xué)生學(xué)習(xí)過程中需要進(jìn)行調(diào)整,例如有些知識點(diǎn)實(shí)踐性很強(qiáng)不適合在線上學(xué)習(xí),有些知識點(diǎn)設(shè)計(jì)的容量較大,有些知識點(diǎn)需要進(jìn)行重新設(shè)計(jì),有些知識點(diǎn)難度系數(shù)較大需要進(jìn)一步拆分等.通過采用大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘技術(shù)對學(xué)生的線上學(xué)習(xí)情況進(jìn)行挖掘和分析,能夠發(fā)現(xiàn)學(xué)生在學(xué)習(xí)過程中出現(xiàn)的問題,很好地實(shí)現(xiàn)評價診斷功能,為今后教學(xué)模式的改革和評價提供一些有價值的依據(jù),促進(jìn)教學(xué)水平的提升.