盧 發(fā)
(廣東省江門市第一職業(yè)高級中學,廣東 江門 529000)
以數(shù)據挖掘提高計算機課堂效率探究
盧 發(fā)
(廣東省江門市第一職業(yè)高級中學,廣東 江門 529000)
文章通過計算機課堂中積累的各種學生行為數(shù)據,用Sqlserver 2005和Excel 2007進行了數(shù)據挖掘,得出了許多新穎的觀點,有利于提高計算機教學課堂效率。
數(shù)據挖掘;課堂效率;學生管理
數(shù)據挖掘(Data Mining,DM)也叫數(shù)據開采或數(shù)據采掘,就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。現(xiàn)存的信息系統(tǒng)的數(shù)據量非常大,而其中真正有價值的信息卻很少,因此從大量的數(shù)據中經過深層分析,獲得有利于業(yè)務運作、提高競爭力的信息,就像從礦石中淘金一樣,數(shù)據挖掘也因此而得名。這種新式的信息處理技術,可以按既定業(yè)務目標,對大量的數(shù)據進行探索和分析,揭示隱藏的、未知的或驗證已知的規(guī)律性,并進一步將其模型化。
具體的數(shù)據挖掘方法有:統(tǒng)計和可視化、聚類、關聯(lián)分析等。
聚類分析是根據所選的變量對研究對象進行分類,聚類的結構僅僅反映了所選變量定義的數(shù)據結構,所以變量的選擇在聚類分析中十分重要。一般而言,所選變量要符合以下要求:(1)和聚類分析的目的密切相關;(2)要反映分類對象的一般特征;(3)在不同研究對象上的值具有明顯的差異;(4)變量之間不應該高度相關。
2.1 以學生課堂表現(xiàn)進行聚類
在現(xiàn)代的中小學校園里,都比較流行對學生的“量化評估”即實行“平時分”課堂管理制度,“平時分”無疑在衡量學生課堂表現(xiàn)中起到標尺的作用,但是在具體操作過程中,我們發(fā)現(xiàn)平時分制度在很多班級的實際應用中存在重大缺陷,并且有時候在一定程度上已經變得形同虛設了。
問題出現(xiàn)在有些班級學生的素質參差不齊,好的學生非常好,不守紀律的學生視紀律如無物,老師設定原始操行分為80分,但是有些學生由于課堂表現(xiàn)太差等原因,分數(shù)被扣很多,已經變成負值了,這導致不少學生不在乎操行分,甚至有些學生變得自暴自棄。
如何解決這些問題,在開學一定時間后(如2~3周),通過對學生平時分的聚類分析,找出相同類型的學生,分值高的一類,中等的一類,分值比較低的一類,三類學生都有不同的特征,每類學生里都有一定的相似點。當然學生都在不斷進步發(fā)展之中,因此要每兩周重新評估學生分類情況,適時調整策略。平時分聚類如圖1所示。
圖1 德育分聚類
聚類分析的結果顯示,根據學生的平時分把學生分為3部分,一部分是100分(含)以下的為分值較低的一類,分值一般的從100~140之間,最高的一部分是140(不含)以上的。
2.2 以學生情況進行聚類
多年的教學經驗告訴我們,學生的家庭情況對學生在學校的是至關重要的,因此通過把學生的家庭進行聚類分析把家庭環(huán)境相似的學生歸為一類,另外把違紀情況相似的也歸為一類,以進行針對性的德育輔導,做到因材施教。
把學生家庭背景中的相關變量:父母學歷、父母工作單位、職務、家庭的完整性等作為聚類變量。為了能更好地衡量不同家庭背景的情況,把學歷、工作單位、職務、完整性等進行數(shù)字化,再進行聚類。
2.3 學生其他情況聚類
構造一個二維交叉表,其中數(shù)字是課堂違紀的次數(shù)(見表1),違紀聚類如圖2所示。
表1 學生違紀二維表
圖2 違紀聚類
有了聚類分析,平時分管理制度的存在就有了新的理由,不管是在學生眼里還是教師眼里,在同一類(以平時分作聚類得出)學生里,哪些學生的分數(shù)有了變化;如重新聚類是否會跑到別的類去了;分數(shù)更高的類還是更低的。
關聯(lián)規(guī)則挖掘就是從大量的數(shù)據中挖掘出有價值描述數(shù)據項之間相互聯(lián)系的有關知識。隨著收集和存儲在數(shù)據庫中的數(shù)據規(guī)模越來越大,人們對從這些數(shù)據中挖掘相應的關聯(lián)知識越來越有興趣。例如:從大量的商業(yè)交易記錄中發(fā)現(xiàn)有價值的關聯(lián)知識就可幫助進行商品目錄的設計、交叉營銷或幫助進行其他有關的商業(yè)決策。
由于課堂違紀在學生違紀中較為普遍,所以,對其進行相關分析顯得十分重要。對同某一星期(第7周)里實際發(fā)生的違紀情況數(shù)據(部分)如表2所示。
表2 學生課堂違紀情況
面對如此多的違紀,作為老師,只能教育,手段可以多種多樣,如私下談心、嚴格要求、惡性懲罰、通知家長等,但是,我們仔細分析上表會發(fā)現(xiàn),有些同學如果遲到回來后可能會上課講閑話,如果曠課回來后可能會瞌睡。學生違紀關聯(lián)分析如圖3所示。
圖3 學生違紀關聯(lián)分析
通過以上的分析,我們意外地發(fā)現(xiàn),如果一個學生不做眼保健操,那么可以肯定他必定會上課說話,另外上課說話的也會上課打瞌睡。
關聯(lián)分析工具是基于現(xiàn)有數(shù)據得出一個相對客觀的結論,有經驗的教師在教學中往往也能得到同樣的結論,但是,經過數(shù)據挖掘,從理論上得出結論,往往比老師的經驗更具說服力,從而避免了某些教師由于僥幸心理作出不利于課堂穩(wěn)定的決定。
數(shù)據挖掘確實是個好東西,其中的聚有分析和關聯(lián)分析是進行數(shù)據挖掘的重要手段,能夠從毫不起眼的、別人以為無用的一堆班級統(tǒng)計數(shù)據里發(fā)現(xiàn)一些很有創(chuàng)意的觀點,這些觀點不是憑空想象出來的,而是由實際數(shù)據得出的,讓人不得不信服。
對已經形成的學生情況調查表進行分析、整理、判斷,如果采用聚類分析的方法,借助于SPSS,SAS等統(tǒng)計軟件,不僅省時、省力,而且結果客觀得多,能夠發(fā)現(xiàn)許多意想不到的觀點,在學生違紀前就觀察出蛛絲馬跡,把許多重大違紀現(xiàn)象扼殺在萌芽階段。
當然數(shù)據挖掘并不是無所不能的,并且也有自身的不足。如聚類分析應用于班級的研究領域畢竟是一種新的嘗試,還存在許多問題,如聚類的方法具體包含多種,使用哪一種應根據研究需要慎重選擇;無論是關聯(lián)分析還是聚類分析,都只是數(shù)據的反映,而且是歷史數(shù)據的反映,同樣的數(shù)據不一定得出相同的結果,課堂管理的對象是學生,如果只刻板地由數(shù)據挖掘得出結論,并由此作出決策的話,可能會犯下嚴重錯誤。
Study on improving the ef fi ciency of computer classroom by data mining
Lu Fa
(The First Vocational High School of Jiangmen City in Guangdong Province, Jiangmen 529000, China)
This paper uses the student behavior data accumulated in computer classroom, came up with a lot of novel viewpoints by using Sqlserver 2005 and Excel 2007 to carry on data mining, which helps to improve the ef fi ciency of computer teaching classroom.
data mining; classroom ef fi ciency; student management
盧發(fā)(1977— ),男,廣東江門人。