田文祥
(合肥工業(yè)大學 管理學院,合肥 230009)
學業(yè)預警通常是指學校通過學生在學習進度推進的不同階段,密切關注學生學習進展,對學習效果不理想達到一定程度的學生采取提醒、教育等預先警示方式并責令改正,幫助學生順利完成學業(yè)的一種教育和干預手段[1]。高校學業(yè)預警中學生學分數(shù)的取得通常是學生畢業(yè)資格中最基本的要素之一,學分數(shù)或課程數(shù)是高校學業(yè)預警機制中最常見的量化指標,同時學業(yè)績點或平均學分績點(GPA)也是衡量學生學習質量的常見指標,也是學業(yè)預警中常用的篩查指標。對在校學生進行學業(yè)預警篩查時,一般會根據(jù)學生學業(yè)問題的嚴重程度設置幾個不同的預警等級,如模仿氣象預警等級的黃色預警(較嚴重)、橙色預警(嚴重)、紅色預警(非常嚴重)。借助于數(shù)據(jù)挖掘技術對高校學生學業(yè)數(shù)據(jù)進行處理,從大量的數(shù)據(jù)中發(fā)現(xiàn)潛在育人價值體系[2]。離群數(shù)據(jù)[3]具有空間稀疏性、小樣本、屬性點異?,F(xiàn)象等顯著特點,與高校學生學業(yè)預警管理體系[4]狀態(tài)分布特點接近,基于統(tǒng)計學的方法和已獲得數(shù)據(jù),選擇采用離群數(shù)據(jù)挖掘技術作為技術手段。
以合肥工業(yè)大學管理學院會計學專業(yè)學生學年度文化課成績?yōu)闃颖?,運用離群數(shù)據(jù)挖掘技術[5]進行處理,通過分析相關指標,對數(shù)據(jù)進行以下定義與處理:得分90分以上的科目所獲成績劃分為一類成績,并通過SQL語言、數(shù)據(jù)庫系統(tǒng)進行數(shù)據(jù)處理,計算單個學生90分以上科目學分總和。
將數(shù)據(jù)進行預處理后,通過Rapidminer軟件對預處理后的數(shù)據(jù)進行數(shù)據(jù)聚類,進而分析學生平均成績與一類成績之間的關系。
本次聚類主要通過K-Means算法進行聚類分析,具體步驟如下:將數(shù)據(jù)導入Rapidminer軟件;建立規(guī)則,將學號設為ID;建立K-Means算法,將K值設為4;鏈接各個輸入端,運行算法;將輸出方式設置為“散點圖”。
通過上述步驟進行聚類數(shù)據(jù),得到以下輸出結果,如圖1所示。
圖1 平均成績散點圖Fig.1 Scatter diagram of average scores
通過散點圖的分布狀況可判定此聚類是有效聚類,該散點圖中的左下角紅色標點的學生為一級學業(yè)預警對象[6],暫定為D類學生,隨著其分布逐漸向右上方移動,認為其學習狀態(tài)比前一層次更好,其相應的預警程度也就越低。
數(shù)據(jù)結果表明,A類學生在各個科目中都獲得了相對高分,其平均成績也是位于專業(yè)前茅。與此同時,D類學生表現(xiàn)出各個科目的成績都不是很好,其最終成績排名也不太理想。對于B類學生,可能存在個別科目不太擅長,其他科目學習成果較好,存在略微的偏科現(xiàn)象。對于C類同學,更偏向于部分學科能達到良好水平,但是總體不是很優(yōu)秀,每一門科目都屬于中等水平,可能由于學習熱情不夠高或者不夠認真導致此結果。
第一,成績標準改變對結果的影響。
成績標準劃分的不同對最后結果會產生不同影響,將一類成績的標準降低到85分以及80分,通過Rapidminer軟件進行相似步驟的分析,結果如圖2、圖3所示。
圖2 以80分作為一類標準Fig.2 80 scores as a category
圖3 以85分作為一類標準Fig.3 85 scores as a category
研究結果表明,調整一類成績的標準后,整體趨勢并沒有發(fā)生顯著變化,但是每一聚類所包含點的數(shù)量則發(fā)生了一定程度上的改變。在實際應用中,可以根據(jù)各個樣本的實際水平及客觀因素的影響(如考試的難度、評卷的標準)來對這一標準進行設定。
第二,德、體、能三因素間的關聯(lián)。
用同樣的辦法,將同一樣本中學生的德、體、能所獲得的成績進行標準化處理,并利用Rapidminer軟件對其進行聚類分析,結果如圖4~圖6所示。
圖4 智—德關系圖Fig.4 Wisdom-ethics relationship
圖5 智—體關系圖Fig.5 Wisdom-physics relationship
圖6 智—能關系圖Fig.6 Wisdom-ability relationship
研究結果表明,學業(yè)預警模型散點圖[7]呈現(xiàn)出倒直角三角型式的排列,即智力分數(shù)越高的學生,在德、體、能方面的表現(xiàn)相對來說也更為突出。這與高校學生日常教育管理服務工作中所觀察到的學生日常表現(xiàn)具有較高的一致性,在學業(yè)成績上能取得較好表現(xiàn)的學生,通常對于班級日常活動的參與有著更高的積極性,也更注重于自身對日常良好習慣的保持。
在基于離群數(shù)據(jù)挖掘技術分析處理中,對學生年度學業(yè)成績進行分析,建立了適合于該群體學生的預警模型,根據(jù)學生日常表現(xiàn)驗證了該學業(yè)預警模型的可靠性,同時表明了基于離群數(shù)據(jù)挖掘分析的學業(yè)預警模型的可行性。
在驗證了基于離群數(shù)據(jù)挖掘分析的學業(yè)預警模型可行性的基礎上,研究發(fā)現(xiàn)學業(yè)預警除了可針對學生的學業(yè)成績指標外,該模型還可以在學生的日常學習生活中給予更加全面和生動的預警與建議,使學業(yè)預警模型更加科學化、系統(tǒng)化與規(guī)范化,在幫助學生順利完成學業(yè)的基礎上,更好地促進學生成長成才。
對學生的日常學習行為和過程表現(xiàn)進行記錄,如學生出勤情況、課堂參與度、課后作業(yè)完成情況、課程難易程度等方面,對學生的學業(yè)狀態(tài)進行及時提醒,動態(tài)跟進,提前預警研判。