吳煥瑞
【摘 要】數(shù)據(jù)挖掘技術(shù)能夠從海量信息中獲取有用的知識,有利于輔助管理者制定決策。分析《計算機信息技術(shù)》的課程成績時,挖掘得出影響學生成績的潛在的因素,目的在于改善課程教學。
【關(guān)鍵詞】決策樹;數(shù)據(jù)挖掘;成績分析
一、引言
傳統(tǒng)的學生學習成績分析大多只是將學生的考試成績檔和查詢做簡單的排序和分析,如果將數(shù)據(jù)挖掘技術(shù)運用到高校學生成績分析中來,對成績數(shù)據(jù)進行更深層次的有效分析處理,可以更加全面地分析各種影響學生成績的因素以及學生各項成績之間的潛在聯(lián)系,可以幫助教師們認清同學們的學習現(xiàn)狀,從而更加靈活和有效的組織教學,同時,還可以進一步幫助同學們科學的、有針對性的提高學習成績。
二、決策樹介紹
決策樹是一種類似于流程圖的樹結(jié)構(gòu),它對數(shù)據(jù)進行分類,以此達到預測的目的。決策樹由決策結(jié)點、分支和葉子組成,每個決策結(jié)點代表一個問題或決策,最上面的結(jié)點為根結(jié)點,每個分支代表一個新的測試輸出,每一個內(nèi)部節(jié)點代表在一個屬性上的測試,每一個葉子結(jié)點代表一種可能的分類結(jié)果。決策樹結(jié)構(gòu)是采用自上而下的遞歸算法,由內(nèi)部結(jié)點屬性值的比較來判斷下面再根據(jù)哪個結(jié)點進行分支,最后找到?jīng)Q策樹的葉節(jié)點。
三、決策樹算法在《計算機信息技術(shù)》成績分析中的應(yīng)用
《計算機信息技術(shù)》在學生在大一時上的一門基礎(chǔ)課,包含選擇題、windows操作、word操作、excel操作、PPT、網(wǎng)絡(luò)等,利用決策樹技術(shù)研究在計算機等級考試中,各個模塊對成績影響的程度,通過構(gòu)造決策樹可以很容易看出,哪些屬性對成績起決定作用最大。
(一)數(shù)據(jù)采集
本文利用的數(shù)據(jù)源是2013級計算機類專業(yè)的《計算機信息技術(shù)》成績,由于現(xiàn)實數(shù)據(jù)是不完整和包含噪聲的,對原始數(shù)據(jù)進行預處理,是進行數(shù)據(jù)挖掘操作前必須要做的一個非常重要的步驟。數(shù)據(jù)預處理部分包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換等操作。
數(shù)據(jù)清洗:采用忽略元組的方式,將采集到的原始數(shù)據(jù)中缺考、緩考、曠考、作弊的學生記錄刪除。
數(shù)據(jù)選擇:因為主要針對各個模塊對成績的影響進行分析,所以學生的學號姓名等無關(guān)字段一并刪除。
數(shù)據(jù)轉(zhuǎn)換:因為重點分析成績及格和不及格決定因素,因此將數(shù)據(jù)轉(zhuǎn)換為表:
(二)數(shù)據(jù)分析
利用C5.0算法,在Spss Clementine下建立“成績分析”表的決策樹模型。
流中將“分析結(jié)果.xls”作為源文件節(jié)點。用到了Excel、類型、C5.0模型三個對象。將三個節(jié)點對象拖如流中,并建立其連接。在建立成績是否及格決策樹模型時,以等級屬性作為分類屬性。運行后對結(jié)果進行了分析,得出了基于等級字段類型的決策樹模型為圖2,分類規(guī)則如圖3.
(三)結(jié)果分析
通過以上分析,可以看到對EXCEL決定這最終成績的影響是最為重要的,其次是網(wǎng)絡(luò),word。因此,同學們在計算機信息技術(shù)的等級考試的時候可以將excel作為重點來進行強化訓練。另一方面,任課教師也可以根據(jù)通過等級的幾種規(guī)則有所了解,在日常的教學工作中,合理制定教學計劃,適時調(diào)整教學方法。授課教師要在課堂上多進行excel強化訓練,經(jīng)常提醒同學們多重視、多練習。因此根據(jù)數(shù)據(jù)挖掘分析結(jié)果教師對同學們學習進行科學的指導,幫助學生進一步提高學習效率。
四、總結(jié)
本文運用數(shù)據(jù)挖掘的技術(shù)建立了分類處理模型,探究了《計算機信息技術(shù)》這門課中,找出規(guī)律,從而不斷改進教學工作,指導學生調(diào)整學習計劃、完善學習方法、科學有效提高學習成績。
【參考文獻】
[1]吳全勝,馬敏.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用現(xiàn)狀[J].科技信息,2009(33).
[2]范明 ,孟小峰,譯.數(shù)據(jù)挖掘概念與技術(shù)[M].機械工業(yè)出版社,2001.
[3]趙艷春.決策樹算法在中職招生宣傳中的應(yīng)用研究[J].中國西部科技,2013 (01).
[4]張春琴.數(shù)據(jù)挖掘技術(shù)在課程成績分析管理中的應(yīng)用研究[D].杭州:浙江工業(yè)大學,2009.