李宣冬
摘 要:為了探究素質(zhì)教育的管理模式并將其運(yùn)用到高職院校的素質(zhì)教育工作中,本文引入了數(shù)據(jù)挖掘技術(shù),將素質(zhì)教育學(xué)分化和數(shù)據(jù)化,從而實(shí)現(xiàn)對(duì)素質(zhì)教育學(xué)分的分析與評(píng)價(jià),為學(xué)生的素質(zhì)教育提供更寬闊的發(fā)展空間和制度保障,使素質(zhì)教育成為高職院校教育教學(xué)工作的有機(jī)組成部分。
關(guān)鍵詞:素質(zhì)教育;學(xué)分制系統(tǒng);決策樹(shù)算法;數(shù)據(jù)挖掘
1 概述
素質(zhì)教育教學(xué)過(guò)程中,尤其是將學(xué)分制引入素質(zhì)教育中后,相關(guān)數(shù)據(jù)具有數(shù)據(jù)容量大、不完全、有噪聲、隨機(jī)性、模糊性等特點(diǎn)。傳統(tǒng)的數(shù)據(jù)處理方法根本無(wú)法勝任如此復(fù)雜的數(shù)據(jù)處理工作,因此必須采用數(shù)據(jù)挖掘相關(guān)技術(shù),提取對(duì)素質(zhì)教育發(fā)展有價(jià)值的數(shù)據(jù)信息,然后再進(jìn)行更深層次的研究。
2 C4.5決策樹(shù)算法在素質(zhì)教育學(xué)分成績(jī)?cè)u(píng)價(jià)與分析中的適用性分析
決策樹(shù)(Decision Tree)是運(yùn)用于分類(lèi)的一種樹(shù)型結(jié)構(gòu),可以對(duì)未知的數(shù)據(jù)通過(guò)分析進(jìn)行分類(lèi)或預(yù)測(cè)。在數(shù)據(jù)挖掘的研究與應(yīng)用中,決策樹(shù)是一種經(jīng)常要用到的技術(shù),在數(shù)據(jù)分析和預(yù)測(cè)中發(fā)揮著重要作用,決策樹(shù)算法是目前應(yīng)用非常廣泛的一種學(xué)習(xí)方法,其中C4.5算法應(yīng)用最廣泛,其既能處理分類(lèi)問(wèn)題,又能處理回歸問(wèn)題,它產(chǎn)生的規(guī)則容易理解,準(zhǔn)確率高。分析學(xué)生素質(zhì)教育成績(jī)優(yōu)良與哪些因素有關(guān),屬于預(yù)測(cè)中的分類(lèi)數(shù)據(jù)挖掘。
3 基于C4.5決策樹(shù)算法的素質(zhì)教育學(xué)分評(píng)價(jià)模型的構(gòu)建
3.1 數(shù)據(jù)收集 本文的數(shù)據(jù)由某高職院校學(xué)工部提供,分別取自“會(huì)計(jì)”與“商務(wù)管理”兩個(gè)專(zhuān)業(yè),數(shù)據(jù)源包括學(xué)生的基本信息(來(lái)自學(xué)生學(xué)籍管理系統(tǒng))、教師信息(來(lái)自教務(wù)管理系統(tǒng))、素質(zhì)教育學(xué)分成績(jī)等,然后最終用到的數(shù)據(jù)就是以這三者為基礎(chǔ)的關(guān)系數(shù)據(jù)庫(kù)。
3.2 數(shù)據(jù)預(yù)處理 ①數(shù)據(jù)屬性刪除。通過(guò)對(duì)某高職院校的素質(zhì)教育學(xué)分制應(yīng)用情況進(jìn)行調(diào)研,結(jié)果發(fā)現(xiàn),學(xué)生信息庫(kù)中幾張數(shù)據(jù)庫(kù)表格中的很多屬性,與其他的數(shù)據(jù)顯然存在著較大的區(qū)別,存在很大的不一致性,是不相關(guān)的,因此必須刪除,以減少后期數(shù)據(jù)挖掘不必要的時(shí)間、精力以及財(cái)力的浪費(fèi)。②數(shù)據(jù)屬性泛化:通過(guò)對(duì)某高職院校的素質(zhì)教育學(xué)分制應(yīng)用情況進(jìn)行調(diào)研,應(yīng)用數(shù)據(jù)泛化原理,對(duì)大學(xué)生信息中的“學(xué)分成績(jī)”進(jìn)行了泛化處理,3.0分以上為“優(yōu)秀”;2-2.9分之間為“中”;其他為“一般”。到課率泛化為:到課率>=95的為“高”,90%至95%之間的為“中”,<90%的為“低”。教師教學(xué)經(jīng)驗(yàn)泛化為:具有五年以上教學(xué)經(jīng)歷的為“豐富”,五年以下的為“不豐富”。特長(zhǎng)愛(ài)好根據(jù)學(xué)生的登記信息對(duì)比相關(guān)課程,泛化為“愛(ài)好”和“不愛(ài)好”。③數(shù)據(jù)清理:通過(guò)對(duì)某高職院校的素質(zhì)教育學(xué)分制應(yīng)用情況進(jìn)行調(diào)研,結(jié)果發(fā)現(xiàn),雖然學(xué)生信息、教師信息等數(shù)據(jù)相對(duì)比較完整,但仍然存在某些記錄不完整、沒(méi)有填寫(xiě)或者填寫(xiě)錯(cuò)誤等問(wèn)題,需要進(jìn)行數(shù)據(jù)清理,針對(duì)不同的數(shù)據(jù)類(lèi)型,采用不同的數(shù)據(jù)清理技術(shù)來(lái)處理。
3.3 創(chuàng)建決策樹(shù)模型
3.3.1 信息增益率的計(jì)算(略)。
根據(jù)公式GainRatio(S,A)=,依次計(jì)算出所有屬性的信息增益率:
Gainratio(性別)==0.0024
Gainratio(專(zhuān)業(yè))==0.00006
Gainratio(音樂(lè)愛(ài)好)=)=0.00005
Gainratio(到課率)=)=0.0794
Gainratio(教師經(jīng)驗(yàn))=)=0.0438
3.3.2 遞歸創(chuàng)建決策樹(shù)。從以上計(jì)算結(jié)果得知,“到課率”屬性的信息增益率最高,因此,“到課率”被選為第一個(gè)測(cè)試屬性。創(chuàng)建根節(jié)點(diǎn),用“到課率”標(biāo)記,并根據(jù)它的三個(gè)屬性值,引出三個(gè)分枝,樣本以此劃分,然后再分別計(jì)算各個(gè)分枝節(jié)點(diǎn)的劃分,根據(jù)算法繼續(xù)計(jì)算,得出當(dāng)“到課率”=“高”時(shí)的劃分,如圖1所示。
重復(fù)以上步驟,完成各個(gè)分枝的劃分,遞歸得到學(xué)生音樂(lè)課學(xué)分成績(jī)決策樹(shù)模型。如圖2所示。
圖2 ?素質(zhì)教育音樂(lè)學(xué)分成績(jī)決策樹(shù)模型
4 素質(zhì)教育學(xué)分成績(jī)?cè)u(píng)價(jià)模型的評(píng)估與分析
依據(jù)上述素質(zhì)教育音樂(lè)學(xué)分成績(jī)決策樹(shù)模型,對(duì)音樂(lè)成績(jī)保留的160個(gè)樣本進(jìn)行測(cè)試,通過(guò)測(cè)試其準(zhǔn)確率達(dá)到88.75%,通過(guò)測(cè)試來(lái)判斷它的合理性,以檢驗(yàn)分類(lèi)規(guī)則的準(zhǔn)確率,由此我們可以看到,經(jīng)過(guò)測(cè)試,采用C4.5決策樹(shù)算法生成的分類(lèi)規(guī)則的準(zhǔn)確率大于85%,基本符合要求,如果再進(jìn)行適當(dāng)?shù)男藜?,正確率會(huì)更高。因此該模型較為合理,可以加以應(yīng)用。通過(guò)對(duì)學(xué)生音樂(lè)課成績(jī)的分析,得到以下建議:一是到課率對(duì)學(xué)生學(xué)習(xí)成績(jī)的影響較大,學(xué)生應(yīng)該在學(xué)習(xí)過(guò)程中嚴(yán)格遵守學(xué)校的學(xué)習(xí)紀(jì)律,按時(shí)上課,端正學(xué)習(xí)態(tài)度,按時(shí)完成老師要求完成的學(xué)習(xí)任務(wù)。二是學(xué)生的專(zhuān)業(yè)對(duì)學(xué)習(xí)成績(jī)也有一定的影響,不同專(zhuān)業(yè)的學(xué)生的性格、愛(ài)好都不一樣。三是教師的教學(xué)經(jīng)驗(yàn)對(duì)學(xué)生的學(xué)習(xí)成績(jī)影較大,教師應(yīng)該通過(guò)各種途徑不斷地豐富自己的教學(xué)經(jīng)驗(yàn),提高音樂(lè)專(zhuān)業(yè)技能和音樂(lè)教學(xué)水平,以此來(lái)進(jìn)一步提高學(xué)生的到課率。
綜上所述,C4.5決策樹(shù)算法對(duì)于素質(zhì)教育學(xué)分成績(jī)的分析與評(píng)價(jià)的應(yīng)用研究具有較好的適用性,通過(guò)對(duì)成績(jī)的分析與評(píng)價(jià),可以了解影響學(xué)生成績(jī)的主要因素,從而幫助學(xué)生改進(jìn)學(xué)習(xí)方法,輔助教師提高教學(xué)水平,為教學(xué)管理者提供決策依據(jù),從而提高高職院校素質(zhì)教育的整體水平。
參考文獻(xiàn):
[1]杜玉波.全面推進(jìn)素質(zhì)教育,培養(yǎng)高素質(zhì)創(chuàng)新人才[J].中國(guó)高教研究,2012,01:1-4.
[2]哈申花,張春生.基于C4.5決策樹(shù)學(xué)生成績(jī)數(shù)據(jù)挖掘方法[J].內(nèi)蒙古民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,02:151-152+158.