鄒星
高校教務(wù)管理系統(tǒng)在高校管理中具有舉足輕重的地位。伴隨著高校的擴(kuò)招、學(xué)生數(shù)量的急劇增加以及學(xué)分制的確定,原本復(fù)雜的教務(wù)管理工作變得更加復(fù)雜。教務(wù)管理所使用的教務(wù)管理系統(tǒng)雖然能夠完成日常事務(wù)工作的處理,但卻不能解決信息查找、信息分析等問題,無(wú)法為管理人員提供決策支持,滿足不了現(xiàn)代高校管理的新需求。數(shù)據(jù)挖掘技術(shù)可以發(fā)現(xiàn)海量數(shù)據(jù)之間隱藏的關(guān)聯(lián)及相互之間的影響作用,為管理人員提供決策幫助。本文研究的重點(diǎn)就是在現(xiàn)有的教務(wù)管理系統(tǒng)之上,利用數(shù)據(jù)挖掘技術(shù)解決目前高校教務(wù)管理中普遍存在的數(shù)據(jù)分析問題,達(dá)到提高高校管理的質(zhì)量和水平的目的。
一、數(shù)據(jù)挖掘的過程
第一,明確業(yè)務(wù)應(yīng)該處理的對(duì)象。應(yīng)該對(duì)于問題進(jìn)行明確的界定,對(duì)于數(shù)據(jù)挖掘的目標(biāo)的確定是保證數(shù)據(jù)挖掘的開端,也是非常重要的一個(gè)環(huán)節(jié)。雖然對(duì)于數(shù)據(jù)進(jìn)行挖掘最后的結(jié)論是不可預(yù)測(cè)的,但是對(duì)于問題所進(jìn)行的探索是非常清楚的。如果盲目地對(duì)數(shù)據(jù)進(jìn)行挖掘,就會(huì)降低數(shù)據(jù)挖掘的準(zhǔn)確性。
第二,數(shù)據(jù)準(zhǔn)備工作。這個(gè)過程需要完成的工作主要有數(shù)據(jù)選擇、數(shù)據(jù)處理、數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)選擇主要是對(duì)和業(yè)務(wù)對(duì)象相關(guān)的所有的有用信息進(jìn)行搜索,從而在里面選擇最合適的信息。數(shù)據(jù)處理主要研究數(shù)據(jù)本身的質(zhì)量,其目的是為了更好地完成數(shù)據(jù)分析工作,并且確定進(jìn)行數(shù)據(jù)挖掘的類型。數(shù)據(jù)轉(zhuǎn)換主要是為數(shù)據(jù)轉(zhuǎn)換確定合適的分析模型,這個(gè)模型的建立需要充分考慮數(shù)據(jù)的算法,建立真正合適的分析模型。
二、關(guān)聯(lián)規(guī)則算法與決策樹算法在教務(wù)管理中的應(yīng)用
(一)關(guān)聯(lián)規(guī)則算法
關(guān)聯(lián)規(guī)則能夠非常清晰準(zhǔn)確地表達(dá)數(shù)據(jù)庫(kù)中每一個(gè)子集的基本情況。使用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)分析時(shí),主要工作方式就是通過對(duì)數(shù)據(jù)庫(kù)、關(guān)系數(shù)據(jù)庫(kù)和其他儲(chǔ)備信息庫(kù)進(jìn)行分析,從而尋找出項(xiàng)集之間存在的關(guān)聯(lián)性。關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的重要組成部分。所謂關(guān)聯(lián)規(guī)則,是指能夠達(dá)到預(yù)定目標(biāo)要求的規(guī)則。舉一個(gè)簡(jiǎn)單的例子,在一個(gè)蘊(yùn)含式子中:形如這樣的一種蘊(yùn)含式子:X-Y。其中:X表示規(guī)則前件,Y表示規(guī)則后件。關(guān)聯(lián)規(guī)則的強(qiáng)度值通常用客觀興趣度衡量。客觀興趣度衡量是一種評(píng)價(jià)關(guān)聯(lián)模式的質(zhì)量的數(shù)據(jù)驅(qū)動(dòng)的方法。它使用從數(shù)據(jù)推導(dǎo)出的統(tǒng)計(jì)量來確定模式是否是有趣的,可用支持度或置信度來評(píng)價(jià)。令I(lǐng)=(i1,i2,i3,…,im)是挖掘數(shù)據(jù)庫(kù)D中所有項(xiàng)的集合,集合T={t1,t2,t3,…,tn}是所有事務(wù)的集合,包含零個(gè)或多個(gè)項(xiàng)的集合稱為項(xiàng)集。如果項(xiàng)集X是事務(wù)t1的子集,則稱事務(wù)t1包含項(xiàng)集X。在事務(wù)集T中包含項(xiàng)集X的事務(wù)個(gè)數(shù)稱為項(xiàng)集X的支持度計(jì)數(shù)M(X)。
(二)決策樹算法
決策樹算法就是以實(shí)際案例進(jìn)行歸納總結(jié)而得出的一種學(xué)習(xí)算法,主要的運(yùn)算原理即是在無(wú)順序、無(wú)規(guī)則的元組中找到?jīng)Q策樹表示形式的分類規(guī)則。其遞歸方式采用的是自項(xiàng)而下的方式,在決策樹的內(nèi)部節(jié)點(diǎn)中去完成屬性值的比較,并且根據(jù)不用的屬性值進(jìn)行自上而下的分支,在分類的過程中要學(xué)習(xí)葉節(jié)點(diǎn)自身的特性和規(guī)律,只有把握住其內(nèi)在規(guī)律才能夠在從根到葉節(jié)點(diǎn)的運(yùn)算過程中不出現(xiàn)錯(cuò)誤。決策樹的構(gòu)造過程中不需要掌握非常高端的計(jì)算機(jī)知識(shí),只需要掌握基本的知識(shí)就能夠完成其構(gòu)建過程,因此這種算法在數(shù)據(jù)挖掘過程中受到非常廣泛的關(guān)注。
(三)關(guān)聯(lián)規(guī)則算法與決策樹算法在教務(wù)管理中的應(yīng)用
當(dāng)前研究的高校教務(wù)管理系統(tǒng)中就已經(jīng)應(yīng)用了很多的關(guān)于關(guān)聯(lián)算法和決策樹算法,因?yàn)檫@兩種算法的綜合應(yīng)用性比較強(qiáng),所以依據(jù)其自身的挖掘目的和數(shù)據(jù)分析的特點(diǎn)所設(shè)計(jì)的數(shù)據(jù)挖掘系統(tǒng)就具有非常強(qiáng)大的適用性。通過數(shù)據(jù)挖掘就能夠?qū)⒔處煹哪挲g、工作、學(xué)歷、課時(shí)等基本信息很快地搜索關(guān)聯(lián)起來,這樣對(duì)提高教學(xué)質(zhì)量和教師的自身素質(zhì)有很大的幫助。因?yàn)橄鄬?duì)來說,高校的教務(wù)管理系統(tǒng)中有很多的教師信息,這樣就會(huì)導(dǎo)致學(xué)生和教師的信息非常龐雜,龐大的數(shù)據(jù)系統(tǒng)會(huì)使教務(wù)管理系統(tǒng)在運(yùn)作時(shí)所需要處理的數(shù)據(jù)變得更多。
決策樹在高校教務(wù)管理信息系統(tǒng)中所發(fā)揮的作用非常大,主要就是用于對(duì)相關(guān)數(shù)據(jù)信息的預(yù)處理。在預(yù)處理的過程中,首先應(yīng)該完成的就是相關(guān)的決策樹模型構(gòu)建,在構(gòu)建決策樹模型以后,往往會(huì)存在一些不需要處理的分支,這些分支的存在對(duì)于正常的教務(wù)管理工作有很大的影響,所以說,在構(gòu)建決策樹以后首先應(yīng)該完成的就是剪枝工作,剪枝工作的質(zhì)量和效率對(duì)于決策樹自身存在的合理性有很大的影響。對(duì)于分支決策樹進(jìn)行合理的剪枝,就能夠讓決策樹剪枝工作順利完成,這樣也就能夠保證其預(yù)期具有較高的效率。在構(gòu)建決策樹的過程中,一定要注意構(gòu)建合理科學(xué)的決策樹。
三、結(jié)束語(yǔ)
在當(dāng)前的學(xué)校教務(wù)管理系統(tǒng)中,信息量的快速增加會(huì)給教務(wù)管理人員帶來很大的挑戰(zhàn)。因此在當(dāng)前的科技環(huán)境下,應(yīng)該將數(shù)據(jù)挖掘技術(shù)的相關(guān)算法廣泛應(yīng)用在學(xué)校的教務(wù)管理系統(tǒng)中,這樣就能夠促進(jìn)教務(wù)管理系統(tǒng)進(jìn)一步改革和完善,為管理人員決策提供重要的依據(jù),從而使教務(wù)管理工作變得更有科學(xué)性和針對(duì)性。