文|程知
隨著科學(xué)技術(shù)的迅猛發(fā)展,高等院校的教學(xué)質(zhì)量問(wèn)題也隨即成為社會(huì)關(guān)注的重要課題,不斷完善,不斷更新,適應(yīng)新形式的發(fā)展刻不容緩。各種高校在教學(xué)管理的過(guò)程中,每天都會(huì)產(chǎn)生及其大量的數(shù)據(jù),目前形勢(shì)看來(lái),高校的教學(xué)管理系統(tǒng)只是做出了更新、查詢、統(tǒng)計(jì)或是打印等操作,完全沒(méi)有運(yùn)用到數(shù)據(jù)挖掘技術(shù),即從如此海量的數(shù)據(jù)中挖掘出有益信息或是發(fā)現(xiàn)出其中所隱含的規(guī)律,這無(wú)疑造成了數(shù)據(jù)浪費(fèi)。因此,探討數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用與研究對(duì)于從數(shù)據(jù)庫(kù)中發(fā)掘有益信息、提高教學(xué)質(zhì)量、提高教師教學(xué)水平等方面有深遠(yuǎn)的意義。
數(shù)據(jù)挖掘即在給定數(shù)據(jù)庫(kù)中提取出隱含信息。這些隱含信息一般包括人們事先所未知的以及其中潛在的信息資源。這些隱含信息資源可以有多種多樣的表現(xiàn)形式,類似于概念規(guī)則、定理規(guī)律或者是模式等,沒(méi)有一個(gè)確定的規(guī)則來(lái)定義是何種表現(xiàn)形式。一般來(lái)說(shuō),從這些隱含信息中提取出來(lái)的信息知識(shí)都兼?zhèn)溆行?、最終可理解性、新穎性,換句話說(shuō),所挖掘的信息知識(shí)是可運(yùn)用的、可理解的、可接受的,而且最佳的結(jié)果是能夠通過(guò)自然的語(yǔ)言來(lái)表現(xiàn)出來(lái)。
數(shù)據(jù)挖掘要運(yùn)用一定的算法,進(jìn)行有條不紊的操作,一般其操作過(guò)程分為幾個(gè)步驟,即數(shù)據(jù)預(yù)處理,數(shù)據(jù)挖掘,模式評(píng)估。鞏固知識(shí)以及運(yùn)用知識(shí)等。
數(shù)據(jù)預(yù)處理是在數(shù)據(jù)處理之前的準(zhǔn)備工作,這一步驟是數(shù)據(jù)處理的基礎(chǔ)。進(jìn)行數(shù)據(jù)挖掘的對(duì)象即數(shù)據(jù),這些數(shù)據(jù)是存儲(chǔ)在數(shù)據(jù)庫(kù)中的,是高校在長(zhǎng)期的數(shù)據(jù)管理中產(chǎn)生的。但是可想而知,若籠統(tǒng)的對(duì)這些數(shù)據(jù)直接進(jìn)行操作一定是十分不方便的,因此,要提前進(jìn)行數(shù)據(jù)預(yù)處理。類似于清除數(shù)據(jù)噪聲等操作。這是數(shù)據(jù)挖掘中的第一步,也是十分關(guān)鍵的一步,它對(duì)于數(shù)據(jù)挖掘的效率以及準(zhǔn)確度都有很大的影響。數(shù)據(jù)預(yù)處理之后進(jìn)行數(shù)據(jù)挖掘,根據(jù)預(yù)定的要求選擇出合適科學(xué)的算法以及參數(shù),來(lái)對(duì)已經(jīng)準(zhǔn)備好的數(shù)據(jù)做分析,產(chǎn)生一個(gè)數(shù)據(jù)集。這就是數(shù)據(jù)挖掘后可能會(huì)出現(xiàn)的知識(shí)模型。數(shù)據(jù)挖掘中,大多數(shù)據(jù)都是歷屆學(xué)生的學(xué)習(xí)情況以及教師的教學(xué)情況,包括教學(xué)任務(wù)教學(xué)計(jì)劃、教師的教案等。這些復(fù)雜的數(shù)據(jù)內(nèi)容構(gòu)成了數(shù)據(jù)庫(kù)。在數(shù)據(jù)挖掘這一環(huán)節(jié)中,其對(duì)象是數(shù)據(jù)倉(cāng)庫(kù)中的這些內(nèi)容,因而數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)體系結(jié)構(gòu)十分重要。針對(duì)高校的教務(wù)管理特點(diǎn),建立起與之相適應(yīng)的數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu),類似的體系結(jié)構(gòu)包括中央數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市以及個(gè)人倉(cāng)庫(kù);根據(jù)不同的數(shù)據(jù)挖掘需求選取不同的數(shù)據(jù)庫(kù)體系結(jié)構(gòu);根據(jù)相應(yīng)的具體特征,完成針對(duì)各種目標(biāo)的數(shù)據(jù)挖掘目的。模式評(píng)估作為數(shù)據(jù)挖掘中的一個(gè)關(guān)鍵步驟,是由挖掘的算法形成的模式或者是規(guī)律,當(dāng)然也會(huì)出現(xiàn)沒(méi)有意義或者沒(méi)有實(shí)用價(jià)值的情況,還會(huì)出現(xiàn)不能真實(shí)反映出數(shù)據(jù)真正含義的情況,甚至顯示的內(nèi)容恰與實(shí)際情況相悖。這些現(xiàn)象都是會(huì)有幾率出現(xiàn)的,因此,進(jìn)行模式評(píng)估意義重大,一來(lái)使得挖掘數(shù)據(jù)的效果更有意義,二來(lái)還使得數(shù)據(jù)在反復(fù)的提取中能夠顯示出更有利的知識(shí)。鞏固知識(shí)以及運(yùn)用知識(shí)的層面,是對(duì)于數(shù)據(jù)挖掘結(jié)果的一致性檢查,旨在更大程度確保所挖掘的內(nèi)容與已知信息不碰撞,同時(shí),還能在運(yùn)用過(guò)程中不斷發(fā)現(xiàn)值得優(yōu)化的方面,更好地做出決策。
我們將電子在線答疑系統(tǒng)中保留的數(shù)據(jù)內(nèi)容稱為“原始資料庫(kù)”,然后將這一數(shù)據(jù)內(nèi)容保存在Web數(shù)據(jù)庫(kù)中,以便于接收學(xué)生們對(duì)于學(xué)科建設(shè)等相關(guān)內(nèi)容的咨詢,類似于學(xué)科性質(zhì)或者是相關(guān)知識(shí)等,包括學(xué)生們對(duì)于課題求解方法或者是求解步驟的咨詢。除此之外,數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用研究——原始資料庫(kù),還發(fā)揮著記錄教師對(duì)于學(xué)科建設(shè)的建議以及看法的作用、解答實(shí)際問(wèn)題的作用等。另外,原始資料庫(kù)中還存儲(chǔ)著學(xué)生的一些基本資料、老師授課的情況、教案?jìng)浒感畔⒌榷喾N數(shù)據(jù)。這些數(shù)據(jù)信息在與之相應(yīng)的學(xué)院數(shù)據(jù)庫(kù)中的存取、存儲(chǔ)形成了原始資料庫(kù)的主要部分。利用數(shù)據(jù)挖掘技術(shù),能夠?qū)W(xué)生們對(duì)某一學(xué)科的感興趣程度或是相關(guān)問(wèn)題進(jìn)行實(shí)時(shí)了解,從而教師可以實(shí)現(xiàn)正確的引導(dǎo),同時(shí)能夠把學(xué)生的問(wèn)題以及相對(duì)應(yīng)的解決方案等數(shù)據(jù)進(jìn)行科學(xué)合理地存儲(chǔ),存儲(chǔ)到相應(yīng)的數(shù)據(jù)倉(cāng)庫(kù)或者是數(shù)據(jù)集市等領(lǐng)域。這無(wú)疑為學(xué)科建設(shè)的發(fā)展起到了極大的推進(jìn)作用。
學(xué)科建設(shè)工作的深入開(kāi)展,使得數(shù)據(jù)挖掘技術(shù)在這一內(nèi)容中的應(yīng)用研究地位更加突出。隨訪工作量不斷增大,也使得數(shù)據(jù)挖掘的應(yīng)用與研究課題更加有意義。高校中的數(shù)據(jù)管理內(nèi)容不斷龐大起來(lái),因此,數(shù)據(jù)的挖掘管理技術(shù)在其計(jì)算機(jī)學(xué)科建設(shè)等方面需要不斷的深入應(yīng)用研究。我們可以把電子在線答疑系統(tǒng)的數(shù)據(jù)稱為“原始資料庫(kù)”,對(duì)其進(jìn)行數(shù)據(jù)處理,然后建立相應(yīng)的“隨訪數(shù)據(jù)庫(kù)”。主要作用是師生等對(duì)于學(xué)科建設(shè)進(jìn)行相應(yīng)的跟蹤調(diào)查。把經(jīng)過(guò)清理處理的原始資料庫(kù)中相關(guān)的數(shù)據(jù)內(nèi)容歸納入隨訪信息庫(kù)內(nèi),換句話說(shuō),這一應(yīng)用研究對(duì)于教改信息資源等內(nèi)容的第二次開(kāi)發(fā)有著重要影響。隨訪信息庫(kù)中,包含了學(xué)生的基本信息,如學(xué)生信息以及學(xué)生的學(xué)習(xí)情況,學(xué)生反映的一些實(shí)時(shí)情況等多種形式的數(shù)據(jù)信息。高校中的關(guān)于數(shù)據(jù)挖掘在計(jì)算機(jī)學(xué)科建設(shè)中的應(yīng)用研究中,隨訪數(shù)據(jù)庫(kù)的應(yīng)用基礎(chǔ)是原始資料庫(kù),通過(guò)進(jìn)行有價(jià)值信息的篩選對(duì)隨訪數(shù)據(jù)庫(kù)進(jìn)行實(shí)時(shí)應(yīng)用,建成計(jì)算機(jī)學(xué)科建設(shè)的隨訪信息庫(kù)。
通過(guò)一系列的隨訪手段進(jìn)行相關(guān)隨訪,從而建立起一個(gè)能夠?qū)τ陔S訪進(jìn)行自動(dòng)處理的在線隨訪答疑系統(tǒng);這一系統(tǒng)所發(fā)揮的作用正是數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用研究。在線隨訪答疑的系統(tǒng)中的學(xué)生信息情況是與隨訪信息庫(kù)中的學(xué)生信息相一致的。高校信息系統(tǒng)中必然會(huì)產(chǎn)生大量的數(shù)據(jù)信息,對(duì)這些數(shù)據(jù)全部調(diào)用幾乎是不可能辦到的,即使辦到了,也是屬于無(wú)用功。在線隨訪答疑的應(yīng)用就針對(duì)這一現(xiàn)象發(fā)揮出作用。通過(guò)數(shù)據(jù)挖掘技術(shù)在學(xué)科建設(shè)中的應(yīng)用研究,能夠?qū)㈦S訪信息庫(kù)與原始資料庫(kù)相結(jié)合,從而能夠進(jìn)行具體科學(xué)的數(shù)據(jù)分析,實(shí)現(xiàn)清理以及挖掘操作,以便得到相應(yīng)的結(jié)論,比如具有代表性、具有科學(xué)的指導(dǎo)意義的教學(xué)案例等,繼而還可以將這一教學(xué)案例添加到相應(yīng)的教學(xué)案例庫(kù)中。這也為日后形成具有規(guī)模性的、輔導(dǎo)價(jià)值的教學(xué)案例系統(tǒng)、或指導(dǎo)信息庫(kù)打下基礎(chǔ)。由此形成師生之間的資源共享,信息共享,老師、學(xué)生都可以從此有所借鑒。
總而言之,基于教學(xué)管理系統(tǒng)中建立的數(shù)據(jù)庫(kù),結(jié)合學(xué)科建設(shè)中的具體教學(xué)要求,利用數(shù)據(jù)挖掘,提取出對(duì)于學(xué)科建設(shè)有利的數(shù)據(jù),找出在具體的教學(xué)環(huán)節(jié)中所表現(xiàn)出的薄弱環(huán)節(jié),繼而根據(jù)具體的形式,制定出對(duì)于學(xué)科建設(shè)有利的教學(xué)策略,使高校能夠?qū)崿F(xiàn)數(shù)據(jù)倉(cāng)庫(kù)建設(shè)以及數(shù)據(jù)挖掘的研究應(yīng)用。計(jì)算機(jī)學(xué)科建設(shè)工作的開(kāi)展力度不斷加大,數(shù)據(jù)挖掘技術(shù)也隨之凸顯出其優(yōu)勢(shì),如何將數(shù)據(jù)挖掘在學(xué)科建設(shè)中得到更好的研究與應(yīng)用是推動(dòng)學(xué)科建設(shè)更加完善的前提與保障。數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用研究為教學(xué)和學(xué)科的研究工作提供了極大的方便。