[摘 要] 數(shù)據(jù)挖掘技術(shù)應(yīng)用于中職德育管理中,可以加快尋找和建立數(shù)據(jù)的聯(lián)系,提煉出具有價值的信息。將該技術(shù)有效應(yīng)用于管理系統(tǒng),可以對該系統(tǒng)進(jìn)行整體掌握,合理地建立中職德育管理機(jī)制,有效發(fā)揮德育管理系統(tǒng)的積極作用。首先就數(shù)據(jù)挖掘技術(shù)進(jìn)行簡單的概述,進(jìn)而詳細(xì)闡述了數(shù)據(jù)挖掘在德育管理系統(tǒng)中的應(yīng)用。
[關(guān) 鍵 詞] 數(shù)據(jù)挖掘;中職德育管理;數(shù)據(jù)信息
[中圖分類號] G717 [文獻(xiàn)標(biāo)志碼] A [文章編號] 2096-0603(2016)12-0134-02
前階段,競爭日益加劇,中職學(xué)校進(jìn)行了淘汰、升級?,F(xiàn)階段,多數(shù)學(xué)校已經(jīng)具備校園網(wǎng),配套建設(shè)了相應(yīng)的數(shù)據(jù)管理系統(tǒng),比如,政務(wù)管理系統(tǒng)、工資管理系統(tǒng)等。但是德育管理仍處于紙質(zhì)管理狀態(tài),更為嚴(yán)重的是根本不存在任何參考文獻(xiàn),對于學(xué)生的成績以及德育只是教師主觀的、隨意的判斷。部分學(xué)校具備德育管理系統(tǒng)但是沒有進(jìn)行有效的應(yīng)用,使其積極作用無法充分發(fā)揮,不利于人才的培養(yǎng),不利于學(xué)校德育、教學(xué)的發(fā)展。文章對數(shù)據(jù)挖掘進(jìn)行闡述,進(jìn)而探究數(shù)據(jù)挖掘在德育管理中的應(yīng)用,希望給學(xué)校管理人員一定的幫助,促進(jìn)德育管理的有效發(fā)展,更好地引導(dǎo)和教育學(xué)生,提高德育的轉(zhuǎn)化率。
一、數(shù)據(jù)挖掘
(一)數(shù)據(jù)挖掘的技術(shù)定義
數(shù)據(jù)挖掘其實就是在數(shù)據(jù)庫中提取具有價值的信息,比較智能而且方便,提取也是具有一定規(guī)則的,所謂的規(guī)則模式表示的是散落在數(shù)據(jù)倉庫中以及海量信息背后的知識。而數(shù)據(jù)挖掘則是從這些大量的、混亂的、無規(guī)則的、殘缺的信息中,提取潛藏的,我們無法預(yù)知的、但是具有價值和意義的知識的過程。知識又是什么,從廣義的角度講,數(shù)據(jù)和信息均屬于知識的類型,但是,我們往往把實施看作規(guī)則、模式、約束、含義等。數(shù)據(jù)是知識的來源,利用知識,發(fā)現(xiàn)進(jìn)而有效管理信息,進(jìn)一步優(yōu)化查詢,有利于作出正確的決策,有利于管理流程的控制,同時通過知識的發(fā)現(xiàn),促進(jìn)了對數(shù)據(jù)的維護(hù)。數(shù)據(jù)挖掘?qū)儆跀?shù)據(jù)庫搜索數(shù)據(jù)的子步驟,而知識發(fā)現(xiàn)一共涵蓋以下幾個步驟,其一,數(shù)據(jù)清理,其二,數(shù)據(jù)集成,其三,轉(zhuǎn)換數(shù)據(jù)信息,其四,數(shù)據(jù)挖掘,其五,測評模型和描述知識。
(二)數(shù)據(jù)挖掘的技術(shù)特點
1.數(shù)據(jù)挖掘的對象是規(guī)模巨大的數(shù)據(jù),數(shù)量級能夠達(dá)到GB、TB,還可以更大。
2.數(shù)據(jù)挖掘的通常的規(guī)律查詢是德育部門非常隨機(jī)性的查詢,無法提前提出準(zhǔn)確的要求,而是單純依賴系統(tǒng)查詢,獲得認(rèn)為有價值的知識。
3.在部分應(yīng)用中,數(shù)據(jù)變化極快,這就需要數(shù)據(jù)挖掘可以非??焖俚剡M(jìn)行反應(yīng),提出及時的決策支持。
4.在挖掘數(shù)據(jù)的過程中,統(tǒng)計數(shù)據(jù)具有一定的規(guī)律性,為規(guī)則的發(fā)現(xiàn)提供了良好的前提。所以,挖掘的規(guī)則可以同數(shù)據(jù)庫中的數(shù)據(jù)不相適用,一旦數(shù)據(jù)處于某一臨界值時,則是有效的。所以采用數(shù)據(jù)挖掘還可以找出更多的規(guī)則。
5.數(shù)據(jù)挖掘找出的規(guī)則單純表示當(dāng)下的數(shù)據(jù)庫所呈現(xiàn)的規(guī)則,由于該規(guī)則具有一定的動態(tài)性,一旦有新的數(shù)據(jù)添加進(jìn)來,就必須對其規(guī)則進(jìn)行重新計算。
二、數(shù)據(jù)挖掘在中職德育管理中的運用
數(shù)據(jù)挖掘所需要的技術(shù)有很多,文中集中對決策樹分類分析算法進(jìn)行闡述。該技術(shù)方法所使用的最具代表性的算法是ID3算法,基于該算法還可以演化出C4.5算法,后者算法不僅含有前面算法的功能,同時也具備一些拓展功能。本文采用功能相對多的C4.5算法。決策樹屬于二叉樹,類似于流程圖的倒樹結(jié)構(gòu),根節(jié)點表示了各種數(shù)據(jù),按照所選的性質(zhì)遞歸決策樹,同時把相關(guān)信息分析形成一個個子集,而這些子集和初期的具有可預(yù)測性的狀態(tài)非常相似。決策樹上的節(jié)點都表示輸入屬性值一次測試,每條邊數(shù)據(jù)測試結(jié)果。每拆分決策樹,都對相應(yīng)的屬性值影響可預(yù)測值的情況進(jìn)行分析,如此循環(huán)下去,直至終止條件,由此形成決策樹。總而言之,二叉樹建設(shè)的核心是貪心算法,較之其他算法,其自身具有一定的特點:使用二叉樹算法可以快捷地建立挖掘模型,而且該模型描述解釋起來比較簡單。為就某特設(shè)的項目進(jìn)行分類,著手于二叉樹的根節(jié)點,利用判斷,順著分支一直向下直至樹的葉子節(jié)點,這樣的路徑可以視作一種分類規(guī)則,這也就成為一個決策。二叉樹屬于表現(xiàn)較為直觀的分類模式。該樹有三個組成部分,其一,決策根節(jié)點,其二,根和葉子節(jié)點二者中間建立的路徑分枝,其三,葉節(jié)點。根節(jié)點位于樹的頂端部位,屬于二叉樹的開端,決策節(jié)點代表的是分類對象的屬性,在建立二叉樹的過程中,各個新例必須遍歷二叉樹,也即必須從根節(jié)點按照順序和實例與節(jié)點進(jìn)行對比,當(dāng)二叉樹的葉節(jié)點獲得了新屬性的時候必須終止比較。在進(jìn)行分支建立的過程中,為所有的字段選擇不一樣的取值,以上在二叉樹中起著關(guān)鍵性作用。選擇各異的字段值,最后獲得子集也是存在差異的,由此對二叉樹的生長情況產(chǎn)生影響,成功的取值及可以加速二叉樹生長,還可以獲得理想的規(guī)則信息。必須首先活動數(shù)據(jù)才能獲得取值,該數(shù)據(jù)不僅具有一定的屬性,具備一定的獨特性質(zhì)。此數(shù)據(jù)知識的搜索歸納在于對下步行為進(jìn)行評價預(yù)測,并在此基礎(chǔ)上,深層次對德育教育進(jìn)行研究。這種的德育管理存在的數(shù)據(jù)都具備以下相關(guān)特點。
(一)數(shù)據(jù)的隱私性
學(xué)生的基本信息,個人狀況以及家庭背景,尤其是父母的具體信息包含部分隱私內(nèi)容,而這部分隱私內(nèi)容會導(dǎo)致學(xué)生受到侵害,違紀(jì)現(xiàn)象頻發(fā)。因此,學(xué)生必須對學(xué)生的隱私進(jìn)行絕對保密,保障管理系統(tǒng)具有絕對的安全、可靠。
(二)數(shù)據(jù)的不完整性
建設(shè)德育系統(tǒng)內(nèi)包含的信息也許不能包含所有研究需要的一切數(shù)據(jù)。另外,人為的原因也會對數(shù)據(jù)記錄造成一定的影響,使其出現(xiàn)偏差或者不完整的情況。團(tuán)委以及宿管負(fù)責(zé)人員在對違紀(jì)項目評定的過程中,應(yīng)當(dāng)保證絕對的公平公正,減少主觀因素的影響,否則會對學(xué)生信息的安全形成影響。成功的取值是表示決策樹按照這一數(shù)值實行分裂時獲得子集信息和預(yù)測信息要盡可能相同。通常來說,使用“熵”對系統(tǒng)的平均信息量進(jìn)行表示,按照其理論對分支之后數(shù)據(jù)優(yōu)劣情況進(jìn)行分析評估。熵,公式里的Pi表示劃分子集對應(yīng)的測試屬性的可能取值。子集的經(jīng)歷路徑由熵值具體的數(shù)值所決定,假如子集的熵值偏低,子集具備的純度就會提高,反之,熵值很大,經(jīng)過劃分的子集數(shù)據(jù)缺乏足夠的一致性。所以,要求隔離計算樣本子集對應(yīng)的熵值,而后算出的數(shù)據(jù)中,熵值最小所指的信息字段對應(yīng)的屬性值可以選作對象,這樣就能夠獲取更好的取值目標(biāo)。因此,可以按照不同的取值對樣本集進(jìn)行劃分,進(jìn)而就分裂后的分支對應(yīng)的樣本子集進(jìn)行分散,逐層核算具體的熵值,采取各種方法,獲得最佳的取值目標(biāo)。決策樹含有許多形式的算法,其中心理念是輸入預(yù)設(shè)值,也就是訓(xùn)練集,利用決策樹算法分類分析上述訓(xùn)練集,形成一個二叉樹,進(jìn)而對詳細(xì)分析該樹,獲得研究人員所需要的預(yù)測情況和目標(biāo)。
文章通過讀數(shù)據(jù)挖掘技術(shù)的研究,闡述了數(shù)據(jù)挖掘的相關(guān)特點,繼而有效地在中職德育管理中高效應(yīng)用數(shù)據(jù)挖掘技術(shù),對學(xué)生相關(guān)德育信息進(jìn)行高效處理,繼而提取具有一定價值的信息,用于學(xué)校以及老師做出德育管理決策,其理論和現(xiàn)實意義非常重要。但是因為時間有限,在傳統(tǒng)系統(tǒng)中應(yīng)用新技術(shù)經(jīng)驗比較缺乏,部分功能不能得到完全的發(fā)揮,不利于學(xué)校的德育管理工作開展。
參考文獻(xiàn):
[1]林敏.數(shù)據(jù)挖掘在中職德育管理中的應(yīng)用[D].湖南大學(xué),2014.
[2]李桂榮.數(shù)據(jù)挖掘技術(shù)在中職教學(xué)評估中的應(yīng)用研究[D].廣東技術(shù)師范學(xué)院,2012.
[3]張穎.數(shù)據(jù)挖掘技術(shù)在中職學(xué)校學(xué)生德育行為分析的研究與應(yīng)用[D].福建師范大學(xué),2014.
[4]?,|.數(shù)據(jù)挖掘技術(shù)在中職院校教學(xué)質(zhì)量管理中的應(yīng)用[D].河北工業(yè)大學(xué),2015.