亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘的學(xué)生綜合測(cè)評(píng)系統(tǒng)的構(gòu)建

        2013-08-01 02:10:34李曉俊
        關(guān)鍵詞:數(shù)據(jù)挖掘素質(zhì)分類

        李曉俊

        (太原旅游職業(yè)學(xué)院信息系,太原030006)

        學(xué)生綜合測(cè)評(píng)成績(jī)是大學(xué)生獎(jiǎng)學(xué)金、三好生評(píng)比和畢業(yè)生就業(yè)的重要依據(jù)和參照,與每一個(gè)大學(xué)生都密切相關(guān)?,F(xiàn)行大學(xué)生綜合測(cè)評(píng)體系中還存在一些弊端,德育標(biāo)準(zhǔn)大多停留在口號(hào)上,大概念清楚,具體標(biāo)準(zhǔn)模糊,因而造成了在這一項(xiàng)的評(píng)分上人人都得滿分的結(jié)果,變相減弱了德育在綜合測(cè)評(píng)中的地位;獎(jiǎng)罰分混亂,從而引發(fā)許多關(guān)系分、人情分,而這項(xiàng)是直接加分,在綜合測(cè)評(píng)成績(jī)中占了很重要的地位;不重視學(xué)生的實(shí)踐能力的考核等等。建立一套更為合理的、操作性強(qiáng)的綜合素質(zhì)測(cè)評(píng)辦法,既能科學(xué)地反映出每個(gè)學(xué)生的發(fā)展,又能為學(xué)生樹立起一個(gè)導(dǎo)向性目標(biāo),從而引導(dǎo)學(xué)生全面提高自身素質(zhì)。測(cè)評(píng)系統(tǒng)還可以把近年來新興的數(shù)據(jù)挖掘技術(shù)應(yīng)用到系統(tǒng)中,從而提高學(xué)生管理的水平和效率。

        1 數(shù)據(jù)挖掘概述

        1.1 數(shù)據(jù)挖掘的概念

        數(shù)據(jù)挖掘(data mining)是一個(gè)從已知數(shù)據(jù)集合中發(fā)現(xiàn)各種模型、概要和導(dǎo)出值的過程[1-2]。數(shù)據(jù)挖掘的基本過程包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果的解釋和評(píng)估三個(gè)階段[3-4]。

        1.2 數(shù)據(jù)挖掘的任務(wù)

        數(shù)據(jù)挖掘的任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)模式。模式有很多種,按功能可分為兩大類:預(yù)測(cè)型和描述型。預(yù)測(cè)型模式是可以根據(jù)數(shù)據(jù)項(xiàng)的值精確確定某種結(jié)果的模式。描述型模式是對(duì)數(shù)據(jù)中存在的規(guī)則做一種描述,或者根據(jù)數(shù)據(jù)的相似性把數(shù)據(jù)分組[3]。在實(shí)際應(yīng)用中,往往根據(jù)模式的實(shí)際作用將其細(xì)分為以下七種。

        分類:分類是指把每個(gè)事例分成多個(gè)類別的行為。每個(gè)事例包含一組屬性,其中有一個(gè)屬性是類別(class)屬性。分類任務(wù)要求找到一個(gè)模型,該模型將類別屬性定義為輸入屬性的函數(shù)。分類模型將使用事例的其他屬性(輸入屬性)來確定類別的模式(輸出屬性)[5]。

        聚類:聚類是把一組對(duì)象按照相似性歸成若干類別,它的目的是使屬于同一類別的對(duì)象之間的“距離”盡可能的小,而屬于不同類別的對(duì)象之間的“距離”盡可能的大,它反映的是同類事物共同性質(zhì)的特征型知識(shí)和不同事物之間的差異性質(zhì)的特征型知識(shí)。通過聚類,對(duì)象可被劃分為一系列有意義的子集[6]。

        關(guān)聯(lián):關(guān)聯(lián)分析的目的就是挖掘隱藏在數(shù)據(jù)間的滿足一定條件的關(guān)聯(lián)關(guān)系。關(guān)聯(lián)規(guī)則的形式為:X?Y[support=s,confidence=c],這里X稱為規(guī)則的條件,Y稱為規(guī)則的結(jié)果。規(guī)則X?Y的support(支持度)s是含有X和Y的記錄在全體記錄中所占的比率,confidence(置信度)c是同時(shí)含有X和Y的記錄數(shù)與含有X的記錄數(shù)的比率[6]。

        回歸:回歸任務(wù)類似于分類任務(wù),但它不是查找描述類的模式,它的目的是查找模式以確定數(shù)值。簡(jiǎn)單的線性線段擬合技術(shù)就是回歸的一個(gè)例子,其結(jié)果是一個(gè)函數(shù),可以根據(jù)輸入的值來確定輸出。更高級(jí)的回歸形式支持分類輸入以及數(shù)值輸入?;貧w使用的最流行的技術(shù)是線性回歸和邏輯回歸。

        預(yù)測(cè):預(yù)測(cè)也是一種重要的數(shù)據(jù)挖掘任務(wù)。預(yù)測(cè)技術(shù)采用數(shù)列作為輸入,表示一系列時(shí)間值,然后運(yùn)用各種能處理數(shù)據(jù)周期性分析、趨勢(shì)分析和噪聲分析的計(jì)算機(jī)學(xué)習(xí)和統(tǒng)計(jì)技術(shù)來估算這些序列未來的值。

        序列分析:序列分析是用來發(fā)現(xiàn)一系列事件中的模式,這一系列事件稱為序列。例如,某客戶首先買了一臺(tái)電腦,然后買了一個(gè)揚(yáng)聲器,最后買了一個(gè)網(wǎng)絡(luò)攝像頭。

        偏差分析:偏差分析是為了找出一些特殊的事例,這些事例的行為與其他事例有明顯的不同。偏差分析的應(yīng)用范圍很廣,最常見的應(yīng)用是信用卡欺詐行為檢測(cè)[5]。

        1.3 數(shù)據(jù)挖掘的主要算法

        SQL-Server 2008提煉了上述的各種復(fù)雜知識(shí),加工好友好的視窗工具,嵌入到分析服務(wù)中。SQLServer 2008提供了7種不同的算法,其中大多數(shù)算法能完成幾種不同的任務(wù)。我們沒有必要了解每個(gè)算法內(nèi)部的工作原理,更重要的是明白每種算法能完成的任務(wù)。決策樹算法主要用于分類、回歸、關(guān)聯(lián);貝葉斯算法主要用于分類;聚類算法主要用于回歸、分類;關(guān)聯(lián)算法主要用于關(guān)聯(lián);序列算法主要用于序列分析、回歸、分類;時(shí)序算法主要用于回歸;神經(jīng)網(wǎng)絡(luò)主要用于分類、回歸[7]。

        2 構(gòu)建學(xué)生綜合測(cè)評(píng)系統(tǒng)

        2.1 設(shè)計(jì)思路

        測(cè)評(píng)系統(tǒng)要能實(shí)現(xiàn)按學(xué)號(hào)、學(xué)期、學(xué)年、綜合四方面的查詢。測(cè)評(píng)系統(tǒng)分為獨(dú)立的三個(gè)方面:德育素質(zhì)、學(xué)識(shí)素質(zhì)、實(shí)踐能力。其中德育素質(zhì)主要考核學(xué)生在紀(jì)律、衛(wèi)生、勞動(dòng)等方面的素質(zhì),根據(jù)學(xué)生處每學(xué)期給出的學(xué)生德育量化考核成績(jī)輸入。德育考核依據(jù)“學(xué)院德育量化考核辦法”執(zhí)行,每天都要做,每天都要有學(xué)生在紀(jì)律、衛(wèi)生、勞動(dòng)等方面的考核記錄,每月一小結(jié),每學(xué)期再根據(jù)每月的情況,給出學(xué)期德育成績(jī),上報(bào)學(xué)生處。學(xué)習(xí)成績(jī)按教務(wù)處每學(xué)期期末考核給出的學(xué)習(xí)成績(jī)輸入,學(xué)識(shí)素質(zhì)根據(jù)本學(xué)期所開課程的平均分得出;實(shí)踐能力主要考核學(xué)生在職業(yè)技能等方面的素質(zhì),鼓勵(lì)學(xué)生積極進(jìn)行廣泛的職業(yè)技能訓(xùn)練、積極參加各項(xiàng)活動(dòng),其中分為幾個(gè)單項(xiàng)(例如集體活動(dòng)、職業(yè)資格證書、職業(yè)技能比賽,社會(huì)實(shí)踐、社團(tuán)活動(dòng),運(yùn)動(dòng)會(huì)破院記錄,學(xué)生干部等),并由各系每學(xué)期末考核給出“合格”或“不合格”等級(jí)。該系統(tǒng)不僅能對(duì)輸入的德育、學(xué)習(xí)、實(shí)踐數(shù)據(jù)自動(dòng)進(jìn)行排序工作,而且能根據(jù)要求進(jìn)行優(yōu)良中差的等級(jí)劃分,并且能針對(duì)學(xué)生個(gè)人提出合理化建議:例,“你遵守校規(guī),學(xué)習(xí)優(yōu)秀,希提高實(shí)踐能力”、“你德育成績(jī)較低,如不改正,將影響對(duì)你的實(shí)習(xí)推薦”、“你沒有就業(yè)資格證,可能會(huì)影響到你畢業(yè)證的領(lǐng)取”等等。最重要的是對(duì)學(xué)生的評(píng)價(jià)不以學(xué)習(xí)成績(jī)進(jìn)行單一評(píng)價(jià),而是以德育、學(xué)習(xí)、實(shí)踐三方面系統(tǒng)自動(dòng)給出一個(gè)綜合評(píng)價(jià)。

        2.2 系統(tǒng)功能模塊結(jié)構(gòu)圖

        測(cè)評(píng)系統(tǒng)功能模塊結(jié)構(gòu)如圖1所示,通過這個(gè)系統(tǒng),老師可以更全面地了解學(xué)生,學(xué)生也可以從另一個(gè)角度了解自己。

        圖1 學(xué)生綜合測(cè)評(píng)系統(tǒng)結(jié)構(gòu)模塊圖Fig.1 The structure module graph of graduate student synthetical evaluation system

        2.3 系統(tǒng)主要功能

        該系統(tǒng)的主要功能有數(shù)據(jù)輸入、數(shù)據(jù)修改、數(shù)據(jù)處理、數(shù)據(jù)查詢和用戶管理五部分組成,為教師、學(xué)生、用人單位較全面地了解學(xué)生的在校情況提供方便,為決策者提供指導(dǎo)。

        3 決策樹算法在學(xué)生綜合測(cè)評(píng)中的應(yīng)用

        決策樹是最受歡迎的數(shù)據(jù)挖掘技術(shù),因?yàn)檫@種算法有很快的訓(xùn)練性能、較高的準(zhǔn)確性和易于理解的模式。它首先對(duì)數(shù)據(jù)進(jìn)行處理,利用歸納算法生成可讀的規(guī)則和決策樹,然后使用決策樹對(duì)新數(shù)據(jù)進(jìn)行分析。本質(zhì)上決策樹是通過一系列規(guī)則對(duì)數(shù)據(jù)進(jìn)行分類的過程。

        3.1 學(xué)生綜合測(cè)評(píng)分類決策樹

        利用決策樹分類理論構(gòu)建學(xué)生綜合測(cè)評(píng)決策樹(如圖2所示),進(jìn)行綜合素質(zhì)分類。

        圖2 分類決策樹Fig.2 Classification decision tree

        綜合素質(zhì)按優(yōu)秀、良好、一般、較差分為1,2,3,4級(jí);

        德育素質(zhì)按優(yōu)秀、良好、一般分為1,2,3級(jí);優(yōu)秀 =(85,100);良好 =(65,85);一般 =(0,65);

        學(xué)業(yè)素質(zhì)按優(yōu)秀、良好、中等、合格、不合格分為1,2,3,4,5 級(jí);優(yōu)秀 =(90,100);良好 =(80,90);中等 =(70,80);合格 =(60,70);不合格 =(0,60);

        實(shí)踐能力按合格、不合格分為1,2級(jí)。

        3.2 建立和分析分類模型

        決策樹應(yīng)用于數(shù)據(jù)挖掘分成兩個(gè)階段,一是模型訓(xùn)練階段,通過對(duì)訓(xùn)練集訓(xùn)練獲得樹的模式,其二是使用模型階段,實(shí)際上就是用獲取的模型對(duì)未知的數(shù)據(jù)進(jìn)行分析[8]。具體流程如下:

        (1)模型訓(xùn)練階段

        模型訓(xùn)練階段得到的分類模型,不僅要很好地描述或擬合訓(xùn)練樣本,還要正確地預(yù)測(cè)或分類新樣本,因此,需要評(píng)估分類模型的準(zhǔn)確率,只有分類模型的準(zhǔn)確率滿足要求,才能利用該分類模型分類新樣本。所以,我沒有選用現(xiàn)實(shí)的學(xué)生數(shù)據(jù)作為訓(xùn)練樣本,而是按照前面構(gòu)建的學(xué)生綜合測(cè)評(píng)決策樹,建立數(shù)據(jù)訓(xùn)練集,從而獲得很好的結(jié)果。圖3展示的是部分?jǐn)?shù)據(jù)。

        根據(jù)已建立的數(shù)據(jù)訓(xùn)練集數(shù)據(jù),在SQL Server 2008的數(shù)據(jù)挖掘向?qū)е羞x擇決策樹算法,經(jīng)過處理后,形成基于訓(xùn)練集訓(xùn)練出來的決策樹分類模型(如圖4所示)。

        決策樹中每個(gè)節(jié)點(diǎn)都根據(jù)輸入屬性來標(biāo)記,每一條從根節(jié)點(diǎn)到葉結(jié)點(diǎn)的路徑就是目標(biāo)變量的一條規(guī)則,從決策樹中可以提取出更為形象的 IFTHEN分類規(guī)則,IF-THEN分類規(guī)則易于理解,特別是當(dāng)決策樹比較龐大時(shí)。

        (2)使用模型階段

        使用模型階段,就是利用決策樹所形成的分類模型對(duì)新樣本進(jìn)行分類或預(yù)測(cè)[10]。本文使用前面所建立的分類模型對(duì)信息系2009級(jí)學(xué)生數(shù)據(jù)進(jìn)行了綜合素質(zhì)的分類。

        然后我們還進(jìn)一步做了一些數(shù)據(jù)挖掘工作,分別從學(xué)識(shí)素質(zhì)角度、實(shí)踐能力和德育素質(zhì)角度、綜合素質(zhì)角度來分析2009級(jí)學(xué)生情況。

        通過挖掘我們發(fā)現(xiàn),學(xué)識(shí)素質(zhì)優(yōu)秀的學(xué)生中有64.06%的學(xué)生綜合素質(zhì)為優(yōu)、32.59%的學(xué)生綜合素質(zhì)為良,合計(jì)96.65%;學(xué)識(shí)素質(zhì)良好的學(xué)生中有47.75%的學(xué)生綜合素質(zhì)為優(yōu)、35.61%的學(xué)生綜合素質(zhì)為良,合計(jì)83.36%。所以我們可以預(yù)測(cè)出:學(xué)識(shí)素質(zhì)高的學(xué)生綜合素質(zhì)也應(yīng)該較好。

        圖4 決策樹分類模型Fig.4 Classification model of decision tree

        如果不考慮學(xué)習(xí)成績(jī),只考慮德育素質(zhì)與實(shí)踐能力去選擇學(xué)生,又如何呢?我們把預(yù)測(cè)變量設(shè)為“綜合”,把輸入變量設(shè)為“德育”和“實(shí)踐”,從圖中可以看出,綜合為優(yōu)秀者,主要集中在德育優(yōu)秀且實(shí)踐合格的學(xué)生上,再選擇德育優(yōu)秀且實(shí)踐合格,從圖例中我們可以看到73.72%的學(xué)生綜合素質(zhì)是優(yōu)秀。所以我們可以預(yù)測(cè)出:德育優(yōu)秀且實(shí)踐能力強(qiáng)的學(xué)生綜合素質(zhì)也應(yīng)該較好(如圖5所示)。

        如果直接考查綜合素質(zhì),又當(dāng)如何?在綜合素質(zhì)優(yōu)秀的學(xué)生中學(xué)識(shí)素質(zhì)為優(yōu)秀的占50.90%,良好的占45.91%,共占96.81%.所以我們可以預(yù)測(cè)出:學(xué)生綜合素質(zhì)好的學(xué)生,學(xué)識(shí)素質(zhì)也應(yīng)該較好。

        數(shù)據(jù)挖掘技術(shù)在學(xué)生綜合測(cè)評(píng)系統(tǒng)中的應(yīng)用,實(shí)現(xiàn)了一種更為科學(xué)的與時(shí)代相適應(yīng)的學(xué)生綜合測(cè)評(píng)體系;對(duì)學(xué)生管理者推薦畢業(yè)生、對(duì)用人單位選擇人才,有一定的幫助;對(duì)領(lǐng)導(dǎo)考核班級(jí)、班主任引導(dǎo)學(xué)生也有一定的幫助。

        4 結(jié)束語(yǔ)

        圖5 德育和實(shí)踐、綜合決策樹Fig.5 Moral education and practical,comprehensive decision tree

        數(shù)據(jù)挖掘技術(shù)是當(dāng)前信息處理領(lǐng)域先進(jìn)技術(shù)之一,它的應(yīng)用大大加強(qiáng)了決策分析的功能和靈活性,是一個(gè)很有前景的方向。把數(shù)據(jù)挖掘技術(shù)應(yīng)用到教育管理領(lǐng)域里,將有效地推動(dòng)教育管理的進(jìn)一步改革、完善和發(fā)展[11],數(shù)據(jù)挖掘技術(shù)在教育管理領(lǐng)域的應(yīng)用也將越來越廣泛和深入。

        [1]王艷春.基于數(shù)據(jù)挖掘算法的教學(xué)評(píng)測(cè)系統(tǒng)研究[J].長(zhǎng)春理工大學(xué)學(xué)報(bào),2006,29(4):73-76.

        [2](美)康塔尼克.數(shù)據(jù)挖掘[M].閃四清,譯.北京:清華大學(xué)出版社,2004.

        [3]張?jiān)茲?數(shù)據(jù)挖掘原理與應(yīng)用[M].北京:電子工業(yè)出版社,2004.

        [4]周云峰.數(shù)據(jù)挖掘理論在高校教學(xué)評(píng)估中的應(yīng)用[D].江西:南昌大學(xué)計(jì)算機(jī)技術(shù)系,2009.

        [5](美)Jamie MacLennan.數(shù)據(jù)挖掘原理與應(yīng)用[M].董艷,譯.北京:清華大學(xué)出版社,2010.

        [6]王麗珍.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘原理及應(yīng)用[M].北京:科學(xué)出版社,2009.

        [7](美)Brian Larson.SQL-Server 2005商業(yè)智能實(shí)現(xiàn)[M].趙志恒,譯.北京:清華大學(xué)出版社,2008.

        [8]朱德利.SQL-Server 2005數(shù)據(jù)挖掘與商業(yè)智能完全解決方案[M].北京:電子工業(yè)出版社,2007.

        [9]朱錫亮.數(shù)據(jù)挖掘在高校固定資產(chǎn)管理中的應(yīng)用研究[D].江蘇:揚(yáng)州大學(xué)計(jì)算機(jī)技術(shù)系,2010.

        [10]李云.數(shù)據(jù)挖掘技術(shù)在中學(xué)教務(wù)管理系統(tǒng)中的應(yīng)用研究[D].貴州:貴州大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)系,2008.

        [11]邱文教,潘曉卉.數(shù)據(jù)挖掘技術(shù)在教務(wù)管理中的應(yīng)用[J].安徽工業(yè)大學(xué)學(xué)報(bào),2005,22(3):133-134.

        猜你喜歡
        數(shù)據(jù)挖掘素質(zhì)分類
        分類算一算
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        素質(zhì)是一場(chǎng)博弈
        什么是重要的素質(zhì)
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        青青草视频网站免费观看| 亚洲熟女www一区二区三区| 国产亚洲精品aaaa片小说| 视频一区欧美| 一区二区三区在线蜜桃| 久草福利国产精品资源| 欧美熟妇性xxx交潮喷| 少妇高潮喷水正在播放| 日本一本草久国产欧美日韩| 中文字幕亚洲五月综合婷久狠狠| 色老板美国在线观看| 亚洲欧美日韩一区二区三区在线| 亚洲公开免费在线视频| 亚洲av天堂一区二区| (无码视频)在线观看| 国产精品永久免费视频| 国产AV高清精品久久| 91精品人妻一区二区三区水蜜桃| 婷婷丁香五月激情综合| 俺来也俺去啦久久综合网| 欧洲一级无码AV毛片免费| 国产三级精品三级在线专区2| 99精品国产在热久久无码 | 久久精品一区二区三区夜夜| 日韩人妻另类中文字幕| 国产xxxx99真实实拍| 精品一区二区三区四区少妇| 国产精品国产三级国产an不卡| 狠狠躁18三区二区一区| 国产乱子伦精品免费无码专区| 欧美xxxxx精品| 国产三级黄色免费网站| 亚洲人成网址在线播放| 麻豆国产乱人伦精品一区二区| 一区二区激情偷拍老牛视频av| 97人伦影院a级毛片| 无码人妻丰满熟妇精品区| 亚洲综合久久久中文字幕| 亚洲夫妻性生活免费视频| 使劲快高潮了国语对白在线| www久久久888|