亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘技術(shù)的學(xué)生信息系統(tǒng)開發(fā)

        2009-06-18 04:42:10徐成香
        新媒體研究 2009年16期
        關(guān)鍵詞:學(xué)號(hào)數(shù)據(jù)倉(cāng)庫(kù)字段

        徐成香

        [摘要]隨著學(xué)生信息數(shù)據(jù)的急劇膨脹,為了更好的進(jìn)行學(xué)生信息管理,提出基于數(shù)據(jù)挖掘技術(shù)的學(xué)生信息系統(tǒng)的開發(fā),并舉例說(shuō)明如何利用數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)庫(kù)技術(shù)建立學(xué)生信息管理系統(tǒng),為相關(guān)專業(yè)人員提供參考。

        [關(guān)鍵詞]數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則模型

        中圖分類號(hào):TP3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2009)0820057-01

        目前我國(guó)很多學(xué)校均建立了學(xué)生信息系統(tǒng),隨著時(shí)間的推移學(xué)生信息系統(tǒng)中相關(guān)的信息數(shù)據(jù)也急劇膨脹。如何運(yùn)用科學(xué)的技術(shù)和手段從海量數(shù)據(jù)中發(fā)現(xiàn)有用的信息并充分利用,發(fā)現(xiàn)各個(gè)學(xué)生的特點(diǎn),了解學(xué)生的學(xué)習(xí)規(guī)律,更好地管理學(xué)生信息,這是學(xué)校管理者企盼解決的深層問(wèn)題。因此采用數(shù)據(jù)挖掘技術(shù)對(duì)學(xué)生數(shù)據(jù)進(jìn)行再次開發(fā)已成為新的趨勢(shì)。

        一、數(shù)據(jù)挖掘的概念[1]

        數(shù)據(jù)挖掘(DataMining,DM)是指從大量不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、有用的信息和知識(shí)的過(guò)程。其表現(xiàn)形式為概念(Concepts)、規(guī)則(Rules)、模式(Patterns)等形式。數(shù)據(jù)挖掘是現(xiàn)代科學(xué)技術(shù)相互滲透與融合的產(chǎn)物,融合了數(shù)理統(tǒng)計(jì)、人工智能、可視化技術(shù)、數(shù)據(jù)庫(kù)技術(shù)和計(jì)算機(jī)技術(shù)等領(lǐng)域的理論技術(shù)。

        二、學(xué)生信息數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與建設(shè)

        數(shù)據(jù)挖掘是建立在數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)之上的。數(shù)據(jù)倉(cāng)庫(kù)概念是W.H.Inmon

        在《建立數(shù)據(jù)倉(cāng)庫(kù)》一書中提出的,數(shù)據(jù)倉(cāng)庫(kù)就是面向主題的、集成的、不可更新的(穩(wěn)定性)隨時(shí)間不斷變化(不同時(shí)間)的數(shù)據(jù)集合,用以支持經(jīng)營(yíng)管理中的決策制定過(guò)程[2]。數(shù)據(jù)準(zhǔn)備的好壞將影響到數(shù)據(jù)挖掘的效率和準(zhǔn)確度以及最終模型的有效性,數(shù)據(jù)準(zhǔn)備工作包括數(shù)據(jù)的選擇(選擇相關(guān)和合適的數(shù)據(jù))、探索(盡可能了解數(shù)據(jù),如分布情況和異常數(shù)據(jù)等)、修正(包括缺失數(shù)據(jù)的插值等)、變換(離散值數(shù)據(jù)與連續(xù)值數(shù)據(jù)之間的相互轉(zhuǎn)換,數(shù)據(jù)的分組分類,數(shù)據(jù)項(xiàng)之間的計(jì)算組合等)。

        學(xué)生信息數(shù)據(jù)庫(kù)中的數(shù)據(jù)表主要有:學(xué)生學(xué)籍信息表,主要字段有學(xué)生學(xué)號(hào)(ID)、姓名(name)、性別(sex)、出生日期(age)、家庭住

        址(address)等;學(xué)生班級(jí)信息表,主要字段有學(xué)號(hào)(ID)、班級(jí)(clas

        S)、職務(wù)(duty)等;學(xué)生成績(jī)表,主要字段有學(xué)號(hào)(ID)、課程號(hào)(cI

        D)、成績(jī)(result)等;學(xué)生選課表,主要字段有學(xué)號(hào)(ID)、選修課程號(hào)(xID)、任課教師(teacher)、成績(jī)(result)等;各學(xué)期成績(jī)匯總表,主要字段有學(xué)號(hào)(ID)、課程1成績(jī)(result1)、課程2成績(jī)(result

        2)、課程3成績(jī)(result3)、總成績(jī)(results)、名次(rank)等。

        三、數(shù)據(jù)挖掘在學(xué)生信息管理系統(tǒng)開發(fā)中的應(yīng)用

        (一)建立挖掘數(shù)據(jù)模型及數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理是對(duì)數(shù)據(jù)源進(jìn)行加工,檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性,對(duì)其中的噪音數(shù)據(jù)進(jìn)行平滑,對(duì)丟失的數(shù)據(jù)進(jìn)行填補(bǔ),消除“臟”數(shù)據(jù),消除重復(fù)記錄等,使之符合數(shù)據(jù)挖掘的要求。它的主要工作有檢查拼寫錯(cuò)誤、去掉重復(fù)的記錄、補(bǔ)上不完全的記錄、推導(dǎo)計(jì)算缺失數(shù)據(jù)、完成數(shù)據(jù)類型轉(zhuǎn)換。數(shù)據(jù)變換的主要目的是精減數(shù)據(jù)維數(shù),即從初始特征中找出真正有用的特征以減少數(shù)據(jù)挖掘時(shí)要考慮的特征或變量個(gè)數(shù)。

        (二)數(shù)據(jù)挖掘的算法[3]。由于學(xué)生信息系統(tǒng)有多個(gè)不同的應(yīng)用目標(biāo),以查詢不同的結(jié)果。因此要有與其相對(duì)應(yīng)的挖掘任務(wù)和定制數(shù)據(jù)庫(kù),針對(duì)這些數(shù)據(jù)庫(kù)有很多的數(shù)據(jù)挖掘算法。而每個(gè)算法都會(huì)提出一些諸如置信度、感興趣度、新穎度等統(tǒng)計(jì)屬性作為對(duì)產(chǎn)生模式的評(píng)估標(biāo)準(zhǔn),從而進(jìn)一步?jīng)Q定對(duì)模式的取舍,提高找出有興趣模式的效率。這里用最佳的數(shù)據(jù)挖掘方法進(jìn)行計(jì)算,這些算法包括:人工神經(jīng)網(wǎng)絡(luò)、決策樹、遺傳算法、鄰近算法等。

        (三)數(shù)據(jù)挖掘結(jié)果與分析。根據(jù)數(shù)據(jù)方面處理結(jié)果,設(shè)最小支持度為0.2,最小置信度設(shè)為0.4,利用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘Apriori算法處理數(shù)據(jù)并得出關(guān)聯(lián)規(guī)則。

        是否為班干部+學(xué)習(xí)成績(jī),進(jìn)行挖掘,挖掘結(jié)果如下:

        [是否為班干部=“是”=>學(xué)習(xí)成績(jī)=“優(yōu)”] 0.588

        [是否為班干部=“是”=>學(xué)習(xí)成績(jī)=“一般”] 0.450

        [是否為班干部=“否”=>學(xué)習(xí)成績(jī)=“優(yōu)”] 0.500

        [是否為班干部=“否”=>學(xué)習(xí)成績(jī)=“一般”] 0.655

        結(jié)果表明:在班級(jí)擔(dān)任一定職務(wù)的學(xué)生并沒(méi)有因?yàn)閷W(xué)生工作耽誤學(xué)習(xí),相反,班干部的學(xué)習(xí)成績(jī)要比普通同學(xué)的學(xué)習(xí)成績(jī)好。班干部經(jīng)常和老師聯(lián)系,在老師身上學(xué)到很多知識(shí),并且任職班干部要給普通學(xué)生作表率。因此,班主任及任課教師要重視班干部,但不能忽視普通學(xué)生,要經(jīng)常找普通學(xué)生談心,以提高他們的學(xué)習(xí)成績(jī)。

        實(shí)踐經(jīng)歷+學(xué)習(xí)成績(jī),進(jìn)行挖掘,挖掘結(jié)果如下:

        [實(shí)踐經(jīng)歷=“多”=>學(xué)習(xí)成績(jī)=“優(yōu)”] 0.670

        [實(shí)踐經(jīng)歷=“中”=>學(xué)習(xí)成績(jī)=“良”] 0.498

        [實(shí)踐經(jīng)歷=“少”=>學(xué)習(xí)成績(jī)=“中”] 0.680

        結(jié)果表明:社會(huì)實(shí)踐及參加活動(dòng)多的學(xué)生的學(xué)習(xí)成績(jī)要好,而社會(huì)實(shí)踐及參加活動(dòng)少的學(xué)生的學(xué)習(xí)成績(jī)一般。作為學(xué)校的管理者,應(yīng)該多舉行有意義的活動(dòng),豐富學(xué)生的學(xué)校生活,提高他們的社會(huì)實(shí)踐能力,為以后步入社會(huì)奠定良好的基礎(chǔ)。

        四、數(shù)據(jù)挖掘技術(shù)應(yīng)用過(guò)程中要注意的問(wèn)題

        盡管數(shù)據(jù)挖掘有如此多的優(yōu)點(diǎn),但數(shù)據(jù)挖掘也面臨著許多的問(wèn)題,隨著這些問(wèn)題的解決,也為數(shù)據(jù)挖掘的未來(lái)的發(fā)展提供了更大的空間。

        1.數(shù)據(jù)挖掘的基本問(wèn)題就在于數(shù)據(jù)的數(shù)量和維數(shù),數(shù)據(jù)結(jié)構(gòu)也因此顯得非常復(fù)雜。海量的數(shù)據(jù)一方面提供了挖掘的基礎(chǔ)和前提,但同時(shí)維數(shù)的增加也會(huì)給數(shù)據(jù)挖掘的實(shí)現(xiàn)帶來(lái)難度。如何進(jìn)行探索,選擇元數(shù)據(jù),選擇分析變量,也就成為首要解決的問(wèn)題。

        2.面對(duì)如此大的數(shù)據(jù),數(shù)據(jù)中隱含一定的變化趨勢(shì),對(duì)數(shù)據(jù)進(jìn)行抽樣,怎么抽樣,抽取多大的樣本,又怎樣評(píng)價(jià)抽樣的效果,這些都是決定挖掘效果好壞的關(guān)鍵。

        3.數(shù)據(jù)挖掘的結(jié)果是不確定的。不同的人對(duì)同樣的數(shù)據(jù)進(jìn)行挖掘,可能產(chǎn)生不同的結(jié)果,甚至差異很大,要和專業(yè)知識(shí)相結(jié)合才能對(duì)其做出判斷,這就涉及到可靠性的問(wèn)題。需要建立有效的評(píng)估體系來(lái)評(píng)價(jià)。

        五、結(jié)束語(yǔ)

        學(xué)校作為科學(xué)技術(shù)的傳播地,學(xué)生的管理和建設(shè)對(duì)學(xué)校的可持續(xù)發(fā)展具有深遠(yuǎn)的影響。數(shù)據(jù)挖掘技術(shù)是一個(gè)研究活躍的領(lǐng)域,利用數(shù)據(jù)挖掘技術(shù)對(duì)學(xué)生信息積累的大量數(shù)據(jù)進(jìn)行挖掘,挖掘出具有管理和決策的信息,使學(xué)校切實(shí)做到“以學(xué)生為本”,管理進(jìn)一步走向規(guī)范化、科學(xué)化、現(xiàn)代化。

        參考文獻(xiàn):

        [1]范明、孟小峰,數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2007.

        [2]耿曉中、張冬梅,數(shù)據(jù)挖掘綜述[J].長(zhǎng)春師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2006.6,Vol.25,No.3,24~27.

        [3]李國(guó)杰,數(shù)據(jù)挖掘綜述[J].廣東輕工職業(yè)技術(shù)學(xué)院學(xué)報(bào),2006.3,Vol.5,No.1,19~21.

        [4]夏瑞麗,淺談數(shù)據(jù)挖掘[J].科技創(chuàng)新導(dǎo)報(bào),2008(24).

        猜你喜歡
        學(xué)號(hào)數(shù)據(jù)倉(cāng)庫(kù)字段
        圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
        我們來(lái)打牌
        基于數(shù)據(jù)倉(cāng)庫(kù)的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
        嘗試親歷的過(guò)程,感受探究的快樂(lè)
        分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉(cāng)庫(kù)中的設(shè)計(jì)
        電子制作(2016年15期)2017-01-15 13:39:15
        探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用
        學(xué)生學(xué)號(hào)的妙用
        基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析探索與實(shí)踐
        CNMARC304字段和314字段責(zé)任附注方式解析
        與56號(hào)說(shuō)再見
        亚洲午夜福利在线视频| 丰满巨臀人妻中文字幕| 国内精品少妇高潮视频| 天天狠天天添日日拍| 大地资源网最新在线播放| 99在线无码精品秘 人口| 中文字幕有码在线人妻| 在线亚洲高清揄拍自拍一品区| 黄色视频在线免费观看| 精品午夜一区二区三区久久| 中文亚洲一区二区三区| 97久久婷婷五月综合色d啪蜜芽| 日本丰满熟妇bbxbbxhd| 秋霞日韩一区二区三区在线观看| 91人妻人人做人人爽九色| 亚洲人成在线播放网站| 无码国产69精品久久久孕妇| 国产精品久久久久久久专区 | 国产又大大紧一区二区三区| 丰满熟妇人妻av无码区| 精品成人乱色一区二区| 中文字幕一区二区三区日韩网| 91偷自国产一区二区三区| 欧美亚洲国产一区二区三区| 色欲欲www成人网站| а√天堂资源8在线官网在线 | 欧美日韩区1区2区3区| 国产精品天堂在线观看| 无码 人妻 在线 视频| 少妇厨房愉情理伦片免费| 丝袜 亚洲 另类 欧美| 开心久久婷婷综合中文字幕| 岳好紧好湿夹太紧了好爽矜持| 色999欧美日韩| 福利视频在线一区二区三区| 日韩一区二区三区无码影院| 最新亚洲av日韩av二区| 亚洲天堂av社区久久| 插上翅膀插上科学的翅膀飞| 337人体做爰大胆视频| 男人天堂AV在线麻豆|