亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        普通高校招生信息處理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用探索

        2016-03-25 01:08:38劉峰王玉吉周克復(fù)馬英杰
        科學(xué)與財(cái)富 2016年7期
        關(guān)鍵詞:數(shù)據(jù)挖掘特征信息

        劉峰 王玉吉 周克復(fù) 馬英杰

        摘 要:隨著信息技術(shù)在高校教學(xué)管理、學(xué)生管理工作中日益廣泛而深入的應(yīng)用,高校招生管理系統(tǒng)與教學(xué)管理、學(xué)生管理系統(tǒng)的信息對接顯得尤為重要,只有對招生管理系統(tǒng)中的信息進(jìn)行深度的挖掘,才能使教學(xué)、學(xué)生管理系統(tǒng)獲得高質(zhì)量的數(shù)據(jù)輸入。高校招生信息的充分有效利用將有效促進(jìn)高校教學(xué)、學(xué)生、招生管理工作的規(guī)范化、信息化、自動化水平,本研究對數(shù)據(jù)挖掘技術(shù)在高校招生數(shù)據(jù)中的運(yùn)用進(jìn)行了有益探索。

        關(guān)鍵詞:數(shù)據(jù)挖掘;招生信息

        隨著高校間生源競爭的日趨激烈,招生宣傳工作越來越受到高校管理者的重視,而科學(xué)、深入地挖掘招生數(shù)據(jù)中潛在的、隱藏的規(guī)律,能夠大大提高招生宣傳工作的針對性,從而增強(qiáng)宣傳效果。通過數(shù)據(jù)挖掘技術(shù),可以對招生系統(tǒng)積累的海量招生數(shù)據(jù)進(jìn)行挖掘和提煉,對簡單的數(shù)據(jù)進(jìn)行多維分析、合并歸類和高度集成,從而挖掘出隱藏于數(shù)據(jù)間的潛在聯(lián)系,獲取有價(jià)值的信息。基于挖掘結(jié)果,高校教學(xué)管理、學(xué)生管理、招生管理工作者可以透視數(shù)據(jù)間的各種特征和關(guān)系,大大提高決策水平和管理水平,有效增強(qiáng)學(xué)校競爭力。

        1、數(shù)據(jù)挖掘技術(shù)

        數(shù)據(jù)庫規(guī)模日益擴(kuò)大產(chǎn)生了繁雜的海量數(shù)據(jù),要從這些海量數(shù)據(jù)中發(fā)現(xiàn)潛在的、有用的信息,成為一項(xiàng)重要而艱巨的任務(wù),而數(shù)據(jù)挖掘技術(shù)正是在這種需求的背景下應(yīng)運(yùn)而生。數(shù)據(jù)挖掘是指從海量數(shù)據(jù)中自動搜索隱藏的、潛在的、有用的信息的過程。數(shù)據(jù)挖掘的結(jié)果一般以概念、規(guī)則、規(guī)律、模式、約束、可視化圖表等形式表現(xiàn),通過決策支持工具提供給決策者使用。

        數(shù)據(jù)挖掘的主要任務(wù)包括關(guān)聯(lián)分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等等,數(shù)據(jù)挖掘的主要任務(wù)可以分為預(yù)測性任務(wù)和描述性任務(wù)兩大類。數(shù)據(jù)挖掘的主要過程包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘和知識表示,數(shù)據(jù)準(zhǔn)備包括對數(shù)據(jù)的集成和選擇,數(shù)據(jù)挖掘階段是最核心的環(huán)節(jié),需要確定挖掘模式并選擇合適的算法工具,知識表示是數(shù)據(jù)挖掘的最后也是最重要階段,決定了信息最終將以何種形式呈現(xiàn)給用戶。數(shù)據(jù)挖掘技術(shù)中常見的算法包括聚類算法、關(guān)聯(lián)算法和歸類算法等,聚類算法將樣本點(diǎn)按照屬性特征進(jìn)行無指定標(biāo)簽歸類,確保同類樣本點(diǎn)的極大相似和不同類樣本點(diǎn)的極大差異,關(guān)聯(lián)規(guī)則算法則用于發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中令人感興趣的關(guān)聯(lián),分類算法則通過一定的訓(xùn)練算法來學(xué)習(xí)分類知識,然后將分類知識用于樣本集。

        2、分析普通高校招生信息處理存在的問題

        我國普通高等學(xué)校的主要生源來自普通高考,普通高考錄取工作通過教育部組織開發(fā)的高等院校招生錄取系統(tǒng)進(jìn)行,該系統(tǒng)導(dǎo)出的數(shù)據(jù)規(guī)范、豐富、詳細(xì),但其功能僅限于網(wǎng)上錄取工作,如何利用好系統(tǒng)導(dǎo)出數(shù)據(jù)卻成為錄取后續(xù)相關(guān)工作的軟肋。按照現(xiàn)有管理模式,招生系統(tǒng)數(shù)據(jù)僅僅是在校內(nèi)經(jīng)過簡單的傳送、轉(zhuǎn)發(fā)后流向相關(guān)職能部門,對于數(shù)據(jù)的利用也僅僅限于簡單的查詢、統(tǒng)計(jì)、備份,并沒有充分發(fā)揮出其作用,現(xiàn)代化、信息化的高校教學(xué)和學(xué)生管理工作也迫切需要更有價(jià)值的信息作為系統(tǒng)輸入,而數(shù)據(jù)挖掘技術(shù)恰恰能夠較好地滿足高校信息處理需求。將數(shù)據(jù)挖掘技術(shù)用于高校招生數(shù)據(jù)處理,是高校管理信息化、自動化、現(xiàn)代化的必然選擇。

        3、功能的實(shí)現(xiàn)

        可以建立招生信息管理系統(tǒng)來對海量招生數(shù)據(jù)進(jìn)行挖掘。招生信息管理系統(tǒng)的目的是承接全國網(wǎng)上招生系統(tǒng)數(shù)據(jù)輸出,整合高校教學(xué)和學(xué)生管理部門數(shù)據(jù)積累,在海量數(shù)據(jù)的基礎(chǔ)上,形成全校數(shù)據(jù)整合、集成、處理平臺,向高校相關(guān)職能部門提供信息查詢和決策支持。招生信息管理系統(tǒng)包含信息維護(hù)模塊、信息查詢模塊、入校管理模塊、決策支持模塊四個(gè)基本功能模塊組成,其中決策支持模塊是實(shí)現(xiàn)數(shù)據(jù)挖掘算法的主要模塊,該系統(tǒng)基于三層構(gòu)架,挖掘算法邏輯運(yùn)行于JugarCTS中間組件,可以大大提高運(yùn)行效率。在數(shù)據(jù)挖掘的實(shí)現(xiàn)上,使用微軟的SQLServer2000 AnalysisServices,該系統(tǒng)能夠提供數(shù)據(jù)挖掘中間服務(wù),對決策樹、聚類算法等數(shù)據(jù)挖掘算法均能提供較好的支持。

        4、普通高校招生信息處理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用

        4.1挖掘的過程

        數(shù)據(jù)準(zhǔn)備階段的主要工作包括將來自招生、教務(wù)、學(xué)生管理系統(tǒng)中的數(shù)據(jù)進(jìn)行集成,然后根據(jù)實(shí)際需要對集成數(shù)據(jù)進(jìn)行選擇,以縮小處理數(shù)據(jù)量。實(shí)施挖掘階段先采用發(fā)現(xiàn)型數(shù)據(jù)挖掘,為用戶提出預(yù)先假設(shè),然后選擇合適的算法工具,在本文中主要采用了聚類算法、決策樹歸納算法和頻繁項(xiàng)集關(guān)聯(lián)規(guī)則算法,進(jìn)而由招生信息管理系統(tǒng)實(shí)現(xiàn)算法邏輯,最后依靠決策支持技術(shù)對挖掘結(jié)果進(jìn)行整理后呈現(xiàn)給用戶。在整個(gè)挖掘過程中,數(shù)據(jù)準(zhǔn)備是十分重要的基礎(chǔ)性工作,數(shù)據(jù)準(zhǔn)備質(zhì)量的高低,直接決定了挖掘工作能否達(dá)到預(yù)設(shè)目的。數(shù)據(jù)準(zhǔn)備工作主要包括聚集、抽樣、維歸約、特征子集選擇、特征創(chuàng)建、離散化和二元化、變量變換,聚集工作是數(shù)據(jù)對象合并過程,抽樣工作將使挖掘工作集中于有意義的、感興趣的數(shù)據(jù)范圍內(nèi),維歸約可以刪除數(shù)據(jù)中不相關(guān)的特征并降低數(shù)據(jù)噪聲從而避免維災(zāi)難,特征子集的選擇去除了冗余特征和不相關(guān)特征,特征創(chuàng)建可以選擇性地開發(fā)新的數(shù)據(jù)特征,最后,連續(xù)屬性可以通過離散化來轉(zhuǎn)換成適合數(shù)據(jù)挖掘算法的離散屬性。

        4.2生源關(guān)聯(lián)分析和生源前景預(yù)測

        使用關(guān)聯(lián)規(guī)則對歷年積累的生源信息進(jìn)行深入挖掘,發(fā)現(xiàn)生源層次、專業(yè)、地域、畢業(yè)高中、科類間的潛在聯(lián)系和規(guī)律,從而為招生宣傳工作提供決策支持。使用Apriori頻繁項(xiàng)集算法對學(xué)生數(shù)據(jù)進(jìn)行挖掘并生成關(guān)聯(lián)規(guī)則,可以發(fā)現(xiàn)和預(yù)測生源信息屬性間存在的關(guān)聯(lián)規(guī)律,從而支持教學(xué)管理工作中的生源特征分析和招生管理工作生源結(jié)構(gòu)預(yù)測。使用決策樹作為分類器,用信息增益度作為屬性測試條件選擇的度量依據(jù),運(yùn)用決策樹算法構(gòu)造決策樹,在海量招生數(shù)據(jù)中提取知識,以預(yù)測可能的生源變化,發(fā)現(xiàn)測試屬性對制定招生來源計(jì)劃的影響,在此基礎(chǔ)上,對專業(yè)設(shè)置和分省分專業(yè)招生計(jì)劃作出合理調(diào)整。

        4.3學(xué)生分班管理

        使用聚類算法,綜合新生高考總成績、單科成績、政治面貌、性別、地域等信息進(jìn)行分析,在分班過程中注重屬于不同組類學(xué)生之間的平衡,防止具有相同綜合特征的學(xué)生過于集中于一個(gè)或某幾個(gè)班級。由于新生數(shù)據(jù)屬于低維數(shù)據(jù),因此可以使用自下而上的聚合層次聚類算法,通過樹狀圖對作為原子聚類的新生數(shù)據(jù)對象進(jìn)行逐層聚合,直至聚合終止條件被激活。聚類算法對于分班管理具有重要意義,使用傳統(tǒng)的分班方式容易導(dǎo)致“以偏概全”,即偏重于單項(xiàng)指標(biāo)而難以達(dá)到整體指標(biāo)的平衡,從而給后續(xù)教學(xué)、學(xué)生管理帶來諸多問題。

        4.4人才選拔管理

        可以從系統(tǒng)數(shù)據(jù)和電子檔案中抽取反映新生個(gè)性特征、興趣志向、認(rèn)知能力的數(shù)據(jù)字段,使用聚類算法對信息進(jìn)行提取、分析、歸納、總結(jié),從而發(fā)現(xiàn)符合特定特征標(biāo)準(zhǔn)的群體,在入校一段時(shí)間以后,還可以對學(xué)生日常成績信息進(jìn)行篩選、融合,對學(xué)生成長定位進(jìn)行傾向性預(yù)測,達(dá)到增強(qiáng)人才培養(yǎng)工作針對性的目的。使用ID3決策樹歸納算法對學(xué)生成績信息、日常評價(jià)信息進(jìn)行深入分析,并訓(xùn)練出學(xué)生發(fā)展定位前景分類器,根據(jù)此分類器可以對學(xué)生的發(fā)展定位特征做出預(yù)測,并在此基礎(chǔ)上增強(qiáng)人才培養(yǎng)工作的針對性。ID3算法以決策樹作為分析工具,將信息增益度作為條件測試屬性選擇的依據(jù)(決策樹節(jié)點(diǎn)),該算法理論清晰,算法簡單,具有較好的總預(yù)測準(zhǔn)確率。

        綜上所述,數(shù)據(jù)挖掘作為將傳統(tǒng)數(shù)據(jù)分析方法與處理大量數(shù)據(jù)的復(fù)雜算法相結(jié)合的新手段,已經(jīng)成為信息管理和決策支持領(lǐng)域的前沿研究方向之一,應(yīng)用將越來越廣泛。高等院校招生數(shù)據(jù)積累量大,格式規(guī)范,因此非常適用于現(xiàn)有數(shù)據(jù)挖掘算法的使用,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校招生信息處理工作中,必將為高校教學(xué)管理、學(xué)生管理、招生管理提供有價(jià)值的決策依據(jù)信息,對于提高高校管理規(guī)范化、信息化水平,提高生源數(shù)量和質(zhì)量具有顯著意義,值得普遍推廣應(yīng)用。

        參考文獻(xiàn):

        [1] 許碩. 數(shù)據(jù)挖掘技術(shù)在民辦高校招生中的探索[J]. 遼寧師專學(xué)報(bào)(社會科學(xué)版). 2013(04)

        [2] 孫曉瑩,郭飛燕. 數(shù)據(jù)挖掘在高校招生預(yù)測中的應(yīng)用研究[J]. 計(jì)算機(jī)仿真. 2012(04)

        猜你喜歡
        數(shù)據(jù)挖掘特征信息
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        如何表達(dá)“特征”
        不忠誠的四個(gè)特征
        抓住特征巧觀察
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        综合精品欧美日韩国产在线| 邻居少妇张开腿让我爽了一夜| 亚洲av成人精品日韩在线播放 | 丰满人妻熟妇乱又伦精品视| 巨乳av夹蜜桃站台蜜桃机成人| 精品黄色一区二区三区| 亚洲伦理第一页中文字幕| 国产av一区二区三区传媒| 午夜大片又黄又爽大片app| 日本精品久久久久中文字幕1| 久久精品国产9久久综合| 色综合久久中文娱乐网| 亚洲av无码av吞精久久| 亚洲国产精品综合久久20| 日本av不卡一区二区三区| 国产精品99精品久久免费| 久久亚洲精品无码va大香大香| 欧美丝袜激情办公室在线观看| 日韩精品一区二区亚洲观看av| 亚洲精品第一国产综合精品| 开心婷婷五月激情综合社区| 在线看亚洲十八禁网站| 偷拍韩国美女洗澡一区二区三区 | 国产精品综合色区av| 国产乱码精品一区二区三区久久 | 色婷婷综合中文久久一本 | 亚洲人成网7777777国产| 亚洲高清精品50路| 一级老熟女免费黄色片| 人人妻人人狠人人爽| 四虎影视亚洲精品| av资源在线永久免费观看| av高清在线不卡直播| 好屌草这里只有精品| 精品午夜一区二区三区久久| 亚洲一区二区蜜桃视频| 日韩人妻无码一区二区三区久久| 无遮挡亲胸捏胸免费视频| 精品日本一区二区视频| 在线视频观看国产色网| 亚洲av永久无码精品一区二区|