亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘技術(shù)在計算機等級考試成績中的分析研究

        2015-07-13 11:49:09曾斯
        電腦知識與技術(shù) 2015年13期
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘

        曾斯

        摘要:利用數(shù)據(jù)挖掘技術(shù)分析某高職院校全國計算機等級考試成績,從中發(fā)現(xiàn)了影響考試成績的一些隱藏信息,得到的結(jié)論對于提高學(xué)生的考試通過率和教師今后的教學(xué)起著指導(dǎo)作用。

        關(guān)鍵詞:數(shù)據(jù)挖掘;等級考試;關(guān)聯(lián)規(guī)則

        中圖分類號:TP3911 文獻標(biāo)識碼:A 文章編號:1009-3044(2015)13-0014-02

        Abstract: Analysis of data mining technology the National computer grade examination results of Vocational Colleges, Some of the hidden information that has been found to affect the results of the exam is found. The conclusion is of guiding function for improving students' examination pass rate and teachers' future teaching.

        Key words: data mining; grade examination; association rules

        1 引言

        隨著計算機技術(shù)的不斷發(fā)展,越來越多的高校開始重視計算機應(yīng)用基礎(chǔ)課程的教學(xué),《計算機應(yīng)用基礎(chǔ)》作為一門必修的公共基礎(chǔ)課,很多高職院校對該課程的考核不再是采用單一的期末考試,而是把計算機等級考試成績列為對考核學(xué)生該課程的重要內(nèi)容和對教師教學(xué)效果的評價依據(jù)。以筆者所任職的學(xué)院為例,學(xué)院將全國計算機等級考試一級的通過率作為考核學(xué)生的《計算機應(yīng)用基礎(chǔ)》課程的成績,而且該證書也得到了很多用人單位的認(rèn)可,也成為了學(xué)生畢業(yè)找工作的一個敲門磚,因此學(xué)院非常重視。鑒于各種原因,學(xué)生的通過率普遍不高,事實上,影響學(xué)生考試通過率的原因很多,本文就該問題引入了數(shù)據(jù)挖掘技術(shù),目的是從中找到影響學(xué)生成績的各種關(guān)聯(lián)因素,以此來制定整改措施,為后續(xù)的教學(xué)活動提供參考,從而提高學(xué)生計算機等級考試的通過率。

        2 數(shù)據(jù)挖掘技術(shù)

        數(shù)據(jù)挖掘技術(shù)是從海量的、不完整的、模糊的、有噪聲的以及隨機的原始數(shù)據(jù)中搜索出隱含在其中的,之前未知的而具有利用價值的信息的過程。如何對一些直觀的或隱含的海量數(shù)據(jù)進行分析,并且發(fā)現(xiàn)各數(shù)據(jù)間存在的聯(lián)系,提取出有用的模式,用以指導(dǎo)實際工作是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵所在。由于數(shù)據(jù)挖掘技術(shù)的優(yōu)越性和不斷成熟,目前該技術(shù)已經(jīng)廣泛應(yīng)用到商業(yè)決策、生產(chǎn)控制、工程設(shè)計和金融業(yè)等多個領(lǐng)域。

        數(shù)據(jù)挖掘的分析方法有多種,關(guān)聯(lián)規(guī)則分析、聚類規(guī)則分析、預(yù)測分析、分類規(guī)則分析等都是常用的挖掘方法。

        數(shù)據(jù)挖掘的過程包括以下幾步:首先對數(shù)據(jù)進行收集和預(yù)處理,對其進行消噪,去掉錯誤或冗余數(shù)據(jù)等處理,使之成為目標(biāo)數(shù)據(jù),為下一步的操作做準(zhǔn)備,同時要確定挖掘方法;然后是數(shù)據(jù)變換,根據(jù)之前的挖掘算法建立分析模型;接下來是數(shù)據(jù)挖掘和模式評估,將上一步得到的經(jīng)過變換后的數(shù)據(jù)進行挖掘;最后是結(jié)果分析和知識同化,解釋并評估結(jié)果,將分析后得到的知識應(yīng)用到實際的案例中。在數(shù)據(jù)挖掘整個過程中,牽涉到了前期大量的準(zhǔn)備與規(guī)劃工作,幾乎有80%的時間和精力花費在了數(shù)據(jù)的預(yù)處理階段,而且數(shù)據(jù)預(yù)處理階段得出的數(shù)據(jù)質(zhì)量的高低也直接決定了挖掘后的結(jié)果。因此,在進行數(shù)據(jù)挖掘分析之前,還是很有必要做好前期的準(zhǔn)備工作。

        3 數(shù)據(jù)挖掘技術(shù)在計算機等級考試成績分析中的應(yīng)用

        本文挖掘的數(shù)據(jù)來源于作者所任教學(xué)校的幾次全國計算機等級考試一級成績。由于每次考試都產(chǎn)生幾千條數(shù)據(jù),久而久之,大量的數(shù)據(jù)存儲在教務(wù)系統(tǒng)中,并沒有得到充分的利用,如何利用好這些數(shù)據(jù)為以后的教學(xué)提供服務(wù)是數(shù)據(jù)挖掘的目的所在。在數(shù)據(jù)挖掘之前,需要對數(shù)據(jù)進行清理,比如對于一些缺考的學(xué)生,還有一些因漏答造成數(shù)據(jù)不完整的記錄等都需要將其清除掉。

        3.1應(yīng)用關(guān)聯(lián)規(guī)則分析教師的教齡、職稱、評教情況在計算機等級考試成績中的影響

        關(guān)聯(lián)分析是在當(dāng)前教學(xué)活動中使用很頻繁的有效的方法。它用于發(fā)現(xiàn)數(shù)據(jù)庫中數(shù)值之間的相關(guān)性,從中找尋一些潛在的有用信息用于指導(dǎo)以后的教學(xué)工作。目前比較常用的關(guān)聯(lián)分析方法有關(guān)聯(lián)規(guī)則和序列模式。比如從海量的超市購物數(shù)據(jù)中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,可以幫助商家進行改變營銷策略,如促銷的時機、交叉銷售、貨架商品的擺放設(shè)計等。

        對于某些高職院校,由于取消了單一的期末考試,往往將學(xué)生英語過級和計算機等級考試的通過率作為評價教師教學(xué)效果的依據(jù)。通過運用關(guān)聯(lián)規(guī)則來分析學(xué)生的考試成績,挖掘出一些可能會影響學(xué)生過級率的一些相關(guān)因素,對今后的教學(xué)過程起著重要的指導(dǎo)作用?,F(xiàn)將我院計算機等級考試成績進行如下分析:

        隨機抽取本院擔(dān)任計算機教學(xué)的教師信息和學(xué)生計算機等級考試成績集成教師教學(xué)綜合信息表。然后將教師的教齡、職稱、評教情況、所教授對應(yīng)學(xué)生的成績錄入數(shù)據(jù)庫中,其他信息不做處理。為了簡化分析,接下來需要將數(shù)據(jù)進行抽象和離散化處理。優(yōu)秀的為3(90~100),良好的為2(80~89),及格的為1(60~79),不及格的為0(0~59)。教齡分為四個階段,分別用A1(1-5)、A2(6-10)、A3(11-20)、A4(21-30)表示,職稱分別用B1(初級)、B2(中級)、B3(副高)、B4(正高)表示,評教情況分別用C1(好)、C2(一般)、C3(較差)表示,D1(3,2,1,0)分別表示考試成績的等級。

        數(shù)據(jù)經(jīng)預(yù)處理后的視圖如下:

        根據(jù)關(guān)聯(lián)規(guī)則算法,先預(yù)設(shè)最小支持度以及最小可信度,得到如下結(jié)論:教師的教齡和職稱對于過級率的影響并不直接,而跟教師的評教情況卻不無關(guān)系,教師的評教情況越好,對應(yīng)的學(xué)生考試成績也就越好。因此,通過及時反饋學(xué)生對教師的教學(xué)評價,來加強教師的教學(xué)質(zhì)量,對提高學(xué)生等級考試成績是非常重要的。

        3.2 應(yīng)用聚類算法對等級考試試題進行分析

        眾所周知,計算機一級考試題型有以下6種:選擇題、Windows7操作題、文字處理、電子表格、演示文稿和網(wǎng)絡(luò)操作題。在這里將采用聚類算法中的K-Means算法對這6個屬性間的聚類分析進行挖掘。

        為了更好地進行聚類分析,首先需要對數(shù)據(jù)實行標(biāo)準(zhǔn)化。在實行標(biāo)準(zhǔn)化時需遵循的原則是:將每個題型的實際得分?jǐn)?shù)除以該題型的總分,如對于文字處理題,某考生得分為20分,文字處理題的總分為25分,20/25=0.8。同樣的方法,由此得到最終的標(biāo)準(zhǔn)化值范圍是[0,1]。其次是對數(shù)據(jù)進行聚類分析,傳統(tǒng)的K-Means 算法采取的是隨機選擇初始聚類中心的原則,這就使得不同的初始聚類中心會造成聚類結(jié)果的差異和不穩(wěn)定。為了使聚類結(jié)果具有更好的穩(wěn)定性,現(xiàn)將學(xué)生的考試成績分布情況大致分為優(yōu)秀、良好、及格和不及格4個等級。通過不同的等級來確定該等級的初始聚類中心。最后是對生成的聚類結(jié)果進行分析。例如學(xué)生在網(wǎng)絡(luò)操作題上普遍得分率較高,在電子表格處理題上面得分率較低。通過分析教師能夠直觀的了解學(xué)生對各知識點的掌握程度,便于以后在實際的教學(xué)中做出針對性的改進。同時,教師也可根據(jù)各類學(xué)生的學(xué)習(xí)特點做合適的指導(dǎo),調(diào)整教學(xué)方法及相應(yīng)內(nèi)容,從而幫助學(xué)生順利通過考試。

        3.3 應(yīng)用分類算法分析影響計算機等級考試成績的其他因素,如有無計算機基礎(chǔ)、平時上機作業(yè)成績、是否參加了考前培訓(xùn)、學(xué)習(xí)興趣等

        所謂分類是對一個事件或者一組對象依據(jù)他們本身的特性來進行分類。分類的目的是找到一組能夠科學(xué)地描述數(shù)據(jù)典型特征的模型。以便將來能夠識別未來數(shù)據(jù)的類別或歸屬。使用分類模型不但可以分析現(xiàn)有的數(shù)據(jù),而且可以預(yù)測未來。分類和預(yù)測作為兩類主要的預(yù)測問題,根據(jù)它們的不同分別用于離散數(shù)據(jù)和連續(xù)數(shù)據(jù)的預(yù)測。對于影響計算機等級考試成績的諸多因素以及數(shù)據(jù)的特點,將應(yīng)用分類算法來對其各種影響因素來進行分析。分析的流程為:首先,采集數(shù)據(jù),主要包括的數(shù)據(jù)有以下幾個方面:學(xué)生基本信息(學(xué)號、姓名、性別、院系、班級);學(xué)生的學(xué)習(xí)情況信息(有無計算機基礎(chǔ)、是否參加了考前培訓(xùn)、學(xué)習(xí)興趣等);這些信息主要是通過對學(xué)生的問卷調(diào)查來獲得,成績(平時上機作業(yè)成績、等級考試成績)。其次,對獲取的數(shù)據(jù)預(yù)處理。在預(yù)處理之前需要對數(shù)據(jù)進行集成和清理,這一步的目的是為了填補一些遺漏的數(shù)據(jù),從而有利于將上述收集到的各種數(shù)據(jù)通過數(shù)據(jù)庫技術(shù)生成一個標(biāo)準(zhǔn)的學(xué)生成績數(shù)據(jù)庫。然后就是數(shù)據(jù)轉(zhuǎn)換,即對數(shù)據(jù)進行離散化操作。接著是數(shù)據(jù)消減,其目的是縮減挖掘數(shù)據(jù)的規(guī)模,但前提條件是不能影響最終的挖掘結(jié)果。最后是進行數(shù)據(jù)分類挖掘并產(chǎn)生分類規(guī)則。通過上述的幾個步驟可得出哪些因素是影響了學(xué)生考試成績的。

        如IF平時上機作業(yè)成績=優(yōu)秀 AND有無計算機基礎(chǔ)=有AND參加考前培訓(xùn)=是 THEN 等級考試通過率=96%

        IF平時上機作業(yè)成績=良好 AND有無計算機基礎(chǔ)=有AND參加考前培訓(xùn)=是THEN 等級考試通過率=75%

        IF平時上機作業(yè)成績=及格 AND有無計算機基礎(chǔ)=有AND參加考前培訓(xùn)=無 THEN 等級考試通過率=50%

        4 結(jié)束語

        本文利用了數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析、聚類算法和分類算法對全國計算機等級考試一級成績進行了分析,科學(xué)、客觀地找出了影響考試成績的一系列因素。其分析結(jié)果可以幫助學(xué)生發(fā)現(xiàn)《計算機應(yīng)用基礎(chǔ)》這門課程的某些薄弱環(huán)節(jié),對于以后提高學(xué)生的考試通過率提供了幫助。同時對于教師今后的教學(xué)方法的改進和學(xué)院對于等級考試的相關(guān)工作也起著指導(dǎo)作用。

        參考文獻:

        [1] 劉芳,林海霞.數(shù)據(jù)挖掘技術(shù)在高校計算機等級考試成績分析中的應(yīng)用[J].廣西輕工業(yè),2008(11).

        [2] 曾旭,司馬宇.K-Means算法在計算機等級考試成績分析中的應(yīng)用[J].軟件導(dǎo)刊,2012(12).

        [3] 袁小玲,李瑞. 數(shù)據(jù)挖掘技術(shù)在高職院校學(xué)生成績管理中的應(yīng)用分析與探究[J].網(wǎng)絡(luò)與信息工程, 2014(13).

        猜你喜歡
        關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于Apriori算法的高校學(xué)生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
        基于關(guān)聯(lián)規(guī)則和時間閾值算法的5G基站部署研究
        移動通信(2016年20期)2016-12-10 09:09:04
        關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
        數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價體系中的應(yīng)用
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關(guān)聯(lián)規(guī)則的計算機入侵檢測方法
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        √天堂中文官网在线| 欧美 国产 日产 韩国 在线 | 国产成人精品一区二区三区视频 | 波多野结衣一区二区三区高清 | 国模无码人体一区二区| 亚洲狼人社区av在线观看| 日本一区二区三区小视频| 久久日本视频在线观看| 人妻仑乱a级毛片免费看| 国产精品午睡沙发系列| 久久久久AV成人无码网站| 最新中文字幕乱码在线| 精品国产午夜肉伦伦影院| 永久免费观看国产裸体美女 | 国产深夜男女无套内射| 国产午夜福利精品| 精品蜜桃在线观看一区二区三区| 亚洲一区毛片在线观看| 亚洲精品无码成人a片| 狠狠干视频网站| 亚洲中文字幕在线第六区| 人妻 偷拍 无码 中文字幕| 亚洲男人第一av网站| 日本一区二区在线播放观看| 亚洲综合偷自成人网第页色| 欧美最大胆的西西人体44| 8av国产精品爽爽ⅴa在线观看| 国产91成人自拍视频| 偷拍一区二区三区四区视频| 无码中文字幕免费一区二区三区| 国产高级黄区18勿进一区二区| 亚洲一区二区一区二区免费视频| 亚洲欧洲av综合色无码| 狠狠色丁香久久婷婷综合蜜芽五月 | 日韩女优图播一区二区| 亚洲春色在线视频| 久久精品国产热| 色噜噜亚洲精品中文字幕| 一二区成人影院电影网| 色诱久久av| 白白在线免费观看视频|