亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘在計(jì)算機(jī)課程成績(jī)分析中的應(yīng)用

        2017-10-19 07:22:42和鐵行
        浙江醫(yī)學(xué)教育 2017年5期
        關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則

        和鐵行,王 偉

        (杭州醫(yī)學(xué)院,浙江,杭州 310053)

        ·教學(xué)研究與管理·

        數(shù)據(jù)挖掘在計(jì)算機(jī)課程成績(jī)分析中的應(yīng)用

        和鐵行,王 偉

        (杭州醫(yī)學(xué)院,浙江,杭州 310053)

        目的:尋找教務(wù)管理系統(tǒng)中海量數(shù)據(jù)之間的隱性關(guān)聯(lián),以達(dá)到增強(qiáng)學(xué)生學(xué)習(xí)效率,促進(jìn)教學(xué)水平提升,增強(qiáng)教學(xué)管理的有效性。方法利用數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則的改進(jìn)型Apriori算法和聚類算法進(jìn)行數(shù)據(jù)的挖掘。結(jié)果通過(guò)對(duì)數(shù)據(jù)挖掘進(jìn)行統(tǒng)計(jì)分析后,發(fā)現(xiàn)用來(lái)挖掘的2015級(jí)120名??粕?016級(jí)60名本科生計(jì)算機(jī)課程成績(jī)與入學(xué)基礎(chǔ)、授課時(shí)數(shù)之間有著隱藏的關(guān)聯(lián)性。結(jié)論成績(jī)的評(píng)定指標(biāo)要具有可操作性和合理性,利用挖掘結(jié)果可以指導(dǎo)教師教學(xué),有利于學(xué)生更有針對(duì)性地進(jìn)行計(jì)算機(jī)課程的學(xué)習(xí)。

        數(shù)據(jù)挖掘;Apriori算法;成績(jī)分析

        Abstract:[Objective] To find the implicit association between the increasing amount of mass data in the education management system and to enhance students' learning efficiency, promote teaching level and improve the effectiveness of teaching management.[Method] According to Apriori algorithm, the modified form of data mining associated ruler, data miningwascarried out.[Result]Searching for the potential relationship among the data through statistical analysis, it is found that there are hidden correlations between the scores.[Conclusion] The evaluation indicators should be operational and reasonable. The results of mining could be used to guide teaching and help students in targeted computer learning.

        Keywords:data mining; Apriori algorithm;analysis of the performance

        高校在長(zhǎng)期的教學(xué)過(guò)程中積累了大量的數(shù)據(jù),這些海量的數(shù)據(jù)存放在學(xué)校的教務(wù)管理系統(tǒng)中。于是,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到成績(jī)方面成為教學(xué)管理的一個(gè)研究方向。本文利用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則法和聚類算法對(duì)學(xué)生的成績(jī)及其影響因素做了深入的分析、總結(jié)和發(fā)掘,希望能對(duì)今后教師的日常教學(xué)、學(xué)生學(xué)習(xí)以及教學(xué)管理提供幫助。

        1 數(shù)據(jù)挖掘及算法介紹

        1.1 數(shù)據(jù)挖掘

        數(shù)據(jù)挖掘(Data Mining,DM)[1]是利用計(jì)算機(jī)這一現(xiàn)代化工具,從模糊的、海量的、不完整的實(shí)際應(yīng)用數(shù)據(jù)中,把隱含在其中的人們事先不知道的但又可能有用的信息和知識(shí)提取的過(guò)程,試圖發(fā)現(xiàn)隱藏在這些數(shù)據(jù)背后的關(guān)系是人們挖掘的目的,挖掘的結(jié)果是可以為人們提供更多有價(jià)值的信息。

        1.2 數(shù)據(jù)挖掘算法

        數(shù)據(jù)挖掘算法[2]是根據(jù)數(shù)據(jù)創(chuàng)建數(shù)據(jù)挖掘模型的一組試探法和計(jì)算。常用的數(shù)據(jù)挖掘算法有:分類算法、決策樹(shù)算法[3]、回歸算法、聚類分析算法、關(guān)聯(lián)規(guī)則等,這些算法有其各自適用的場(chǎng)景。如對(duì)植物葉子的分類就是典型的分類算法,對(duì)根據(jù)降雨、霧霾、氣溫等特征將自己的行為分類為出門和不出門則是典型的決策樹(shù)算法。

        1.3 Apriori算法

        從所有的項(xiàng)目集合中找出所有頻繁項(xiàng)目集合式Apriori算法的基本思想,找出的這些頻繁項(xiàng)目集合的頻繁性必須大于或等于預(yù)先設(shè)定好的最小支持度值(支持度表示項(xiàng)集{X,Y}在總項(xiàng)集里出現(xiàn)的概率,最小支持度是指出現(xiàn)X導(dǎo)致Y也出現(xiàn)的最小概率值。)然后由這些滿足最小支持度的頻繁項(xiàng)目集合來(lái)產(chǎn)生關(guān)聯(lián)性較強(qiáng)的規(guī)則,也即是強(qiáng)關(guān)聯(lián)規(guī)則,在滿足最小支持度的同時(shí)還要滿足預(yù)先設(shè)定好的最小置信度是強(qiáng)關(guān)聯(lián)規(guī)則的基本要求(置信度表示在先決條件X發(fā)生的情況下,由關(guān)聯(lián)規(guī)則”X→Y”推導(dǎo)出Y的概率。)。Apriori算法最開(kāi)始是從最簡(jiǎn)單的候選項(xiàng)集C1中開(kāi)始篩選,找出符合條件的L1,然后由L1與自身連接便可產(chǎn)生候選項(xiàng)集C2,接著再對(duì)C2進(jìn)行篩選,找出符合條件的L2,如此循環(huán)下去直到最后為空集為止。

        本文用到的數(shù)據(jù)挖掘技術(shù)就是挖掘關(guān)聯(lián)規(guī)則的Apriori算法。

        2 數(shù)據(jù)挖掘在學(xué)生成績(jī)分析中的應(yīng)用

        2.1 挖掘流程

        確定挖掘的目標(biāo),即需要挖掘的計(jì)算機(jī)課程的學(xué)生成績(jī),然后對(duì)這些挖掘的對(duì)象進(jìn)行采集、預(yù)處理,進(jìn)行初步挖掘,再逐層進(jìn)行深度挖掘,最終建立數(shù)據(jù)間的關(guān)聯(lián)性,挖掘分析出各指標(biāo)間的類。

        2.2 系統(tǒng)流程

        根據(jù)挖掘流程,設(shè)計(jì)出如圖1所示的挖掘系統(tǒng)流程圖,應(yīng)用于實(shí)際的數(shù)據(jù)挖掘。

        圖1 挖掘系統(tǒng)流程圖

        圖1中,挖掘的數(shù)據(jù)來(lái)源于正方教務(wù)管理系統(tǒng)、百科園通用考試管理系統(tǒng)(計(jì)算機(jī)課程教學(xué)互動(dòng)的軟件系統(tǒng))和浙江省計(jì)算機(jī)等級(jí)考試數(shù)據(jù)庫(kù);數(shù)據(jù)庫(kù)指的是主要存儲(chǔ)涉及學(xué)生信息的各種數(shù)據(jù),該系統(tǒng)將學(xué)生的基本信息以及學(xué)生學(xué)習(xí)計(jì)算機(jī)課程的各種信息存儲(chǔ)在數(shù)據(jù)庫(kù)中;知識(shí)庫(kù)是經(jīng)過(guò)數(shù)據(jù)挖掘后從中提取出來(lái)的規(guī)則,用來(lái)為決策人員作決策使用;數(shù)據(jù)挖掘是根據(jù)決策者提出的問(wèn)題特點(diǎn),確定挖掘的任務(wù)或目的,對(duì)數(shù)據(jù)庫(kù)中的相關(guān)數(shù)據(jù)進(jìn)行精簡(jiǎn)和預(yù)處理,再?gòu)木?jiǎn)后的數(shù)據(jù)中挖掘出新的、有效的新知識(shí),提供給基于計(jì)算機(jī)課程成績(jī)的有效數(shù)據(jù)挖掘,最終由它給決策者提供有效的知識(shí);挖掘結(jié)果分析是通過(guò)分析最終的挖掘結(jié)果,找出有效數(shù)據(jù)之間的關(guān)聯(lián),提供有實(shí)際意義的報(bào)告。

        2.3 數(shù)據(jù)準(zhǔn)備

        本次研究選擇了我校2015級(jí)120名??茖W(xué)生和2016級(jí)60名本科學(xué)生的基本信息(數(shù)據(jù)來(lái)源于校正方教務(wù)管理系統(tǒng)、百科園通用考試管理系統(tǒng)和浙江省計(jì)算機(jī)等級(jí)考試數(shù)據(jù)庫(kù))、醫(yī)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)課程的任課教師、課時(shí)情況、出勤率等信息(來(lái)源于聯(lián)創(chuàng)機(jī)房管理系統(tǒng)和百科園通用考試管理系統(tǒng)),以及浙江省計(jì)算機(jī)等級(jí)考試的成績(jī)信息(來(lái)源于2016年秋浙江省計(jì)算機(jī)等級(jí)考試數(shù)據(jù))。其基本信息如表1所示。

        表1 計(jì)算機(jī)課程數(shù)據(jù)的基本信息表

        2.4 數(shù)據(jù)預(yù)處理

        表1中的數(shù)據(jù)中可能存在冗余、不完整、空值等情況,因此對(duì)收集到的數(shù)據(jù)在挖掘之前進(jìn)行預(yù)處理,提高數(shù)據(jù)的質(zhì)量,從而有助于建立高準(zhǔn)確率的數(shù)據(jù)模型。數(shù)據(jù)預(yù)處理就是要?jiǎng)h除對(duì)挖掘的預(yù)測(cè)結(jié)果無(wú)關(guān)聯(lián)的數(shù)據(jù),如學(xué)生的年齡、班級(jí)等信息。同時(shí),基于數(shù)據(jù)挖掘的要求,還要將多張數(shù)據(jù)表進(jìn)行合并整理,形成適合數(shù)據(jù)挖掘的數(shù)據(jù)表。

        2.5 基于Apriori算法的數(shù)據(jù)挖掘

        本次關(guān)聯(lián)規(guī)則分析的數(shù)據(jù)由我校2015級(jí)120名??茖W(xué)生和2016級(jí)60名本科學(xué)生學(xué)生、計(jì)算機(jī)課程考試成績(jī)及相應(yīng)的任課老師信息組成。共抽選出180條學(xué)生的記錄。經(jīng)過(guò)整理后的初始信息表如表2所示。

        表2 計(jì)算機(jī)課程初始信息表

        (備注:課前基礎(chǔ)測(cè)驗(yàn)在第一次實(shí)驗(yàn)課中完成,評(píng)定按5級(jí)制;表中只列舉了部分信息)

        為了簡(jiǎn)化分析,接下來(lái)需要將數(shù)據(jù)進(jìn)行抽象和離散化處理。學(xué)生專業(yè)信息處理為:藥學(xué)(A1),護(hù)理(A2),影像(A3)…學(xué)生課前基礎(chǔ)測(cè)驗(yàn)在第一次實(shí)驗(yàn)課中完成評(píng)定,分別用優(yōu)秀(B1),良好(B2),中等(B3),合格(B4),不合格(B5)表示。教師職稱分別用正高(C1),副高(C2),中級(jí)(C3),初級(jí)(C4)表示。學(xué)生上課課時(shí)數(shù)離散化為:>=8周(D1),7周(D2),6周(D3),5周(D4),<=4周(D5)。實(shí)驗(yàn)作業(yè)根據(jù)得分情況離散化為:90~100為優(yōu)秀(E1),80~89為良好(E2),70~79為中等(E3),60~69為合格(E4),低于60分為不合格(E5)。計(jì)算機(jī)課程考試成績(jī)離散化為:90~100為優(yōu)秀(F1),80~89為良好(F2),70~79為中等(F3),60~69為合格(F4),低于60分為不合格(F5)。經(jīng)過(guò)處理的信息表如表3所示。

        表3數(shù)據(jù)預(yù)處理、離散化后的信息表

        數(shù)據(jù)分析過(guò)程采用SPSS Clementine12.0中文版,以Apriori算法為基礎(chǔ),設(shè)置最小支持度為0.35,取最小置信度為0.65,使用加權(quán)支持度計(jì)算函數(shù)(支持度公式為Support(X→Y)=P(X,Y)P(I)。由于考試分?jǐn)?shù)的特性,設(shè)定λ為6,其他權(quán)值為3進(jìn)行挖掘分析,生成頻繁項(xiàng)集(也稱為項(xiàng)集,如果項(xiàng)集的相對(duì)支持度滿足預(yù)定義的最小支持度閾值,則稱之為頻繁項(xiàng)集)和關(guān)聯(lián)規(guī)則(關(guān)聯(lián)規(guī)則是形如X→Y的蘊(yùn)涵式,其中X和Y分別稱為關(guān)聯(lián)規(guī)則的先導(dǎo)和后繼,關(guān)聯(lián)規(guī)則XY,存在支持度和信任度。)。共獲得387條頻繁項(xiàng)集,296條關(guān)聯(lián)規(guī)則。部分關(guān)聯(lián)規(guī)則見(jiàn)表4。

        表4 關(guān)聯(lián)規(guī)則表

        根據(jù)前面設(shè)置最小支持度為0.35和最小置信度為0.65的閾值,從表4中A2,C3->F3的關(guān)聯(lián)規(guī)則可以推導(dǎo)出專業(yè)和教師的職稱對(duì)于學(xué)生成績(jī)的并沒(méi)有什么直接影響,從B5,D5-> F5、B4,E2->F4、D4,E3->F5這些關(guān)聯(lián)規(guī)則中我們可以推導(dǎo)出最終的成績(jī)和前面數(shù)據(jù)存在著很強(qiáng)的關(guān)聯(lián)性,入學(xué)基礎(chǔ)差、授課時(shí)數(shù)少、實(shí)驗(yàn)作業(yè)情況中等以下的學(xué)生的課程通過(guò)率較低;而入學(xué)基礎(chǔ)好、授課課時(shí)數(shù)8周以上、平時(shí)作業(yè)完成良好的學(xué)生,課程考試成績(jī)就較高。因此,應(yīng)當(dāng)適當(dāng)增加課時(shí),對(duì)課時(shí)少的專業(yè)中實(shí)驗(yàn)作業(yè)成績(jī)較差的學(xué)生教師應(yīng)在課堂上給予更多關(guān)注,以利于提高課程的考試成績(jī)。

        3 結(jié)論

        本文利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析對(duì)計(jì)算機(jī)課程的成績(jī)進(jìn)行了分析,分析的結(jié)果和課程結(jié)束后學(xué)生成績(jī)的分布結(jié)構(gòu)相類似。學(xué)生所在專業(yè)以及教師的職稱對(duì)課程成績(jī)影響不明顯,兩者之間基本上不存在符合設(shè)定閾值的關(guān)聯(lián)。而學(xué)生課前的基礎(chǔ)、授課時(shí)數(shù)、實(shí)驗(yàn)作業(yè)和最終成績(jī)存在著很強(qiáng)的關(guān)聯(lián)性。其分析結(jié)果可以幫助學(xué)生發(fā)現(xiàn)自己的薄弱環(huán)節(jié),對(duì)于以后學(xué)習(xí)提供針對(duì)性的幫助。同時(shí)對(duì)教師教學(xué)方法的改進(jìn)和學(xué)院對(duì)課程學(xué)時(shí)分配也有一定的指導(dǎo)意義。

        [1]趙艷.Apriori算法在高職院校課程關(guān)聯(lián)性分析中的應(yīng)用研究[J].河北企業(yè),2015.(9):10-11.

        [2]婁巖.醫(yī)學(xué)大數(shù)據(jù)挖掘與應(yīng)用.北京:科學(xué)出版社,2015.47-48.

        [3]曾斯.?dāng)?shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)等級(jí)考試成績(jī)中的分析研究[J].電腦知識(shí)與技術(shù),2015,(13):14-15.

        Applicationofdatamininginachievementanalysisofcomputercourses

        HETiexing,WANGWei

        (Hangzhou Medical College,Hangzhou 310053,China)

        B

        1672-0024(2017)05-0004-04

        和鐵行(1980-),男,河南周口人,本科,講師。研究方向:計(jì)算機(jī)基礎(chǔ)教學(xué)與科研

        杭州醫(yī)學(xué)院校級(jí)課題(編號(hào):2013XZA05)

        猜你喜歡
        數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則
        撐竿跳規(guī)則的制定
        “苦”的關(guān)聯(lián)
        數(shù)獨(dú)的規(guī)則和演變
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        亚洲色四在线视频观看| 亚洲国产av玩弄放荡人妇系列| 午夜成人理论无码电影在线播放| 午夜亚洲国产理论片亚洲2020| 日韩少妇高潮在线视频| 国产日产在线视频一区| 最新中文字幕av无码不卡| 无码人妻一区二区三区免费n鬼沢| 国产成社区在线视频观看| 亚洲精品中文字幕91| 欧美激情综合色综合啪啪五月| 亚洲最大av资源站无码av网址| 亚洲综合网站精品一区二区| 国产人妖在线观看一区二区三区 | 日本大肚子孕妇交xxx| 香蕉久久久久久久av网站| 免费在线日韩| 中文字幕在线乱码av| 亚洲97成人精品久久久| 亚洲av色影在线| 国产女女精品视频久热视频| 欧美日韩一区二区三区视频在线观看| 宅男天堂亚洲一区二区三区| 久久无码字幕中文久久无码 | 国产激情无码一区二区| 色婷婷欧美在线播放内射| 亚洲综合色婷婷七月丁香| 97超碰精品成人国产| 日夜啪啪一区二区三区| 欧美伊人亚洲伊人色综| 免费看黄片视频在线观看| 免费国产在线精品一区| 久久久久亚洲av无码专区| 国产女主播强伦视频网站| 东北熟妇露脸25分钟| 日本高清h色视频在线观看| 亚洲日韩欧美一区二区三区| 人妻体体内射精一区中文字幕| 白丝爆浆18禁一区二区三区| 污污污污污污污网站污| 色青青女同性恋视频日本熟女 |