亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于K—means聚類算法成績(jī)分析的應(yīng)用探究

        2016-05-30 15:32:15張貴元
        關(guān)鍵詞:成績(jī)分析means算法聚類分析

        張貴元

        摘 要:數(shù)據(jù)挖掘是在海量的數(shù)據(jù)中尋找模式或規(guī)則的過(guò)程。隨著學(xué)校招生規(guī)模的擴(kuò)大,在校學(xué)生成績(jī)分布越來(lái)越復(fù)雜,傳統(tǒng)的成績(jī)分析有一定的局限性,該文介紹了K-means聚類算法的原理和算法流程,針對(duì)學(xué)生成績(jī)數(shù)據(jù)進(jìn)行選擇、預(yù)處理,運(yùn)用K-means聚類算法對(duì)學(xué)生成績(jī)數(shù)據(jù)進(jìn)行聚類挖據(jù)分析等。通過(guò)聚類結(jié)果分析,打破原有成績(jī)分析得局限,使現(xiàn)有數(shù)據(jù)體現(xiàn)更好的價(jià)值,從而輔助教學(xué)管理者做出相應(yīng)決策,更好地提高教學(xué)質(zhì)量。

        關(guān)鍵詞:數(shù)據(jù)挖掘 K-means算法 聚類分析 成績(jī)分析

        中圖分類號(hào):TP31 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2016)01(c)-0090-03

        Abstract:Data mining is the process of finding patterns or rules in massive data. With the expansion of school enrollment,students in grades distribution are more and more complex,the traditional performance analysis has some limitations.This paper introduces the theory and algorithm process of K-means clustering algorithm,to choose for student achievement data,preprocessing, on student achievement data clustering mining to analysis using the K-means clustering algorithm.Through the analysis of clustering results,breaking the original performance analysis is limited,so that the existing data to reflect the better value,so as to assist the teaching managers to make corresponding decisions,to better improve the quality of teaching.

        Key Words:Data mining;K-means algorithm;Clustering analysis;Performance analysis

        在現(xiàn)代信息化被廣泛應(yīng)用的時(shí)代,在我們?nèi)粘=虒W(xué)中,面對(duì)錯(cuò)綜復(fù)雜的學(xué)生成績(jī)信息和各種各樣的學(xué)習(xí)方法和學(xué)習(xí)方式,針對(duì)學(xué)生不及格的課程成績(jī)信息群體,我們傳統(tǒng)的數(shù)據(jù)分析有一定的局限性,通常還是停留在簡(jiǎn)單的統(tǒng)計(jì)、查詢和匯總等層面,往往對(duì)這些數(shù)據(jù)背后的深一層原因無(wú)所了解,而聚類分析通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)這個(gè)數(shù)據(jù)群體進(jìn)行處理,通過(guò)聚類、劃分、分群,將有助于學(xué)校從堆積如山的數(shù)據(jù)中,發(fā)掘有利于教學(xué)的具有針對(duì)性的信息。利用聚類分析方法能從數(shù)據(jù)中找出相關(guān)的特征或模式,可以幫助學(xué)校針對(duì)不學(xué)生的學(xué)習(xí)狀況,制定針對(duì)性的教學(xué)策略,對(duì)學(xué)生信息聚類和分組可以幫助改善學(xué)生學(xué)習(xí)成績(jī),并且可以根據(jù)此數(shù)據(jù)信息預(yù)測(cè)將來(lái)的成績(jī)趨勢(shì),輔助學(xué)校進(jìn)行教學(xué)管理。

        1 聚類分析

        數(shù)據(jù)挖掘的方法中聚類是對(duì)記錄分組,把相似的記錄放在一個(gè)類別里。聚類和分類的區(qū)別是聚類不依賴于預(yù)先定義好的類,不需要訓(xùn)練集。

        聚類分析中,首先需要確定基本聚類分析原則,在各聚集內(nèi)部數(shù)據(jù)對(duì)象間之間,追求的是相似度最大化。而在各聚集對(duì)象之間,追求的是相似度最小化。在進(jìn)行聚類分析時(shí),聚類分析所獲得的組可視為同類別的歸屬,也可視為該類歸屬的數(shù)據(jù)對(duì)象集合。聚類分析已經(jīng)在模式識(shí)別圖像處理、市場(chǎng)分析和數(shù)據(jù)分析等領(lǐng)域得到了廣泛應(yīng)用。

        2 K-means聚類算法

        學(xué)生成績(jī)挖掘分析主要目標(biāo)是針對(duì)學(xué)生成績(jī)數(shù)據(jù)進(jìn)行聚類分析,挖掘出數(shù)據(jù)隱含的不同學(xué)生群體信息。而K-means聚類算法是數(shù)據(jù)挖掘基于劃分最經(jīng)典的聚類方法,也是易于實(shí)現(xiàn)的算法。主要思想是首先初始化K個(gè)聚類簇中心,使用一定的準(zhǔn)則將所有樣本點(diǎn)分到不同的K個(gè)簇中;接著計(jì)算現(xiàn)有的K個(gè)簇的質(zhì)心,確定新的簇心。一直循環(huán)迭代,直到簇心的移動(dòng)距離小于某個(gè)給定的閾值。如果初始簇心選擇不好時(shí),K—means的結(jié)果會(huì)很差,所以一般是多運(yùn)行幾次,按照一定標(biāo)準(zhǔn)選擇一個(gè)比較好的結(jié)果。

        K-means聚類算法的主要流程如下。

        (1)初始化K個(gè)聚類中心。

        (2)計(jì)算每個(gè)點(diǎn)到聚類中心的距離,將每個(gè)點(diǎn)劃分到離該點(diǎn)最近的類別中去。

        (3)更新個(gè)類別中所有點(diǎn)的坐標(biāo)均值,并將其作為新的聚類中心。

        (4)反復(fù)執(zhí)行(2)(3),直到聚類中心不再進(jìn)行大范圍移動(dòng)或者聚類次數(shù)達(dá)到要求為止。

        算法的流程圖如圖1所示。

        3 K-means聚類算法應(yīng)用

        在使用K-means聚類算法聚類分析之前,必須對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,信息數(shù)據(jù)預(yù)處后,才可以利用K-means聚類算法對(duì)處理后的成績(jī)數(shù)據(jù)聚類分析,最后將聚類結(jié)果可視化展示。

        3.1 數(shù)據(jù)預(yù)處理

        學(xué)生成績(jī)數(shù)據(jù)庫(kù)中,由于少數(shù)學(xué)生的個(gè)別錯(cuò)誤信息和虛假信息可能導(dǎo)致聚類中心偏移,從而對(duì)聚類結(jié)果產(chǎn)生影響。需要在研究各屬性值的總體分布后,刪除這些對(duì)聚類結(jié)果準(zhǔn)確性有所影響的部分極值。因此要對(duì)數(shù)據(jù)進(jìn)行清洗、去重和修正等操作。

        在進(jìn)行學(xué)生成績(jī)信息分析挖掘過(guò)程中,不是所有的屬性信息都和學(xué)生成績(jī)信息分析任務(wù)有關(guān),比如進(jìn)行學(xué)生聚類分析時(shí)的學(xué)生專業(yè)等屬性。因此,在進(jìn)行數(shù)據(jù)轉(zhuǎn)換過(guò)程中,把和學(xué)生成績(jī)數(shù)據(jù)分析挖掘不相關(guān)的屬性去除有助于提高數(shù)據(jù)挖掘的效率,節(jié)省分析挖掘時(shí)間,將與挖掘分析任務(wù)相關(guān)的數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換,對(duì)一些屬性值進(jìn)行數(shù)字量化,使得轉(zhuǎn)換后的數(shù)據(jù)更好地適合數(shù)據(jù)挖掘分析。

        此次數(shù)據(jù)源是以東莞理工學(xué)校2014級(jí)計(jì)算機(jī)專業(yè)學(xué)生成績(jī)?yōu)閿?shù)據(jù)源,選取2014級(jí)100名學(xué)生的8門課程成績(jī)數(shù)據(jù),經(jīng)過(guò)初步的一些修正和轉(zhuǎn)換,學(xué)生數(shù)據(jù)屬性包括:專業(yè)、年級(jí)、班級(jí)、學(xué)號(hào)、學(xué)習(xí)科目、學(xué)習(xí)課時(shí)、科目成績(jī)、學(xué)科評(píng)分等信息,學(xué)生成績(jī)數(shù)據(jù)部分信息如表1所示。

        3.2 K-means聚類算法應(yīng)用

        針對(duì)預(yù)處理后的學(xué)生成績(jī)數(shù)據(jù),使用聚類算法K—means進(jìn)行,分析挖掘不同學(xué)生群體類別信息,并將得到的挖掘結(jié)果輸入分析結(jié)果可視化模塊中進(jìn)行輸出展示。使用的學(xué)生成績(jī)數(shù)據(jù)信息是表1中的100條成績(jī)數(shù)據(jù)記錄,聚類分析的實(shí)驗(yàn)環(huán)境是通過(guò)SPSS軟件中的“K-均值聚類法”,給定聚類數(shù)為3,經(jīng)過(guò)信息數(shù)據(jù)預(yù)處理模塊、信息分析挖掘模塊、分析結(jié)果可視化模塊的處理,最終得到Cluster-A、Cluster-B和Cluster-C三種群體??傮w的類別信息如表2所示。

        經(jīng)過(guò)聚類,可以發(fā)現(xiàn),目前該學(xué)校的學(xué)生群體基本上可以分為A、B、C三類,每類學(xué)生群體有自己的類別屬性,表3是部分聚類詳細(xì)結(jié)果。

        3.3 聚類結(jié)果分析

        根據(jù)K-means聚類的結(jié)果分析可以看出,A類學(xué)生一共25個(gè),是屬于整個(gè)群體中優(yōu)秀的;C類學(xué)生一共37個(gè),是屬于整個(gè)群體比較差的;B類學(xué)生一共38個(gè),屬于A類和C類之間。從整個(gè)聚類結(jié)果分析,C類學(xué)生的比例和B類學(xué)生的比例相當(dāng),而且A類學(xué)生不足該群體1/3,優(yōu)秀學(xué)生所占比例較少,C類學(xué)生所占比例較大,這樣就給教師有一個(gè)預(yù)警作用,需要加強(qiáng)B類學(xué)生,需要有針對(duì)地制定策略幫助C類學(xué)生,提高他們的成績(jī)。

        通過(guò)表3觀察,A類學(xué)生群體中各種屬性值都是比較好的,說(shuō)明A類學(xué)生的各方面綜合素質(zhì)還是比較高的,C類學(xué)生的學(xué)習(xí)時(shí)長(zhǎng)和A類是同等的,那就說(shuō)明針對(duì)C類的學(xué)生他們同樣付出了,但是效果不好,那就可以有針對(duì)地進(jìn)行學(xué)習(xí)方法的輔導(dǎo),多元化幫助他們。而B(niǎo)類中大家可以觀察到他們的補(bǔ)考成績(jī)是差的,那就應(yīng)該對(duì)于B類學(xué)生加強(qiáng)他們對(duì)于補(bǔ)考的重視,提高他們補(bǔ)考成績(jī),從而不影響他們畢業(yè)和升學(xué)。

        4 結(jié)語(yǔ)

        通過(guò)介紹在大數(shù)據(jù)和信息化背景下,針對(duì)學(xué)生不及格數(shù)據(jù)信息進(jìn)行聚類分析。聚類分析目前已經(jīng)被廣泛地應(yīng)用于各個(gè)行業(yè),文章重點(diǎn)針對(duì)K-means聚類算法的主要思想和算法流程進(jìn)行闡述,同時(shí)基于K-means聚類算法挖掘的學(xué)生成績(jī)分析,通過(guò)每一類群體屬性的不同,學(xué)??梢灾贫ň哂嗅槍?duì)性的教學(xué)策略,促進(jìn)學(xué)生學(xué)習(xí)成績(jī)得改善和提高。

        參考文獻(xiàn)

        [1] 孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學(xué)報(bào),2008,19(1):48-61.

        [2] 譚慶.基于K-means聚類算法的分析研究[J].河南大學(xué)學(xué)報(bào),2009(4):412-415.

        [3] 廖文果,廖光萍.基于數(shù)據(jù)挖掘的圖書(shū)館創(chuàng)新服務(wù)研究[J].軟件導(dǎo)刊,2014(8):116-118.

        [4] 汪福成.可視化數(shù)據(jù)挖掘在水利工程管理中的使用[J].環(huán)球市場(chǎng)信息導(dǎo)報(bào),2015(39):74.

        猜你喜歡
        成績(jī)分析means算法聚類分析
        學(xué)生成績(jī)分析系統(tǒng)
        基于Apriori算法的高校學(xué)生成績(jī)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
        農(nóng)村居民家庭人均生活消費(fèi)支出分析
        基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
        基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
        科技視界(2016年20期)2016-09-29 12:32:48
        高職院校移動(dòng)互聯(lián)自主學(xué)習(xí)考試平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)
        基于K—Means聚類算法入侵檢測(cè)系統(tǒng)研究
        基于Weka的Apriori算法在原油產(chǎn)量預(yù)測(cè)中的應(yīng)用
        “縣級(jí)供電企業(yè)生產(chǎn)經(jīng)營(yíng)統(tǒng)計(jì)一套”表輔助決策模式研究
        基于HSI顏色空間的小麥粉精度自動(dòng)識(shí)別研究
        亚洲精品综合中文字幕组合| 精品国产网红福利在线观看| 加勒比日本东京热1区| 日韩字幕无线乱码免费| 久久精品国产亚洲av网| 吃奶呻吟打开双腿做受视频| 波多野结衣中文字幕久久| 国产乱人视频在线观看播放器| 亚洲熟女av一区少妇| 亚洲熟女精品中文字幕| 国产性生交xxxxx免费| 一本一本久久a久久精品综合| av有码在线一区二区三区| 99久久无码一区人妻| 欲色天天网综合久久| 久久精品熟女不卡av高清| 日本高清一区二区不卡| 成人一区二区免费中文字幕视频| 午夜无码片在线观看影院| 四虎无码精品a∨在线观看| 日本a爱视频二区三区| 蜜臀av999无码精品国产专区| 巨大欧美黑人xxxxbbbb| 亚洲av人片在线观看调教| 亚洲精品第一页在线观看| 亚洲日本一区二区一本一道| 亚洲国产成人无码影院| 日本一区二区午夜视频| 国产精品婷婷久久爽一下| 欧美日韩亚洲国产精品| 日日躁欧美老妇| 91偷拍与自偷拍亚洲精品86| 国产乱码精品一区二区三区四川人| 精品国产高清一区二区广区| 一区二区三区日韩毛片| 少妇被粗大的猛进出69影院| 又爽又黄禁片视频1000免费 | 欲妇荡岳丰满少妇岳| 挑战亚洲美女视频网站| 大香焦av一区二区三区| 日韩av精品国产av精品|