亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘技術及其應用

        2016-05-14 08:44:07楊筱平徐馳
        電子技術與軟件工程 2016年6期
        關鍵詞:學生成績數(shù)據(jù)挖掘大數(shù)據(jù)

        楊筱平 徐馳

        摘 要數(shù)據(jù)挖掘技術作為一項數(shù)據(jù)分析工具,已經在多個行業(yè)領域得到廣泛應用,極大的促進了各領域的生產效率和管理效率。本文主要對數(shù)據(jù)挖掘技術的相關理論概念進行了簡要介紹,然后以學生成績分析為例,對該項技術的應用進行分析,希望能對教育管理者和教學人員提供一定參考。

        【關鍵詞】數(shù)據(jù)挖掘 大數(shù)據(jù) 教育 學生成績

        1 數(shù)據(jù)挖掘技術基礎理論分析

        1.1 涵義分析

        數(shù)據(jù)挖掘是集合人工智能、數(shù)據(jù)庫、機器學、統(tǒng)計學、數(shù)學等多個學科的一門交叉性學科,該學科不僅能為商業(yè)性企業(yè)提供決策依據(jù),解決發(fā)展困境,還能為管理者優(yōu)化管理方案提供參考。數(shù)據(jù)挖掘技術就是對數(shù)據(jù)信息進行提取、處理、分析和轉化,以期從海量、雜亂的數(shù)據(jù)信息中發(fā)現(xiàn)隱藏的規(guī)律,從而為企業(yè)或用戶制定科學的決策提供參考。

        1.2 數(shù)據(jù)挖掘實施流程

        數(shù)據(jù)挖掘過程是根據(jù)數(shù)據(jù)特征建立模型,然后通過科學檢驗,發(fā)現(xiàn)模型和數(shù)據(jù)之間規(guī)模的一系列活動,具體來說就是確定分析對象,對數(shù)據(jù)進行預處理,選擇合適的數(shù)據(jù)分析方法進行數(shù)據(jù)處理,將分析結果進行可視化展現(xiàn)等,以下將對各個環(huán)節(jié)進行詳細分析。

        1.2.1 數(shù)據(jù)準備

        從操作上來說,數(shù)據(jù)準備階段主要執(zhí)行的操作時數(shù)據(jù)選取、數(shù)據(jù)清洗和數(shù)據(jù)轉化三相工作,具體來說就是選擇數(shù)據(jù)源,確定數(shù)據(jù)挖掘處理的對象,根據(jù)實際需求從海量數(shù)據(jù)中選擇所需要處理的數(shù)據(jù)內容,生成目標數(shù)據(jù);目標數(shù)據(jù)多為原始數(shù)據(jù),可能會存在數(shù)據(jù)不全、數(shù)據(jù)污染等異常情況。為確保數(shù)據(jù)挖掘效果,需要對目標數(shù)據(jù)進行清洗,就是通過一系列操作補全殘缺數(shù)據(jù)、消除不合理數(shù)據(jù),使其轉為凈化數(shù)據(jù)待用。

        1.2.2 數(shù)據(jù)挖掘

        這一階段的工作主要是根據(jù)數(shù)據(jù)特征設定數(shù)據(jù)集合屬性,將不參與算法的字段進行處理,然后將其他參與算法的字段看作一個新的數(shù)據(jù)集合;數(shù)據(jù)集合屬性設定完畢后,需要根據(jù)數(shù)據(jù)挖掘的目的和業(yè)務需求選擇合適的算法。

        1.2.3 結果可視化呈現(xiàn)

        數(shù)據(jù)分析處理結束后產生的結果不利于用戶直接使用,需要將其進行轉化,然后通過可視化手段將其進行展現(xiàn),為用戶決策或管理工作改進提供參考。

        1.3 關鍵技術介紹

        數(shù)據(jù)挖掘技術雖是一項新興的數(shù)據(jù)處理技術,但其發(fā)展速度十分迅猛,至今已經形成了決策樹、神經網(wǎng)絡、統(tǒng)計學習、聚類分析、關聯(lián)規(guī)則等多項數(shù)據(jù)挖掘技術,極大的滿足了用戶的需求。

        1.3.1 決策樹算法

        決策樹算法是分類和預測的常用技術之一,可用于深入分析分類問題,使用時,決策樹能夠利用預測理論對多個變量中進行分析,從而預測處任一變量的發(fā)展趨勢和變化關系;除此以外,還能對變量發(fā)展趨勢進行雙向預測,既能進行正向預測,也能進行反向預測,因此具有方便靈活的優(yōu)勢。

        1.3.2 神經網(wǎng)絡算法

        神經網(wǎng)絡是將計算機技術與現(xiàn)代神經生物學結合的產物,該技術是通過模擬人腦信息處理機制,對數(shù)值數(shù)據(jù)進行處理,并在處理過程中表現(xiàn)出一種思維、學習和記憶能力。神經網(wǎng)絡有多種分類方式,若按照互聯(lián)結構分,可分為以下四種,如圖1所示。由結構示意圖可知,神經網(wǎng)絡能對大規(guī)模數(shù)據(jù)進行處理,且容錯能力強,具有很好的自組織和自適應能力,在解決非線性復雜問題方面具有較高的優(yōu)勢。

        1.3.3 統(tǒng)計學習

        統(tǒng)計學習是一種預測方法,該法是對數(shù)據(jù)進行深入分析,找出不能通過的規(guī)律,然后對所發(fā)現(xiàn)的規(guī)律進一步研究和分析,并結合實際情況對數(shù)據(jù)發(fā)展趨勢進行預測。由此可見,統(tǒng)計學習能對人類無法確認的事務進行預測,這對了解進一步了解世界,探索未知事物具有重要意義。

        1.3.4 聚類分析法

        聚類分析作為一種非參數(shù)分析方法,可對樣本分組中多為數(shù)據(jù)點間的差異及關聯(lián)進行分析,使用該法時,無需對數(shù)據(jù)進行總體假設,也不需要受數(shù)理依據(jù)等原則的限制,只需要通過數(shù)據(jù)搜集、數(shù)據(jù)轉換兩個步驟,就能完成聚類分析的全過程。聚類分析能對數(shù)據(jù)的分布情況進行分析,還能對數(shù)據(jù)分布的局勢進行快捷分析,準確識別出密集和系數(shù)區(qū)域;另外,聚類分析對單類的數(shù)據(jù)同樣具有超強的分析能力,可對每個類的數(shù)據(jù)進行深入分析,發(fā)現(xiàn)其特征,找出變量和類之間的內在關聯(lián)性?;诰垲惙治鲈砘A上的方法很多,如層次法、密度分析法和網(wǎng)絡法就是最常用的聚類分析方法。

        1.3.5 關聯(lián)規(guī)則法

        關聯(lián)規(guī)則的主要優(yōu)勢是能對數(shù)據(jù)與數(shù)據(jù)之間的依賴關系進行準確描述,該技術能對給定事物數(shù)據(jù)庫進行深入分析,尋找各數(shù)據(jù)和項目之間的內在聯(lián)系,然后將所有符合支持度和置信度的,符合一定標準的關聯(lián)規(guī)則進行羅列。關聯(lián)規(guī)則算法的典型代表是FP-Tree算法,經過實驗證明,該算法在處理數(shù)據(jù)關系方面具有十分強大的優(yōu)勢。

        2 數(shù)據(jù)挖掘技術的應用

        近年來,數(shù)據(jù)挖掘技術得到了飛躍式發(fā)展,其應用領域也涉及到商業(yè)零售、電信數(shù)據(jù)分析、金融數(shù)據(jù)分析、生物醫(yī)學分析、教育管理分析等多個領域。隨著各行各業(yè)信息化建設的不斷完善,大量的信息數(shù)據(jù)為數(shù)據(jù)挖掘技術的應用提供了基礎和保障。本文將以教學為例,利用數(shù)據(jù)挖掘技術對學生學習成績進行深入分析。

        2.1 數(shù)據(jù)挖掘在教育教學中應用的可行性分析

        數(shù)據(jù)驅動學校,分析變革教育的大數(shù)據(jù)時代已經帶來,利用數(shù)據(jù)挖掘技術對教育領域的相關數(shù)據(jù)進行分析,探索教育變量之間的關系,為教育教學的科學決策提供有力支撐,已經成為教育發(fā)展的趨勢之一。大數(shù)據(jù)時代的到來,將掀起人類教與學的又一次變革。對此,美國國家教育部于2012年就已經發(fā)布了《通過教育數(shù)據(jù)挖掘和學習分析促進教與學》的報告。報告中,列舉了大數(shù)據(jù)教育應用的案例、領域、應用中所面臨的困難以及應采取的態(tài)度和對策等。

        計算機技術和互聯(lián)網(wǎng)技術在我國起步較晚,但發(fā)展迅速,尤其是近幾年“互聯(lián)網(wǎng)+”時代的到來,極大的促進了各行各業(yè)的發(fā)展。互聯(lián)網(wǎng)的發(fā)展同樣會促進學校信息化的建設,加強教育教學領域的大數(shù)據(jù)研究和應用分析,具有重要的實踐意義。教育學者在信息技術和網(wǎng)絡技術的影響下,逐漸加大了對數(shù)據(jù)挖掘技術的研究力度,通過一系列研究,就“國家和地方應在技術層面、管理體制、法律制度上加大對大數(shù)據(jù)研究和應用力度,按照發(fā)展現(xiàn)狀及未來規(guī)劃,整合現(xiàn)有資源,發(fā)揮后勁優(yōu)勢,真正推動我國教育教學工作的改革進程。大數(shù)據(jù)給各個行業(yè)的發(fā)展帶來的變革和挑戰(zhàn)是前所未有的,就教育行業(yè)而言,教師的教學行為、學生的學習活動、教學管理工作、科學研究等數(shù)據(jù)都能為學校領導者制定決策提供依據(jù),數(shù)據(jù)挖掘技術在教育教學領域具有廣泛應用價值。

        2.2 數(shù)據(jù)挖掘技術對學生成績的分析

        在教學領域,學習分析是其中最為重要的組成部分。學習分析就是收集與學習者有關的信息數(shù)據(jù),然后構建數(shù)據(jù)模型,從中發(fā)現(xiàn)數(shù)據(jù)中隱含的規(guī)律;還可利用該技術對學習者的行為表現(xiàn)進行分析,根據(jù)學生表現(xiàn)制定合適的學習計劃,提高學生的學習效率;總之,學習分析是涉及到社會學、心理學、計算機科學和信息技術等多種學科的一種理論方法,是利用海量數(shù)據(jù)的收集、分析、處理,發(fā)現(xiàn)影響學習者學校結果的因素,評價學生學習情況,根據(jù)分析反饋結果,對教學內容、教學計劃和教學方式進行調整和改進,以此推進教學和學習的整體效率。

        2.3 數(shù)據(jù)挖掘技術應用過程

        2.3.1 數(shù)據(jù)選取

        數(shù)據(jù)是數(shù)據(jù)挖掘的基礎,也是整個數(shù)據(jù)挖掘流程中耗費時間和精力最多的環(huán)節(jié),大概占整個數(shù)據(jù)挖掘項目的60%-80%。在這一環(huán)節(jié)中,若數(shù)據(jù)類型沒有完成轉換,則數(shù)據(jù)類型與模型中的算法匹配度就會受到影響;數(shù)據(jù)中存在的噪聲過多或不完整度過高,就會影響模型的準確性,由此可見,數(shù)據(jù)選取工作具有十分重要的地位,應對其引起足夠的重視。數(shù)據(jù)質量越高,越有利于實現(xiàn)挖掘目標,分析出來后所得出的規(guī)律結論更可靠。

        2.3.2 數(shù)據(jù)挖掘過程

        學生成績數(shù)據(jù)可通過學校教學平臺獲取,其挖掘過程如下:

        (1)數(shù)據(jù)準備階段。首先,先數(shù)據(jù)導入操作,選擇類型為Excel表格后,執(zhí)行查詢操作。然后,對數(shù)據(jù)進行清理。將原始數(shù)據(jù)中異常數(shù)據(jù)、噪聲數(shù)據(jù)或不合理數(shù)據(jù)進行清除;對不完整數(shù)據(jù)進行字段補償,待數(shù)據(jù)符合數(shù)據(jù)挖掘要求后,將其導入數(shù)據(jù)庫。最后,數(shù)據(jù)轉換。將以百分制記錄的原始數(shù)據(jù)分為1-10個檔次的成績備用。

        (2)數(shù)據(jù)挖掘階段。本文選擇決策樹為算法,對學生成績進行數(shù)據(jù)挖掘。首先定義成績字段及其含義,可見表1所示。

        本文以《C語言程序設計》、《Java應用》、《計算機網(wǎng)絡》和《操作系統(tǒng)》四門課程學生成績?yōu)檠芯繉ο?,根?jù)研究目的構建決策樹,對目標數(shù)據(jù)進行計算,然后將處理結果通過轉化形成可視化知識。

        (3)數(shù)據(jù)可視化呈現(xiàn)及解釋。將分析結果進行轉化后,形成如圖2和圖3的關系圖。

        以上四門課程中,《C語言程序設計》成績較好時,《操作系統(tǒng)》對《計算機網(wǎng)絡》的影響較大;而《C語言程序設計》學習成績一般時(90分以下),《Java應用》對《計算機網(wǎng)絡》的影響較大。針對以上分析結果,可對教學管理提出如下建議:《C語言程序設計》這門課程較為重要,應該適當增加課時,盡量保證每周可開設六個學時,而且要確保每周都有實踐課,提高學生動手操作的能力;《操作系統(tǒng)》這門課對其他課程的影響不大,可相應減少課時;網(wǎng)站開發(fā)是以《Java應用》課程為基礎的,而且該學科也是學習其他編程語言的基礎,應該適當增加總課時數(shù)和實踐活動;《C語言程序設計》與《Java應用》課程可以結合在一起上,學完《C語言程序設計》課程后就可繼續(xù)學習《Java應用》,不需等到下一新學期再上。

        3 結語

        數(shù)據(jù)挖掘技術在分析海量數(shù)據(jù),尋找數(shù)據(jù)內隱含規(guī)律方面具有明顯優(yōu)勢,通過數(shù)據(jù)挖掘分析,能為使用者科學決策,減少失誤提供技術保障;該技術的應用還能促進教學工作的有效性,提升教學質量,促進學生學習成績的進步。

        參考文獻

        [1]崔廣風.數(shù)據(jù)挖掘中的統(tǒng)計方法及其應用研究[D].四川:西南石油大學,2014.

        [2]黃雯.數(shù)據(jù)挖掘算法及其應用研究[D].南京:南京郵電大學,2013.

        [3]吳澤曦.數(shù)據(jù)挖掘技術及其在車輛監(jiān)控系統(tǒng)中的應用[D].北京:北京郵電大學,2015.

        作者單位

        天水師范學院電子信息與電氣工程學院 甘肅省天水市 741001

        猜你喜歡
        學生成績數(shù)據(jù)挖掘大數(shù)據(jù)
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        淺析數(shù)據(jù)挖掘技術在學生管理系統(tǒng)中的應用
        東方教育(2016年20期)2017-01-17 20:57:58
        高職數(shù)學分層教學學生成績評價的數(shù)學模型
        藝術科技(2016年9期)2016-11-18 15:47:50
        基于大數(shù)據(jù)背景下的智慧城市建設研究
        科技視界(2016年20期)2016-09-29 10:53:22
        Excel+VBA開發(fā)之《學生成績管理系統(tǒng)》的設計與實現(xiàn)
        基于MATLAB轉置矩陣的學生學習成績預警快速算法
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        色婷婷亚洲精品综合影院| 女同另类一区二区三区| 少妇被黑人嗷嗷大叫视频| 国产太嫩了在线观看| 内射中出无码护士在线| 亚洲无AV码一区二区三区| 亚洲女人毛茸茸的视频| 亚洲国产精品成人精品无码区在线| 日本japanese少妇高清| 久热香蕉av在线爽青青| 亚洲一区久久蜜臀av| 欧美国产激情二区三区| 亚洲日韩精品欧美一区二区一| 最新在线观看精品国产福利片| av高潮一区二区三区| 放荡的少妇2欧美版| 国产欧美日韩视频一区二区三区| 在线视频一区二区亚洲| 美女扒开内裤让我捅的视频| 亚洲av无码一区二区三区人| 欧美一级特黄AAAAAA片在线看| 午夜精品一区二区三区av免费| 在线观看一级黄片天堂| 精品无码中文字幕在线| 人妻人妻少妇在线系列| 亚洲精品中文字幕乱码| 日韩精品久久无码中文字幕| 久久免费视频国产| 午夜av福利亚洲写真集| 精品卡一卡二乱码新区| 国产69精品久久久久9999| 亚洲va成无码人在线观看| 亚洲中文字幕久久精品色老板| 亚洲国产精品ⅴa在线观看| AV永久天堂网| 亚洲av中文字字幕乱码软件| 欧美大屁股xxxx高潮喷水| 中文字幕+乱码+中文字幕无忧| 成在线人免费视频播放| 成人影院在线视频免费观看| 亚洲国产激情一区二区三区|