亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺析數(shù)據(jù)挖掘技術(shù)的概念及運行過程

        2017-05-31 05:14:04王子陽羅敦浪謝先恒李天夫
        魅力中國 2016年28期
        關(guān)鍵詞:數(shù)據(jù)挖掘概念

        王子陽++羅敦浪++謝先恒++李天夫

        摘 要:隨著當(dāng)前現(xiàn)代科技的發(fā)展,計算機在各方面都得到了廣泛的應(yīng)用,計算機給人們的生活帶來了翻天覆地的變化,人們對計算機的重視程度越來越高。但是應(yīng)該看到,計算機一方面帶來了巨大的便利條件,另一方面也帶來了很多問題,數(shù)據(jù)庫中積累下來海量的數(shù)據(jù),這些數(shù)據(jù)中往往隱藏著很多的重要信息。如果能夠?qū)@些數(shù)據(jù)進行深入的分析,并且從中找到潛在的規(guī)律,會對管理者決策起到非常大的作用。但是目前的數(shù)據(jù)分析工具還不能夠使?jié)M足深層次分析的需要,當(dāng)前從海量數(shù)據(jù)中挖掘出重要信息并為之所用,已成為一個新的研究課題。本文主要是在分析數(shù)據(jù)挖掘技術(shù)概念的基礎(chǔ)上,分析了數(shù)據(jù)挖掘的運行過程。

        關(guān)鍵詞:數(shù)據(jù)挖掘 概念 運行過程

        一、數(shù)據(jù)挖掘的概念與分類

        1、數(shù)據(jù)挖掘技術(shù)的概念

        隨著現(xiàn)代科技的迅猛發(fā)展,計算機數(shù)據(jù)管理系統(tǒng)在社會各方面都得到了廣泛的應(yīng)用,尤其是關(guān)系數(shù)據(jù)庫系統(tǒng)已成為了當(dāng)前事務(wù)處理的強有力工具。人類在更廣泛的領(lǐng)域內(nèi)應(yīng)用數(shù)據(jù)庫技術(shù),加大了對空間數(shù)據(jù)庫、工程數(shù)據(jù)庫、時間數(shù)據(jù)庫、統(tǒng)計數(shù)據(jù)庫等的研究和應(yīng)用,這使得越來越多的數(shù)據(jù)在數(shù)據(jù)庫中被積累下來。就目前來講,計算機數(shù)據(jù)庫可以高效完成的工作有:數(shù)據(jù)的查詢、收錄以及統(tǒng)計等,還不能夠從眾多的信息中挖掘出來有效信息,以找出數(shù)據(jù)中潛藏的規(guī)律,同時也不能夠利用現(xiàn)有的數(shù)據(jù)資源對未來發(fā)展趨勢進行科學(xué)預(yù)測。正是因為缺乏挖掘數(shù)據(jù)背后隱藏的知識手段,結(jié)果導(dǎo)致了現(xiàn)代信息技術(shù)中“數(shù)據(jù)爆炸但知識缺乏”的現(xiàn)象,于是數(shù)據(jù)挖掘應(yīng)運而生。 數(shù)據(jù)挖掘具有廣闊的應(yīng)用和發(fā)展前景,是數(shù)據(jù)庫研究、開發(fā)和應(yīng)用最活躍的分支之一。

        數(shù)據(jù)挖掘簡稱DM,也被稱為數(shù)據(jù)庫中只是發(fā)現(xiàn)。從上個世紀(jì)90年代,數(shù)據(jù)挖掘技術(shù)就迅速發(fā)展起來。所謂數(shù)據(jù)挖掘就是指將事先隱藏在數(shù)據(jù)中的、有重大價值的而又未被發(fā)現(xiàn)的信息從大量數(shù)據(jù)中挖掘并提取出來的過程。數(shù)據(jù)挖掘出的內(nèi)容應(yīng)該是使用者有興趣的信息,而且應(yīng)該是大家容易接受的信息,同時這些信息容易被理解分析和再運用;挖掘的目標(biāo)數(shù)據(jù)應(yīng)該是大量的現(xiàn)實中存在的有效數(shù)據(jù);數(shù)據(jù)挖掘所挖掘的對象也是多種多樣的,它可以是文本、圖像和圖形等半結(jié)構(gòu)化的數(shù)據(jù),也可以是關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)等結(jié)構(gòu)化的數(shù)據(jù),同時還可以是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。一般可以把數(shù)據(jù)挖掘發(fā)現(xiàn)的知識分為“概念、模式、規(guī)律、規(guī)則等幾種形式。這些知識可以以新知識的形式轉(zhuǎn)存到相應(yīng)的系統(tǒng)知識存儲機構(gòu)中,相關(guān)的專家領(lǐng)域可以用其來修正原有的知識體系,同時決策者可以用這些知識來輔助決策過程?!?由此我們可以看到數(shù)據(jù)挖掘是門交叉學(xué)科,涉及到數(shù)據(jù)庫、數(shù)理統(tǒng)計、機器學(xué)習(xí)、模式識別、神經(jīng)網(wǎng)絡(luò)、粗糙集和模糊集等相關(guān)技術(shù),數(shù)據(jù)挖掘采用的主要方法有關(guān)聯(lián)規(guī)則、遺傳算法、模糊論方法、決策樹方法、人工神經(jīng)網(wǎng)絡(luò)、粗糙集方法、貝葉斯模型等;數(shù)據(jù)挖掘過程中涉及到數(shù)據(jù)清理、數(shù)據(jù)采集、數(shù)據(jù)變換、數(shù)據(jù)分析、數(shù)據(jù)挖掘以及數(shù)據(jù)結(jié)果表示等一系列環(huán)節(jié)。

        通常情況下,人們把信息和數(shù)據(jù)看作是知識的表現(xiàn)形式,而實際上我們更應(yīng)該重視概念、規(guī)則、模式以及約束等。數(shù)據(jù)挖掘把原來對知識的簡單應(yīng)用擴展到了對知識信息的深度提取和運用。在學(xué)生成績管理系統(tǒng)中,挖掘現(xiàn)有的學(xué)生信息數(shù)據(jù)庫,提取那些對學(xué)生成績有影響的屬性信息,進行綜合分析,幫助學(xué)??茖W(xué)合理地制定教學(xué)計劃。隨著此類應(yīng)用需求的不斷增加,各領(lǐng)域?qū)W者都積極投身于數(shù)據(jù)挖掘這門前沿學(xué)科的研究,尤其是人工智能、計算機數(shù)據(jù)庫以及數(shù)理統(tǒng)計等方面的學(xué)者。我們知道現(xiàn)實中的數(shù)據(jù)分為三種:結(jié)構(gòu)化的、半結(jié)構(gòu)化的、還有異構(gòu)型的,現(xiàn)在學(xué)校里存儲的學(xué)生信息一般都會采用其中的一種類型。數(shù)據(jù)挖掘的知識可以應(yīng)用到學(xué)生基本信息和學(xué)校管理決策方面的管理和數(shù)據(jù)查詢與優(yōu)化,同時也可以應(yīng)用到數(shù)據(jù)庫自身的維護方面。總之,在學(xué)校管理方面數(shù)據(jù)挖掘的應(yīng)用前景是非常廣闊的。

        2、數(shù)據(jù)挖掘技術(shù)的分類

        數(shù)據(jù)挖掘可以根據(jù)不同的標(biāo)準(zhǔn)作出不同的分類。按照數(shù)據(jù)挖掘功能可以將數(shù)據(jù)挖掘分為兩大類:預(yù)測性挖掘和描述性挖掘。按照數(shù)據(jù)庫類型,數(shù)據(jù)挖掘可以分為面向?qū)ο髷?shù)據(jù)挖掘、有關(guān)系數(shù)據(jù)庫挖掘、多媒體數(shù)據(jù)庫的數(shù)據(jù)挖掘、事務(wù)數(shù)據(jù)庫的數(shù)據(jù)挖掘、數(shù)據(jù)倉庫的數(shù)據(jù)挖掘以及模糊數(shù)據(jù)挖掘等等多種類型的數(shù)據(jù)挖掘。按照數(shù)據(jù)挖掘?qū)ο髮?shù)據(jù)挖掘進行分類,主要可以分為數(shù)據(jù)庫數(shù)據(jù)挖掘、多媒體數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘、以及文本數(shù)據(jù)挖掘等。按照數(shù)據(jù)挖掘的任務(wù)進行分類,可以分為序列模式挖掘、關(guān)聯(lián)規(guī)則挖掘、分類數(shù)據(jù)挖掘、預(yù)測挖掘、聚類數(shù)據(jù)挖掘和偏差分析挖掘等類型。按照數(shù)據(jù)挖掘的技術(shù)和方法分類,數(shù)據(jù)挖掘可以分為統(tǒng)計分析類、歸納學(xué)習(xí)類、模糊數(shù)學(xué)類、聚類方法類、放生物技術(shù)類以及可視化技術(shù)類等。

        二、數(shù)據(jù)挖掘的基本運行過程

        數(shù)據(jù)挖掘中首先要確定需要解決的目標(biāo),了解挖掘該目標(biāo)的背景以及工作的業(yè)務(wù)流程。這樣才能夠充分發(fā)揮出挖掘的作用,提取最有價值的信息。問題定義的如何對數(shù)據(jù)模型建立的好壞有著直接關(guān)系,所以一定要做好這一步驟。

        數(shù)據(jù)挖掘的第二步就是建立模型,把待挖掘的數(shù)據(jù)存儲到大型數(shù)據(jù)庫中,然后在此數(shù)據(jù)庫基礎(chǔ)上建立數(shù)據(jù)倉庫,建立各種統(tǒng)計查詢、圖表以及挖掘模型等等。其中這些挖掘數(shù)據(jù)不需要挖掘者自己開發(fā),而是這些挖掘模型自身數(shù)據(jù)庫系統(tǒng)提供的,所以只需要建立數(shù)據(jù)庫就行。

        數(shù)據(jù)挖掘的第三步就是數(shù)據(jù)分析環(huán)節(jié),對數(shù)據(jù)進行分析其目的就是為了找出預(yù)測中有影響力的因素,然后整合這些影響力因素,并且找出關(guān)鍵影響因素。最終通過對各因素的影響力的分析,得出一個更有分析價值的影響因素。

        數(shù)據(jù)挖掘的第四個環(huán)節(jié)就是準(zhǔn)備數(shù)據(jù)環(huán)節(jié),該環(huán)節(jié)主要包括選擇原始數(shù)據(jù)、提前處理目標(biāo)數(shù)據(jù)、整合綜合數(shù)據(jù)等三個方面的工作。數(shù)據(jù)的選擇是指準(zhǔn)備所有待挖掘數(shù)據(jù)集中屬性和相關(guān)數(shù)據(jù)等,選擇出來重要的數(shù)據(jù)集。然后就是對數(shù)據(jù)進行分析,對數(shù)據(jù)集中的數(shù)據(jù)進行過濾、離散化、填補等,從而分析出更有價值的信息,這就是提前處理目標(biāo)數(shù)據(jù)環(huán)節(jié);接著就是數(shù)據(jù)的整合環(huán)節(jié),這個環(huán)節(jié)的主要工作就是把現(xiàn)有的數(shù)據(jù)集整合為一個可以適應(yīng)挖掘算法需要的分析模型數(shù)據(jù)集。

        數(shù)據(jù)挖掘的第五步就是模型選擇的環(huán)節(jié),根據(jù)數(shù)據(jù)特點選擇合適的挖掘算法,包括決策樹算法、神經(jīng)網(wǎng)絡(luò)算法、分類分析、聚類分析等。對于那些數(shù)據(jù)集中的數(shù)據(jù)還要進行相應(yīng)的轉(zhuǎn)化。

        數(shù)據(jù)挖掘的第六步就是數(shù)據(jù)挖掘環(huán)節(jié),驗證決策的正確性,這一步要把前面步驟所得出的相關(guān)信息運用到各項業(yè)務(wù)流程中去。數(shù)據(jù)挖掘的核心是模式發(fā)現(xiàn),充分利用數(shù)據(jù)挖掘方法分析經(jīng)過轉(zhuǎn)換得到的數(shù)據(jù),探索出一個特定的數(shù)據(jù)集或者感興趣的模式。

        數(shù)據(jù)挖掘的第七步就是進行結(jié)果分析,采取有效措施對挖掘結(jié)果進行分析驗證,保證發(fā)現(xiàn)模式的正確性。剔除冗余或者無關(guān)鍵的模式,對于不能滿足用戶要求的模式要重新進行數(shù)據(jù)選取,甚至要更換一種挖掘算法。

        數(shù)據(jù)挖掘的第八個環(huán)節(jié)就是知識表示,要對發(fā)現(xiàn)的模式進行可視化,表示轉(zhuǎn)化為一種用戶易懂的形式,例如可以把分類決策樹轉(zhuǎn)換為“if-then”的形式。

        參考文獻:

        [ ]姚雙良.數(shù)據(jù)挖掘在高校成績分類管理中的應(yīng)用研究[J]. 江蘇科技大學(xué)學(xué)報(社會科學(xué)版). 2011(02),第37頁

        [ ]宋虎森.數(shù)理統(tǒng)計方法在學(xué)生成績管理中的應(yīng)用[J]. 長治學(xué)院學(xué)報. 2006(05),第26頁

        [1] 姚雙良.數(shù)據(jù)挖掘在高校成績分類管理中的應(yīng)用研究[J]. 江蘇科技大學(xué)學(xué)報(社會科學(xué)版). 2011(02)

        [2] 許曉潔.數(shù)據(jù)挖掘技術(shù)在高校學(xué)生信息管理系統(tǒng)中的應(yīng)用[J]. 中國科教創(chuàng)新導(dǎo)刊. 2010(22)

        [3] 路川,王靜靜,胡欣杰,馬含.數(shù)據(jù)挖掘在高校教學(xué)管理中的應(yīng)用研究[J]. 電腦開發(fā)與應(yīng)用. 2010(01)

        猜你喜歡
        數(shù)據(jù)挖掘概念
        Birdie Cup Coffee豐盛里概念店
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        幾樣概念店
        學(xué)習(xí)集合概念『四步走』
        聚焦集合的概念及應(yīng)用
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        論間接正犯概念之消解
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        概念的限制
        试看男女炮交视频一区二区三区| 亚洲欧美日韩人成在线播放| 国产一级二级三级在线观看视频| 蜜桃成熟时在线观看免费视频| 97在线视频人妻无码| 国内熟女啪啪自拍| 边啃奶头边躁狠狠躁| 无码精品a∨在线观看十八禁 | 九九精品国产亚洲av日韩| 一本大道道久久综合av| 国产三级在线观看完整版| 国产人妻久久精品二区三区老狼| 国产熟妇人妻精品一区二区动漫| 日韩a∨精品日韩在线观看| 天天狠天天透天干天天| 永久免费毛片在线播放| 蜜臀av一区二区三区精品| 久久一区二区av毛片国产| 国产成人自拍高清在线| 亚洲av麻豆aⅴ无码电影| 国产精品爽爽va在线观看无码| 中文字幕一区二区人妻出轨| 午夜婷婷国产麻豆精品 | 亚洲中文字幕乱码一二三区| 麻美由真中文字幕人妻| av一区二区在线免费观看| 华人免费网站在线观看| 国产精品一区二区无线| 四虎精品国产一区二区三区| av东京热一区二区三区| 亚洲国产精品一区二区成人av| 色偷偷噜噜噜亚洲男人| 国产人成精品综合欧美成人| 久久老子午夜精品无码| 人妻av不卡一区二区三区| 久久久国产精品无码免费专区 | 在线观看精品视频网站| 美女自卫慰黄网站| 亚洲AV无码永久在线观看| 国产黄片一区二区三区| 亚洲字幕中文综合久久|