亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        論數(shù)據(jù)挖掘及應(yīng)用研究

        2013-05-14 06:45:53王萍
        卷宗 2013年2期
        關(guān)鍵詞:數(shù)據(jù)挖掘應(yīng)用研究

        王萍

        摘 要:隨著社會(huì)信息化不斷進(jìn)步發(fā)展,大量的信息充斥在我們的社會(huì)中,這就要求我們能從中及時(shí)發(fā)現(xiàn)有用的知識(shí),做出正確的分析,從而提高決策的正確性。就是在這樣的背景下深入地分析數(shù)據(jù)挖掘的基本概念、挖掘流程及挖掘技術(shù),討論數(shù)據(jù)挖掘的一些具體應(yīng)用。

        關(guān)鍵詞:數(shù)據(jù)挖掘;應(yīng)用;研究

        一 、數(shù)據(jù)挖掘

        隨著數(shù)據(jù)庫(kù)技術(shù)的廣泛使用,以及計(jì)算技術(shù)和計(jì)算機(jī)性能與網(wǎng)絡(luò)的迅速發(fā)展,人們面臨著一個(gè)困難的問(wèn)題,即如何從海量的數(shù)據(jù)中提取出有價(jià)值的信息。查詢(xún)功能遠(yuǎn)不能滿足人們的需要,數(shù)據(jù)挖掘應(yīng)運(yùn)而生。有人將數(shù)據(jù)挖掘定義為一個(gè)從數(shù)據(jù)及數(shù)據(jù)庫(kù)中抽取隱含的,先前未知的并有潛在價(jià)值的信息的過(guò)程。但有人認(rèn)為數(shù)據(jù)挖掘,即數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是從大數(shù)據(jù)集中快速高效地發(fā)現(xiàn)令人感興趣的規(guī)則,數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)研究的新領(lǐng)域,所挖掘的知識(shí)能夠用于信息、管理、查詢(xún)處理、決策支持和過(guò)程控制等等。

        數(shù)據(jù)挖掘(DataMining)是通過(guò)分析每個(gè)數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要有數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示三個(gè)步驟。隨著計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展和普遍使用,數(shù)據(jù)挖掘成為迫切需要研究的重要

        課題。

        數(shù)據(jù)挖掘涉及多個(gè)學(xué)科方向,主要包括:數(shù)據(jù)庫(kù)、統(tǒng)計(jì)學(xué)和人工智能等。數(shù)據(jù)挖掘可按數(shù)據(jù)庫(kù)類(lèi)型、挖掘?qū)ο?、挖掘任?wù)、挖掘方法與技術(shù)以及應(yīng)用等幾方面進(jìn)行分類(lèi)。按數(shù)據(jù)庫(kù)類(lèi)型分類(lèi):關(guān)系數(shù)據(jù)挖掘、模糊數(shù)據(jù)挖掘、歷史數(shù)據(jù)挖掘、空間數(shù)據(jù)挖掘等多種不同數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘類(lèi)型。按數(shù)據(jù)挖掘?qū)ο蠓诸?lèi):文本數(shù)據(jù)挖掘、多媒體數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘。按數(shù)據(jù)挖掘的任務(wù)有:關(guān)聯(lián)分析、時(shí)序模式、聚類(lèi)、分類(lèi)、偏差檢測(cè)、預(yù)測(cè)等。按數(shù)據(jù)挖掘方法和技術(shù)分類(lèi):歸納學(xué)習(xí)類(lèi)、仿生物技術(shù)類(lèi)、公式發(fā)現(xiàn)類(lèi)、統(tǒng)計(jì)分析類(lèi)、模糊數(shù)學(xué)類(lèi)、可視化技術(shù)類(lèi)。

        二、數(shù)據(jù)挖掘的主要任務(wù)

        (一)數(shù)據(jù)總結(jié)

        數(shù)據(jù)總結(jié)目的是對(duì)數(shù)據(jù)進(jìn)行濃縮,給出它的總體綜合描述。通過(guò)對(duì)數(shù)據(jù)的總結(jié),數(shù)據(jù)挖掘能夠?qū)?shù)據(jù)庫(kù)中的有關(guān)數(shù)據(jù)從較低的個(gè)體層次抽象總結(jié)到較高的總體層次上,從而實(shí)現(xiàn)對(duì)原始基本數(shù)據(jù)的總體把握。

        (二)分類(lèi)

        分類(lèi)的主要功能是學(xué)會(huì)一個(gè)分類(lèi)函數(shù)或分類(lèi)模型(也常常稱(chēng)作分類(lèi)器),該模型能夠根據(jù)數(shù)據(jù)的屬性將數(shù)據(jù)分派到不同的組中。即:分析數(shù)據(jù)的各種屬性,并找出數(shù)據(jù)的屬性模型,確定哪些數(shù)據(jù)屬于哪些組。這樣我們就可以利用該模型來(lái)分析已有數(shù)據(jù),并預(yù)測(cè)新數(shù)據(jù)將屬于哪一個(gè)組。

        (三)關(guān)聯(lián)分析

        數(shù)據(jù)庫(kù)中的數(shù)據(jù)一般都存在著關(guān)聯(lián)關(guān)系,也就是說(shuō),兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性。這種關(guān)聯(lián)關(guān)系有簡(jiǎn)單關(guān)聯(lián)和時(shí)序關(guān)聯(lián)兩種。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng),描述一組數(shù)據(jù)項(xiàng)目的密切度或關(guān)系。有時(shí)并不知道數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)是否存在精確的關(guān)聯(lián)函數(shù),,即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有置信度,置信度級(jí)別度量了關(guān)聯(lián)規(guī)則的強(qiáng)度。

        (四)聚類(lèi)

        當(dāng)要分析的數(shù)據(jù)缺乏描述信息,或者是無(wú)法組織成任何分類(lèi)模式時(shí),可以采用聚類(lèi)分析。聚類(lèi)分析是按照某種相近程度度量方法,將用戶數(shù)據(jù)分成一系列有意義的子集合。每一個(gè)集合中的數(shù)據(jù)性質(zhì)相近,不同集合之間的數(shù)據(jù)性質(zhì)相差較大。

        統(tǒng)計(jì)方法中的聚類(lèi)分析是實(shí)現(xiàn)聚類(lèi)的一種手段,它主要研究基于幾何距離的聚類(lèi)。人工智能中的聚類(lèi)是基于概念描述的。概念描述就是對(duì)某類(lèi)對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類(lèi)對(duì)象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類(lèi)對(duì)象的共同特征,后者描述不同類(lèi)對(duì)象之間的區(qū)別。

        三、數(shù)據(jù)挖據(jù)的應(yīng)用

        數(shù)據(jù)挖掘技術(shù)源于商業(yè)的直接需求,因此它在各種商業(yè)領(lǐng)域都存在廣泛的使用價(jià)值?,F(xiàn)在已經(jīng)應(yīng)用數(shù)據(jù)挖掘技術(shù)的領(lǐng)域都是信息量大、環(huán)境復(fù)雜、需要知識(shí)幫助進(jìn)行管理和決策的領(lǐng)域。下面介紹一些目前比較活躍的應(yīng)用方向:

        (一)在金融數(shù)據(jù)分析中的應(yīng)用

        多數(shù)銀行和金融機(jī)構(gòu)都提供了豐富多樣的儲(chǔ)蓄,信用,投資,保險(xiǎn)等服務(wù)。他們產(chǎn)生的金融數(shù)據(jù)通常比較完整、可靠,這對(duì)系統(tǒng)化的數(shù)據(jù)分析和數(shù)據(jù)挖掘相當(dāng)有利。在具體的應(yīng)用中,采用多維數(shù)據(jù)分析來(lái)分析這些數(shù)據(jù)的一般特性,觀察金融市場(chǎng)的變化趨勢(shì);通過(guò)特征選擇和屬性相關(guān)性計(jì)算,識(shí)別關(guān)鍵因素,進(jìn)行貸款償付預(yù)測(cè)和客戶信用分析;利用分類(lèi)和聚集的方法對(duì)用戶群體進(jìn)行識(shí)別和目標(biāo)市場(chǎng)分析;使用數(shù)據(jù)可視化、鏈接分析、分類(lèi)、聚類(lèi)分析、孤立點(diǎn)分析、序列模式分析等工具偵破洗黑錢(qián)和其他金融犯罪行為。

        (二)在電力業(yè)的應(yīng)用

        在電力行業(yè)中,數(shù)據(jù)挖掘技術(shù)主要用于指導(dǎo)設(shè)備更新、業(yè)績(jī)?cè)u(píng)估、指導(dǎo)電力企業(yè)的建設(shè)規(guī)劃、指導(dǎo)電力的生產(chǎn)和購(gòu)買(mǎi)、指導(dǎo)電力的調(diào)度等。數(shù)據(jù)挖掘在電力企業(yè)的其它方面也有巨大的用處,比如說(shuō)指導(dǎo)項(xiàng)目管理、安全管理、資源管理、投資組合管理、活動(dòng)分析、銷(xiāo)售預(yù)測(cè)、收入預(yù)測(cè)、需求預(yù)測(cè)、理賠分析等。

        (三)在零售業(yè)中的應(yīng)用

        零售業(yè)是數(shù)據(jù)挖掘的主要應(yīng)用領(lǐng)域,這是因?yàn)榱闶蹣I(yè)積累了大量的銷(xiāo)售數(shù)據(jù),如顧客購(gòu)買(mǎi)史記錄、貨物進(jìn)出、消費(fèi)與服務(wù)記錄以及流行的電子商務(wù)等等都為數(shù)據(jù)挖掘提供了豐富的數(shù)據(jù)資源。零售數(shù)據(jù)挖掘有助于劃分顧客群體,使用交互式詢(xún)問(wèn)技術(shù)、分類(lèi)技術(shù)和預(yù)測(cè)技術(shù),更精確地挑選潛在的顧客;識(shí)別顧客購(gòu)買(mǎi)行為,發(fā)現(xiàn)顧客購(gòu)買(mǎi)模式和趨勢(shì),進(jìn)行關(guān)聯(lián)分析,以便更好地進(jìn)行貨架擺設(shè);改進(jìn)服務(wù)質(zhì)量,獲得更好的顧客忠誠(chéng)度和滿意程度;提高貨品的銷(xiāo)量比率,設(shè)計(jì)更好的貨品運(yùn)輸與分銷(xiāo)策略,減少商業(yè)成本;尋找描述性的模式,以便更好地進(jìn)行市場(chǎng)分析等等。

        (四)在醫(yī)學(xué)上的應(yīng)用

        近年來(lái),生物醫(yī)學(xué)研究有了迅猛地發(fā)展,從新藥的開(kāi)發(fā)到癌癥治療的突破,到通過(guò)大規(guī)模序列模式和基因功能的發(fā)現(xiàn),進(jìn)行人類(lèi)基因的識(shí)別與研究。在人類(lèi)基因研究領(lǐng)域具有挑戰(zhàn)性的問(wèn)題是從中找出導(dǎo)致各種疾病的特定基因序列模式。由于數(shù)據(jù)挖掘中已經(jīng)有許多有意義的序列模式分析和相似檢索技術(shù),因此數(shù)據(jù)挖掘成為DNA分析中的強(qiáng)有力工具。基因序列的相關(guān)分析,遺傳研究中的路徑分析等。近期DNA分析的研究成果已經(jīng)促成了對(duì)許多疾病和殘疾基因成因的發(fā)現(xiàn),以及對(duì)疾病診斷、預(yù)防和治療的新藥物、新方法的發(fā)現(xiàn)。

        (五)在高校和科研單位以及其他領(lǐng)域的應(yīng)用

        主要是用于海量信息數(shù)據(jù)的抽取,提供給教研和科研人員有價(jià)值的數(shù)據(jù)。比如在數(shù)字圖書(shū)館方面可以引入數(shù)據(jù)挖掘技術(shù)。同時(shí)還可以應(yīng)用的電子商務(wù)等等眾多領(lǐng)域。

        參考文獻(xiàn)

        [1]鄒先霞、王淑禮、魏長(zhǎng)華.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)淺談[J].高等函授學(xué)報(bào)(自然科學(xué)版),2000,(03).

        [2]樊志平.基于數(shù)據(jù)挖掘技術(shù)的企業(yè)信息化建設(shè)[J].商場(chǎng)現(xiàn)代化,2008,(06).

        [3]孟小峰.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2001.

        猜你喜歡
        數(shù)據(jù)挖掘應(yīng)用研究
        FMS與YBT相關(guān)性的實(shí)證研究
        遼代千人邑研究述論
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        視錯(cuò)覺(jué)在平面設(shè)計(jì)中的應(yīng)用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        EMA伺服控制系統(tǒng)研究
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        GM(1,1)白化微分優(yōu)化方程預(yù)測(cè)模型建模過(guò)程應(yīng)用分析
        科技視界(2016年20期)2016-09-29 12:03:12
        煤礦井下坑道鉆機(jī)人機(jī)工程學(xué)應(yīng)用分析
        科技視界(2016年20期)2016-09-29 11:47:01
        氣體分離提純應(yīng)用變壓吸附技術(shù)的分析
        科技視界(2016年20期)2016-09-29 11:02:20
        會(huì)計(jì)與統(tǒng)計(jì)的比較研究
        一本色道无码道dvd在线观看| 最近亚洲精品中文字幕| 久久亚洲av午夜福利精品西区| 91亚洲国产成人aⅴ毛片大全| 日本一区二区三区小视频 | 一本之道日本熟妇人妻| 色88久久久久高潮综合影院 | 久久久亚洲日本精品一区| 加勒比一本大道大香蕉| 日本a级片一区二区三区| 新婚少妇无套内谢国语播放| 暖暖 免费 高清 日本 在线| 国产综合在线观看| 国产亚洲日韩一区二区三区| 亚洲国产AⅤ精品一区二区久| 熟女人妻一区二区三区| 一区二区三区国产精品乱码| 99热这里有精品| 欧美亚洲午夜| 色se在线中文字幕视频| 蜜桃视频在线观看免费亚洲| 欧美老肥妇做爰bbww| 国产无套护士在线观看| 日韩中文字幕网站| 婷婷久久av综合一区二区三区| 人妻体内射精一区二区三四| 在线观看免费人成视频| 中文字幕国内一区二区| 大香焦av一区二区三区| 人妻 偷拍 无码 中文字幕| 国产一卡2卡3卡四卡国色天香| 国产精品青草视频免费播放| 国产av在线观看91| 中文字幕av伊人av无码av| 亚洲国产成人va在线观看天堂 | 第九色区Aⅴ天堂| 自拍视频在线观看首页国产| 国产成人亚洲综合色婷婷| 国产主播在线 | 中文| 中文字幕精品人妻丝袜| 风韵丰满熟妇啪啪区99杏|