亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘算法分析及其并行模式研究

        2016-12-21 11:21:04單銀龍
        電子技術(shù)與軟件工程 2016年20期
        關(guān)鍵詞:并行算法數(shù)據(jù)挖掘關(guān)聯(lián)

        單銀龍

        摘 要 所謂數(shù)據(jù)挖掘,就是指采用一些算法,通過(guò)利用算法,發(fā)現(xiàn)隱藏在數(shù)據(jù)中事先未知的、用戶(hù)感興趣的知識(shí)的一個(gè)過(guò)程。在本文中,首先對(duì)數(shù)據(jù)挖掘任務(wù)和挖掘方法進(jìn)行了闡述,并對(duì)其數(shù)據(jù)挖掘算法并行模式進(jìn)行了相關(guān)研究。

        【關(guān)鍵詞】數(shù)據(jù)挖掘算法 并行模式

        1 數(shù)據(jù)挖掘的挖掘任務(wù)和挖掘方法

        跟數(shù)據(jù)挖掘相關(guān)的學(xué)科門(mén)類(lèi)較多,其涉及的分類(lèi)方法多種多樣。根據(jù)挖掘角度的差異性,可對(duì)數(shù)據(jù)挖掘方法歸類(lèi)。由挖掘任務(wù)的不同,可將數(shù)據(jù)挖掘分為這幾種類(lèi)型:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、數(shù)據(jù)總結(jié)、聚類(lèi)、異常和趨勢(shì)發(fā)現(xiàn)等;由挖掘?qū)ο蟮牟煌?,可將?shù)據(jù)挖掘分為:面向?qū)ο髷?shù)據(jù)庫(kù)、文本數(shù)據(jù)源、異質(zhì)數(shù)據(jù)庫(kù)等;下文根據(jù)挖掘任務(wù)以及挖掘方法角度,重點(diǎn)對(duì)數(shù)據(jù)抽取、分類(lèi)發(fā)現(xiàn)、聚類(lèi)和關(guān)聯(lián)規(guī)則發(fā)現(xiàn)四種非常重要的發(fā)現(xiàn)任務(wù)進(jìn)行闡述。一個(gè)典型的數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)一般包括數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)等幾個(gè)部分。如圖1所示。

        1.1 數(shù)據(jù)抽取

        數(shù)據(jù)抽取是對(duì)給定數(shù)據(jù)的緊湊描述,其運(yùn)用的手段就是對(duì)數(shù)據(jù)進(jìn)行濃縮處理。其中,最簡(jiǎn)單的一種數(shù)據(jù)抽取方法就是對(duì)數(shù)據(jù)庫(kù)中的各字段上的統(tǒng)計(jì)值進(jìn)行計(jì)算,這些統(tǒng)計(jì)值一般包括和值、均值、方差值等,另外,使用折線(xiàn)圖等圖形對(duì)數(shù)據(jù)庫(kù)字段進(jìn)行表示也是一種比較傳統(tǒng)而簡(jiǎn)單的數(shù)據(jù)抽取方法。數(shù)據(jù)挖掘關(guān)注的焦點(diǎn)是以數(shù)據(jù)泛化的視角來(lái)討論數(shù)據(jù)總結(jié)。所謂數(shù)據(jù)泛化,把低層次的數(shù)據(jù)抽象到高層次的一個(gè)過(guò)程。之所以把低層次的數(shù)據(jù)抽象到高層次,這是因?yàn)榇蠹矣袑?duì)視圖從較高層次處理或者瀏覽有關(guān)數(shù)據(jù)的需要,所以,通過(guò)對(duì)數(shù)據(jù)進(jìn)行多層次的泛化是有其合理的解釋的。

        1.2 分類(lèi)發(fā)現(xiàn)

        在數(shù)據(jù)挖掘的所有任務(wù)中,分類(lèi)是其中極為重要的任務(wù)之一。在所有商業(yè)應(yīng)用的數(shù)據(jù)挖掘任務(wù)中,分類(lèi)得到了最大范圍的應(yīng)用。我們知道,分類(lèi)的目標(biāo)是構(gòu)造分類(lèi)函數(shù)或分類(lèi)模型。在數(shù)據(jù)庫(kù)中,數(shù)據(jù)項(xiàng)在分類(lèi)模型的作用下映射到某一個(gè)給定類(lèi)別。在分類(lèi)的用途中,預(yù)測(cè)是其中一個(gè)較為重要的用途。通過(guò)預(yù)測(cè),從歷史數(shù)據(jù)記錄中推論得到給定數(shù)據(jù)的推廣描述,最后實(shí)現(xiàn)對(duì)未來(lái)數(shù)據(jù)的預(yù)測(cè)目標(biāo)。在對(duì)分類(lèi)器進(jìn)行構(gòu)造的過(guò)程中,必須使用訓(xùn)練樣本數(shù)據(jù)集作為輸入。訓(xùn)練集一般由數(shù)據(jù)庫(kù)記錄或元組構(gòu)成,其中,元組是由特征向量組成的。樣本的一般形式為(u1,u2,...,un;c);其中 ui為字段值,c為類(lèi)別。

        1.3 聚類(lèi)

        聚類(lèi)是把個(gè)體依據(jù)某種規(guī)律歸類(lèi)成為若干類(lèi)別的過(guò)程。其最終目標(biāo)是使相同類(lèi)別的個(gè)體之間距離最小,而不同類(lèi)別個(gè)體間距離最大化。對(duì)于聚類(lèi)而言,其研究方法一般有四種:統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和面向數(shù)據(jù)庫(kù)。通過(guò)對(duì)聚類(lèi)分析方法的應(yīng)用實(shí)踐發(fā)現(xiàn),其僅僅適合于數(shù)據(jù)庫(kù)較小的情形,這是因?yàn)槠洳痪邆渚€(xiàn)性計(jì)算復(fù)雜度。

        1.4 關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

        關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的主要對(duì)象是事務(wù)型數(shù)據(jù)庫(kù),針對(duì)的應(yīng)用是貨籃數(shù)據(jù)。一般而言,事務(wù)的組成部分不僅包括客戶(hù)訂購(gòu)的物品,還包括客戶(hù)的標(biāo)示號(hào)。隨著條形碼技術(shù)不斷得到推廣和應(yīng)用,采用前端收款機(jī)也可以獲得大量的售貨數(shù)據(jù)。所以,通過(guò)分析歷史事務(wù)數(shù)據(jù),可從顧客那里得到一些有價(jià)值的信息。比如,更好的解決擺放貨架商品和規(guī)劃市場(chǎng)的問(wèn)題。所以,如果能從事務(wù)數(shù)據(jù)中找到關(guān)聯(lián)規(guī)則,這對(duì)于零售業(yè)等商業(yè)活動(dòng)決策的重要性是不言而喻的。

        2 關(guān)聯(lián)規(guī)則挖掘的并行算法分析

        2.1 并行算法的基本概念

        所謂并行算法,即對(duì)可同時(shí)執(zhí)行的進(jìn)程集合,通過(guò)進(jìn)程的協(xié)調(diào)作用,達(dá)到求解問(wèn)題的目的。并行算法的設(shè)計(jì)是為了使并行機(jī)的眾多處理機(jī)作用得到最大程度的發(fā)揮,這樣就能更加快速有效解決問(wèn)題。一般而言,并行算法對(duì)并行機(jī)存在非常強(qiáng)的依賴(lài)性。并行機(jī)的不同算法對(duì)其有效性會(huì)產(chǎn)生影響。

        2.2 并行計(jì)算模型

        要想對(duì)一個(gè)應(yīng)用問(wèn)題進(jìn)行求解,那么設(shè)計(jì)良好的并行算法極為重要。如果想讓并行算法作為一個(gè)由程序?qū)崿F(xiàn)結(jié)構(gòu)依賴(lài)的算法,那么抽象的并行計(jì)算機(jī)結(jié)構(gòu)是非常有必要的。這樣才能保障并行算法具有更廣泛的適應(yīng)性。并行計(jì)算模型作為一種并行計(jì)算機(jī)的抽象結(jié)構(gòu),主要考慮到的是為了并行算法的設(shè)計(jì)。所以,并行計(jì)算模型從實(shí)質(zhì)意義上來(lái)講,它是某一類(lèi)并行計(jì)算機(jī)的抽象。

        2.3 并行挖掘關(guān)聯(lián)規(guī)則的算法

        在通常情況下,找出頻繁項(xiàng)目集的付出的資金要比從頻繁項(xiàng)目集中找出關(guān)聯(lián)規(guī)則的費(fèi)用高的多。鑒于此,發(fā)現(xiàn)頻繁項(xiàng)目集的并行算法就具備了重要的意義。產(chǎn)生候選集的算法的計(jì)算工作,通常來(lái)講,可歸類(lèi)為兩個(gè)步驟。其一為生成候選集,其二為對(duì)候選集的計(jì)數(shù)。為達(dá)到處理器間進(jìn)行工作分配的目的,就需要使事務(wù)和候選集分配給各處理器的形式多樣化。為達(dá)到更優(yōu)的并發(fā)度,候選集可選擇并行計(jì)算,或者是并行產(chǎn)生,還可以是兩者并行完成。

        3 小結(jié)

        數(shù)據(jù)挖掘算法的并行性可對(duì)系統(tǒng)運(yùn)行速度進(jìn)行提升,從而提高工作效率,這是因?yàn)閿?shù)據(jù)挖掘算法可實(shí)現(xiàn)對(duì)多個(gè)任務(wù)的執(zhí)行。數(shù)據(jù)挖掘算法并行方式存在差異性,所以,必須根據(jù)實(shí)際情況使用恰當(dāng)?shù)耐诰蚍椒ǎ瑥亩寷Q策的作用得到最大程度的發(fā)揮。隨著數(shù)據(jù)量處理規(guī)模的逐漸增大,所以,對(duì)數(shù)據(jù)挖掘算法并行性研究的意義是不言而喻的。

        參考文獻(xiàn)

        [1]趙峰,李慶華.并行序列挖掘的一種改進(jìn)算法[J].華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版).2003,31(10):38-40.

        [2]陳國(guó)良,安虹等.并行算法實(shí)踐[M].北京:高等教育出版社,2004.

        [3]馬傳香,簡(jiǎn)鐘.序列模式挖掘的并行算法研究[J].計(jì)算機(jī)工程,2005,31(06).

        [4]施建強(qiáng),劉曉平.基于遺傳算法的數(shù)據(jù)挖掘技術(shù)的研究[J].電腦與信息技術(shù),2003(01):9-14

        作者單位

        金陵科技學(xué)院 江蘇省南京市 211169

        猜你喜歡
        并行算法數(shù)據(jù)挖掘關(guān)聯(lián)
        “苦”的關(guān)聯(lián)
        地圖線(xiàn)要素綜合化的簡(jiǎn)遞歸并行算法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        奇趣搭配
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        基于GPU的GaBP并行算法研究
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        基于GPU的分類(lèi)并行算法的研究與實(shí)現(xiàn)
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        成在线人免费视频播放| 日韩内射美女人妻一区二区三区| 久久aⅴ无码av免费一区| 精品人妻av区乱码| 日本人妻系列中文字幕| 日本又色又爽又黄又免费网站| 日韩精品一区二区亚洲av| 99re国产电影精品| 国产免费人成视频在线观看播放播| 麻豆国产精品va在线观看不卡| 国产久热精品无码激情| 亚洲女同成av人片在线观看 | 亚洲精品成人网站在线观看| 国产精品欧美韩国日本久久| 亚洲精品一区二在线观看 | 亚洲老妈激情一区二区三区| 亚洲色AV性色在线观看| 亚洲成在人网站天堂日本| 琪琪色原网站在线观看| 日日猛噜噜狠狠扒开双腿小说| 丝袜美腿网站一区二区| 国产一区二区熟女精品免费| 久久午夜羞羞影院免费观看| 免费做爰猛烈吃奶摸视频在线观看| 亚洲AV秘 无码一区二区在线| 日本在线一区二区三区视频观看 | 我揉搓少妇好久没做高潮| 色爱av综合网站| 久久精品日韩av无码| 大香蕉久久精品一区二区字幕| 亚洲成人中文字幕在线视频 | 亚洲AV乱码毛片在线播放| 国产乱淫h侵犯在线观看| 国产永久免费高清在线| 国产精品第1页在线观看| 国产色婷亚洲99精品av网站| 国产精品亚洲精品日韩已方| 亚洲av永久无码一区| 亚洲中文字幕乱码一二三区| 亚洲久悠悠色悠在线播放| 国产精品成人国产乱|