亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺談數(shù)據(jù)挖掘和自適應(yīng)算法的應(yīng)用

        2016-12-21 10:20:55張曉東王斌
        電腦知識與技術(shù) 2016年28期
        關(guān)鍵詞:擴展數(shù)據(jù)挖掘

        張曉東+王斌

        摘要:數(shù)據(jù)挖掘自從提出以來,已經(jīng)得到了廣泛的應(yīng)用和發(fā)展。關(guān)系關(guān)聯(lián)規(guī)則表示一種特定類型的關(guān)聯(lián)規(guī)則,該規(guī)則描述了在數(shù)據(jù)集內(nèi)描述實例的特征之間發(fā)生的頻繁關(guān)系。該文研究的是重新挖掘一個數(shù)據(jù)集,這個數(shù)據(jù)集是之前已經(jīng)被挖掘過的,但是描述數(shù)據(jù)庫中的元素的屬性集增加時,如何更高效的挖掘關(guān)聯(lián)規(guī)則。

        關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)屬性集;自適應(yīng)算法;擴展

        中圖分類號:TP393 文獻標(biāo)識碼:A 文章編號:1009-3044(2016)28-0023-01

        1 數(shù)據(jù)挖掘背景

        自從人類進入信息社會以來,隨著計算機和網(wǎng)絡(luò)的普及,科學(xué)技術(shù)迅猛發(fā)展,產(chǎn)生的數(shù)據(jù)量越來越大,在各個領(lǐng)域都積累了大量的數(shù)據(jù),如考試報名系統(tǒng)人員的報名信息、搜索引擎每天的海量搜索記錄、購物平臺產(chǎn)生的海量交易記錄和銀行系統(tǒng)每天繁雜的轉(zhuǎn)賬記錄等等。顯然在這些數(shù)據(jù)中蘊藏著豐富的可以加以利用的信息,但是傳統(tǒng)的文件系統(tǒng)面對如此海量的數(shù)據(jù)顯得無能為力。因此我們迫切需要一種工具和手段,從這些數(shù)據(jù)中挖掘出我們感興趣的信息和知識。數(shù)據(jù)庫技術(shù)的發(fā)展有力地加快了人類向信息化時代發(fā)展的腳步,但是數(shù)據(jù)庫的統(tǒng)計和查詢功能,根本無法滿足人們對有趣知識和信息的挖掘需求。于是,人們將數(shù)據(jù)庫技術(shù)、信息檢索、算法、機器學(xué)習(xí)和統(tǒng)計學(xué)等技術(shù)相結(jié)合,數(shù)據(jù)挖掘應(yīng)運而生。

        數(shù)據(jù)挖掘是一門交叉學(xué)科,它融匯了不同學(xué)科的技術(shù),具有分類、聚類、關(guān)聯(lián)規(guī)則和序列模式的發(fā)現(xiàn)、預(yù)測、偏差的檢測等多種功能,各項功能互相聯(lián)系,共同發(fā)揮作用。

        2 自適應(yīng)算法在數(shù)據(jù)挖掘中的應(yīng)用

        自適應(yīng)算法是一種嶄新的關(guān)聯(lián)規(guī)則挖掘算法。關(guān)聯(lián)規(guī)則挖掘的傳統(tǒng)方法是從一組已知的對象開始,在數(shù)據(jù)集內(nèi)發(fā)現(xiàn)有趣的關(guān)系關(guān)聯(lián)規(guī)則。在這組已知的對象中,每個對象是由一組屬性來描述。例如,假設(shè)用D來表示一個數(shù)據(jù)集,則|D|表示這個數(shù)據(jù)集中對象的個數(shù)。D中每個對象都用n個屬性{A1μ1A2,...μm-1Am}來描述,每個屬性Ai(1≤i≤m)都有唯一的取值,μi表示一種大小關(guān)系,比如≤。但是在現(xiàn)實生活中,對象的屬性集可能是要變化的,顯然,為了獲得在這些條件下的對象集的有趣的關(guān)聯(lián)規(guī)則,也就是當(dāng)描述對象的屬性集增加的時候,傳統(tǒng)的挖掘算法可以一次又一次從頭開始應(yīng)用。但這可能是低效的。于是我們提出一種自適應(yīng)算法的思想。

        自適應(yīng)算法適用于在第一次挖掘結(jié)束,屬性擴展之后需要進行第二次挖掘的時候。如果表示這些數(shù)據(jù)元素的屬性集擴展s項,分別是m+1,m+2,...,m+s項。很顯然,擴展之后,描述數(shù)據(jù)元素的向量變成m+s維。這個時候,我們應(yīng)該充分利用第一次的挖掘結(jié)果。在一項集結(jié)合的時候,舊屬性之間不能再進行結(jié)合,相結(jié)合的兩個屬性至少要有一個是新屬性,這樣結(jié)合,得出的結(jié)果一定是第一次挖掘的時候所沒有的,是嶄新的規(guī)則。

        自適應(yīng)算法識別有趣的關(guān)聯(lián)規(guī)則是一個迭代的過程,首先是基于關(guān)聯(lián)規(guī)則長度的迭代,然后驗證的候選人的最小支持度和最小置信度。在開始階段,它先計算長度為2的關(guān)聯(lián)規(guī)則的支持度和置信度,選出有趣的關(guān)聯(lián)規(guī)則,即驗證關(guān)聯(lián)規(guī)則的最小支持度和最小置信度。長度為k的關(guān)聯(lián)規(guī)則挖掘過程分為兩個階段。第一個階段是要產(chǎn)生候選項,長度為k的候選項的產(chǎn)生來源于兩部分。一部分是屬性集擴展之前的數(shù)據(jù)集中,另一部分是在屬性集擴展之前的數(shù)據(jù)集中的兩個長度為k-1的關(guān)聯(lián)規(guī)則結(jié)合而成。第二個階段是要掃描數(shù)據(jù)集,驗證最小支持度和最小置信度,找出有趣的關(guān)聯(lián)規(guī)則。

        由上述可知,自適應(yīng)算法對第一次挖掘的結(jié)果采取了“回避”的策略,并沒有在已有的結(jié)果上花費時間,而是采用了一種新穎的屬性結(jié)合方式,讓那s個新屬性和所有的m+s個屬性相結(jié)合,這樣就保證了結(jié)合出來的關(guān)聯(lián)規(guī)則是新的關(guān)聯(lián)規(guī)則,直觀上可以看出效率更高。

        3 結(jié)束語

        在本文中,我們提出了挖掘關(guān)聯(lián)規(guī)則的一種嶄新的挖掘思想——自適應(yīng)挖掘思想。這種思想是在第一次挖掘之后,如何利用已有的結(jié)果,盡快挖掘出所有有趣的關(guān)聯(lián)規(guī)則。但這種算法仍然是順序挖掘算法,并沒有考慮到在多處理機系統(tǒng)的環(huán)境下,如何利用并行思想,更加高效的挖掘信息。在未來的工作中,我們準(zhǔn)備把并行思想融入到自適應(yīng)算法之中。

        參考文獻:

        [1]韓家煒,裴健.數(shù)據(jù)挖掘概念與技術(shù)[M].3版.范明,孟小峰,譯. 機械工業(yè) 出版時間,2012.

        [2]紀(jì)希禹.數(shù)據(jù)挖掘技術(shù)應(yīng)用實例[M].北京:機械工業(yè)出版社,2008.

        [3]R. Agrawal, T. Imielinski, A. Swarmi, Mining association rules between sets of items in large databases[C]. Proceedings of the ACM SIGMOD Conference on Management of Data 1993:207–216.

        [4]譚建豪.數(shù)據(jù)挖掘技術(shù)[M]. 水利水電出版社, 2009.

        [5]R. Agrawal and R. Srikant. Fast algorithms for mining association rules in large databases. In VLDB, pages 487–499, 1994.

        猜你喜歡
        擴展數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        使用 xlwings 擴展 Excel
        價值工程(2017年7期)2017-03-17 23:45:49
        多維傳播語境下的播音主持功能與拓展研究
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        恒溫晶體振蕩器調(diào)頻范圍擴展思考
        財務(wù)管理內(nèi)容擴展的路徑與方法
        淺談小學(xué)英語教學(xué)中的情境教學(xué)法
        反詰—指令言語行為范疇擴展的關(guān)聯(lián)性解釋
        科技視界(2015年35期)2016-01-04 10:12:30
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        亚洲欧洲日产国码无码av野外| 成人精品一区二区三区电影| 免费a级毛片18禁网站app| 亚洲丁香五月天缴情综合| 国产喷水福利在线视频| 亚洲AV永久无码精品表情包| 久久青青草原亚洲av| 亚洲第一幕一区二区三区在线观看 | 免费一区二区高清不卡av| 97日日碰曰曰摸日日澡| 人人狠狠综合久久亚洲| 色噜噜狠狠色综合中文字幕| 精品少妇人妻久久免费| 桃色一区一区三区蜜桃视频| 日韩av无码中文字幕| 亚洲av无码一区二区三区人妖| 久久精品无码一区二区三区蜜费| 国产美女三级视频网站| 视频区一区二在线观看| 亚洲 欧美 综合 在线 精品 | 国产成人一区二区三区乱| 先锋五月婷婷丁香草草| 久久久久久久综合狠狠综合| 人妻少妇看A偷人无码电影| 中文字幕手机在线精品| 蜜芽亚洲av无码精品色午夜| 久久99精品久久久久久秒播 | 国产精品久久久久aaaa| 国产又黄又大又粗视频| 视频一区视频二区亚洲免费观看 | 品色堂永远的免费论坛| 亚洲午夜久久久精品国产| 蜜桃网站免费在线观看视频| 亚洲成av人在线观看网址| 玩弄少妇高潮ⅹxxxyw| 久久这里都是精品一区| 亚洲一区二区三区最新视频| 亚洲啪啪视频一区二区| 亚洲人成网址在线播放| 粉嫩极品国产在线观看| 成人av在线免费播放|