亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        云計(jì)算模型中關(guān)聯(lián)規(guī)則增量更新方法

        2014-12-23 01:25:30楊澤民
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)庫(kù)

        楊澤民

        (山西大同大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,山西 大同037009)

        0 引 言

        關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系,挖掘關(guān)聯(lián)規(guī)則的核心是通過(guò)統(tǒng)計(jì)數(shù)據(jù)項(xiàng)獲得頻繁項(xiàng)集,傳統(tǒng)的算法大部分是基于單結(jié)點(diǎn)的,主要包括Apriori算法、Partition、FP2growth 及抽樣算法等。但是隨著數(shù)據(jù)集的不斷增長(zhǎng),數(shù)據(jù)量級(jí)別已經(jīng)到達(dá)TB 級(jí)甚至PB級(jí),傳統(tǒng)的單結(jié)點(diǎn)串行算法已經(jīng)無(wú)法滿足數(shù)據(jù)量急劇增長(zhǎng)的需要,與此同時(shí),隨著數(shù)據(jù)集的動(dòng)態(tài)增長(zhǎng),隱藏的關(guān)聯(lián)規(guī)則也會(huì)隨之發(fā)生變化,這就對(duì)關(guān)聯(lián)規(guī)則挖掘算法提出了更高要求,即要能準(zhǔn)確挖掘頻繁項(xiàng)集,又要能實(shí)時(shí)更新已有的頻繁項(xiàng)集,主要包括當(dāng)新的數(shù)據(jù)集添加到舊的數(shù)據(jù)集時(shí),如何產(chǎn)生新的頻繁項(xiàng)集,當(dāng)從舊的數(shù)據(jù)集刪除一個(gè)數(shù)據(jù)集時(shí),如何更新頻繁項(xiàng)集,以及當(dāng)最小支持度與最小置信度發(fā)生變化時(shí),如何生成新的頻繁項(xiàng)集等,這些都已成為熱點(diǎn)研究方向。

        目前,專家學(xué)者們已對(duì)關(guān)聯(lián)規(guī)則與其相關(guān)的算法進(jìn)行了大量的研究,并提出很多效率較高的算法。大部分關(guān)聯(lián)規(guī)則增量式更新算法是在Apriori[1]算法的基礎(chǔ)上進(jìn)行改進(jìn)的,其中張愷提出一種基于云計(jì)算的Apriori算法[2],提高傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘算法的效率。唐璐等提出一種改進(jìn)的關(guān)聯(lián)規(guī)則增量式更新算法IFU[3],用于解決數(shù)據(jù)庫(kù)和最小支持度均發(fā)生改變時(shí)關(guān)聯(lián)規(guī)則的增量式更新問(wèn)題。朱曉峰等提出了一種基于MapReduce的關(guān)聯(lián)規(guī)則增量更新算法MRFUP[4],算法只需要掃描一次數(shù)據(jù)庫(kù),利用云計(jì)算強(qiáng)大的存儲(chǔ)和并行計(jì)算能力來(lái)解決海量數(shù)據(jù)挖掘的問(wèn)題。

        本文將改進(jìn)串行方式關(guān)聯(lián)規(guī)則挖掘效率較低、海量數(shù)據(jù)增量更新挖掘等問(wèn)題,提出一種基于云計(jì)算模式的關(guān)聯(lián)規(guī)則增量更新算法,主要貢獻(xiàn)如下:

        (1)提出一種單節(jié)點(diǎn)環(huán)境下的關(guān)聯(lián)規(guī)則增量更新算法(IUM),可以有效地解決規(guī)模較小的關(guān)聯(lián)規(guī)則增量挖掘問(wèn)題。

        (2)采用MapReduce函數(shù)對(duì)的設(shè)計(jì)方法,將IUM 算法并行化,提出基于云計(jì)算的關(guān)聯(lián)規(guī)則增量更新算法(CIUM)。

        (3)提出一種關(guān)聯(lián)規(guī)則增量更新的云計(jì)算框架,并且可以擴(kuò)展到其它數(shù)據(jù)類型的挖掘應(yīng)用中。

        1 云計(jì)算模型

        云計(jì)算[5]是并行計(jì)算、網(wǎng)格計(jì)算、效用計(jì)算、分布式計(jì)算、虛擬化、網(wǎng)絡(luò)存儲(chǔ)等先進(jìn)計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)整合的產(chǎn)物,具有高效性與普遍適用性,圖1給出了以上相關(guān)概念之間的層次關(guān)系。云計(jì)算技術(shù)與海量數(shù)據(jù)處理緊密相關(guān),利用云計(jì)算來(lái)解決大規(guī)模樹(shù)數(shù)據(jù)挖掘是一個(gè)具有發(fā)展?jié)摿Φ姆较颉T诖鎯?chǔ)能力方面,云計(jì)算平臺(tái)提供的樹(shù)數(shù)據(jù)存儲(chǔ)與維護(hù)能力是傳統(tǒng)數(shù)據(jù)庫(kù)無(wú)法比擬的,海量樹(shù)數(shù)據(jù)容量可能達(dá)幾百GB甚至TB級(jí)別,如果用傳統(tǒng)數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)維護(hù)成本會(huì)較大,而云計(jì)算平臺(tái)則提供了分布式的存儲(chǔ)模式,可以將大量普通計(jì)算機(jī)的存儲(chǔ)能力和計(jì)算能力匯聚在一起,為海量數(shù)據(jù)提供足夠空間,同時(shí)云計(jì)算環(huán)境還提供了數(shù)據(jù)備份、并發(fā)控制、一致性維護(hù)和可靠性等策略,可以為海量數(shù)據(jù)提供可靠保障。在處理能力方面,云計(jì)算平臺(tái)提供了分布式處理能力,利用該特點(diǎn),可以對(duì)數(shù)據(jù)挖掘過(guò)程進(jìn)行并行處理,可以顯著提高海量數(shù)據(jù)挖掘的能力。在靈活性與可伸縮性方面,云計(jì)算平臺(tái)具備良好的靈活性與可伸縮性,非常適合對(duì)數(shù)據(jù)量彈性變化較大的海量樹(shù)數(shù)據(jù)進(jìn)行處理。云計(jì)算平臺(tái)提供了向現(xiàn)有云中擴(kuò)充節(jié)點(diǎn)的功能,以提高計(jì)算資源與存儲(chǔ)容量。

        圖1 云計(jì)算相關(guān)概念關(guān)系

        在云計(jì)算平臺(tái)下進(jìn)行海量數(shù)據(jù)處理主要包括MapReduce和BSP 兩 種 模 型[6]。谷 歌 的Pregel[7]與 雅 虎 的Giraph[8]就是基于BSP模型,但BSP 模型存在著消息通信效率瓶頸。MapReduce模型主要包括Hadoop[9]與HOP[10]系統(tǒng),本文將利用MapReduce模型來(lái)處理海量樹(shù)數(shù)據(jù)。在Hadoop平臺(tái)中執(zhí)行MapReduce操作的各階段的工作流程如下[5]:

        (1)輸入文件:MapReduce庫(kù)將輸入的大數(shù)據(jù)文件分成若干獨(dú)立的數(shù)據(jù),并在不同的機(jī)器上進(jìn)行程序數(shù)據(jù)的備份。

        (2)分配任務(wù):MapReduce中Master節(jié)點(diǎn)分配子任務(wù),并將子任務(wù)遞交給空閑的worker節(jié)點(diǎn)中。

        (3)生成鍵值對(duì):被分配的子任務(wù)的工作節(jié)點(diǎn)讀取輸入的的文件,從中解析出key/value鍵值對(duì),并調(diào)用用戶編寫的Map函數(shù)處理鍵值對(duì),并生成中間鍵值對(duì)。

        (4)發(fā)送消息:分區(qū)函數(shù)將這些中間數(shù)據(jù)分成若干區(qū),將各個(gè)區(qū)在磁盤中位置信息發(fā)送給Master,然后轉(zhuǎn)發(fā)給Reduce子任務(wù)節(jié)點(diǎn)。

        (5)調(diào)用中間數(shù)據(jù):Reduce子任務(wù)節(jié)點(diǎn)獲取由Master轉(zhuǎn)發(fā)的子任務(wù)后,根據(jù)位置信息調(diào)用磁盤上中間數(shù)據(jù),并對(duì)這些中間按key值進(jìn)行排序,相同key值進(jìn)行合并操作。

        (6)執(zhí)行Reduce函數(shù):Reduce子任務(wù)節(jié)點(diǎn)遍歷排序后的中間數(shù)據(jù),并將數(shù)據(jù)傳遞給用戶定義的Reduce函數(shù)。其執(zhí)行結(jié)果將被輸出到最終的輸出文件中。

        (7)輸出結(jié)果:等所有Reduce子任務(wù)完成后,Master節(jié)點(diǎn)將所有數(shù)據(jù)返回給用戶程序,用戶程序合并數(shù)據(jù)并輸出最終數(shù)據(jù)。

        綜上所述,基于Hadoop平臺(tái)的MapReduce算法工作流程簡(jiǎn)單可行,在設(shè)計(jì)時(shí)只需考慮任務(wù)的分配策略與MapReduce函數(shù)對(duì)的設(shè)計(jì),而對(duì)于其它并行計(jì)算中的復(fù)雜問(wèn)題,如工作調(diào)度、容錯(cuò)處理、分布式存儲(chǔ)、網(wǎng)絡(luò)通信等則交給Hadoop平臺(tái)進(jìn)行處理。因此,本文將基于Hadoop平臺(tái)設(shè)計(jì)出一種關(guān)聯(lián)規(guī)則增量更新算法以改善海量數(shù)據(jù)的更新挖掘效率,實(shí)驗(yàn)結(jié)果表明,算法具有可行性以及良好的運(yùn)行效率。

        2 云計(jì)算模型下關(guān)聯(lián)規(guī)則增量更新算法

        傳統(tǒng)的Apriori算法通過(guò)逐層搜索的迭代方式來(lái)挖掘頻繁項(xiàng)集,主要包括兩個(gè)步驟:連接與刪除。通過(guò)對(duì)頻繁k-1項(xiàng)集進(jìn)行兩兩連接產(chǎn)生候選k項(xiàng)集,連接步驟可以標(biāo)記為L(zhǎng)k-1Lk-1=Ck,Ck為候選k項(xiàng)集。Ck中包含所有的頻繁k 項(xiàng)集Lk與非頻繁k 項(xiàng)集,即LkCk,循環(huán)掃描數(shù)據(jù)庫(kù)可以得到每個(gè)候選項(xiàng)集的支持度,并根據(jù)最小支持度閾值來(lái)篩選出所有的頻繁k項(xiàng)集。然而在循環(huán)掃描過(guò)程中需要進(jìn)行大量的I/O 操作,特別是在大數(shù)據(jù)量的情況下,算法效率較低。為提高算法的執(zhí)行效率,利用頻繁項(xiàng)集的所有非空子集也是頻繁的這一性質(zhì),可以對(duì)候選k項(xiàng)集進(jìn)行剪枝操作,以提高算法運(yùn)行效率。然而當(dāng)數(shù)據(jù)集發(fā)生增量更新時(shí),傳統(tǒng)的Apriori算法已經(jīng)滿足新的需求,只能重新掃描數(shù)據(jù)庫(kù)挖掘頻繁項(xiàng)集,這樣會(huì)極大地增加挖掘時(shí)間與消耗系統(tǒng)資源。因此本文首先提出在單計(jì)算結(jié)點(diǎn)下的關(guān)聯(lián)規(guī)則增量更新算法IUM (incremental updating mining),算法描述如下:

        算法1:IUM

        輸入:原數(shù)據(jù)庫(kù)TDB,頻繁項(xiàng)集Lk,新增數(shù)據(jù)庫(kù)tdb,最小支持度s

        輸出:新的頻繁項(xiàng)集L*k

        (1)對(duì)所有的X∈Lk,掃描新增數(shù)據(jù)集tdb,得到X 在TDB∪tdb中的支持?jǐn)?shù)s(TDB∪tdb),若s(TDB∪tdb)<s×(TDB+tdb),則該項(xiàng)集為非頻繁的,并將X 從Lk中進(jìn)行刪除。

        (2)在tdb中找出所有的候選頻繁k項(xiàng)集Ck,對(duì)所有的X∈Ck,掃描tdb 并計(jì)算每個(gè)候選項(xiàng)集的支持?jǐn)?shù),若支持?jǐn)?shù)小于s×tdb,則該候選項(xiàng)集是非頻繁的,可以將X 從Ck中剪掉,以此得到一個(gè)更加精簡(jiǎn)的候選項(xiàng)集的集合C′k。

        (3)掃描原始數(shù)據(jù)庫(kù)TDB,更新Ck中所有候選項(xiàng)集的支持?jǐn)?shù),并發(fā)現(xiàn)TDB∪tdb中新的頻繁項(xiàng)集,這些新的頻繁項(xiàng)集與上述更新后的Lk共同組成了新數(shù)據(jù)庫(kù)中的頻繁項(xiàng)集Lk*。

        在IUM 算法的執(zhí)行過(guò)程中,每次迭代只需要掃描整個(gè)數(shù)據(jù)庫(kù)一次,對(duì)于新產(chǎn)生的頻繁項(xiàng)集,首先根據(jù)候選項(xiàng)集在新增數(shù)據(jù)庫(kù)tdb 中的支持?jǐn)?shù)進(jìn)行修剪,然后再判斷在總數(shù)據(jù)庫(kù)中是否頻繁,這樣可以大大減少掃描數(shù)據(jù)庫(kù)的次數(shù),因此IUM 算法在增量更新發(fā)生時(shí)的執(zhí)行效率要比使用Apriori算法要好,但是當(dāng)數(shù)據(jù)庫(kù)較大或頻繁更新時(shí),IUM算法會(huì)因?yàn)橛?jì)算量的急劇增加而導(dǎo)致運(yùn)行效率的降低。因此,設(shè)計(jì)一個(gè)基于云計(jì)算模型的關(guān)聯(lián)規(guī)則增量更新算法CIUM (cloud incremental updating mining)來(lái) 解 決 海 量 數(shù)據(jù)挖掘的問(wèn)題。

        設(shè)計(jì)一個(gè)主控程序Driver[11],首先由Driver對(duì)新增數(shù)據(jù)庫(kù)tdb 進(jìn)行頻繁項(xiàng)集的挖掘,得到tdb中所有的頻繁項(xiàng)集L(tdb),將原有的頻繁項(xiàng)集L(TDB)與L(tdb)進(jìn)行對(duì)比,找出其公共部分并放入最終的頻繁項(xiàng)集L*中,剩余的頻繁項(xiàng)集L(TDB)與L(tdb)記為CR。然后進(jìn)行MapReduce操作,算法描述如下:

        算法2:CIUM

        Map操作:并行掃描原始數(shù)據(jù)庫(kù)與新增數(shù)據(jù)庫(kù),根據(jù)原有的頻繁項(xiàng)集與CR,對(duì)數(shù)據(jù)進(jìn)行格式化操作形成鍵值對(duì)<Tnum,Lk>,并將所有鍵值對(duì)作為中間數(shù)據(jù)傳遞給Reduce操作。

        Reduce操作:掃描中間結(jié)果集,將中間鍵值對(duì)進(jìn)行升序排序,依次掃描數(shù)據(jù)庫(kù)并判斷X∈Lk,若條件成立則刪除該鍵值對(duì),否則遍歷tdb,計(jì)算候選項(xiàng)集在tdb中的支持度,如果滿足條件s(TDB∪tdb)<s×(TDB+tdb),則該項(xiàng)集在新數(shù)據(jù)庫(kù)中就是非頻繁的,因此可將其刪除。最后對(duì)TDB+tdb進(jìn)行遍歷,計(jì)算各個(gè)項(xiàng)集的支持度,再根據(jù)公式判斷是否頻繁,那么新數(shù)據(jù)庫(kù)中頻繁k項(xiàng)集由原Lk中剩下的項(xiàng)集和新產(chǎn)生的頻繁項(xiàng)集共同組成L*k= (Lk-Ldelete)∪Lnew。

        云計(jì)算模型下關(guān)聯(lián)規(guī)則增量更新挖掘框架圖如圖2所示。

        圖2 云計(jì)算框架

        3 實(shí)驗(yàn)設(shè)計(jì)與分析

        本次實(shí)驗(yàn)主要考察關(guān)聯(lián)規(guī)則增量更新算法是否具備可行性、良好的加速比與擴(kuò)展率,在實(shí)驗(yàn)中心搭建實(shí)驗(yàn)所需的軟硬件平臺(tái),實(shí)驗(yàn)所需的硬件平臺(tái)見(jiàn)表1。

        表1 硬件設(shè)施

        選取了11臺(tái)計(jì)算機(jī)結(jié)點(diǎn)作為實(shí)驗(yàn)設(shè)備,安裝并調(diào)試好Hadoop環(huán)境,其中計(jì)算機(jī)結(jié)點(diǎn)的分配如下:1臺(tái)作為Driver結(jié)點(diǎn),控制所有程序的運(yùn)行,剩余10如作為計(jì)算結(jié)點(diǎn)與存儲(chǔ)設(shè)備,在計(jì)算機(jī)結(jié)點(diǎn)之間使用高速網(wǎng)卡與光纖進(jìn)行連接。實(shí)驗(yàn)操作系統(tǒng)為Ubuntu Linux,用C++實(shí)現(xiàn)并行算法,并設(shè)計(jì)一個(gè)隨機(jī)數(shù)據(jù)生成程序生成實(shí)驗(yàn)所需的模擬數(shù)據(jù),隨機(jī)數(shù)據(jù)生成程序還可以通過(guò)調(diào)整相應(yīng)的參數(shù)來(lái)控制數(shù)據(jù)的規(guī)模與復(fù)雜程度。

        實(shí)驗(yàn)共分為3組,第一組實(shí)驗(yàn)隨機(jī)生成包含500000條記錄的數(shù)據(jù)庫(kù),最小支持度s設(shè)置為0.02-0.1之間,最小置信度c設(shè)置為0.6,在不同的新增數(shù)據(jù)集tdb 下進(jìn)行實(shí)驗(yàn),具體的參數(shù)設(shè)置見(jiàn)表2。

        實(shí)驗(yàn)結(jié)果如圖3所示。

        表2 參數(shù)設(shè)置

        圖3 不同支持度下運(yùn)行結(jié)果

        從圖3可以發(fā)現(xiàn),隨著數(shù)據(jù)庫(kù)的增大,算法所需的時(shí)間也就越大,這是因?yàn)閿?shù)據(jù)庫(kù)越大,算法產(chǎn)生的頻繁項(xiàng)集也就越多,所需的計(jì)算量也就越大。同時(shí),隨著支持度的增加,算法所需的時(shí)間也就越小,因?yàn)橹С侄仍酱?,產(chǎn)生的頻繁項(xiàng)集也就越少,所需的運(yùn)算時(shí)間也就越小。

        第二組實(shí)驗(yàn)主要驗(yàn)證并行算法在不同數(shù)據(jù)規(guī)模下的加速效果,生成不同規(guī)模的數(shù)據(jù)庫(kù),設(shè)置新增數(shù)據(jù)庫(kù)集tdb為8000,最小支持度閾值為0.05,實(shí)驗(yàn)結(jié)果如圖4所示。

        圖4 加速比性能測(cè)試結(jié)果

        從圖4可知,隨著數(shù)據(jù)庫(kù)規(guī)模的增大,算法的加速性能會(huì)越好,數(shù)據(jù)庫(kù)規(guī)模越大,運(yùn)行所需代價(jià)減少比例越高,因此加速性能更好。

        第三組實(shí)驗(yàn)主要驗(yàn)證并行算法的擴(kuò)展率,隨機(jī)選取4個(gè)計(jì)算結(jié)點(diǎn),采用5 組數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),數(shù)據(jù)集設(shè)置見(jiàn)表3。

        設(shè)置tdb為9000,根據(jù)表3的設(shè)置運(yùn)行算法,選擇其中幾組實(shí)驗(yàn)結(jié)果,如圖5所示。

        表3 參數(shù)設(shè)置

        圖5 擴(kuò)展率測(cè)試結(jié)果

        通過(guò)實(shí)驗(yàn)結(jié)果可以看出,隨著計(jì)算結(jié)點(diǎn)的增多,結(jié)點(diǎn)之間的通訊代價(jià)也就增加,算法的運(yùn)行時(shí)間也會(huì)隨之增加,算法擴(kuò)展率就會(huì)隨之減小。同時(shí)不同的數(shù)據(jù)集對(duì)算法擴(kuò)展率也有影響,數(shù)據(jù)規(guī)模越大,算法的擴(kuò)展率越好,這是因?yàn)樵谠朴?jì)算環(huán)境下,大數(shù)據(jù)集能充分發(fā)揮計(jì)算結(jié)點(diǎn)的計(jì)算性能,可以充分利用系統(tǒng)的資源與潛能,最大程度地發(fā)揮計(jì)算性能。

        綜上,本文提出的云計(jì)算模式下關(guān)聯(lián)規(guī)則增量更新算法具有可行性,算法適合在海量數(shù)據(jù)庫(kù)中進(jìn)行關(guān)聯(lián)規(guī)則的增量挖掘,并且具有一定的擴(kuò)展率。

        4 結(jié)束語(yǔ)

        本文通過(guò)將云計(jì)算與關(guān)聯(lián)規(guī)則挖掘相結(jié)合的方式,提出一種基于云計(jì)算模型的關(guān)聯(lián)規(guī)則增量更新算法,改進(jìn)現(xiàn)有單結(jié)點(diǎn)算法的串行執(zhí)行方式,提高了算法的執(zhí)行效率與關(guān)聯(lián)規(guī)則增量更新的效率,特別是在海量數(shù)據(jù)集的情況下效果尤為明顯。大量實(shí)驗(yàn)結(jié)果可以表明,本文的算法具有可行性,以及良好的加速性能與可擴(kuò)展率,并且可以將算法應(yīng)用于實(shí)際的項(xiàng)目當(dāng)中。

        未來(lái)我們將繼續(xù)更新算法并將算法應(yīng)用于其它數(shù)據(jù)類型的挖掘當(dāng)中,譬如結(jié)構(gòu)化數(shù)據(jù)的挖掘、社會(huì)關(guān)系網(wǎng)絡(luò)分析等。

        [1]YE Y B,CHIANG C C.A parallel apriori algorithm for frequent item sets mining [C]//Proceedings of the Fourth International Conference on Software Engineering Research Mannagement and Applications,2006:87-94.

        [2]ZHANG Kai,ZHENG Jing.An improved Apriori based on cloud computing[J].Journal of Gansu Lianhe University (Natural Science Edition),2012,26 (6):61-64(in Chinese)[張愷,鄭晶.一種基于云計(jì)算的新的關(guān)聯(lián)規(guī)則Apriori算法 [J].甘肅聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,26 (6):61-64.]

        [3]TANG Lu,JIANG Hong,SHANGGUAN Qiuzi.An improved incremental updating algorithm for association rules[J].Computer Applications and Softwars,2012,29 (4):246-248(in Chinese).[唐璐,江紅,上官秋子.一種改進(jìn)的關(guān)聯(lián)規(guī)則的增量式更新算法 [J].計(jì)算機(jī)應(yīng)用與軟件,2012,29 (4):246-248.]

        [4]ZHU Xiaofeng,LI Lingjuan,XU Xiaolong,et al.MapReduce based association rule incremental updating algorithm [J].Computer Technology and Development,2012,22 (4):115-118 (in Chinese).[朱曉峰,李玲娟,徐曉龍,等.基于MapReduce的關(guān)聯(lián)規(guī)則增量更新算法 [J].計(jì)算機(jī)技術(shù)與發(fā)展,2012,22 (4):115-118.]

        [5]LIU Peng.Cloud computing [M].Beijing:Publishing House of Electronics Industry,2010 (in Chinese).[劉 鵬.云計(jì)算[M].北京:電子工業(yè)出版社,2010.]

        [6]Dean Jeffrey,Ghemawat Sanjay.MapReduce:Simplified data processing on large clusters[J].Communications of the ACM,2008,51 (1):107-113.

        [7]Malewicz Grzegorz,Austern Matthew H,Bik Art J C,et al.Pregel:A system for large-scale graph processing [C]//Proceedings of the SIGMOD,2010:135-145.

        [8]Ching Avery.Giraph:Large-scale graph processing infrastruction on Hadoop [C]//Proceedings of the Hadoop Summit,2011.

        [9]Son J,Choi H,Chung Y D.Skew-tolerant key distribution for load balancing in MapReduce[J].IEICE Transaction on Information and Systems,2012,95 (2):677-680.

        [10]Condie Tyson,Conway Neil,Alvaro Peter,et al.MapReduce online[C]//Proceedings of the NSDI,2010:33-48.

        [11]CHEN Guangpeng,YANG Yubin,GAO Yang,et al.Closed frequent itemset mining base on MapReduce[J].Pattern Recognition and Artificial Intelligence,2012,25 (2):220-224 (in Chinese).[陳光鵬,楊育彬,高陽(yáng),等.一種基于MapReduce的頻繁閉項(xiàng)集挖掘算法 [J].模式識(shí)別與人工智能,2012,25 (2):220-224.]

        猜你喜歡
        關(guān)聯(lián)規(guī)則數(shù)據(jù)庫(kù)
        撐竿跳規(guī)則的制定
        “苦”的關(guān)聯(lián)
        數(shù)獨(dú)的規(guī)則和演變
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        數(shù)據(jù)庫(kù)
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        国产女同一区二区在线| 亚洲看片lutube在线观看| 热re99久久精品国产99热| 精品视频在线观看免费无码| 日韩少妇高潮在线视频| 噜噜中文字幕一区二区| 亚洲av无码一区二区三区天堂古代| 内射后入在线观看一区| 麻豆国产AV网站| 在线人妻va中文字幕| 青青草免费在线视频导航| 在线观看高清视频一区二区三区| 国产午夜视频在线观看免费| 欧美放荡的少妇| 91精品国产91久久久无码95| 最新欧美一级视频| 日韩狼人精品在线观看| 国产自拍偷拍视频免费在线观看| 精品久久久久香蕉网| 国产天堂网站麻豆| 久久一日本道色综合久久大香| 人妻被公上司喝醉在线中文字幕| 天天爽夜夜爽夜夜爽精品视频| 小蜜被两老头吸奶头在线观看| 提供最新的在線欧美综合一区| 国产一区二区三区av香蕉| 色婷婷色丁香久久婷婷| 人妻丰满熟妇av无码片| 国内免费AV网站在线观看| 蜜桃视频在线免费观看一区二区| 日本一区二区高清精品| 国内最真实的xxxx人伦| 欧美在线三级艳情网站| 亚洲av精品一区二区三| 激情综合五月婷婷久久| 亚洲国产精品成人无码区| 亚洲欧洲一区二区三区波多野| 日本一区二区在线播放视频| 欧美牲交a欧美牲交aⅴ免费真| 人妻丰满熟妇av无码区hd| 精品久久人妻一区二区|