亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于圖數(shù)據(jù)庫(kù)的虛擬身份關(guān)系挖掘算法

        2020-07-14 00:47:38尹玉嬌張偉
        軟件導(dǎo)刊 2020年1期
        關(guān)鍵詞:社交網(wǎng)絡(luò)

        尹玉嬌 張偉

        摘要:基于虛擬身份的關(guān)系挖掘是關(guān)系挖掘的重要途徑,但虛擬身份存在一定的不真實(shí)性。鑒于此,將虛擬身份一一映射到真實(shí)身份,再針對(duì)真實(shí)身份進(jìn)行關(guān)系挖掘,并采用圖數(shù)據(jù)庫(kù)存儲(chǔ)強(qiáng)關(guān)聯(lián)的關(guān)系數(shù)據(jù)。該關(guān)系挖掘算法包括3部分:首先基于公共場(chǎng)所卡口設(shè)備和審計(jì)設(shè)備采集到的日志數(shù)據(jù),抽取手機(jī)終端MAC、卡口設(shè)備MAC及微信構(gòu)建虛擬身份庫(kù),將虛擬身份微信反向映射到真實(shí)身份手機(jī)終端MAC:然后找出單節(jié)點(diǎn)手機(jī)終端MAC在某段時(shí)間內(nèi)的同行人作為一個(gè)關(guān)系團(tuán)體,或者直接找出虛擬身份庫(kù)中微信對(duì)應(yīng)映射到的手機(jī)終端MAC最大度數(shù)節(jié)點(diǎn)作為核心節(jié)點(diǎn);再利用同行人分析算法找出該節(jié)點(diǎn)在某段時(shí)間內(nèi)的同行節(jié)點(diǎn)作為一個(gè)關(guān)系團(tuán)體。研究結(jié)果表明,相比單純基于虛擬身份的關(guān)系挖掘,基于圖數(shù)據(jù)庫(kù)的虛擬身份關(guān)系挖掘算法準(zhǔn)確率可提高至100%。

        關(guān)鍵詞:社交網(wǎng)絡(luò);圖數(shù)據(jù)庫(kù);虛擬身份;關(guān)系挖掘

        DOI: 10. 11907/rjdk.191322

        開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

        中圖分類號(hào):TP312

        文獻(xiàn)標(biāo)識(shí)碼:A

        文章編號(hào):1672-7800( 2020) 001-0117-06

        0 引言

        自沃爾瑪公司“啤酒和尿布”的潛在關(guān)聯(lián)關(guān)系被挖掘出來(lái)后,關(guān)聯(lián)規(guī)則挖掘逐漸進(jìn)入人們的視野并受到關(guān)注。關(guān)聯(lián)規(guī)則起源于購(gòu)物籃的物品搭配問(wèn)題,最終目的是獲得事務(wù)集中各屬性間的關(guān)聯(lián)關(guān)系,獲得可信的強(qiáng)關(guān)聯(lián)規(guī)則,并應(yīng)用這些規(guī)則服務(wù)于人類,如商店中物品的放置位置、電子商務(wù)中用戶的購(gòu)物行為。

        Agrawal等[1]最先提出關(guān)聯(lián)規(guī)則的概念,同時(shí)給出了相應(yīng)的挖掘算法AIS,但其性能較差;隨后建立了項(xiàng)目集格空間理論,并依據(jù)上述兩個(gè)定理,提出了著名的Apriori算法,之后大部分學(xué)者基于經(jīng)典Apriori算法進(jìn)行算法改進(jìn)研究。2015年邵文爽[2]針對(duì)傳統(tǒng)Apriori算法執(zhí)行效率低、1/0負(fù)載大、算法冗余等缺陷提出了兩種改進(jìn)算法,第一種優(yōu)化是基于邏輯位運(yùn)算,第二種優(yōu)化是基于哈希表;崔妍等[3]提出了基于散列技術(shù)、基于劃分、基于采樣、FP增長(zhǎng)等串行算法以及并行分布式算法,其中并行是基于多處理器進(jìn)行的。

        隨著數(shù)據(jù)量的增長(zhǎng),傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘算法已經(jīng)不能滿足大數(shù)據(jù)時(shí)代的生產(chǎn)和生活需要,于是出現(xiàn)了分布式、并行的關(guān)聯(lián)規(guī)則挖掘算法。MapReduce是一種流行的分布式并行計(jì)算模型,因其使用簡(jiǎn)單、伸縮性好、自動(dòng)負(fù)載均衡和自動(dòng)容錯(cuò)等優(yōu)點(diǎn),得到了廣泛應(yīng)用,由此出現(xiàn)了基于Ma-pReduce的并行關(guān)聯(lián)規(guī)則挖掘算法?;贛apReduce的并行關(guān)聯(lián)規(guī)則挖掘算法主要基于磁盤訪問(wèn),降低了計(jì)算性能。隨著加州大學(xué)伯克利分校AMLab實(shí)驗(yàn)室研發(fā)的用于大型數(shù)據(jù)快速處理的并行計(jì)算框架被提出,基于Spark的關(guān)聯(lián)規(guī)則挖掘逐漸受到人們的廣泛關(guān)注。

        不論是傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法,改進(jìn)的關(guān)聯(lián)規(guī)則挖掘算法,還是分布式的基于MapReduce和Spark的關(guān)聯(lián)規(guī)則挖掘算法,都是在傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘算法Apriori.FP-growth、Eclat基礎(chǔ)上提出的,其實(shí)質(zhì)仍然是兩個(gè)事物之間關(guān)聯(lián)關(guān)系的挖掘。

        在關(guān)聯(lián)規(guī)則分析基礎(chǔ)上出現(xiàn)了關(guān)系挖掘。關(guān)系挖掘算法更加實(shí)用,有基于機(jī)器學(xué)習(xí)的方法和統(tǒng)計(jì)的方法,關(guān)系挖掘的范疇包括兩個(gè)事物之間的關(guān)聯(lián)關(guān)系和多個(gè)事物之間的關(guān)聯(lián)關(guān)系。姜麗莉[4]對(duì)傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了優(yōu)化,算法借鑒元組ID傳播思想,對(duì)關(guān)系圖進(jìn)行切分,對(duì)每一部分建立全局鍵值映射哈希表,通過(guò)哈希表,將表單挖掘出的項(xiàng)集進(jìn)行連接,從而得到多關(guān)系間的頻繁項(xiàng)集。

        隨著社交媒體的不斷普及,人們更多地在虛擬網(wǎng)絡(luò)中進(jìn)行溝通和交流,出現(xiàn)了大量通過(guò)社交軟件進(jìn)行注冊(cè)的賬號(hào)信息?;谔摂M身份的關(guān)系挖掘?yàn)樯缃魂P(guān)系挖掘提供了新的助力,通過(guò)識(shí)別多個(gè)屬于同一個(gè)現(xiàn)實(shí)用戶的所有虛擬身份信息,并將其合并到一起,最終生成一個(gè)虛擬身份庫(kù)。隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,用于隱藏網(wǎng)絡(luò)用戶身份的技術(shù)手段和方法越來(lái)越多且更新速度較快,造成用戶身份識(shí)別特別困難[5]?;跀?shù)據(jù)挖掘的虛擬身份識(shí)別方法可以解決在線網(wǎng)站的身份識(shí)別問(wèn)題。

        目前,大部分虛擬身份關(guān)系挖掘是將虛擬身份對(duì)應(yīng)轉(zhuǎn)換成現(xiàn)實(shí)世界中的真實(shí)身份。根據(jù)涉及領(lǐng)域不同,對(duì)應(yīng)轉(zhuǎn)換成的對(duì)象也不同,而且大部分虛擬身份關(guān)系挖掘算法仍停留在理論階段。本文從公安部門構(gòu)建虛擬身份庫(kù)的實(shí)際需求出發(fā),提出了一種基于圖數(shù)據(jù)庫(kù)的虛擬身份關(guān)系挖掘算法G VIRM(A Virtual Identity Relation Mining AlgorithmBased on Craph Database)。該關(guān)系挖掘算法利用具有強(qiáng)實(shí)用性的同行人分析算法挖掘虛擬身份之間的關(guān)聯(lián)關(guān)系,并針對(duì)虛擬身份的不真實(shí)性,將虛擬身份一一映射到真實(shí)身份,然后針對(duì)真實(shí)身份進(jìn)行關(guān)系挖掘。

        1 相關(guān)工作

        在關(guān)系挖掘之前最早出現(xiàn)的是關(guān)聯(lián)規(guī)則挖掘,關(guān)聯(lián)規(guī)則挖掘最初研究的是單純兩個(gè)事物之間的關(guān)聯(lián)關(guān)系,由于單純的關(guān)聯(lián)規(guī)則算法存在缺陷,便出現(xiàn)了關(guān)聯(lián)規(guī)則算法的優(yōu)化算法。隨著大數(shù)據(jù)時(shí)代的到來(lái),傳統(tǒng)關(guān)聯(lián)規(guī)則計(jì)算模式已經(jīng)不能滿足大規(guī)模數(shù)據(jù)處理需求,于是出現(xiàn)了分布式大數(shù)據(jù)平臺(tái),如Hadoop和Spark。目前,基于MapReduce計(jì)算模型的并行關(guān)聯(lián)規(guī)則挖掘算法大多是將Apriori、FP-Crowth和Eclat 3種經(jīng)典算法向MapReduce計(jì)算模型遷移,實(shí)現(xiàn)并行計(jì)算?;舅悸肥牵豪胔adoop作為運(yùn)行平臺(tái),利用Hadoop的分布式文件系統(tǒng)HDFS進(jìn)行大數(shù)據(jù)集的分布式存儲(chǔ),將算法的輸入和輸出改造成MapReduce計(jì)算模型要求的<鍵,值>,將算法運(yùn)行改造成map和re-duce兩個(gè)階段[6]。MapReduce是一種基于磁盤的分布式并行計(jì)算模型,但存在抽象層次低、僅支持Map和Reduce兩種操作、處理效率低、不適合迭代運(yùn)算等缺點(diǎn),而Spark是基于內(nèi)存進(jìn)行計(jì)算,克服了MapReduce的諸多缺點(diǎn),具有抽象層次更高、效率更高、有迭代處理和內(nèi)存計(jì)算的特性。OIU H[7]等在2014年提出了一種經(jīng)典的基于SparkRDD計(jì)算模型的并行Apriori算法;FANC X[8]等在2016年提出了一種基于Spark的改進(jìn)FP-growth并行算法IP-FP-growth,實(shí)現(xiàn)了將改進(jìn)的PFP-growth算法移植到Spark計(jì)算模型上進(jìn)行分布式計(jì)算。Apriori算法和FP-growth算法處理的事務(wù)數(shù)據(jù)格式是水平格式,而Eclat算法不一樣,是垂直格式。馮興杰等[9]提出一種基于Spark的并行Eclat算法即SPEclat,通過(guò)改變數(shù)據(jù)存儲(chǔ)格式,將數(shù)據(jù)按前綴進(jìn)行分組劃分到不同的計(jì)算節(jié)點(diǎn),壓縮數(shù)據(jù)的搜索空間,實(shí)現(xiàn)并行化計(jì)算。

        本文虛擬身份庫(kù)是面向公安應(yīng)用而構(gòu)建,如圖1所示。基于公共場(chǎng)所的卡口設(shè)備和審計(jì)設(shè)備采集日志數(shù)據(jù),抽取卡口設(shè)備MAC、手機(jī)終端MAC、虛擬賬號(hào)微信等實(shí)體,以及卡口設(shè)備MAC和手機(jī)終端MAC、手機(jī)終端MAC和微信的關(guān)聯(lián)關(guān)系,利用圖數(shù)據(jù)庫(kù)進(jìn)行實(shí)體和關(guān)系的存儲(chǔ)。

        2.2 虛擬身份到真實(shí)身份的映射

        要想準(zhǔn)確識(shí)別虛擬身份或者定位虛擬身份團(tuán)體,需要將虛擬身份定位到真實(shí)身份,其難度隨著虛擬身份種類的復(fù)雜性而增加。本文虛擬身份微信與手機(jī)終端MAC直接綁定,因此直接將微信賬號(hào)定位到手機(jī)終端MAC,這種情況下的轉(zhuǎn)換是一對(duì)一的,如圖2所示。

        2.3 虛擬身份關(guān)系挖掘算法設(shè)計(jì)

        將微信虛擬身份映射到手機(jī)終端MAC這一真實(shí)身份后,再基于手機(jī)終端MAC進(jìn)行關(guān)系挖掘。一種情況是基于特定的某個(gè)手機(jī)終端MAC進(jìn)行同行人分析,得到關(guān)系團(tuán)體1;另一種情況是首先挖掘出虛擬身份庫(kù)中微信虛擬身份對(duì)應(yīng)映射的手機(jī)終端MAC度數(shù)最大的節(jié)點(diǎn)作為核心節(jié)點(diǎn),然后基于已經(jīng)挖掘出來(lái)的核心節(jié)點(diǎn),利用同行人分析算法找出其在某段時(shí)間內(nèi)的同行人作為一個(gè)關(guān)系團(tuán)體,得到關(guān)系團(tuán)體2。虛擬身份關(guān)系挖掘算法設(shè)計(jì)如圖3所示。

        同行人分析算法如圖4所示。其中,圓圈節(jié)點(diǎn)是核心節(jié)點(diǎn),圖中總共出現(xiàn)了5個(gè)軌跡點(diǎn),然后在每個(gè)軌跡點(diǎn)找出某段時(shí)間同出現(xiàn)的其它節(jié)點(diǎn),如圖4中的菱形和長(zhǎng)方形,其中長(zhǎng)方形節(jié)點(diǎn)是在5個(gè)軌跡點(diǎn)都出現(xiàn)過(guò)的節(jié)點(diǎn),即核心節(jié)點(diǎn)的關(guān)系團(tuán)體。

        2.4 算法描述及偽代碼實(shí)現(xiàn)

        2.4.1 虛擬身份庫(kù)構(gòu)建

        輸入:從卡口設(shè)備和審計(jì)設(shè)備采集到的日志數(shù)據(jù)中抽取出卡口設(shè)備MAC、手機(jī)終端MAC、微信賬號(hào)實(shí)體,卡口設(shè)備MAC和手機(jī)終端MAC的關(guān)聯(lián)次數(shù),手機(jī)終端MAC和微信賬號(hào)的關(guān)聯(lián)次數(shù)。

        輸出:基于卡口設(shè)備MAC、手機(jī)終端MAC、微信賬號(hào)及其之間的關(guān)聯(lián)次數(shù)形成的虛擬身份庫(kù)。

        算法:

        Stepl:首先從數(shù)據(jù)庫(kù)中抽取出實(shí)體節(jié)點(diǎn);

        Step2:導(dǎo)入實(shí)體節(jié)點(diǎn)到圖數(shù)據(jù)庫(kù);

        Step3:導(dǎo)入實(shí)體節(jié)點(diǎn)之間的邊到圖數(shù)據(jù)庫(kù);

        Step4:判斷實(shí)體節(jié)點(diǎn)之間的邊是否出現(xiàn)過(guò),如果出現(xiàn)過(guò)累積邊的權(quán)值加1。

        其中創(chuàng)建節(jié)點(diǎn)和邊的偽代碼如下:

        Node(“l(fā)abel", name, real_name, stype)

        Relationship( nodel,“l(fā)abel”.node2, name, stype)

        2.4.2 核心節(jié)點(diǎn)挖掘

        輸入:由卡口設(shè)備MAC、手機(jī)終端MAC、微信及其之間的關(guān)聯(lián)次數(shù)形成的虛擬身份庫(kù)。

        輸出:虛擬身份庫(kù)中微信對(duì)應(yīng)映射的手機(jī)終端MAC度數(shù)最大的節(jié)點(diǎn)。

        算法:

        Stepl:設(shè)置初始微信對(duì)應(yīng)映射的手機(jī)終端MAC度數(shù)最大節(jié)點(diǎn)的度為0;

        Step2:搜索出虛擬身份庫(kù)中的所有節(jié)點(diǎn);

        Step3:判斷節(jié)點(diǎn)是否是手機(jī)終端MAC節(jié)點(diǎn),如果是則記錄下該節(jié)點(diǎn)的度數(shù),并搜索出該節(jié)點(diǎn)的所有孩子節(jié)點(diǎn)。判斷孩子節(jié)點(diǎn)是否是微信賬號(hào),如果是則節(jié)點(diǎn)的度數(shù)減1,并與初始微信對(duì)應(yīng)映射的度數(shù)最大的手機(jī)終端MAC節(jié)點(diǎn)相比較,取兩者中最大的作為當(dāng)前手機(jī)終端MAC度數(shù)最大的節(jié)點(diǎn);

        Step4:不斷循環(huán)判斷其余所有手機(jī)終端MAC節(jié)點(diǎn),保留最終手機(jī)終端MAC節(jié)點(diǎn)度數(shù)最大的作為核心節(jié)點(diǎn)。

        核心節(jié)點(diǎn)挖掘偽代碼如下:

        max_degree=0

        real_name=null

        flag=0

        for nodel in nodes:

        if nodel.label==mac:

        flag=0

        degree=graph.degree( nodel)

        for node2 in nodel.child:

        if node2.label==wechat:

        degree=degree-l

        flag=l

        if( flag==l°ree>max_degree):

        max_degree=degree

        real_name=nodel

        2.4.3 關(guān)系團(tuán)體挖掘

        輸入:虛擬身份庫(kù)中的核心節(jié)點(diǎn)或者特定的虛擬身份映射后的手機(jī)終端MAC節(jié)點(diǎn),統(tǒng)稱為節(jié)點(diǎn)A,以及特定的某段時(shí)間內(nèi)卡口設(shè)備采集到的日志數(shù)據(jù)。

        輸出:特定某段時(shí)間內(nèi)節(jié)點(diǎn)A的關(guān)系團(tuán)體。

        算法:

        Step1:搜索出特定某段時(shí)間內(nèi)卡口設(shè)備采集到的日志數(shù)據(jù);

        Step2:按時(shí)間順序?qū)⑷罩緮?shù)據(jù)進(jìn)行排序;

        Step3:找出節(jié)點(diǎn)A在該段時(shí)間內(nèi)的軌跡,也即出現(xiàn)過(guò)的場(chǎng)所;

        Step4:在每個(gè)軌跡點(diǎn)找出與節(jié)點(diǎn)A同出現(xiàn)的其它節(jié)點(diǎn);

        Step5:所有軌跡點(diǎn)做交集得出核心節(jié)點(diǎn)的關(guān)系團(tuán)體。

        按照時(shí)間先后順序搜索出節(jié)點(diǎn)A的軌跡,其中status是場(chǎng)所狀態(tài),為1表示該場(chǎng)所在線,偽代碼如下:

        track={}

        for line in lines:

        if( status==l):

        track[ netbar]={}

        track[netbar][‘equipment_longitude] =longitude

        track[ netbar][‘equipment_latitude] =latitude

        搜索每個(gè)軌跡點(diǎn)同出現(xiàn)的其它節(jié)點(diǎn)偽代碼如下:

        for netbar in netbars:

        select distinct (mobile_mac) from table where net-bar_wacode=netbar

        所有軌跡點(diǎn)做交集得出核心節(jié)點(diǎn)的關(guān)系團(tuán)體偽代碼如下所示,其中count是軌跡點(diǎn)的總數(shù):

        for i in range( count):

        if(i_=0):

        continue

        listl=colle[i]

        list2=colle[i-l]

        ans=list( set( listl) .intersection( list2))

        3 實(shí)驗(yàn)與分析

        3.1 實(shí)驗(yàn)平臺(tái)及數(shù)據(jù)

        本實(shí)驗(yàn)平臺(tái)CPU 4核,內(nèi)存8G,操作系統(tǒng)采用CentosMinial版,數(shù)據(jù)庫(kù)采用單機(jī)版Greenplum和圖數(shù)據(jù)庫(kù)Ne04j。實(shí)驗(yàn)數(shù)據(jù)采用某市150 000條卡口設(shè)備日志數(shù)據(jù)和5 000條審計(jì)日志數(shù)據(jù)。

        3.2 實(shí)驗(yàn)結(jié)果

        基于卡口設(shè)備MAC、手機(jī)終端MAC、微信及其關(guān)聯(lián)次數(shù)構(gòu)建的虛擬身份庫(kù)如圖5所示。

        虛擬身份到真實(shí)身份映射后,虛擬身份庫(kù)中核心節(jié)點(diǎn)和特定某個(gè)微信映射的手機(jī)終端MAC節(jié)點(diǎn)MAC值、度數(shù)、某段時(shí)間內(nèi)的軌跡、關(guān)系團(tuán)體總數(shù)如表1所示。

        3.3 結(jié)果分析

        實(shí)驗(yàn)結(jié)果表明,由卡口設(shè)備MAC、手機(jī)終端MAC,微信等形成的網(wǎng)絡(luò)具有群聚現(xiàn)象,大部分節(jié)點(diǎn)會(huì)聚集在一個(gè)地方,不松散,這種現(xiàn)象由人類居住特點(diǎn)和人口密度決定。通過(guò)將虛擬身份映射到真實(shí)身份,增加了虛擬身份關(guān)系挖掘的準(zhǔn)確性。隨著數(shù)據(jù)量的累積,核心節(jié)點(diǎn)的度數(shù)維持在66左右。在數(shù)據(jù)量達(dá)不到一定規(guī)模時(shí),核心節(jié)點(diǎn)出現(xiàn)的場(chǎng)所過(guò)少,同行人節(jié)點(diǎn)過(guò)多。微信等虛擬身份對(duì)應(yīng)映射到真實(shí)身份手機(jī)終端MAC節(jié)點(diǎn)后,特定的某個(gè)手機(jī)終端MAC節(jié)點(diǎn)或者核心節(jié)點(diǎn)軌跡非空,同行節(jié)點(diǎn)非空。本文同行人分析算法充分利用了時(shí)間和空間屬性,具有較強(qiáng)實(shí)用性。

        4 結(jié)語(yǔ)

        本文基于圖數(shù)據(jù)庫(kù)的虛擬身份關(guān)系挖掘算法通過(guò)將微信等虛擬身份映射為手機(jī)終端MAC等真實(shí)身份,進(jìn)而將虛擬身份的關(guān)系挖掘問(wèn)題轉(zhuǎn)換為真實(shí)身份的關(guān)系挖掘問(wèn)題,提高了虛擬身份關(guān)系挖掘的準(zhǔn)確性。并且,本文關(guān)系挖掘算法充分利用了時(shí)間和空間屬性,具有較強(qiáng)的實(shí)用性,能夠解決基于微信等虛擬身份的關(guān)系團(tuán)體挖掘問(wèn)題。后續(xù)研究可針對(duì)更為復(fù)雜的虛擬身份關(guān)系網(wǎng)絡(luò)進(jìn)行身份識(shí)別和關(guān)系挖掘。

        參考文獻(xiàn):

        [1] 周英,卓金武,卞月青.大數(shù)據(jù)挖掘系統(tǒng)方法與實(shí)例分析[M].北京:機(jī)械工業(yè)出版社,2016.

        [2] 邵文爽.基于關(guān)聯(lián)規(guī)則挖掘Apriori算法的改進(jìn)[D].沈陽(yáng):東北大學(xué),2015.

        [3] 崔妍,包志強(qiáng).關(guān)聯(lián)規(guī)則挖掘綜述[J].計(jì)算機(jī)應(yīng)用研究,2016,33 (2).330-334.

        [4]姜麗莉,黃承寧.多關(guān)系關(guān)聯(lián)規(guī)則挖掘在考勤數(shù)據(jù)分析中的應(yīng)用[J].電腦知識(shí)與技術(shù),2018,14( 36):3-4.

        [5] 陳莎.基于大數(shù)據(jù)的互聯(lián)網(wǎng)虛擬身份關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2015.

        [6] 肖文,胡娟,周曉峰.基于MapReduce計(jì)算模型的并行關(guān)聯(lián)規(guī)則挖掘算法研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2018,35(1):13-23.

        [7]QIU H,CU R, YUAN C, et aI.YAFIM:a parallel frequent itemset min-ing algorithmWith Spark[C].Parallel&Distributed Processing Sym-posium Workshops.IEEE, 2014.

        [8]FANG X. ZHANG G X. Optimization of parallel FP-growth algorithmhased on Spark [Jl. Modern Electronics Technique, 2016, 39 (8): 9-13.

        [9] 馮興杰,潘軒.基于Spark的并行Eclat算法[J].計(jì)算機(jī)應(yīng)用研究,2019(1):18-21.

        [10] 邵健.基于數(shù)據(jù)挖掘的及物性和單賓語(yǔ)句典型性關(guān)系挖掘[J].漢語(yǔ)學(xué)習(xí),2019(1),31-41.

        [11]王敏,李萬(wàn)春,扶彩霞,等.基于Apriori算法的戰(zhàn)術(shù)數(shù)據(jù)鏈層次關(guān)系挖掘[J].航天電子對(duì)抗,2018(6):29-33.

        [12] 江慶華,王亞民,湯在祥.基于生存分析模型挖掘HSPB1基因表達(dá)與放療敏感性關(guān)系研究[J].安徽醫(yī)科大學(xué)學(xué)報(bào),2019,54(2):261-266.

        [13] 李嬌,曹暉,李倩.基于共現(xiàn)和關(guān)聯(lián)挖掘的人物關(guān)系圖構(gòu)建過(guò)程[J].無(wú)線互聯(lián)科技,2019,16(1):110-112.

        [14]李有增,周全,蔣鴻玲.基于時(shí)空關(guān)聯(lián)的高校社會(huì)網(wǎng)絡(luò)關(guān)系挖掘方法研究[J].微電子學(xué)與計(jì)算機(jī),2018,35( 12):137-140.

        [15]唐佳麗.面向科技評(píng)審中專家回避的人物社會(huì)關(guān)系分析方法研究[D].南昌:華東交通大學(xué),2016.

        [16]邱文龍.網(wǎng)絡(luò)虛擬身份分析系統(tǒng)的研究與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2015.

        [17] 藍(lán)邵武.網(wǎng)絡(luò)虛擬身份關(guān)系的提取和分析[D]北京:北京郵電大學(xué),2017.

        [18] 閆洲.基于深度學(xué)習(xí)的多社交網(wǎng)絡(luò)中虛擬身份關(guān)聯(lián)技術(shù)研究[D].長(zhǎng)沙:國(guó)防科技大學(xué),2017.

        [19] 韓浩明.圖數(shù)據(jù)庫(kù)系統(tǒng)研究綜述[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2014.

        [20] 字鳳芹,牛進(jìn),畢柱蘭,等.基于圖數(shù)據(jù)庫(kù)的電影推薦系統(tǒng)設(shè)計(jì)[J].軟件導(dǎo)刊,2016,15(1):1-3.

        [21] 呂冰清.大規(guī)模圖數(shù)據(jù)庫(kù)中的模式查詢算法研究[D].上海:華東師范大學(xué),2018.

        (責(zé)任編輯:孫娟)

        基金項(xiàng)目:北京市教育委員會(huì)科技計(jì)劃項(xiàng)目( KM201811232017)

        作者簡(jiǎn)介:尹玉嬌(1992-),女,北京信息科技大學(xué)計(jì)算機(jī)學(xué)院碩士研究生,研究方向?yàn)閳D算法、關(guān)系挖掘;張偉(1980-),男,博士,北京信息科技大學(xué)計(jì)算機(jī)學(xué)院副教授,研究方向?yàn)檐浻布f(xié)同設(shè)計(jì)、存儲(chǔ)安全、網(wǎng)絡(luò)安全。本文通訊作者:張偉。

        猜你喜歡
        社交網(wǎng)絡(luò)
        口碑信息傳播對(duì)圖書館服務(wù)創(chuàng)新的啟示
        社交網(wǎng)絡(luò)對(duì)大學(xué)英語(yǔ)教學(xué)的影響及應(yīng)用
        科技視界(2016年26期)2016-12-17 20:01:00
        社交網(wǎng)絡(luò)推薦系統(tǒng)
        社交網(wǎng)絡(luò)對(duì)大學(xué)生人際交往的影響及對(duì)策研究
        基于五要素理論的視頻自媒體盈利模式
        聲屏世界(2016年10期)2016-12-10 21:16:45
        大數(shù)據(jù)時(shí)代社交網(wǎng)絡(luò)個(gè)人信息安全問(wèn)題研究
        社交網(wǎng)絡(luò)中的隱私關(guān)注及隱私保護(hù)研究綜述
        基于圖片分享為核心的社交網(wǎng)絡(luò)應(yīng)用分析
        戲劇之家(2016年19期)2016-10-31 19:44:28
        社交網(wǎng)絡(luò)自拍文化的心理解讀
        新聞前哨(2016年10期)2016-10-31 17:46:44
        社交網(wǎng)絡(luò)營(yíng)銷策略及盈利模式探討
        商情(2016年11期)2016-04-15 20:16:05
        亚无码乱人伦一区二区| 九九精品国产亚洲av日韩| 亚洲日韩av无码| 无码一区二区三区在线 | 一级一级毛片无码免费视频| 中文字幕一区二区三区在线不卡 | 性生交大片免费看淑女出招| 全免费a级毛片| 毛片免费全部无码播放| 波多吉野一区二区三区av| 亚洲国产色图在线视频| 黑丝美腿国产在线观看| 亚洲美女自拍偷拍视频| 国产av国片精品jk制服| 国产美女露脸口爆吞精| 国产剧情国产精品一区| 久久久精品人妻一区二区三区日本| 亚洲一区二区三区av色婷婷| 中文字幕人妻互换av | 天堂在线资源中文在线8| 男女爱爱好爽视频免费看| 国产精品国产三级国产av′| 欧美久久中文字幕| 女同在线视频一区二区| 一区二区三区国产色综合| 国产在线视频一区二区天美蜜桃 | 久久本道久久综合一人| 中文字幕综合一区二区| 天天摸天天做天天爽水多| 亚洲av成人一区二区三区| 国产免费一区二区三区在线观看| 欧美亚洲另类 丝袜综合网| 91精品啪在线观看国产色| 情av一区二区三区在线观看| 校园春色人妻激情高清中文字幕| 免费a级毛片在线播放不收费| 精品丰满人妻无套内射| 精品国产一区二区三区av 性色| 制服无码在线第一页| 国产午夜精品久久精品| 欧洲美女熟乱av|