尹玉嬌 張偉
摘要:基于虛擬身份的關(guān)系挖掘是關(guān)系挖掘的重要途徑,但虛擬身份存在一定的不真實(shí)性。鑒于此,將虛擬身份一一映射到真實(shí)身份,再針對(duì)真實(shí)身份進(jìn)行關(guān)系挖掘,并采用圖數(shù)據(jù)庫(kù)存儲(chǔ)強(qiáng)關(guān)聯(lián)的關(guān)系數(shù)據(jù)。該關(guān)系挖掘算法包括3部分:首先基于公共場(chǎng)所卡口設(shè)備和審計(jì)設(shè)備采集到的日志數(shù)據(jù),抽取手機(jī)終端MAC、卡口設(shè)備MAC及微信構(gòu)建虛擬身份庫(kù),將虛擬身份微信反向映射到真實(shí)身份手機(jī)終端MAC:然后找出單節(jié)點(diǎn)手機(jī)終端MAC在某段時(shí)間內(nèi)的同行人作為一個(gè)關(guān)系團(tuán)體,或者直接找出虛擬身份庫(kù)中微信對(duì)應(yīng)映射到的手機(jī)終端MAC最大度數(shù)節(jié)點(diǎn)作為核心節(jié)點(diǎn);再利用同行人分析算法找出該節(jié)點(diǎn)在某段時(shí)間內(nèi)的同行節(jié)點(diǎn)作為一個(gè)關(guān)系團(tuán)體。研究結(jié)果表明,相比單純基于虛擬身份的關(guān)系挖掘,基于圖數(shù)據(jù)庫(kù)的虛擬身份關(guān)系挖掘算法準(zhǔn)確率可提高至100%。
關(guān)鍵詞:社交網(wǎng)絡(luò);圖數(shù)據(jù)庫(kù);虛擬身份;關(guān)系挖掘
DOI: 10. 11907/rjdk.191322
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
中圖分類號(hào):TP312
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1672-7800( 2020) 001-0117-06
0 引言
自沃爾瑪公司“啤酒和尿布”的潛在關(guān)聯(lián)關(guān)系被挖掘出來(lái)后,關(guān)聯(lián)規(guī)則挖掘逐漸進(jìn)入人們的視野并受到關(guān)注。關(guān)聯(lián)規(guī)則起源于購(gòu)物籃的物品搭配問(wèn)題,最終目的是獲得事務(wù)集中各屬性間的關(guān)聯(lián)關(guān)系,獲得可信的強(qiáng)關(guān)聯(lián)規(guī)則,并應(yīng)用這些規(guī)則服務(wù)于人類,如商店中物品的放置位置、電子商務(wù)中用戶的購(gòu)物行為。
Agrawal等[1]最先提出關(guān)聯(lián)規(guī)則的概念,同時(shí)給出了相應(yīng)的挖掘算法AIS,但其性能較差;隨后建立了項(xiàng)目集格空間理論,并依據(jù)上述兩個(gè)定理,提出了著名的Apriori算法,之后大部分學(xué)者基于經(jīng)典Apriori算法進(jìn)行算法改進(jìn)研究。2015年邵文爽[2]針對(duì)傳統(tǒng)Apriori算法執(zhí)行效率低、1/0負(fù)載大、算法冗余等缺陷提出了兩種改進(jìn)算法,第一種優(yōu)化是基于邏輯位運(yùn)算,第二種優(yōu)化是基于哈希表;崔妍等[3]提出了基于散列技術(shù)、基于劃分、基于采樣、FP增長(zhǎng)等串行算法以及并行分布式算法,其中并行是基于多處理器進(jìn)行的。
隨著數(shù)據(jù)量的增長(zhǎng),傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘算法已經(jīng)不能滿足大數(shù)據(jù)時(shí)代的生產(chǎn)和生活需要,于是出現(xiàn)了分布式、并行的關(guān)聯(lián)規(guī)則挖掘算法。MapReduce是一種流行的分布式并行計(jì)算模型,因其使用簡(jiǎn)單、伸縮性好、自動(dòng)負(fù)載均衡和自動(dòng)容錯(cuò)等優(yōu)點(diǎn),得到了廣泛應(yīng)用,由此出現(xiàn)了基于Ma-pReduce的并行關(guān)聯(lián)規(guī)則挖掘算法?;贛apReduce的并行關(guān)聯(lián)規(guī)則挖掘算法主要基于磁盤訪問(wèn),降低了計(jì)算性能。隨著加州大學(xué)伯克利分校AMLab實(shí)驗(yàn)室研發(fā)的用于大型數(shù)據(jù)快速處理的并行計(jì)算框架被提出,基于Spark的關(guān)聯(lián)規(guī)則挖掘逐漸受到人們的廣泛關(guān)注。
不論是傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法,改進(jìn)的關(guān)聯(lián)規(guī)則挖掘算法,還是分布式的基于MapReduce和Spark的關(guān)聯(lián)規(guī)則挖掘算法,都是在傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘算法Apriori.FP-growth、Eclat基礎(chǔ)上提出的,其實(shí)質(zhì)仍然是兩個(gè)事物之間關(guān)聯(lián)關(guān)系的挖掘。
在關(guān)聯(lián)規(guī)則分析基礎(chǔ)上出現(xiàn)了關(guān)系挖掘。關(guān)系挖掘算法更加實(shí)用,有基于機(jī)器學(xué)習(xí)的方法和統(tǒng)計(jì)的方法,關(guān)系挖掘的范疇包括兩個(gè)事物之間的關(guān)聯(lián)關(guān)系和多個(gè)事物之間的關(guān)聯(lián)關(guān)系。姜麗莉[4]對(duì)傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了優(yōu)化,算法借鑒元組ID傳播思想,對(duì)關(guān)系圖進(jìn)行切分,對(duì)每一部分建立全局鍵值映射哈希表,通過(guò)哈希表,將表單挖掘出的項(xiàng)集進(jìn)行連接,從而得到多關(guān)系間的頻繁項(xiàng)集。
隨著社交媒體的不斷普及,人們更多地在虛擬網(wǎng)絡(luò)中進(jìn)行溝通和交流,出現(xiàn)了大量通過(guò)社交軟件進(jìn)行注冊(cè)的賬號(hào)信息?;谔摂M身份的關(guān)系挖掘?yàn)樯缃魂P(guān)系挖掘提供了新的助力,通過(guò)識(shí)別多個(gè)屬于同一個(gè)現(xiàn)實(shí)用戶的所有虛擬身份信息,并將其合并到一起,最終生成一個(gè)虛擬身份庫(kù)。隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,用于隱藏網(wǎng)絡(luò)用戶身份的技術(shù)手段和方法越來(lái)越多且更新速度較快,造成用戶身份識(shí)別特別困難[5]?;跀?shù)據(jù)挖掘的虛擬身份識(shí)別方法可以解決在線網(wǎng)站的身份識(shí)別問(wèn)題。
目前,大部分虛擬身份關(guān)系挖掘是將虛擬身份對(duì)應(yīng)轉(zhuǎn)換成現(xiàn)實(shí)世界中的真實(shí)身份。根據(jù)涉及領(lǐng)域不同,對(duì)應(yīng)轉(zhuǎn)換成的對(duì)象也不同,而且大部分虛擬身份關(guān)系挖掘算法仍停留在理論階段。本文從公安部門構(gòu)建虛擬身份庫(kù)的實(shí)際需求出發(fā),提出了一種基于圖數(shù)據(jù)庫(kù)的虛擬身份關(guān)系挖掘算法G VIRM(A Virtual Identity Relation Mining AlgorithmBased on Craph Database)。該關(guān)系挖掘算法利用具有強(qiáng)實(shí)用性的同行人分析算法挖掘虛擬身份之間的關(guān)聯(lián)關(guān)系,并針對(duì)虛擬身份的不真實(shí)性,將虛擬身份一一映射到真實(shí)身份,然后針對(duì)真實(shí)身份進(jìn)行關(guān)系挖掘。
1 相關(guān)工作
在關(guān)系挖掘之前最早出現(xiàn)的是關(guān)聯(lián)規(guī)則挖掘,關(guān)聯(lián)規(guī)則挖掘最初研究的是單純兩個(gè)事物之間的關(guān)聯(lián)關(guān)系,由于單純的關(guān)聯(lián)規(guī)則算法存在缺陷,便出現(xiàn)了關(guān)聯(lián)規(guī)則算法的優(yōu)化算法。隨著大數(shù)據(jù)時(shí)代的到來(lái),傳統(tǒng)關(guān)聯(lián)規(guī)則計(jì)算模式已經(jīng)不能滿足大規(guī)模數(shù)據(jù)處理需求,于是出現(xiàn)了分布式大數(shù)據(jù)平臺(tái),如Hadoop和Spark。目前,基于MapReduce計(jì)算模型的并行關(guān)聯(lián)規(guī)則挖掘算法大多是將Apriori、FP-Crowth和Eclat 3種經(jīng)典算法向MapReduce計(jì)算模型遷移,實(shí)現(xiàn)并行計(jì)算?;舅悸肥牵豪胔adoop作為運(yùn)行平臺(tái),利用Hadoop的分布式文件系統(tǒng)HDFS進(jìn)行大數(shù)據(jù)集的分布式存儲(chǔ),將算法的輸入和輸出改造成MapReduce計(jì)算模型要求的<鍵,值>,將算法運(yùn)行改造成map和re-duce兩個(gè)階段[6]。MapReduce是一種基于磁盤的分布式并行計(jì)算模型,但存在抽象層次低、僅支持Map和Reduce兩種操作、處理效率低、不適合迭代運(yùn)算等缺點(diǎn),而Spark是基于內(nèi)存進(jìn)行計(jì)算,克服了MapReduce的諸多缺點(diǎn),具有抽象層次更高、效率更高、有迭代處理和內(nèi)存計(jì)算的特性。OIU H[7]等在2014年提出了一種經(jīng)典的基于SparkRDD計(jì)算模型的并行Apriori算法;FANC X[8]等在2016年提出了一種基于Spark的改進(jìn)FP-growth并行算法IP-FP-growth,實(shí)現(xiàn)了將改進(jìn)的PFP-growth算法移植到Spark計(jì)算模型上進(jìn)行分布式計(jì)算。Apriori算法和FP-growth算法處理的事務(wù)數(shù)據(jù)格式是水平格式,而Eclat算法不一樣,是垂直格式。馮興杰等[9]提出一種基于Spark的并行Eclat算法即SPEclat,通過(guò)改變數(shù)據(jù)存儲(chǔ)格式,將數(shù)據(jù)按前綴進(jìn)行分組劃分到不同的計(jì)算節(jié)點(diǎn),壓縮數(shù)據(jù)的搜索空間,實(shí)現(xiàn)并行化計(jì)算。
本文虛擬身份庫(kù)是面向公安應(yīng)用而構(gòu)建,如圖1所示。基于公共場(chǎng)所的卡口設(shè)備和審計(jì)設(shè)備采集日志數(shù)據(jù),抽取卡口設(shè)備MAC、手機(jī)終端MAC、虛擬賬號(hào)微信等實(shí)體,以及卡口設(shè)備MAC和手機(jī)終端MAC、手機(jī)終端MAC和微信的關(guān)聯(lián)關(guān)系,利用圖數(shù)據(jù)庫(kù)進(jìn)行實(shí)體和關(guān)系的存儲(chǔ)。
2.2 虛擬身份到真實(shí)身份的映射
要想準(zhǔn)確識(shí)別虛擬身份或者定位虛擬身份團(tuán)體,需要將虛擬身份定位到真實(shí)身份,其難度隨著虛擬身份種類的復(fù)雜性而增加。本文虛擬身份微信與手機(jī)終端MAC直接綁定,因此直接將微信賬號(hào)定位到手機(jī)終端MAC,這種情況下的轉(zhuǎn)換是一對(duì)一的,如圖2所示。
2.3 虛擬身份關(guān)系挖掘算法設(shè)計(jì)
將微信虛擬身份映射到手機(jī)終端MAC這一真實(shí)身份后,再基于手機(jī)終端MAC進(jìn)行關(guān)系挖掘。一種情況是基于特定的某個(gè)手機(jī)終端MAC進(jìn)行同行人分析,得到關(guān)系團(tuán)體1;另一種情況是首先挖掘出虛擬身份庫(kù)中微信虛擬身份對(duì)應(yīng)映射的手機(jī)終端MAC度數(shù)最大的節(jié)點(diǎn)作為核心節(jié)點(diǎn),然后基于已經(jīng)挖掘出來(lái)的核心節(jié)點(diǎn),利用同行人分析算法找出其在某段時(shí)間內(nèi)的同行人作為一個(gè)關(guān)系團(tuán)體,得到關(guān)系團(tuán)體2。虛擬身份關(guān)系挖掘算法設(shè)計(jì)如圖3所示。
同行人分析算法如圖4所示。其中,圓圈節(jié)點(diǎn)是核心節(jié)點(diǎn),圖中總共出現(xiàn)了5個(gè)軌跡點(diǎn),然后在每個(gè)軌跡點(diǎn)找出某段時(shí)間同出現(xiàn)的其它節(jié)點(diǎn),如圖4中的菱形和長(zhǎng)方形,其中長(zhǎng)方形節(jié)點(diǎn)是在5個(gè)軌跡點(diǎn)都出現(xiàn)過(guò)的節(jié)點(diǎn),即核心節(jié)點(diǎn)的關(guān)系團(tuán)體。
2.4 算法描述及偽代碼實(shí)現(xiàn)
2.4.1 虛擬身份庫(kù)構(gòu)建
輸入:從卡口設(shè)備和審計(jì)設(shè)備采集到的日志數(shù)據(jù)中抽取出卡口設(shè)備MAC、手機(jī)終端MAC、微信賬號(hào)實(shí)體,卡口設(shè)備MAC和手機(jī)終端MAC的關(guān)聯(lián)次數(shù),手機(jī)終端MAC和微信賬號(hào)的關(guān)聯(lián)次數(shù)。
輸出:基于卡口設(shè)備MAC、手機(jī)終端MAC、微信賬號(hào)及其之間的關(guān)聯(lián)次數(shù)形成的虛擬身份庫(kù)。
算法:
Stepl:首先從數(shù)據(jù)庫(kù)中抽取出實(shí)體節(jié)點(diǎn);
Step2:導(dǎo)入實(shí)體節(jié)點(diǎn)到圖數(shù)據(jù)庫(kù);
Step3:導(dǎo)入實(shí)體節(jié)點(diǎn)之間的邊到圖數(shù)據(jù)庫(kù);
Step4:判斷實(shí)體節(jié)點(diǎn)之間的邊是否出現(xiàn)過(guò),如果出現(xiàn)過(guò)累積邊的權(quán)值加1。
其中創(chuàng)建節(jié)點(diǎn)和邊的偽代碼如下:
Node(“l(fā)abel", name, real_name, stype)
Relationship( nodel,“l(fā)abel”.node2, name, stype)
2.4.2 核心節(jié)點(diǎn)挖掘
輸入:由卡口設(shè)備MAC、手機(jī)終端MAC、微信及其之間的關(guān)聯(lián)次數(shù)形成的虛擬身份庫(kù)。
輸出:虛擬身份庫(kù)中微信對(duì)應(yīng)映射的手機(jī)終端MAC度數(shù)最大的節(jié)點(diǎn)。
算法:
Stepl:設(shè)置初始微信對(duì)應(yīng)映射的手機(jī)終端MAC度數(shù)最大節(jié)點(diǎn)的度為0;
Step2:搜索出虛擬身份庫(kù)中的所有節(jié)點(diǎn);
Step3:判斷節(jié)點(diǎn)是否是手機(jī)終端MAC節(jié)點(diǎn),如果是則記錄下該節(jié)點(diǎn)的度數(shù),并搜索出該節(jié)點(diǎn)的所有孩子節(jié)點(diǎn)。判斷孩子節(jié)點(diǎn)是否是微信賬號(hào),如果是則節(jié)點(diǎn)的度數(shù)減1,并與初始微信對(duì)應(yīng)映射的度數(shù)最大的手機(jī)終端MAC節(jié)點(diǎn)相比較,取兩者中最大的作為當(dāng)前手機(jī)終端MAC度數(shù)最大的節(jié)點(diǎn);
Step4:不斷循環(huán)判斷其余所有手機(jī)終端MAC節(jié)點(diǎn),保留最終手機(jī)終端MAC節(jié)點(diǎn)度數(shù)最大的作為核心節(jié)點(diǎn)。
核心節(jié)點(diǎn)挖掘偽代碼如下:
max_degree=0
real_name=null
flag=0
for nodel in nodes:
if nodel.label==mac:
flag=0
degree=graph.degree( nodel)
for node2 in nodel.child:
if node2.label==wechat:
degree=degree-l
flag=l
if( flag==l°ree>max_degree):
max_degree=degree
real_name=nodel
2.4.3 關(guān)系團(tuán)體挖掘
輸入:虛擬身份庫(kù)中的核心節(jié)點(diǎn)或者特定的虛擬身份映射后的手機(jī)終端MAC節(jié)點(diǎn),統(tǒng)稱為節(jié)點(diǎn)A,以及特定的某段時(shí)間內(nèi)卡口設(shè)備采集到的日志數(shù)據(jù)。
輸出:特定某段時(shí)間內(nèi)節(jié)點(diǎn)A的關(guān)系團(tuán)體。
算法:
Step1:搜索出特定某段時(shí)間內(nèi)卡口設(shè)備采集到的日志數(shù)據(jù);
Step2:按時(shí)間順序?qū)⑷罩緮?shù)據(jù)進(jìn)行排序;
Step3:找出節(jié)點(diǎn)A在該段時(shí)間內(nèi)的軌跡,也即出現(xiàn)過(guò)的場(chǎng)所;
Step4:在每個(gè)軌跡點(diǎn)找出與節(jié)點(diǎn)A同出現(xiàn)的其它節(jié)點(diǎn);
Step5:所有軌跡點(diǎn)做交集得出核心節(jié)點(diǎn)的關(guān)系團(tuán)體。
按照時(shí)間先后順序搜索出節(jié)點(diǎn)A的軌跡,其中status是場(chǎng)所狀態(tài),為1表示該場(chǎng)所在線,偽代碼如下:
track={}
for line in lines:
if( status==l):
track[ netbar]={}
track[netbar][‘equipment_longitude] =longitude
track[ netbar][‘equipment_latitude] =latitude
搜索每個(gè)軌跡點(diǎn)同出現(xiàn)的其它節(jié)點(diǎn)偽代碼如下:
for netbar in netbars:
select distinct (mobile_mac) from table where net-bar_wacode=netbar
所有軌跡點(diǎn)做交集得出核心節(jié)點(diǎn)的關(guān)系團(tuán)體偽代碼如下所示,其中count是軌跡點(diǎn)的總數(shù):
for i in range( count):
if(i_=0):
continue
listl=colle[i]
list2=colle[i-l]
ans=list( set( listl) .intersection( list2))
3 實(shí)驗(yàn)與分析
3.1 實(shí)驗(yàn)平臺(tái)及數(shù)據(jù)
本實(shí)驗(yàn)平臺(tái)CPU 4核,內(nèi)存8G,操作系統(tǒng)采用CentosMinial版,數(shù)據(jù)庫(kù)采用單機(jī)版Greenplum和圖數(shù)據(jù)庫(kù)Ne04j。實(shí)驗(yàn)數(shù)據(jù)采用某市150 000條卡口設(shè)備日志數(shù)據(jù)和5 000條審計(jì)日志數(shù)據(jù)。
3.2 實(shí)驗(yàn)結(jié)果
基于卡口設(shè)備MAC、手機(jī)終端MAC、微信及其關(guān)聯(lián)次數(shù)構(gòu)建的虛擬身份庫(kù)如圖5所示。
虛擬身份到真實(shí)身份映射后,虛擬身份庫(kù)中核心節(jié)點(diǎn)和特定某個(gè)微信映射的手機(jī)終端MAC節(jié)點(diǎn)MAC值、度數(shù)、某段時(shí)間內(nèi)的軌跡、關(guān)系團(tuán)體總數(shù)如表1所示。
3.3 結(jié)果分析
實(shí)驗(yàn)結(jié)果表明,由卡口設(shè)備MAC、手機(jī)終端MAC,微信等形成的網(wǎng)絡(luò)具有群聚現(xiàn)象,大部分節(jié)點(diǎn)會(huì)聚集在一個(gè)地方,不松散,這種現(xiàn)象由人類居住特點(diǎn)和人口密度決定。通過(guò)將虛擬身份映射到真實(shí)身份,增加了虛擬身份關(guān)系挖掘的準(zhǔn)確性。隨著數(shù)據(jù)量的累積,核心節(jié)點(diǎn)的度數(shù)維持在66左右。在數(shù)據(jù)量達(dá)不到一定規(guī)模時(shí),核心節(jié)點(diǎn)出現(xiàn)的場(chǎng)所過(guò)少,同行人節(jié)點(diǎn)過(guò)多。微信等虛擬身份對(duì)應(yīng)映射到真實(shí)身份手機(jī)終端MAC節(jié)點(diǎn)后,特定的某個(gè)手機(jī)終端MAC節(jié)點(diǎn)或者核心節(jié)點(diǎn)軌跡非空,同行節(jié)點(diǎn)非空。本文同行人分析算法充分利用了時(shí)間和空間屬性,具有較強(qiáng)實(shí)用性。
4 結(jié)語(yǔ)
本文基于圖數(shù)據(jù)庫(kù)的虛擬身份關(guān)系挖掘算法通過(guò)將微信等虛擬身份映射為手機(jī)終端MAC等真實(shí)身份,進(jìn)而將虛擬身份的關(guān)系挖掘問(wèn)題轉(zhuǎn)換為真實(shí)身份的關(guān)系挖掘問(wèn)題,提高了虛擬身份關(guān)系挖掘的準(zhǔn)確性。并且,本文關(guān)系挖掘算法充分利用了時(shí)間和空間屬性,具有較強(qiáng)的實(shí)用性,能夠解決基于微信等虛擬身份的關(guān)系團(tuán)體挖掘問(wèn)題。后續(xù)研究可針對(duì)更為復(fù)雜的虛擬身份關(guān)系網(wǎng)絡(luò)進(jìn)行身份識(shí)別和關(guān)系挖掘。
參考文獻(xiàn):
[1] 周英,卓金武,卞月青.大數(shù)據(jù)挖掘系統(tǒng)方法與實(shí)例分析[M].北京:機(jī)械工業(yè)出版社,2016.
[2] 邵文爽.基于關(guān)聯(lián)規(guī)則挖掘Apriori算法的改進(jìn)[D].沈陽(yáng):東北大學(xué),2015.
[3] 崔妍,包志強(qiáng).關(guān)聯(lián)規(guī)則挖掘綜述[J].計(jì)算機(jī)應(yīng)用研究,2016,33 (2).330-334.
[4]姜麗莉,黃承寧.多關(guān)系關(guān)聯(lián)規(guī)則挖掘在考勤數(shù)據(jù)分析中的應(yīng)用[J].電腦知識(shí)與技術(shù),2018,14( 36):3-4.
[5] 陳莎.基于大數(shù)據(jù)的互聯(lián)網(wǎng)虛擬身份關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2015.
[6] 肖文,胡娟,周曉峰.基于MapReduce計(jì)算模型的并行關(guān)聯(lián)規(guī)則挖掘算法研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2018,35(1):13-23.
[7]QIU H,CU R, YUAN C, et aI.YAFIM:a parallel frequent itemset min-ing algorithmWith Spark[C].Parallel&Distributed Processing Sym-posium Workshops.IEEE, 2014.
[8]FANG X. ZHANG G X. Optimization of parallel FP-growth algorithmhased on Spark [Jl. Modern Electronics Technique, 2016, 39 (8): 9-13.
[9] 馮興杰,潘軒.基于Spark的并行Eclat算法[J].計(jì)算機(jī)應(yīng)用研究,2019(1):18-21.
[10] 邵健.基于數(shù)據(jù)挖掘的及物性和單賓語(yǔ)句典型性關(guān)系挖掘[J].漢語(yǔ)學(xué)習(xí),2019(1),31-41.
[11]王敏,李萬(wàn)春,扶彩霞,等.基于Apriori算法的戰(zhàn)術(shù)數(shù)據(jù)鏈層次關(guān)系挖掘[J].航天電子對(duì)抗,2018(6):29-33.
[12] 江慶華,王亞民,湯在祥.基于生存分析模型挖掘HSPB1基因表達(dá)與放療敏感性關(guān)系研究[J].安徽醫(yī)科大學(xué)學(xué)報(bào),2019,54(2):261-266.
[13] 李嬌,曹暉,李倩.基于共現(xiàn)和關(guān)聯(lián)挖掘的人物關(guān)系圖構(gòu)建過(guò)程[J].無(wú)線互聯(lián)科技,2019,16(1):110-112.
[14]李有增,周全,蔣鴻玲.基于時(shí)空關(guān)聯(lián)的高校社會(huì)網(wǎng)絡(luò)關(guān)系挖掘方法研究[J].微電子學(xué)與計(jì)算機(jī),2018,35( 12):137-140.
[15]唐佳麗.面向科技評(píng)審中專家回避的人物社會(huì)關(guān)系分析方法研究[D].南昌:華東交通大學(xué),2016.
[16]邱文龍.網(wǎng)絡(luò)虛擬身份分析系統(tǒng)的研究與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2015.
[17] 藍(lán)邵武.網(wǎng)絡(luò)虛擬身份關(guān)系的提取和分析[D]北京:北京郵電大學(xué),2017.
[18] 閆洲.基于深度學(xué)習(xí)的多社交網(wǎng)絡(luò)中虛擬身份關(guān)聯(lián)技術(shù)研究[D].長(zhǎng)沙:國(guó)防科技大學(xué),2017.
[19] 韓浩明.圖數(shù)據(jù)庫(kù)系統(tǒng)研究綜述[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2014.
[20] 字鳳芹,牛進(jìn),畢柱蘭,等.基于圖數(shù)據(jù)庫(kù)的電影推薦系統(tǒng)設(shè)計(jì)[J].軟件導(dǎo)刊,2016,15(1):1-3.
[21] 呂冰清.大規(guī)模圖數(shù)據(jù)庫(kù)中的模式查詢算法研究[D].上海:華東師范大學(xué),2018.
(責(zé)任編輯:孫娟)
基金項(xiàng)目:北京市教育委員會(huì)科技計(jì)劃項(xiàng)目( KM201811232017)
作者簡(jiǎn)介:尹玉嬌(1992-),女,北京信息科技大學(xué)計(jì)算機(jī)學(xué)院碩士研究生,研究方向?yàn)閳D算法、關(guān)系挖掘;張偉(1980-),男,博士,北京信息科技大學(xué)計(jì)算機(jī)學(xué)院副教授,研究方向?yàn)檐浻布f(xié)同設(shè)計(jì)、存儲(chǔ)安全、網(wǎng)絡(luò)安全。本文通訊作者:張偉。