劉 群,譚洪勝,張優(yōu)敏,王國胤
(重慶郵電大學計算機科學與技術(shù)學院,重慶 400065)
網(wǎng)絡(luò)表示學習在保留網(wǎng)絡(luò)結(jié)構(gòu)和語義信息的同時,將網(wǎng)絡(luò)中的節(jié)點表示成低維向量,以提升圖挖掘后續(xù)任務(wù)的性能,如節(jié)點分類[1]、聚類[2]等.現(xiàn)有大多數(shù)網(wǎng)絡(luò)表示學習方法是為靜態(tài)網(wǎng)絡(luò)設(shè)計.文獻[3~5]通過特定的游走策略得到節(jié)點的節(jié)點序列,然后將其輸入到自然語言模型Skip-gram[6]中,學習到節(jié)點的向量表示.LINE[7]保留了節(jié)點的一階和二階相似性進行概率建模,通過負采樣算法提升了在大規(guī)模網(wǎng)絡(luò)上學習節(jié)點表示的效率.算法SDNE[8]采用深度學習的方法也取得了較好的效果.隨著圖神經(jīng)網(wǎng)絡(luò)[9](Graph Neural Network,GNN)的廣泛應(yīng)用,很多網(wǎng)絡(luò)表示學習方法[10~13]聚合鄰居節(jié)點信息和節(jié)點本身的屬性信息,以提升節(jié)點向量表示質(zhì)量.但是上述方法忽略了網(wǎng)絡(luò)空間信息(拓撲結(jié)構(gòu)和屬性)隨時間變化的特點,而只是簡單地將不同時間對應(yīng)的空間壓縮在一起.
由于網(wǎng)絡(luò)是隨時間不斷變化的,前一秒沒有關(guān)系的兩個節(jié)點可能會在下一秒關(guān)聯(lián),而節(jié)點之間邊的建立也改變了網(wǎng)絡(luò)的拓撲結(jié)構(gòu).因此,只考慮靜態(tài)的處理方式不符合網(wǎng)絡(luò)實際的演化規(guī)律.早期的動態(tài)同質(zhì)網(wǎng)絡(luò)表示學習結(jié)合網(wǎng)絡(luò)演化特點,通過快照的方式獲得網(wǎng)絡(luò)在不同時間上的動態(tài)演化信息[14,15].不同于上述基于快照的模型,CTDNE[16]設(shè)計了能捕獲網(wǎng)絡(luò)時間信息的游走序列,可以更細粒度地捕捉網(wǎng)絡(luò)中重要信息.M2DNE[17]從微觀動力學和宏觀動力學兩個角度很好地模擬了網(wǎng)絡(luò)演化過程.動態(tài)同質(zhì)網(wǎng)絡(luò)表示學習未考慮網(wǎng)絡(luò)節(jié)點和邊的差異,如果將其直接應(yīng)用于動態(tài)異質(zhì)網(wǎng)絡(luò)中,將不可避免地丟失語義信息.目前,典型的動態(tài)異質(zhì)網(wǎng)絡(luò)表示學習方法[18~20],使用快照對空間(結(jié)構(gòu))進行劃分,前提是要確保空間子圖之間的平滑演化(節(jié)點和邊微小變化).但是,在真實網(wǎng)絡(luò)中(例如學術(shù)網(wǎng)絡(luò)),子圖之間的節(jié)點和邊存在巨大差異,基于快照的劃分方式會將交互的時間戳刪除,不僅導致網(wǎng)絡(luò)的形成過程變得未知,還將導致空間子圖之間的相關(guān)性變低.
為了解決現(xiàn)有方法的不足,本文提出了一種基于元路徑的動態(tài)異質(zhì)網(wǎng)絡(luò)表示學習方法DHNR,主要貢獻有以下幾點.(1)為捕獲更精細的語義,提出了時間加權(quán)元路徑對耦合的時空結(jié)構(gòu)進行劃分.通過對時間進行編碼,把每一條元路徑對應(yīng)的時間信息編碼到元路徑序列里.(2)不同于大部分元路徑處理方法,DHNR通過設(shè)計門控循環(huán)單元(Gated Recurrent Unit Network,GRU)將每條元路徑序列中的所有鄰居節(jié)點屬性和信息都聚合到節(jié)點序列中,而不是僅僅保留兩個末端節(jié)點的結(jié)構(gòu)信息,從而保證盡量完整地捕獲節(jié)點的上下文語義.(3)拓展了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),設(shè)計了帶注意力機制的雙向門控循環(huán)單元(Bi-directional Gated Recurrent Unit Network,Bi-GRU),對不同時間的元路徑序列按照重要性進行權(quán)重分配,進而完成聚合.(4)三個真實網(wǎng)絡(luò)數(shù)據(jù)集上的實驗證明了本文模型優(yōu)于其他基線模型.在節(jié)點分類任務(wù)中,Micro-F1 平均提高了1.09%~3.72%,節(jié)點聚類任務(wù)的ARI值提高了3.23%~14.49%.同時在對網(wǎng)絡(luò)動態(tài)特性捕獲和消融分析實驗上,也證明了本文模型的有效性.
定義1 動態(tài)異質(zhì)網(wǎng)絡(luò)動態(tài)異質(zhì)網(wǎng)絡(luò)可以形式化表示為G=(V,E,T),其中V表示節(jié)點集合,E表示連邊集合,T表示邊上時間集合.網(wǎng)絡(luò)中節(jié)點和節(jié)點類型間的映射函數(shù)為φ:V→A,邊和邊類型間的映射函數(shù)為ψ:E→R.其中A和R 表示節(jié)點類型和邊類型,動態(tài)異質(zhì)網(wǎng)絡(luò)中|A|+|R| ≥2.每條邊(i,j,t) ∈E表示t時刻節(jié)點i連接到節(jié)點j.
定義2 元路徑[21]一條元路徑Φ 可以表示為(縮寫為A1A2…Am+1).r=r1?r2?… ?rm定義了Ai和Am+1之間的復合關(guān)系,?表示Ai和Aj之間關(guān)系的復合操作符.
圖1 給出了學術(shù)網(wǎng)絡(luò)的示意圖.該網(wǎng)絡(luò)包含t1,t2兩個時間點對應(yīng)的空間.在t1時,A1、A2、A3、A4四位作者在C1,C2兩個會議上發(fā)表了三篇論文P1、P3、P4;在t2時,A1、A2和A3三位作者在會議C1上再次合作發(fā)表了論文P2.傳統(tǒng)的基于元路徑的方法由于忽略網(wǎng)絡(luò)中的時間因素,容易導致一條元路徑序列上的節(jié)點間存在空間(結(jié)構(gòu))耦合.例如,在元路徑APCPA 引導下,捕獲到這樣跨時間的節(jié)點序列.該序列耦合了兩個時間點下不同的結(jié)構(gòu)空間,無法學習到序列里面的時間信息,同時也無法保證語義的準確性.根據(jù)網(wǎng)絡(luò)平滑演變假設(shè)[7]可知,間隔越近,其對應(yīng)的空間信息也會越相似,其中的微妙變化只有對元路徑考慮時間才能精細捕獲.為了解決此問題,本文提出了時間加權(quán)元路徑.
圖1 動態(tài)異質(zhì)網(wǎng)絡(luò)示例
本文提出的基于元路徑的動態(tài)異質(zhì)網(wǎng)絡(luò)表示學習模型框架如圖2所示,該模型由三部分構(gòu)成:空間劃分,鄰域信息聚合,時序信息集成.空間劃分模塊根據(jù)時間將每個節(jié)點的結(jié)構(gòu)鄰域劃分為不同時間下的時間加權(quán)元路徑序列.通過GRU 模型和相對時間編碼,鄰域信息融合模塊能夠盡量保留網(wǎng)絡(luò)的完整語義和時間信息.最后時序信息集成模塊使用帶注意力機制的Bi-GRU模型進行過濾篩選.
圖2 模型框架示意圖
DHNR 采用時間加權(quán)元路徑為節(jié)點采樣鄰居序列.圖3 說明了將網(wǎng)絡(luò)通過時間加權(quán)元路徑劃分后,獲得不同時間值下多條時間加權(quán)元路徑序列的過程.例如,給定一個節(jié)點類型為A1=φ(n0)的節(jié)點,在時間加權(quán)元路徑的引導下,首先采樣在t1時與節(jié)點n0建立r1類型邊的鄰居節(jié)點n1,然后采樣在t1時與節(jié)點n1建立r2類型邊的鄰居節(jié)點n2,如此重復,直至采樣與nm在時間t1建立rm類型邊的鄰居節(jié)點nm+1.最后獲得節(jié)點n0在時間屬性值為t1的一條時間加權(quán)元路徑序列.通過設(shè)置不同的時間加權(quán)元路徑的時間值,可以將網(wǎng)絡(luò)耦合的空間進行有效劃分.
圖3 空間劃分過程
為了捕獲節(jié)點的語義信息,DHNR將每個節(jié)點的不同時間加權(quán)元路徑信息分別進行聚合,如圖4 所示.以節(jié)點n0為例,給定一條由時間加權(quán)元路徑提取的n0的時間加權(quán)元路徑序列,以及該序列上每個節(jié)點的初始特征向量xi∈Rd(d表示初始特征向量維數(shù)).將n0的時間加權(quán)元路徑序列中所有鄰居信息及其自身信息聚合起來,形成一個初始的向量表示.
圖4 鄰域信息聚合
傳播過程中的鄰居信息可以視為序列輸入,而GNN 不能處理序列數(shù)據(jù),所以DHNR 模型引入了GRU構(gòu)造的傳播模塊,將節(jié)點n0本身特征x0及其鄰域信息編碼成特定時間特定語義下的向量,st表示序列語義為s,時間值為t的序列.
由于節(jié)點的異質(zhì)性,不同類型的節(jié)點具有不同的特征空間.對每種類型的節(jié)點設(shè)計特定類型的變換矩陣(例如節(jié)點類型為φi的變換矩陣為),以此將不同類型節(jié)點的特征投影到相同的特征空間中.轉(zhuǎn)換過程如下:
其中xi和分別是節(jié)點ni的原始特征和投影特征.通過式(1)的投影操作,GRU 傳播模塊可以處理序列中任意類型的節(jié)點.傳播模塊在時間加權(quán)元路徑序列上的基本遞歸過程如下:
為了捕獲更多的語義信息,同時學習的網(wǎng)絡(luò)演化規(guī)律,DHNR 將所有序列的特征向量進行融合,形成節(jié)點的最終表示.DHNR 拓展了已有的RNN 模型,運用帶注意力機制的Bi-GRU 進行深層次信息交互,為不同時間元路徑序列下的節(jié)點表示向量分配不同權(quán)重,再聚合得到節(jié)點的最終表示向量.
由于鄰域信息聚合的是每個時間加權(quán)元路徑上的鄰域節(jié)點信息,考慮到節(jié)點的演化規(guī)律需要結(jié)合節(jié)點在不同時空結(jié)構(gòu)下的語義特征信息,DHNR 使用Bi-GRU 來交互不同時間下的特征信息,以此來模擬網(wǎng)絡(luò)的演化.其公式為:
其中{o1,o2,…,og}是Bi-GRU 的狀態(tài)向量序列集合,g為節(jié)點采樣的序列數(shù).傳統(tǒng)方法直接拼接這些狀態(tài)向量作為節(jié)點的最終向量表示,這種處理方式無法關(guān)注到重要特征.本文模型引用注意力機制對特征向量進行權(quán)重設(shè)計,注意力權(quán)重αi的計算公式如下:
αi越高,oi則越重要.LeakyReLU為激活函數(shù),為注意力參數(shù),則節(jié)點n0的所有狀態(tài)特征聚合得到的節(jié)點最終向量表示為:
u0∈Rd'是節(jié)點n0的最終向量表示.在節(jié)點最終表示向量的生成過程中,采用了最小化所有標記節(jié)點的真實值和預測值的交叉熵作為損失函數(shù):
其中Yl是節(jié)點真實標簽集合.yl和表示節(jié)點標簽真實值和節(jié)點標簽預測值.DHNR算法如下.
DHNR 模型為三個模塊構(gòu)成.若網(wǎng)絡(luò)中有N個節(jié)點,則三個模塊分別對應(yīng)的時間復雜度分析如下:空間劃分模塊的時間為Nl,其中每個節(jié)點采樣時間為l=w1f1+w2f2+……+wk fk,每條時間加權(quán)元路徑序列節(jié)點數(shù)為fi(i=1,…,k),k為元路徑類型數(shù),wi(i=1,…,k)表示每種類型元路徑的數(shù)量,則每個節(jié)點采樣的序列數(shù)為g=w1+w2+……+wk;鄰域信息聚合模塊的時間為N(7ld2+3ld+3gd2),其中d為向量維度;時序信息集成模塊的時間為Ng(12d2+10d+1).由于d、g、l都為很小的常數(shù),最終DHNR的時間復雜度為O(N).
為了驗證DHNR 模型的性能,針對三種典型的網(wǎng)絡(luò)挖掘任務(wù),與不同基線模型進行了對比,同時也對DHNR模型捕獲網(wǎng)絡(luò)動態(tài)性的能力做了驗證測試.
AMiner①https://www.aminer.cn/data和DBLP②https://dblp.uni-trier.de是廣泛用于異質(zhì)網(wǎng)絡(luò)研究的兩個數(shù)據(jù)集.DBLP-4 是從DBLP 中抽取生成的一個公開數(shù)據(jù)集.為了更充分地進行對比,本文對DBLP 數(shù)據(jù)集抽取生成了數(shù)據(jù)子集DBLP-10.表1歸納了三個數(shù)據(jù)集的統(tǒng)計特征.
表1 數(shù)據(jù)集描述
(1)AMiner:是一個學術(shù)網(wǎng)絡(luò)數(shù)據(jù)集,實驗抽取了從1990 年到2005 年且作者在其中五個領(lǐng)域研究方向有變化的子集.對于每位在這五個領(lǐng)域發(fā)表文章的作者,其標簽與其主要研究領(lǐng)域相符.
(2)DBLP-4:是一個計算機科學的學術(shù)網(wǎng)絡(luò),包含四類節(jié)點,根據(jù)作者的研究方向?qū)⑵浞譃樗膫€領(lǐng)域.
(3)DBLP-10:該數(shù)據(jù)集包含從2008年到2013年10個研究領(lǐng)域發(fā)表的文章,標簽是根據(jù)文章被發(fā)表的會議或者期刊所屬領(lǐng)域進行標記.
將DHNR算法與以下基線算法進行對比:
(1)DeepWalk[4]和GCN[13]:這是兩種靜態(tài)同質(zhì)網(wǎng)絡(luò)表示學習模型.前者基于隨機游走生成序列,再學習節(jié)點表示,簡寫為DeW.后者為圖卷積神經(jīng)網(wǎng)絡(luò),在實驗對比中,測試了本文使用的所有元路徑,記錄其中的最佳結(jié)果.
(2)Metapath2vec[3]和HAN[10]:這是兩種靜態(tài)異質(zhì)網(wǎng)絡(luò)的表示學習方法,前者通過元路徑約束生成的序列來學習節(jié)點表示,簡寫為M2v.后者考慮了節(jié)點和語義級兩種注意力.本文實驗中,HAN 元路徑的選擇和本文相同.
(3)M2DNE[17]:一種動態(tài)同質(zhì)網(wǎng)絡(luò)表示學習方法,用微觀動力學和宏觀動力學模擬網(wǎng)絡(luò)的演化.
(4)DHNE[18]和DyHATR[20]:都是基于快照的動態(tài)異質(zhì)網(wǎng)絡(luò)表示模型.DHNE 在歷史快照和當前快照進行元路徑約束游走,通過改進的Skip-gram 模型學習動態(tài)異質(zhì)網(wǎng)絡(luò)的節(jié)點表示.DyHATR 利用層次注意力來學習網(wǎng)絡(luò)的異質(zhì)性,并利用帶注意力機制的RNN 學習網(wǎng)絡(luò)演化過程.
(5)DHNRstu:本文模型DHNR 的變體,通過消除每條序列上的時間編碼,進行消融實驗對比.
實驗過程中使用Par2vec[24]對節(jié)點的文本內(nèi)容進行預訓練,設(shè)置初始特征維數(shù)為128.在DHNR 模型中,節(jié)點隱藏層維度和最終表示維度都設(shè)置為128 維.使用Adam優(yōu)化器對參數(shù)進行優(yōu)化,學習率設(shè)置為0.000 1.為了對比公平,其他基線模型的節(jié)點表示維度均設(shè)置為128 維,Deepwalk和Metapath2vec 設(shè)置其窗口大小參數(shù)5,其他超參數(shù)設(shè)置為各自論文中指定值.所有實驗都重復10 次,取平均值作為最終實驗結(jié)果.對比的靜態(tài)網(wǎng)絡(luò)表示學習模型,實驗中忽略了網(wǎng)絡(luò)中的時間屬性值.對比的動態(tài)同質(zhì)表示學習模型,將所有節(jié)點和邊視為同一類.對比的動態(tài)異質(zhì)網(wǎng)絡(luò)表示學習算法,依據(jù)其思想,構(gòu)造了不同的時間快照進行學習.
實驗中,在AMiner和DBLP-4 數(shù)據(jù)集上是對作者節(jié)點類型進行分類.在DBLP-10 數(shù)據(jù)集上,是對論文節(jié)點進行分類.采用的分類算法是邏輯回歸分類模型.將DHNR 學習到的節(jié)點向量表示作為邏輯回歸分類器的輸入.實驗過程中訓練集的比例設(shè)置為20%,50%,80%.
表2 給出了以Micro-F1和Macro-F1 作為評價指標的分類結(jié)果.從實驗結(jié)果可以看出,DHNR 在三個數(shù)據(jù)集上的表現(xiàn)優(yōu)于所有的對比算法,證明了DHNR 學習的節(jié)點向量表示的有效性.在DBLP-4 數(shù)據(jù)集上,由于該數(shù)據(jù)集包含了關(guān)鍵詞等類型節(jié)點,使網(wǎng)絡(luò)中節(jié)點類型更加豐富,節(jié)點相互之間產(chǎn)生的邊也更多,語義信息也更豐富.因此要想獲得更多更準確的語義信息,需要設(shè)計更多的元路徑.實驗對比中,發(fā)現(xiàn)M2DNE 表現(xiàn)性能好于本文模型,分析原因其核心思想是計算鄰居節(jié)點間的相似性,較好地適用于邊豐富的網(wǎng)絡(luò).但是當訓練比例稍大一點,本文模型DHNR 表現(xiàn)更優(yōu).這說明了DHNR不僅能獲得較豐富語義信息,還能獲得高階鄰居結(jié)構(gòu)信息.對比不同的動態(tài)異質(zhì)網(wǎng)絡(luò)表示學習,DHNR也展現(xiàn)最佳性能,說明DHNR 通過元路徑保留網(wǎng)絡(luò)語義和結(jié)構(gòu)信息同時,拓展的RNN 很好地歸納聚合了網(wǎng)絡(luò)演化信息,提升了網(wǎng)絡(luò)表示質(zhì)量.同時為了驗證本文模型DHNR 不同模塊的有效性,與不考慮時間編碼的DHNRstu進行了對比,可以看到,考慮了每個序列時間信息的DHNR,其分類性能有一定的提升.
表2 節(jié)點多分類結(jié)果
實驗中利用KMeans 進行節(jié)點聚類,簇數(shù)K 設(shè)置為數(shù)據(jù)集本身的標簽數(shù)目.采用標準化互信息(NMI)和調(diào)整蘭德系數(shù)(ARI)作為聚類評價指標.由于KMeans的性能受到初始質(zhì)心的影響,進行了10次重復實驗,最后實驗結(jié)果取均值,表3給出了聚類的實驗結(jié)果.
從表3可以看出,本文模型DHNR 在聚類任務(wù)上具有較優(yōu)的性能,比其他基線算法的蘭德系數(shù)(ARI)高出3.23%~14.49%.DHNR 區(qū)分了網(wǎng)絡(luò)中的時間和空間,結(jié)合了節(jié)點在不同時間的軌跡,并在信息融合過程中考慮了路徑上的中繼節(jié)點,使得節(jié)點表示質(zhì)量提升.
表3 節(jié)點聚類結(jié)果
本節(jié)進一步將學習到的節(jié)點特征向量投影到二維空間中,進行可視化比較.采用t-SNE 可視化了AMiner中的作者節(jié)點表示向量,根據(jù)作者節(jié)點的類型,進行不同著色.從圖5可以看出,相比于其他基線模型,DHNR可以將不同類型的作者更好地映射到不同的社區(qū),并且同一社區(qū)中節(jié)點聚集緊密,不同社區(qū)節(jié)點相距較遠,只有極少數(shù)節(jié)點被嵌入到其他顏色區(qū)域,具有較高的聚類質(zhì)量.
圖5 AMiner網(wǎng)絡(luò)中的節(jié)點向量表示的可視化
為了更好地驗證DHNR 模型是否能夠捕獲時間信息,實驗中采用了節(jié)點聚類進行測試.考慮到網(wǎng)絡(luò)演化是一個漫長的過程,所以選擇有較長時間的AMiner 數(shù)據(jù)集進行實驗.因為DHNR 可以通過節(jié)點的所有時間軌跡來學習向量表示,時間步長越長,網(wǎng)絡(luò)中包含的時間信息越多,節(jié)點的交互軌跡越豐富,學習到的節(jié)點向量表示越準確.本節(jié)通過分析不同的時間步長來驗證本文模型在捕獲網(wǎng)絡(luò)演化方面的有效性.
實驗結(jié)果如圖6 所示,當時間步長小于10 時,節(jié)點聚類性能提升較快.這說明當時間步長較短時,網(wǎng)絡(luò)中節(jié)點的交互軌跡不足以反應(yīng)節(jié)點的特征信息.隨著時間步長增加,包含的時間信息更加豐富,節(jié)點聚類精度提升較快.但是當時間步長達到一定值后,網(wǎng)絡(luò)演化趨于穩(wěn)定,模型已經(jīng)能夠從節(jié)點的交互軌跡中學習到較完整的節(jié)點向量表示,所以聚類結(jié)果趨于穩(wěn)定.說明本文模型能夠真實地反映網(wǎng)絡(luò)的動態(tài)演化特性.
圖6 不同時間步的影響
由于本文模型DHNR 利用了多條不同類型的元路徑來提取網(wǎng)絡(luò)中的豐富語義信息,為驗證單個不同元路徑以及不同類型元路徑的效果,以DBLP 數(shù)據(jù)集為例,進行了節(jié)點聚類的實驗驗證.
如圖7所示,僅僅使用單條元路徑提取的語義信息和結(jié)構(gòu)信息有限,導致性能較差.而且從實驗中可以發(fā)現(xiàn),不同元路徑提取的語義信息對節(jié)點表示向量的影響也不相同.APCPA 較APA和APTPA 具有更好的性能,分析原因是APCPA 較好地反映了作者的研究領(lǐng)域與他們提交的會議之間的相關(guān)性.由此可見,對不同類型的元路徑進行注意力權(quán)重設(shè)置能夠提升節(jié)點表示向量的質(zhì)量.
圖7 不同元路徑影響合
為判斷不同元路徑數(shù)量對模型的影響,對AMiner和DBLP-10 數(shù)據(jù)集進行了節(jié)點分類的實驗.圖8 中Ma-F1表示Macro-F1,Mi-F1表示Micro-F1.由圖8(a)可知,在Aminer 數(shù)據(jù)集上,APA 元路徑數(shù)量取為4 的時候達到峰值,而APCPA元路徑取值為8的時候達到峰值.其中上下兩組分別代表上述兩條路徑在不同數(shù)量情況下的Macro-F1和Micro-F1 的取值情況.由于在Aminer 數(shù)據(jù)集中,很多作者發(fā)表論文數(shù)量是有限的,所以當路徑數(shù)量為4 的時候,就能夠?qū)PA 的鄰域空間準確劃分,超過4 則容易導致APA 節(jié)點序列出現(xiàn)重復,再增加路徑數(shù)量對模型幾乎不產(chǎn)生影響.對于APCPA,盡管一定數(shù)量序列可以將A 的鄰域空間準確劃分,但是中繼節(jié)點C的存在能夠形成更多不同節(jié)點序列,因此更多的元路徑數(shù)量能獲取更多結(jié)構(gòu)信息.如圖8(b)所示,在DBLP-10 數(shù)據(jù)集上,當選取4 條PAP 路徑和4 條PCP 元路徑,實驗效果達到峰值.其中上下兩組分別代表上述兩條路徑在不同數(shù)量情況下的Macro-F1和Micro-F1 的取值情況.隨著路徑數(shù)量增多,分類效果會逐漸提升.但是到達一定值后,結(jié)果趨于穩(wěn)定.同樣,在DBLP-4數(shù)據(jù)集上選取了4 條APA,4 條APCPA,4 條APTPA 進行對比實驗.
圖8 不同元路徑數(shù)量實驗結(jié)果
本文提出了一種動態(tài)異質(zhì)網(wǎng)絡(luò)表示學習方法DHNR.模型利用時間加權(quán)元路徑和GRU 模型來獲取網(wǎng)絡(luò)結(jié)構(gòu)和語義信息,再通過帶注意力機制的雙向門控循環(huán)單元來歸納網(wǎng)絡(luò)演化規(guī)律,有效地提高了節(jié)點向量表示的質(zhì)量,并在分類、聚類等下游任務(wù)中均表現(xiàn)出優(yōu)異的性能.但是本文利用元路徑提取語義信息可能導致部分信息丟失,并且忽視了網(wǎng)絡(luò)演化的驅(qū)動力.未來將從上述兩個方面開展進一步的工作.首先是考慮采用能夠更好地捕捉語義的方法,其次是從網(wǎng)絡(luò)動力學角度更好地描述網(wǎng)絡(luò)的動態(tài)演化過程.