亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合拓撲和屬性的動態(tài)網(wǎng)絡鏈路預測方法

        2023-03-13 10:04:28羅世杰呂文韜崔家熙
        計算機工程與應用 2023年5期
        關鍵詞:集上鏈路動態(tài)

        羅世杰,呂文韜,李 凡,崔家熙,相 潔

        太原理工大學 信息與計算機學院,山西 晉中 030600

        隨著基于大數(shù)據(jù)深度學習的發(fā)展,鏈路預測成為了當前數(shù)據(jù)挖掘領域的研究熱點之一。大多現(xiàn)實問題均可以用復雜網(wǎng)絡表示,并借助鏈路預測來表達、分析和挖掘其中存在的重要模式。如生物工程中分子間酶轉化可能性[1]、協(xié)作網(wǎng)絡中學者間合作可能性[2]、交通網(wǎng)絡中事故評估[3]和社交網(wǎng)絡中人際關系預測[4]等。目前,該領域主要分為靜態(tài)和動態(tài)兩種主流[5]。

        傳統(tǒng)靜態(tài)鏈路預測方法其核心思想是利用各種指標的分值計算邊存在的概率。如共同鄰居(common neighbor,CN)、Admaic-Ada(rAA)、局部路徑(local path,LP)、優(yōu)先鏈接(preferential attachment,PA)等局部相似性指標來預測[6-8]。除此之外,還有大量網(wǎng)絡嵌入的方法,如矩陣分解DNMF[9]、隨機游走DeepWalk[10]、node2vec[11]和圖自編碼VGAE[12]。

        而在現(xiàn)實世界中,網(wǎng)絡本質上是動態(tài)的,其結構和屬性會隨時間而變化。同時現(xiàn)實世界網(wǎng)絡在快速增長,動態(tài)鏈路預測在各種場景中得到了應用[13]。如預測未來一段時間內的交通流量[14]、企業(yè)間未來合作可能性[15]等。在動態(tài)方法中,其目的是學習網(wǎng)絡隨時間的復雜變化,預測未來存在的邊[5]。目前主流方法是圖表示學習,如DynGEM算法[16]用之前時刻的嵌入初始化當下的嵌入,但無法捕獲長時間動態(tài)變化。Dyngraph2vec算法[17]把每個節(jié)點不同時刻下的拓撲信息通過循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)學習嵌入,但該方法難以聚集節(jié)點鄰域信息。為此THS-GWNN算法[18]利用對多個時間步下鄰居采樣提取節(jié)點時空特征,DTINE算法[19]利用node2vec去豐富二階、三階等高階信息、DYSAT算法[20]通過結構自注意方法聚合節(jié)點鄰域特征,但這類算法缺點是僅學習網(wǎng)絡拓撲信息導致預測效果有限。和之前研究相比,EvolveGCN算法[21]通過GCN提取網(wǎng)絡拓撲和屬性特征、用RNN演化GCN參數(shù)來捕捉動態(tài)變化;SLIDE算法[22]考慮底層屬性網(wǎng)絡動態(tài)變化;CDAN算法[23]通過變分自編碼嵌入、聚合節(jié)點的擾動特征和屬性關聯(lián)來描述動態(tài)變化;但這類算法都不能很好融合拓撲和屬性信息用于動態(tài)鏈路預測。

        通過對近幾年動態(tài)鏈路預測的觀察,發(fā)現(xiàn)大部分鏈路預測模型不能有效挖掘高階拓撲和節(jié)點屬性信息,且捕獲網(wǎng)絡演化能力有限,從而導致鏈路預測精度不足等問題。

        針對上述問題,本文受Dyngraph2vec模型啟發(fā),提出了一種融合網(wǎng)絡結構和屬性的動態(tài)鏈路預測方法(link prediction of dynamic network for fusion topology and attributes,DTA-LP)。Dyngraph2vec模型運用自編碼和長短期記憶網(wǎng)絡(long short-term memory,LSTM)兩個模塊分別學習圖的拓撲信息和演化信息。本文模型是以自編碼為整體框架融合拓撲和屬性進行動態(tài)鏈路預測。為挖掘結構信息降低融合難度,模型借鑒重啟隨機游走(random walk with restart,RWR)算法[24]和自編碼神經(jīng)網(wǎng)絡對拓撲向量嵌入,這兩種方法在圖嵌入已經(jīng)大量運用,并取得了理想的效果[16,23,25-26]。為更好地融合屬性特征,利用注意力機制能從大量信息中篩選出重要信息的特點[26-27],模型設計注意層對拓撲和屬性融合。為捕獲時間演化信息,模型將歷史節(jié)點序列輸入到深度循環(huán)神經(jīng)網(wǎng)絡學習演化,最后利用解碼器重構網(wǎng)絡拓撲,計算損失反向優(yōu)化參數(shù)。本文設計實驗在鏈路預測任務上進行評估,并與當前先進的算法相比較,結果表明DTA-LP模型優(yōu)于對比算法。本文主要貢獻如下:

        (1)提出了一種新的動態(tài)鏈路預測方法DTA-LP,該模型可以有效地捕獲節(jié)點隨時間變化的屬性和拓撲信息。

        (2)本文的實驗數(shù)據(jù)中,論證了節(jié)點屬性信息可以作為動態(tài)鏈路預測的補充。

        (3)真實數(shù)據(jù)集上的實驗結果表明DTA-LP模型優(yōu)于其余幾種對比算法。

        1 問題描述

        本文中的主要符號和定義如表1所示。t時刻下網(wǎng)絡可表示為Gt=(V,At,Xt),其中V是圖中所有節(jié)點的集合,At∈Rn×n為鄰接矩陣表示網(wǎng)絡拓撲結構,Xt∈Rn×d為屬性矩陣。本文考慮無向無權圖,如果(i,j)∈E,aij=1,否則為0。

        表1 符號及其含義Table 1 Symbols and meanings

        定義1(動態(tài)屬性網(wǎng)絡)一個動態(tài)屬性網(wǎng)絡G可以看作是由多個屬性網(wǎng)絡快照組成,記G={G1,…,Gt,Gt+1},其中每個網(wǎng)絡快照可表示為Gt=(V,At,Xt)。每個網(wǎng)絡快照有相同的節(jié)點集合,而網(wǎng)絡拓撲(邊集)和節(jié)點屬性會隨著時間而發(fā)生演變。因此,對于動態(tài)網(wǎng)絡中的每個時刻網(wǎng)絡的邊可表示為atij∈At,指代t時刻下的節(jié)點i和j之間的邊。相應的節(jié)點屬性表示為xit={u1,u2,…,ud}∈Xt,指代t時刻下節(jié)點i的屬性。

        動態(tài)網(wǎng)絡中的鏈路預測任務主要是利用歷史時間內的網(wǎng)絡信息預測未來時刻下網(wǎng)絡中可能存在的鏈路[28]。因此動態(tài)屬性網(wǎng)絡的鏈路預測問題可如下定義:

        定義2(動態(tài)鏈路預測)給定一個動態(tài)屬性網(wǎng)絡G={G1,…,Gt,Gt+1},其中節(jié)點的邊和屬性隨時間變化。動態(tài)鏈路預測目的是用t時間(根據(jù)步長決定t的取值范圍)拓撲和屬性去預測t+1時刻的拓撲信息。

        如圖1所示,給定一個在t-1、t和t+1不同時刻的動態(tài)屬性網(wǎng)絡,網(wǎng)絡結構和節(jié)點屬性都發(fā)生了變化,算法可預測在t+1時刻可能出現(xiàn)的邊。相比基于動態(tài)拓撲網(wǎng)絡而言,引入了用戶的屬性信息(如興趣、愛好等,圖中用u表示)用于鏈路預測。如隨時間變化,在t時刻當用戶A和D之間有相同興趣愛好u1和u5時,可以預測在t+1時刻二者可能相識。

        圖1 基于網(wǎng)絡拓撲和屬性的動態(tài)鏈路預測圖解Fig.1 Illustration of dynamic link prediction based on network topology and attributes

        2 動態(tài)鏈路預測模型結構

        本文旨在解決動態(tài)屬性網(wǎng)絡中拓撲和屬性相互融合以及隨時序演化的問題,提出的模型采用監(jiān)督性學習,模型借鑒圖表示性學習方法將網(wǎng)絡拓撲映射到低維向量空間R,并設計注意力機制對屬性和拓撲進行自適應加權融合,通過LSTM和解碼器捕獲每個時間步和跨多個時間步節(jié)點之間的高度非線性關聯(lián)。模型由如下三部分組成:

        (1)結構嵌入層:在原始網(wǎng)絡中,鄰接矩陣維度大且稀疏,為有效分析和學習數(shù)據(jù)特征,必須轉換到低維空間并保留關鍵信息[29]。因此本層使用RWR挖掘高階拓撲信息及編碼器映射降維,完成對網(wǎng)絡拓撲學習和嵌入,方便后續(xù)特征學習。

        (2)屬性融合層:網(wǎng)絡拓撲和屬性往往不是相互獨立的,可能會相互影響[22]。為使拓撲和屬性相互補充從中提取有效信息,本層采用注意力機制學習權重參數(shù),完成拓撲和屬性融合。相比其他方法,注意力層的參數(shù)較少、解釋性較強、直觀簡潔且有利于后續(xù)統(tǒng)一處理時間特征。

        (3)時間捕獲層:兩層LSTM網(wǎng)絡通過門控單元保存節(jié)點融合向量所有時刻的歷史信息,捕獲時間演化模式提高預測能力。

        DTA-LP模型框架如圖2所示,在預測At+1之前,首先RWR和編碼器得到拓撲向量嵌入ys,然后用拓撲嵌入和屬性向量ya進行融合生成yt,用LSTM捕獲時間的變化生成最終嵌入y,最后通過解碼器預測下一時刻的拓撲信息At+1。實驗表明,在網(wǎng)絡邊和節(jié)點屬性不斷變化的過程中,本文模型可以有效學習其中模式,從而提高鏈路預測精度。

        模型具體步驟如算法1中所示,第2~6行用于從鄰域中提取網(wǎng)絡拓撲和屬性特征;第7行特征融合,有效保存拓撲和屬性信息;第8行用雙層LSTM捕獲網(wǎng)絡演化;第9~11行通過迭代訓練模型;最終預測下一時刻拓撲結構。

        算法1融合拓撲和屬性的動態(tài)網(wǎng)絡鏈路預測方法

        輸入:動態(tài)屬性網(wǎng)絡GT={G1,…,Gt,Gt+1}

        輸出:t+1時刻下鄰接矩陣A

        1.對原始數(shù)據(jù)構建拓撲鄰接矩陣A和節(jié)點屬性向量X

        2.輸入A,根據(jù)公式(1)、(2)得到節(jié)點的拓撲向量表示S

        3.將S和X分別標準化

        4.fori←1 toNdo

        5.forGtinGTdo

        6.根據(jù)公式(3)~(5)嵌入得到y(tǒng)s

        7.根據(jù)公式(6)~(8)融和得到y(tǒng)t

        8.end for

        9.根據(jù)公式(15)、(16)得到y(tǒng)

        10.根據(jù)公式(3)、(4)反向計算得到L

        11.根據(jù)公式(17)計算損失

        12.利用Adma優(yōu)化器和反向傳播算法最小化Loss函數(shù),更新模型參數(shù)

        13.end for

        2.1 基于自編碼的結構嵌入層

        本層主要作用是捕獲鄰域信息和嵌入節(jié)點拓撲向量,如圖2第一行所示,從網(wǎng)絡拓撲到鄰接矩陣進而生成拓撲向量,最終得到節(jié)點嵌入。本層以節(jié)點級別向量作為輸入,采用經(jīng)典RWR算法來豐富向量表示,該方法相比node2vec時間復雜度更低且所需要學習參數(shù)更少,同時在網(wǎng)絡數(shù)據(jù)挖掘中表現(xiàn)出了良好效果。

        圖2 鏈路預測框架DTA-LP的工作流程Fig.2 Workflow of proposed link prediction framework DTA-LP

        給定一個時間演化網(wǎng)絡G,對于每個時間t下有Gt=(V,At,Xt),對鄰接矩陣At,對應一個轉移矩陣T,T定義為從當前節(jié)點游走到其他鄰居節(jié)點的概率,對于T中每一個行向量ti=ti di,di為第i個節(jié)點的度數(shù),用α表示繼續(xù)游走的概率,1-α為重啟游走的概率,那么經(jīng)過K次游走之后到達每個節(jié)點的概率ptk可以由公式(1)計算:

        因此在t時刻經(jīng)過K次游走之后,節(jié)點的拓撲上下文向量定義表示為:

        at仿照自編碼的encoder部分,如公式(3)~(5)所示,計算過程中使用多個并行的編碼器,將其與動態(tài)圖所關注時間長度關聯(lián),簡稱之為回看(lookback,l)。對于每一個回看都存在一個編碼器,由不同維度的稠密層連接構成。

        其中,fa為激活函數(shù)(Leaky ReLU),W是權重矩陣,at∈N×N,p表示編碼器的層數(shù),得到y(tǒng)t(p)為t時刻結構嵌入,多個并行encoder最終得到結構嵌入ys=為拓撲向量嵌入到隱式空間維度的大小,是一個重要的超參數(shù)。

        2.2 基于注意力機制的拓撲和屬性融合層

        由結構嵌入層可以得到低維拓撲向量ys,本層是實現(xiàn)拓撲和屬性融合。如圖2第二行所示,拓撲和屬性通過注意層生成嵌入,其中屬性數(shù)據(jù)Xt維度較低,不需要嵌入可以直接用于融合。不同時間下屬性信息,將結構嵌入ys和ya作為輸入,通過公式(6)~(8)計算出融合嵌入yt。

        2.3 基于LSTM的時間捕獲層

        由注意層生成融合嵌入yt,特征中包含未處理時序信息,為捕獲網(wǎng)絡中時間變化模式,最終得到融合時間特征的嵌入。由圖2中時間捕獲層所示,構建LSTM層,處理數(shù)據(jù)長時間依賴問題。第一個單層LSTM網(wǎng)絡的定義如下:

        其中,yt是當前時刻的輸入,ht-1是上一時刻的輸出,Wf為權重矩陣,b為偏置向量,σ為sigmoid函數(shù)輸出為0到1之間,公式(9)中ft為遺忘門,公式(12)中用ft?Ct-1控制Ct-1的通過,趨近于0時表示流入不能通過遺忘門,趨近于1時表示流入完全通過遺忘門。公式(10)、(11)為輸入門,為Ct-1添加當前時刻新的輸入信息,對于it采用和遺忘門相同的原理,用sigmoid函數(shù)控制輸入信息,公式(11)使用tanh作為激活函數(shù)對輸入信息處理生成Ct,tanh函數(shù)控制輸出在?1到1之間,然后在公式(12)中用it?Ct控制輸入信息多少,并更新Ct-1成為當前時刻的狀態(tài)。公式(13)、(14)為輸出門,公式(13)同樣采用sigmoid函數(shù)控制輸出信息,經(jīng)過公式(14)最終生成當前輸出ht。經(jīng)過LSTM遺忘門、輸入門和輸出門能夠有效的防止了RNN梯度爆炸和梯度消失問題。

        本文模型設計了兩層LSTM層來捕獲時序信息,第一層輸入為帶時序信息的融合嵌入yt,輸出為h=LSTM1(yt),其中h={h1,h2,…,ht}∈Rt×d1作為第二層的輸入,即y=LSTM2(h),其中y∈Rt×d2為最后一個時刻的輸出,d1、d2分別為第一層和第二層LSTM輸出維度,y為結構、屬性和時序信息的融合嵌入,具體由公式(15)、(16)計算。

        最后,由LSTM網(wǎng)絡生成的隱藏表示y被傳遞給一個由稠密層組成的解碼器,decoder完全按照encoder采用反向結構設計得到,如圖2綠色解碼器所示最終得到At+1。

        2.4 損失函數(shù)設計

        對于動態(tài)圖的鏈路預測而言,其目的是預測在下一時刻存在的邊。因此將損失函數(shù)設計為預測拓撲向量L和實際拓撲向量L的差值,為了增加預測概率,引用加權矩陣B對差值加權。B是通過鄰接矩陣At+1來構造,與其不同之處在于At+1中aij=1時B中bij=β,其中β為懲罰項,損失函數(shù)設計為如下形式[30]:

        在訓練過程中,通過學習t時間段內嵌入來預測在t+1時刻的邊。通過最小化上述損失函數(shù)來反向優(yōu)化模型參數(shù),最終準確預測未來的邊。

        3 實驗配置

        所有實驗均在64位16.04.1-Ubuntu系統(tǒng)上進行,配置為Intel?Xeon?Gold 6240 CPU@2.60 GHz,RAM為256 GB,GUP為2×GeForce RTX 2080TI。

        3.1 數(shù)據(jù)集

        使用四個真實世界的數(shù)據(jù)集,相關信息如表2所示。DataBase systems and Logic Programming(DBLP-5)和Epinions用于基于結構和屬性的動態(tài)鏈路預測實驗,Autonomous Systems(AS)和High Energy Physics Theory conference(Hep-TH)用于基于結構的動態(tài)鏈路預測實驗。

        表2 數(shù)據(jù)集的描述Table 2 Description of datasets

        DBLP-5是一個研究者協(xié)作網(wǎng)絡數(shù)據(jù)集,作者來自五個研究領域。其中節(jié)點表示作者,網(wǎng)絡快照中的節(jié)點屬性是通過word2vec從通訊作者某一時間段的出版物標題和摘要中提取出來的。

        Epinions數(shù)據(jù)來自一個產品評論網(wǎng)站,根據(jù)用戶之間構建的圖來尋求他人的建議。節(jié)點表示用戶,如果其中一個節(jié)點向另一個節(jié)點尋求建議,則兩個節(jié)點在網(wǎng)絡快照中存在邊,節(jié)點屬性由word2vec從評論中生成,考慮實驗比對的公平性,從這個數(shù)據(jù)集中抽取2 000個節(jié)點進行訓練和測試。

        AS數(shù)據(jù)來自BGP(邊界網(wǎng)關協(xié)議)日志對話的通信網(wǎng)絡,原始數(shù)據(jù)集時間從1997年11月8日到2000年1月2日,采用了時間最近的20個快照,從這個數(shù)據(jù)集中抽取2 000個節(jié)點的子圖。

        Hep-TH是高能物理理論會議上作者的協(xié)作網(wǎng)絡,原始數(shù)據(jù)集包含1993年1月至2003年4月期間高能物理理論會議的論文摘要,采取一個月為一個時間跨度,提取了最近20個快照,同樣從這個數(shù)據(jù)集中抽取2 000個節(jié)點的子圖。

        3.2 對比方法

        將DTA-LP模型與當前先進的鏈路預測方法Dyn-AERNN和SLIDE比較。

        DynAERNN是Dyngraph2vec中性能最好的鏈路預測模型,它是基于拓撲網(wǎng)絡的鏈路預測,使用t時刻之前的網(wǎng)絡拓撲來預測t+1時刻的邊。

        SLIDE[22]是基于動態(tài)屬性網(wǎng)絡的鏈路預測,使用t時刻之前的拓撲和屬性信息來預測t+1時刻的邊。

        3.3 評價指標

        實驗中,使用t+1時刻的圖來評估鏈路預測模型,使用平均精度(mean average precision,MAP)[30]作為衡量模型效果的指標,MAP是對所有節(jié)點精度進行平均之后的結果。

        模型預測的邊用Epred表示,真實存在的邊用Etrue表示,P@k定義為正確預測前k條邊的得分,定義如下:

        對于MAP的計算如下:

        其中,Δi(j)表示頂點i到j存在邊,V是頂點集,MAP值越高,表明該模型對絕大多數(shù)節(jié)點的預測效果越好。

        4 實驗結果及分析

        為了便于驗證本文提出算法的有效性,進行了三類實驗:(1)基于拓撲結構的動態(tài)鏈路預測;(2)基于節(jié)點屬性的動態(tài)鏈路預測;(3)基于拓撲和屬性融合的動態(tài)鏈路預測。

        4.1 基于拓撲數(shù)據(jù)的動態(tài)鏈路預測

        在基于拓撲結構的實驗下,為探索不同嵌入維度對預測效果的影響,選取DBLP-5和Epinions兩個數(shù)據(jù)集,使用DynAERNN算法和所提算法進行實驗對比。結果如圖3所示,DTA-LP模型整體性能隨維度的增加而增 加。與DynAERNN算法相比,DTA-LP在DBLP-5數(shù)據(jù)集上性能提升50%,在Epinions數(shù)據(jù)集上性能提升1.2%。另一個發(fā)現(xiàn)是,在DBLP-5數(shù)據(jù)集上嵌入維度很低時,DTA-LP算法也有良好的性能,能夠很好地表達原始拓撲信息,降低模型復雜度。因此在DBLP-5數(shù)據(jù)集中選取嵌入維度最低的32作為后續(xù)實驗參數(shù),考慮到Epinions數(shù)據(jù)集的整體效果穩(wěn)定,選定最好性能256作為Epinions后續(xù)實驗參數(shù)。

        圖3 嵌入維度對性能的影響Fig.3 Impact of embedding dimensions on performance

        此外,時間步長也是序列分析的一個重要參數(shù),回看數(shù)據(jù)量變化在預測未來能發(fā)揮不同的作用。為了分析回看值lookback對MAP影響,回看值取值范圍從2到6,實驗結果如圖4所示。與DynAERNN算法相比,DTA-LP模型在DBLP-5數(shù)據(jù)集上性能提升78%,隨著回看值不斷增加,DTA-LP算法預測精度呈正態(tài)分布,因此在選擇回看值參數(shù)時一般不會太小或太大,不同數(shù)據(jù)集也應當選擇適當?shù)幕乜粗?。故在DBLP-5和Epinions數(shù)據(jù)集上,分別選取回看值3和2作為后續(xù)實驗的參數(shù)。

        為測試迭代次數(shù)對性能的影響,在DBLP-5數(shù)據(jù)集上參數(shù)設置為lookback=3、embedding=32、Epoch步長為10。Epinions數(shù)據(jù)集上參數(shù)設置為lookback=2、embedding=256、Epoch步長為10。實驗結果如圖5所示,由(a)、(c)子圖可知在兩個數(shù)據(jù)集上,DTA-LP算法MAP曲線一直位于DynAERNN上方,由(b)、(d)子圖可知Loss曲線一直處于DynAERNN下方,表明本文模型性能在結構實驗優(yōu)于DynAERNN。對比(b)、(d)損失函數(shù)曲線可以發(fā)現(xiàn)隨著Epoch不斷增加,DTA-LP算法取得了更快的下降效果及更小的Loss值。與此同時對應DTA-LP算法MAP曲線有更快的上升效果及更高的MAP值。值得一提的是,在Epinions數(shù)據(jù)上,只將訓練集固定為圖中的節(jié)點數(shù),相比DynAERNN模型這是DTA-LP訓練速度更快的原因之一。為節(jié)省模型訓練時間,將DBLP-5和Epinions上Epoch參數(shù)分別設置為30和200。

        圖5 Epoch對性能的影響1Fig.5 Impact of Epoch on performance

        為進一步說明DTA-LP模型的有效性,設計實驗采用和DynAERNN論文中相同的數(shù)據(jù)集和模型參數(shù),驗證所提方法在結構上的有效性。按照DynAERNN模型中設置參數(shù)embedding=128,sample=2 000,length=20,不同lookback下的結果如圖4(c)、(d)子圖所示。在AS數(shù)據(jù)集上DTA-LP模型和DynAERNN模型MAP值大致相同,在Hep數(shù)據(jù)集上雖然DTA-LP模型比起Dyn-AERNN模型的MAP標準差較大,但是卻有著最優(yōu)的MAP值。

        圖4 回看值對性能的影響1Fig.4 Impact of lookback values on performance

        綜上所有基于拓撲數(shù)據(jù)的實驗表明,DTA-LP鏈路預測性能超過當前先進的動態(tài)鏈路預測方法。

        4.2 基于節(jié)點屬性的動態(tài)鏈路預測

        采用和拓撲實驗相同設計思路,本實驗進行屬性上的動態(tài)鏈路預測。對DBLP-5和Epinions數(shù)據(jù)集分別設計嵌入維度為64和16,探索以往時間步長對于之后結構預測的影響,回看值取值范圍為2到6,測試屬性數(shù)據(jù)的動態(tài)鏈路預測效果,結果如圖6所示。DynAERNN在屬性鏈路預測實驗中,MAP值隨著回看值增加而呈現(xiàn)下降趨勢,而DTA-LP有增漲趨勢并呈現(xiàn)正態(tài)分布,且平均MAP值都明顯高于DynAERNN算法。在兩個數(shù)據(jù)集上MAP值分別提升82%和195%。在lookback=6時DynAERNN和DTA-LP算法MAP都顯著下降,分析原因是數(shù)據(jù)集只有11個時間步,lookback=6時由于訓練集不足導致模型效果下降,這一點在結構數(shù)據(jù)預測時也存在。為更好地捕獲屬性信息,在DBLP-5和Epinions數(shù)據(jù)集上將回看值分別設置為3和4。

        圖6 回看值對性能的影響2Fig.6 Impact of lookback values on performance

        實驗同樣考慮DTA-LP模型在訓練中MAP值和損失函數(shù)隨Epoch增加的變化,在DBLP-5和Epinions數(shù)據(jù)集上回看值分別設置為3和4,結果如圖7所示。總體來看DTA-LP比DynAERNN算法MAP值更高,Loss值更低,表明DTA-LP算法能夠很好地捕獲網(wǎng)絡屬性信息用于鏈路預測。由子圖(a)、(b)可知,在DBLP-5數(shù)據(jù)集上DTA-LP算法在Epoch=50時就能夠很好地完成,DynAERNN算法Epoch至少要70次才能夠收斂。從子圖(c)、(d)中看出DTA-LP算法比DynAERNN有更高的MAP值,DTA-LP算法在Epoch=1 400時趨于穩(wěn)定。

        圖7 Epoch對性能的影響2Fig.7 Impact of Epoch on performance

        綜上可說明,在動態(tài)鏈路預測中屬性數(shù)據(jù)的有效性;可用t時刻之前節(jié)點的屬性來推測t+1時刻存在的邊;同時DTA-LP模型可以很好地捕獲動態(tài)網(wǎng)絡的屬性信息。

        4.3 基于拓撲和屬性融合的動態(tài)鏈路預測

        基于前面實驗,本實驗是運用DTA-LP模型融合拓撲和屬性進行動態(tài)鏈路預測,實驗借鑒前兩部分探索得到的超參數(shù)來進行。DBLP-5數(shù)據(jù)集上設置參數(shù)embedding=32,Epoch=30,Epinions數(shù)據(jù)集上設置embedding=256,Epoch=500。特別指出,在Epinions數(shù)據(jù)集上實驗時,結構嵌入和屬性向量采用拼接的方式進行特征融合,實驗結果由圖8和表3所示。

        表3 DTA-LP、DynAERNN在Epinions數(shù)據(jù)集的實驗結果Table 3 Experimental results of DTA-LP and DynAERNN on Epinions dataset

        圖8 DTA-LP、DynAERNN在DBLP數(shù)據(jù)集的實驗結果Fig.8 Experimental results of DTA-LP and DynAERNN in DBLP dataset

        可以看出,在兩個數(shù)據(jù)集上DTA-LP融合實驗的平均MAP得分最高,DTA-LP和DynAERNN拓撲實驗結果次之。DTA-LP融合實驗相比自身結構實驗,在DBLP-5和Epinions數(shù)據(jù)集上分別提升7.7%和1.1%,DTA-LP整體優(yōu)于DynAERNN算法。可以證明DTA-LP融合算法的優(yōu)越性,以及將拓撲和屬性進行融合方法的有效性。特別指出,考慮與其他算法比對的便捷性,DTA-LP融合實驗沒有探索最優(yōu)的embedding、lookback和Epoch參數(shù)。僅參考前面的實驗結果和參數(shù),便可以得到比DynAERNN算法更優(yōu)的MAP值,足以說明DTA-LP算法在注意力融合機制的巨大能力和潛力。

        為進一步體現(xiàn)DTA-LP算法性能,在DBLP-5和Epinions數(shù)據(jù)集上對DTA-LP和SLIDE算法進行了對比,結果如表4所示。DTA-LP能夠有效預測未來時刻的邊,取得較高的MAP值??梢哉f明DTA-LP在處理屬性和拓撲信息上相比SLIDE取得了較大的進步。

        表4 DTA-LP、SLIDE融合實驗的平均MAP值Table 4 Mean MAP values of DTA-LP,SLIDE fusion experiment

        綜上,DTA-LP相比目前先進的方法有了顯著提升。DTA-LP在結構上優(yōu)于DynAERNN方法,并可以有效引入屬性信息,進一步提升鏈路預測性能。通過與SLIDE方法對比,體現(xiàn)DTA-LP在動態(tài)屬性圖上鏈路預測的高效性。

        5 結論與展望

        本文提出一種基于動態(tài)屬性圖的鏈路預測方法,利用原始時序網(wǎng)絡中的拓撲和屬性信息,預測在下一時刻網(wǎng)絡可能存在的邊。提出了一種注意力融合機制,驗證了模型在四個真實數(shù)據(jù)集上的有效性和可行性,說明了在動態(tài)鏈路預測中節(jié)點屬性信息可以作為有效補充。融合模型效果優(yōu)于目前基于結構以及屬性融合的鏈路預測算法。

        在接下來的工作中,需要在更多的數(shù)據(jù)集上驗證算法的可行性,需要通過注意力權重考慮節(jié)拓撲和屬性對鏈路預測的不同貢獻。之后研究不僅是融合屬性信息,還可以豐富更多網(wǎng)絡信息。

        猜你喜歡
        集上鏈路動態(tài)
        家紡“全鏈路”升級
        國內動態(tài)
        國內動態(tài)
        國內動態(tài)
        天空地一體化網(wǎng)絡多中繼鏈路自適應調度技術
        移動通信(2021年5期)2021-10-25 11:41:48
        Cookie-Cutter集上的Gibbs測度
        鏈完備偏序集上廣義向量均衡問題解映射的保序性
        動態(tài)
        復扇形指標集上的分布混沌
        基于3G的VPDN技術在高速公路備份鏈路中的應用
        国产一精品一av一免费爽爽| 4hu44四虎www在线影院麻豆| 丝袜美腿亚洲综合玉足| 穿着白丝啪啪的av网站| 国产精品久久国产精品99| 久久99精品久久久久久| 久久久久无码中文字幕| 久久精品国产免费一区二区三区| 国产人妻大战黑人20p| 色先锋资源久久综合5566| 爱v天堂在线观看| 性生大片免费观看性少妇| 国产一区内射最近更新| 在线观看免费午夜大片| 熟妇高潮一区二区三区| 无码精品一区二区免费AV| 丰满少妇又爽又紧又丰满动态视频| 久久国内精品自在自线| 野狼第一精品社区| 欧美成人精品三级在线观看| 亚洲天堂av在线免费播放| 极品美女扒开粉嫩小泬图片| 成人精品综合免费视频| 一区在线播放| 在线中文字幕一区二区| 亚洲av综合a色av中文| 国产高级黄区18勿进一区二区| 91蜜桃精品一区二区三区毛片 | 人人妻人人澡人人爽人人dvd| 无遮无挡爽爽免费视频| 99热国产在线| 国产91在线播放九色快色| 亚洲精品美女久久777777| 亚洲日本va中文字幕久久| 亚洲精品区二区三区蜜桃| 国产精品人成在线观看免费| 国产熟人av一二三区| 无码高清视频在线播放十区| 亚洲丰满熟女乱一区二区三区| 777米奇色8888狠狠俺去啦| 国产一毛片|