馬滿福,姜璐娟,李 勇,張 強,范顏軍,鄧曉飛
(1.西北師范大學計算機科學與工程學院,甘肅 蘭州 730070;2.西北工業(yè)大學計算機學院,陜西 西安 710129)
個性化推薦系統(tǒng)在線上購物、社交平臺和流媒體等眾多互聯(lián)網(wǎng)應用中得到廣泛應用,主要對用戶行為、商品特征等進行學習,對用戶偏好進行預測,從而減輕信息超載,提供個性化服務(wù),輔助用戶決策等[1,2]。目前,大部分電商平臺,如淘寶、京東等,都利用所掌握的用戶行為數(shù)據(jù),對用戶偏好進行預測,然后為用戶提供相關(guān)的產(chǎn)品推薦[3,4]。在各類推薦系統(tǒng)中,對用戶在線點擊行為數(shù)據(jù)進行挖掘的鏈路預測方法一直得到廣泛應用。鏈路預測旨在通過分析已知網(wǎng)絡(luò)節(jié)點和網(wǎng)絡(luò)結(jié)構(gòu)等信息,預測網(wǎng)絡(luò)中的任意2個節(jié)點產(chǎn)生一條連邊的可能性[5]。
鏈路預測最常用的方法是啟發(fā)式方法[6],通過計算節(jié)點間的相似性來判斷鏈接存在的可能性。低階啟發(fā)式算法,如CN(Common Neighbor)和PA(Preferential Attachment),涉及網(wǎng)絡(luò)中目標節(jié)點的一階和二階鄰居,高階啟發(fā)式算法,如Katz、PageRank等,考慮x(x≥2)階鄰居。高階啟發(fā)式相較一階和二階啟發(fā)式算法性能更優(yōu),但會導致高的時間復雜度和內(nèi)存消耗問題,而且啟發(fā)式算法使用圖結(jié)構(gòu)特征,缺乏考慮包含豐富信息的網(wǎng)絡(luò)顯式特征和隱式特征[7]。此外,現(xiàn)有的鏈路預測算法大多數(shù)基于無向無權(quán)網(wǎng)絡(luò),不能直接應用于有向加權(quán)的注意力流網(wǎng)絡(luò)。
推薦系統(tǒng)通常依賴用戶行為數(shù)據(jù),如用戶瀏覽時間、點擊次數(shù)、搜索次數(shù)和停留時間等,基于用戶集體行為數(shù)據(jù)構(gòu)建的注意力流網(wǎng)絡(luò)CAFN(Collective Attention Flow Network)分析方法為推薦系統(tǒng)研究帶來了新方向[8,9]。集體注意力流網(wǎng)絡(luò)由在線用戶點擊流數(shù)據(jù)構(gòu)建而成,是節(jié)點和邊皆有屬性的有向加權(quán)網(wǎng)絡(luò),基于CAFN的鏈路預測對推薦系統(tǒng)和知識圖譜補全等領(lǐng)域具有重要的研究意義[10,11]。
本文針對傳統(tǒng)啟發(fā)式鏈路預測方法存在的不足,提出了基于集體注意力流網(wǎng)絡(luò)模型的鏈路預測算法AFP(Attention Flow Prediction)。該算法將注意力流網(wǎng)絡(luò)節(jié)點間不同的邊方向抽象為2種邊關(guān)系類型,并引入注意力機制學習網(wǎng)絡(luò)中的節(jié)點屬性和邊屬性[12],綜合考慮了網(wǎng)絡(luò)的圖結(jié)構(gòu)特征、顯式特征和隱式特征,將鏈路預測問題轉(zhuǎn)化為一個二分類問題,即判斷節(jié)點間的邊屬于某個關(guān)系類型的可能性大小,在推薦系統(tǒng)等領(lǐng)域具有重要的應用價值。本文研究內(nèi)容包含以下4個方面:
(1)基于有向加權(quán)注意力流網(wǎng)絡(luò)和R-GCN(Relational-Graph Convolutional Network)算法提出了新的鏈路預測算法AFP。該算法引入注意力機制取代了傳統(tǒng)R-GCN算法中的參數(shù)權(quán)值共享,將網(wǎng)絡(luò)中的邊方向抽象為2種關(guān)系類型,有效解決了有向加權(quán)網(wǎng)絡(luò)邊關(guān)系的準確預測問題。
(2)在R-GCN基礎(chǔ)上,引入注意力機制學習節(jié)點特征表示。注意力流網(wǎng)絡(luò)中的節(jié)點和邊具有不同的權(quán)重,引入注意力機制取代了傳統(tǒng)R-GCN算法中的權(quán)重共享方法,通過每個關(guān)系的不同重要性程度聚合鄰居信息。
(3)將注意力流網(wǎng)絡(luò)中的邊方向抽象為{rin:vi←vj;rout:vi→vj}2種關(guān)系類型。針對不同的關(guān)系類型,分別學習并聚合不同節(jié)點和邊的特征信息,有效表征了網(wǎng)絡(luò)中邊的方向信息。
(4)綜合學習網(wǎng)絡(luò)的圖結(jié)構(gòu)特征、顯式特征和隱式特征。在學習節(jié)點特征的過程中,考慮注意力流網(wǎng)絡(luò)的局部結(jié)構(gòu)、節(jié)點嵌入、網(wǎng)站停留時間和點擊次數(shù)等特征,捕獲了關(guān)于網(wǎng)絡(luò)的更多信息,并且有效提升了預測性能。
鏈路預測是推薦系統(tǒng)中使用的重要方法之一,通過分析已知網(wǎng)絡(luò)節(jié)點及網(wǎng)絡(luò)結(jié)構(gòu)等信息,挖掘網(wǎng)絡(luò)底層的潛在規(guī)律,預測網(wǎng)絡(luò)中的任意2個節(jié)點在未來產(chǎn)生連邊的可能性。現(xiàn)有的鏈路預測方法大多數(shù)都是基于無向無權(quán)圖的。文獻[13]在多路復用網(wǎng)絡(luò)上結(jié)合層相似性度量方法和層重構(gòu)方法,在多個無向圖上實現(xiàn)了鏈路預測。文獻[14]結(jié)合概率啟發(fā)式和注意力機制,通過合適的學習方式來預測無向圖中的鏈接,無需依賴復雜特征工程。文獻[15]提出了一種捕獲網(wǎng)絡(luò)中的高階結(jié)構(gòu)的嵌入算法,并在多個無向圖上驗證了其有效性。文獻[16]使用屬性信息識別社交網(wǎng)絡(luò)中新鏈接和節(jié)點的位置,預測網(wǎng)絡(luò)中的新關(guān)系和缺失關(guān)系。這些方法在無向圖上的預測性能優(yōu)異,但不能有效地應用于有向加權(quán)圖。
現(xiàn)實世界中,推薦系統(tǒng)研究面對的大多數(shù)網(wǎng)絡(luò)都是有向加權(quán)圖,基于無向圖的方法不能有效地處理具有復雜交互關(guān)系的有向加權(quán)圖。文獻[17]提出了一種基于AUC(Area Under the Curve)的鏈路預測方法,將鏈路預測問題轉(zhuǎn)化為優(yōu)化問題,在有向圖上實現(xiàn)了高質(zhì)量預測。文獻[18]提出了WLNM(Weisfeiler-Lehman Neural Model)鏈接預測方法,以圖模式學習拓撲特征,根據(jù)頂點在提取的子圖中的結(jié)構(gòu)角色標記頂點,同時保留子圖的內(nèi)在方向性。文獻[19]提出了一種有監(jiān)督的鏈接預測方法來預測研究人員的引文數(shù),該方法可以預測鏈接及其權(quán)重。這些方法都考慮了網(wǎng)絡(luò)中邊的方向,但沒有綜合學習網(wǎng)絡(luò)的圖結(jié)構(gòu)特征、顯式特征和隱式特征,有向加權(quán)的注意力流網(wǎng)絡(luò)節(jié)點和邊皆有屬性,所以上述方法在該網(wǎng)絡(luò)上是無效的。
Figure 1 Framework of AFP algorithm
注意力流網(wǎng)絡(luò)由在線用戶點擊網(wǎng)站的序列數(shù)據(jù)構(gòu)建而成,是一種節(jié)點和邊都帶有屬性的有向加權(quán)網(wǎng)絡(luò)。對注意力流網(wǎng)絡(luò)的點擊率進行預測是互聯(lián)網(wǎng)廣告系統(tǒng)和推薦系統(tǒng)中最重要且最具挑戰(zhàn)的預測之一。文獻[20]提出了基于特征交互的神經(jīng)網(wǎng)絡(luò),通過三維關(guān)系張量對特征交互進行建模,提高了深度神經(jīng)網(wǎng)絡(luò)在點擊率預測任務(wù)中的性能。文獻[21]提出了自動特征交互選擇兩階段算法,可以在模型訓練過程中自動識別和去除冗余特征交互。文獻[22]提出了一個端到端的框架RippleNet,通過沿著知識圖中的鏈接自動、迭代地擴展用戶的潛在興趣,以刺激用戶偏好在知識實體集上的傳播,可用于預測最終點擊率并進行推薦。隨著以用戶行為數(shù)據(jù)分析為主的推薦系統(tǒng)的發(fā)展,對基于用戶行為的注意力流網(wǎng)絡(luò)的研究吸引了越來越多的研究人員并在網(wǎng)絡(luò)的特征捕獲方面取得了優(yōu)異的效果,但基于該網(wǎng)絡(luò)的鏈路預測方法還很少。
綜上,現(xiàn)有針對不同網(wǎng)絡(luò)類型考慮不同網(wǎng)絡(luò)信息的建模方法,還沒有綜合考慮網(wǎng)絡(luò)的圖結(jié)構(gòu)特征、顯式特征和隱式特征,不能有效應用于有向加權(quán)的注意力流網(wǎng)絡(luò);此外,注意力流網(wǎng)絡(luò)已成為依賴用戶行為數(shù)據(jù)分析的推薦系統(tǒng)的一個重要分支,卻鮮有基于注意力流網(wǎng)絡(luò)的鏈路預測算法研究。鑒于此,本文提出了基于有向加權(quán)注意力流網(wǎng)絡(luò)的鏈路預測算法AFP,綜合學習了網(wǎng)絡(luò)的圖結(jié)構(gòu)特征、顯式特征和隱式特征,彌補了上述相關(guān)研究中的不足,并通過多個評價指標驗證了該算法的有效性。
AFP算法整體框架如圖1所示,由一個編碼器和一個解碼器組成。首先,編碼器將高維的圖數(shù)據(jù)映射到低維的向量空間中。在學習節(jié)點特征向量的過程中,把網(wǎng)絡(luò)中不同的邊方向抽象為2種關(guān)系類型,目標節(jié)點根據(jù)不同的類型聚合不同的鄰居信息,并引入注意力機制融合學習網(wǎng)絡(luò)中的節(jié)點屬性和邊屬性,經(jīng)過多個隱藏層得到的向量可以表征網(wǎng)絡(luò)中節(jié)點的局部結(jié)構(gòu)。其次,編碼器獲得的節(jié)點向量表示和關(guān)系類型以三元組形式輸入解碼器,解碼器采用DistMult評分函數(shù)計算三元組成立的概率,當概率值大于閾值ε時輸出1,表示三元組關(guān)系成立;否則輸出0,表示三元組關(guān)系不成立。最后,將評分結(jié)果映射到高維圖數(shù)據(jù)中,便可得到最終的鏈路預測結(jié)果。
本文使用中國物聯(lián)網(wǎng)信息中心提供的在線用戶瀏覽網(wǎng)站的行為日志數(shù)據(jù)作為實驗對象,數(shù)據(jù)記錄了用戶開關(guān)時間、瀏覽網(wǎng)站的URL等信息。首先,清洗數(shù)據(jù)并過濾無用信息,抽取1 000名用戶1個月的點擊網(wǎng)站數(shù)據(jù)來構(gòu)建注意力流網(wǎng)絡(luò)。將在線用戶瀏覽點擊的網(wǎng)站抽象成網(wǎng)絡(luò)中的節(jié)點,網(wǎng)站與網(wǎng)站之間的跳轉(zhuǎn)抽象成網(wǎng)絡(luò)中的邊,網(wǎng)站停留時長作為節(jié)點權(quán)重,網(wǎng)站間的跳轉(zhuǎn)頻數(shù)作為邊權(quán)重。當用戶在網(wǎng)站停留時間超過30 min時,該網(wǎng)站作為一個新節(jié)點加入網(wǎng)絡(luò),同時產(chǎn)生一條新連邊,以此構(gòu)建了集體注意力流網(wǎng)絡(luò)。該網(wǎng)絡(luò)由20 115個節(jié)點和125 557條邊組成,構(gòu)建的集體注意力流網(wǎng)絡(luò)符合復雜網(wǎng)絡(luò)的“冪律分布”[23],網(wǎng)絡(luò)的可視化效果如圖2所示。
Figure 2 Collective attention flow network
集體注意力流網(wǎng)絡(luò)中,用戶在網(wǎng)站的停留總時間表示網(wǎng)站對用戶注意力的吸引。網(wǎng)站間的跳轉(zhuǎn)次數(shù)與網(wǎng)站的度相關(guān),入度反映了網(wǎng)站的吸引力,出度反映了網(wǎng)站的活躍程度,綜合考慮網(wǎng)站的出度和入度,網(wǎng)站度集和鄰居網(wǎng)站中網(wǎng)站vi的總度值,即集體注意力流網(wǎng)絡(luò)的顯式特征。通過結(jié)合R-GCN和注意力機制來學習網(wǎng)站間關(guān)系的復雜性和關(guān)系權(quán)重的多樣性,即隱式特征。
具體地,網(wǎng)絡(luò)中的節(jié)點vi將自身的特征信息hi經(jīng)過抽取變換后,共享給同一關(guān)系下的鄰居節(jié)點vj;接著,將2個節(jié)點的特征信息hi和hj聚集起來,實現(xiàn)局部結(jié)構(gòu)信息融合;最后,將聚合的信息進行非線性變換,更新網(wǎng)絡(luò)中節(jié)點在l+1層的特征狀態(tài),如式(1)所示:
(1)
(2)
(3)
(4)
將注意力機制與R-GCN算法鄰域特征更新規(guī)則相結(jié)合,式(1)轉(zhuǎn)換為式(5):
(5)
以注意力流網(wǎng)絡(luò)中任意節(jié)點vi為例,基于關(guān)系類型rin:vi←vj,該節(jié)點不僅考慮了節(jié)點自身特征hi,而且還聚合了其鄰居節(jié)點vj的特征信息hj,并根據(jù)關(guān)系類型進行相應變換和歸一化操作,此時節(jié)點特征狀態(tài)的更新由式(5)轉(zhuǎn)換為式(6):
(6)
節(jié)點vi基于第2種關(guān)系類型rout:vi→vj,節(jié)點特征狀態(tài)更新如式(7)所示:
(7)
綜合考慮節(jié)點vi與任意節(jié)點的2種不同關(guān)系類型,其特征狀態(tài)更新描述如式(8)所示:
(8)
(9)
基于上述給定的評分函數(shù)f(),在訓練過程中使用負采樣,對網(wǎng)絡(luò)中的每一個正樣本,隨機修改三元組中的節(jié)點。利用交叉熵損失函數(shù)優(yōu)化損失值,通過迭代求解損失值,并采用隨機梯度下降來優(yōu)化算法,迭代過程直至收斂或迭代次數(shù)超過一個閾值α時停止,故損失函數(shù)如式(10)所示:
(1-yij)log(1-σ(f(Z))))
(10)
其中,σ()是sigmoid激活函數(shù),yij是節(jié)點標簽,yij=1表示節(jié)點vi和節(jié)點vj間存在連邊,yij=0表示節(jié)點vi和節(jié)點vj不存在連邊。Dtrain表示訓練集,Z為訓練集中的樣本。
鏈路預測算法AFP如算法1所示。
算法1AFP算法
輸入:三元組Z=(vi,R,vj);層數(shù)L;輸入特征{hi,?vi∈V};激活函數(shù)。
輸出:三元組成立的概率f(Z)。
1.VK←V;
2.forl=L,…,1do
3.Vl←Vl+1;
4.forvi∈Vl+1do
5.Vl←Vl∪Nl+1(i);/*Nl+1(i)表示節(jié)點vi在第l+1次聚合時的鄰域*/
6.end
7.end
9.forl=L,…,1do
10.forvi∈Vldo
13.end
14.end
17.returnf(Z)
基于中國互聯(lián)網(wǎng)絡(luò)信息中心提供的在線用戶行為數(shù)據(jù)[24],本文構(gòu)建了一個由20 115個節(jié)點和125 557條邊組成的集體注意力流網(wǎng)絡(luò),網(wǎng)絡(luò)中節(jié)點的平均度為6.251。集體注意力流網(wǎng)絡(luò)中度大的節(jié)點相對稀少,度小的節(jié)點較多且分布集中,符合“長尾分布”[23],可用于復雜網(wǎng)絡(luò)鏈路預測任務(wù)研究。
本文選擇了6個經(jīng)典算法與提出的AFP算法作對比:(1)GCN(Graph Convolutional Network)[25]算法結(jié)合深度優(yōu)先搜索和廣度優(yōu)先搜索對圖中的節(jié)點進行采樣,利用word2vec的思想來學習節(jié)點表示向量;(2)GAT(Graph Attention Network)[26]在GCN的基礎(chǔ)上引入Attention思想,計算每個節(jié)點的鄰居節(jié)點對它的權(quán)重,從而獲取鄰近點的特征;(3)GraphSAGE(Graph SAmple and aggreGatE)[27]利用節(jié)點特征信息和結(jié)構(gòu)信息得到圖嵌入映射;(4)TransE(Translating Embeddings)[28]利用詞向量的平移不變,對三元組實例,通過不斷調(diào)整h、r和t(Head、Relation和Tail的向量)使(h+r)盡可能與t相等;(5)DistMult[29]采用基于相似性的打分函數(shù),通過匹配實體和關(guān)系在嵌入向量空間的潛在語義衡量三元組成立的可能性;(6)ComplEx(ComplEx embeddings)[30]在DistMult的基礎(chǔ)上引入復值嵌入,取復值點積的實部作為三元組得分。
本文采用鏈路預測任務(wù)中常用的評價指標準確度(Accuracy)、精準度(Precision)、召回率(Recall)和F1值來評價各算法。下述各公式中的TP表示正例預測正確的個數(shù);FP表示負例預測正確的個數(shù);TN表示負例預測錯誤的個數(shù);FN表示正例預測錯誤的個數(shù)。各指標簡要描述如下:
(1)Accuracy:所有三元組Z=(vi,R,vj)中預測正確的比例,如式(11)所示:
(11)
(2)Precision:正確預測正例樣本數(shù)與預測為正例的樣本數(shù)的比例,如式(12)所示:
(12)
(3)Recall:正確預測正例樣本數(shù)與所有正例樣本數(shù)的比例,如式(13)所示:
(13)
(4)F1值:綜合考慮Precision和Recall得分,是Precision和Recall的調(diào)和均值,如式(14)所示:
(14)
除上述4個評價指標外,本文還采用推薦系統(tǒng)和知識圖譜廣泛使用的MRR和Hits@K指標對TransE、DistMult、ComplEx和AFP進行對比。分別簡要描述如下:
(1)MRR(Mean Reciprocal Rank)是一個國際上通用的評價檢索算法的機制,其第1個預測結(jié)果匹配分數(shù)為1,第2個匹配分數(shù)為0.5,第n個匹配分數(shù)為1/n,沒有結(jié)果匹配的分數(shù)為0,最終的分數(shù)為所有得分之和,如式(15)所示:
(15)
其中,Dtest為測試集。
(2)HR(Hit Ratio)是Top-K推薦中常用的衡量召回率的指標。若正例三元組Z=(vi,R,vj)出現(xiàn)在Top-K中,則Hits@K=1,否則Hits@K=0,Hits@K*為所有命中Hits@K=1的測試正例,總體的Hits@K是通過對所有測試用例求平均來確定的,如式(16)所示:
(16)
注意力流數(shù)據(jù)集擁有數(shù)萬級的節(jié)點集和邊集,將數(shù)據(jù)集按一定比例劃分為訓練集Dtrain、驗證集Dvalid和測試集Dtest,劃分情況如表1所示。
Table 1 Data set and its division
為保證收斂速度和質(zhì)量,經(jīng)過反復實驗,最終將訓練的迭代次數(shù)設(shè)置為epoch=3000,訓練批大小batch_size=3000,激活函數(shù)采用sigmoid,學習率lr=0.001,優(yōu)化器采用Adam,隱藏層層數(shù)H=200,節(jié)點嵌入維度E=200。
AFP算法預測的注意力流網(wǎng)絡(luò)中網(wǎng)站的點擊率排名如表2所示,其中Rank列代表網(wǎng)站排名序號,Source_Node列代表源節(jié)點網(wǎng)站,SN_f(Z)列代表源節(jié)點網(wǎng)站的點擊概率,Target_Node列代表目標節(jié)點網(wǎng)站,TN_f(Z)列代表目標節(jié)點網(wǎng)站的點擊概率。表2所示的排名結(jié)果與網(wǎng)站的停留時長、點擊次數(shù)、度值等網(wǎng)絡(luò)屬性值成正比關(guān)系,并且與注意力流網(wǎng)絡(luò)的真實點擊情況基本一致。
Table 2 Ranking of predictive click-through rate of websites in the attention flow network
將4.2節(jié)的6個對比算法和AFP算法的10次實驗結(jié)果取平均值,得到表3和表4,粗體顯示的是本文算法AFP的結(jié)果,其整體表現(xiàn)最好。例如,在Accuracy、Precision、Recall和F1指標上,AFP與未加入注意力機制的R-GCN相比,AFP的平均Accuracy值提高了1.52%,平均Precision提高了7.88%,平均Recall提高了1.59%,平均F1提高了4.89%。此外,在MRR和Hits@K指標上,AFP與R-GCN相比,平均MRR提高了0.54%,平均Hits@1提高了0.44%,平均Hits@3提高了0.58%,平均Hits@10提高了0.14%。
Table 3 Comparison of Accuracy,Precision,Recall,and F1 of different algorithms on the attention flow network
Table 4 Comparison of MRR and Hits@K of different algorithms on the attention flow network
此外,本文還將訓練集按比例從50%到90%劃分以驗證本文算法的有效性。不同算法在不同訓練集規(guī)模下的預測性能如圖3~圖6所示。由圖可知,AFP算法在訓練集不同規(guī)模下的性能依舊顯著,說明AFP算法的預測性能優(yōu)勢與網(wǎng)絡(luò)訓練集劃分的大小無關(guān),且在網(wǎng)絡(luò)不完整的情況下,預測性能依舊顯著。
Figure 3 Comparison of Accuracy values of different algorithms under different sizes of training set
Figure 4 Comparison of Precision values of different algorithms under different sizes of training set
Figure 5 Comparison of Recall values of different algorithms under different sizes of training set
Figure 6 Comparison of F1 values of different algorithms under different sizes of training set
本文提出了適用于有向加權(quán)網(wǎng)絡(luò)的鏈路預測算法AFP,該算法綜合考慮了網(wǎng)絡(luò)的圖結(jié)構(gòu)特征、顯式特征和隱式特征;將有向網(wǎng)絡(luò)中的邊方向抽象為2種關(guān)系類型,實現(xiàn)了邊方向的預測;引入了注意力機制,以捕獲節(jié)點和邊的不同重要性。研究結(jié)果表明:(1)針對有向加權(quán)注意力流網(wǎng)絡(luò)鏈路預測,AFP算法比基準算法的預測準確率提高了至少3.52%;(2)網(wǎng)絡(luò)中的節(jié)點和邊皆有屬性,綜合考慮多種特征能夠提高邊關(guān)系預測性能;(3)注意力流網(wǎng)絡(luò)中度大的節(jié)點相對稀少,度小的節(jié)點較多且分布集中,符合“長尾分布”。
AFP算法的優(yōu)點有:(1)AFP可以有效地預測有向加權(quán)網(wǎng)絡(luò)中的邊關(guān)系;(2)構(gòu)建的注意力流網(wǎng)絡(luò)由20 115個節(jié)點和125 557條邊組成,因此AFP的預測結(jié)果不受在大數(shù)據(jù)集上預測性能差假設(shè)的影響。但也存在以下不足:(1)引入注意力機制捕獲網(wǎng)絡(luò)特征提高了特征學習效果,同時也提高了時間復雜度;(2)相比于鏈路預測,知識圖譜補全關(guān)注的是網(wǎng)絡(luò)中最可能出現(xiàn)的鏈路的預測正確度。與知識圖譜算法相比,AFP預測效果在MRR和Hits@K指標上均比較低。
有向加權(quán)集體注意力流網(wǎng)絡(luò)鏈路預測是個性化推薦的重要方法之一。在未來的研究中,針對知識圖譜存在的大量非對稱關(guān)系,將進一步研究AFP服務(wù)于知識圖譜補全等領(lǐng)域,以提高其預測性能,降低時間復雜度。