摘要: 為了提高挖掘超關(guān)系數(shù)據(jù)中的隱含關(guān)系的能力,提出一種基于三元組鍵值對(duì)超關(guān)系學(xué)習(xí)的知識(shí)圖譜鏈接預(yù)測(cè)模型;所提模型不僅捕捉編碼在三元組中知識(shí)圖譜的主要結(jié)構(gòu)信息,而且通過(guò)對(duì)三元組及其相關(guān)鍵值對(duì)進(jìn)行學(xué)習(xí),采集每個(gè)三元組及其相關(guān)聯(lián)的鍵值對(duì)之間的相關(guān)性;通過(guò)最小值操作,對(duì)基本三元組、鍵值對(duì)以及相關(guān)性特征向量進(jìn)行合并,利用全連接投影得到預(yù)測(cè)得分。結(jié)果表明,與其他預(yù)測(cè)模型相比,所提模型在JF17K數(shù)據(jù)集和WikiPeople數(shù)據(jù)集的鍵、值預(yù)測(cè)平均倒數(shù)排名表現(xiàn)更佳,在鏈接預(yù)測(cè)中排名分別小于10、1的三元組的平均占比的預(yù)測(cè)性能更優(yōu)。
關(guān)鍵詞: 知識(shí)圖譜; 鏈接預(yù)測(cè); 超關(guān)系學(xué)習(xí); 結(jié)構(gòu)信息; 鍵值對(duì)
中圖分類號(hào): TP311.5
文獻(xiàn)標(biāo)志碼: A
Abstract: To improve the ability to mine implicit relationships in hyperrelational data, a link prediction model of knowledgegraph based on triple key-value pair hyperrelation learning was proposed. The proposed model not only captured the main structural information of knowledge graph encoded in the triple, but also collected the correlation between each triple and its associated key-value pairs by learning triples and their key-value pairs. Basic triples, key-value pairs, and correlation feature vectors were combined by minimum operation, and the prediction score was obtained by full join projection. The results show that on JF17K and WikiPeople datasets, key prediction and value prediction of the proposed model has better mean reciprocal ranking, triples that rank less than 10 and 1 respectively in link prediction indexes betterthan those of the other methods.
Keywords: knowledge graph; link prediction; hyperrelation learning; structural information; key-value pair
基金項(xiàng)目: 國(guó)家自然科學(xué)基金項(xiàng)目(61702026);湖南省教育廳科學(xué)研究項(xiàng)目?jī)?yōu)秀青年項(xiàng)目(19B397)
第一作者簡(jiǎn)介: 甄春成(1974—),男(侗族),湖南會(huì)同人。高級(jí)工程師,研究方向?yàn)閳D像處理、人工智能。Email: 505293959@qq.com。
網(wǎng)絡(luò)首發(fā)地址: https://kns.cnki.net/kcms/detail/37.1378.N.20230329.1658.006.html
知識(shí)圖譜(knowledge graph, KG)[1]是一種融合了計(jì)算機(jī)可視化技術(shù)、 圖形學(xué)、 應(yīng)用數(shù)學(xué)、 共現(xiàn)分析等交叉領(lǐng)域的現(xiàn)代理論, 在公安偵查、 風(fēng)險(xiǎn)管控等多方面具有重要應(yīng)用價(jià)值。 目前,谷歌的KG[2]、維基數(shù)據(jù)(Wikidata)[3]和百度的KG[4]等,已經(jīng)成為支持語(yǔ)義搜索[5]、 問(wèn)答[6]等網(wǎng)絡(luò)應(yīng)用的關(guān)鍵資產(chǎn)?,F(xiàn)代KG雖然包含豐富的高質(zhì)量數(shù)據(jù),但也存在不完整性問(wèn)題(即缺少事實(shí))。當(dāng)前,KG的完補(bǔ)性問(wèn)題已經(jīng)得到了廣泛研究,其中預(yù)測(cè)KG中的缺失鏈接(即鏈接預(yù)測(cè))是一個(gè)核心問(wèn)題,也是研究的熱點(diǎn)問(wèn)題。
三元組集合是表示KG的典型方式,其中每個(gè)三元組的頭部、關(guān)系和尾部均編碼了連接頭實(shí)體和尾實(shí)體的關(guān)系。KG嵌入是進(jìn)行鏈接預(yù)測(cè)的強(qiáng)有力工具[7],其核心理念是:在保留KG進(jìn)行鏈接預(yù)測(cè)的同時(shí),從三元組集合中學(xué)習(xí)實(shí)體-關(guān)系的隱性向量表征(即實(shí)體-關(guān)系嵌入)。
基于三元組的KG表征超關(guān)系數(shù)據(jù)在KG中普遍存在,以創(chuàng)作共享類網(wǎng)站Freebase為例,比例超過(guò)30%的實(shí)體涉及到這種超關(guān)系事實(shí)[8]。在學(xué)習(xí)KG嵌入時(shí),必須通過(guò)某種方式將這些超關(guān)系事實(shí)轉(zhuǎn)換為三元組。雖然這種轉(zhuǎn)換保留了超關(guān)系事實(shí)的完整信息,但人工引入的額外關(guān)系(或?qū)嶓w)會(huì)混淆KG的嵌入方法,使其無(wú)法捕捉原始輸入圖的結(jié)構(gòu)屬性。
目前, 超關(guān)系數(shù)據(jù)的研究相對(duì)較少, 很多研究將關(guān)系集合考慮為n元關(guān)系, 利用n元表征[9], 但將超關(guān)系事實(shí)轉(zhuǎn)換為n元表征并不符合現(xiàn)代KG架構(gòu)。 也有學(xué)者對(duì)實(shí)體的相關(guān)性進(jìn)行建模[10-11], 或者從實(shí)體-關(guān)系對(duì)的相關(guān)性進(jìn)行學(xué)習(xí)[12-13]。 這些方法大多基于傳統(tǒng)的結(jié)構(gòu)化信息, 在挖掘隱含關(guān)系方面的能力較弱, 為此, 本文中提出一種基于三元組鍵值對(duì)超關(guān)系學(xué)習(xí)的知識(shí)圖譜鏈接預(yù)測(cè)模型(本文模型), 用于提高鏈接預(yù)測(cè)性能。 其主要?jiǎng)?chuàng)新之處在于: 1)分析超關(guān)系KG嵌入問(wèn)題, 每個(gè)事實(shí)不僅包含基本三元組, 而且包含相關(guān)聯(lián)的鍵值對(duì); 2)提出超關(guān)系KG嵌入模型, 直接從KG中的超關(guān)系事實(shí)中學(xué)習(xí), 不僅捕捉三元組中的KG主要結(jié)構(gòu)信息, 而且捕捉每個(gè)三元組及其相關(guān)鍵值對(duì)之間的關(guān)系。
1 本文模型的設(shè)計(jì)
三元組是現(xiàn)代KG中的基本數(shù)據(jù)結(jié)構(gòu),保留了KG中鏈接預(yù)測(cè)的重要信息,即超關(guān)系事實(shí)上的鍵值對(duì)不應(yīng)被當(dāng)作基本三元組對(duì)待。超關(guān)系事實(shí)將關(guān)系集合考慮為n元(或多重)關(guān)系,并將相關(guān)實(shí)體考慮為該關(guān)系的實(shí)例。超關(guān)系KG嵌入模型的設(shè)計(jì)原則是:一方面,直接從主數(shù)據(jù)源(三元組)中學(xué)習(xí)嵌入,最大限度地保留KG中鏈接預(yù)測(cè)的重要信息;另一方面,對(duì)三元組及其關(guān)聯(lián)的鍵值對(duì)(若存在)的相關(guān)性進(jìn)行學(xué)習(xí)。本文模型的設(shè)計(jì)目標(biāo)如下:
1)從三元組事實(shí)和超關(guān)系事實(shí)中進(jìn)行有效學(xué)習(xí)。由于KG中并非所有事實(shí)都是超關(guān)系的,因此嵌入模型應(yīng)該從2種事實(shí)中進(jìn)行高效學(xué)習(xí),即納入來(lái)自超關(guān)系事實(shí)的鍵值對(duì),且對(duì)三元組的主要學(xué)習(xí)過(guò)程無(wú)干擾。
2)在學(xué)習(xí)超關(guān)系事實(shí)的基本三元組時(shí)利用鍵值對(duì)。對(duì)于每個(gè)超關(guān)系事實(shí),基本三元組與鍵值對(duì)集合相關(guān)聯(lián),后者提供了基本三元組相關(guān)的額外信息。由于基本三元組依然是對(duì)超關(guān)系事實(shí)建模的主要數(shù)據(jù)源,因此在嵌入模型設(shè)計(jì)時(shí),應(yīng)利用鍵值對(duì)來(lái)改善從三元組的學(xué)習(xí)過(guò)程。
3)從任意數(shù)量的超關(guān)系事實(shí)鍵值對(duì)中學(xué)習(xí)。超關(guān)系事實(shí)涉及到的鍵值對(duì)的數(shù)量是可變的, 嵌入模型應(yīng)能有效處理超關(guān)系事實(shí)中任意數(shù)量的鍵值對(duì)。
本文中基于上述3個(gè)目標(biāo),從三元組和超關(guān)系事實(shí)中進(jìn)行有效學(xué)習(xí)嵌入。
2 本文模型的構(gòu)建與訓(xùn)練
本文模型結(jié)構(gòu)如圖1所示。直接從KG的超關(guān)系事實(shí)中學(xué)習(xí),不僅捕捉編碼在三元組中的KG主要結(jié)構(gòu)信息,還獲得每個(gè)三元組及其相關(guān)聯(lián)的鍵值對(duì)之間的相關(guān)性。對(duì)于包含基本三元組(h, r, t) (h為頭部,r為關(guān)系,t為尾部)和關(guān)聯(lián)鍵值對(duì)(ki, vi)(ki為鍵值對(duì)第一變量,vi為鍵值對(duì)第二變量,i=1, 2,…, n)的每個(gè)超關(guān)系事實(shí),本文模型由以下3個(gè)部分組成: 1)從基本三元組(h, r, t)中學(xué)習(xí),分別生成h、 r和t逐三相關(guān)性特征向量; 2)從三元組及其相關(guān)的每個(gè)鍵值對(duì)(k, v)中學(xué)習(xí),分別生成h、 r、 t、 k和v逐五相關(guān)性特征向量; 3)合并相關(guān)性特征向量,生成輸入超關(guān)系事實(shí)的最終預(yù)測(cè)得分。
2.1 從三元組中學(xué)習(xí)
在三元組和超關(guān)系事實(shí)中,基本三元組均編碼了KG的主要結(jié)構(gòu)信息,由此可以捕捉KG中鏈接預(yù)測(cè)的重要信息。為了從基本三元組(h, r, t)中學(xué)習(xí),本文中利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)對(duì)三元組中3個(gè)元素h、 r、 t之間的內(nèi)在交互關(guān)系進(jìn)行建模,生成逐三相關(guān)性特征向量。
2.5 模型的有效性
首先,為了實(shí)現(xiàn)目標(biāo)1),本文中采用基礎(chǔ)三元組、鍵值對(duì)與基礎(chǔ)三元組2個(gè)單獨(dú)的神經(jīng)網(wǎng)絡(luò)流水線分別學(xué)習(xí)。對(duì)于三元事實(shí),僅使用第1個(gè)模塊[圖1(a)],不激活第2個(gè)模塊[圖1(b)]。對(duì)于超關(guān)系事實(shí)(帶鍵值對(duì)),則使用第1、 2個(gè)模塊。用于基礎(chǔ)三元組的CNN是獨(dú)立于鍵值對(duì)的,由此支持其
捕捉三元組中編碼的KG主要結(jié)構(gòu)信息,以最大限度地保留KG中鏈接預(yù)測(cè)的重要信息。
其次,為了實(shí)現(xiàn)目標(biāo)2),通過(guò)最小值操作,對(duì)基本三元組、鍵值對(duì)與基本三元組所習(xí)得的相關(guān)性特征向量進(jìn)行合并。該操作確保用于鍵值對(duì)的CNN有助于評(píng)估超關(guān)系事實(shí)的可信性??紤]包含基本三元組及與其關(guān)聯(lián)的鍵值對(duì)的超關(guān)系事實(shí),則可得到逐三相關(guān)性向量和逐五相關(guān)性向量ψ。若鍵值對(duì)與基本三元組高度相關(guān)(即ψ數(shù)值較大),則相關(guān)性特征向量中的數(shù)值取決于。最終預(yù)測(cè)得分主要取決于基本三元組,如果鍵值對(duì)與基本三元組的相關(guān)性較低(即ψ數(shù)值較?。?,則合并操作確保整體相關(guān)性特征向量中的數(shù)值較小。
最后,利用合并操作自動(dòng)實(shí)現(xiàn)目標(biāo)3)。 對(duì)于基本三元組關(guān)聯(lián)到多個(gè)鍵值對(duì)(ki, vi)的情形, 每個(gè)鍵值對(duì)(ki, vi)均與基本三元組進(jìn)行組合以生成相應(yīng)的逐五相關(guān)性特征向量ψ, 因此, 基于最小值的合并操作能夠取任意數(shù)量的逐五相關(guān)性特征向量作為輸入。
3 實(shí)驗(yàn)與分析
3.1 數(shù)據(jù)集與參數(shù)設(shè)置
本文中在Freebase和Wikidata提取出的2個(gè)超關(guān)系數(shù)據(jù)集JF17K和WikiPeople上進(jìn)行實(shí)驗(yàn)。每個(gè)數(shù)據(jù)集均包含三元事實(shí)與超關(guān)系事實(shí)。JF17K數(shù)據(jù)集側(cè)重于超關(guān)系事實(shí),WikiPeople數(shù)據(jù)集側(cè)重于人類實(shí)體。由于原始WikiPeople數(shù)據(jù)集中的一些事實(shí)還包含字面量,因此本文中濾除了這些非實(shí)體字面量和相應(yīng)的事實(shí)。數(shù)據(jù)集的重要統(tǒng)計(jì)信息如表1所示。實(shí)驗(yàn)設(shè)置2個(gè)CNN中的過(guò)濾器數(shù)量nf均為400,批數(shù)據(jù)量設(shè)為128,學(xué)習(xí)率設(shè)為0.000 1,嵌入維數(shù)設(shè)為100。JF17K數(shù)據(jù)集的訓(xùn)練集和測(cè)試集的數(shù)據(jù)比為76 376∶24 561; WikiPeople數(shù)據(jù)集的訓(xùn)練集與測(cè)試集的數(shù)據(jù)比為287 928∶37 536。
3.2 評(píng)估與度量指標(biāo)
鏈接預(yù)測(cè)是KG的典型任務(wù)。給定超關(guān)系事實(shí)中三元組的2個(gè)元素,該任務(wù)要求預(yù)測(cè)缺失元素,例如(?, r , t)、(h, ?, t)或(h, r , ?),其中,“?”表示缺失實(shí)體或關(guān)系。本文中對(duì)所有3種情況進(jìn)行實(shí)驗(yàn),即預(yù)測(cè)缺失的頭部、關(guān)系或尾部。對(duì)于測(cè)試(超關(guān)系)事實(shí)中的三元組(?, r , t),利用所有實(shí)體替換缺失頭部,得到候選事實(shí)集合。該集合中除了測(cè)試事實(shí),其他受損事實(shí)可能為真實(shí)事實(shí)(即存在于訓(xùn)練集或測(cè)試集內(nèi));從候選事實(shí)中移除這些事實(shí);然后,將得到的候選事實(shí)輸入嵌入模型,以輸出預(yù)測(cè)得分。對(duì)于缺失關(guān)系(h, ?, t )和缺失尾部(h, r, ?)的情況應(yīng)用相同評(píng)估程序和度量。缺失的頭部或尾部的預(yù)測(cè)實(shí)際上是預(yù)測(cè)缺失實(shí)體,因此本文中給出這2種情況的平均結(jié)果,關(guān)系預(yù)測(cè)的結(jié)果則單獨(dú)給出。根據(jù)相應(yīng)得分對(duì)候選事實(shí)進(jìn)行排序,為缺失頭部的實(shí)體生成預(yù)測(cè)排名列表。在測(cè)試集中所有測(cè)試事實(shí)上重復(fù)該評(píng)估過(guò)程,得到平均倒數(shù)排名(MRR)、在鏈接預(yù)測(cè)中排名小于10的三元組的平均占比Hits@10和在鏈接預(yù)測(cè)中排名小于1的三元組的平均占比Hits@1,這是在鏈接預(yù)測(cè)任務(wù)中常用度量[14]。
3.3 與其他方法的比較
為了驗(yàn)證本文模型的優(yōu)越性, 將本文模型的KG鏈接預(yù)測(cè)性能與文獻(xiàn)[9]、 [10]、 [16]、 [17]中的方法的預(yù)測(cè)性能進(jìn)行對(duì)比。 其中, 文獻(xiàn)[9]中考慮了n元表征事實(shí)中實(shí)體之間的逐對(duì)相關(guān)性, 通過(guò)從每個(gè)n元事實(shí)的逐對(duì)相關(guān)性中學(xué)習(xí), 以預(yù)測(cè)一個(gè)或多個(gè)缺失實(shí)體。文獻(xiàn)[10]中引入一種關(guān)系投影知識(shí)圖譜(relational projection knowledge graph, RPKG), 以更好地捕捉多映射關(guān)系。 文獻(xiàn)[16]中提出一種張量分解方法Rescal, 將每個(gè)實(shí)體表示為向量, 關(guān)系表示為矩陣, 利用雙線性函數(shù)對(duì)成對(duì)實(shí)體之間的關(guān)系進(jìn)行建模。 文獻(xiàn)[17]中利用2D卷積神經(jīng)網(wǎng)絡(luò)ConvE捕捉實(shí)體與關(guān)系嵌入之間更豐富的交互。
不同方法在WikiPeople數(shù)據(jù)集中的KG鏈接預(yù)測(cè)性能如表2所示。實(shí)驗(yàn)考慮了3種數(shù)據(jù)集轉(zhuǎn)換設(shè)定,其中:基本設(shè)定丟棄鍵值對(duì),造成不可逆信息損失[18];關(guān)系路徑和虛擬型設(shè)定則創(chuàng)建額外實(shí)體或關(guān)系,對(duì)嵌入模型從輸入KG中捕捉鏈接預(yù)測(cè)的能力造成干擾。表中空白表示不能進(jìn)行該項(xiàng)實(shí)驗(yàn)。
由表可知,與其他預(yù)測(cè)方法相比,本文模型對(duì)頭部、尾部預(yù)測(cè)和關(guān)系預(yù)測(cè)的性能改善明顯,主要得益于本文模型直接從KG的超關(guān)系事實(shí)中學(xué)習(xí),不但捕捉編碼在三元組中的主要結(jié)構(gòu)信息,而且采集每個(gè)三元組及其相關(guān)聯(lián)的鍵值對(duì)之間的相關(guān)性。在基本設(shè)定下針對(duì)WikiPeople數(shù)據(jù)集的頭部、尾部預(yù)測(cè),
本文模型與ConvE的預(yù)測(cè)結(jié)果相差不大,這是因?yàn)镃onvE也利用2D卷積層從三元組的實(shí)體、關(guān)系嵌入中進(jìn)行特征提取,且WikiPeople數(shù)據(jù)集中三元組事實(shí)的優(yōu)勢(shì)度較高, 使得ConvE的預(yù)測(cè)性能較好?;陉P(guān)系路徑設(shè)定的預(yù)測(cè)性能略低于基于基本設(shè)定的,進(jìn)一步證明了雖然關(guān)系路徑設(shè)定保留了超關(guān)系事實(shí)的完整信息,但額外創(chuàng)建的實(shí)體、關(guān)系會(huì)干擾KG嵌入中捕捉鏈接預(yù)測(cè)的重要信息的能力。
不同方法在JF17K數(shù)據(jù)集中的KG鏈接預(yù)測(cè)性能如表3所示。 與WikiPeople數(shù)據(jù)集相比, JF17K數(shù)據(jù)集包含更高比例的超關(guān)系事實(shí), 因此本文模型利用超關(guān)系事實(shí)中的鍵值對(duì), 取得更優(yōu)的預(yù)測(cè)性能, 證明本文中提出的固定負(fù)采樣處理方法的有效性, 且特別適用于關(guān)系預(yù)測(cè)。 ConvE利用數(shù)據(jù)轉(zhuǎn)換設(shè)定從轉(zhuǎn)換后的數(shù)據(jù)集中學(xué)習(xí),針對(duì)頭部、尾部預(yù)測(cè)而設(shè)計(jì),并不適用于關(guān)系預(yù)測(cè)任務(wù)。NKG、RPKG和Rescal的預(yù)測(cè)結(jié)果略低于本文模型的,主要原因是超關(guān)系事實(shí)的n元表征實(shí)際上忽略了三元組結(jié)構(gòu),雖然這些方法能夠從與三元組相關(guān)聯(lián)的鍵值對(duì)中學(xué)習(xí),但忽視了三元組結(jié)構(gòu),無(wú)法獲得更好的預(yù)測(cè)結(jié)果。
3.4 鍵、值預(yù)測(cè)性能分析
針對(duì)預(yù)測(cè)超關(guān)系事實(shí)中的缺失鍵(?, vi)或缺失值(ki, ?) 進(jìn)行實(shí)驗(yàn),采用與鏈接預(yù)測(cè)任務(wù)相類似的評(píng)估程序。以缺失鍵(?, vi) 的預(yù)測(cè)為例,首先,將缺失鍵替換為所有可能的關(guān)系,由此得到一組候選超關(guān)系事實(shí)。在濾除測(cè)試事實(shí)之外的其他真實(shí)事實(shí)(存在于訓(xùn)練、測(cè)試集內(nèi))后,將剩余的候選超關(guān)系事實(shí)輸入到嵌入模型中,最后輸出預(yù)測(cè)得分。根據(jù)得分對(duì)候選事實(shí)排序,并給出MRR、Hits@10和Hits@1。對(duì)缺失值(ki, ?)的預(yù)測(cè)采用相同評(píng)價(jià)程序。與之前實(shí)驗(yàn)一樣,僅將本文模型的預(yù)測(cè)性能與ConvE進(jìn)行比較,結(jié)果如表4所示。從表中可見(jiàn),與ConvE相比,本文模型在WikiPeople數(shù)據(jù)集的值、鍵預(yù)測(cè)結(jié)果分別提高6%、28%,在JF17K數(shù)據(jù)集的分別提高27%、 28%。本文模型不但捕捉編碼在三元組中的主要結(jié)構(gòu)信息,而且采集每個(gè)三元組及其相關(guān)聯(lián)的鍵值對(duì)之間的相關(guān)性,因此預(yù)測(cè)性能更好。
3.5 參數(shù)敏感性分析
以下分析本文模型中2個(gè)重要參數(shù),即CNN中使用的過(guò)濾器數(shù)量nf和嵌入維數(shù)K對(duì)參數(shù)敏感性的影響。首先,將嵌入維數(shù)K固定為100,過(guò)濾器數(shù)量nf設(shè)為10~800,圖2給出了濾波器數(shù)量nf對(duì)2個(gè)數(shù)據(jù)集的KG鏈接預(yù)測(cè)的影響。從圖中可以看出,隨著nf的增加,KG鏈接預(yù)測(cè)性能提升,當(dāng)nf≥400時(shí)趨向平穩(wěn)。然后,將過(guò)濾器數(shù)量nf固定為400,設(shè)K=5~200,嵌入維數(shù)K對(duì)2個(gè)數(shù)據(jù)集的KG鏈接預(yù)測(cè)的影響如圖3所示。由圖可見(jiàn), 隨著K的增大,KG鏈接預(yù)測(cè)性能快速上升,然后在K≥100后趨向平穩(wěn)。綜上,本文中設(shè)定濾波器數(shù)量nf為400,嵌入維數(shù)K為100。
4 結(jié)語(yǔ)與展望
當(dāng)前的KG嵌入技術(shù)大部分將KG表示為三元組集合,從中學(xué)習(xí)實(shí)體、關(guān)系嵌入,并保留KG中鏈接預(yù)測(cè)的重要信息,但這種三元組表征過(guò)度簡(jiǎn)化了KG中保存數(shù)據(jù)的復(fù)雜性質(zhì),特別是對(duì)于超關(guān)系事實(shí)。本文中提出了一種超關(guān)系KG嵌入模型,不但從三元組中捕捉KG中的主要結(jié)構(gòu)信息,而且捕捉每個(gè)三元組與其關(guān)聯(lián)鍵值對(duì)之間的相關(guān)性,實(shí)驗(yàn)結(jié)果驗(yàn)證了該模型在各種KG鏈接預(yù)測(cè)中具有優(yōu)異的性能。
下一步將考慮KG中其他類型的數(shù)據(jù),例如數(shù)值和文本、多模態(tài)數(shù)據(jù)(例如圖像),使得本文模型具有更廣的應(yīng)用范圍。
參考文獻(xiàn):
[1] 李浩, 張亞釧, 康雁, 等. 融合循環(huán)知識(shí)圖譜和協(xié)同過(guò)濾電影推薦算法[J]. 計(jì)算機(jī)工程與應(yīng)用, 2020, 56(2): 106.
[2] UYAR A, ALIYU F M. Evaluating search features of Google Knowledge Graph and Bing Satori:entity types, list searches and query interfaces[J]. Online Information Review, 2015, 39(2): 197.
[3] TURKI H," VRANDECIC D ," HAMDI H , et al. Using WikiData as a multilingual multidialectal dictionary for Arabic dialects[C]//2017 IEEE/ACS 14th International Conference on Computer Systems and Applications (AICCSA)," October 30-November 3, 2017, Hammamet, Tunisia. New York: IEEE, 2017: 75.
[4] 覃曉, 元昌安, 何國(guó)對(duì), 等. 基于百度百科知識(shí)圖譜的旅游資源文化特色評(píng)分算法:CN110781300A[P]. 2020-02-11.
[5] XIONG C Y, POWER R, CALLAN J. Explicit semantic ranking for academic search via knowledge graph embedding[C]//WWW’17: Proceedings of the 26th International Conference on World Wide Web, April 3-7, 2017, Perth, Australia. New York: ACM, 2017: 1271.
[6] YANG D Q, ROSSO P, LI B, et al. NodeSketch: highlyefficient graph embeddings via recursive sketching[C]// KDD’19: Proceedingsof the 25th ACM SIGKDD International Conference on Knowledge Discovery amp; Data Mining, August 4-8, 2019, Anchorage," USA. New York: ACM, 2019: 1162.
[7] 蘇榮. 基于圖網(wǎng)絡(luò)的知識(shí)圖譜嵌入研究[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2019.
[8] BEIERLE C, EICHHORN C, KERNISBERNER G, et al. Propertiesof skeptical cinference for conditional knowledge bases and its realization as a constraint satisfaction problem[J]. Annals of Mathematics and Artificial Intelligence, 2018, 83(3/4): 247.
[9] BEAN D M, WU H H, IQBAL E, et al. Author correction: knowledge graph prediction of unknown adverse drug reactions and validation in electronic health records[J]. Scientific Reports, 2018, 8(1): 4284.
[10] ZHANG R C, LI J P, MEI J J, et al. Scalable instance reconstruction in knowledge bases via relatedness affiliated embedding[C]// WWW ’18: Proceedings of the Web Conference 2018, April 23-27, 2018, Lyon, France. New York: ACM, 2018: 1185.
[11] 鄒鼎杰. 基于知識(shí)圖譜和貝葉斯分類器的圖書(shū)分類[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2020, 41(6):1796.
[12] ABEDINI F, KEYVANPOUR M R, MENHAJ M B. Correction tower: a general embedding method of the error recognition for the knowledge graph correction[J]. International Journal of Pattern Recognition and Artificial Intelligence, 2020, 34(10): 2059034.
[13] 劉瓊昕, 馬敬, 鄭培雄. 一種融合實(shí)體關(guān)聯(lián)性約束的表示學(xué)習(xí)方法[J]. 北京理工大學(xué)學(xué)報(bào), 2020, 40(1): 90.
[14] GUAN S P, JIN X L, WANG Y Z, et al. Link prediction on naryrelational data[C]//WWW ’19: the World Wide Web Conference, May 13-17, 2019, San Francisco, USA. New York: ACM, 2019: 583.
[15] CAI H Y, ZHENG V W, CHANG K C. A comprehensive survey of graph embedding: problems, techniques, and applications[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 30(9): 1616.
[16] 王琳, 張國(guó)坤, 徐逸濃. 一種張量分解的知識(shí)圖譜推理優(yōu)化算法[J]. 計(jì)算機(jī)應(yīng)用研究, 2020, 37(增刊1): 52.
[17] BERRENDORF M, FAERMAN E, MELNYCHUK V, et al. Knowledge graph entity alignment with graph convolutional networks: lessons learned[M]//JOSE J M, YILMAZ E, MAGALHES J, et al. Advances in Information Retrieval. Cham: Springer, Cham, 2020: 3.
[18] FANG W, ZHANG J W, WANG D L, et al. Entity disambiguation by knowledge and text jointly embedding[C]//Proceedings of the 20th SIGNLL Conference on Computational Natural Language Learning(CoNLL), August 11-12, 2016, Berlin, Germany. Berlin: ACL, 2016: 260.
(責(zé)任編輯:劉 飚)