亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種改進(jìn)的知識(shí)圖注意力網(wǎng)絡(luò)推薦模型

        2022-12-08 07:23:08王志寅
        現(xiàn)代計(jì)算機(jī) 2022年18期
        關(guān)鍵詞:三元組圖譜注意力

        王志寅

        (太原師范學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系,晉中 030600)

        0 引言

        隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)爆炸帶來(lái)的信息過載問題尤為顯著。為了有效解決信息過載問題,方便用戶從海量數(shù)據(jù)中找到其感興趣的內(nèi)容,研究人員提出使用推薦系統(tǒng)的方法來(lái)為用戶提供精準(zhǔn)的個(gè)性化推薦服務(wù)?;趨f(xié)同過濾(collaborative filtering,CF)的推薦算法[1]考慮用戶歷史交互數(shù)據(jù),并根據(jù)用戶之間可能存在的共同偏好進(jìn)行推薦,在推薦準(zhǔn)確性上獲得了顯著的提高,但依然存在冷啟動(dòng)和稀疏性等問題。為緩解這一問題,通常會(huì)將社交網(wǎng)絡(luò)[2]和用戶/項(xiàng)目屬性[3]等輔助信息與推薦系統(tǒng)相融合。

        在各類型的輔助信息中,知識(shí)圖譜(knowledge graph,KG)作為輔助信息輔助推薦已引起了廣泛的研究,這類方法不僅可以有效緩解冷啟動(dòng)和稀疏性問題,還能為用戶提供更準(zhǔn)確且更具可解釋性的推薦結(jié)果。KG是一種有向異構(gòu)圖,其中節(jié)點(diǎn)對(duì)應(yīng)實(shí)體,邊對(duì)應(yīng)實(shí)體之間的關(guān)系,可以用來(lái)描述真實(shí)世界存在的各種實(shí)體或概念,以及他們之間的關(guān)系。基于知識(shí)圖譜的推薦系統(tǒng)主要利用KG中豐富的關(guān)系信息挖掘用戶與項(xiàng)目之間可能存在的聯(lián)系,在為用戶提供精準(zhǔn)推薦的同時(shí)給推薦結(jié)果帶來(lái)可解釋性。

        目前,基于知識(shí)圖譜的推薦系統(tǒng)大體上可以分為基于路徑的方法和基于嵌入的方法。其中,基于路徑的方法[4-6]通過知識(shí)圖譜挖掘用戶與物品之間的多種關(guān)系信息,并根據(jù)挖掘路徑的信息構(gòu)造推薦算法。這類方法嚴(yán)重依賴于人工設(shè)計(jì)的元路徑,存在無(wú)法實(shí)現(xiàn)端到端的訓(xùn)練,延展性不夠以及信息丟失等問題?;谇度氲姆椒ㄖ饕ㄟ^圖嵌入的方式對(duì)實(shí)體和關(guān)系進(jìn)行表征,進(jìn)而擴(kuò)充原有物品和用戶表征的語(yǔ)義信息。其中,文獻(xiàn)[7]提出的協(xié)同知識(shí)嵌入(collaborative knowledge base embedding,CKE)模型通過在知識(shí)圖譜上學(xué)習(xí)物品相關(guān)實(shí)體的結(jié)構(gòu)化知識(shí)來(lái)進(jìn)一步擴(kuò)充物品的語(yǔ)義向量,進(jìn)而實(shí)現(xiàn)對(duì)用戶的推薦?;谇度氲姆椒軌蚶肒G來(lái)輔助推薦系統(tǒng),具有很高的靈活性,但是在嵌入時(shí)難以考慮到用戶興趣偏好在實(shí)體關(guān)系傳播過程中的影響,忽略了用戶的潛在偏好。

        為了充分利用KG中的信息,文獻(xiàn)[8]提出的RippleNet模型首次將路徑信息與實(shí)體嵌入表示相結(jié)合,該模型從用戶初始興趣集合出發(fā),沿著知識(shí)圖譜進(jìn)行鄰域多跳傳播來(lái)模擬用戶興趣偏好的傳播,能夠不斷自動(dòng)地發(fā)現(xiàn)用戶潛在的興趣。文獻(xiàn)[9]提出的KGAT推薦模型則將用戶交互歷史和知識(shí)圖譜相結(jié)合,以端到端的方式顯式,對(duì)圖中的高階關(guān)系進(jìn)行建模,遞歸地傳播來(lái)自鄰居節(jié)點(diǎn)的嵌入,并使用注意力機(jī)制來(lái)區(qū)分鄰居的重要性,最終通過聚合用戶和物品的嵌入表示來(lái)進(jìn)行推薦。由于該模型在整個(gè)知識(shí)圖譜上傳播信息,容易引入不相關(guān)的實(shí)體,導(dǎo)致最終的用戶和物品表示易受噪聲的影響。針對(duì)這一問題,本文基于KGAT模型提出了新的改進(jìn)方法,開展了如下的工作:

        (1)改進(jìn)注意力得分策略,以使相似實(shí)體之間能夠傳遞更多的信息。

        (2)針對(duì)噪聲影響,研究噪聲過濾策略,以降低信息傳播過程中的噪聲影響,優(yōu)化節(jié)點(diǎn)嵌入。

        (3)基于工作(1)和(2),提出改進(jìn)的KGAT推薦模型,并在兩個(gè)公共數(shù)據(jù)集Amazon-Book和Last-FM上分別進(jìn)行對(duì)比實(shí)驗(yàn),以證明模型的有效性。

        1 相關(guān)工作

        1.1 TransR

        基于翻譯模型(Trans系列)的知識(shí)表示學(xué)習(xí)是目前對(duì)知識(shí)圖譜中的實(shí)體和關(guān)系進(jìn)行表征的主要方法,這類方法將KG中的實(shí)體和關(guān)系映射到低維空間中來(lái)進(jìn)行計(jì)算和推理。

        文獻(xiàn)[10]提出了多元關(guān)系數(shù)據(jù)嵌入(TransE)算法,它通過簡(jiǎn)單建模將實(shí)體和關(guān)系嵌入到低維空間中,解決了已有的一些方法存在的模型復(fù)雜、不易拓展等問題,同時(shí)具有很強(qiáng)的可解釋性。

        TransE基于實(shí)體和關(guān)系的分布式向量表示,將每個(gè)三元組實(shí)例(h,r,t)中的關(guān)系r看作從實(shí)體h到實(shí)體t的翻譯(translation),通過不斷調(diào)整h、r和t的向量表示,使h+r盡可能與t相等,即h+r≈t。

        目前這種方法相對(duì)于其他方法在知識(shí)表示學(xué)習(xí)上有更好的表現(xiàn),在后續(xù)的研究中TransE作為知識(shí)向量表示的基礎(chǔ),衍生出了很多變體,TransR[11]就是其變體之一。TransR算法中,一個(gè)實(shí)體具有多個(gè)不同的方面,不同關(guān)系關(guān)注實(shí)體的不同方面,而不同的關(guān)系又擁有不同的語(yǔ)義空間。TransR的基本思想如圖1所示,對(duì)于每個(gè)三元組(h,r,t),將實(shí)體空間中的實(shí)體h和t通過關(guān)系r的投影矩陣Wr投影到r的關(guān)系空間中,分別記為hr和tr,那么會(huì)有hr+r≈tr,實(shí)體的空間轉(zhuǎn)化公式為

        特定關(guān)系的投影可以使擁有這種關(guān)系的頭/尾實(shí)體彼此靠近,同時(shí)那些沒有這種關(guān)系的實(shí)體相互遠(yuǎn)離,三元組的得分函數(shù)為

        根據(jù)式(2)可知,三元組得分越低,說明映射到r空間的頭實(shí)體和尾實(shí)體越靠近,三元組更有可能是正確的,反之亦然。

        1.2 KGAT模型

        KGAT模型基于協(xié)同知識(shí)圖(collaborative knowledge graph,CKG)構(gòu)建,該方法將圖譜關(guān)系信息及用戶交互歷史融合到一個(gè)圖空間,這樣就可以融合協(xié)同過濾信息及KG信息,同時(shí)也可以通過CKG發(fā)現(xiàn)高階的關(guān)系信息,模型框架如圖2所示。

        KGAT模型主要由三部分組成:

        (1)嵌入層,保留CKG的結(jié)構(gòu),使用TransR學(xué)習(xí)節(jié)點(diǎn)和邊的向量表示。

        (2)注意力嵌入傳播層,通過遞歸傳播節(jié)點(diǎn)鄰居的嵌入信息來(lái)更新節(jié)點(diǎn)表示,并在傳播過程中通過注意力機(jī)制為鄰居節(jié)點(diǎn)分配不同的權(quán)重,用以區(qū)分鄰居節(jié)點(diǎn)的重要性。

        首先,令Nh={(h,r,t)|(h,r,t)∈G}表示h是頭實(shí)體的三元組的集合,則傳遞所有以h為頭實(shí)體的三元組(h,r,t)的尾向量et的信息為

        其中π(h,r,t)是衡量消息(h,r,t)重要程度的權(quán)重,表示有多少信息以r為條件從尾實(shí)體向量et傳遞到頭實(shí)體向量eh,權(quán)重越大,則傳遞的信息越多,其具體的實(shí)現(xiàn)如下:

        其次,對(duì)注意力得分采用softmax函數(shù)進(jìn)行標(biāo)準(zhǔn)化,即:

        最后,采用雙交互(Bi-Interaction)聚合器聚合所有傳播層的用戶和項(xiàng)目的表示為

        其中,W1,W2∈Rd'×d為可訓(xùn)練權(quán)重矩陣,⊙表示元素乘積。雙交互聚合器考慮eh和eNh之間的特征交互,目的是使得傳播的信息更關(guān)注eh和eNh之間的關(guān)聯(lián)性,從而使相似的實(shí)體之間傳遞更多的消息。

        (3)預(yù)測(cè)層,經(jīng)過L層傳播,最終得到用戶節(jié)點(diǎn)u的多個(gè)表示形式,即同樣地,可以得到項(xiàng)目節(jié)點(diǎn)i的多個(gè)表示形式,即由于不同傳播層的輸出強(qiáng)調(diào)不同階的連通信息,所以采用層聚合機(jī)制[12]將每一層的表示聚合成一個(gè)向量:

        其中‖是拼接操作,通過調(diào)整L來(lái)控制嵌入傳播的階數(shù),豐富初始嵌入。最后,對(duì)最終的用戶表示e*u和項(xiàng)目表示e*i進(jìn)行內(nèi)積來(lái)預(yù)測(cè)它們的匹配得分:

        2 改進(jìn)的KGAT模型

        2.1 模型框架

        針對(duì)KGAT模型在整個(gè)知識(shí)圖譜上進(jìn)行傳播,容易引入不相關(guān)的實(shí)體的問題,本文對(duì)其提出改進(jìn),將注意力嵌入傳播層替換為注意力機(jī)制嵌入和信息過濾兩個(gè)部分,改進(jìn)后的模型框架如圖3所示。

        2.2 注意力機(jī)制嵌入

        KGAT模型的主要優(yōu)勢(shì)在于不僅利用了圖的鄰近結(jié)構(gòu),還規(guī)定了相鄰節(jié)點(diǎn)的不同重要性,實(shí)現(xiàn)了在傳播過程中傳遞更多信息的功能。

        由于KGAT模型采用內(nèi)積計(jì)算注意力得分,容易導(dǎo)致一些不相似的節(jié)點(diǎn)仍然有較高的注意力得分,違背客觀。因此,對(duì)節(jié)點(diǎn)的注意力得分機(jī)制進(jìn)行了改進(jìn)。首先,在注意力機(jī)制嵌入中,節(jié)點(diǎn)在關(guān)系空間r的相似度通過歐式距離計(jì)算,并將兩個(gè)節(jié)點(diǎn)的相似度作為節(jié)點(diǎn)的注意力得分;其次,結(jié)合TransR算法的思想,即若三元組關(guān)系(h,r,t)能滿足Wreh+er≈Wret,那么所獲得的權(quán)重就越大,由于充分考慮了節(jié)點(diǎn)之間的距離因素,更有利于傳播信息時(shí)實(shí)體之間的相互靠近。式(4)中的注意力得分π(h,r,t)的改進(jìn)為

        其中dist(X,Y)表示兩個(gè)向量之間的歐氏距離。改進(jìn)后的注意力嵌入機(jī)制使在關(guān)系空間r下兩個(gè)距離更近的節(jié)點(diǎn)之間具有更高的注意力得分,從而使更相似的實(shí)體之間傳遞更多的信息,有效降低了實(shí)體所包含的信息的損失。

        2.3 信息過濾

        KGAT模型在整個(gè)知識(shí)圖譜上傳播信息,容易引入噪聲,從而導(dǎo)致實(shí)體的最終表示中包含不相關(guān)的實(shí)體的信息,進(jìn)而直接影響推薦結(jié)果的準(zhǔn)確性。改進(jìn)的KGAT模型通過設(shè)置閾值來(lái)過濾注意力得分較小的三元組,旨在使相似度較低的實(shí)體不傳播信息,降低KGAT模型在信息更新過程中噪聲的影響,過濾后的三元組集合的注意力得分的標(biāo)準(zhǔn)化采用了softmax函數(shù),即:

        其中

        表示所有注意力得分不小于閾值的三元組集合,α為注意力得分閾值。

        標(biāo)準(zhǔn)化后的注意力得分能夠提示哪些鄰居節(jié)點(diǎn)在傳播中更需要被關(guān)注,并且在執(zhí)行傳播時(shí),能夠提高相似度高的相鄰節(jié)點(diǎn)之間的邊的權(quán)重,進(jìn)而使模型在傳播時(shí)更加關(guān)注得高分的節(jié)點(diǎn),同時(shí)模型的偏好傳播行為更具有可解釋性。

        3 實(shí)驗(yàn)與結(jié)果分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)集

        本文使用了兩個(gè)公開的數(shù)據(jù)集來(lái)驗(yàn)證方法的有效性:

        (1)Amazon-Book是一個(gè)圖書評(píng)分?jǐn)?shù)據(jù)集,是產(chǎn)品推薦數(shù)據(jù)集Amazon-review中的一部分。

        (2)Last-FM是用戶收聽音樂的數(shù)據(jù)集。取時(shí)間戳從2015年1月到2015年6月的數(shù)據(jù)集的子集。

        所有數(shù)據(jù)集的統(tǒng)計(jì)結(jié)果匯總見表1。

        對(duì)于每個(gè)數(shù)據(jù)集,隨機(jī)選取每個(gè)用戶交互歷史的80%作為訓(xùn)練集,其余作為測(cè)試集。從訓(xùn)練集中,隨機(jī)抽取10%的交互歷史作為驗(yàn)證集來(lái)調(diào)優(yōu)超參數(shù)。將觀察到的每個(gè)用戶和物品的交互視為一個(gè)正項(xiàng),采用負(fù)抽樣策略,將其與一個(gè)用戶之前沒有交互過的負(fù)項(xiàng)配對(duì)。

        3.2 結(jié)果對(duì)比

        本文采用兩種廣泛使用的評(píng)價(jià)指標(biāo)來(lái)評(píng)估Top-K推薦和偏好排序的有效性,分別為召回率(recall)和歸一化折損累計(jì)增益(normalized discounted cumulative gain,ndcg)。

        為了證明本文方法的有效性,用本文提出的改進(jìn)模型與以下的基線模型進(jìn)行對(duì)比,其對(duì)比結(jié)果在表2中呈現(xiàn):

        (1)FM[13]是一個(gè)基準(zhǔn)因子分解模型,以線性的方式學(xué)習(xí)二階特征交互。

        (2)NFM[14]是一種將FM包含在神經(jīng)網(wǎng)絡(luò)中的先進(jìn)的分解模型。

        (3)CKE將協(xié)同過濾與結(jié)構(gòu)知識(shí)、文本知識(shí)和視覺知識(shí)統(tǒng)一在一個(gè)推薦框架中。

        (4)CFKG[15]模 型將TransE應(yīng) 用于包含 用戶、項(xiàng)目、實(shí)體和關(guān)系的統(tǒng)一圖上,將推薦任務(wù)轉(zhuǎn)化為(u,Interact,i)三元組的可信性預(yù)測(cè)。

        (5)MCRec利用基于元路徑的上下文和神經(jīng)共同注意力模型進(jìn)行Top-N推薦,它提取合格的元路徑作為用戶和項(xiàng)目之間的連接。

        (6)RippleNet模型利用水波紋的思想模擬用戶的偏好傳播,不斷挖掘用戶的潛在興趣。

        (7)GC-MC[16]采用GCN編碼器對(duì)圖結(jié)構(gòu)數(shù)據(jù)進(jìn)行編碼。

        如表2所示,本文提出的改進(jìn)模型在兩個(gè)公共數(shù)據(jù)集上的recall和ndcg指標(biāo)與基線模型相比都有提高。其中,在Amazon-Book和Last-FM上與基線模型中表現(xiàn)最佳的KGAT模型相比,對(duì)應(yīng)的recall有1.54%和1.03%的提升,而對(duì)應(yīng)的ndcg有1.68%和1.96%的提升。

        表2 實(shí)驗(yàn)結(jié)果對(duì)比

        3.3 閾值的設(shè)置與選擇

        為了證明本文模型在注意力嵌入傳播層上改進(jìn)的有效性,對(duì)不同的閾值α,α∈[]0,1,根據(jù)式(11)計(jì)算注意力得分,并在Amazon-Book數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖4和圖5所示。

        首先,從圖中可以看出,當(dāng)改進(jìn)后的模型不設(shè)置閾值,即α為0時(shí),對(duì)應(yīng)的recall和ndcg分別為0.1501和0.1013,均優(yōu)于KGAT模型的實(shí)驗(yàn)結(jié)果,證明了本文改進(jìn)注意力機(jī)制嵌入的有效性。

        其次,從圖中還可以看出,隨著閾值α從0開始增長(zhǎng),對(duì)應(yīng)的recall和ndcg指標(biāo)也隨之提高,但當(dāng)α增長(zhǎng)到一定程度后,性能開始呈現(xiàn)下降趨勢(shì)。從圖中可以看到,閾值α為0.4時(shí)效果達(dá)到最佳。

        實(shí)驗(yàn)結(jié)果表明,閾值太小,容易引入不相關(guān)的實(shí)體,導(dǎo)致實(shí)體的最終嵌入表示受噪聲的影響;閾值太大,過濾的節(jié)點(diǎn)過多,導(dǎo)致不能充分聚合鄰居節(jié)點(diǎn)的信息,實(shí)體的最終嵌入表示不能有效表示節(jié)點(diǎn)包含的豐富信息。

        4 結(jié)語(yǔ)

        本文對(duì)KGAT模型進(jìn)行了改進(jìn),通過改變注意力得分機(jī)制,降低了信息傳播過程中的損失;通過增加信息過濾策略,降低了噪聲影響,優(yōu)化了節(jié)點(diǎn)嵌入。在兩個(gè)公共數(shù)據(jù)集上的實(shí)驗(yàn)對(duì)比,證明改進(jìn)模型是有效的。

        猜你喜歡
        三元組圖譜注意力
        基于語(yǔ)義增強(qiáng)雙編碼器的方面情感三元組提取
        軟件工程(2024年12期)2024-12-28 00:00:00
        基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
        讓注意力“飛”回來(lái)
        繪一張成長(zhǎng)圖譜
        關(guān)于余撓三元組的periodic-模
        “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
        補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        A Beautiful Way Of Looking At Things
        主動(dòng)對(duì)接你思維的知識(shí)圖譜
        三元組輻射場(chǎng)的建模與仿真
        少妇人妻偷人中文字幕| 青青草97国产精品免费观看| 国产亚洲一区二区手机在线观看| 少妇装睡让我滑了进去| 国产午夜福利精品| 中文字幕日本韩国精品免费观看 | 九九精品无码专区免费| 国产三级av在线播放| 国产91人妻一区二区三区| 日本丰满熟妇videossex8k| 国产啪精品视频网给免丝袜| 精品一区二区三区不老少妇| av影片在线免费观看| 内射少妇36p亚洲区| 日韩一区二区肥| 全程国语对白资源在线观看| 狠狠cao日日橹夜夜十橹| 乱人伦中文无码视频| 久久尤物av天堂日日综合| 国产一区二区三区小向美奈子| 成人免费a级毛片无码片2022| 亚洲欧美日韩在线一区| 亚洲AV成人无码天堂| 蜜桃视频第一区免费观看| 国产精品成人aaaaa网站| 在线视频你懂的国产福利| 蜜臀av一区二区三区精品| 亚洲男女内射在线播放| 性欧美暴力猛交69hd| 亚洲欧美另类日本久久影院| 五月婷婷开心六月激情| 无码人妻精品一区二区蜜桃网站| 亚洲精品成人专区在线观看| 国产av区亚洲av毛片| 国产一区二区三区毛片| 麻豆一区二区99久久久久| 日韩国产精品一本一区馆/在线 | 成年人免费黄色h网| 男奸女永久免费视频网站| 人妻丝袜av中文系列先锋影音| 在线观看无码一区二区台湾|