亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合知識圖譜與圖片特征的推薦模型

        2022-05-31 06:18:26陳喬松郭傲東杜雨露張怡文
        電子與信息學(xué)報 2022年5期
        關(guān)鍵詞:語義模態(tài)特征

        陳喬松 郭傲東 杜雨露* 張怡文 朱 越

        ①(重慶郵電大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 重慶 400065)

        ②(安徽新華學(xué)院信息工程學(xué)院 合肥 230000)

        ③(河南農(nóng)業(yè)大學(xué)信息與管理科學(xué)學(xué)院 鄭州 450046)

        1 引言

        目前推薦系統(tǒng)中相對核心推薦算法大致可以分為基于內(nèi)容的推薦[1]、協(xié)同過濾推薦[2]、基于關(guān)聯(lián)規(guī)則的推薦[3]以及混合推薦[4]。針對廣泛應(yīng)用的協(xié)同過濾推薦,該方法依賴用戶的歷史偏好信息,當(dāng)用戶行為數(shù)據(jù)越稀疏時,推薦的精確度越低;同時,還存在著新用戶和新商品的冷啟動等問題。

        為了解決這些問題,研究者嘗試將社交網(wǎng)絡(luò)、用戶項目屬性、圖片文字等信息引入推薦系統(tǒng)。深度學(xué)習(xí)算法[5]能夠有效地挖掘輔助信息潛在的用戶興趣偏好,研究者開始將傳統(tǒng)推薦算法與深度學(xué)習(xí)相結(jié)合[6],例如深度興趣網(wǎng)絡(luò)的點(diǎn)擊率預(yù)測[7]和改進(jìn)遞歸神經(jīng)網(wǎng)絡(luò)的會話推薦[8]等。

        近幾年,知識圖譜成為一種新起的輔助信息,知識圖譜更多地挖掘現(xiàn)實中存在的交互聯(lián)系。這種融合知識圖譜的推薦能夠深層次地發(fā)現(xiàn)用戶的興趣,避免單一類型的推薦結(jié)果,同時知識圖譜也可以對推薦結(jié)果進(jìn)行解釋,增強(qiáng)用戶對推薦系統(tǒng)的信任?;趥鹘y(tǒng)知識圖譜的推薦系統(tǒng)研究分為兩類,一類采用的是基于知識圖譜特征學(xué)習(xí)方法[9,10],例如,高階鄰域混合模型(MixHop)[11]通過不同距離之間的特征反復(fù)學(xué)習(xí)挖掘特征關(guān)系。深度知識感知網(wǎng)絡(luò)(Deep Knowledge- aware Network, DKN)[12]通過提取文本構(gòu)建知識圖譜,將新聞的詞向量與知識圖譜的實體融合。這些模型更多的關(guān)注于知識圖譜內(nèi)部的語義信息,忽略了知識圖譜的空間結(jié)構(gòu)特征;另一類采用的是基于固定路徑數(shù)據(jù)[13,14]的方法,例如,元圖融合推薦模型(Meta- Graph based Recommendation Fusion, FMG) [13]通過設(shè)定特定路徑挖掘?qū)嶓w之間的潛在關(guān)系,直觀地利用網(wǎng)絡(luò)結(jié)構(gòu)但是路徑較為固定。文獻(xiàn)[14]提出一種基于元圖的融合注意力機(jī)制的網(wǎng)絡(luò),通過注意機(jī)制從固定路徑中挖掘交互信息來訓(xùn)練模型構(gòu)建推薦器進(jìn)行推薦。該類方法通過設(shè)定固定的連接方式直觀地捕獲知識圖譜地網(wǎng)絡(luò)結(jié)構(gòu),但是需要手動設(shè)定元路徑且丟失大量的語義信息。

        最近,對于多模態(tài)知識圖譜的特征組合成為研究趨勢。多模態(tài)知識圖譜通過圖片、文本等信息去調(diào)整傳統(tǒng)知識圖譜中的語義關(guān)系。與傳統(tǒng)開源知識圖譜的數(shù)據(jù)相同,維基數(shù)據(jù)(Wikidata)、圖像鏈接數(shù)據(jù)集(IMages Gpedia, IMGpedia)等多模態(tài)數(shù)據(jù)庫仍舊存在具體場景應(yīng)用問題。多模態(tài)知識圖譜的不同數(shù)據(jù)信息一方面解決了單一知識圖譜對用戶偏好挖掘的局限性,另一方面也是構(gòu)建多模態(tài)知識圖譜的極大挑戰(zhàn)。多模態(tài)知識圖譜的構(gòu)成一定程度地解決單一知識圖譜中過于相似實體間的歧義信息,極大程度地確保實體信息挖掘的準(zhǔn)確性。

        針對以上問題及推薦系統(tǒng)中數(shù)據(jù)稀疏問題,本文提出一種融合知識圖譜與圖片特征的推薦模型。該模型利用深度游走模型(Deep Walk)[15]捕獲空間結(jié)構(gòu)的方法和波紋網(wǎng)絡(luò)模型(RippleNet)[9]的思想同時挖掘知識圖譜的空間結(jié)構(gòu)和知識表達(dá),并且考慮圖片對用戶偏好的影響,擴(kuò)展知識圖譜模態(tài),有效地將這些信息進(jìn)行混合,從而進(jìn)一步提高了推薦精度。本文的貢獻(xiàn)主要包括以下幾點(diǎn)。

        (1) 與現(xiàn)有的研究不同,本文提出融合知識圖譜語義特征、空間結(jié)構(gòu)信息以及圖片特征的推薦模型(KG-I)。將知識圖譜結(jié)構(gòu)嵌入、知識嵌入和視覺嵌入作為不同模態(tài)輸入,并保持各模態(tài)間的對應(yīng)關(guān)系,去挖掘用戶-項目之間的潛在信息,以此提高推薦算法的性能;

        (2) 本文基于知識圖譜挖掘了其結(jié)構(gòu)信息和知識信息相關(guān)的兩種向量表示,基于圖片特征構(gòu)建了用戶興趣度矩陣。設(shè)計融合策略,以用戶對項目的隱式反饋作為銜接,對3種不同的嵌入表示更好的融合;最后,結(jié)合L2正則優(yōu)化和梯度下降對特征概率進(jìn)行限制;

        (3) 在真實的數(shù)據(jù)集上進(jìn)行了一系列的實驗來驗證模型的推薦效果,包括與現(xiàn)有模型的效果比較、研究多種特征對于推薦效果的影響、研究模型在不同稀疏度數(shù)據(jù)子集的表現(xiàn)。結(jié)果表明,這種融合知識圖譜與圖片特征的個性化推薦模型完全優(yōu)于對比算法。

        2 相關(guān)工作

        2.1 知識圖譜

        知識圖譜(Knowledge Graph)[12]具有強(qiáng)大的語義表達(dá)能力,本質(zhì)上是語義網(wǎng)絡(luò)的知識庫,具體地說是一種表達(dá)語義的多關(guān)系圖。從最初的優(yōu)化Google搜索引擎,到現(xiàn)在的自然語言理解、聊天機(jī)器人、問答系統(tǒng)、可視化知識表現(xiàn)等都與知識圖譜技術(shù)相關(guān)。近年,知識圖譜在推薦領(lǐng)域的熱度也不斷上升,較多的推薦領(lǐng)域?qū)W者致力于構(gòu)建商品、電影、音樂相關(guān)的知識圖譜,從中挖掘出用戶的潛在興趣偏好,分析知識圖譜對推薦系統(tǒng)性能的影響。

        2.2 知識圖譜與推薦系統(tǒng)

        知識圖譜運(yùn)用于推薦領(lǐng)域成為熱門研究,一方面知識圖譜補(bǔ)全了推薦系統(tǒng)項目信息的完整性,提供了更多與項目相關(guān)的信息;另一方面知識圖譜模擬了實際用戶對項目的興趣路徑。因此,利用知識圖譜的推薦系統(tǒng)方法分為兩類,基于知識圖譜特征學(xué)習(xí)方法和基于固定路徑數(shù)據(jù)的方法。基于知識圖譜特征學(xué)習(xí)方法[16,17]主要通過提取文本構(gòu)建知識圖譜,將項目與知識圖譜中實體進(jìn)行融合,然后利用傳統(tǒng)的推薦模型進(jìn)行訓(xùn)練,如協(xié)同知識嵌入(Collaborative Knowledge base Embedding, CKE)[18]、深度知識感知網(wǎng)絡(luò)(Deep Knowledge-aware Network,DKN)[12]等,這些特征更多利用項目之間的豐富的語義信息?;诠潭窂綌?shù)據(jù)[13,14]的方法主要通過設(shè)定特定路徑挖掘?qū)嶓w之間的潛在關(guān)系,利用網(wǎng)絡(luò)結(jié)構(gòu)來挖掘項目之間的潛在關(guān)系,如元圖融合推薦模型(Meta-Graph based recommendation Fusion,FMG)[14]、個性化實體推薦模型(Personalized Entity Recommendation, PER)[19]等,直觀地捕獲知識圖譜的網(wǎng)絡(luò)結(jié)構(gòu)。

        多模態(tài)知識圖譜與傳統(tǒng)的知識圖譜最主要的區(qū)別主要體現(xiàn)在圖譜中的實體通過不同模態(tài)進(jìn)行刻畫,形成一種多模態(tài)的語義關(guān)聯(lián),因此需要注意不同模態(tài)下的數(shù)據(jù)對應(yīng)關(guān)系。多模態(tài)知識圖譜運(yùn)用于推薦系統(tǒng)主要側(cè)重于特征和實體的兩種方式:基于特征的方式是將不同模態(tài)信息直接視為實體的輔助信息,如文獻(xiàn)[20]提出的基于多模式翻譯模型,該模型在知識圖譜的3元組數(shù)據(jù)上加入視覺和語言信息,設(shè)計融合函數(shù)使用特征;基于實體的方式是將不同類別的信息視作結(jié)構(gòu)化的知識關(guān)系3元組,如多模態(tài)知識圖譜嵌入(Multimodal Knowledge Base Embeddings, MKBE)[21]將不同數(shù)據(jù)與關(guān)系模型結(jié)合去學(xué)習(xí)實體的關(guān)系的嵌入,提出新型多模填補(bǔ)模型生成缺失的多模數(shù)據(jù)。

        3 融合知識圖譜與圖片特征的推薦模型

        本文通過深度游走[15]算法和RippleNet[9]模型的思想,可以自主挖掘知識圖譜的知識信息和結(jié)構(gòu)信息,不需要手動設(shè)置路徑,并在此基礎(chǔ)上引入圖片特征來提升推薦系統(tǒng)的性能。利用知識圖譜G與用戶評分列表L作為模型輸入,結(jié)合項目的圖片特征,從而輸出用戶點(diǎn)擊項目的預(yù)測概率。

        融合知識圖譜與圖片信息的推薦模型(integrating Knowledge Graph and Image features, KG-I)結(jié)構(gòu)如圖1所示,其中上半部分包含知識圖譜G與圖片構(gòu)成的多模態(tài)知識圖譜和視覺嵌入方法,下半部分包含多模態(tài)知識圖譜的結(jié)構(gòu)嵌入和知識嵌入方法。如圖1結(jié)構(gòu)模塊所示,結(jié)構(gòu)嵌入中利用深度游走思想獲取知識圖譜的空間結(jié)構(gòu)特征表示;如圖1語義模塊所示,知識嵌入中將頭尾節(jié)點(diǎn)與關(guān)系組建3元組表示知識圖譜的語義關(guān)系,獲取用戶的擴(kuò)散偏好集合,對知識圖譜的語義特征表示;如圖1圖片模塊所示,視覺嵌入挖掘知識圖譜實體的圖片特征。最終對3種不同的嵌入表示進(jìn)行融合,輸出用戶點(diǎn)擊項目的預(yù)測概率。

        圖1 KG-I框架圖

        本文的推薦系統(tǒng)以點(diǎn)擊率預(yù)測為目標(biāo)進(jìn)行訓(xùn)練,同時根據(jù)點(diǎn)擊率排序進(jìn)行Top-N列表推薦??紤]知識圖譜和推薦算法以及融合特征進(jìn)行聯(lián)合學(xué)習(xí),所以模型的損失函數(shù)如式(1)所示

        3.1 結(jié)構(gòu)特征學(xué)習(xí)

        結(jié)構(gòu)特征學(xué)習(xí)模塊的目標(biāo)是獲取知識圖譜中實體節(jié)點(diǎn)在知識圖譜中位置的向量維度映射,利用知識圖譜鄰近節(jié)點(diǎn)的依賴性實現(xiàn)知識圖譜結(jié)構(gòu)特征表示。通過深度游走方法無監(jiān)督地捕獲知識圖譜拓?fù)浣Y(jié)構(gòu)信息,整個知識圖譜的實體由各個實體對應(yīng)的向量表示反映整個網(wǎng)絡(luò)的結(jié)構(gòu)特征。適當(dāng)規(guī)模的向量特征表示通用于任何分類算法或者集成于其他機(jī)器學(xué)習(xí)算法。

        3.2 知識特征學(xué)習(xí)

        知識圖譜與普通網(wǎng)絡(luò)結(jié)構(gòu)圖不同,推薦項目的知識圖譜涵蓋項目大量的隱藏知識語義信息。知識圖譜中每一條復(fù)雜連接在實際場景下均可以進(jìn)行有效的翻譯,例如用戶對某項目的行為通過路徑傳遞至另一項目,可以根據(jù)3元組(頭節(jié)點(diǎn)、關(guān)系、尾節(jié)點(diǎn))表示鏈路的語義特征,所有的尾節(jié)點(diǎn)作為頭節(jié)點(diǎn)和關(guān)系的翻譯結(jié)果反映用戶的潛在興趣偏好。而這種傳遞隨著鏈路的增加帶來更多的噪聲數(shù)據(jù)使用戶的潛在偏好受到影響。合適的鏈路長度不僅需要挖掘用戶在知識圖譜中的潛在偏好同時也要滿足項目能夠與遠(yuǎn)端項目保有聯(lián)系。

        為了減少計算開銷,每個用戶擴(kuò)散偏好集的大小相同。后續(xù)實驗會討論擴(kuò)散偏好集的大小以及鏈路長度對推薦結(jié)果的影響。

        3.3 圖片特征提取

        用戶選擇項目的興趣來源主要包括朋友的推薦、與之前項目類似的物品等途徑,同時圖片信息可以給用戶帶來最直接的感官刺激。因此,在一定的程度上項目圖片特征對用戶的選擇有著隱式影響。

        本文設(shè)計圖片特征模塊,如圖1圖片模塊所示,該模塊挖掘項目圖片的潛在特征,后續(xù)與知識圖譜分解后的結(jié)構(gòu)特征和語義特征相融合重構(gòu)項目特征,緩解傳統(tǒng)協(xié)同過濾算法中的數(shù)據(jù)稀疏性問題。具體使用圖像卷積神經(jīng)網(wǎng)絡(luò)(Visual Geometry Group, VGG16)[22]框架挖掘項目圖片特征的流程如圖2所示。

        圖2 VGG16框架圖

        使用VGG16框架卷積圖片數(shù)據(jù)獲得高維海報特征數(shù)據(jù)。較大的數(shù)據(jù)組成面臨著高難度的運(yùn)算復(fù)雜度,因此選擇主成分分析算法(Principal Component Analysis, PCA)[23]在保留圖片數(shù)據(jù)的特征的同時降低數(shù)據(jù)維度,降低后續(xù)運(yùn)算和時間復(fù)雜度。根據(jù)主成分公式獲得PCA處理后的低維圖片特征數(shù)據(jù)與分解后的知識圖譜特征融合。當(dāng)項目不存在圖片時,使用0向量作為項目的圖片特征,使得當(dāng)前項目不參與圖片特征的融合。

        3.4 知識圖譜與圖片特征的融合策略

        為了以更細(xì)粒度的方式模擬用戶與項目之間的交互,提出了一種知識圖譜語義特征、結(jié)構(gòu)特征和圖片特征的融合策略去挖掘用戶潛在興趣偏好。

        其中,V,E,R分別為項目和知識圖譜實體與關(guān)系的向量表示。Ir是 項目在關(guān)系r下的向量表示。α,β分別表示知識圖譜結(jié)構(gòu)特征和圖片特征的權(quán)重向量。損失函數(shù)由3項組成,第1項表示預(yù)測概率與真實值之間的交叉熵?fù)p失函數(shù),第2項表示真實關(guān)系下的項目向量與重構(gòu)關(guān)系下的項目誤差,第3項是融合各種特征后防止模型過度擬合的L2正則化。

        4 實驗及分析

        設(shè)計實驗去驗證提出模型的推薦性能,在內(nèi)存32 GB,處理器型號為AMD EPYC? ROME的Windows Server 2012服務(wù)器中,利用Tensorflow作為深度學(xué)習(xí)的框架,使用Python3.5設(shè)計對比實驗進(jìn)行性能分析。

        4.1 數(shù)據(jù)集

        本文數(shù)據(jù)來源于公開數(shù)據(jù)集MovieLens(https://grouplens.org/datasets/movielens),數(shù)據(jù)集中包含610個用戶對9742部電影的100000多條1~5分范圍內(nèi)的評分?jǐn)?shù)據(jù)。知識圖譜數(shù)據(jù)源于MovieLens中統(tǒng)一資源定位符(Uniform Resource Locator, URL)在互聯(lián)網(wǎng)電影資源庫 (Internet Movie DataBase,IMDB) (https: //www.imdb.com)中的映射,獲取導(dǎo)演、作者、演員等輔助信息去構(gòu)建知識圖譜,數(shù)據(jù)基本信息見表1。本實驗將數(shù)據(jù)集按4:1的比例劃分訓(xùn)練集和測試集進(jìn)行對比實驗分析。

        表1 實驗數(shù)據(jù)

        4.2 實驗評價指標(biāo)

        (1) 點(diǎn)擊率預(yù)測。實驗通過預(yù)測用戶對電影的點(diǎn)擊率對推薦性能分析。采用度量標(biāo)準(zhǔn)特征曲線下面積(Area Under Curve, AUC)[9]和正確率(Accuracy,Acc)[9]作為反映算法準(zhǔn)確度的指標(biāo)。

        (2) Top-N列表推薦。實驗通過給用戶推薦N個項目的列表對推薦性能分析。采用度量標(biāo)準(zhǔn)為召回率 ( Recall@K)[16]和準(zhǔn)確率( Precision@K)[16]作為衡量推薦列表的指標(biāo)。

        4.3 參數(shù)設(shè)置與對比分析

        在本節(jié)討論分析實驗的具體參數(shù)設(shè)置,其中d表示特征維度,h表示鏈路長度,m表示擴(kuò)散偏好集的每層大小,λ1表示KGE損失權(quán)重,λ2表示L2正則項權(quán)重。

        為了測量特征維度d對推薦效果的影響,分別設(shè)置d=4, 8, 16, 32, 64對數(shù)據(jù)集進(jìn)行實驗,實驗結(jié)果如圖3(a)所示。當(dāng)維度d=8時推薦效果達(dá)到最佳。最初,AUC隨著d的增加而增加,特征帶來更多信息;而當(dāng)d一直增加時,會帶來過擬合現(xiàn)象,導(dǎo)致模型性能下降。

        為了測量鏈路長度h對推薦效果的影響,分別設(shè)置h=2, 3, 4, 5對數(shù)據(jù)集進(jìn)行實驗,實驗結(jié)果如圖3(b)所示。結(jié)果顯示當(dāng)鏈路長度h=2時推薦效果達(dá)到最佳。隨著h的增加,實體之間的關(guān)聯(lián)減弱,帶來更多的噪聲數(shù)據(jù)。過長的關(guān)系連接從知識圖譜中挖掘出過多的無用信息,過短的路徑無法探索遠(yuǎn)端實體與用戶之間的相關(guān)性和依賴性。

        為了測量擴(kuò)散偏好集每一層大小對推薦效果的影響,分別設(shè)置m=8, 16, 32, 64對數(shù)據(jù)集進(jìn)行實驗,實驗結(jié)果如圖3(c)所示。結(jié)果顯示當(dāng)擴(kuò)散偏好集m=32時推薦效果達(dá)到最佳。一開始AUC隨著m的增加而增加,當(dāng)m太大時帶來更多的實體數(shù)據(jù)但實體間關(guān)聯(lián)性減弱,同時計算開銷增加,實際推薦效果下降。

        圖3 模型參數(shù)對AUC的影響

        為了確定損失函數(shù)中權(quán)重λ1, λ2,分別在數(shù)據(jù)集上設(shè)置實驗去選取合適的權(quán)重值。實驗結(jié)果如圖4所示。結(jié)果顯示當(dāng)λ1=0.5,λ2=10–7時推薦效果達(dá)到最佳。

        圖4 模型權(quán)重對AUC的影響

        綜上所述,實驗的具體參數(shù)設(shè)置為特征維度d=8,擴(kuò)散偏好集的層數(shù)h=2,擴(kuò)散偏好集的每層大小m=32,KGE損失權(quán)重λ1= 0.5,L2正則項權(quán)重λ2=10–7。

        4.4 模型訓(xùn)練變化分析

        在本節(jié)討論分析實驗?zāi)P碗S著訓(xùn)練次數(shù)的增加,評價指標(biāo)AUC和Acc在訓(xùn)練集和測試集的變化情況。實驗結(jié)果如圖5所示。

        由圖5可以看出,隨著訓(xùn)練次數(shù)的增加,模型訓(xùn)練集和測試集上的AUC和Acc指標(biāo)在訓(xùn)練20次左右達(dá)到最高值并開始收斂。在模型收斂后,不斷增加訓(xùn)練會致使模型在測試集上的AUC和Acc微弱下降,但整體影響較小。

        圖5 AUC和Acc評價指標(biāo)隨訓(xùn)練輪數(shù)的變化圖

        4.5 實驗結(jié)果及分析

        本文主要從模型預(yù)測準(zhǔn)確性方面和Top-N列表推薦方面分析融合知識圖譜與圖片信息的推薦模型(integrating Knowledge Graph and Image features, KG-I)在MovieLens集上的性能表現(xiàn)。所有對比方法均采用4.2節(jié)指標(biāo)進(jìn)行性能衡量。在這一節(jié),主要在數(shù)據(jù)集上進(jìn)行以下實驗:(1)比較本文所提模型和現(xiàn)有模型的效果;(2)研究多種特征對于推薦效果的影響,包括知識圖譜的語義特征、結(jié)構(gòu)特征以及圖片特征;(3)研究模型在不同稀疏度數(shù)據(jù)子集的表現(xiàn)。

        4.5.1 與其他對比模型比較

        為了驗證文中提出的模型性能,本文選取下面幾種推薦相關(guān)模型作為對比。

        基于貝葉斯個性化排序的矩陣分解(Matrix Factorization base Bayesian Personalized Ranking, BPRMF)[24]:通過構(gòu)建用戶對不同物品的偏序關(guān)系進(jìn)行協(xié)調(diào)過濾的推薦。

        深度知識感知網(wǎng)絡(luò)(Deep Knowledge-aware Network, DKN)[12]:將知識圖譜實體嵌入與卷積神經(jīng)網(wǎng)絡(luò)相融合,利用關(guān)系建模轉(zhuǎn)換嵌入方法(Transe)對知識圖譜進(jìn)行項目表示,給用戶進(jìn)行推薦。

        RippleNet[9]:將知識圖譜特征學(xué)習(xí)融入推薦系統(tǒng),利用偏好擴(kuò)散結(jié)合注意力機(jī)制得到用戶的偏好特征進(jìn)行推薦。

        KG-I:利用深度游走和偏好擴(kuò)散原理將知識圖譜的語義和結(jié)構(gòu)特征相融合,同時融入項目圖片特征進(jìn)行推薦。

        融合知識圖譜語義特征和結(jié)構(gòu)特征的推薦模型(integrating Knowledge Graph- Semantic and Structural features, KG-SS):該模型在KG-I的基礎(chǔ)上融合知識圖譜語義特征和結(jié)構(gòu)特征,沒有考慮項目圖片特征。

        基于知識圖譜語義特征的推薦模型(integrating Knowledge Graph-Semantic features, KG-S):該模型僅僅考慮知識圖譜的語義信息,沒有考慮知識圖譜的結(jié)構(gòu)特征與項目圖片特征。

        實驗設(shè)置點(diǎn)擊率預(yù)測,比較各模型在數(shù)據(jù)集上的AUC和Acc,結(jié)果如表2所示,同時在Top-N列表推薦的場景下設(shè)置top-K=1, 5, 10, 20, 50, 100,比較各模型在數(shù)據(jù)集上的召回率和精確度,結(jié)果如圖6所示。

        觀察表2和圖6可以發(fā)現(xiàn):

        圖6 不同模型的召回率和準(zhǔn)確率

        表2 在MovieLens集上各種算法AUC和Acc對比

        (1)在實驗中,BPRMF的總體效果略微遜色于其他對比算法,這主要因為利用知識圖譜的算法模型效果更好,知識圖譜帶來了更多的項目潛在信息,從而提升了推薦效果。

        (2) 與RippleNet模型相比,RippleNet只是挖掘了知識圖譜中的語義信息忽略了圖譜本身自帶的空間結(jié)構(gòu)特征,因此效果略微遜色與KG-SS模型。

        (3) KG-I算法的推薦性能比DKN, RippleNet算法在知識圖譜的基礎(chǔ)上加入了圖片特征,這說明圖片特征的融合有利于提高推薦算法的性能。

        (4) BPRMF在準(zhǔn)確率值上表現(xiàn)略高,召回率和準(zhǔn)確率的指標(biāo)是相互矛盾的,召回率越高準(zhǔn)確率越低。實際情況下需要保證召回率和準(zhǔn)確率相對平衡。結(jié)合表中數(shù)據(jù),BPRMF的推薦效果表現(xiàn)一般。

        (5) 本文方法在數(shù)據(jù)集上取得了最好的效果,因為它不僅挖掘知識圖譜的語義特征和結(jié)構(gòu)特征,同時融合項目的圖片特征,豐富了用戶的歷史偏好數(shù)據(jù)集。

        實驗結(jié)果表明:KG-I模型更好地利用知識圖譜的特征,融合多種數(shù)據(jù)信息提高推薦效果。

        4.5.2 多種特征對于推薦效果的影響

        為了研究本文所提融合知識圖譜語義特征、結(jié)構(gòu)特征、圖片特征對于推薦效果的影響,設(shè)置實驗進(jìn)行對比。

        KG-S:該模型僅僅考慮知識圖譜的語義信息,沒有考慮知識圖譜的結(jié)構(gòu)特征與項目圖片特征。

        KG-SS:該模型融合知識圖譜語義特征和結(jié)構(gòu)特征,沒有考慮項目圖片特征。

        KG-I:該模型融合知識圖譜語義特征、結(jié)構(gòu)特征和項目圖片特征。

        融合知識圖譜語義特征與圖片特征的推薦模型(integrating Knowledge Graph- Semantic and Image feature, KG-SI):該模型不僅僅考慮知識圖譜的語義信息,同時引入項目圖片特征,沒有挖掘知識圖譜結(jié)構(gòu)特征。

        該實驗設(shè)置top-K=1, 5, 10, 20, 50, 100比較各模型在數(shù)據(jù)集上的召回率和精確度,結(jié)果如圖7所示。

        從圖7可以看出:

        圖7 不同特征的召回率和準(zhǔn)確率

        (1) KG-I模型比KG-SS模型推薦效果好,說明在原有知識圖譜的基礎(chǔ)上圖片特征的引入提高了模型的推薦效果;

        (2) KG-I模型與KG-SI相比,召回率有明顯提升的同時準(zhǔn)確率也有所提升,這說明知識圖譜的結(jié)構(gòu)特征對推薦效果有著重要影響,不能完全忽略。

        (3) KG-I模型的推薦效果是最好的,說明同時考慮了知識圖譜的結(jié)構(gòu)特征、語義特征與項目圖片特征時,模型效果最好。

        實驗結(jié)果表明,知識圖譜的結(jié)構(gòu)特征、語義特征和項目圖片特征的融合能夠有效地提高推薦的效果。KG-I模型的特征融合優(yōu)于現(xiàn)有的利用知識圖譜的推薦效果。

        4.5.3 稀疏性驗證

        為了驗證模型在不同稀疏度數(shù)據(jù)集的表現(xiàn),該實驗分別對訓(xùn)練集抽取了不同的數(shù)據(jù)子集設(shè)置實驗進(jìn)行對比。

        步驟1 在原有訓(xùn)練集的基礎(chǔ)上,隨機(jī)選取20%的數(shù)據(jù),降低數(shù)據(jù)密度,分別在不同模型上進(jìn)行實驗。

        步驟2 在原有訓(xùn)練集的基礎(chǔ)上,隨機(jī)選取50%的數(shù)據(jù),降低數(shù)據(jù)密度,分別在不同模型上進(jìn)行實驗。

        步驟3 在原有訓(xùn)練集的基礎(chǔ)上,隨機(jī)選取80%的數(shù)據(jù),降低數(shù)據(jù)密度,分別在不同模型上進(jìn)行實驗。

        該實驗設(shè)置top-K=1, 5, 10, 20, 50, 100,比較各模型在數(shù)據(jù)集上的召回率,結(jié)果如圖8所示。從圖8可以看出:

        圖8 不同數(shù)據(jù)稀疏度的召回率

        (1) 與KG-I模型類似,RippletNet模型隨著數(shù)據(jù)越來越稀疏,利用知識圖譜的模型的召回率變化大,推薦效果的優(yōu)勢越來越明顯。這說明考慮知識圖譜的推薦,較好地緩解了數(shù)據(jù)稀疏性的問題。

        (2) 無論數(shù)據(jù)的稀疏度如何,KG-I的召回率指標(biāo)變化不大基本不受數(shù)據(jù)稀疏度的影響。而BPRMF模型有明顯的降低,說明BPRMF模型受數(shù)據(jù)稀疏度影響較大。

        (3) 在越稀疏的數(shù)據(jù)集上,KG-I模型的推薦效果越明顯。隨著數(shù)據(jù)密度的上升,其他算法的推薦效果有明顯的回升。

        實驗結(jié)果表明:相比于其他的推薦模型,KG-I模型在數(shù)據(jù)較為稀疏的情況下依舊能夠有很好的推薦效果,KG-I模型有效地緩解數(shù)據(jù)稀疏問題。

        5 結(jié)束語

        本文完成知識圖譜與推薦領(lǐng)域的結(jié)合,提出一種融合知識圖譜與圖片特征的推薦模型(KG-I)。文中將知識圖譜結(jié)構(gòu)嵌入、知識嵌入和視覺嵌入作為不同模態(tài)輸入,并保持各模態(tài)間的對應(yīng)關(guān)系,以用戶對項目的隱式反饋作為銜接,對3種不同的嵌入表示更好的融合,以此提高推薦算法的性能。需要注意的是知識圖譜的實體和現(xiàn)實用戶項目等具體的映射。結(jié)果表明,知識圖譜的結(jié)構(gòu)特征、知識特征以及視覺特征對推薦效果有著重要影響不能忽略,同時融合知識圖譜與圖片特征的個性化推薦模型完全優(yōu)于其他的對比算法并且緩解數(shù)據(jù)稀疏情況。

        本文在各個模態(tài)之間相對較為獨(dú)立,一定程度上的丟失不同模態(tài)之間的依賴和對應(yīng)關(guān)系。多模態(tài)融合方法采取較為基礎(chǔ)的后端融合,使得不同模態(tài)下的錯誤互不影響不會造成錯誤累積,因此使得多模態(tài)數(shù)據(jù)之間互補(bǔ)性較差,但能夠直觀地對比出不同模態(tài)對推薦效果的影響,有一定的參考價值。

        猜你喜歡
        語義模態(tài)特征
        語言與語義
        如何表達(dá)“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        “上”與“下”語義的不對稱性及其認(rèn)知闡釋
        國內(nèi)多模態(tài)教學(xué)研究回顧與展望
        基于HHT和Prony算法的電力系統(tǒng)低頻振蕩模態(tài)識別
        認(rèn)知范疇模糊與語義模糊
        由單個模態(tài)構(gòu)造對稱簡支梁的抗彎剛度
        計算物理(2014年2期)2014-03-11 17:01:39
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        国产国语亲子伦亲子| 丝袜美腿爆炒国产在线观看| 色偷偷亚洲精品一区二区| 亚洲精品乱码久久久久久| 性欧美videofree高清精品| 国产无线乱码一区二三区 | 精品天堂色吊丝一区二区| 开心五月激情综合婷婷色| 一本色道久久综合亚洲精品小说 | 国产精品毛片极品久久| 日韩夜夜高潮夜夜爽无码| 国产av一区二区精品久久凹凸| 欧美精品aaa久久久影院| 成人av一区二区亚洲精| 国产成人无码专区| 国产婷婷一区二区三区| 久久精品国产精品亚洲婷婷| 国产精品国产三级国产专区50| 护士的小嫩嫩好紧好爽| 亚洲欧美日韩在线一区 | 久久国产36精品色熟妇| 大肥婆老熟女一区二区精品| 日本久久久免费观看视频| 手机看片久久国产免费| 毛片毛片免费看| 少妇一区二区三区精选| 夜夜躁日日躁狠狠久久av| 人人爽人人爽人人爽| 免费大学生国产在线观看p| 色和尚色视频在线看网站| 欧洲vat一区二区三区| 在线观看视频一区| 人妻系列少妇极品熟妇| 在线观看人成视频免费| 久久久久亚洲av无码专区桃色| av草草久久久久久久久久久| 一区二区三区免费观看日本| 忘忧草社区www日本高清| 男人j进女人p免费视频| 亚洲精品国产av成拍色拍| 中文字幕日韩三级片|