亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于協(xié)同過濾知識圖譜的圖書推薦

        2024-01-07 14:08:01孫進(jìn)強(qiáng)肖銀寶
        科技風(fēng) 2023年36期
        關(guān)鍵詞:協(xié)同過濾推薦系統(tǒng)知識圖譜

        孫進(jìn)強(qiáng) 肖銀寶

        摘要:目前存在的圖書推薦算法普遍都只考慮了讀者對圖書的評分等數(shù)據(jù),忽略了圖書的其他屬性,并且這種推薦算法都會面臨冷啟動等問題。為了緩解圖書推薦系統(tǒng)準(zhǔn)確率低、可解釋性差和數(shù)據(jù)稀疏等問題,本文將圖書評分和圖書標(biāo)簽數(shù)據(jù)相結(jié)合,實現(xiàn)圖書的精準(zhǔn)推薦。首先通過圖書與圖書標(biāo)簽之間的關(guān)系構(gòu)建圖書知識圖譜,提取出圖書與圖書之間的關(guān)系,通過前文提到的算法模型計算推測出讀者的讀書偏好,還可以利用圖書和讀者之間的交互信息,通過協(xié)同過濾算法計算出讀者偏好,綜合上述兩種方法得到推薦列表進(jìn)行最終的TopK推薦。

        關(guān)鍵詞:圖書;推薦系統(tǒng);協(xié)同過濾;知識圖譜

        1概述

        進(jìn)入21世紀(jì)以來,互聯(lián)網(wǎng)技術(shù)的快速發(fā)展、計算能力的快速提升,各行業(yè)中產(chǎn)生的大量數(shù)據(jù)開始受到學(xué)者、企業(yè)的重視,但用戶在享受其帶來的便利同時,也面臨著信息過載、信息泄露等問題。用戶在信息資源的快速不停地產(chǎn)生情況下無法準(zhǔn)確獲取自己需要的目標(biāo)信息。推薦系統(tǒng)的出現(xiàn),有效緩解了上述問題。而協(xié)同過濾算法利用協(xié)同信息推薦用戶感興趣的信息,被廣泛運(yùn)用于圖書、電影、電商等領(lǐng)域。但在實際應(yīng)用過程中,協(xié)同過濾的數(shù)據(jù)稀疏問題嚴(yán)重,實際的推薦效果并不理想。為此,學(xué)者們提出了在協(xié)同過濾算法中添加各種輔助信息來解決這個問題。

        2研究方案

        分析圖書數(shù)據(jù)集的數(shù)據(jù)構(gòu)成,設(shè)計圖書知識圖譜的實體、關(guān)系、屬性以及標(biāo)簽的結(jié)構(gòu),從圖書數(shù)據(jù)集中抽取出知識語義信息,并對知識語義信息進(jìn)行預(yù)處理。對錯誤、缺失信息進(jìn)行合理化處理,直接提取出實體信息,預(yù)定義實體之間的關(guān)系,對實體進(jìn)行抽取找到匹配關(guān)系,并將實體和關(guān)系信息存入圖形數(shù)據(jù)庫中。通過低維的圖形化表示來直觀地顯示出高維語義信息,以此設(shè)計并構(gòu)建圖書推薦模型并進(jìn)行驗證。

        構(gòu)建基于知識圖譜與協(xié)同過濾的推薦模型之前,首先需要考慮其主要的目標(biāo)需求和重點(diǎn)難點(diǎn),并調(diào)研實際應(yīng)用中不同類別信息對用戶做出選擇的影響程度因子,確定問題的輸入、輸出、約束以及邊界條件,通過對問題的目標(biāo)函數(shù)、約束條件等進(jìn)行梳理,設(shè)計適合圖書推薦的推薦模型。

        根據(jù)軟件工程中的相關(guān)概念,在設(shè)計系統(tǒng)軟件時首先需要進(jìn)行需求分析,得到完整的需求定義,從而避免后續(xù)開發(fā)時的不斷修改任務(wù)需求,可以減少開發(fā)周期。

        3知識圖譜和協(xié)同過濾算法的引進(jìn)

        個性化推薦的基礎(chǔ)原理就是通過采集用戶的信息以及相關(guān)行為進(jìn)行分析推測,以此為基礎(chǔ)向用戶推薦其感興趣的項目,例如在短視頻行業(yè)中,用戶的點(diǎn)贊記錄、興趣愛好等都會被推薦系統(tǒng)抓取,用來提高服務(wù)質(zhì)量,提高用戶黏性。而傳統(tǒng)的推薦算法有:協(xié)同過濾算法、基于內(nèi)容的推薦算法、混合推薦算法等。

        協(xié)同過濾算法的原理是計算兩兩個體之間的相似度分析預(yù)測用戶可能感興趣的項目,從而快速準(zhǔn)確地實現(xiàn)將合適的項目推薦給合適的用戶。協(xié)同過濾算法按照根據(jù)主體可劃分為基于項目的協(xié)同過濾推薦(ICF)、基于用戶的協(xié)同過濾(UCF)以及基于模型的協(xié)同過濾(MCF)。前兩種方法都是利用“用戶—項目評分矩陣”進(jìn)行推薦,本文主要采用的是基于用戶的協(xié)同過濾推薦算法。

        如圖1所示,在推薦系統(tǒng)中根據(jù)用戶對項目的評分可以得到如下的“用戶項目評分矩陣”,矩陣中的元素值就是特定用戶對特定項目的評分,“*”代表用戶并未對此項目進(jìn)行評分,將該矩陣通過訓(xùn)練得到用戶模型,從中選取出與目標(biāo)用戶最相似的n個用戶,從而為目標(biāo)用戶進(jìn)行推薦。但在實際運(yùn)用過程時發(fā)現(xiàn)用戶對項目評分的數(shù)量較少,形成的該矩陣非常稀疏。

        基于用戶的協(xié)同過濾是利用每個用戶對同一個項目的不同感興趣程度,計算出兩兩用戶之間的相似度找到每個用戶的相似用戶集,在相似用戶集的感興趣項目集合中預(yù)測推薦用戶感興趣的項目,其工作原理如圖2所示,UserB和UserC相似,他們的興趣愛好很大程度相似,而UserB喜歡Bookb,所以推測UserC大概率也會喜歡Bookb,所以給他推薦這本書。

        其工作流程:

        Step1:采用余弦相似度計算公式計算任意兩個用戶之間的相似度

        Wμv=N(μ)∩N(v)N(μ)N(v)(1)

        Ssep2:建立一張用戶相似度表,其中保存任意兩個用戶之間的相似度,方便后續(xù)挑選出若干個與目標(biāo)用戶最相似的用戶。

        Step3:采用如下公式度量用戶μ對物品i的感興趣程度。

        p(μ,i)=∑v∈S(μ,K)∩N(i)WμvRvi(2)

        其中S(μ,K)表示與用戶μ最相似的K個用戶,將與用戶μ相似的用戶列表按照相似度進(jìn)行排序就可以得到,N(i)表示喜歡物品i的用戶集合,Wμv是用戶μ和用戶v之間的相似度,Rvi表示用戶v對物品i的興趣。

        Step4:對于與用戶μ最相似的k個用戶,分別計算用戶μ與這k個用戶喜歡的物品集合In,n∈1,2,…,N之間的感興趣程度,得到用戶μ對這N個物品的感興趣程度排序列表,取前m個物品推薦給用戶μ。

        知識圖譜(KnowledgeGraph,KG)是由節(jié)點(diǎn)和邊組成的語義網(wǎng)絡(luò)圖,包含豐富的語義知識被廣泛應(yīng)用到搜索引擎、推薦系統(tǒng)、智能問答等領(lǐng)域。其運(yùn)用在推薦系統(tǒng)上具有準(zhǔn)確率高、可解釋強(qiáng)等優(yōu)點(diǎn),其按照運(yùn)用方向可以分為兩類,其中最普遍的就是項目知識圖譜,此外還可以將用戶—項目之間存在的各種關(guān)系類型轉(zhuǎn)換為圖譜可表達(dá)的關(guān)系,在此基礎(chǔ)上搭建出用戶—項目關(guān)系的知識圖譜,根據(jù)其圖譜上距離計算相似度從而進(jìn)行推薦。圖書的知識圖譜示例圖如下圖3所示

        圖3圖書知識圖譜

        知識圖譜是由一條條基礎(chǔ)知識表達(dá)構(gòu)成的,其中每條知識都可以用一個三元組表達(dá):(實體,關(guān)系,實體)或(實體,屬性,屬性值),例如,某作者與《××》就是通過“作者”關(guān)系建立一個三元組表達(dá)的知識,2012年與《××》通過“出版時間”屬性建立一個三元組。多個這類三元組之間相互關(guān)聯(lián),從而形成了一個關(guān)于圖書的知識圖譜。根據(jù)這種規(guī)則搭建的圖書知識圖譜,那么兩兩圖書在圖譜中距離就可以代表這兩本圖書之間的相似性。

        目前利用知識圖譜進(jìn)行推薦主要采用知識圖譜嵌入、路徑實例挖掘以及高階信息聚合三種技術(shù)。其中知識圖譜嵌入法的主要思想是利用圖譜嵌入技術(shù)獲取用戶和項目的圖譜表示,Wang在論文中將知識圖譜嵌入技術(shù)詳細(xì)分成兩種:基于語義匹配的嵌入和基于距離的翻譯嵌入?;诰嚯x的翻譯嵌入模型將實體和關(guān)系分別以低維向量表示,這是訓(xùn)練知識圖譜中Trans系列算法普遍采用的函數(shù)思想,即:

        h+r≈t(3)

        其中h,t分別代表知識圖譜中的頭實體和尾實體的向量,r代表關(guān)系的向量。Trans系列方法主要有TransE、TransH以及TransR等。本文的知識圖譜技術(shù)主要采用基于距離的翻譯嵌入TransE算法,其示意圖如圖4所示。

        給定圖書的知識圖譜(h,r,t),其中h為頭實體集合,t為尾實體集合,r為關(guān)系集合。然后將實體和關(guān)系在各自的空間中(實體空間和關(guān)系空間)表示為向量,使知識圖譜中的每個三元組的實體向量和關(guān)系向量滿足公式三:即如果三元組是正確的,則頭實體向量加上關(guān)系向量的結(jié)果應(yīng)該和尾實體向量極為接近;反之,頭實體向量和關(guān)系向量的加和應(yīng)該與尾實體向量相差很多?;诖?,TransE算法的目標(biāo)函數(shù)設(shè)計為:

        L=∑(h,r,t)∈S∑(h′,r′,t′∈S′)γ+d(h+r,t)-d(h′+r,t′)+(4)

        其中h表示正確的三元組集合,h′表示錯誤的三元組集合,γ表示正負(fù)樣本之間的間距,是一個常數(shù),x+表示max0,x,通常為了訓(xùn)練方便且避免過擬合問題,會加上約束條件

        模型優(yōu)化過程為最小化目標(biāo)函數(shù)L,即此時d(h+l,t)的值小,d(h′+l,t′)的值大,同時采用隨機(jī)梯度下降(SGD加速優(yōu)化過程,其算法主要可分為三步,偽代碼描述如下圖5所示:

        Step1:對源數(shù)據(jù)進(jìn)行預(yù)處理,設(shè)計實體以及關(guān)系。

        Step2:對實體以及關(guān)系進(jìn)行抽取,初始化頭實體、尾實體和關(guān)系向量,并對初始化向量做歸一化處理,構(gòu)建圖書的知識圖譜。

        Step3:對數(shù)據(jù)集中的三元組抽樣,并對抽樣出來的三元組進(jìn)行實體替換,形成負(fù)樣本。

        Step4:優(yōu)化目標(biāo)函數(shù),得到實體和關(guān)系的向量表示。

        混合推薦系統(tǒng)是采用多種推薦方式相結(jié)合產(chǎn)生的,將各種推薦方式的優(yōu)點(diǎn)融合在一起。混合推薦技術(shù)可以分為推薦算法的混合技術(shù)和推薦結(jié)果的混合技術(shù)。推薦算法的混合是將不同的推薦算法融合在一起,從而改善嵌入向量的計算過程,以此來獲得更加優(yōu)質(zhì)的推薦結(jié)果。推薦結(jié)果的混合式指通過不同的推薦方式,得到多個推薦結(jié)果,再通過不同的參數(shù)將每個推薦技術(shù)的推薦結(jié)果合并至最終的推薦結(jié)果列表中,以達(dá)到最優(yōu)的推薦結(jié)果。

        結(jié)語

        通過對讀者興趣愛好進(jìn)行合適表達(dá),基于協(xié)同過濾算法和知識圖譜構(gòu)建出適合圖書的推薦模型,在實踐中反復(fù)驗證并改進(jìn),以提升推薦系統(tǒng)的運(yùn)行速度和準(zhǔn)確率,主要是在傳統(tǒng)的協(xié)同過濾算法基礎(chǔ)上融合了知識圖譜技術(shù),彌補(bǔ)了協(xié)同過濾算法的不足;對參數(shù)進(jìn)行多次調(diào)優(yōu),使之符合圖書推薦系統(tǒng)的特點(diǎn),符合用戶對圖書推薦的期望,在推薦效果上優(yōu)于單一技術(shù)應(yīng)用的使用;搭建系統(tǒng)的客戶端和服務(wù),為讀者提供可視化界面。

        參考文獻(xiàn):

        [1]趙俊逸,莊福振,敖翔,等.協(xié)同過濾推薦系統(tǒng)綜述[J].信息安全學(xué)報,2021,6(05):1734.

        [2]黃勃,嚴(yán)非凡,張昊,等.推薦系統(tǒng)研究進(jìn)展與應(yīng)用[J].武漢大學(xué)學(xué)報(理學(xué)版),2021,67(06):503516.

        [3]劉佳奇,王全民.基于改進(jìn)的用戶協(xié)同過濾算法的高校個性化圖書推薦系統(tǒng)[J].計算機(jī)與數(shù)字工程,2020,48(10):24582461.

        [4]于洪,李俊華.一種解決新項目冷啟動問題的推薦算法[J].軟件學(xué)報,2015,26(06):13951408.

        [5]趙杰.基于改進(jìn)用戶興趣模型的個性化圖書推薦算法(英文)[J].機(jī)床與液壓,2018,46(06):193198.

        [6]鄒海濤,陳沁梅.基于信任網(wǎng)絡(luò)與協(xié)同過濾的自適應(yīng)推薦模型研究[J].江蘇科技大學(xué)學(xué)報(自然科學(xué)版),2019,33(04):4550.

        [7]劉嶠,李楊,段宏,等.知識圖譜構(gòu)建技術(shù)綜述[J].計算機(jī)研究與發(fā)展,2016,53(03):582600.

        [8]VrandeCˇiC'D,KrtzschM.Wikidata:afreecollaborativeknowledgebase[J].CommunicationsoftheACM,2014,57(10):7885.

        [9]李雪婷,楊抒,賽亞熱·迪力夏提,等.融合內(nèi)容與協(xié)同過濾的混合推薦算法應(yīng)用研究[J].計算機(jī)技術(shù)與發(fā)展,2021,31(10):2429+37.

        項目:廣東高校重點(diǎn)領(lǐng)域?qū)m椥乱淮畔⒓夹g(shù)重點(diǎn)領(lǐng)域?qū)m楉椖浚ň幪枺?021ZDZX1019)

        作者簡介:孫進(jìn)強(qiáng)(1999—),男,漢族,安徽安慶人,碩士研究生在讀,專業(yè):人工智能,研究方向:大數(shù)據(jù)應(yīng)用;肖銀寶(1973—),男,漢族,云南昆明人,碩士,助理研究員,研究方向:科技管理及信息化。

        猜你喜歡
        協(xié)同過濾推薦系統(tǒng)知識圖譜
        基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
        基于鏈?zhǔn)酱鎯Y(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實現(xiàn)
        基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
        基于個性化的協(xié)同過濾圖書推薦算法研究
        個性化推薦系統(tǒng)關(guān)鍵算法探討
        基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
        近十五年我國小學(xué)英語教學(xué)研究的熱點(diǎn)、問題及對策
        基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
        智富時代(2016年12期)2016-12-01 16:28:41
        混合推薦算法在電影推薦中的研究與評述
        基于知識圖譜的智慧教育研究熱點(diǎn)與趨勢分析
        麻豆乱码国产一区二区三区| 久久伊人这里都是精品| 韩国三级大全久久网站| 伦人伦xxxx国语对白| 日本道免费精品一区二区| 我的极品小姨在线观看| 国产乱码人妻一区二区三区| 国产黄在线观看免费观看不卡| 国产成人国产在线观看| 91中文字幕精品一区二区| 丰满人妻久久中文字幕| 久久久久女人精品毛片| 8av国产精品爽爽ⅴa在线观看| 亚洲伊人av综合福利| 国产精品成人无码久久久久久 | 亚洲人成人77777网站| 91免费国产| 一本之道日本熟妇人妻| 蜜臀av999无码精品国产专区| 日韩一级特黄毛片在线看| 日本中文字幕一区二区在线观看 | 无码熟妇人妻av在线网站 | 麻豆国产一区二区三区四区| 伊人久久五月丁香综合中文亚洲| 亚洲一区二区自拍偷拍| 日本一区二区三区女优在线| 国产综合精品一区二区三区| 国语对白做受xxxxx在线中国 | 91老司机精品视频| 亚洲av午夜福利一区二区国产 | 一区二区三区在线观看人妖| 天堂а在线中文在线新版| 亚洲另类激情综合偷自拍图| 国产性感丝袜美女av| 亚洲成av人片女在线观看| 中文人妻av久久人妻18| 日韩无码尤物视频| 亚洲中文字幕九色日本| 国产精品午夜爆乳美女视频| 99热成人精品国产免| 亚洲av专区一区二区|