亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合用戶偏好和多交互網(wǎng)絡(luò)的協(xié)同過濾算法①

        2021-10-11 06:46:50劉錦濤謝穎華
        計算機系統(tǒng)應(yīng)用 2021年9期
        關(guān)鍵詞:相似性向量神經(jīng)網(wǎng)絡(luò)

        劉錦濤,謝穎華

        (東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海 201620)

        隨著信息和互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,海量的網(wǎng)絡(luò)信息資源使得用戶難以在短時間內(nèi)找到自己感興趣的信息資源,這造成了信息過載問題[1],這種現(xiàn)象的出現(xiàn)嚴重影響了互聯(lián)網(wǎng)的發(fā)展.推薦系統(tǒng)通過分析用戶的歷史行為來獲得用戶的興趣偏好,從而進行定向的信息資源推薦[2,3],減少用戶因篩選信息而消耗的時間,使得用戶能夠快速獲取到于自己有用的信息資源的推薦.但隨著用戶數(shù)和項目數(shù)的激增,傳統(tǒng)推薦算法面臨著嚴重的數(shù)據(jù)稀疏問題.這一問題使得傳統(tǒng)推薦算法計算出的用戶相似度不夠準確,推薦精度不高.因此,改進相似度計算方法、緩解數(shù)據(jù)稀疏性一直以來是推薦算法研究的重點[4-6].

        王巖等將用戶評分分值差異度和用戶評分傾向相似性融入到傳統(tǒng)的協(xié)同過濾算法中,并用項目評分的標準差改進皮爾遜相似性,綜合用戶興趣和改進后的皮爾遜相似性得到更準確的用戶相似度[7].Chen 等在余弦相似度和皮爾遜相似度的計算方法中引入平衡參數(shù),利用平衡參數(shù)解決不同用戶間評級尺度不同的問題,從而對這兩種方法進行優(yōu)化[8].隨著深度學(xué)習的發(fā)展,使用深度學(xué)習緩解推薦系統(tǒng)的數(shù)據(jù)稀疏性問題得到了廣泛地研究[9].目前基于深度學(xué)習的推薦模型主要是結(jié)合神經(jīng)網(wǎng)絡(luò)和矩陣分解思想,將用戶和項目的獨熱編碼(one-hot)作為模型的輸入,通過嵌入層將稀疏的輸入向量映射為稠密向量,然后利用深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)去非線性地學(xué)習用戶和項目潛向量之間的交互結(jié)果,最后根據(jù)學(xué)習到的交互結(jié)果來生成推薦列表[10-12].

        1 相關(guān)知識

        1.1 基于用戶的協(xié)同過濾推薦算法

        基于用戶的協(xié)同過濾推薦算法是通過用戶-項目評分矩陣,計算出用戶之間的評分相似度,然后對評分相似度進行降序排序,選出與目標用戶相似度高的用戶構(gòu)成鄰居用戶集.推薦時,根據(jù)鄰居用戶計算預(yù)測評分,并將預(yù)測評分高的項目推薦給目標用戶[13].這種推薦方法源于生活中的經(jīng)驗假設(shè):若兩個用戶之間的興趣愛好相似,則他們很可能對同一項目有著相似的偏好程度[14].

        (1)用戶相似度計算

        相似度的計算方法主要有余弦相似性、改進的余弦相似性以及皮爾遜相關(guān)系數(shù)等[15,16].余弦相似性是兩個用戶之間的評分向量的夾角余弦值,余弦值越大,相似度越高.改進的余弦相似度考慮到不同用戶的評分習慣對相似度計算準確性的影響,在計算相似度時減去用戶的平均評分.皮爾遜相關(guān)系數(shù)在計算時要首先找出用戶間的共同評分項目集,然后基于該集合使用改進的余弦相似性進行用戶相似度的計算,計算公式如下:

        其中,Suv表示用戶u和用戶v的共同評分項目集合,rui和rvi分別表示用戶u和用戶v對項目i的評分,和分別表示用戶u和v的平均評分.

        (2)評分預(yù)測

        用戶相似度計算完成后,篩選出鄰居用戶集.根據(jù)鄰居用戶對項目的評分和與目標用戶的相似度來預(yù)測目標用戶對項目的評分,計算公式為:

        其中,Pui為目標用戶u對項目i的預(yù)測評分值,NU(u)為目標用戶u的鄰居用戶集,S im(u,v)表示目標用戶u與鄰居用戶v之間的相似度.

        1.2 多交互神經(jīng)網(wǎng)絡(luò)

        多層感知機(Multi-Layer Perceptron,MLP)指的是有多層隱藏層的神經(jīng)網(wǎng)絡(luò).相鄰的神經(jīng)網(wǎng)絡(luò)層之間是全連接的.單個神經(jīng)元的計算是一個前向傳播過程,即通過一個線性函數(shù)關(guān)系和激活函數(shù)向前傳播.

        多交互神經(jīng)網(wǎng)絡(luò)通過構(gòu)建并行的多層感知機來分別學(xué)習不同類型實體的隱特征表示.考慮到隱藏層中每層網(wǎng)絡(luò)的神經(jīng)元數(shù)目和學(xué)習能力不同,學(xué)習到的隱特征表示的維度和意義也不相同,多交互神經(jīng)網(wǎng)絡(luò)充分利用每一層的隱表示結(jié)果,對每層網(wǎng)絡(luò)所學(xué)習到的不同類型實體的隱表示進行一次交互操作,最后綜合所有層的交互結(jié)果來獲取模型最終的預(yù)測結(jié)果[17],網(wǎng)絡(luò)模型如圖1所示.

        圖1 多交互神經(jīng)網(wǎng)絡(luò)模型

        2 融合用戶偏好和多交互網(wǎng)絡(luò)的協(xié)同過濾算法

        2.1 用戶-項目屬性偏好相似度

        2.1.1 挖掘用戶-項目屬性偏好信息

        表1顯示出了項目的屬性特征信息,為便于后續(xù)計算,做出如下定義:S表示用戶u的評分項目集,N為用戶u的評分項目數(shù),qs表示項目s的流行度(評分用戶數(shù)),As表示項目s包含的項目屬性.

        表1 項目屬性信息

        對于流行度高的項目,用戶選擇它更可能是出于從眾心理而不是因為項目本身的屬性.因此我們引入懲罰因子 γ對流行度超過閾值 φ的項目進行懲罰.定義用戶u對項目屬性a的偏好度Iua如下:

        2.1.2 計算用戶-項目屬性偏好相似度

        對挖掘出的用戶-項目屬性偏好信息進行降序排序,得到用戶的項目屬性偏好排名,然后使用基于集合(Set Based Measure,SBM)的方法計算用戶間的項目屬性偏好相似度.

        SBM是通過計算在不同深度時的兩個排序列表的交集大小來衡量排序列表之間的相似度.假設(shè)用戶u和用戶v對項目屬性{a,b,c,d,e}的偏好排序如下:

        依次計算它們在深度d時,兩個列表前d個元素構(gòu)成的兩個集合的交集,以及交集大小相對當前深度的比例,如表2所示.計算出不同深度的交集比例后,我們使用交集比例的平均值來度量用戶之間的項目屬性偏好相似度.計算公式如下:

        表2 SBM 方法

        在推薦系統(tǒng)中,我們一般只關(guān)注用戶最喜愛的那部分項目屬性,并由此進行項目推薦.因此,我們希望在計算兩個排序列表的相似度時,能夠關(guān)注top 元素的相對位置權(quán)重.在前面例子中,項目屬性數(shù)k為5,SBM(u,v)為0.8.假設(shè)另有用戶w的項目屬性偏好排序為:[a,b,c,e,d],與列表u相比,列表w是通過交換列表u的最后兩個元素的位置得到的,而列表v是通過交換列表u的前2 個元素的位置得到的,計算出SBM(u,w)為0.95.由此可以看出,SBM自身具有top-weightiness屬性.

        2.2 改進用戶相似度計算公式

        協(xié)同過濾算法通過計算用戶偏好進行項目推薦,其中傳統(tǒng)的用戶協(xié)同過濾算法僅使用評分相似性來選擇與目標用戶具有相似偏好的鄰居用戶,沒有考慮從輔助信息中提取對提升推薦性能有用的信息,數(shù)據(jù)稀疏性大,推薦精度不高.本文算法根據(jù)評分數(shù)據(jù)挖掘出用戶的項目屬性偏好信息,然后使用SBM方法計算出用戶-項目屬性偏好相似度,并用其改進用戶相似度計算公式.

        Jaccard 系數(shù)是一種比較常用的用戶相似性計算方法,它使用用戶的共同評分項目在所有評分項目中所占的比例來衡量用戶之間的相似性:

        對于共同評分項目,用戶對其的評價可能截然相反的,然而Jaccard 系數(shù)在計算用戶相似性時沒有考慮用戶評分差異對用戶偏好的影響,這會導(dǎo)致用戶相似性計算不準確.式(1)的皮爾遜相關(guān)系數(shù)可以衡量用戶間的評分相似性,但在數(shù)據(jù)稀疏,用戶之間共同評分項目少的情況下,計算結(jié)果會不準確.因此可以使用皮爾遜相關(guān)系數(shù)來修正Jaccard 系數(shù),修正后的Jaccard 系數(shù)如下:

        綜合用戶-項目屬性偏好相似度和修正后的Jaccard系數(shù),α為調(diào)節(jié)參數(shù),表示兩種相似度之間的比重,最終的用戶相似度計算公式如下:

        2.3 評分預(yù)測

        2.3.1 構(gòu)建多交互神經(jīng)網(wǎng)絡(luò)模型

        構(gòu)建融合用戶-項目屬性偏好信息的多交互神經(jīng)網(wǎng)絡(luò)預(yù)測模型,如圖2所示.模型由輸入層、嵌入層、隱藏層和輸出層組成.輸入層輸入用戶和項目的onehot 編碼向量,嵌入層包含用戶-項目屬性偏好向量(user attribute preference vector),用戶嵌入向量(user latent vector),項目屬性特征向量(item attribute feature vector),項目嵌入向量(item latent vector).

        圖2 融合用戶-項目屬性偏好的多交互神經(jīng)網(wǎng)絡(luò)模型

        模型采用多交互的網(wǎng)絡(luò)結(jié)構(gòu),通過兩個并行的多層隱藏層網(wǎng)絡(luò)去分別學(xué)習用戶和項目在不同維度空間中的隱特征表示,隱藏層的神經(jīng)元數(shù)目表示要學(xué)習的隱特征表示的維度大小.此外,該模型融合了用戶-項目屬性偏好信息,一定程度上緩解了單一評分數(shù)據(jù)的數(shù)據(jù)稀疏問題.將用戶-項目屬性偏好向量和用戶嵌入向量拼接后通過多層隱藏層進行非線性交互提取用戶在不同維度空間中的隱特征表示.同樣將項目屬性特征向量和項目嵌入向量拼接后通過多層隱藏層來提取項目在不同維度空間中的隱特征表示.隱藏層采用金字塔型的網(wǎng)絡(luò)結(jié)構(gòu),后一層網(wǎng)絡(luò)的神經(jīng)元數(shù)目為前一層網(wǎng)絡(luò)神經(jīng)元數(shù)目的一半,選擇tanh 函數(shù)作為模型的激活函數(shù).

        用Ui表示用戶-項目屬性偏好向量,Uh表示用戶嵌入向量,σ表示激活函數(shù),Wl和bl分別表示第l層隱藏層的權(quán)重矩陣和偏差向量,則用戶的各層隱特征表示如下:

        同理,對于項目屬性特征向量和項目嵌入向量,通過多層隱藏層網(wǎng)絡(luò)得到項目的各層隱特征表示.

        在基于深度學(xué)習的推薦模型中,MLP 模型將用戶和項目的one-hot 編碼向量通過嵌入層映射到新的維度空間中獲得用戶和項目的嵌入向量(隱特征表示),然后將用戶和項目的嵌入向量拼接后通過多層感知機得到模型的預(yù)測評分.然而特征維度大小選取對于預(yù)測的準確性有著重要影響,一般需要進行多次實驗來確定合適的特征維度,并且在不同的維度空間中用戶和項目的隱特征表示的意義不同,只使用單一維度空間中的隱特征表示進行預(yù)測限制了模型的推薦性能.在本文所使用的多交互神經(jīng)網(wǎng)絡(luò)模型中,模型通過兩個并行的多層隱藏層網(wǎng)絡(luò)來分別學(xué)習用戶和項目在不同維度空間中的隱特征表示,后一層網(wǎng)絡(luò)在前一層網(wǎng)絡(luò)提取的隱特征表示的基礎(chǔ)上進一步提取更深層次的隱特征表示.隱藏層中每層網(wǎng)絡(luò)的神經(jīng)元數(shù)目和學(xué)習能力不同,學(xué)習到的用戶和項目的隱特征表示的維度和意義也不同.多交互神經(jīng)網(wǎng)絡(luò)綜合每一層網(wǎng)絡(luò)學(xué)習到的隱特征表示來提高模型的推薦性能,對每層用戶和項目的隱特征表示進行一次交互操作,最后綜合所有層的交互結(jié)果作為模型最終的預(yù)測結(jié)果.

        我們使用3 層感知機模型來獲取每一層用戶和項目的隱特征表示的交互結(jié)果,計算公式如下:

        其中,zl和xl分別表示第l層的用戶和項目的隱特征表示,Sl表示zl和xl拼接后通過三層感知機模型的交互結(jié)果.

        在輸出層,將隱藏層每層用戶和項目的隱特征表示的交互結(jié)果拼接起來進行一次全連接操作得到模型最終的預(yù)測評分:

        本文模型是用來進行評分預(yù)測任務(wù)的,因此選擇基于點的方式來構(gòu)建損失函數(shù),使用均方誤差作為模型要優(yōu)化的損失函數(shù):

        2.3.2 綜合預(yù)測評分

        對于評分預(yù)測系統(tǒng),我們首先使用改進后的用戶相似度篩選出鄰居用戶集,并根據(jù)評分預(yù)測公式計算出預(yù)測評分Pui.然后通過融合用戶-項目屬性偏好信息的多交互神經(jīng)網(wǎng)絡(luò)模型獲得模型的預(yù)測評分.最終預(yù)測結(jié)果是這兩種預(yù)測評分的動態(tài)加權(quán):

        其中,CNu表示鄰居集的大小,表示鄰居集中對項目i評分的用戶數(shù),λ為放縮因子.值越大,則由評分預(yù)測公式計算出的預(yù)測值在最終預(yù)測評分中的比重就越大.

        在對用戶進行推薦時,使用改進算法預(yù)測目標用戶對項目的評分,選擇預(yù)測評分高的項目推薦給目標用戶.改進算法的推薦流程如圖3所示.

        圖3 改進算法推薦流程圖

        3 實驗評估

        3.1 實驗數(shù)據(jù)集及度量標準

        MovieLens 數(shù)據(jù)集是推薦系統(tǒng)中常用的驗證數(shù)據(jù)集,該數(shù)據(jù)集有多種規(guī)格,如:100 k、1 M和10 M 等.本文實驗使用100 k 數(shù)據(jù)集,它包含943 位用戶對1682部電影的10 萬條評分信息,評分范圍為1 到5 分.

        平均絕對誤差(MAE)和均方根誤差(RMSE)是推薦算法中使用最為廣泛的兩種性能評價指標,它們反映出預(yù)測評分的準確性,計算公式如下:

        F1-score是精確率(precision)和召回率(recall)的加權(quán)平均值,計算公式為:

        Precision表示模型預(yù)測為正的樣本中實際也為正的樣本占被預(yù)測為正的樣本的比例.Recall表示實際為正的樣本中預(yù)測也為正的樣本占實際為正的樣本的比例.F1-score是兩者的綜合,F1-score越高,說明模型越穩(wěn)健.

        3.2 實驗結(jié)果與分析

        3.2.1 推薦性能分析

        本文的相關(guān)參數(shù)設(shè)置:流行度閾值φ=200,懲罰因子 γ=0.5,調(diào)節(jié)參 數(shù)α=0.3,放縮因子λ=0.2,batchsize為256,隱藏層的網(wǎng)絡(luò)層數(shù)為3,優(yōu)化器為Adam,學(xué)習率為0.001,正則化率為0.0001.

        本文提出的綜合預(yù)測模型記為NIAP-CF.實驗將測試集中實際評分高于4 分的樣本標記為正樣本,其余標記成負樣本.在推薦時,由預(yù)測評分高于4 分的樣本產(chǎn)生推薦列表.

        對于基于用戶相似度的推薦模型,將本文算法與皮爾遜相似性計算方法、Jaccard 相似性計算方法以及文獻[6] 中相似度計算方法(UII-CF) 進行MAE值、RMSE值以及F1-score的比較來驗證本文推薦算法的推薦效果.

        圖4和圖5分別顯示了在MovieLens 數(shù)據(jù)集中本文提出的算法NIAP-CF和其它3 種算法在不同鄰居用戶數(shù)下的MAE和RMSE值對比情況.從圖中可以看出,4 種算法的MAE和RMSE值都隨著鄰居用戶數(shù)的增加而逐漸減小,并且在選取鄰居用戶數(shù)相同時,本文算法的MAE和RMSE值小于其它3 種算法,預(yù)測精度最高.此外,本文算法綜合了鄰居集的預(yù)測評分和多交互神經(jīng)網(wǎng)絡(luò)模型的預(yù)測評分,預(yù)測的精度較為穩(wěn)定,可以在鄰居用戶較少時獲得較高的推薦精度.

        圖4 MAE 值對比結(jié)果

        圖5 RMSE 值對比結(jié)果

        圖6顯示了在MovieLens 數(shù)據(jù)集中4 種算法的F1-score值的對比結(jié)果.由圖可以看出,在鄰居用戶數(shù)相同時,本文算法的F1-score值最大,模型的穩(wěn)健度優(yōu)于其它3 種算法.

        圖6 F1-score對比

        對于基于深度學(xué)習的推薦模型,將本文提出的NIAPCF 模型與文獻[10]中He 等提出的GMF 模型、MLP模型以及NeuCF 模型進行對比實驗來驗證本文推薦算法的有效性.

        表3顯示了在MovieLens 數(shù)據(jù)集中本文模型與GMF 模型、MLP 模型以及NeuCF 模型的MAE值、RMSE值以及F1-score的對比情況.從表中可以看出,本文模型的MAE和RMSE值低于其它3 種模型,預(yù)測的精度最高,并且本文模型的F1-score最高,模型的穩(wěn)健度優(yōu)于其它3 種模型.

        表3 MovieLens 數(shù)據(jù)集對比實驗結(jié)果

        3.2.2 參數(shù)分析

        在用戶相似度計算部分,調(diào)節(jié)參數(shù) α表示用戶-項目屬性偏好相似度和修正后的Jaccard 系數(shù)之間的比重,對于計算用戶相似度的準確性有著非常重要的影響.因此,需要確定 α的值來消除其對推薦結(jié)果的影響.選取鄰居用戶數(shù)為30,觀察MAE值在不同 α取值下的變化情況,結(jié)果如圖7所示.從圖中可以看出,當 α值為0.3 時,本文相似性計算方法達到最優(yōu).

        圖7 MAE 隨α 值的變化情況

        在融合用戶-項目屬性偏好信息的多交互神經(jīng)網(wǎng)絡(luò)模型中,用于學(xué)習用戶和項目隱特征表示的隱藏層層數(shù)是神經(jīng)網(wǎng)絡(luò)中的一個非常重要的參數(shù).我們通過實驗研究隱藏層的網(wǎng)絡(luò)層數(shù)對模型預(yù)測精度的影響.實驗結(jié)果如表4所示.由實驗結(jié)果可以看出:一定數(shù)目的隱藏層層數(shù)能夠改善模型的推薦性能.但更深層次的網(wǎng)絡(luò)結(jié)構(gòu)會耗費大量的計算資源,在實際中,隱藏層層數(shù)的選擇可以根據(jù)具體需求來確定.

        表4 隱藏層網(wǎng)絡(luò)層數(shù)對比結(jié)果

        4 總結(jié)與展望

        傳統(tǒng)的用戶協(xié)同過濾算法僅通過用戶間的評分相似性來預(yù)測評分,沒有考慮從外部輔助信息中提取出對推薦有用的信息,數(shù)據(jù)稀疏性大,推薦精度不高.本文提出的NIAP-CF 算法首先根據(jù)評分矩陣和項目屬性特征矩陣挖掘出用戶的項目屬性偏好信息,然后使用SBM方法計算用戶間的項目屬性偏好相似度,并用其改進用戶相似度計算公式.在進行評分預(yù)測時,建立融合用戶-項目屬性偏好信息的多交互神經(jīng)網(wǎng)絡(luò)預(yù)測模型,引入動態(tài)權(quán)衡參數(shù),對由相似度計算出的預(yù)測評分和模型的預(yù)測評分進行動態(tài)加權(quán),從而獲得最終的預(yù)測評分.實驗結(jié)果表明,與傳統(tǒng)的協(xié)同過濾算法相比,本文提出的改進算法降低了評分預(yù)測的MAE和RMSE值,提高了推薦精度.

        猜你喜歡
        相似性向量神經(jīng)網(wǎng)絡(luò)
        一類上三角算子矩陣的相似性與酉相似性
        向量的分解
        聚焦“向量與三角”創(chuàng)新題
        淺析當代中西方繪畫的相似性
        河北畫報(2020年8期)2020-10-27 02:54:20
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        低滲透黏土中氯離子彌散作用離心模擬相似性
        向量垂直在解析幾何中的應(yīng)用
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
        重型機械(2016年1期)2016-03-01 03:42:04
        向量五種“變身” 玩轉(zhuǎn)圓錐曲線
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        国产自精品| 亚洲av乱码一区二区三区按摩| 精品乱码久久久久久久| 国产精品亚洲一区二区无码国产| 久久狠狠爱亚洲综合影院| 亚洲精品中文字幕导航| 色诱视频在线观看| 亚洲国产精品久久久久久久| 久久久久久人妻一区二区无码Av| 中文字幕一区二区三区日日骚| 久久综合亚洲色一区二区三区| 少妇精品久久久一区二区三区| 中文字幕一区二区三区日韩网| 久久久人妻一区二区三区蜜桃d| 色噜噜亚洲精品中文字幕| 国产爆乳美女娇喘呻吟| 吃奶摸下的激烈视频| 亚洲国产福利成人一区二区 | 国产乡下三级全黄三级| 亚洲中久无码永久在线观看软件| 国产黄片一区视频在线观看| 国产一区二区三区视频地址| 欧美私人情侣网站| 国产精品日韩欧美一区二区区| 人妻少妇人人丰满视频网站| 日本一区二区三区清视频| 亚洲成熟女人毛毛耸耸多| 男受被做哭激烈娇喘gv视频| 99久久这里只精品国产免费| 国产精品久久婷婷免费观看| 精品久久久久香蕉网| 99久久久国产精品免费蜜臀| 日本熟妇视频在线中出| 国产香港明星裸体xxxx视频 | 国产日产精品久久久久久| 国产视频一区二区三区免费| 无码人妻精品一区二区三区蜜桃 | 久久国产品野战| 精品视频手机在线免费观看| 内射人妻少妇无码一本一道| 丁香综合网|