亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于BP神經(jīng)網(wǎng)絡(luò)的電影協(xié)同過濾算法

        2021-08-28 02:08:32宋曼
        電腦與電信 2021年6期
        關(guān)鍵詞:相似性公式神經(jīng)網(wǎng)絡(luò)

        宋曼

        (廣州城建職業(yè)學(xué)院,廣東 廣州 510925)

        1 引言

        電影協(xié)同過濾推薦算法采用最鄰近技術(shù)計算用戶和電影的相似性,根據(jù)相似電影評分預(yù)測目標(biāo)電影評分,再根據(jù)電影預(yù)測評分從高到低對用戶進(jìn)行TOP-N電影推薦[1]。協(xié)同過濾推薦算法的推薦精度主要還是新電影的冷啟動問題[2],有的算法計算電影的相似性僅僅考慮用戶對電影的評分,有的算法只考慮電影的內(nèi)容信息來衡量電影的相關(guān)性,這樣既不能有效利用數(shù)據(jù)集信息又導(dǎo)致最終推薦結(jié)果不準(zhǔn)確。BP神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)組織的計算系統(tǒng),具有很好的學(xué)習(xí)能力和適應(yīng)能力。BP 神經(jīng)網(wǎng)絡(luò)將輸入值映射為輸出值,適合復(fù)雜問題求解。本文提出,在進(jìn)行電影的協(xié)同過濾推薦時,將電影相似性采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行融合,將各分量相似性作為輸入,輸出值為兩部電影的最終相似性,根據(jù)最終相似性得出預(yù)測評分,通過比較預(yù)測評分和真實評分,不斷對BP 模型參數(shù)進(jìn)行調(diào)整和優(yōu)化,最終得到精確可靠的推薦結(jié)果。

        2 BP神經(jīng)網(wǎng)絡(luò)

        BP 神經(jīng)網(wǎng)絡(luò)的工作過程模擬人腦細(xì)胞的工作方式,具有輸入層、隱藏層和輸出層三層結(jié)構(gòu)[3],如圖1 所示,是具有兩層隱藏層的BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。輸入層節(jié)點接收輸入信息,經(jīng)過隱藏層節(jié)點處理后,由輸出層節(jié)點輸出最終結(jié)果。BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程是有監(jiān)督的學(xué)習(xí),能對比輸出結(jié)果和真實值,計算出誤差后將結(jié)果反向傳遞給每一層,從而調(diào)整所有計算層的參數(shù)。

        圖1 BP神經(jīng)網(wǎng)絡(luò)圖

        現(xiàn)假設(shè)輸入層節(jié)點數(shù)是4個,隱藏層節(jié)點數(shù)是3個,輸出層節(jié)點數(shù)是2 個,學(xué)習(xí)樣本數(shù)為M,每個樣本的輸入向量為I={in1,in2,in3,in4},輸出向量為O={out1,out2},期望輸出向量E={e1,e2}。輸入層和隱藏層間的權(quán)重向量表示為:,隱藏層和輸出層的權(quán)重向量表示為:。BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程步驟如下:

        (1)初始化兩個權(quán)值α1和α2:將兩個權(quán)值的初始值設(shè)定為較小隨機(jī)數(shù),設(shè)定誤差精度為β,最大學(xué)習(xí)次數(shù)為N。

        (2)設(shè)定當(dāng)前學(xué)習(xí)樣本為i={in1,in2,in3,in4},對M個樣本輸入學(xué)習(xí)。

        (3)隱藏層節(jié)點輸入值、輸出值計算。

        a)隱藏層節(jié)點輸入值:根據(jù)輸入層對隱藏層權(quán)值和輸入向量計算隱藏層輸入值,第j個隱藏層節(jié)點的輸入值計算如公式(1)所示:

        其中,yinij的下標(biāo)i表示輸入值,j表示第j個隱藏層節(jié)點,指輸入層節(jié)點x對隱藏層節(jié)點j的權(quán)值。

        b)隱藏層節(jié)點輸出值:輸出值由激活函數(shù)計算得來,如公式(2)所示。

        其中,yinoj的下標(biāo)o表示隱藏層輸出值,j表示第j個隱藏層節(jié)點。pj表示第j個隱藏節(jié)點的偏向值,函數(shù)f(x)的計算如公式(3)所示。其中,β為誤差精度。

        (4)輸出層節(jié)點輸入值、輸出值計算。

        a)輸出層節(jié)點輸入值:根據(jù)隱藏層對輸出層權(quán)重和隱藏層輸出值計算輸出層輸入值,第k個節(jié)點的輸入值計算如公式(4)所示:

        其中,outik的下標(biāo)i表示輸入值,k表示第k個輸出層節(jié)點。表示第x個隱藏層節(jié)點對第k個輸出層節(jié)點的權(quán)值。b)輸出層節(jié)點輸出值:和隱藏層相同,輸出層節(jié)點的輸出值同樣由激活函數(shù)計算得來,計算如公式(5)所示。

        其中,f(x)的計算公式如上面公式(3)所示,outok中的下標(biāo)o表示輸出層的輸出值,k表示第k個輸出層節(jié)點。qk表示第k個節(jié)點偏向值。

        (5)學(xué)習(xí)樣本訓(xùn)練誤差計算。

        輸出層的誤差計算如公式(6)所示。

        其中,outox指輸出層節(jié)點x的輸出值,βx指節(jié)點x的誤差精度。

        隱藏層的誤差計算如公式(7)所示。

        其中,yinox指隱藏層節(jié)點x的輸出值,misoi指輸出層節(jié)點i的輸出誤差,指第x個隱藏層節(jié)點對第i個輸出層節(jié)點的權(quán)值。

        (6)偏向及權(quán)重的調(diào)整。

        a)偏向值調(diào)整

        假設(shè)調(diào)整參數(shù)為η,節(jié)點偏向值為p,偏向值調(diào)整計算如公式(8)所示。

        其中,mis指隱藏層節(jié)點或輸出層節(jié)點的誤差,每個節(jié)點都有自己不同的偏向值。

        b)調(diào)整權(quán)重

        參照文獻(xiàn)[4]調(diào)整權(quán)重值,隱藏層權(quán)重調(diào)整如公式(9)所示,輸出層的權(quán)重調(diào)整如公式(10)所示。

        公式(9)中,表示隱藏層節(jié)點對輸出層節(jié)點的權(quán)重值,η是調(diào)整參數(shù),misox表示第x個節(jié)點的輸出誤差,yinoj表示第j個隱藏層節(jié)點的輸出值。公式(10)中,指輸入層對隱藏層的權(quán)重值,misyx指隱藏層節(jié)點x的誤差值,inx表示第x個學(xué)習(xí)樣本的輸入值。

        (7)總誤差計算??傉`差的計算如公式(11)所示:

        其中,Mis表示總誤差,βx表示第x個節(jié)點的誤差精度,outox表示第x個輸出層節(jié)點的輸出值。當(dāng)總誤差值Mis小于誤差精度β或沒有達(dá)到最大訓(xùn)練次數(shù)時,繼續(xù)步驟(2),否則停止退出。

        3 改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法

        每部電影的屬性信息可以直接反映電影的特征,在改進(jìn)BP 神經(jīng)網(wǎng)絡(luò)算法中,主要利用電影的演員、類型、導(dǎo)演和編劇等電影屬性,在進(jìn)行電影協(xié)同過濾推薦算法是用于計算電影與電影之間的相似性。在本算法中,將電影屬性信息進(jìn)行直接量化,因為在計算電影之間的相似性時考慮了電影屬性信息,所以該算法能有效緩解新物品的冷啟動問題。

        3.1 電影之間屬性相似性計算

        先假設(shè)任意兩部電影i和電影j,從電影演員相似性、導(dǎo)演與編劇相似性和電影類型相似性三個方面來考量兩部電影之間的相似性。

        3.1.1 電影演員相似性

        考慮到大部分電影演員的戲路風(fēng)格變化不大,例如吳京、成龍擅長于演功夫片,周冬雨、馬思純擅長于演文藝片?;蛘?,有些觀眾因為喜歡某個演員而喜歡他所有的電影。因此,考慮相同演員對計算電影相似性有一定貢獻(xiàn)。而考慮電影演員相似性時,不用考慮所有演員,而是選取4名關(guān)鍵演員來代表該電影的演員信息。假設(shè)電影i和電影j的4名關(guān)鍵演員集合分別為Ai和Aj,得出兩部電影i和電影j之間的演員相似性SimijA計算公式如(12)所示。

        3.1.2 電影導(dǎo)演和編劇相似性

        部分觀眾會因為青睞某位導(dǎo)演或編劇而喜愛這位編劇或?qū)а莸碾娪?,而同一個導(dǎo)演指導(dǎo)的電影在很多方面有共性,因此我們認(rèn)為同一個導(dǎo)演指導(dǎo)的電影有相似性。影響電影相似性的因素考慮兩點:電影時間跨度和導(dǎo)演指導(dǎo)電影的數(shù)量。當(dāng)同一個導(dǎo)演指導(dǎo)的電影時間跨度大時,電影相關(guān)性會減小。當(dāng)同一導(dǎo)演指導(dǎo)電影數(shù)量增加時,電影之間的相似性也會減小。利用導(dǎo)演信息計算電影i和電影j之間的相似性如公式(13)所示。

        其中,di和dj指電影i和電影j的導(dǎo)演,number表示導(dǎo)演指導(dǎo)的電影數(shù)量,γ表示電影數(shù)量的影響因子。

        同理,編劇相似性采用與導(dǎo)演相似性相同的方式計算,將編劇相似性記為SimijD。

        3.1.3 類型相似性

        在改進(jìn)算法中,我們把電影類型相似性納入電影相似性計算范圍,首先對電影集中的所有電影整理得到電影-類型信息矩陣,如表1所示,表中對應(yīng)值為1表示電影為該類型的電影,為0表示不是該類型的電影??紤]到電影類型是有限的,我們將矩陣的列也就是類型標(biāo)簽控制在二十列以內(nèi),這在大數(shù)據(jù)存儲技術(shù)上完全可行。

        表1 電影-類型信息矩陣

        考慮到余弦相似性能更好地體現(xiàn)方向上的相似性和差異性,我們計算電影類型相似性時使用余弦相似性進(jìn)行計算。根據(jù)電影-類型信息表,假設(shè)電影i和電影j的類型向量分別為,根據(jù)電影類型信息計算得出電影i 和電影j 的相似性如公式(14)所示。

        其中,SimijT表示電影i和電影j的類型相似性,typeix指電影i的第x個類型的值,n為電影類型的總數(shù)目。

        3.2 電影預(yù)測模型

        根據(jù)文獻(xiàn)[5]提出的傳統(tǒng)基于物品的協(xié)同過濾推薦算法的電影相似性衡量方法,得出電影由評價過的用戶信息計算出來的相似性,記為Simij-CF,Simij-CF采用余弦相似性量度,計算過程如公式(15)所示:

        其中,Uij指用戶集合,sui表示用戶u對電影i的評分,suj表示用戶u對電影j的評分。

        電影預(yù)測模型利用BP 神經(jīng)網(wǎng)絡(luò)對任意兩部電影i和電影j之間的相似度分量Simij-A,Simij-D,Simij-B,Simij-T和Simij-CF進(jìn)行優(yōu)化,得到最終的電影相似性Simij。相似性計算模型如圖2所示。

        圖2 BP網(wǎng)絡(luò)相似性計算模型

        如圖2 所示,模型將5 個分量相似性作為神經(jīng)網(wǎng)絡(luò)的輸入,最終的Simij即為電影i和電影j根據(jù)BP 網(wǎng)絡(luò)模型預(yù)測的相似性。其中表示第x個階段第j個輸入節(jié)點對第j個輸出節(jié)點的權(quán)重,如指第1個階段第1個輸入節(jié)點對第n個輸出節(jié)點的權(quán)重。將5 個分量相似性輸入到BP 網(wǎng)絡(luò)的輸入節(jié)點后,可以利用公式(1)計算出隱藏層節(jié)點的輸入值,然后,利用公式(2)計算出這些節(jié)點的輸出值。使用同樣的方法,可以計算出輸出層節(jié)點的輸入值和輸出值。最終計算出待遇測電影i與其他電影的相似性計算。

        接下來根據(jù)預(yù)測評分公式計算用戶u對電影i的評分。計算預(yù)測評分之前,先根據(jù)公式(15)余弦相似性計算公式計算出電影i和電影j的相似性Simij-CF,然后,再根據(jù)余弦相似性計算用戶u對電影i的預(yù)測評分scorePui,如公式(16)所示。

        設(shè)電影真實評分為scoreRui,預(yù)測評分為scorePui。當(dāng)預(yù)測評分低于真實評分時,采用梯度上升法對預(yù)測評分進(jìn)行調(diào)整,當(dāng)預(yù)測評分高于真實評分時,使用梯度下降法對預(yù)測評分進(jìn)行調(diào)整。以梯度下降法為例,先對BP 模型最終輸出的相似度Simij進(jìn)行求導(dǎo),如公式(17)所示:

        設(shè)梯度下降步長為μ,采用梯度下降法調(diào)整后的Simij值設(shè)為SimijE,SimijE的計算如公式(18)所示:

        將公式(18)計算出來的SimijE作為圖2中Simij的期望值輸出,然后進(jìn)行后向傳播,對權(quán)重和進(jìn)行調(diào)整,可求得輸出層誤差如公式(19)所示:

        首先使用公式(7)算出隱藏層誤差,使用公式(8)和(9)調(diào)整隱藏層、輸出層的權(quán)重偏向,使用相同的方法調(diào)整隱藏層與輸出層之間的權(quán)重和偏向。經(jīng)過多次迭代后可得最終的推薦模型。本文提出的算法簡稱IW-CFA,即改進(jìn)的加權(quán)協(xié)同過濾算法(Improved Weighted Collaborative Filtering Algorithm)。

        4 仿真實驗

        4.1 實驗數(shù)據(jù)集

        本實驗采用MovieLens 上1M 的最近電影數(shù)據(jù)集,共包含4000部電影信息,6000個用戶信息和1000500個用戶評價信息。數(shù)據(jù)集由movies.dat、users.dat 和ratings.dat 三個文件組成,分別是電影信息數(shù)據(jù)、用戶信息數(shù)據(jù)和評論信息數(shù)據(jù)。其中,movies.dat 包含電影編號、名稱、時間和類型等電影屬性信息,users.dat包含用戶編號、性別、年齡段、職業(yè)和壓縮包解碼等用戶屬性信息,rating.dat 包含電影編號、用戶編號、評分和時間戳等評論信息[6]。MovieLens 數(shù)據(jù)集的電影數(shù)-評價數(shù)分布如圖3所示。

        圖3 MovieLens數(shù)據(jù)集中電影數(shù)-評分?jǐn)?shù)對照圖

        由于本文提出的IW-CFA算法主要解決新電影的冷啟動問題,在實驗過程中會驗證算法在評價數(shù)少的電影推薦上的有效性。因此,將MovieLens中評論數(shù)少于80的電影單獨抽取出來,記為Movie-Little 集合。Movie-Little 集合中包含3300 個用戶對2800 部電影的118000 條評論信息。Movie-Little數(shù)據(jù)集中電影數(shù)-評價數(shù)分布如圖4所示。

        圖4 Movie-Little數(shù)據(jù)集中電影數(shù)-評分?jǐn)?shù)對照圖

        根據(jù)本文的電影之間屬性相似性計算公式,從電影演員相似性、導(dǎo)演與編劇相似性和電影類型相似性三個方面來考量兩部電影之間的相似性。這些數(shù)據(jù)信息通過Python 爬蟲技術(shù),在電影網(wǎng)站中根據(jù)電影編號進(jìn)行爬取并記錄在attribute.dat數(shù)據(jù)集中,attribute.dat數(shù)據(jù)集中包含電影編號、導(dǎo)演、演員和編劇等信息。

        4.2 實驗量度標(biāo)準(zhǔn)

        本文使用平均絕對誤差(Mean Absolute Error)和均方根誤差(Root Mean Squared Error)評估算法準(zhǔn)確性。測試數(shù)據(jù)集中,假設(shè)預(yù)測電影評分為集合為,用戶對電影真實評分集合為,則MAE 和RMSE 的計算公式分別如式(20)和式(21)所示。其中,n為測試集的數(shù)量。

        4.3 實驗結(jié)果分析

        為了充分利用數(shù)據(jù),得到真實的實驗結(jié)果驗證文本提出的IW-CFA 算法的有效性,實驗采用K 折交叉驗證法對實驗結(jié)果進(jìn)行驗證,即將全部數(shù)據(jù)集分成K份,取1份作測試集,剩余K-1份都作為訓(xùn)練集,經(jīng)過K次實驗后取平均值作為最終實驗結(jié)果。具體實驗時,取K=10。

        通過對比本文提出的IW-CFA 算法和其他三種推薦算法,分別是聚類推薦算法(CRA)[7]:Clustering recommendation algorithm、分類推薦算法(CLRA)[8]:Classification recommendation algorithm和特征加權(quán)推薦算法(FWRA)[9]:Feature weighted recommendation algorithm,驗證兩點:(1)IW-CFA算法相比其他推薦算法,能產(chǎn)生更準(zhǔn)確的推薦結(jié)果;(2)相比其他推薦算法,IW-CFA 算法對解決新電影的冷啟動問題更有效。

        如圖5 和圖6 所示,是四種推薦算法在MovieLens 數(shù)據(jù)集上的實驗結(jié)果,圖5 的縱坐標(biāo)為平均絕對誤差MAE,圖6的縱坐標(biāo)為均方根誤差RMSE。圖5、圖6的橫坐標(biāo)均為相似電影個數(shù)。

        圖5 四種算法在MovieLens數(shù)據(jù)集上的MAE值

        圖6 四種算法在MovieLens數(shù)據(jù)集上的RMSE值

        在實驗過程中,選取最近鄰居數(shù)從20到70,以步長10依次遞增。從實驗結(jié)果可以看出,本文提出的IW-CFA 算法優(yōu)于其他三種算法,具有最小的MAE 和RMSE。當(dāng)最近鄰居數(shù)為30時,IW-CFA算法具有最小的MAE和RMSE??梢哉J(rèn)為,使用本文提出的IW-CFA算法,當(dāng)最近鄰居數(shù)為30時,電影推薦效果最好,充分驗證了本文提出的IW-CFA 算法推薦結(jié)果的準(zhǔn)確性。

        圖7 和圖8 是四種算法在Movie-Little 數(shù)據(jù)集上的MAE和RMSE 值仿真實驗結(jié)果,實驗結(jié)果充分驗證了IW-CFA 算法能有效解決新電影冷啟動問題。圖7的縱坐標(biāo)為平均絕對誤差MAE,圖8的縱坐標(biāo)為均方根誤差RMSE。圖7、圖8的橫坐標(biāo)均為相似電影個數(shù)。

        圖7 四種算法在Movie-Little數(shù)據(jù)集上的MAE值

        圖8 四種算法在Movie-Little數(shù)據(jù)集上的RMSE值

        在Movie-Little 數(shù)據(jù)集上的實驗中,我們同樣選取最近鄰居數(shù)從20 到70,以步長10 依次遞增。從實驗結(jié)果可以看出,本文提出的IW-CFA 算法對比其他三種算法具有更小的MAE 和RMSE,在緩解電影的冷啟動問題上更優(yōu),同樣最近鄰居數(shù)為30時,達(dá)到最優(yōu)解。

        5 結(jié)論

        本文針對新物品的冷啟動問題,提出了一種基于BP 神經(jīng)網(wǎng)絡(luò)的電影協(xié)同過濾推薦算法。針對電影的不同屬性,首先計算任意兩部電影在該屬性上的相似性,利用BP 神經(jīng)網(wǎng)絡(luò)計算電影間的最終相似性,預(yù)測電影評分,再利用真實評分對相似性和BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行不斷調(diào)整,得到最終的算法模型。最后,我們通過仿真實驗分別在MovieLens和Movie-Little數(shù)據(jù)集對本文提出的IW-CFA算法進(jìn)行了驗證,實驗結(jié)果表明本文提出的IW-CFA 算法相比其他推薦算法,能產(chǎn)生更準(zhǔn)確的推薦結(jié)果,能更有效地解決新電影的冷啟動問題。

        猜你喜歡
        相似性公式神經(jīng)網(wǎng)絡(luò)
        一類上三角算子矩陣的相似性與酉相似性
        組合數(shù)與組合數(shù)公式
        排列數(shù)與排列數(shù)公式
        等差數(shù)列前2n-1及2n項和公式與應(yīng)用
        淺析當(dāng)代中西方繪畫的相似性
        河北畫報(2020年8期)2020-10-27 02:54:20
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        例說:二倍角公式的巧用
        低滲透黏土中氯離子彌散作用離心模擬相似性
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        久久红精品一区二区三区| 亚洲AV无码国产精品久久l| 亚洲国产精一区二区三区性色| 综合亚洲二区三区四区在线 | 国产成人综合色在线观看网站| 国产91吞精一区二区三区| av男人操美女一区二区三区| 亚洲精选自偷拍一区二| 国产99久久久国产精品免费看| 无码国产亚洲日韩国精品视频一区二区三区 | 亚洲熟妇无码一区二区三区导航| 亚洲AV色无码乱码在线观看| 老肥熟女老女人野外免费区| 少妇被按摩出高潮了一区二区| 国产高跟黑色丝袜在线| 国产一级特黄无码免费视频| 国产亚洲精品综合99久久| 亚洲精品久久区二区三区蜜桃臀| 中文字幕日韩人妻不卡一区| 国产污污视频| 色se在线中文字幕视频| 国产在线无码一区二区三区视频| 开心五月激情综合婷婷| 91精品啪在线观看国产色| 亚洲97成人精品久久久| 国产成人小视频| 一本色道久久综合狠狠躁 | 偷拍一区二区视频播放器| 夜夜躁狠狠躁2021| 日本a级大片免费观看| 日韩av在线手机免费观看| 亚洲日韩激情无码一区| 欧美精品一区二区性色a+v| 日本久久精品在线播放| 91成人自拍国语对白| 天堂中文在线资源| 免费一级a毛片在线播出| 九七青青草视频在线观看| 无码国产69精品久久久久孕妇| 国产尻逼视频| 日本一区二区三区免费|