亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合注意力機(jī)制與場(chǎng)感知因子分解機(jī)的電影推薦

        2020-07-24 02:11:37黃德柒茍剛
        軟件導(dǎo)刊 2020年6期
        關(guān)鍵詞:推薦系統(tǒng)注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)

        黃德柒 茍剛

        摘要:傳統(tǒng)協(xié)同過濾算法僅利用評(píng)分信息進(jìn)行推薦,而沒有利用到更多用戶特征與電影特征,推薦效果不佳。深度學(xué)習(xí)的普通應(yīng)用,為特征提取打下了良好基礎(chǔ)。通過爬取網(wǎng)站上的電影演員信息表,使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)文本信息進(jìn)行特征提取,采用結(jié)合注意力機(jī)制與場(chǎng)感知因子分解機(jī)的混合推薦方法,并使用用戶一電影特征矩陣進(jìn)行訓(xùn)練。在公開數(shù)據(jù)集MovieLens上進(jìn)行實(shí)驗(yàn)測(cè)試,RMSE達(dá)到0.850,與5組推薦模型進(jìn)行對(duì)比,RMSE分別提升了18.0%、11.3%、7.60%、25.7%、6.80%。實(shí)驗(yàn)結(jié)果表明,該模型可以提高推薦效率。

        關(guān)鍵詞:推薦系統(tǒng);注意力機(jī)制;場(chǎng)感知因子分解機(jī);卷積神經(jīng)網(wǎng)絡(luò)

        DOI:10.11907/rjdk.192143 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

        中圖分類號(hào):TP301文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2020)006-0019-04

        0 引言

        隨著互聯(lián)網(wǎng)的發(fā)展,人們?cè)诰W(wǎng)上觀看各類電影的同時(shí),也被大量電影信息所淹沒。目前解決信息過載的手段主要分為兩種:搜索引擎與推薦系統(tǒng)。當(dāng)掌握一定量信息時(shí),可以使用搜索引擎進(jìn)行搜索,但網(wǎng)絡(luò)上的視頻數(shù)量十分龐大,而且隨著時(shí)間推移,數(shù)量還會(huì)繼續(xù)增加。因此,若要在大量信息中尋找到潛在感興趣的電影,則需要用到推薦系統(tǒng)。在互聯(lián)網(wǎng)上,各大視頻網(wǎng)站為用戶推薦視頻是很常見的事情,目前常用推薦算法有基于內(nèi)容的推薦、協(xié)同過濾推薦以及混合推薦?;趦?nèi)容的推薦僅考慮到項(xiàng)目與項(xiàng)目之間的關(guān)聯(lián),而沒有考慮到用戶的歷史興趣偏好;協(xié)同過濾推薦則是基于用戶之間的相似性,基于多個(gè)用戶的歷史行為信息對(duì)用戶進(jìn)行潛在項(xiàng)目評(píng)分預(yù)測(cè),因此在數(shù)據(jù)稀疏時(shí)效果不佳,且沒有利用電影的特征信息;混合推薦由協(xié)同過濾推薦以及基于內(nèi)容的推薦混合而成,既包含了項(xiàng)目特征,又考慮到用戶的歷史興趣偏好,但由于數(shù)據(jù)量過于龐大,完全依靠人工進(jìn)行特征提取需要花費(fèi)大量人工成本,提取效果也不理想。隨著深度學(xué)習(xí)研究的發(fā)展,Covington等針對(duì)You了ubc提出一種基于深度神經(jīng)網(wǎng)絡(luò)的模型,使用兩個(gè)深度網(wǎng)絡(luò),一個(gè)生成候選集,一個(gè)進(jìn)行推薦,這也是工業(yè)上第一次使用深度學(xué)習(xí)進(jìn)行視頻推薦。目前評(píng)分預(yù)測(cè)中使用較多的方法是使用矩陣分解進(jìn)行預(yù)測(cè),如何加入更多特征信息提高推薦效果也是目前的主要研究?jī)?nèi)容。由于神經(jīng)網(wǎng)絡(luò)良好的特征提取性能,基于深度學(xué)習(xí)進(jìn)行協(xié)同過濾,提取上下文信息學(xué)習(xí)潛在特征已是很普遍的手段,但在學(xué)習(xí)大量特征時(shí),協(xié)同過濾或矩陣分解都沒有考慮到特征之間的交互性。因此,本文提出基于卷積神經(jīng)網(wǎng)絡(luò)對(duì)電影信息進(jìn)行特征提取,并將特征應(yīng)用于融合注意力機(jī)制的場(chǎng)感知因子分解機(jī)電影推薦模型(CAFFM)中。

        1 推薦模型框架設(shè)計(jì)

        1.1 基于卷積神經(jīng)網(wǎng)絡(luò)的特征提取

        考慮到目前社會(huì)上存在明顯的追星效應(yīng),電影參演演員會(huì)很大程度上影響用戶對(duì)于電影的選擇,因此本文將每部電影的演員信息作為電影的一個(gè)標(biāo)簽信息,將該部分信息映射到數(shù)字特征空間,并將每個(gè)演員表都表示為定長(zhǎng)的信息,其中缺失的部分用空白進(jìn)行填補(bǔ),最后會(huì)形成很大的稀疏矩陣。然而,龐大的稀疏矩陣會(huì)極大地浪費(fèi)模型訓(xùn)練時(shí)間,也會(huì)降低推薦效率。因此,本文使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)演員信息進(jìn)行提取。

        設(shè)計(jì)一個(gè)單通道的卷積神經(jīng)網(wǎng)絡(luò),對(duì)映射好的特征矩陣輸入進(jìn)行特征提取及降維處理。卷積神經(jīng)網(wǎng)絡(luò)能夠很好地提取文本信息,特別對(duì)于演員信息這種有著順序的文本信息,通過局部感知野、共享權(quán)重和下采樣可以有效地捕捉演員順序信息。由于電影演員排序是一個(gè)很重要的信息,主角和配角之間的號(hào)召力有著明顯差距,本文使用一個(gè)四層的卷積網(wǎng)絡(luò)對(duì)特征進(jìn)行提取,并通過卷積層進(jìn)行計(jì)算。本文采用relu激勵(lì)函數(shù),卷積層和池化層連續(xù)疊加,用于對(duì)數(shù)據(jù)進(jìn)行壓縮、減少參數(shù)個(gè)數(shù),并對(duì)高維特征進(jìn)行降維,以最大程度保證特征包含的信息。最后在池化層加上注意力層,重點(diǎn)提取特征。

        其定義為:

        為了更好地提取出特征,采用4個(gè)大小不同的卷積核,大小分別為2、3、4、5。將卷積神經(jīng)網(wǎng)絡(luò)的輸出融人電影特征,再將電影特征與用戶特征相連接,即構(gòu)建出整個(gè)特征矩陣,用于接下來的模型輸入。

        1.2 融合注意力機(jī)制的場(chǎng)感知因子分解機(jī)

        場(chǎng)感知因子分解機(jī)(Field-aware Factorization Machine,F(xiàn)FM)是一種隱向量學(xué)習(xí)的非線性模型,即將同一性質(zhì)的特征歸于一個(gè)場(chǎng)中。在電影推薦中,部分屬性下?lián)碛卸鄠€(gè)值,如電影有多個(gè)類型,實(shí)際上屬于同一性質(zhì),即歸于同一個(gè)場(chǎng)。FFM模型具有強(qiáng)大的泛化能力,并能很好地利用上下文信息,其定義如公式(2)所示。

        對(duì)于不同特征,都會(huì)有一個(gè)交互過程,將公式表示成另一種形式,即:

        注意力模型(Attention Model)被廣泛應(yīng)用于自然語言處理、圖像識(shí)別及語音識(shí)別等不同類型的深度學(xué)習(xí)模型中,其借鑒了人的注意力機(jī)制,本文將其應(yīng)用于推薦系統(tǒng)。在評(píng)分預(yù)測(cè)中,不同項(xiàng)對(duì)最終結(jié)果的影響是不同的,融人注意力機(jī)制,給多元二次項(xiàng)中的每個(gè)項(xiàng)添加一個(gè)注意力系數(shù),用于篩選出具有更高價(jià)值的項(xiàng),并獲取更多所需關(guān)注目標(biāo)的細(xì)節(jié)信息,同時(shí)抑制其它無用信息。融人注意力因子的場(chǎng)感知因子分解機(jī)公式如下:

        其中,ai、ai,j的值可以解釋為后面所乘項(xiàng)在目標(biāo)預(yù)測(cè)中的重要性。對(duì)于訓(xùn)練數(shù)據(jù)中從未出現(xiàn)過的特征,無法估計(jì)其注意力值。為解決一般化問題,本文進(jìn)一步使用多層感知器(MLP)對(duì)注意力值進(jìn)行參數(shù)化,形成一個(gè)注意力網(wǎng)絡(luò)。定義為:

        網(wǎng)絡(luò)采用Relu作為激活函數(shù),并對(duì)注意力值使用softmax函數(shù)進(jìn)行歸一化,歸一化過程如式(7)、式(8)所示。

        1.3 模型框架與損失函數(shù)

        最終模型框架設(shè)計(jì)如圖2所示。

        損失函數(shù)取最小評(píng)分誤差,即:

        其中L(x)為模型損失值,y是用戶對(duì)電影的實(shí)際評(píng)分,R(x)為模型預(yù)測(cè)值,為防止過擬合現(xiàn)象,采用dropout與正則化兩種技術(shù),正則化系數(shù)在式(8)中表現(xiàn)為入(過擬合懲罰因子),||w||是L2范數(shù),作為過擬合懲罰項(xiàng)。Dropout的思想是在訓(xùn)練過程中隨機(jī)地丟棄一些神經(jīng)元,以阻止特征檢測(cè)器的共同作用,提高神經(jīng)網(wǎng)絡(luò)性能。因此,優(yōu)化模型的目標(biāo)是使損失函數(shù)最小化,本文采取隨機(jī)梯度下降(SGD)算法,通過最小化損失函數(shù)訓(xùn)練模型參數(shù),根據(jù)樣本進(jìn)行迭代更新,可以控制更新速率和迭代次數(shù),從而使模型的訓(xùn)練變得可控。

        猜你喜歡
        推薦系統(tǒng)注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)
        基于深度學(xué)習(xí)的問題回答技術(shù)研究
        基于LSTM?Attention神經(jīng)網(wǎng)絡(luò)的文本特征提取方法
        基于注意力機(jī)制的雙向LSTM模型在中文商品評(píng)論情感分類中的研究
        軟件工程(2017年11期)2018-01-05 08:06:09
        InsunKBQA:一個(gè)基于知識(shí)庫(kù)的問答系統(tǒng)
        基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
        基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
        基于個(gè)性化的協(xié)同過濾圖書推薦算法研究
        個(gè)性化推薦系統(tǒng)關(guān)鍵算法探討
        淺談Mahout在個(gè)性化推薦系統(tǒng)中的應(yīng)用
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        亚洲毛片αv无线播放一区| 国产麻豆一区二区三区在线播放| 亚洲一区二区三区美女av| 亚洲精品中文字幕一二三四| 国产成人无精品久久久| 中文字幕精品人妻av在线| 日本高清中文一区二区三区| 美女一区二区三区在线视频| 日韩乱码中文字幕在线| 成人精品视频一区二区| 亚洲精品网站在线观看你懂的| 国产精品1区2区| 日本成人三级视频网站| 桃色一区一区三区蜜桃视频| 日韩精品无码一区二区三区四区| av人摸人人人澡人人超碰妓女| 中文幕无线码中文字蜜桃| 亚洲中文字幕乱码一二三区| 国产一区资源在线播放| 久久久久人妻精品一区二区三区 | 久草青青91在线播放| 人妻少妇不满足中文字幕| 欧美丰满大爆乳波霸奶水多| 午夜av内射一区二区三区红桃视| 在线看亚洲一区二区三区| 亚洲中文字幕日产无码| 日韩毛片免费无码无毒视频观看| 制服丝袜视频国产一区| 亚洲一区二区三区一站| 亚洲国产一区二区三区精品| 成人乱码一区二区三区av| 少妇spa推油被扣高潮| 亚洲欧美成人久久综合中文网 | 亚洲av无码专区在线亚| 亚洲一区二区日韩在线| 成年人观看视频在线播放| 肉体裸交137日本大胆摄影| 国产精品丝袜黑色高跟鞋| 国产免费视频一区二区| 刚出嫁新婚少妇很紧很爽| 日韩精品极品视频在线观看免费|