亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

結(jié)合協(xié)同過(guò)濾與隱語(yǔ)義模型的視頻推薦策略

2021-12-24 09:29:18沈正一崔德龍劉晴瑞

湖南工程學(xué)院學(xué)報(bào)(自然科學(xué)版) 2021年4期

王寧，沈正一，崔德龍，劉晴瑞

（湖南工程學(xué)院計(jì)算機(jī)與通信學(xué)院，湘潭 411104）

伴隨著移動(dòng)智能設(shè)備的快速發(fā)展、通信設(shè)備及5G技術(shù)的快速普及，如今在移動(dòng)設(shè)備上觀看短視頻已經(jīng)成為人們閑暇時(shí)休閑娛樂(lè)的方式之一.但短視頻的推薦結(jié)果卻面臨同質(zhì)化嚴(yán)重的問(wèn)題，因此如何提高視頻推薦內(nèi)容的多樣化，避免內(nèi)容同質(zhì)化，給用戶(hù)帶來(lái)更加優(yōu)質(zhì)的體驗(yàn)是當(dāng)今所有短視頻平臺(tái)所面臨的主要問(wèn)題.

協(xié)同過(guò)濾算法［1］作為一種結(jié)構(gòu)簡(jiǎn)單的推薦算法被廣泛地應(yīng)用于各類(lèi)推薦系統(tǒng)中，在1994年作為“信息過(guò)濾”［2］被提出研究，又在2002年被Prem Melville［3］稱(chēng)為“協(xié)同過(guò)濾”并進(jìn)行了進(jìn)一步研究.其算法核心是通過(guò)尋找集合中最近的“鄰居”，并通過(guò)用戶(hù)彼此之間的相似度來(lái)提供對(duì)于相應(yīng)物品的推薦.目前則采用啟發(fā)式或基于模型的協(xié)同過(guò)濾算法［4-5］.

隱語(yǔ)義模型是在文本信息挖掘方面被廣泛使用的一種方法，其算法是基于奇異值分解改進(jìn)而來(lái)的［6］.現(xiàn)主要用于提取文本中的隱含分類(lèi)并與其建立關(guān)系.本文將隱語(yǔ)義模型與協(xié)同過(guò)濾算法相結(jié)合，通過(guò)建立模型找出用戶(hù)與隱含分類(lèi)之間所存在的關(guān)系以及物品與隱含分類(lèi)之間的關(guān)系，利用隱含分類(lèi)構(gòu)建出用戶(hù)對(duì)物品的興趣信息，結(jié)合協(xié)同過(guò)濾算法進(jìn)行推薦.實(shí)驗(yàn)結(jié)果表明通過(guò)該模型與協(xié)同過(guò)濾算法的改進(jìn)能夠較好地改進(jìn)推薦系統(tǒng)的推薦效果.

1 推薦系統(tǒng)改進(jìn)

本文通過(guò)對(duì)推薦系統(tǒng)進(jìn)行了改進(jìn)，將其主要分為協(xié)同過(guò)濾算法、隱語(yǔ)義模型、推薦過(guò)程三個(gè)部分，分別通過(guò)協(xié)同過(guò)濾算法和隱語(yǔ)義模型產(chǎn)生推薦列表，保證推薦結(jié)果的實(shí)時(shí)性、新穎性和多樣性，最后對(duì)推薦列表中的內(nèi)容進(jìn)行排名，產(chǎn)生最后的推薦結(jié)果.

1.1 協(xié)同過(guò)濾算法

本文選擇基于用戶(hù)的協(xié)同過(guò)濾算法［7］，主要是將用戶(hù)觀看視頻的瀏覽記錄作為主要的推薦依據(jù).通過(guò)公式（1）再對(duì)相同的視頻存在過(guò)瀏覽行為的用戶(hù)之間建立一個(gè)相似度矩陣得到用戶(hù)u，v之間的相似度矩陣U-V：

再根據(jù)用戶(hù)v與其所瀏覽過(guò)的視頻i建立出一個(gè)興趣度矩陣V-I，通過(guò)兩矩陣相乘就可以計(jì)算出用戶(hù)u對(duì)視頻i的興趣程度：

為了保證對(duì)于視頻內(nèi)容的推薦結(jié)果具有多樣性，因此在協(xié)同過(guò)濾的基礎(chǔ)上需要減少關(guān)于熱門(mén)視頻以及相應(yīng)標(biāo)簽內(nèi)容對(duì)推薦結(jié)果的影響.因此通過(guò)改進(jìn)用戶(hù)之間的興趣度計(jì)算得到公式（3）：

通過(guò)改進(jìn)后的協(xié)同過(guò)濾算法能夠有效地減少向用戶(hù)推薦相同或類(lèi)似的視頻內(nèi)容，并能較好地增加用戶(hù)的滿意度.

1.2 隱語(yǔ)義模型

伴隨人們對(duì)視頻內(nèi)容的需求，單一視頻內(nèi)所包含的內(nèi)容也逐漸趨于多樣化，通常在一個(gè)視頻內(nèi)會(huì)包含多個(gè)主題，即具有多個(gè)標(biāo)簽.因此若根據(jù)單一的標(biāo)簽就無(wú)法得到視頻所真正具有的特性.本文選擇通過(guò)隱語(yǔ)義模型分析出視頻之間的隱含分類(lèi)，根據(jù)所得到的視頻之間的隱含分類(lèi)再通過(guò)用戶(hù)與視頻之間的交互，計(jì)算出用戶(hù)之間的相似度，并得到相應(yīng)的推薦結(jié)果.用戶(hù)u對(duì)視頻內(nèi)容i的喜好程度可以通過(guò)公式（4）進(jìn)行計(jì)算：

通過(guò)公式計(jì)算還需要兩個(gè)重要的參數(shù)P(u,c)和B(c,i)，其參數(shù)的確定需要根據(jù)用戶(hù)瀏覽視頻的時(shí)間長(zhǎng)度以及用戶(hù)對(duì)于視頻的反饋情況來(lái)計(jì)算.通過(guò)用戶(hù)物品評(píng)分矩陣則可以將用戶(hù)反饋的這些行為數(shù)據(jù)通過(guò)訓(xùn)練得到我們希望得到的推薦結(jié)果.為了減小訓(xùn)練結(jié)果的誤差，采用公式（5）作為訓(xùn)練的損失函數(shù)：

由于學(xué)習(xí)過(guò)程中可能會(huì)產(chǎn)生過(guò)擬合從而造成計(jì)算出來(lái)的用戶(hù)對(duì)視頻的興趣程度出現(xiàn)錯(cuò)誤，因此對(duì)于損失函數(shù)，我們還需要加入正則化項(xiàng)：來(lái)對(duì)損失函數(shù)進(jìn)行優(yōu)化，最后可以得到公式（6）作為修改后的損失函數(shù)：

由于損失函數(shù)的復(fù)雜程度依然較大，因此仍需要對(duì)算法模型進(jìn)行優(yōu)化.本文選擇了隨機(jī)梯度下降法［4］來(lái)優(yōu)化算法，求得參數(shù)的偏導(dǎo)數(shù)：

借助所得到的偏導(dǎo)數(shù)，根據(jù)隨機(jī)梯度下降法得到：

將參數(shù)沿著最有效的下降方向進(jìn)行推進(jìn).在此基礎(chǔ)上只需要不斷迭代對(duì)參數(shù)進(jìn)行優(yōu)化，以取得最優(yōu)的下降步長(zhǎng).

1.3 推薦過(guò)程

雖然通過(guò)隱語(yǔ)義模型能夠得到多樣性較好的推薦結(jié)果，但由于計(jì)算隱語(yǔ)義模型所需要花費(fèi)的時(shí)間較長(zhǎng)，因此選擇將其與協(xié)同過(guò)濾算法進(jìn)行結(jié)合以保證推薦效率.首先通過(guò)上述的兩種算法分別得出相應(yīng)的推薦結(jié)果集.每當(dāng)用戶(hù)進(jìn)行視頻的瀏覽動(dòng)作后，會(huì)在后臺(tái)根據(jù)用戶(hù)所產(chǎn)生的瀏覽數(shù)據(jù)導(dǎo)入隱語(yǔ)義模型并與協(xié)同過(guò)濾算法產(chǎn)生一個(gè)即時(shí)的推薦結(jié)果，根據(jù)權(quán)值對(duì)興趣程度進(jìn)行合并，在此基礎(chǔ)上依據(jù)視頻項(xiàng)目的興趣程度的排序生成推薦列表.

2 實(shí)驗(yàn)結(jié)果及分析

2.1 數(shù)據(jù)集

本次實(shí)驗(yàn)通過(guò)使用Movielens-1M數(shù)據(jù)集［8］，數(shù)據(jù)集包含了6040位用戶(hù)對(duì)3900條物品所產(chǎn)生的1000209條觀看及評(píng)分記錄.在實(shí)驗(yàn)過(guò)程中對(duì)數(shù)據(jù)集以7∶1的比例隨機(jī)劃分為訓(xùn)練集及測(cè)試集，對(duì)數(shù)據(jù)集進(jìn)行多次劃分并對(duì)劃分后數(shù)據(jù)集進(jìn)行重復(fù)實(shí)驗(yàn)，最終將每次劃分得到的實(shí)驗(yàn)結(jié)果取均值作為最終的實(shí)驗(yàn)結(jié)果.

2.2 度量標(biāo)準(zhǔn)

本文采用了廣泛用于推薦系統(tǒng)評(píng)測(cè)的召回率和準(zhǔn)確率作為評(píng)測(cè)標(biāo)準(zhǔn)［9］.其中R為訓(xùn)練集，T為測(cè)試集，R(u)為訓(xùn)練集上所產(chǎn)生的推薦結(jié)果，T(u)為測(cè)試集中用戶(hù)對(duì)物品產(chǎn)生的行為列表.

準(zhǔn)確率計(jì)算式（11）通過(guò)計(jì)算符合測(cè)試集推薦的結(jié)果占訓(xùn)練集的比例，其結(jié)果能夠較好地反映針對(duì)用戶(hù)的推薦精度.召回率計(jì)算式（12）通過(guò)計(jì)算符合測(cè)試集推薦的結(jié)果占測(cè)試集的比例，反映出推薦系統(tǒng)對(duì)相應(yīng)物品的推薦比例.

2.3 實(shí)驗(yàn)結(jié)果

為了驗(yàn)證改進(jìn)后算法的有效性，本文選擇基于用戶(hù)的協(xié)同過(guò)濾算法以及PersonalRank，PureSVD這幾種推薦算法［10］模型進(jìn)行比較：

從圖1中可以看出，四種推薦算法的召回率伴隨著推薦項(xiàng)目的增加逐漸上升，從圖2中可以看到在召回率上升的同時(shí)準(zhǔn)確率卻隨之下降，但總體的下降趨勢(shì)較緩.在圖1中通過(guò)融合隱語(yǔ)義模型及協(xié)同過(guò)濾的算法相較于其他的三種算法伴隨著推薦數(shù)量的提高，召回率指標(biāo)有著較好的提升，圖2中同樣表現(xiàn)出了在召回率提升的同時(shí)，準(zhǔn)確率也高于其余幾種比較算法.

圖1 隱語(yǔ)義模型與比較算法的召回率

圖2 隱語(yǔ)義模型與比較算法的準(zhǔn)確率

圖1中當(dāng)推薦數(shù)量較少時(shí)即數(shù)量在4～10之間，改進(jìn)后的算法的推薦結(jié)果興趣點(diǎn)過(guò)于單一，因此造成了召回率的下降.但伴隨著推薦數(shù)目的增加，即當(dāng)推薦數(shù)目增加到10左右時(shí)，通過(guò)隱語(yǔ)義模型的數(shù)據(jù)逐漸增強(qiáng)，推薦的召回率相較之前以及其余的推薦算法有所提高.

除此之外，隱語(yǔ)義模型中負(fù)樣本的選擇數(shù)目對(duì)于本文算法也存在影響，伴隨著視頻的負(fù)樣本數(shù)目增加，改進(jìn)后算法的召回率及準(zhǔn)確率會(huì)呈現(xiàn)出先增后減的趨勢(shì)，如圖3所示.同時(shí)當(dāng)數(shù)據(jù)集中的用戶(hù)與物品的交互較少時(shí)，改進(jìn)后的算法性能同樣會(huì)出現(xiàn)下降.

圖3 負(fù)樣本對(duì)改進(jìn)算法的召回率與準(zhǔn)確率影響

總的來(lái)說(shuō)，如表1所示改進(jìn)后的算法與經(jīng)典協(xié)同過(guò)濾算法、矩陣分解算法相比，推薦性能還是有所提升.因此在協(xié)同過(guò)濾算法的基礎(chǔ)上通過(guò)引入隱含語(yǔ)義模型能夠有效地挖掘出用戶(hù)對(duì)于物品興趣的隱含信息，并能夠有效地提高推薦系統(tǒng)的推薦質(zhì)量.

表1 改進(jìn)后算法與比較算法的平均推薦性能指標(biāo)

3 結(jié)論

本文通過(guò)融合在文本信息挖掘中廣泛使用的隱語(yǔ)義模型與協(xié)同過(guò)濾算法，改進(jìn)推薦系統(tǒng)，改進(jìn)后的算法通過(guò)深度學(xué)習(xí)對(duì)用戶(hù)相似度以及物品的興趣度上進(jìn)行數(shù)據(jù)分析，總體上優(yōu)化了協(xié)同過(guò)濾算法中用戶(hù)對(duì)物品興趣度的計(jì)算精度.

當(dāng)前深度學(xué)習(xí)發(fā)展迅速，同時(shí)其在信息的處理上也顯現(xiàn)出了巨大的優(yōu)勢(shì)，通過(guò)與推薦系統(tǒng)的結(jié)合，利用神經(jīng)網(wǎng)絡(luò)提取出用戶(hù)的相關(guān)興趣，并對(duì)其進(jìn)行預(yù)測(cè)，通過(guò)學(xué)習(xí)算法優(yōu)化最后的推薦結(jié)果并排序，能夠有效地提高用戶(hù)對(duì)推薦系統(tǒng)的滿意度.在未來(lái)的推薦系統(tǒng)的研究中應(yīng)當(dāng)更好地結(jié)合相關(guān)技術(shù)的發(fā)展，融合各種方法及思路來(lái)改善并促進(jìn)推薦系統(tǒng)的發(fā)展.