亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        結(jié)合協(xié)同過(guò)濾與隱語(yǔ)義模型的視頻推薦策略

        2021-12-24 09:29:18沈正一崔德龍劉晴瑞
        關(guān)鍵詞:語(yǔ)義用戶(hù)模型

        王 寧,沈正一,崔德龍,劉晴瑞

        (湖南工程學(xué)院 計(jì)算機(jī)與通信學(xué)院,湘潭 411104)

        伴隨著移動(dòng)智能設(shè)備的快速發(fā)展、通信設(shè)備及5G技術(shù)的快速普及,如今在移動(dòng)設(shè)備上觀看短視頻已經(jīng)成為人們閑暇時(shí)休閑娛樂(lè)的方式之一.但短視頻的推薦結(jié)果卻面臨同質(zhì)化嚴(yán)重的問(wèn)題,因此如何提高視頻推薦內(nèi)容的多樣化,避免內(nèi)容同質(zhì)化,給用戶(hù)帶來(lái)更加優(yōu)質(zhì)的體驗(yàn)是當(dāng)今所有短視頻平臺(tái)所面臨的主要問(wèn)題.

        協(xié)同過(guò)濾算法[1]作為一種結(jié)構(gòu)簡(jiǎn)單的推薦算法被廣泛地應(yīng)用于各類(lèi)推薦系統(tǒng)中,在1994年作為“信息過(guò)濾”[2]被提出研究,又在2002年被Prem Melville[3]稱(chēng)為“協(xié)同過(guò)濾”并進(jìn)行了進(jìn)一步研究.其算法核心是通過(guò)尋找集合中最近的“鄰居”,并通過(guò)用戶(hù)彼此之間的相似度來(lái)提供對(duì)于相應(yīng)物品的推薦.目前則采用啟發(fā)式或基于模型的協(xié)同過(guò)濾算法[4-5].

        隱語(yǔ)義模型是在文本信息挖掘方面被廣泛使用的一種方法,其算法是基于奇異值分解改進(jìn)而來(lái)的[6].現(xiàn)主要用于提取文本中的隱含分類(lèi)并與其建立關(guān)系.本文將隱語(yǔ)義模型與協(xié)同過(guò)濾算法相結(jié)合,通過(guò)建立模型找出用戶(hù)與隱含分類(lèi)之間所存在的關(guān)系以及物品與隱含分類(lèi)之間的關(guān)系,利用隱含分類(lèi)構(gòu)建出用戶(hù)對(duì)物品的興趣信息,結(jié)合協(xié)同過(guò)濾算法進(jìn)行推薦.實(shí)驗(yàn)結(jié)果表明通過(guò)該模型與協(xié)同過(guò)濾算法的改進(jìn)能夠較好地改進(jìn)推薦系統(tǒng)的推薦效果.

        1 推薦系統(tǒng)改進(jìn)

        本文通過(guò)對(duì)推薦系統(tǒng)進(jìn)行了改進(jìn),將其主要分為協(xié)同過(guò)濾算法、隱語(yǔ)義模型、推薦過(guò)程三個(gè)部分,分別通過(guò)協(xié)同過(guò)濾算法和隱語(yǔ)義模型產(chǎn)生推薦列表,保證推薦結(jié)果的實(shí)時(shí)性、新穎性和多樣性,最后對(duì)推薦列表中的內(nèi)容進(jìn)行排名,產(chǎn)生最后的推薦結(jié)果.

        1.1 協(xié)同過(guò)濾算法

        本文選擇基于用戶(hù)的協(xié)同過(guò)濾算法[7],主要是將用戶(hù)觀看視頻的瀏覽記錄作為主要的推薦依據(jù).通過(guò)公式(1)再對(duì)相同的視頻存在過(guò)瀏覽行為的用戶(hù)之間建立一個(gè)相似度矩陣得到用戶(hù)u,v之間的相似度矩陣U-V:

        再根據(jù)用戶(hù)v與其所瀏覽過(guò)的視頻i建立出一個(gè)興趣度矩陣V-I,通過(guò)兩矩陣相乘就可以計(jì)算出用戶(hù)u對(duì)視頻i的興趣程度:

        為了保證對(duì)于視頻內(nèi)容的推薦結(jié)果具有多樣性,因此在協(xié)同過(guò)濾的基礎(chǔ)上需要減少關(guān)于熱門(mén)視頻以及相應(yīng)標(biāo)簽內(nèi)容對(duì)推薦結(jié)果的影響.因此通過(guò)改進(jìn)用戶(hù)之間的興趣度計(jì)算得到公式(3):

        通過(guò)改進(jìn)后的協(xié)同過(guò)濾算法能夠有效地減少向用戶(hù)推薦相同或類(lèi)似的視頻內(nèi)容,并能較好地增加用戶(hù)的滿意度.

        1.2 隱語(yǔ)義模型

        伴隨人們對(duì)視頻內(nèi)容的需求,單一視頻內(nèi)所包含的內(nèi)容也逐漸趨于多樣化,通常在一個(gè)視頻內(nèi)會(huì)包含多個(gè)主題,即具有多個(gè)標(biāo)簽.因此若根據(jù)單一的標(biāo)簽就無(wú)法得到視頻所真正具有的特性.本文選擇通過(guò)隱語(yǔ)義模型分析出視頻之間的隱含分類(lèi),根據(jù)所得到的視頻之間的隱含分類(lèi)再通過(guò)用戶(hù)與視頻之間的交互,計(jì)算出用戶(hù)之間的相似度,并得到相應(yīng)的推薦結(jié)果.用戶(hù)u對(duì)視頻內(nèi)容i的喜好程度可以通過(guò)公式(4)進(jìn)行計(jì)算:

        通過(guò)公式計(jì)算還需要兩個(gè)重要的參數(shù)P(u,c)和B(c,i),其參數(shù)的確定需要根據(jù)用戶(hù)瀏覽視頻的時(shí)間長(zhǎng)度以及用戶(hù)對(duì)于視頻的反饋情況來(lái)計(jì)算.通過(guò)用戶(hù)物品評(píng)分矩陣則可以將用戶(hù)反饋的這些行為數(shù)據(jù)通過(guò)訓(xùn)練得到我們希望得到的推薦結(jié)果.為了減小訓(xùn)練結(jié)果的誤差,采用公式(5)作為訓(xùn)練的損失函數(shù):

        由于學(xué)習(xí)過(guò)程中可能會(huì)產(chǎn)生過(guò)擬合從而造成計(jì)算出來(lái)的用戶(hù)對(duì)視頻的興趣程度出現(xiàn)錯(cuò)誤,因此對(duì)于損失函數(shù),我們還需要加入正則化項(xiàng):來(lái)對(duì)損失函數(shù)進(jìn)行優(yōu)化,最后可以得到公式(6)作為修改后的損失函數(shù):

        由于損失函數(shù)的復(fù)雜程度依然較大,因此仍需要對(duì)算法模型進(jìn)行優(yōu)化.本文選擇了隨機(jī)梯度下降法[4]來(lái)優(yōu)化算法,求得參數(shù)的偏導(dǎo)數(shù):

        借助所得到的偏導(dǎo)數(shù),根據(jù)隨機(jī)梯度下降法得到:

        將參數(shù)沿著最有效的下降方向進(jìn)行推進(jìn).在此基礎(chǔ)上只需要不斷迭代對(duì)參數(shù)進(jìn)行優(yōu)化,以取得最優(yōu)的下降步長(zhǎng).

        1.3 推薦過(guò)程

        雖然通過(guò)隱語(yǔ)義模型能夠得到多樣性較好的推薦結(jié)果,但由于計(jì)算隱語(yǔ)義模型所需要花費(fèi)的時(shí)間較長(zhǎng),因此選擇將其與協(xié)同過(guò)濾算法進(jìn)行結(jié)合以保證推薦效率.首先通過(guò)上述的兩種算法分別得出相應(yīng)的推薦結(jié)果集.每當(dāng)用戶(hù)進(jìn)行視頻的瀏覽動(dòng)作后,會(huì)在后臺(tái)根據(jù)用戶(hù)所產(chǎn)生的瀏覽數(shù)據(jù)導(dǎo)入隱語(yǔ)義模型并與協(xié)同過(guò)濾算法產(chǎn)生一個(gè)即時(shí)的推薦結(jié)果,根據(jù)權(quán)值對(duì)興趣程度進(jìn)行合并,在此基礎(chǔ)上依據(jù)視頻項(xiàng)目的興趣程度的排序生成推薦列表.

        2 實(shí)驗(yàn)結(jié)果及分析

        2.1 數(shù)據(jù)集

        本次實(shí)驗(yàn)通過(guò)使用Movielens-1M數(shù)據(jù)集[8],數(shù)據(jù)集包含了6040位用戶(hù)對(duì)3900條物品所產(chǎn)生的1000209條觀看及評(píng)分記錄.在實(shí)驗(yàn)過(guò)程中對(duì)數(shù)據(jù)集以7∶1的比例隨機(jī)劃分為訓(xùn)練集及測(cè)試集,對(duì)數(shù)據(jù)集進(jìn)行多次劃分并對(duì)劃分后數(shù)據(jù)集進(jìn)行重復(fù)實(shí)驗(yàn),最終將每次劃分得到的實(shí)驗(yàn)結(jié)果取均值作為最終的實(shí)驗(yàn)結(jié)果.

        2.2 度量標(biāo)準(zhǔn)

        本文采用了廣泛用于推薦系統(tǒng)評(píng)測(cè)的召回率和準(zhǔn)確率作為評(píng)測(cè)標(biāo)準(zhǔn)[9].其中R為訓(xùn)練集,T為測(cè)試集,R(u)為訓(xùn)練集上所產(chǎn)生的推薦結(jié)果,T(u)為測(cè)試集中用戶(hù)對(duì)物品產(chǎn)生的行為列表.

        準(zhǔn)確率計(jì)算式(11)通過(guò)計(jì)算符合測(cè)試集推薦的結(jié)果占訓(xùn)練集的比例,其結(jié)果能夠較好地反映針對(duì)用戶(hù)的推薦精度.召回率計(jì)算式(12)通過(guò)計(jì)算符合測(cè)試集推薦的結(jié)果占測(cè)試集的比例,反映出推薦系統(tǒng)對(duì)相應(yīng)物品的推薦比例.

        2.3 實(shí)驗(yàn)結(jié)果

        為了驗(yàn)證改進(jìn)后算法的有效性,本文選擇基于用戶(hù)的協(xié)同過(guò)濾算法以及PersonalRank,PureSVD這幾種推薦算法[10]模型進(jìn)行比較:

        從圖1中可以看出,四種推薦算法的召回率伴隨著推薦項(xiàng)目的增加逐漸上升,從圖2中可以看到在召回率上升的同時(shí)準(zhǔn)確率卻隨之下降,但總體的下降趨勢(shì)較緩.在圖1中通過(guò)融合隱語(yǔ)義模型及協(xié)同過(guò)濾的算法相較于其他的三種算法伴隨著推薦數(shù)量的提高,召回率指標(biāo)有著較好的提升,圖2中同樣表現(xiàn)出了在召回率提升的同時(shí),準(zhǔn)確率也高于其余幾種比較算法.

        圖1 隱語(yǔ)義模型與比較算法的召回率

        圖2 隱語(yǔ)義模型與比較算法的準(zhǔn)確率

        圖1中當(dāng)推薦數(shù)量較少時(shí)即數(shù)量在4~10之間,改進(jìn)后的算法的推薦結(jié)果興趣點(diǎn)過(guò)于單一,因此造成了召回率的下降.但伴隨著推薦數(shù)目的增加,即當(dāng)推薦數(shù)目增加到10左右時(shí),通過(guò)隱語(yǔ)義模型的數(shù)據(jù)逐漸增強(qiáng),推薦的召回率相較之前以及其余的推薦算法有所提高.

        除此之外,隱語(yǔ)義模型中負(fù)樣本的選擇數(shù)目對(duì)于本文算法也存在影響,伴隨著視頻的負(fù)樣本數(shù)目增加,改進(jìn)后算法的召回率及準(zhǔn)確率會(huì)呈現(xiàn)出先增后減的趨勢(shì),如圖3所示.同時(shí)當(dāng)數(shù)據(jù)集中的用戶(hù)與物品的交互較少時(shí),改進(jìn)后的算法性能同樣會(huì)出現(xiàn)下降.

        圖3 負(fù)樣本對(duì)改進(jìn)算法的召回率與準(zhǔn)確率影響

        總的來(lái)說(shuō),如表1所示改進(jìn)后的算法與經(jīng)典協(xié)同過(guò)濾算法、矩陣分解算法相比,推薦性能還是有所提升.因此在協(xié)同過(guò)濾算法的基礎(chǔ)上通過(guò)引入隱含語(yǔ)義模型能夠有效地挖掘出用戶(hù)對(duì)于物品興趣的隱含信息,并能夠有效地提高推薦系統(tǒng)的推薦質(zhì)量.

        表1 改進(jìn)后算法與比較算法的平均推薦性能指標(biāo)

        3 結(jié)論

        本文通過(guò)融合在文本信息挖掘中廣泛使用的隱語(yǔ)義模型與協(xié)同過(guò)濾算法,改進(jìn)推薦系統(tǒng),改進(jìn)后的算法通過(guò)深度學(xué)習(xí)對(duì)用戶(hù)相似度以及物品的興趣度上進(jìn)行數(shù)據(jù)分析,總體上優(yōu)化了協(xié)同過(guò)濾算法中用戶(hù)對(duì)物品興趣度的計(jì)算精度.

        當(dāng)前深度學(xué)習(xí)發(fā)展迅速,同時(shí)其在信息的處理上也顯現(xiàn)出了巨大的優(yōu)勢(shì),通過(guò)與推薦系統(tǒng)的結(jié)合,利用神經(jīng)網(wǎng)絡(luò)提取出用戶(hù)的相關(guān)興趣,并對(duì)其進(jìn)行預(yù)測(cè),通過(guò)學(xué)習(xí)算法優(yōu)化最后的推薦結(jié)果并排序,能夠有效地提高用戶(hù)對(duì)推薦系統(tǒng)的滿意度.在未來(lái)的推薦系統(tǒng)的研究中應(yīng)當(dāng)更好地結(jié)合相關(guān)技術(shù)的發(fā)展,融合各種方法及思路來(lái)改善并促進(jìn)推薦系統(tǒng)的發(fā)展.

        猜你喜歡
        語(yǔ)義用戶(hù)模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        語(yǔ)言與語(yǔ)義
        關(guān)注用戶(hù)
        3D打印中的模型分割與打包
        關(guān)注用戶(hù)
        “上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
        關(guān)注用戶(hù)
        認(rèn)知范疇模糊與語(yǔ)義模糊
        无码吃奶揉捏奶头高潮视频| 国产av麻豆精品第一页| 日本五月天婷久久网站| 音影先锋色天堂av电影妓女久久 | 亚洲av成人片色在线观看高潮| 鲁一鲁一鲁一鲁一曰综合网| 无遮无挡三级动态图| 国产成人AV乱码免费观看| 亚洲精品国产一区二区免费视频| 高潮内射双龙视频| 免费无码成人av在线播| 日本一区二区三区小视频| 久久精品国产免费一区二区三区| 手机福利视频| 久久99精品久久久久久久清纯| 久草视频华人在线观看| 人妻少妇69久久中文字幕| 国产精品18久久久| 日本在线视频网站www色下载 | 久久www免费人成精品| 国产天堂网站麻豆| 精品日本一区二区视频| 最新中文字幕人妻少妇| 99re8这里有精品热视频免费| 波霸影院一区二区| 一区二区三区高清视频在线| 国产精品h片在线播放| 久久久久久久99精品国产片| 精品一区二区av天堂| 女同另类一区二区三区| 国产精品人人做人人爽人人添 | 欧美丰满熟妇性xxxx| 人妻夜夜爽天天爽三区麻豆AV网站| 国产精品一区二区三区色| 国产黄污网站在线观看| 桃花色综合影院| 亚洲欧美日韩在线中文一| 亚洲av日韩专区在线观看| 成人国产精品一区二区视频| 任你躁国产自任一区二区三区| 免费女女同黄毛片av网站|