沈曉鵬 趙明 劉善智
摘要:短視頻推薦是推薦系統(tǒng)中的一個(gè)重要領(lǐng)域,其目標(biāo)是根據(jù)用戶的興趣和偏好,為用戶推薦個(gè)性化的短視頻內(nèi)容,該研究具有重要的理論和實(shí)踐意義。該文旨在對(duì)短視頻推薦方法進(jìn)行綜述和研究,通過(guò)分析比較不同推薦方法,深入探討和研究不同方法的優(yōu)缺點(diǎn),進(jìn)行模型優(yōu)化與設(shè)計(jì)。該研究可以為短視頻推薦系統(tǒng)的設(shè)計(jì)和優(yōu)化提供指導(dǎo)和參考,為短視頻推薦系統(tǒng)的改進(jìn)和優(yōu)化提供有力支持,提高用戶的滿意度和體驗(yàn)。
關(guān)鍵詞:短視頻;推薦系統(tǒng);深度學(xué)習(xí)
中圖分類號(hào):TP37? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2023)34-0116-03
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)
1 前言
1.1 背景介紹
隨著移動(dòng)互聯(lián)網(wǎng)的普及和社交媒體平臺(tái)的興起,短視頻已經(jīng)成為人們?nèi)粘I畋夭豢缮俚慕M成部分。短視頻以其簡(jiǎn)短、直觀和生動(dòng)的特點(diǎn)吸引了廣大用戶的關(guān)注,用戶通過(guò)短視頻可以輕松獲取豐富的信息和娛樂(lè)內(nèi)容。然而,由于短視頻數(shù)量龐大且類別繁多,用戶往往面臨巨大的選擇困難,推薦系統(tǒng)由此成為幫助用戶發(fā)現(xiàn)和獲取感興趣內(nèi)容的重要工具。
短視頻推薦是推薦系統(tǒng)中的一個(gè)重要領(lǐng)域,其目標(biāo)是根據(jù)用戶的興趣和偏好,為用戶推薦個(gè)性化的短視頻內(nèi)容。然而短視頻推薦系統(tǒng)依然有不少挑戰(zhàn)。首先,短視頻以其時(shí)效性和多樣性的特點(diǎn),導(dǎo)致用戶的興趣和偏好頻繁變化,從而系統(tǒng)需要有及時(shí)性和適應(yīng)性的特殊需求。其次,短視頻的內(nèi)容多樣化,包括音樂(lè)、影視、娛樂(lè)、教育等不同領(lǐng)域的內(nèi)容,如何準(zhǔn)確地理解和區(qū)分視頻的內(nèi)容特點(diǎn),成了一個(gè)關(guān)鍵問(wèn)題。最后,用戶對(duì)于短視頻的喜好具有一定的主觀性和個(gè)體差異,傳統(tǒng)的推薦方法往往無(wú)法滿足用戶的個(gè)性化需求。
1.2 研究目的及意義
通過(guò)研究不同的短視頻推薦方法與模型,可以促進(jìn)推薦系統(tǒng)研究進(jìn)展,探索更加高效、準(zhǔn)確和用戶滿意的推薦算法和模型,為其他推薦任務(wù)和領(lǐng)域的研究提供一定的借鑒。研究短視頻推薦方法與模型可以幫助內(nèi)容提供者更好地了解用戶需求和喜好,為用戶提供個(gè)性化的短視頻推薦服務(wù),從而推動(dòng)短視頻產(chǎn)業(yè)的發(fā)展。因此,短視頻推薦方法與模型的研究具有重要意義。
2 基于深度學(xué)習(xí)的推薦方法
2.1 深度神經(jīng)網(wǎng)絡(luò)架構(gòu)
基于深度學(xué)習(xí)的推薦方法通常使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行建模和預(yù)測(cè)[1]。主要模型有多層感知器、矩陣分解神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等。在這里,著重分析卷積神經(jīng)網(wǎng)絡(luò)推薦方法。
深度學(xué)習(xí)網(wǎng)絡(luò)采用了一種三層結(jié)構(gòu),包括輸入層、隱藏層和輸出層。其中,多層感知器為具有多個(gè)隱藏層的網(wǎng)絡(luò)。每個(gè)隱藏層的輸出作為下一個(gè)隱藏層的輸入,每一層都在表達(dá)一種中間特征[2]。通過(guò)輸入數(shù)據(jù)集特征和反復(fù)迭代,網(wǎng)絡(luò)結(jié)構(gòu)逐步獲得更加抽象的高層特征,從而能夠發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
深度學(xué)習(xí)根據(jù)研究?jī)?nèi)容劃分,主要分為卷積神經(jīng)網(wǎng)絡(luò)(CNN) 、自編碼神經(jīng)網(wǎng)絡(luò)(AEN) 、深度置信網(wǎng)絡(luò)(DBN)三類方法[3]。以上三類方法中,在當(dāng)今視頻推薦系統(tǒng)中,卷積神經(jīng)網(wǎng)絡(luò)算法最為常見(jiàn)。
卷積神經(jīng)網(wǎng)絡(luò)CNN可以提取出用戶和物品的局部特征,進(jìn)而捕捉它們之間的關(guān)系。CNN在處理圖像[4]、文本和序列等數(shù)據(jù)時(shí)具有優(yōu)秀的表達(dá)能力。實(shí)際應(yīng)用中還有其他各式各樣的深度學(xué)習(xí)模型,根據(jù)具體的推薦任務(wù)和數(shù)據(jù)特點(diǎn),可以選擇最合適的深度神經(jīng)網(wǎng)絡(luò)來(lái)建立推薦模型。
2.2 模型訓(xùn)練和評(píng)估
對(duì)于模型訓(xùn)練,首先需要準(zhǔn)備好訓(xùn)練和測(cè)試所需的數(shù)據(jù)。這包括用戶的歷史行為數(shù)據(jù)、物品的屬性信息以及用戶和物品之間的交互數(shù)據(jù)等。隨后,根據(jù)具體的推薦任務(wù)和數(shù)據(jù)特點(diǎn),選擇適合的深度學(xué)習(xí)模型架構(gòu)。使用準(zhǔn)備好的數(shù)據(jù)集,將其劃分為訓(xùn)練集和驗(yàn)證集。然后,使用訓(xùn)練集訓(xùn)練。
對(duì)于模型評(píng)估,使用驗(yàn)證集對(duì)訓(xùn)練好的模型進(jìn)行評(píng)估。常用的評(píng)估指標(biāo)包括準(zhǔn)確率(Precision) 、召回率(Recall) 、F1-score等[5]。根據(jù)評(píng)估結(jié)果,可以進(jìn)行模型的調(diào)整和優(yōu)化。在模型訓(xùn)練和驗(yàn)證完成后,可以使用訓(xùn)練好的模型對(duì)新的用戶和物品進(jìn)行推薦預(yù)測(cè),根據(jù)用戶的特征和歷史行為預(yù)測(cè)可能感興趣的物品。
3 推薦方法的評(píng)估與模型優(yōu)化
3.1 新的短視頻推薦模型構(gòu)想
3.1.1 算法設(shè)計(jì)和思路
設(shè)計(jì)一個(gè)新的短視頻推薦模型可以從多個(gè)方面考慮和設(shè)計(jì),首先需要收集和整理短視頻的數(shù)據(jù)集,包括視頻的特征信息(如時(shí)長(zhǎng)、分類標(biāo)簽)、用戶的行為數(shù)據(jù)(如觀看歷史、喜歡、評(píng)論等)以及其他可能有關(guān)的數(shù)據(jù)(如用戶畫像信息)。就不同情況來(lái)分析,對(duì)于視頻和用戶的特征信息[6],可以進(jìn)行特征工程,提取一些有用的特征。
3.1.2 新模型設(shè)計(jì)
針對(duì)短視頻推薦的準(zhǔn)確性和實(shí)時(shí)性不夠的問(wèn)題上,這里結(jié)合神經(jīng)網(wǎng)絡(luò)推薦模型的優(yōu)點(diǎn),使用融合卷積神經(jīng)網(wǎng)絡(luò)CNN的個(gè)性化短視頻推薦方法,引入注意力機(jī)制,提升推薦系統(tǒng)的準(zhǔn)確性。
CBAM是一種輕量級(jí)的卷積注意力模塊,在注意力機(jī)制中起關(guān)鍵作用。它同時(shí)結(jié)合了通道注意力和空間注意力,可以學(xué)習(xí)全局和特定特征,并更準(zhǔn)確地關(guān)注不同特征。在推薦系統(tǒng)中,CBAM的引入可以提升特征提取能力,幫助模型更好地理解用戶和商品之間的關(guān)系,從而提高預(yù)測(cè)準(zhǔn)確性。通過(guò)提高模型的解釋性和特征提取能力,CBAM可以增強(qiáng)推薦系統(tǒng)對(duì)用戶興趣和行為的理解能力,進(jìn)而提升推薦準(zhǔn)確度。
引入注意力機(jī)制的CNN模型是一種引入了輕量級(jí)的卷積注意力模塊,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(CNN) 的深度學(xué)習(xí)模型,基于CBAM的CNN推薦系統(tǒng)模型以下簡(jiǎn)稱為CBN(CBAM-based Neural Network) 模型。在CNN之后,用全局平均池化計(jì)算每個(gè)通道的權(quán)重,并使用兩個(gè)密集層對(duì)權(quán)重進(jìn)行更新和擴(kuò)展。通過(guò)使用Sigmoid激活函數(shù)將權(quán)重限制在[0,1]范圍內(nèi),并將其與原始特征相乘,通過(guò)比較通道之間的重要性來(lái)加權(quán)特征。通過(guò)比較空間位置之間的重要性來(lái)加權(quán)特征。設(shè)計(jì)方案如圖1所示。
CBN模型首先使用卷積和池化操作從用戶和商品的信息中提取特征,然后將用戶特征向量和商品特征向量拼接在一起。接著,CBN模型將該特征向量輸入CBAM模塊中,以學(xué)習(xí)用戶和商品特征的通道和空間關(guān)系。最后,CBN模型使用全連接層來(lái)推理用戶與商品之間的關(guān)聯(lián)度,預(yù)測(cè)用戶對(duì)商品的評(píng)分。
按照兩種模型原理,在理論上CNN模型通過(guò)引入CBAM模塊,能夠增強(qiáng)模型對(duì)于用戶和商品特征的建模能力,尤其是可以自適應(yīng)地控制不同特征的權(quán)重,以便更好地捕捉不同特征之間的依賴性。同時(shí),CBN模型可以使用CBAM模塊來(lái)分析模型的決策過(guò)程,提高模型的解釋性。
3.2 模型實(shí)驗(yàn)和對(duì)比分析
3.2.1 實(shí)驗(yàn)數(shù)據(jù)集設(shè)計(jì)
在這項(xiàng)研究中,選擇了Netflix Prize Dataset數(shù)據(jù)集作為實(shí)驗(yàn)主數(shù)據(jù)集,另外使用了MovieLens數(shù)據(jù)集大量用戶對(duì)電影的評(píng)價(jià)信息以及TikTok數(shù)據(jù)集中的短視頻數(shù)據(jù)。此數(shù)據(jù)集一共包含了2 120 000多個(gè)視頻,篩選了目前最火的3種不同的視頻類別,每個(gè)視頻都被分成了多個(gè)幀,每幀的圖像分辨率為112×112。為了提升實(shí)驗(yàn)的有效性,特意分割選取代表性的3種數(shù)據(jù)集,分別是電影類、游戲類、音樂(lè)類,且數(shù)據(jù)集中包含實(shí)驗(yàn)需要的評(píng)分?jǐn)?shù)據(jù),具體如表1所示。
3.2.2 評(píng)價(jià)指標(biāo)
實(shí)驗(yàn)的最終目的是驗(yàn)證模型的有效性和優(yōu)越性,本實(shí)驗(yàn)主要以離線評(píng)估的方法從模型對(duì)比、基于評(píng)分準(zhǔn)確度和基于預(yù)測(cè)準(zhǔn)確度方面分別對(duì)提出的CBN模型進(jìn)行對(duì)比和分析[7]。其中,基于評(píng)分準(zhǔn)確度評(píng)價(jià)采用的評(píng)價(jià)指標(biāo)包括平均絕對(duì)誤差MAE和均方根誤差RMSE,精度、召回率、F1值等作為評(píng)測(cè)方法。
3.2.3 實(shí)驗(yàn)與分析
3.2.3.1 橫向?qū)Ρ?/p>
為了評(píng)估CBN模型的改進(jìn)效果,通過(guò)模型比較分析的方式,在具有代表性的推薦模型中擇優(yōu)選擇三種模型開(kāi)展對(duì)比,所參考的衡量參數(shù)為模型中是否采用了評(píng)論數(shù)據(jù)、深度學(xué)習(xí)技術(shù)以及注意力機(jī)制等。
通過(guò)對(duì)比,LAD、NARRE、NeuMF及本文提出的CBN模型都能兼顧神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法,但本文提出的CBN模型在考慮評(píng)論數(shù)據(jù)的同時(shí),能夠引入注意力機(jī)制,實(shí)現(xiàn)更好的評(píng)論數(shù)據(jù)的融合。除此之外,本文把提出的CBN以上三個(gè)模型,在準(zhǔn)備的實(shí)驗(yàn)數(shù)據(jù)集中分別進(jìn)行MSE實(shí)驗(yàn)與分析,從而驗(yàn)證CBN模型的優(yōu)越性。
另外,從數(shù)據(jù)集中隨機(jī)選擇數(shù)據(jù)進(jìn)行對(duì)比,進(jìn)行RMSE和MAE分析,本文提出的CBN模型無(wú)論從RMSE還是MAE數(shù)值上分析,效果均比傳統(tǒng)的LAD、NARRE等推薦模型具有優(yōu)勢(shì)。
3.2.3.2 縱向?qū)Ρ?/p>
對(duì)于新的短視頻推薦模型的實(shí)驗(yàn)和結(jié)果分析,首先進(jìn)行數(shù)據(jù)集選擇和預(yù)處理,其次使用數(shù)據(jù)集進(jìn)行模型的訓(xùn)練和評(píng)估。根據(jù)推薦系統(tǒng)的特點(diǎn),選擇合適的評(píng)估指標(biāo)來(lái)衡量推薦模型的性能,常用的指標(biāo)包括準(zhǔn)確率、F1值、AUC等。最后,分析評(píng)估指標(biāo)的結(jié)果,了解推薦模型的性能,根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行模型的調(diào)優(yōu)。本研究將實(shí)驗(yàn)數(shù)據(jù)集隨機(jī)分為訓(xùn)練集和測(cè)試集,實(shí)驗(yàn)結(jié)果如表2所示。
從表2可以看出,本研究提出的算法在Netflix Prize Dataset數(shù)據(jù)集上取得了不錯(cuò)的性能,精度為0.8070,F(xiàn)1-score為0.7538,AUC為0.8247,說(shuō)明該算法具有一定的推薦準(zhǔn)確性。CNN模型通過(guò)引入CBAM模塊,能夠增強(qiáng)模型對(duì)于用戶和商品特征的建模能力,尤其是可以自適應(yīng)地控制不同特征的權(quán)重,以便更好地捕捉不同特征之間的依賴性。同時(shí),CBN模型可以使用CBAM模塊來(lái)分析模型的決策過(guò)程,提高模型的解釋性。
通過(guò)以上實(shí)驗(yàn)和分析,可以深入了解新的短視頻推薦模型的性能和效果,幫助優(yōu)化算法和改進(jìn)推薦系統(tǒng),提供更好的推薦服務(wù)。
4 結(jié)論
4.1 短視頻推薦方法在實(shí)際應(yīng)用中的潛在價(jià)值
短視頻推薦方法在實(shí)際應(yīng)用中有很大的潛在價(jià)值。通過(guò)短視頻推薦方法,能夠根據(jù)用戶的興趣和偏好,為其提供更加個(gè)性化的推薦內(nèi)容,可以幫助用戶節(jié)省瀏覽時(shí)間,提高用戶滿意度。短視頻推薦方法能夠根據(jù)用戶的行為和歷史記錄,智能地將精彩的短視頻推薦給用戶,這有助于提高短視頻的曝光度和播放量,幫助視頻創(chuàng)作者獲得更多的曝光和關(guān)注。短視頻推薦方法可以將廣告內(nèi)容推薦給用戶,增加點(diǎn)擊率。個(gè)性化短視頻推薦能夠滿足用戶的多樣化需求,提供更多感興趣的內(nèi)容,從而增加用戶對(duì)平臺(tái)的黏性和留存率。通過(guò)短視頻推薦方法,平臺(tái)可以收集用戶的行為數(shù)據(jù)和反饋信息。這些數(shù)據(jù)可以用于用戶畫像的建立、用戶興趣的分析以及市場(chǎng)趨勢(shì)的洞察等,為平臺(tái)的運(yùn)營(yíng)決策提供參考。需要注意的是,短視頻推薦方法也面臨一些挑戰(zhàn),如數(shù)據(jù)稀疏性、冷啟動(dòng)問(wèn)題、算法解釋性等。但隨著技術(shù)的不斷發(fā)展,這些問(wèn)題有望得到更好的解決,釋放出更大的潛在價(jià)值。
4.2 未來(lái)研究方向和挑戰(zhàn)
隨著技術(shù)的進(jìn)步和應(yīng)用場(chǎng)景的不斷推進(jìn),短視頻推薦方法將有更大的發(fā)展空間和潛力,但未來(lái)短視頻推薦方法的研究也面臨很多挑戰(zhàn)。在短視頻推薦中,一方面,用戶個(gè)人隱私的保護(hù)和數(shù)據(jù)安全是一個(gè)重要問(wèn)題,未來(lái)的研究應(yīng)關(guān)注如何在保護(hù)用戶隱私的同時(shí),提高推薦的效果。另外,隨著短視頻平臺(tái)的發(fā)展和用戶行為的多樣性,短視頻推薦也需要考慮不同平臺(tái)之間的推薦問(wèn)題,進(jìn)行跨平臺(tái)的個(gè)性化推薦。短視頻平臺(tái)具有強(qiáng)烈的社交屬性,用戶之間的關(guān)系對(duì)于推薦效果的影響不容忽視。未來(lái)的研究可以探索如何利用社交關(guān)系來(lái)提高短視頻推薦的準(zhǔn)確性和用戶滿意度。
參考文獻(xiàn):
[1] MONDAL R,SRIVASTAVA P.Fuzzy utility matrix-based intelligent decision-making model and its application to diet recommendation system for metabolic disorder patients[J].International Journal of Fuzzy System Applications,2022,11(1):1-22.
[2] 王強(qiáng).基于時(shí)空軌跡的快件送達(dá)時(shí)間預(yù)測(cè)方法研究[D].北京:北京交通大學(xué),2021.
[3] 張潤(rùn)蓮,張瑞,武小年,等.基于混合相似度和差分隱私的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)應(yīng)用研究,2021,38(8):2334-2339.
[4] 高宸,李勇,金德鵬.基于圖神經(jīng)網(wǎng)絡(luò)的視頻推薦系統(tǒng)[J].中興通訊技術(shù),2021,27(1):27-32.
[5] WU F Y,LYU C,LIU Y.A personalized recommendation system for multi-modal transportation systems[J].Multimodal Transportation,2022,1(2):100016.
[6] 彭宇,寧慧,張汝波.基于改進(jìn)的LFM算法的短視頻推薦系統(tǒng)的研究與實(shí)現(xiàn)[J].應(yīng)用科技,2022,49(3):64-68.
[7] 劉端陽(yáng).基于深度觀看興趣網(wǎng)絡(luò)的視頻推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2021.
【通聯(lián)編輯:代影】