摘要:為解決短視頻行業(yè)蓬勃發(fā)展所帶來的“信息過載”問題,本文提出一種融合3D卷積神經(jīng)網(wǎng)絡(luò)(3DCNN)、長短時記憶網(wǎng)絡(luò)(LSTM)和負反饋機制的多維短視頻推薦模型。文中詳細闡述了模型的構(gòu)建流程,包括短視頻標簽與特征提取、用戶信息及行為數(shù)據(jù)的提取,以及利用負反饋機制開展視頻推薦的具體方法,并從數(shù)據(jù)處理、模型優(yōu)化和訓(xùn)練過程三個方面提出了優(yōu)化思路。該模型有望提升推薦的準確性和個性化程度,為后續(xù)實證分析和對比研究提供理論基礎(chǔ),推動短視頻推薦算法朝著更高效、更智能的方向發(fā)展。
關(guān)鍵詞:短視頻推薦;深度學(xué)習(xí);3D卷積神經(jīng)網(wǎng)絡(luò);LSTM;負反饋;個性化推薦
中圖分類號:TP18文獻標識碼:A
文章編號:1009-3044(2025)14-0025-04
0引言
《中國網(wǎng)絡(luò)視聽發(fā)展研究報告(2025)》(以下簡稱《報告》)數(shù)據(jù)顯示,截至2024年12月,我國短視頻用戶規(guī)模達到10.40億,使用率達93.8%,連續(xù)6年穩(wěn)居網(wǎng)絡(luò)視聽?wèi)?yīng)用細分領(lǐng)域榜首。作為最具吸引力的互聯(lián)網(wǎng)應(yīng)用之一,短視頻平臺憑借龐大的用戶基礎(chǔ)和豐富的短視頻內(nèi)容,貢獻了互聯(lián)網(wǎng)的主要流量增量和使用時長,不僅豐富了消費者的日常生活,也改變了他們的信息獲取方式和網(wǎng)絡(luò)消費行為,成為信息傳播的支柱性媒介。
《報告》提到,每日全國上線短視頻突破1.3億條,海量內(nèi)容如潮水般不斷涌入用戶視野。如此龐大的內(nèi)容產(chǎn)出與傳播,不可避免地加劇了“信息過載”難題。相關(guān)統(tǒng)計表明,每年全球因信息過載造成的直接或間接損失保守估計達6500億美元[1]。
海量信息與用戶個性化需求相互掣肘,推薦算法和個性化分發(fā)順勢誕生。當(dāng)用戶完成單條短視頻觀看后,推薦算法會根據(jù)多維度數(shù)據(jù)構(gòu)建的用戶畫像篩選匹配內(nèi)容。在短視頻行業(yè)持續(xù)擴張、內(nèi)容呈指數(shù)級增長的背景下,如何有效應(yīng)對“信息過載”,成為亟待解決的緊迫課題。文章借助深度學(xué)習(xí)算法構(gòu)建多維短視頻推薦模型,旨在快速推送契合用戶興趣偏好的新視頻,實現(xiàn)瀏覽過程的無縫銜接,提升信息獲取效率。
1短視頻推薦算法研究現(xiàn)狀
短視頻推薦算法發(fā)展經(jīng)歷了從基于簡單標簽匹配的初級方法,逐步演進到運用復(fù)雜的機器學(xué)習(xí)算法,并最終邁向多元化深度學(xué)習(xí)模型的構(gòu)建。本文概述部分相關(guān)推薦算法,并進行對比。
1.1基于內(nèi)容的推薦方法
基于內(nèi)容的推薦模式主要借助短視頻特征與用戶畫像實現(xiàn)精準推送。短視頻特征涵蓋人工添加的各類標簽數(shù)據(jù),用戶畫像則包括用戶屬性層面和用戶行為層面的數(shù)據(jù)?;趦?nèi)容的推薦方法通常通過自然語言處理和計算機視覺等技術(shù)提取視頻的多模態(tài)關(guān)鍵特征,進行匹配和推薦。
劉宇東等[2]參考用戶年齡、性別等信息,基于相似用戶的興趣偏好,構(gòu)建出一種融合多特征內(nèi)容相似度的個性化微博推薦模型。
1.2協(xié)同過濾推薦算法
協(xié)同過濾算法的核心思想在于假設(shè)具有相似興趣愛好的用戶,在面對新內(nèi)容時也會有相似的行為和評價。算法通過收集大量用戶對短視頻的行為數(shù)據(jù),構(gòu)建用戶與短視頻之間的關(guān)聯(lián)矩陣,訓(xùn)練出用戶興趣模型來推薦短視頻。
許智宏等[3]在傳統(tǒng)協(xié)同過濾算法中引入知識圖譜,運用路徑排序技術(shù)深入挖掘?qū)嶓w之間的關(guān)聯(lián),并將語義相似性計算融入其中,結(jié)合用戶行為的相似特征,實現(xiàn)視頻的精準推薦。何濤[4]采用超圖的雙向物質(zhì)擴散推薦算法,將用戶對標簽的興趣度及標簽對視頻的相關(guān)度進行內(nèi)積融合,并考慮用戶負反饋行為,獲得用戶對未交互視頻的預(yù)測評分。
1.3基于深度學(xué)習(xí)的推薦算法
深度學(xué)習(xí)具有強大的特征自動提取能力,能從海量、高維的短視頻數(shù)據(jù)和用戶行為數(shù)據(jù)中挖掘出隱藏的深層特征模式。其核心在于構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型,通過對大量數(shù)據(jù)的學(xué)習(xí),自動捕獲用戶與短視頻之間復(fù)雜關(guān)聯(lián)關(guān)系,已成為當(dāng)前的研究熱點。
徐繽榮[5]運用圖卷積神經(jīng)網(wǎng)絡(luò)方法,針對用戶長期與短期喜好建模分析,通過目標短視頻與用戶所瀏覽短視頻的特征計算兩者相似度及用戶對目標短視頻的喜好度,實現(xiàn)短視頻的智能推薦。馮勇[6]提出了一種用RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))模型將長短期興趣融合的實時短視頻推薦方法。
上述方法均具有各自的優(yōu)勢與局限,如表1所示。本文將在前人研究基礎(chǔ)上,開展基于深度學(xué)習(xí)的短視頻推薦模型構(gòu)建工作,該模型主要由三部分組成:3DCNN、LSTM和負反饋機制,如圖1所示。
2基于深度學(xué)習(xí)的短視頻個性化推薦模型構(gòu)建
2.1短視頻標簽和特征提取
短視頻標簽和特征提取利用視頻的文本信息(標題、描述、字幕等)、視覺信息(圖像、視頻幀)和音頻信息(聲音、語音、背景音樂等),通過融合多種模態(tài)特征,實現(xiàn)更準確、全面的標簽提取。3D卷積神經(jīng)網(wǎng)絡(luò)主要依靠卷積層、池化層及全連接層,實現(xiàn)對圖像特征的提取與轉(zhuǎn)換操作。
2.3通過負反饋進行視頻推薦
負反饋一方面能夠幫助快速過濾候選推薦列表中用戶不喜歡的視頻項目,縮小計算范圍;另一方面,可以明確指示用戶偏好,使推薦結(jié)果更加個性化。因此,用戶的“舉報”行為、“不感興趣”點擊行為、過短的瀏覽時間、較低的視頻關(guān)鍵指標(如完播率、點贊量、評論量、轉(zhuǎn)發(fā)量、關(guān)注量)、彈幕評論的情感分析等,均可作為負反饋。
1)預(yù)處理階段
將這些負反饋數(shù)據(jù)與上述的視頻特征提取及用戶行為數(shù)據(jù)分析進行關(guān)聯(lián),對數(shù)據(jù)進行歸一化等預(yù)處理操作。
2)訓(xùn)練階段
訓(xùn)練過程中,一方面在原有損失函數(shù)基礎(chǔ)上,加入針對負反饋的懲罰項,引入權(quán)重因子ω(ωgt;1),使調(diào)整后的損失函數(shù)更加關(guān)注負反饋樣本。假設(shè)原始損失函數(shù)為L0,針對負反饋單獨計算的損失為J,引入權(quán)重因子ω(ωgt;1)后,新的損失函數(shù)變?yōu)長1=L0+ω?J。由于ω大于1,負反饋帶來的損失被放大。另一方面,在梯度下降時,可將學(xué)習(xí)率α乘以系數(shù)β(βgt;1),以減少此類樣本的預(yù)測誤差。
3)預(yù)測階段
在將視頻特征和用戶行為輸入3D卷積和LSTM模型之前,先對負反饋信息進行編碼,轉(zhuǎn)化為特征向量F。然后將F與視頻的3D卷積特征A以及LSTM輸入的用戶行為特征O進行融合,得到新的特征向量G=[A;O;F],作為模型的輸入。這樣,模型在預(yù)測時能夠直接考慮負反饋對用戶偏好的影響。若某視頻的負反饋率較高,可在模型預(yù)測的喜好概率P上乘以調(diào)整因子γ(0lt;γlt;1),降低該視頻被推薦的可能性;也可以設(shè)定閾值θ,當(dāng)Plt;θ時,將該視頻從推薦列表中排除。
3基于深度學(xué)習(xí)的短視頻推薦模型的優(yōu)化建議
3.1數(shù)據(jù)處理方面
運用學(xué)習(xí)算法進行短視頻推薦時,既要保證數(shù)據(jù)量充足,又要確保收集渠道的合法性。數(shù)據(jù)收集過程中,務(wù)必向用戶明確告知數(shù)據(jù)的目的、范圍及使用方式,并取得用戶同意。涉及與合作伙伴、內(nèi)容提供商、廣告商的數(shù)據(jù)共享,以及使用公開數(shù)據(jù)時,均須嚴格遵守版權(quán)規(guī)定。
在數(shù)據(jù)處理環(huán)節(jié),首先應(yīng)采取數(shù)據(jù)脫敏措施,對敏感信息進行加密和變形,防止信息泄露;其次,應(yīng)構(gòu)建基于最小權(quán)限原則的嚴格訪問控制機制,杜絕越權(quán)訪問;第三,要建立隱私合規(guī)審查機制,全面把控數(shù)據(jù)收集、存儲、使用及共享等環(huán)節(jié);最后,應(yīng)定期開展審計,排查潛在風(fēng)險,筑牢隱私與數(shù)據(jù)安全防線。
3.2模型優(yōu)化方面
3.2.1模型結(jié)構(gòu)優(yōu)化
短視頻特征提取時,應(yīng)充分識別視頻中的關(guān)鍵物體和音頻特效,提升模型對各類短視頻數(shù)據(jù)的泛化能力。在3D卷積神經(jīng)網(wǎng)絡(luò)部分,可嘗試引入殘差連接或密集連接結(jié)構(gòu)。
殘差連接能夠幫助模型更好地捕捉長期依賴關(guān)系。例如,在分析用戶一段時間內(nèi)的連續(xù)觀看行為時,早期層提取的基礎(chǔ)特征可通過殘差連接直接傳遞至較深層,與后續(xù)提取的高級特征融合,促進模型更全面地理解用戶興趣的演變,從而提升推薦準確性。密集連接則能豐富特征的多樣性。例如,淺層可能提取視頻的基礎(chǔ)視覺特征,中層提取用戶的短期興趣特征,深層提取長期興趣特征。通過密集連接,這些特征得以充分交互,模型能夠從多維度綜合考量各種信息,精準捕捉用戶對不同短視頻的潛在喜好,進而為用戶推薦更貼合興趣的視頻內(nèi)容,提高推薦系統(tǒng)的召回率和精準度。
3.2.2負反饋優(yōu)化
負反饋優(yōu)化著重于進一步細化負反饋的類型和程度。以視頻觀看時長為例,觀看不足視頻時長10%視為強負反饋,10%至30%視為中等負反饋,依此類推。針對不同強度的負反饋,在損失函數(shù)中設(shè)置差異化權(quán)重,以強化模型對嚴重不感興趣內(nèi)容的學(xué)習(xí)。此外,應(yīng)定期分析負反饋數(shù)據(jù),挖掘其中的共性特征,并將這些特征作為額外輸入或約束條件融入模型,提高模型的負反饋處理能力。
3.3訓(xùn)練過程優(yōu)化
目前采用的3D卷積神經(jīng)網(wǎng)絡(luò)和LSTM算法均具備一定的自學(xué)習(xí)能力。為提升模型對數(shù)據(jù)特征的學(xué)習(xí)效果,常采用學(xué)習(xí)率衰減策略。訓(xùn)練初期,使用較大學(xué)習(xí)率以快速搜索較優(yōu)解區(qū)域;隨著訓(xùn)練進行,逐步減小學(xué)習(xí)率,使模型在最優(yōu)解附近精細調(diào)整參數(shù)。具體方法可采用階梯衰減(StepDecay)、指數(shù)衰減(Ex?ponentialDecay等,以提升訓(xùn)練效果與可操作性)或自適應(yīng)算法。(如Adam、RMSProp)此外,合理平衡批量大小與硬件資源至關(guān)重要,直接影響訓(xùn)練效率、穩(wěn)定性及硬件負載。對于超大模型或數(shù)據(jù)集,可將數(shù)據(jù)分割成多個小批次計算梯度,然后累加更新參數(shù),模擬大批量效果,同時控制顯存占用。
4結(jié)束語
本文提出了一種融合3D卷積神經(jīng)網(wǎng)絡(luò)、LSTM及負反饋機制的短視頻推薦模型,旨在解決精準推薦問題,避免“信息繭房”現(xiàn)象。3D卷積神經(jīng)網(wǎng)絡(luò)具備強大的時空特征提取能力,能夠有效捕捉短視頻中的動態(tài)場景與視覺信息,為精準推薦提供內(nèi)容基礎(chǔ)。LSTM擅長處理用戶行為序列,能夠深入學(xué)習(xí)用戶的長短期興趣模式,提升推薦的個性化程度,使推薦結(jié)果更貼合用戶需求。負反饋機制通過收集用戶跳過、快速關(guān)閉等負面反饋行為,使模型能夠及時調(diào)整推薦策略,減少不感興趣內(nèi)容的推送,進一步優(yōu)化推薦效果?;谠撃P停疚膹臄?shù)據(jù)處理、模型優(yōu)化和訓(xùn)練過程三個方面提出優(yōu)化建議。未來可在大規(guī)模真實短視頻平臺上驗證模型性能,并與其他深度學(xué)習(xí)推薦體系進行對比測試,以進一步完善和優(yōu)化該模型。
參考文獻:
[1]張海.面對海量信息帶來的認知過載,怎么辦[N].環(huán)球網(wǎng),2024-05-08(7).
[2]劉宇東,孫豪,蔣運承.融合內(nèi)容相似度與多特征計算的個性化微博推薦模型[J].計算機科學(xué),2020,47(10):97-101.
[3]許智宏,趙杏,董永峰,等.基于知識圖譜知識推理的視頻推薦算法[J].計算機工程與設(shè)計,2020,41(3):710-715.
[4]何濤.基于圖網(wǎng)絡(luò)和負反饋的視頻推薦系統(tǒng)研究與實現(xiàn)[D].南京:南京郵電大學(xué),2023.
[5]徐繽榮.基于深度學(xué)習(xí)的短視頻智能推薦算法技術(shù)[J].信息技術(shù),2024,48(2):143-147,153.
[6]馮勇,孫宇,徐紅艷,等.基于知識圖譜的短視頻實時推薦方法研究[J].遼寧大學(xué)學(xué)報(自然科學(xué)版),2023,50(4):302-311.
【通聯(lián)編輯:唐一東】