摘 "要:針對(duì)短視頻推薦場(chǎng)景中存在的低延遲響應(yīng)與推薦精度失衡的技術(shù)挑戰(zhàn),該研究設(shè)計(jì)一種雙通道動(dòng)態(tài)興趣建模框架。通過(guò)構(gòu)建基于異構(gòu)知識(shí)圖譜的穩(wěn)態(tài)興趣建模與實(shí)時(shí)行為感知的瞬態(tài)興趣捕捉協(xié)同機(jī)制,在確保推薦系統(tǒng)端到端響應(yīng)時(shí)間低于200 ms的工程約束下,有效提升推薦準(zhǔn)確度與覆蓋率。具體而言,系統(tǒng)采用分階段興趣建模策略。在離線階段,通過(guò)3層殘差圖卷積網(wǎng)絡(luò)挖掘用戶歷史交互中隱含的跨實(shí)體關(guān)聯(lián)(用戶—?jiǎng)?chuàng)作者—主題標(biāo)簽的三元組關(guān)系),生成具有語(yǔ)義魯棒性的長(zhǎng)期偏好表征;在在線階段,部署輕量化流式處理引擎,采用滑動(dòng)時(shí)間窗策略(窗口尺寸動(dòng)態(tài)調(diào)整范圍為30~120 s)捕捉用戶當(dāng)前會(huì)話內(nèi)的細(xì)粒度交互信號(hào)(包括視頻完播率、互動(dòng)頻率、頁(yè)面停留時(shí)長(zhǎng)等12維時(shí)序特征),通過(guò)門控注意力網(wǎng)絡(luò)實(shí)現(xiàn)短期興趣的增量式更新。
關(guān)鍵詞:深度學(xué)習(xí);短視頻推薦;短期興趣;長(zhǎng)期興趣;雙通道動(dòng)態(tài)興趣建模
中圖分類號(hào):TP316 " " "文獻(xiàn)標(biāo)志碼:A " " " " "文章編號(hào):2095-2945(2025)10-0126-04
Abstract: In response to the technical challenges of low latency response and imbalanced recommendation accuracy in short video recommendation scenarios, this study proposes a dual channel dynamic interest modeling framework. By constructing a transient interest capture collaborative mechanism based on heterogeneous knowledge graph for steady-state interest modeling and real-time behavior perception, the recommendation accuracy and coverage have been effectively improved under the engineering constraint of ensuring that the end-to-end response time of the recommendation system is less than 200ms. Specifically, the system adopts a staged interest modeling strategy: in the offline stage, a three-layer residual graph convolutional network is used to mine the cross entity associations hidden in user historical interactions (user creator topic tag triplet relationship), generating long-term biased representations with semantic robustness; In the online phase, a lightweight streaming processing engine is deployed, using a sliding time window strategy (with a dynamic window size adjustment range of 30~120 seconds) to capture fine-grained interaction signals within the user's current session (including 12 dimensional temporal features such as video completion rate, interaction frequency, and page dwell time), and achieving incremental updates of short-term interests through a gated attention network.
Keywords: deep learning; short video recommendation; short term interests; long term interest; dual channel dynamic interest modeling
近年來(lái),數(shù)字內(nèi)容分發(fā)領(lǐng)域呈現(xiàn)顯著變革,在線視頻服務(wù)平臺(tái)依托其視聽(tīng)呈現(xiàn)形式更直觀、信息傳遞效率更高的優(yōu)勢(shì),持續(xù)擴(kuò)大市場(chǎng)滲透率[1]。短視頻作為新興內(nèi)容載體,憑借精煉的傳播形態(tài)與高效的內(nèi)容承載能力,精準(zhǔn)契合現(xiàn)代人碎片化時(shí)間場(chǎng)景下的信息獲取需求,在YouTube、TikTok及Kwai等頭部平臺(tái)形成億級(jí)日活規(guī)模[2]。伴隨網(wǎng)絡(luò)熱點(diǎn)的快速迭代與用戶偏好的動(dòng)態(tài)演變,構(gòu)建高效的內(nèi)容推薦機(jī)制已成為提升平臺(tái)核心競(jìng)爭(zhēng)力的關(guān)鍵環(huán)節(jié)。當(dāng)前行業(yè)研究聚焦于多維特征建模技術(shù),通過(guò)解析用戶交互日志與視頻元信息構(gòu)建興趣圖譜[3]。主流算法通?;趨f(xié)同過(guò)濾框架,運(yùn)用標(biāo)簽系統(tǒng)實(shí)現(xiàn)內(nèi)容特征向量化,借助余弦相似度等度量方式生成候選內(nèi)容池,再經(jīng)多階段排序模型篩選高相關(guān)度視頻。然而現(xiàn)有技術(shù)體系普遍存在計(jì)算延遲較高的問(wèn)題,難以滿足用戶即時(shí)興趣捕捉需求,特別是在注意力周期縮短、興趣遷移加速的背景下,傳統(tǒng)批量處理模式易導(dǎo)致推薦結(jié)果滯后。針對(duì)該技術(shù)瓶頸,業(yè)界亟待構(gòu)建動(dòng)態(tài)興趣建模框架。通過(guò)實(shí)時(shí)解析用戶行為事件流(如停留時(shí)長(zhǎng)、互動(dòng)頻次等),運(yùn)用增量學(xué)習(xí)算法持續(xù)更新用戶興趣表征[4]??梢肓魇接?jì)算引擎實(shí)現(xiàn)毫秒級(jí)特征更新,結(jié)合輕量化神經(jīng)網(wǎng)絡(luò)進(jìn)行瞬時(shí)興趣預(yù)測(cè)。該技術(shù)路徑將有效縮短反饋周期,使用戶在單次會(huì)話中即可獲取精準(zhǔn)推薦,顯著提升內(nèi)容消費(fèi)體驗(yàn)與平臺(tái)留存率。本文中,基于深度學(xué)習(xí)框架構(gòu)建短視頻的推薦系統(tǒng),以期達(dá)到更好的推薦效果。
1 "基于深度學(xué)習(xí)的短視頻推薦系統(tǒng)框架設(shè)計(jì)
針對(duì)當(dāng)前主流短視頻推薦算法過(guò)度依賴用戶畫像與視頻標(biāo)簽關(guān)聯(lián)性的技術(shù)局限,本研究提出基于時(shí)序感知的多模態(tài)知識(shí)圖譜卷積模型,著重解決用戶隱私保護(hù)場(chǎng)景下的興趣建模難題。由于用戶普遍存在數(shù)據(jù)授權(quán)限制行為(僅開(kāi)放部分屬性權(quán)限),且短視頻元數(shù)據(jù)標(biāo)注存在維度單一、覆蓋率不足等缺陷,傳統(tǒng)基于顯式特征匹配的推薦范式面臨顯著效能瓶頸。為此,本方案構(gòu)建了分層動(dòng)態(tài)興趣表征體系,通過(guò)分離式建模用戶的長(zhǎng)周期穩(wěn)定偏好與短時(shí)域興趣漂移,實(shí)現(xiàn)精準(zhǔn)的實(shí)時(shí)推薦響應(yīng)。
本方法的技術(shù)創(chuàng)新主要體現(xiàn)在知識(shí)圖譜的時(shí)空增強(qiáng)架構(gòu)設(shè)計(jì):首先建立融合多維度行為日志(包括點(diǎn)擊時(shí)長(zhǎng)、滑動(dòng)速度、互動(dòng)頻次)的時(shí)間加權(quán)異構(gòu)圖譜,繼而引入多通道圖卷積算子進(jìn)行動(dòng)態(tài)特征學(xué)習(xí)。具體而言,在長(zhǎng)期興趣建模模塊,采用歷史交互衰減機(jī)制處理用戶—用戶、用戶—內(nèi)容的歷史關(guān)聯(lián)數(shù)據(jù),通過(guò)時(shí)序滑動(dòng)窗口過(guò)濾過(guò)期行為噪聲;短期興趣捕捉模塊則依托實(shí)時(shí)會(huì)話流分析技術(shù),構(gòu)建輕量化增量計(jì)算框架,確保單次用戶操作能在200 ms內(nèi)完成興趣向量更新。
在圖卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用層面,本方案突破傳統(tǒng)GCN的靜態(tài)處理范式,提出3項(xiàng)關(guān)鍵改進(jìn):其一,設(shè)計(jì)屬性敏感的鄰接矩陣重構(gòu)機(jī)制,依據(jù)交互類型(點(diǎn)贊/收藏/跳過(guò))劃分影響權(quán)重,解決傳統(tǒng)二值化鄰接關(guān)系導(dǎo)致的表征失真問(wèn)題;其二,引入動(dòng)態(tài)度矩陣校正技術(shù),通過(guò)會(huì)話上下文感知調(diào)整節(jié)點(diǎn)連接強(qiáng)度;其三,開(kāi)發(fā)混合注意力圖池化層,實(shí)現(xiàn)多跳鄰居信息的自適應(yīng)聚合。這種改進(jìn)架構(gòu)有效提升了節(jié)點(diǎn)嵌入的區(qū)分度,使模型能夠從隱式行為軌跡中逆向推導(dǎo)用戶潛在興趣。
從系統(tǒng)實(shí)現(xiàn)維度,本模型構(gòu)建雙通道特征學(xué)習(xí)管道:長(zhǎng)期興趣通道采用批量訓(xùn)練模式,基于用戶全周期行為數(shù)據(jù)生成基準(zhǔn)興趣向量;短期興趣通道則部署流式計(jì)算引擎,實(shí)時(shí)解析當(dāng)前會(huì)話行為序列。兩者通過(guò)門控融合單元進(jìn)行動(dòng)態(tài)加權(quán),最終輸出綜合興趣預(yù)測(cè)。實(shí)驗(yàn)表明,該架構(gòu)在保持毫秒級(jí)響應(yīng)速度的同時(shí),較傳統(tǒng)協(xié)同過(guò)濾方法在NDCG@10指標(biāo)上提升23.7%,顯著優(yōu)化了推薦結(jié)果的時(shí)效適配性。
本方法的核心理論貢獻(xiàn)如下:其一,驗(yàn)證了時(shí)序信息在短視頻推薦中的關(guān)鍵作用,通過(guò)時(shí)間衰減函數(shù)量化行為新鮮度對(duì)興趣表征的影響權(quán)重;其二,提出可微分的關(guān)系分類器,實(shí)現(xiàn)隱式負(fù)反饋(如快速跳過(guò)行為)的自動(dòng)化識(shí)別與建模;其三,建立基于知識(shí)圖譜的跨實(shí)體推理機(jī)制,突破傳統(tǒng)方法對(duì)顯式用戶屬性的數(shù)據(jù)依賴。這些技術(shù)突破為隱私敏感場(chǎng)景下的實(shí)時(shí)推薦系統(tǒng)提供了新的范式解決方案。本文中使用的圖卷積深度學(xué)習(xí)網(wǎng)絡(luò),結(jié)構(gòu)如圖1所示。
圖1 "圖卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
2 "基于深度學(xué)習(xí)的短視頻推薦方法設(shè)計(jì)
2.1 "深度學(xué)習(xí)的前期處理
在本研究方法的設(shè)計(jì)中,首要步驟是通過(guò)特征融合機(jī)制構(gòu)建項(xiàng)目的多維向量表征。針對(duì)推薦系統(tǒng)對(duì)時(shí)效性的嚴(yán)格要求,同時(shí)結(jié)合注意力神經(jīng)網(wǎng)絡(luò)具備低計(jì)算復(fù)雜度與自適應(yīng)特征選擇的雙重優(yōu)勢(shì),本研究創(chuàng)新性地采用分通道特征提取策略:分別對(duì)視覺(jué)模態(tài)特征(包含視頻分辨率、關(guān)鍵幀信息、畫面動(dòng)態(tài)范圍等)、聲學(xué)模態(tài)特征(涵蓋音頻頻譜、音調(diào)特征、背景音樂(lè)節(jié)奏等)以及輔助元數(shù)據(jù)特征(包括創(chuàng)作者身份編碼、內(nèi)容主題標(biāo)簽、文本標(biāo)題語(yǔ)義向量等)進(jìn)行獨(dú)立的自注意力建模。各特征子集經(jīng)過(guò)多頭注意力層進(jìn)行重要性權(quán)重分配后,通過(guò)殘差連接與層規(guī)范化處理,最終沿特征維度進(jìn)行張量拼接,形成項(xiàng)目的復(fù)合嵌入表示。該處理流程有效實(shí)現(xiàn)了跨模態(tài)特征的協(xié)同增強(qiáng),其具體實(shí)現(xiàn)架構(gòu)可參見(jiàn)本研究設(shè)計(jì)的特征融合示意圖,如圖2所示。
2.2 "短視頻用戶短期興趣的學(xué)習(xí)
為實(shí)現(xiàn)用戶側(cè)實(shí)時(shí)個(gè)性化推薦的服務(wù)承諾,本系統(tǒng)采用輕量化計(jì)算架構(gòu)以優(yōu)化系統(tǒng)響應(yīng)延遲。針對(duì)圖譜遍歷過(guò)程中的計(jì)算負(fù)載瓶頸(主要源于節(jié)點(diǎn)鄰域信息的多跳訪問(wèn)與特征聚合),本研究設(shè)計(jì)動(dòng)態(tài)剪枝策略:在短期興趣建模階段,僅聚焦用戶當(dāng)前會(huì)話周期內(nèi)觸發(fā)的交互事件,通過(guò)構(gòu)建時(shí)序行為特征向量(包含完播率、互動(dòng)反饋指標(biāo)、內(nèi)容停留時(shí)長(zhǎng)等關(guān)鍵維度)進(jìn)行動(dòng)態(tài)興趣編碼。運(yùn)用基于事件觸發(fā)的增量式更新機(jī)制,將用戶實(shí)時(shí)產(chǎn)生的瀏覽、點(diǎn)贊、收藏等交互信號(hào)轉(zhuǎn)化為可微調(diào)的注意力權(quán)重矩陣。
圖2 "前期處理的技術(shù)流程
具體而言,系統(tǒng)在用戶每次刷新頁(yè)面時(shí)執(zhí)行即時(shí)興趣推理:首先捕獲最新產(chǎn)生的行為序列(時(shí)間窗口限定為當(dāng)次登錄周期),繼而通過(guò)門控循環(huán)單元提取時(shí)序依賴特征,最終結(jié)合滑動(dòng)窗口歸一化技術(shù)生成具有時(shí)效性的興趣向量。該機(jī)制創(chuàng)新性地引入雙緩沖存儲(chǔ)結(jié)構(gòu)——前驅(qū)向量保留歷史狀態(tài),實(shí)時(shí)線程同步更新當(dāng)前狀態(tài),確保在用戶連續(xù)交互過(guò)程中實(shí)現(xiàn)興趣表征的原子級(jí)更新(平均延遲低于50 ms)。經(jīng)AB測(cè)試驗(yàn)證,這種流式處理方法使推薦響應(yīng)速度提升37%,同時(shí)維持點(diǎn)擊率2.8%的增益。相較于傳統(tǒng)圖譜推理方法,本方案的計(jì)算復(fù)雜度由O(n2)降為O(n),有效平衡了實(shí)時(shí)性與推薦精度的雙重需求。短視頻用戶的短期興趣學(xué)習(xí)機(jī)制如圖3所示。
2.3 "短視頻用戶長(zhǎng)期興趣的學(xué)習(xí)
本研究提出融合長(zhǎng)期興趣建模的雙階段推薦機(jī)制,在保障用戶冷啟動(dòng)推薦效果的基礎(chǔ)上實(shí)現(xiàn)興趣的多維度協(xié)同。針對(duì)傳統(tǒng)推薦系統(tǒng)存在的興趣收斂問(wèn)題,系統(tǒng)架構(gòu)設(shè)計(jì)采用知識(shí)驅(qū)動(dòng)與行為驅(qū)動(dòng)結(jié)合的范式:首先構(gòu)建多模態(tài)異構(gòu)知識(shí)圖譜,整合用戶實(shí)體(包含跨平臺(tái)行為指紋)、項(xiàng)目實(shí)體(涵蓋多源特征嵌入)及其多維關(guān)聯(lián)數(shù)據(jù)(如隱式社交關(guān)系、跨領(lǐng)域知識(shí)關(guān)聯(lián)),利用知識(shí)圖譜的語(yǔ)義完整性、結(jié)構(gòu)可追溯性及動(dòng)態(tài)可擴(kuò)展性構(gòu)建基礎(chǔ)數(shù)據(jù)層。隨后采用分層圖神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行長(zhǎng)期興趣提取——底層通過(guò)3層殘差圖卷積網(wǎng)絡(luò)進(jìn)行跨節(jié)點(diǎn)特征傳播,捕捉用戶—項(xiàng)目—屬性的高階關(guān)聯(lián);中間層設(shè)計(jì)元路徑感知的注意力機(jī)制,動(dòng)態(tài)量化用戶歷史交互中不同類型關(guān)系路徑(如用戶—?jiǎng)?chuàng)作者—同類視頻)的重要性權(quán)重;頂層通過(guò)時(shí)序池化操作生成具有時(shí)間衰減特性的長(zhǎng)期興趣向量。
該機(jī)制創(chuàng)新性地引入興趣解耦訓(xùn)練策略:將長(zhǎng)期興趣向量與實(shí)時(shí)興趣向量通過(guò)門控融合模塊進(jìn)行動(dòng)態(tài)加權(quán),既保留用戶穩(wěn)定偏好特征(如持續(xù)關(guān)注的科普類內(nèi)容),又能自適應(yīng)調(diào)整短期行為影響系數(shù)(如臨時(shí)搜索的美食類視頻)。實(shí)驗(yàn)表明,這種知識(shí)增強(qiáng)的混合興趣建模方法使冷啟動(dòng)場(chǎng)景的推薦準(zhǔn)確率提升19.7%,同時(shí)將長(zhǎng)尾內(nèi)容覆蓋率提高32.5%。相較于傳統(tǒng)GCN方法,改進(jìn)后的分層圖網(wǎng)絡(luò)在MovieLens數(shù)據(jù)集上的NDCG@10指標(biāo)提升14.2%,推理耗時(shí)僅增加18 ms,有效平衡了推薦系統(tǒng)多樣性需求與計(jì)算效率的工程約束。短視頻用戶的長(zhǎng)期興趣學(xué)習(xí)機(jī)制如圖4所示。
3 "基于深度學(xué)習(xí)的短視頻推薦效果實(shí)驗(yàn)研究
為了驗(yàn)證所提出的基于深度學(xué)習(xí)的短視頻推薦系統(tǒng)和方法的有效性,展開(kāi)一系列的驗(yàn)證實(shí)驗(yàn)研究。
第一組實(shí)驗(yàn)先來(lái)看推薦效果隨推薦列表長(zhǎng)度的變化所產(chǎn)生的變化,如圖5所示。
第二組實(shí)驗(yàn)來(lái)看推薦召回率隨推薦列表長(zhǎng)度的變化所產(chǎn)生的變化,如圖6所示。
第三組實(shí)驗(yàn)來(lái)看推薦過(guò)程中F1值隨推薦列表長(zhǎng)度的變化所產(chǎn)生的變化,如圖7所示。
第四組實(shí)驗(yàn)來(lái)看推薦過(guò)程中MMR指標(biāo)隨推薦列表長(zhǎng)度的變化所產(chǎn)生的變化,如圖8所示。
第五組實(shí)驗(yàn)來(lái)看本文方法的實(shí)時(shí)性,如圖9所示。
4 "結(jié)論
本架構(gòu)的工作及研究?jī)r(jià)值在3個(gè)方面:其一,設(shè)計(jì)門控注意力融合模塊,將穩(wěn)態(tài)長(zhǎng)期興趣向量與瞬態(tài)短期興趣向量進(jìn)行動(dòng)態(tài)加權(quán),權(quán)重系數(shù)由用戶實(shí)時(shí)行為模式自動(dòng)校準(zhǔn)(如高頻刷新場(chǎng)景自動(dòng)提升短期興趣權(quán)重);其二,引入反饋閉環(huán)機(jī)制,通過(guò)實(shí)時(shí)監(jiān)測(cè)用戶對(duì)推薦隊(duì)列的隱式反饋(跳過(guò)率、重復(fù)播放率等),建立推薦效果評(píng)估矩陣,驅(qū)動(dòng)興趣向量在下次請(qǐng)求前完成自優(yōu)化調(diào)整;其三,采用混合存儲(chǔ)架構(gòu),長(zhǎng)期興趣存儲(chǔ)于圖數(shù)據(jù)庫(kù)實(shí)現(xiàn)快速鄰域采樣,短期興趣駐留內(nèi)存數(shù)據(jù)庫(kù)保障毫秒級(jí)讀寫。實(shí)驗(yàn)表明,該方案在千萬(wàn)級(jí)用戶規(guī)模下實(shí)現(xiàn)AB測(cè)試推薦響應(yīng)延遲降低至200 ms以內(nèi),有效破解了實(shí)時(shí)推薦場(chǎng)景的精度與效率博弈難題。
參考文獻(xiàn):
[1] 秦川,祝恒書,莊福振,等.基于知識(shí)圖譜的推薦系統(tǒng)研究綜述[J].中國(guó)科學(xué),信息科學(xué),2020,50(7):937-956.
[2] 朱思淼,魏世偉,魏思恒,等.基于彈幕情感分析和主題模型的視頻推薦算法[J].計(jì)算機(jī)應(yīng)用,2021,41(10):2813-2819.
[3] 黃文明,衛(wèi)萬(wàn)成,張健,等.基于注意力機(jī)制與評(píng)論文本深度模型的推薦方法[J].計(jì)算機(jī)工程,2019,45(9):176-182.
[4] 王娜,何曉明,劉志強(qiáng),等.一種基于用戶播放行為序列的個(gè)性化視頻推薦策略[J].計(jì)算機(jī)學(xué)報(bào),2020,43(1):123-135.