亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于膠囊網(wǎng)絡(luò)的交互式網(wǎng)絡(luò)電視視頻點(diǎn)播推薦模型

        2021-12-07 10:09:00高銘蔚桑楠楊茂林
        計(jì)算機(jī)應(yīng)用 2021年11期
        關(guān)鍵詞:注意力膠囊向量

        高銘蔚,桑楠,楊茂林

        (電子科技大學(xué)信息與軟件工程學(xué)院,成都 610054)

        0 引言

        隨著信息技術(shù)的高速發(fā)展以及互聯(lián)網(wǎng)的大規(guī)模普及,信息爆炸使人們進(jìn)入了信息過載時(shí)代。搜索引擎和推薦系統(tǒng)是解決信息過載的兩種主要技術(shù),前者需要使用者提供關(guān)鍵詞來獲取信息,而后者則通過分析使用者的歷史行為信息獲取其興趣偏好并主動(dòng)給用戶推薦其感興趣的信息[1]。近年來,推薦系統(tǒng)已經(jīng)廣泛應(yīng)用于各種互聯(lián)網(wǎng)平臺(tái),例如淘寶的商品推薦、今日頭條的新聞推薦、抖音的短視頻推薦等。

        當(dāng)前深度學(xué)習(xí)廣泛應(yīng)用于推薦系統(tǒng)領(lǐng)域,通過學(xué)習(xí)樣本數(shù)據(jù)的多種內(nèi)在規(guī)律和多維表示層次,實(shí)現(xiàn)自適應(yīng)的差異化信息推送和用戶的個(gè)性化服務(wù)。在交互式網(wǎng)絡(luò)電視(Internet Protocol Television,IPTV)應(yīng)用中,一個(gè)電視終端往往由多名家庭成員共享,不同成員的興趣偏好往往不同。因此,正確分析隱藏在同一終端ID 后的多成員興趣偏好是進(jìn)行IPTV 視頻點(diǎn)播個(gè)性化推薦的關(guān)鍵。

        經(jīng)典推薦算法通常對(duì)家庭組的視頻點(diǎn)播數(shù)據(jù)進(jìn)行統(tǒng)一建模,這種建模方法會(huì)使得推薦系統(tǒng)側(cè)重于家庭組整體的興趣偏好而難以滿足不同家庭成員的獨(dú)特興趣偏好。為此,本文提出了一種基于膠囊網(wǎng)絡(luò)的IPTV 視頻點(diǎn)播的推薦算法CapIPTV,以解決多用戶共享同一IPTV 終端的差異化推薦問題。首先,利用膠囊網(wǎng)絡(luò)對(duì)每個(gè)終端的歷史行為進(jìn)行聚類,將具有較高相似性的點(diǎn)播視頻聚集在一起,聚類后的多個(gè)結(jié)果表示終端背后不同匿名成員的多種類型興趣偏好。其次,根據(jù)多種興趣偏好為IPTV 終端召回多種類型的點(diǎn)播視頻以滿足不同家庭成員的需求。實(shí)驗(yàn)結(jié)果顯示,該策略可以更好地提取出每臺(tái)IPTV 終端背后多名家庭成員的興趣偏好,有效提升對(duì)IPTV視頻點(diǎn)播的推薦效果。

        本文的主要工作如下:

        1)提出了一種基于膠囊網(wǎng)絡(luò)的IPTV 視頻點(diǎn)播推薦模型,通過膠囊網(wǎng)絡(luò)提取不同家庭成員的興趣偏好,從而充分滿足多名成員的差異化需求;

        2)利用注意力機(jī)制動(dòng)態(tài)賦予不同興趣偏好以不同的注意力權(quán)重,使得感興趣程度更高的興趣偏好能夠獲得更多的曝光度。

        1 相關(guān)工作

        1.1 IPTV推薦算法

        推薦算法在電視領(lǐng)域的應(yīng)用最早由Das 等[2]開始。早期研究主要對(duì)經(jīng)典推薦算法加以改進(jìn),使其適應(yīng)電視視頻推薦的基本數(shù)據(jù)要求。Yu等[3]提出了一種針對(duì)多用戶共享的電視節(jié)目推薦算法,利用群組內(nèi)所有觀眾的偏好組合成一個(gè)群組的偏好,并采用平均策略為群組成員進(jìn)行推薦,從而提高群組整體的滿意度。Kim 等[4]提出了一種基于協(xié)同過濾的IPTV 個(gè)性化推薦算法,將觀看時(shí)長轉(zhuǎn)化為隱式評(píng)分。Shin 等[5]提出了一種混合多模式的推薦算法,結(jié)合基于分類的方法和基于關(guān)鍵字的方法,提出了一種基于關(guān)系的相似性度量,以提高分類內(nèi)容的評(píng)分精準(zhǔn)度。Teng等[6]提出了一種基于協(xié)同過濾的推薦相似度計(jì)算方法,利用評(píng)分、觀看和收藏三種用戶行為進(jìn)行歷史行為數(shù)據(jù)挖掘,以評(píng)估不同類型的行為與用戶興趣的關(guān)系。

        1.2 基于深度學(xué)習(xí)的推薦算法

        鑒于深度學(xué)習(xí)在計(jì)算機(jī)視覺和自然語言處理方面取得了顯著的應(yīng)用效果[7],研究者將深度學(xué)習(xí)技術(shù)廣泛應(yīng)用于推薦系 統(tǒng)[8]。Covington 等[9]在2016年構(gòu)建了基于深度學(xué)習(xí)的YouTube 個(gè)性化推薦系統(tǒng)并且提供了設(shè)計(jì)、迭代和維護(hù)大型復(fù)雜推薦系統(tǒng)的實(shí)踐經(jīng)驗(yàn)。Zhou 等[10]提出了DIN(Deep Interest Network)推薦模型,利用注意力機(jī)制學(xué)習(xí)用戶興趣偏好的表達(dá)形式,并在阿里巴巴的個(gè)性化廣告推薦系統(tǒng)中成功部署,取得了較好的效果。Xiao 等[11]提出了DMIN(Deep Multi-Interest Network)推薦模型,利用多頭自注意力機(jī)制提取用戶的多興趣偏好,從而提升點(diǎn)擊率預(yù)估效果。Tang 等[12]使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)用戶行為進(jìn)行建模并提供了一個(gè)統(tǒng)一而且靈活的網(wǎng)絡(luò)結(jié)構(gòu)。各種類型的深度模型已經(jīng)在推薦系統(tǒng)領(lǐng)域引起了廣泛的關(guān)注,如何利用全連接深度神經(jīng)網(wǎng)絡(luò)建模表示用戶物品交互數(shù)據(jù)受到了重點(diǎn)關(guān)注。其中,He 等[13]提出了NCF(Neural Collaborative Filtering),Guo 等[14]提出了DeepFM以及Xue等[15]提出了DMF(Deep Matrix Factorization)。

        1.3 膠囊網(wǎng)絡(luò)

        膠囊網(wǎng)絡(luò)是由Hinton 等[16]在2011 年首次提出的一種全新的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),其最初被用來改變卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和循環(huán)神經(jīng)網(wǎng) 絡(luò)(Recurrent Neural Network,RNN)的局限性。帶有轉(zhuǎn)化矩陣的膠囊網(wǎng)絡(luò)可以自動(dòng)學(xué)習(xí)到整體與部分之間的關(guān)系,從而作為一種層次結(jié)構(gòu)來對(duì)特征之間潛在的復(fù)雜關(guān)系進(jìn)行建模。膠囊網(wǎng)絡(luò)用一個(gè)向量來表示一個(gè)神經(jīng)元,一個(gè)膠囊就是一個(gè)向量。Sabour 等[17]提出用膠囊網(wǎng)絡(luò)的向量輸出代替CNN 的標(biāo)量輸出特征檢測器,用動(dòng)態(tài)路由協(xié)議代替最大池化,確保低層次特征可以選擇性地聚合成高層次特征。與CNN 的最大池化不同,膠囊網(wǎng)絡(luò)可以避免丟失待檢測部分在整個(gè)區(qū)域內(nèi)的精確位置信息。

        Li 等[18]將膠囊網(wǎng)絡(luò)引入推薦系統(tǒng)領(lǐng)域,提出了一種基于動(dòng)態(tài)路由機(jī)制的推薦算法模型MIND(Multi-Interest Network with Dynamic routing),利用膠囊網(wǎng)絡(luò)聚類用戶的歷史行為,從而獲取用戶對(duì)于不同類型商品的興趣。Li等[19]提出了一種基于雙向路由機(jī)制的情感膠囊網(wǎng)絡(luò)的用戶評(píng)分預(yù)測模型,該模型從用戶的評(píng)論數(shù)據(jù)中提取信息邏輯單元并判斷用戶對(duì)物品的情感,從而解釋用戶偏好。

        已有膠囊網(wǎng)絡(luò)研究還未充分考慮IPTV 視頻點(diǎn)播推薦背景下中如何通過多個(gè)興趣向量共同表示一個(gè)終端興趣偏好的問題。本文針對(duì)該問題,在多家庭成員共享同一終端的前提下,提出了基于膠囊網(wǎng)絡(luò)的IPTV視頻點(diǎn)播推薦算法。

        2 模型結(jié)構(gòu)

        2.1 問題闡述及相關(guān)定義

        本文重點(diǎn)關(guān)注IPTV 視頻點(diǎn)播場景下的推薦問題,相關(guān)問題和定義闡述如下:

        IPTV 視頻點(diǎn)播推薦系統(tǒng)的目標(biāo)是為每一個(gè)電視終端t∈T從數(shù)萬級(jí)的點(diǎn)播視頻池I中最終篩選出數(shù)十個(gè)可能感興趣的點(diǎn)播視頻i∈I。為了實(shí)現(xiàn)這個(gè)目標(biāo),推薦系統(tǒng)利用終端歷史行為數(shù)據(jù)It構(gòu)建推薦算法模型。

        為了能更好地闡述本文算法的模型,表1 給出了本文所用到的相關(guān)符號(hào)及其含義。

        表1 IPTV推薦模型符號(hào)定義Tab.1 Symbol definition for IPTV recommendation model

        定義1終端歷史行為數(shù)據(jù)It是終端與點(diǎn)播視頻的交互數(shù)據(jù),包括曝光、瀏覽、點(diǎn)擊、觀看、購買、收藏等多種不同類型的行為數(shù)據(jù)信息。

        定義2表示終端t所對(duì)應(yīng)的向量化表示,其中d表示單個(gè)興趣向量的維度大小,K表示一個(gè)終端興趣矩陣所對(duì)應(yīng)的興趣向量的個(gè)數(shù)。當(dāng)K=1 時(shí),表示僅使用一個(gè)興趣向量來表示一個(gè)終端。

        定義3ei∈Rd×1表示點(diǎn)播視頻i所對(duì)應(yīng)的向量化表示,其中d表示點(diǎn)播視頻向量的維度大小,點(diǎn)播視頻向量的維度大小與興趣向量的維度大小相同。

        本文的核心任務(wù)是訓(xùn)練一個(gè)函數(shù),可以通過輸入行為數(shù)據(jù)It,得到終端的興趣表示矩陣Vt。由于一個(gè)終端興趣具有多種不同類型的興趣偏好,因此一個(gè)終端的興趣表示矩陣Vt由多個(gè)不同的興趣向量組合而成。

        當(dāng)通過模型學(xué)習(xí)到終端t的興趣表示矩陣Vt和點(diǎn)播視頻i的表示向量ei之后,可以通過計(jì)算得到每一個(gè)終端興趣矩陣Vt的每一個(gè)興趣向量對(duì)于每一個(gè)點(diǎn)播視頻ei的評(píng)分。選取多個(gè)興趣向量的評(píng)分最大值作為終端興趣矩陣Vt對(duì)于點(diǎn)播視頻i的評(píng)分,這個(gè)評(píng)分可以反映出終端對(duì)于點(diǎn)播視頻的喜愛程度。通過對(duì)評(píng)分進(jìn)行排序,取前N個(gè)評(píng)分最高的點(diǎn)播視頻作為最終推薦結(jié)果。

        2.2 CapIPTV推薦模型框架

        如圖1 所示,CapIPTV 推薦模型結(jié)構(gòu)分別由嵌入層、用戶興趣生成層、全連接層、注意力層構(gòu)成,其核心是用戶興趣生成層,輸入是終端的歷史行為記錄,而輸出則是終端的興趣矩陣Vt和點(diǎn)播視頻的表示向量ei。

        圖1 CapIPTV推薦模型結(jié)構(gòu)Fig.1 Structure of CapIPTV recommendation model

        模型訓(xùn)練是為了得到終端的興趣向量和點(diǎn)播視頻的表示向量。模型部署時(shí)需要將訓(xùn)練得到的向量部署在服務(wù)器端,以便于及時(shí)響應(yīng)來自電視終端的推薦請(qǐng)求。

        2.3 嵌入層

        本文所提出的CapIPTV 模型的輸入是終端行為數(shù)據(jù),包括終端ID 和其點(diǎn)擊觀看過點(diǎn)播視頻ID。由于IPTV 推薦系統(tǒng)中包含數(shù)以萬計(jì)的點(diǎn)播視頻和終端,并且這些ID 特征具有高維度和稀疏性的特點(diǎn),因此可以利用推薦系統(tǒng)中常用的嵌入方法,將ID 特征轉(zhuǎn)化為低維度稠密特征向量,從而減少模型中參數(shù)量,加快模型的訓(xùn)練速度。對(duì)于點(diǎn)播視頻而言,其表示向量共享同一個(gè)嵌入空間,嵌入空間可以表示為E∈Rd×|N|,|N|表示點(diǎn)播視頻池的大小,d表示該嵌入空間的維度大小。

        2.4 用戶興趣生成層

        2.4.1 興趣矩陣

        為了學(xué)習(xí)到同一個(gè)IPTV 終端ID 背后多個(gè)家庭成員的興趣偏好,本文采用聚類算法將同一個(gè)終端的歷史交互點(diǎn)播視頻數(shù)據(jù)聚合成多個(gè)不同的類。同一個(gè)類中的點(diǎn)播視頻具有較高的相似度,不同類之間的點(diǎn)播視頻相似度較低,從而可以通過一個(gè)類來表示一種特定類型的興趣偏好。為此,本文設(shè)計(jì)了用戶興趣生成層,從終端的歷史交互點(diǎn)播視頻數(shù)據(jù)中提取多名家庭成員的不同興趣偏好。該層利用膠囊網(wǎng)絡(luò)強(qiáng)大的向量化特征表示能力以及基于動(dòng)態(tài)路由機(jī)制的特征整合能力,從終端的歷史行為數(shù)據(jù)中提取多名家庭成員的不同興趣偏好,以提升推薦準(zhǔn)確度。

        通過用戶興趣生成層所得到的興趣矩陣,其中每一個(gè)興趣向量都可以表示一種特定類型的興趣偏好。每一個(gè)終端對(duì)這種類型的興趣偏好的喜愛程度可以用興趣向量的模長大小表示。興趣向量的模越長,該向量所對(duì)應(yīng)的偏好出現(xiàn)的概率越高。為了實(shí)現(xiàn)這種特性,定義了一個(gè)膠囊網(wǎng)絡(luò)版的非線性激活函數(shù)squash。該函數(shù)將輸入向量的模長取值范圍壓縮到[0,1],確保短向量長度壓縮到接近0,而長向量長度壓縮到接近1,同時(shí)保持膠囊j總輸入向量sj與輸出向量uj方向相同。

        用戶興趣生成層的輸入最終會(huì)經(jīng)過一個(gè)非線性激活函數(shù)squash得到興趣矩陣。

        2.4.2 動(dòng)態(tài)路由機(jī)制

        本文設(shè)計(jì)了一個(gè)擁有兩層膠囊網(wǎng)絡(luò)的用戶興趣生成層,利用動(dòng)態(tài)路由機(jī)制從一個(gè)終端的歷史交互點(diǎn)播視頻數(shù)據(jù)中提取多名家庭成員的多興趣表達(dá)。第一層膠囊層的每一個(gè)輸出向量傳遞到合適的第二層膠囊層作為第二層膠囊的輸入,從而構(gòu)建出第一層膠囊與第二層膠囊之間的潛在關(guān)系。

        如圖2 所示,第一層膠囊網(wǎng)絡(luò)稱為終端膠囊層,第二層膠囊網(wǎng)絡(luò)稱為用戶膠囊層。當(dāng)輸入數(shù)據(jù)進(jìn)入終端膠囊層后,可以通過如算法1 所示的動(dòng)態(tài)路由算法計(jì)算出用戶膠囊層。在每次迭代中,給出一個(gè)終端膠囊i∈{1,2,…,m},其表示向量為,Nt表示終端膠囊ti的維度,可以得到用戶膠囊j∈{1,2,…,n},其表示向量為,Nu表示用戶膠囊uj的維度。

        圖2 用戶興趣生成層模型結(jié)構(gòu)Fig.2 Structure of user interest generation layer model

        對(duì)于用戶膠囊j而言,其輸出uj是其輸入sj通過壓縮激活函數(shù)squash 得到的,而輸入到用戶膠囊層的sj則是通過所有終端膠囊層作出的預(yù)測輸出向量加權(quán)和計(jì)算得到。

        cij是由動(dòng)態(tài)路由迭代過程所確定的耦合系數(shù),終端膠囊ti與用戶膠囊層中所有膠囊之間的耦合系數(shù)總和為1,表示終端膠囊ti與用戶膠囊uj之間的權(quán)重鏈接,耦合系數(shù)cij通過bij計(jì)算而得。

        2.5 全連接層

        為了提高模型的泛化能力,在用戶興趣生成層的后面加入了全連接層網(wǎng)絡(luò),并使用relu作為非線性激活函數(shù)。

        2.6 注意力層

        通過用戶興趣生成層,利用終端的歷史行為生成了多個(gè)用戶興趣膠囊,不同的興趣膠囊代表了終端不同類型的興趣偏好。利用用戶興趣膠囊表示終端對(duì)某種偏好的喜愛程度,在模型訓(xùn)練過程中,基于注意力機(jī)制設(shè)計(jì)了一個(gè)注意力層[10],利用目標(biāo)點(diǎn)播視頻從而動(dòng)態(tài)調(diào)節(jié)用戶膠囊層多個(gè)膠囊之間的權(quán)重。注意力層模型結(jié)構(gòu)如圖3所示。

        圖3 注意力層模型結(jié)構(gòu)Fig.3 Structure of attention layer model

        對(duì)于一個(gè)目標(biāo)點(diǎn)播視頻而言,可以得到多個(gè)興趣向量和這個(gè)目標(biāo)點(diǎn)播視頻的向量,通過計(jì)算出目標(biāo)點(diǎn)播視頻與每一個(gè)興趣向量的匹配程度,將終端的多個(gè)興趣偏好向量的加權(quán)和作為這個(gè)終端對(duì)于目標(biāo)點(diǎn)播視頻的終端表示向量。

        2.7 模型的訓(xùn)練和部署

        對(duì)于工業(yè)級(jí)推薦系統(tǒng)來說,模型的訓(xùn)練和部署是獨(dú)立的。隨著行為數(shù)據(jù)的不斷增長,推薦模型需要定時(shí)訓(xùn)練以更新模型內(nèi)部的參數(shù)。經(jīng)過訓(xùn)練后的模型會(huì)在線部署,以便于推薦請(qǐng)求訪問模型獲取最新推薦結(jié)果。

        2.7.1 模型訓(xùn)練

        當(dāng)?shù)玫矫總€(gè)終端的最終興趣向量vt和每個(gè)點(diǎn)播視頻的興趣向量ei后,通過計(jì)算得到某個(gè)終端t對(duì)于某個(gè)點(diǎn)播視頻i∈It的感興趣程度。

        模型的目標(biāo)函數(shù)是最大化感興趣程度P(i|t),即最小化損失函數(shù)loss。

        模型訓(xùn)練迭代過程中,將終端t的第n次交互點(diǎn)播視頻作為目標(biāo)點(diǎn)播視頻,利用終端的前n-1 次交互行為預(yù)測第n次交互行為。當(dāng)計(jì)算式(10)時(shí),使用點(diǎn)播視頻池中所有的點(diǎn)播視頻來計(jì)算會(huì)導(dǎo)致計(jì)算量過大,因此采用sample softmax 來訓(xùn)練模型[20]。

        2.7.2 模型部署

        通過訓(xùn)練優(yōu)化模型,提取點(diǎn)播視頻的隱向量以及每個(gè)終端的多種興趣偏好。每一種興趣偏好向量可以獨(dú)立使用最近鄰相似算法從點(diǎn)播視頻候選池中召回終端可能感興趣的點(diǎn)播視頻。那些與終端興趣向量相似度較高的點(diǎn)播視頻將會(huì)作為召回階段的結(jié)果,在輸入排序階段進(jìn)行排序。當(dāng)終端產(chǎn)生了新的行為記錄時(shí),可以通過定時(shí)訓(xùn)練模型更新終端的興趣向量。在檢索與興趣向量最匹配的點(diǎn)播視頻時(shí),使用Faiss[21]作為檢索工具。

        3 實(shí)驗(yàn)與結(jié)果分析

        3.1 數(shù)據(jù)集

        為了驗(yàn)證不同類型的數(shù)據(jù)集對(duì)算法模型性能的影響,本文分別選取MovieLens 公開數(shù)據(jù)集和某廣電系統(tǒng)的真實(shí)電視終端數(shù)據(jù)集IPTV來進(jìn)行實(shí)驗(yàn)。

        MovieLens 數(shù)據(jù)集是一個(gè)在推薦系統(tǒng)中廣泛使用的公開數(shù)據(jù)集,本文選取了MovieLens-20M 數(shù)據(jù)集,此數(shù)據(jù)集包含了13 多萬名用戶和2 萬余部電影,以及2000 多萬條觀影行為。選取至少觀看過20部電影的用戶以及至少被觀看過5次的電影,最終得到了13萬多用戶、1.8萬多電影,以及2000萬多觀影記錄。

        實(shí)際廣電網(wǎng)絡(luò)的IPTV 點(diǎn)播數(shù)據(jù)集包含用戶的曝光、瀏覽、點(diǎn)擊、觀看、購買等多種歷史交互行為。經(jīng)過常規(guī)清洗等操作,得到約64萬個(gè)終端、2萬點(diǎn)播視頻,以及2300萬用戶隱式行為的數(shù)據(jù)。兩個(gè)數(shù)據(jù)集的具體統(tǒng)計(jì)信息如表2所示。

        表2 實(shí)驗(yàn)數(shù)據(jù)集統(tǒng)計(jì)信息Tab.2 Statistics of experimental datasets

        在數(shù)據(jù)處理方面,將每個(gè)數(shù)據(jù)集的用戶按照8∶1∶1 的比例切分為訓(xùn)練用戶數(shù)據(jù)集、驗(yàn)證用戶數(shù)據(jù)集、測試用戶數(shù)據(jù)集,確保切分之后的各個(gè)數(shù)據(jù)集的用戶沒有交叉存在[22-23]。對(duì)于訓(xùn)練用戶數(shù)據(jù)集,采用留一法切分訓(xùn)練點(diǎn)播視頻和目標(biāo)點(diǎn)播視頻;對(duì)于驗(yàn)證用戶數(shù)據(jù)集和測試用戶數(shù)據(jù)集而言,按照8∶2的比例切分訓(xùn)練點(diǎn)播視頻和目標(biāo)點(diǎn)播視頻。

        3.2 評(píng)價(jià)指標(biāo)

        本文采用召回率(Recall)、命中率(HR)、歸一化折損累計(jì)增益(Normalized Discounted Cumulative Gain,NDCG)這三種評(píng)價(jià)指標(biāo)來衡量推薦算法模型的性能。

        Recall 反映推薦列表中用戶可能感興趣的點(diǎn)播視頻占測試集中有過交互行為的目標(biāo)點(diǎn)播視頻的比例大小。令Rt表示終端t的最終推薦列表,表示測試集中與終端t有過交互行為的目標(biāo)點(diǎn)播視頻列表,N表示推薦列表的大小(即:推薦列表中包含的點(diǎn)播視頻的數(shù)量)。對(duì)于推薦列表大小為N的測試用例,召回率定義為:

        HR 反映生成的推薦列表中是否含有測試集中的目標(biāo)點(diǎn)播視頻,命中率越高,表明推薦的效果越好。對(duì)于推薦列表大小為N的測試用例,命中率定義為:

        NDCG 是反映推薦列表中點(diǎn)播視頻位置的指標(biāo),用戶喜歡的點(diǎn)播視頻排在推薦列表中靠前的位置,則獲得的增益越大。其中,I(x)是一個(gè)指示函數(shù),當(dāng)x>0 時(shí),I(x)=1,反之為0。表示終端t的推薦列表中的第n個(gè)位置的推薦點(diǎn)播視頻。Z是一個(gè)常數(shù),其值為理想狀態(tài)下的DGC@N,對(duì)于推薦列表大小為N的測試用例,歸一化折損累計(jì)增益(NDCG)定義為:

        3.3 對(duì)比模型

        選取以下模型與本文CapIPTV模型進(jìn)行對(duì)比:

        1)ItemPop[24],非個(gè)性化推薦策略的基準(zhǔn)模型。該模型通過點(diǎn)播視頻的觀看次數(shù)來判斷其受歡迎的程度,并將熱門的點(diǎn)播視頻推薦給每一個(gè)終端。

        2)YouTube DNN[9],由谷歌在2016 年提出的應(yīng)用于視頻領(lǐng)域的推薦模型。該模型已經(jīng)在YouTube 上線部署并且取得了較好的效果,是成功將深度學(xué)習(xí)應(yīng)用于工業(yè)推薦系統(tǒng)的推薦模型之一。

        3)DIN[10],首次提出使用注意力機(jī)制對(duì)用戶歷史行為進(jìn)行建模,從而提取出用戶的興趣偏好。DIN 與CapIPTV 均使用注意力機(jī)制,不同的是DIN 直接對(duì)行為數(shù)據(jù)利用注意力機(jī)制進(jìn)行建模,而CapIPTV 首先從行為數(shù)據(jù)中提取出多種類型的興趣偏好,然后利用注意力機(jī)制對(duì)興趣偏好進(jìn)行建模。

        4)DMIN[11],阿里研究發(fā)現(xiàn)用戶在同一個(gè)時(shí)間點(diǎn)的興趣是多樣的,因此利用多頭自注意力機(jī)制提取用戶的多樣化興趣。DMIN 與CapIPTV 都是提取多種興趣偏好,不同的是DMIN 使用多頭自注意力機(jī)制,而CapIPTV使用膠囊網(wǎng)絡(luò)。

        5)MIND[18],面向天貓用戶的多興趣推薦模型。該模型提出了一種興趣轉(zhuǎn)化(Behavior-to-Interest,B2I)動(dòng)態(tài)路由,可以將用戶行為自適應(yīng)轉(zhuǎn)化為興趣表示向量。MIND 與CapIPTV均使用膠囊網(wǎng)絡(luò)提取多興趣,不同的是MIND 使用B2I動(dòng)態(tài)路由,而CapIPTV 使用CapsNet[17]所使用的原始動(dòng)態(tài)路由,并且CapIPTV 使用的注意力機(jī)制與MIND 所使用的自注意力機(jī)制也有所不同。

        3.4 實(shí)驗(yàn)參數(shù)分析

        CapIPTV 模型與其他五種對(duì)比模型所有的實(shí)驗(yàn)都是基于TensorFlow實(shí)現(xiàn),是在GEFORCE RTX 2080 Ti和內(nèi)存64 GB的服務(wù)器上進(jìn)行的。模型的超參數(shù)設(shè)置如表3所示。

        表3 模型超參數(shù)設(shè)置Tab.3 Hyperparameter setting of model

        3.4.1 訓(xùn)練時(shí)間開銷

        為了衡量本文所提出的模型與其他模型的復(fù)雜度,在相同參數(shù)設(shè)定的條件下,通過單次迭代訓(xùn)練所消耗的時(shí)間間接體現(xiàn)出模型的復(fù)雜度。

        如表4 所示,YouTube DNN 模型的時(shí)間開銷最小,從而反映出其模型結(jié)構(gòu)較為簡單;DIN 模型相較于YouTube DNN 模型增大了時(shí)間開銷,是因?yàn)槠湓黾恿俗⒁饬C(jī)制,使得模型結(jié)構(gòu)變復(fù)雜;DMIN 模型相較于DIN 模型而言,單次迭代所花費(fèi)的時(shí)間更多,是由于采用了更加復(fù)雜的多頭自注意力機(jī)制,其模型結(jié)構(gòu)更為復(fù)雜;MIND 模型的時(shí)間開銷最大,其引入了膠囊網(wǎng)絡(luò)并使用B2I 動(dòng)態(tài)路由,增加了模型的參數(shù)量;本文所提出的CapIPTV 模型使用原始的動(dòng)態(tài)路由協(xié)議,在保證模型精度的條件下,降低了模型的復(fù)雜度,減少了模型的訓(xùn)練時(shí)間。

        表4 不同模型單次迭代訓(xùn)練時(shí)間對(duì)比 單位:sTab.4 Training time comparison of different models in single iteration unit:s

        3.4.2 超參數(shù)選擇

        本文最重要的超參數(shù)是動(dòng)態(tài)路由機(jī)制的超參數(shù)。針對(duì)兩個(gè)數(shù)據(jù)集分別對(duì)比不同的參數(shù)設(shè)置并進(jìn)行分析,結(jié)果如表5所示。

        表5 不同參數(shù)K下的CapIPTV模型在MovieLens和IPTV數(shù)據(jù)集上的性能比較 單位:%Tab.5 Performance comparison of CapIPTV model with different parameter K on MovieLens and IPTV datasets unit:%

        根據(jù)表5 中的實(shí)驗(yàn)結(jié)果可以看出:對(duì)于MovieLens 數(shù)據(jù)集而言,當(dāng)CapIPTV模型的參數(shù)K為1時(shí),其召回率、命中率和歸一化折損累計(jì)增益明顯優(yōu)于參數(shù)K為其他值時(shí)的推薦效果。實(shí)驗(yàn)結(jié)果表明,MovieLens 數(shù)據(jù)集中大部分用戶的興趣偏好較為集中,未能表現(xiàn)出明顯的單用戶興趣多樣性,并且隨著參數(shù)K的增加,推薦效果明顯減弱。對(duì)于IPTV 數(shù)據(jù)集而言,當(dāng)CapIPTV 模型的參數(shù)K為4 時(shí),推薦效果明顯優(yōu)于參數(shù)K為其他值時(shí)的推薦效果。實(shí)驗(yàn)結(jié)果表明,本文所使用的IPTV 數(shù)據(jù)集中用戶呈現(xiàn)出明顯的興趣多樣性,并且K為4 時(shí),CapIPTV模型可以充分提取多種不同的興趣偏好,推薦效果最優(yōu)。

        根據(jù)表5的實(shí)驗(yàn)結(jié)果可以看出:CapIPTV模型對(duì)于用戶興趣多樣性明顯的數(shù)據(jù)集可以充分提取出多種不同類型的興趣偏好,即對(duì)于IPTV 推薦場景而言,本文所提出的模型可以更好地獲取那些共享同一個(gè)IPTV 終端的家庭組中的不同家庭成員的不同興趣偏好,從而更好地滿足每一位家庭成員的個(gè)性化推薦需求,提升IPTV推薦場景下的推薦效果。

        3.5 對(duì)比分析

        為了驗(yàn)證CapIPTV 模型的性能,本文設(shè)計(jì)了3 組對(duì)比實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析。

        3.5.1 公開數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對(duì)比

        第一組對(duì)比實(shí)驗(yàn)將CapIPTV 模型與其他五種對(duì)比模型在MovieLens 數(shù)據(jù)集上進(jìn)行比較來衡量推薦效果,表6 是對(duì)比實(shí)驗(yàn)的結(jié)果,可以驗(yàn)證CapIPTV 模型在通用推薦場景下的推薦效果。

        表6 六種推薦模型在MovieLens數(shù)據(jù)集上的性能比較 單位:%Tab.6 Performance comparison of 6 recommendation models on MovieLens dataset unit:%

        表6 顯示六種不同的推薦模型在公開數(shù)據(jù)集MovieLens上的推薦效果,可以從表6中看出:

        1)非個(gè)性化的推薦模型ItemPop 在各項(xiàng)指標(biāo)上均沒有其他5 種推薦模型效果好,這是因?yàn)榉莻€(gè)性化推薦并沒有考慮到不同終端之間的興趣差異性,對(duì)所有的終端使用相同的推薦列表,不能夠提供個(gè)性化推薦。

        2)YouTube DNN 模型僅優(yōu)于ItemPop模型,該模型利用深度學(xué)習(xí)挖掘用戶興趣,從而提升了推薦效果,說明深度學(xué)習(xí)確實(shí)可以有效提升推薦效果。

        3)DIN 模型在YouTube DNN 模型的基礎(chǔ)上增加了注意力機(jī)制,因而推薦效果獲得了提升,表明引入注意力機(jī)制有利于充分獲取用戶偏好。相較于DIN 模型直接對(duì)行為數(shù)據(jù)進(jìn)行建模,CapIPTV 模型首先從行為數(shù)據(jù)中提取出多種興趣偏好然后再進(jìn)行建模,從而可以獲得更好的推薦效果。

        4)DMIN模型引入多頭自注意力機(jī)制,充分提取用戶的興趣偏好,因而優(yōu)于YouTube DNN模型和DIN模型,說明多頭注意力機(jī)制可以有效提取用戶偏好。同樣是提取用戶偏好,與DMIN 模型不同,MIND 模型通過引入膠囊網(wǎng)絡(luò)提取用戶偏好,并取得了不錯(cuò)的效果,體現(xiàn)了膠囊網(wǎng)絡(luò)捕獲多興趣偏好的強(qiáng)大能力。

        5)對(duì)比本文所提出的CapIPTV 模型與其他模型可以看出,CapIPTV 模型在MovieLens 數(shù)據(jù)集的每一項(xiàng)指標(biāo)上均具有至少1 個(gè)百分點(diǎn)的提升,表明融合膠囊網(wǎng)絡(luò)和注意力機(jī)制是非常有必要的。

        3.5.2 真實(shí)廣電數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對(duì)比

        第二組實(shí)驗(yàn)將CapIPTV 模型與其他五種對(duì)比模型在IPTV數(shù)據(jù)集上進(jìn)行比較來衡量推薦效果,結(jié)果如表7所示,可以驗(yàn)證CapIPTV模型在特定場景下的推薦效果。

        表7 為6 種不同的推薦模型在IPTV 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,其整體趨勢與表6 所示結(jié)果相似,CapIPTV 模型均優(yōu)于其他模型,與同樣采用注意力機(jī)制的DIN 模型和同樣采用膠囊網(wǎng)絡(luò)的MIND 模型相比,融合了膠囊網(wǎng)絡(luò)與注意力機(jī)制的CapIPTV 推薦模型的Recall@50 分別提升了1.93 個(gè)百分點(diǎn)和1.07 個(gè)百分點(diǎn),HR@50 分別提升了3.01 個(gè)百分點(diǎn)和1.31 個(gè)百分點(diǎn),NDCG@50 分別提升了1.82 個(gè)百分點(diǎn)和0.8 個(gè)百分點(diǎn),這表明CapIPTV 模型可以較好提升IPTV 視頻點(diǎn)播推薦場景下的推薦效果。

        表7 六種推薦模型在IPTV數(shù)據(jù)集上的性能比較 單位:%Tab.7 Performance comparison of 6 recommendation models on IPTV dataset unit:%

        通過表6~7 可以進(jìn)一步得出,CapIPTV 模型無論在用戶興趣偏好比較集中的MovieLens數(shù)據(jù)集,還是在興趣偏好呈現(xiàn)出明顯多樣性的IPTV 數(shù)據(jù)集,都可以呈現(xiàn)出比較好的推薦效果。

        3.5.3 模型消融實(shí)驗(yàn)結(jié)果對(duì)比

        第三組對(duì)比實(shí)驗(yàn)針對(duì)CapIPTV 模型各個(gè)部分進(jìn)行消融實(shí)驗(yàn)[25],驗(yàn)證模型中主要組成部分的有效性。CapIPTV_1 表示去掉用戶興趣生成層,即不提取多興趣偏好,直接對(duì)行為數(shù)據(jù)進(jìn)行建模;CapIPTV_2 表示去掉模型中的注意力機(jī)制,使用men-pooling 操作融合多個(gè)興趣偏好;CapIPTV_3 表示去掉模型中的注意力機(jī)制,使用max-pooling 融合多個(gè)興趣偏好。各模型實(shí)驗(yàn)結(jié)果如表8所示。

        表8 CapIPTV模型的消融實(shí)驗(yàn)結(jié)果 單位:%Tab.8 Ablation experimental results of CapIPTV model unit:%

        CapIPTV 模型的消融實(shí)驗(yàn)結(jié)果如表8 所示,從表8 可以看出:

        1)CapIPTV 在各項(xiàng)指標(biāo)上均優(yōu)于CapIPTV_1,這表明引入膠囊網(wǎng)絡(luò)提取多樣性偏好信息有助于提升推薦準(zhǔn)確度。

        2)CapIPTV 在各項(xiàng)指標(biāo)上均優(yōu)于CapIPTV_2 和CapIPTV_3,表明引入注意力機(jī)制能夠有效地獲取多樣性偏好之間的隱含關(guān)系,從而提高IPTV視頻點(diǎn)播推薦的準(zhǔn)確性。

        4 結(jié)語

        針對(duì)IPTV 視頻點(diǎn)播推薦系統(tǒng)中一個(gè)電視終端由多名家庭成員共享的應(yīng)用特點(diǎn),本文提出了一種提取家庭組成員多類型興趣偏好的推薦算法CapIPTV。該模型融合了膠囊網(wǎng)絡(luò)與注意力機(jī)制,對(duì)歷史行為數(shù)據(jù)進(jìn)行多層次建模,有助于生成更加精確的推薦結(jié)果。通過在公開數(shù)據(jù)集MovieLens 和廣電系統(tǒng)真實(shí)數(shù)據(jù)集IPTV 的實(shí)驗(yàn)結(jié)果表明,本文所提出的推薦算法在召回率、命中率和歸一化折損累計(jì)增益上均優(yōu)于五種同類算法。另外,本文還通過消融實(shí)驗(yàn)驗(yàn)證了模型中各組成部分的有效性。

        本文對(duì)于包含多名成員的群組推薦進(jìn)行了新的嘗試,通過獲取家庭群組中多名成員的多種類型興趣偏好豐富群組的興趣表達(dá)。未來研究將關(guān)注用戶興趣與觀影時(shí)刻的潛在關(guān)系,利用成員的不同觀影習(xí)慣調(diào)節(jié)不同時(shí)間點(diǎn)多興趣的權(quán)重以優(yōu)化推薦效果,從而進(jìn)一步提升推薦準(zhǔn)確性。

        猜你喜歡
        注意力膠囊向量
        膠囊可以打開吃嗎?
        Shugan Jieyu capsule (舒肝解郁膠囊) improve sleep and emotional disorder in coronavirus disease 2019 convalescence patients: a randomized,double-blind,placebo-controlled trial
        向量的分解
        讓注意力“飛”回來
        Shumian capsule(舒眠膠囊)improves symptoms of sleep mood disorder in convalescent patients of Corona Virus Disease 2019
        聚焦“向量與三角”創(chuàng)新題
        “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
        A Beautiful Way Of Looking At Things
        向量垂直在解析幾何中的應(yīng)用
        向量五種“變身” 玩轉(zhuǎn)圓錐曲線
        我把护士日出水了视频90分钟 | 日本高清视频www| 亚洲精品第一页国产精品| 亚洲成AV人片无码不卡| 国内偷拍精品一区二区| 岳丰满多毛的大隂户| 射死你天天日| 中文字幕第一页亚洲观看| 国成成人av一区二区三区| 精品无码一区二区三区的天堂| 亚洲日韩成人av无码网站| 亚洲A∨无码国产精品久久网| 青青草在线成人免费视频| 黄片视频免费在线观看国产| 97久久精品亚洲中文字幕无码| 亚洲免费av电影一区二区三区| 午夜精品人妻中字字幕| 蜜桃视频在线免费观看| 天堂aⅴ无码一区二区三区| 丝袜美女污污免费观看的网站| 激情免费视频一区二区三区| 久久久久99人妻一区二区三区| 亚洲精品无码成人片久久不卡| 毛片在线啊啊| 美腿丝袜日韩在线观看| 亚洲va国产va天堂va久久| 欧美自拍区| 色av色婷婷18人妻久久久| 亚洲欧洲av综合色无码| 色伦专区97中文字幕| 亚洲欧美日韩国产综合专区| 日本一级片一区二区三区| 啦啦啦中文在线观看日本| 亚洲免费视频播放| 人妻少妇激情久久综合| 亚洲va中文字幕无码一二三区 | 国产在线一区观看| 美女草逼视频免费播放| 国产精品午夜福利视频234区| 人妻妺妺窝人体色www聚色窝| 99热高清亚洲无码|