亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于知識增強的深度新聞推薦網(wǎng)絡(luò)

        2021-03-31 10:28:24劉瓊昕宋祥覃明帥
        北京理工大學(xué)學(xué)報 2021年3期
        關(guān)鍵詞:特征用戶信息

        劉瓊昕, 宋祥, 覃明帥

        (1.北京理工大學(xué) 計算機學(xué)院,北京 100081;2.北京市海量語言信息處理與云計算應(yīng)用工程技術(shù)研究中心,北京 100081)

        新聞平臺擁有大量的新聞信息,如果讓用戶直接選擇,那么會對用戶造成極大的選擇困擾.因此,構(gòu)建一個能夠捕獲用戶的閱讀興趣并推送相關(guān)信息的個性化推薦系統(tǒng)對于新聞平臺來說是至關(guān)重要的.在推薦系統(tǒng)中,主要有3類算法:基于內(nèi)容的方法、協(xié)同過濾和混合方法.由于協(xié)同過濾具有用戶和物品的交互信息是稀疏的特點且存在冷啟動問題,不適合新聞推薦場景,主流的新聞推薦方法通常是基于內(nèi)容或者混合方法.

        隨著深度學(xué)習(xí)技術(shù)的發(fā)展,一些研究人員開始利用深度學(xué)習(xí)模型來構(gòu)建新聞特征和用戶興趣特征.Steffen提出了基于特征的因子分解模型LibFM[1],該模型在矩陣分解(MF)[2]、SVD++[3]、PITF[4]、FPMC[5]等基礎(chǔ)之上,針對高維稀疏數(shù)據(jù),實現(xiàn)了隨機梯度下降(SGD)、交替最小二乘(ALS)[6]和使用MCMC進行貝葉斯推斷的方法[7].Cheng等[8]提出了推薦模型Wide&Deep,將邏輯回歸模型和前饋神經(jīng)網(wǎng)絡(luò)結(jié)合起來,既發(fā)揮邏輯回歸模型的優(yōu)勢,又利用前饋神經(jīng)網(wǎng)絡(luò)的自動特征組合學(xué)習(xí)和強泛化能力進行補充,對模型整體學(xué)習(xí),在Google Apps推薦的大規(guī)模數(shù)據(jù)上成功應(yīng)用.Guo等[9]在FM[10]、FFM[11]的基礎(chǔ)上進行改進,加入神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提出了深度推薦模型DeepFM.該模型通過加入多層的神經(jīng)網(wǎng)絡(luò),使得低階和高階特征組合隱含地體現(xiàn)在隱藏層中,解決之前模型只實現(xiàn)二階組合特征的缺陷;并通過FFM的思想,將特征分為不同的域(Filed),降低模型網(wǎng)絡(luò)參數(shù);模型設(shè)計了并行和串行結(jié)構(gòu),實現(xiàn)了高階的特征組合.

        現(xiàn)階段,基于新聞的推薦系統(tǒng)僅僅從語義層對新聞進行表示學(xué)習(xí),忽略了新聞本身包含的知識層面的信息.而知識層面的信息大部分都存在于知識圖譜中,將新聞推薦模型與知識圖譜相結(jié)合的相關(guān)研究還很少.Wang等[12]提出了融合知識圖譜信息的深度推薦模型DKN.DKN首先構(gòu)造了一個與任務(wù)高度相關(guān)的知識圖譜,接著在傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,將知識圖譜的實體信息融入到神經(jīng)網(wǎng)絡(luò)中,實現(xiàn)了把新聞的語義表示和實體的知識表示融合的目標(biāo).這種方法雖然考慮了不同層面上的信息,實驗證明比未添加實體信息的傳統(tǒng)方法效果好,但是用知識表示學(xué)習(xí)模型單獨生成的實體向量更適合用于鏈接預(yù)測等任務(wù),直接用在推薦模型中會丟失新聞實體之間的聯(lián)系,造成一定程度的信息丟失.

        現(xiàn)有的深度新聞推薦網(wǎng)絡(luò)模型對知識圖譜的融合只考慮實體本身的信息,融合知識圖譜的實體特征或者與實體距離為1的相鄰實體特征.這種方法雖然考慮了不同層面上的信息,補充了新聞實體信息,但是未考慮新聞實體之間的關(guān)聯(lián)關(guān)系[13],忽略了知識圖譜中遠距離實體之間的聯(lián)系,造成了新聞實體之間的關(guān)聯(lián)信息和深層次語義聯(lián)系的缺失.針對該信息缺失問題,本文提出了基于知識增強的深度新聞推薦網(wǎng)絡(luò)DKEN,補充新聞標(biāo)題實體之間的關(guān)聯(lián)信息,在構(gòu)建用戶興趣特征和預(yù)測點擊候選新聞概率中分別添加實體路徑特征[14],補充知識圖譜中遠距離實體之間的聯(lián)系,增強模型的表達能力.

        1 問題描述

        融合知識圖譜的深度新聞推薦網(wǎng)絡(luò)模型通過構(gòu)建新聞特征和用戶興趣特征對候選新聞進行推薦.模型定義如式(1)所示.

        p=f(u,v|θ,C,G)

        (1)

        模型的整體流程如圖1所示.在模型訓(xùn)練模塊,DKEN考慮了兩種向量:一種是實體和關(guān)系向量;一種是新聞標(biāo)題中的詞向量.實體和關(guān)系向量首先從新聞?wù)Z料中識別出實體,將其與知識圖譜中的實體相匹配,構(gòu)造出新的知識圖譜,利用知識表示學(xué)習(xí)模型得到實體和關(guān)系的向量表示.新聞標(biāo)題中的詞向量表示使用大規(guī)模語料通過詞嵌入方法得到.在模型測試模塊,基于訓(xùn)練得到的DKEN模型,預(yù)測用戶點擊候選新聞的概率.

        圖1 DKEN的整體流程

        2 模型描述

        2.1 模型架構(gòu)

        DKEN的整體框架如圖2所示,輸入是候選新聞標(biāo)題、用戶瀏覽過的新聞標(biāo)題以及候選新聞標(biāo)題與每個瀏覽過的新聞標(biāo)題之間的實體路徑,輸出是用戶點擊候選新聞標(biāo)題的概率.模型首先用基于知識感知的卷積神經(jīng)網(wǎng)絡(luò)(knowledge-aware convolutional neural network,KCNN)[12]融合新聞標(biāo)題的文本特征、實體特征和實體上下文特征,構(gòu)建候選新聞特征.然后,對于用戶瀏覽過的新聞標(biāo)題,考慮候選新聞特征,使用注意力網(wǎng)絡(luò)動態(tài)地構(gòu)建用戶的興趣特征.為了更好地刻畫用戶瀏覽過的新聞標(biāo)題與候選新聞標(biāo)題之間的遠距離聯(lián)系,論文額外考慮了兩者所包含實體之間的路徑信息,利用長短期記憶網(wǎng)絡(luò)構(gòu)建路徑特征.最終,以候選新聞特征、用戶的動態(tài)興趣特征和加權(quán)實體路徑特征為輸入,用多層感知機(MLP)得到用戶點擊候選新聞的概率,進而達到推薦目的.

        圖2 DKEN的整體結(jié)構(gòu)

        2.2 知識圖譜構(gòu)建

        為了在模型中利用知識圖譜的信息,本文首先構(gòu)建一個和任務(wù)高度相關(guān)的知識圖譜.首先從新聞標(biāo)題中識別出實體,本文采用Sil等[15]所提出的實體鏈接技術(shù),將新聞標(biāo)題中的單詞與知識庫中的實體進行匹配消歧.在處理完所有的新聞標(biāo)題后,得到一個新聞實體集合Enews.由于原始的知識圖譜規(guī)模較大,包含了大量與集合Enews中的實體無關(guān)的內(nèi)容,為了減少計算代價,本文根據(jù)集合Enews從原始的知識圖譜中抽取出一個子圖,子圖中剔除了那些不屬于集合Enews且不處于連通任意ei∈Enews的路徑上的結(jié)點和相應(yīng)的邊.接下來本采用知識表示學(xué)習(xí)方法,例如TransE[16]、TransH[17]、TransR[18]、TransD[19]等將知識圖譜子圖中的實體和關(guān)系映射到低維向量空間,得到實體和關(guān)系的特征向量,供后續(xù)的DKEN模型使用.

        2.3 新聞特征構(gòu)建

        本文構(gòu)建新聞特征采用與DKN模型相同的方法,即使用知識感知的卷積神經(jīng)網(wǎng)絡(luò)KCNN來提取新聞特征.該方法以Kim提出的TextCNN[20]為基礎(chǔ)模型,融合文本特征、實體特征和實體上下文特征來提取新聞特征.

        (2)

        2.4 實體路徑特征構(gòu)建

        (3)

        其中,⊕為連接運算符,將實體向量el與關(guān)系向量rl連接為一個2d維的向量xl,作為LSTM的第l個輸入,對于l=L的情況,用一個零向量填充缺失的關(guān)系向量.在LSTM中,每個單元的計算如式(4)~(9)所示.

        zl=tanh(Wzxl+Whhl-1+bz)

        (4)

        fl=σ(Wfxl+Whhl-1+bf)

        (5)

        il=σ(Wixl+Whhl-1+bi)

        (6)

        ol=σ(Woxl+Whhl-1+bo)

        (7)

        cl=fl·cl-1+il·zl

        (8)

        hl=oltanh(cl)

        (9)

        其中,cl∈Rd′、z∈Rd′分別為細胞狀態(tài)以及當(dāng)前細胞要更新的信息;d′為隱含層的單元數(shù)量,即狀態(tài)向量的維度;il、ol和fl分別代表輸入門、輸出門和遺忘門;Wz∈Rd′×3d、Wf∈Rd′×3d、Wi∈Rd′×3d、Wh∈Rd′×d′分別代表映射矩陣;bz、bf、bi和bo為偏置向量.σ為sigmoid激活函數(shù),為逐元素(element-wise)的乘法操作.最后一層輸出hl作為整個路徑的特征向量表示,用H來表示LSTM網(wǎng)絡(luò),即H(p)=hl.

        (10)

        2.5 用戶興趣特征構(gòu)建

        圖3 注意力網(wǎng)絡(luò)

        (11)

        用戶u的動態(tài)興趣特征qu的計算公式如式(12)所示.

        (12)

        2.6 預(yù)測點擊概率

        在預(yù)測用戶u是否會點擊候選新聞標(biāo)題tj時,本文提出的模型DKEN不僅考慮了用戶的動態(tài)興趣特征、候選新聞特征,還考慮了候選新聞標(biāo)題和用戶瀏覽過的新聞標(biāo)題的的加權(quán)路徑特征,通過多層感知機預(yù)測用戶點擊候選新聞的概率.

        候選新聞特征qt如式(2)所示,用戶u的動態(tài)興趣特征qu如式(12)所示,候選新聞標(biāo)題和用戶瀏覽過的新聞標(biāo)題的的加權(quán)路徑特征pu,tj的計算公式如式(13)所示.

        (13)

        最后,用一個多層感知機G來預(yù)測用戶u點擊候選新聞tj的概率,計算公式如式(14)所示.

        pu,tj=G(qu,qtj,pu,tj)

        (14)

        3 實驗結(jié)果和分析

        3.1 實驗設(shè)置

        本文采用的數(shù)據(jù)集與DKN相同,來自必應(yīng)新聞,其中每條記錄包含用戶ID、新聞標(biāo)題、用戶是否瀏覽以及時間戳等信息.訓(xùn)練集數(shù)據(jù)集來自2016年10月16日至2017年6月11日的新聞,測試集數(shù)據(jù)來自2017年6月12日至2017年8月11日的新聞.本文通過微軟的Satori知識圖譜數(shù)據(jù)庫信息,將新聞標(biāo)題中的單詞與知識庫中的實體進行匹配消歧,并同時獲得與實體一步可達的實體.表1和表2分別是提取的知識圖譜和新聞數(shù)據(jù)集的統(tǒng)計信息.

        表1 提取的知識圖譜的統(tǒng)計信息

        表2 新聞數(shù)據(jù)集的統(tǒng)計信息

        圖4和圖5分別是一條新聞標(biāo)題中單詞(去除停用詞)和實體的數(shù)目的分布.實驗中訓(xùn)練集和測試集都經(jīng)過采樣保證正負樣本的均衡,表3是訓(xùn)練集和測試集的統(tǒng)計信息.

        圖4 新聞標(biāo)題單詞數(shù)量分布

        圖5 新聞標(biāo)題實體數(shù)量分布

        表3 訓(xùn)練集和測試集的統(tǒng)計信息

        實驗的參數(shù)設(shè)置如下:word embeddings和entity embeddings的維度是100,KCNN中,窗口大小是1,2,3,4,每個窗口對應(yīng)的卷積核個數(shù)均是100.使用Adam[22]訓(xùn)練優(yōu)化模型.

        實驗對比的基準(zhǔn)方法如下.

        TextCNN:從新聞標(biāo)題的詞向量中提取文本特征作為新聞的向量表示,用戶特征用該用戶瀏覽過新聞的特征向量的均值來表示,用一個多層感知機基于用戶特征和候選新聞特征來預(yù)測用戶瀏覽新聞的概率.

        KPCNN[23]:在TextCNN的基礎(chǔ)上,引入單詞對應(yīng)的實體的向量,將其拼接在單詞的詞向量后面作為單詞的綜合向量.

        DKN:利用TextCNN從新聞的文本特征和實體特征中學(xué)習(xí)新聞的綜合特征,利用注意力網(wǎng)絡(luò)構(gòu)動態(tài)構(gòu)造用戶特征.

        Wide&Deep:一種通用的推薦模型,包含一個線性的wide通道和非線性的deep通道.

        LibFM:一個經(jīng)典的基于特征分解的CTR預(yù)估模型.

        3.2 實驗結(jié)果分析

        3.2.1基準(zhǔn)模型對比

        DKEN和各種基準(zhǔn)方法的實驗結(jié)果對比如表4所示,為了更方便的對比數(shù)據(jù),在AUC指標(biāo)上,將數(shù)值放大100倍后顯示.其中Wide&Deep*和LibFM*分別代表Wide&Deep和LibFM去掉實體向量輸入后的版本.

        表4 DKEN與基準(zhǔn)模型的實驗結(jié)果比較

        從表4中可以得出,LibFM的表現(xiàn)最差,一方面是因為LibFM模型本身結(jié)構(gòu)比較簡單,限制了表達能力;另一方面是因為LibFM需要人工從詞向量中構(gòu)造新聞的特征和用戶特征,人工很難構(gòu)造出最適合該模型的特征.除了LibFM,其他模型均為深度網(wǎng)絡(luò)模型,其中Wide&Deep是一種通用的推薦模型,應(yīng)用于本論文描述的新聞推薦問題時,同樣需要人工從詞向量中構(gòu)造新聞特征作為模型輸入,因此效果相對較差.Wide&Deep和LibFM在引入了實體向量作為額外輸入后,性能均得到了一定的提升.

        TextCNN、KPCNN、DKN、DKEN這4種模型均是基于CNN從原始的詞向量中提取新聞特征.其中TextCNN僅考慮新聞標(biāo)題文本的詞向量,KPCNN在TextCNN的基礎(chǔ)上,將單詞的對應(yīng)實體的向量拼接在每一個詞向量后面作為單詞的綜合向量,模型相對TextCNN有一點提升.DKN在TextCNN的基礎(chǔ)上,以多通道的形式融合了詞向量和實體向量,并對實體向量做了映射,這種方式與KPCNN直接拼接兩種向量的做法相比更加合理,另外還引入了注意力網(wǎng)絡(luò)來更好地構(gòu)造用戶特征,因此DKN與KPCNN相比有了更大的提升.本文提出的模型DKEN在DKN的基礎(chǔ)上引入路徑向量,在一定程度上彌補了實體向量的信息丟失,加強了注意力網(wǎng)絡(luò)的效果,與DKN 相比有了進一步的提升.

        3.2.2模型變體對比

        為了進一步說明DKEN中各種機制的效果,本文針對DKEN的各種變體進行了對比實驗,結(jié)果如表5所示.其中,DKEN without attention表示DKEN去除注意力網(wǎng)絡(luò)后的模型,DKEN without path embedding表示DKEN去除實體路徑向量后的模型,DKEN without context embedding表示DKEN去除實體上下文向量后的模型,DKEN without entity embedding表示DKEN 去除實體向量后的模型,DKEN without knowledge embedding表示DKEN去除了實體向量和實體上下文向量后的模型,DKEN without mapping表示DKEN去除了對實體向量的映射后的模型,DKEN+TransE、DKEN+TransH和DKEN+TransR中的實體向量分別通過TransE、TransH和TransR學(xué)習(xí)得到,其他情況下的DKEN默認采用TransD 學(xué)習(xí)實體向量.

        表5 DKEN變體直接的實驗結(jié)果比較

        從表5中可以得出如下結(jié)論.

        (1)實體路徑向量的引入使得模型性能得到了提升.對知識圖譜信息的融合如果僅僅考慮實體的信息,那么就會忽略了遠距離實體之間的聯(lián)系,實體路徑向量補充了這種實體之間的關(guān)系聯(lián)系和深層次語義聯(lián)系.

        (2)注意力網(wǎng)絡(luò)使模型關(guān)注到更為重要的信息,性能得到較大提升.

        (3)實體向量和實體上下文向量都能帶來一些提升,同時將這兩種向量作為輸入時,它們能夠起到互補的作用,帶來更多的提升.

        (4)非線性映射函數(shù)的引入能夠有效地減輕實體向量與詞向量的兼容性問題,顯著地提升模型效果.

        (5)在使用不同的知識表示學(xué)習(xí)模型生成的向量時,DKEN性能有一些較小的變化,其中使用TransD生成的向量的DKEN模型取得了最好的效果.

        3.2.3案例分析

        為了直觀地說明知識圖譜在模型中起到的作用,本文抽取了某個用戶A在訓(xùn)練集和測試集中的樣本,分別如表6和表7所示,在訓(xùn)練樣本集中,第1~5條跟IT相關(guān),第6~8條跟政治相關(guān),在測試樣本集中,第1~3條和IT相關(guān),第4條和電影相關(guān).論文用同樣的數(shù)據(jù)集分別訓(xùn)練包含知識圖譜信息的模型(DKEN with KG)和不包含知識圖譜信息的模型(DKEN without KG),這兩種模型對用戶A進行預(yù)測時的注意力結(jié)果分別如圖6和圖7所示,顏色越深表示注意力越高.從圖5中可以看出,第1條測試樣本對第1~4條訓(xùn)練樣本有較高的注意力,這是因為“Apple”、“Microsoft”等詞在新聞標(biāo)題語料庫中經(jīng)常一起出現(xiàn),如表8所示,而詞向量正是基于這種詞的共現(xiàn)關(guān)系來生成的,因此僅使用詞向量的模型也能較好地捕獲這種關(guān)聯(lián).第2~3條測試樣本的結(jié)果較差,因為這兩個標(biāo)題中詞與訓(xùn)練樣本中的詞沒有在語料庫中頻繁地共現(xiàn).而在圖6中可以看出,第2條測試樣本對第3~4條訓(xùn)練樣本有較高注意力,第3條測試樣本對第1~2條訓(xùn)練樣本有較高注意力.這是因為“Youtube”和“Cortana”的實體在知識圖譜中分別與“Google”和“Microsoft”的實體密切相關(guān),它們的上下文重疊程度較高.

        表6 用戶A的訓(xùn)練樣本集

        表7 用戶A的測試樣本集

        表8 部分與Microsoft相關(guān)的新聞標(biāo)題

        圖6 用戶A訓(xùn)練集和測試集的注意力可視化結(jié)果(有KG)

        圖7 用戶A訓(xùn)練集和測試集的注意力可視化結(jié)果(無KG)

        3.2.4推薦結(jié)果解釋

        結(jié)合注意力機制和新聞之間的實體關(guān)系路徑,論文可以模型的推薦結(jié)果提供直觀的解釋.以用戶A的測試樣本3為例,該樣本的注意力集中在訓(xùn)練樣本1和訓(xùn)練樣本2,這意味著測試樣本3被推薦給用戶A主要是受訓(xùn)練樣本1和2的影響,因此可以將訓(xùn)練樣本1和2中的實體與測試樣本3中的實體之間的路徑提取出來作為推薦的解釋.訓(xùn)練樣本1和2中包含實體“Microsoft”、“Windows”和“Microsoft Surface”,測試樣本3中包含實體“Cortana”,在知識圖譜中實體之間的關(guān)系如圖8所示.DKEN模型在預(yù)測用戶興趣時,考慮到了實體在知識圖譜中的關(guān)聯(lián),測試樣本3被推薦給用戶A,很大程度上是因為“Cortana”與“Microsoft”等實體關(guān)系密切,因此可以將這種實體關(guān)系展示出來解釋推薦的原因.

        圖8 對推薦結(jié)果的知識路徑解釋

        4 結(jié) 論

        本文基于現(xiàn)有的新聞推薦系統(tǒng)無法捕捉實體之間的深層次語義聯(lián)系,提出了DKEN模型.模型利用KCNN從新聞標(biāo)題的詞向量、實體向量和實體上下文向量組成的三通道輸入中提取新聞特征,利用注意力網(wǎng)絡(luò)根據(jù)用戶瀏覽過的新聞標(biāo)題和候選新聞標(biāo)題來動態(tài)構(gòu)建用戶特征、實體路徑特征.為了更好地刻畫用戶瀏覽過的新聞標(biāo)題與候選新聞標(biāo)題之間的遠距離聯(lián)系,論文額外考慮了兩者所包含實體之間的路徑信息,利用LSTM構(gòu)建實體路徑特征.最后通過MLP來預(yù)測用戶點擊候選新聞標(biāo)題的概率.實驗結(jié)果顯示該模型效果優(yōu)于其他新聞推薦模型.在DKEN模型中,新聞標(biāo)題中的部分單詞無法對應(yīng)到知識圖譜中的實體,本文的做法是用零向量填充,在未來的工作中,可以考慮用更合理的方法解決該問題.

        猜你喜歡
        特征用戶信息
        如何表達“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        无码av专区丝袜专区| 男人天堂AV在线麻豆| 国产精品99久久免费| 亚洲AV无码专区国产H小说| 三级日本午夜在线观看| 日韩熟女系列中文字幕| 日本久久高清一区二区三区毛片| 99精品国产高清一区二区麻豆 | 国产精品久久国产精品99| 亚洲一区爱区精品无码| 久久水蜜桃亚洲av无码精品麻豆 | 久久精品无码一区二区三区不| 亚洲av一区二区三区网站| 日韩精品专区在线观看| 天美传媒一区二区| 国产成人户外露出视频在线| 亚洲黑寡妇黄色一级片| av免费一区二区久久| 成年性生交大片免费看| 嫩草影院未满十八岁禁止入内| 久久久久久AV无码成人| 成人性生交大片免费5| 免费无码av一区二区三区| 亚洲乱亚洲乱少妇无码99p| 国产精品情侣露脸av在线播放| 东京热加勒比国产精品| 伊人久久精品亚洲午夜| 亚洲精品一区二区| 国产国语对白一区二区三区| 日本女优禁断视频中文字幕| 九一免费一区二区三区偷拍视频| 免费a级毛片无码| 亚洲AV无码一区二区三区ba| 日韩成人高清不卡av| 天天躁夜夜躁av天天爽| 毛片大全真人在线| 亚洲午夜久久久久中文字幕| 男人天堂插插综合搜索| 18精品久久久无码午夜福利| 欧美在线不卡视频 | 国产亚洲精品一区在线|