亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于特征權(quán)重與情感偏好的可解釋推薦

        2022-08-16 03:11:00劉永堅(jiān)劉平峰
        關(guān)鍵詞:特征情感用戶(hù)

        戴 興,劉永堅(jiān),解 慶+,劉平峰

        (1.武漢理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,湖北 武漢 430070; 2.武漢理工大學(xué) 經(jīng)濟(jì)學(xué)院,湖北 武漢 430070)

        0 引 言

        目前基于用戶(hù)和物品的協(xié)同過(guò)濾推薦[1]、基于內(nèi)容的推薦[2]、基于知識(shí)的推薦[3]等主流推薦算法已經(jīng)發(fā)展得較為成熟,并廣泛應(yīng)用于電子商務(wù)、社交網(wǎng)絡(luò)等領(lǐng)域。為了準(zhǔn)確預(yù)測(cè)用戶(hù)對(duì)商品的偏好,用戶(hù)和商品之間的相關(guān)性分析常常應(yīng)用于推薦模型,因?yàn)橘?gòu)買(mǎi)同一商品的用戶(hù)之間以及同一用戶(hù)購(gòu)買(mǎi)的不同商品之間存在相關(guān)性(下文分別用相似用戶(hù)和相似商品表示),有直接交互的用戶(hù)和商品間也具有一定的關(guān)聯(lián)性(下文用交互商品和交互用戶(hù)表示)。Wu等[4]提出RMG模型利用注意力機(jī)制為用戶(hù)、商品間的相關(guān)性建模,學(xué)習(xí)用戶(hù)和商品的表征預(yù)測(cè)評(píng)分。雖然RMG模型考慮了用戶(hù)、商品間的相關(guān)性,但是忽略了用戶(hù)對(duì)商品不同屬性的偏好差異,以及商品不同屬性的重要程度。此外,傳統(tǒng)推薦算法通常僅提供推薦結(jié)果,用戶(hù)只能被動(dòng)地接受推薦,推薦過(guò)程不具有可解釋性,影響推薦效果和系統(tǒng)成交率。

        基于以上分析,本文提出了基于特征權(quán)重與情感偏好的可解釋推薦算法(explainable recommendation based on weighted feature and emotional preference,EWFEP)。該算法從歷史評(píng)論數(shù)據(jù)中挖掘用戶(hù)偏好和商品屬性以及不同商品特征的重要程度,結(jié)合注意力機(jī)制精確刻畫(huà)用戶(hù)/商品表征,并以此設(shè)計(jì)可解釋的推薦算法,同時(shí)引入貝葉斯個(gè)性化排序[5,6],優(yōu)化整個(gè)算法模型。在最后推薦商品時(shí)提供特征短語(yǔ)級(jí)別的解釋以提高推薦質(zhì)量。在Amazon和Yelp數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果驗(yàn)證了EWFEP模型的有效性。

        1 相關(guān)工作

        1.1 基于評(píng)論的推薦方法

        近年來(lái),大量研究[7]驗(yàn)證了利用用戶(hù)對(duì)商品的歷史評(píng)論能夠有效提高推薦的準(zhǔn)確性。最初,學(xué)者們使用主題建模技術(shù)從評(píng)論中提取語(yǔ)義特征,并將語(yǔ)義主題整合到潛在因子學(xué)習(xí)模型中。TLFM模型[8]提出了兩個(gè)單獨(dú)的因子學(xué)習(xí)模型,利用用戶(hù)和項(xiàng)目的情感一致性和文本一致性,將這兩個(gè)模塊結(jié)合在一起進(jìn)行評(píng)分預(yù)測(cè)。然而該方案需要將目標(biāo)用戶(hù)和項(xiàng)目成對(duì)的評(píng)論作為輸入,在實(shí)際應(yīng)用中可行性不高,因此該方法將推薦任務(wù)轉(zhuǎn)變?yōu)榍楦蟹治鋈蝿?wù)。

        最近,許多對(duì)評(píng)論的上下文信息建模的研究工作被提出。DeepCoNN模型[9]使用并行的CNN網(wǎng)絡(luò)從用戶(hù)和項(xiàng)目評(píng)論中提取語(yǔ)義特征,然后將提取的特征輸入到分解機(jī)(FM)中進(jìn)行評(píng)分預(yù)測(cè)。TransNet模型[10]在DeepCoNN的基礎(chǔ)上添加額外的隱藏層來(lái)表示用戶(hù)和商品,該隱藏層表示與目標(biāo)用戶(hù)-目標(biāo)項(xiàng)目對(duì)相對(duì)應(yīng)的評(píng)論的近似值,使之與訓(xùn)練集的評(píng)論文本類(lèi)似。D-Attn模型[11]采用全局和局部的注意力機(jī)制來(lái)識(shí)別評(píng)論文檔中的重要單詞,更精確挖掘用戶(hù)和商品的表征預(yù)測(cè)評(píng)分。NARRE[12]認(rèn)為對(duì)于不同的用戶(hù)-項(xiàng)目對(duì)評(píng)論應(yīng)該被區(qū)別對(duì)待,并使用注意機(jī)制選擇有用的評(píng)論,用于評(píng)級(jí)預(yù)測(cè)。MPCN模型[13]利用基于指針的共同注意方案啟用多層次的信息選擇,能夠識(shí)別重要的評(píng)論及評(píng)論中重要的詞,從而更準(zhǔn)確地預(yù)測(cè)評(píng)分。RMG模型[4]使用注意力機(jī)制從評(píng)論中學(xué)習(xí)用戶(hù)和商品的個(gè)性化表示,繼續(xù)使用注意力機(jī)制對(duì)用戶(hù)、商品之間的交互建模,進(jìn)一步學(xué)習(xí)用戶(hù)和項(xiàng)目的表示。上述基于評(píng)論和基于特征的解決方案通過(guò)識(shí)別重要的單詞或特征來(lái)得到用戶(hù)/項(xiàng)目的表征,然后為用戶(hù)項(xiàng)目之間相關(guān)性建模來(lái)提高推薦的質(zhì)量。然而在為用戶(hù)項(xiàng)目相關(guān)性建模時(shí),忽略了用戶(hù)對(duì)不同特征的關(guān)注度和商品不同屬性的重要程度。

        1.2 可解釋推薦

        現(xiàn)有研究[14]表明,給用戶(hù)推薦商品的同時(shí)提供合理的推薦理由,不僅可以提高用戶(hù)對(duì)推薦商品的接受度,還能激發(fā)用戶(hù)對(duì)系統(tǒng)的信心,幫助用戶(hù)更快地做出良好的決策以提升決策的效率和有效性。解釋的形式一般包括句子、標(biāo)簽/關(guān)鍵字、特征短語(yǔ)以及不同類(lèi)型的可視化方案等。

        MTER[6]從用戶(hù)評(píng)論中構(gòu)建情感詞典,生成3個(gè)三維張量,并將三維張量進(jìn)行Tucker分解,在損失函數(shù)中引入貝葉斯個(gè)性化推薦進(jìn)行優(yōu)化,最后生成自由文本作為解釋。NARRE模型[12]認(rèn)為不同評(píng)論重要性不一樣,通過(guò)注意力機(jī)制給每條評(píng)論賦予一個(gè)權(quán)重,將權(quán)重高的評(píng)論作為解釋呈現(xiàn)給用戶(hù)。MT模型[15]利用對(duì)抗式序列學(xué)習(xí)生成目標(biāo)用戶(hù)對(duì)目標(biāo)項(xiàng)目的評(píng)論作為解釋。Wang等[16]通過(guò)引入決策樹(shù)學(xué)習(xí)決策規(guī)則,與嵌入模型結(jié)合進(jìn)行推薦,使整個(gè)推薦過(guò)程具有解釋性。

        上述方法中作為解釋的生成的文本可能會(huì)有語(yǔ)句不順,而且評(píng)論可能只是某個(gè)用戶(hù)的觀點(diǎn),并不能代表商品的真實(shí)屬性特點(diǎn)。在EWFEP模型中,從評(píng)論中提取顯式特征,并采用TF-IDF確定其權(quán)重,將顯式特征和權(quán)重作為解釋?zhuān)脩?hù)可以更加直觀地了解商品的屬性及其質(zhì)量。

        2 可解釋推薦算法EWFEP

        本節(jié)將詳細(xì)介紹本文提出的EWFEP模型。如圖1所示,EWFEP模型由3個(gè)模塊組成:模塊一是文本處理模塊,從評(píng)論文本中提取特征及其情感構(gòu)建情感詞典,然后構(gòu)建用戶(hù)/商品表征,并確定特征權(quán)重;模塊二是交互建模模塊,為用戶(hù)-用戶(hù)、商品-商品、用戶(hù)-商品間的相關(guān)性建模,結(jié)合模塊一中的特征權(quán)重學(xué)習(xí)最終用戶(hù)/商品的表征;模塊三是預(yù)測(cè)層,主要負(fù)責(zé)結(jié)合模塊二中得到的用戶(hù)和商品表征與評(píng)分矩陣中挖掘出的潛在向量進(jìn)行評(píng)分預(yù)測(cè),并引入貝葉斯個(gè)性化排序減小評(píng)分預(yù)測(cè)誤差,提升模型性能。

        圖1 EWFEP模型框架

        2.1 文本處理模塊

        2.1.1 構(gòu)建情感詞典

        由于用戶(hù)在評(píng)論中提及特征的頻次及其表達(dá)的情感傾向能夠反映出用戶(hù)的偏好以及商品的屬性質(zhì)量,因此首先從評(píng)論文本中構(gòu)建情感詞典。這個(gè)過(guò)程主要分為兩步:首先采用語(yǔ)法和形態(tài)學(xué)分析工具從評(píng)論文本中提取特征詞集F,根據(jù)提取到的特征詞,匹配對(duì)應(yīng)的情感詞;然后利用知網(wǎng)的情感分析詞語(yǔ)集確定該特征的情感因子(若檢測(cè)存在否定詞,則將情感極性逆轉(zhuǎn))。從評(píng)論文本中提取出一系列二元組(f,s)構(gòu)建情感詞典,其中f表示特征,s為該特征對(duì)應(yīng)的情感因子。本文將知網(wǎng)情感分析用語(yǔ)集劃分為5個(gè)情感程度等級(jí),如式(1)所示

        (1)

        2.1.2 建立初始表征矩陣與特征權(quán)重矩陣

        假設(shè)F={f1,f2,…,fn} 表示評(píng)論中出現(xiàn)頻率最高的n個(gè)特征,U={u1,u2,…,um} 表示m個(gè)用戶(hù),對(duì)于用戶(hù)ui, 假設(shè)特征fj在與其相關(guān)評(píng)論中出現(xiàn)tij次。為了將tij縮放到與評(píng)分矩陣相同的范圍[1,N],通過(guò)式(2)進(jìn)行映射,則用戶(hù)特征矩陣Ur的對(duì)應(yīng)元素為

        (2)

        其中,N表示滿分評(píng)分,一般為5,如Amazon和Yelp。

        評(píng)論中表達(dá)對(duì)商品屬性的情感可以體現(xiàn)商品該屬性的質(zhì)量,因此在構(gòu)建商品屬性矩陣時(shí)需要考慮商品屬性對(duì)應(yīng)的情感程度。類(lèi)似地,假設(shè)P={p1,p2,…,po} 表示o件商品,屬性fj在商品pi相關(guān)評(píng)論中出現(xiàn)t次,t次的情感均值為sij, 則商品屬性矩陣Pr的對(duì)應(yīng)元素為

        (3)

        通常用戶(hù)對(duì)不同特征關(guān)注度不同,商品不同屬性的重要性也不同,且用戶(hù)傾向于在評(píng)論中頻繁提及其關(guān)注的特征,同時(shí)評(píng)論中特征對(duì)應(yīng)的情感傾向可以體現(xiàn)商品的屬性質(zhì)量。因此利用從評(píng)論中提取出的特征及其情感極性構(gòu)建用戶(hù)特征權(quán)重矩陣和商品屬性權(quán)重矩陣。

        TF-IDF(term frequency-inverse document frequency)算法一般用來(lái)計(jì)算文檔中某個(gè)詞的重要性,本文采用TF-IDF的思想計(jì)算用戶(hù)特征權(quán)重和商品屬性權(quán)重。用戶(hù)特征權(quán)重矩陣與商品屬性權(quán)重矩陣構(gòu)建類(lèi)似,本節(jié)以用戶(hù)特征權(quán)重矩陣的構(gòu)建為例,商品屬性權(quán)重矩陣同理。TFij代表用戶(hù)ui相關(guān)評(píng)論中特征fj出現(xiàn)的次數(shù)占用戶(hù)ui評(píng)論中所有特征出現(xiàn)次數(shù)的比重,TFij越大表示用戶(hù)ui對(duì)特征fj的關(guān)注度越高。IDF(j) 代表屬性fj在所有用戶(hù)中提及該特征的用戶(hù)數(shù)比重,IDF(j) 越大表示提及屬性j的用戶(hù)越少,說(shuō)明屬性j對(duì)目標(biāo)用戶(hù)越重要。用戶(hù)ui對(duì)特征fj的關(guān)注度wij計(jì)算式(4)~式(6)

        (4)

        (5)

        wij=TFij*IDF(j)

        (6)

        2.1.3 表征優(yōu)化

        (7)

        (8)

        (9)

        (10)

        (11)

        其中,k是一個(gè)比例系數(shù),本文將通過(guò)實(shí)驗(yàn)研究k的取值對(duì)模型性能的影響。同理,用戶(hù)的特征權(quán)重矩陣和商品的屬性權(quán)重矩陣進(jìn)行同樣的迭代處理。

        2.2 交互建模模塊

        用戶(hù)和商品并不相互獨(dú)立,用戶(hù)與用戶(hù)之間,商品與商品之間以及用戶(hù)與商品之間都存在一定的相關(guān)性。如圖2所示(圓圈代表用戶(hù)或商品,線表示購(gòu)買(mǎi)或評(píng)論行為),由于u1購(gòu)買(mǎi)了p1也購(gòu)買(mǎi)了p2、p3,u2購(gòu)買(mǎi)了p1,u3購(gòu)買(mǎi)了p1,也購(gòu)買(mǎi)了p4。因此p1與u1,u2,u3有關(guān)聯(lián),同時(shí)也與p2,p3,p4有一定的關(guān)聯(lián)。本節(jié)將具體研究用戶(hù)商品間的相關(guān)性及其在推薦模型中的作用。

        圖2 用戶(hù)商品交互

        (12)

        (13)

        (14)

        其中,w和b是可調(diào)參數(shù),β是交互商品相應(yīng)的注意權(quán)重。

        由于式(14)未考慮用戶(hù)對(duì)不同特征的關(guān)注度以及不同屬性對(duì)商品的重要程度,因此引入2.1.2節(jié)中得到的權(quán)重矩陣,則相似用戶(hù)對(duì)目標(biāo)用戶(hù)的特征偏好貢獻(xiàn)為

        (15)

        (16)

        (17)

        同理,可以得到商品的優(yōu)化表征向量。

        2.3 預(yù)測(cè)層

        2.3.1 評(píng)分預(yù)測(cè)

        評(píng)分矩陣中也包含豐富的用戶(hù)和商品信息,因此引入潛在因子模型(latent factor model,LFM),通過(guò)矩陣分解技術(shù)從評(píng)分矩陣中學(xué)習(xí)用戶(hù)和商品的潛在特征向量,并將潛在特征與顯式特征建立映射關(guān)系

        (18)

        其中,pu∈Rm×n,qi∈Ro×n,n為上文選取的特征數(shù),bu、bi、μ分別是用戶(hù)偏量、商品偏量和全局偏量。結(jié)合評(píng)論中挖掘到的表征,采用LFM的思想根據(jù)式(19)預(yù)測(cè)評(píng)分

        R′u,i=W(Uf+pu)*(Pf+qi)T+bu+bi+μ

        (19)

        其中,W為參數(shù),Uf和Pf分別是評(píng)論中學(xué)習(xí)的用戶(hù)和商品表征,bu、bi、μ為用戶(hù)偏量、商品偏量和全局偏量。如果將W置為1,忽略Uf和Pf, EWFEP模型就變成了潛在因子模型。

        2.3.2 貝葉斯個(gè)性化排序優(yōu)化

        貝葉斯個(gè)性化排序(Bayesian personalized ranking,BPR)是基于矩陣分解的一種排序算法。BPR代替了SVD中的逐點(diǎn)學(xué)習(xí),對(duì)一個(gè)用戶(hù)和兩個(gè)項(xiàng)目的三元組建模。如果用戶(hù)u與項(xiàng)目i有交互,則假定相比所有其它未交互的項(xiàng)目,用戶(hù)更喜歡該項(xiàng)目。在訓(xùn)練集中構(gòu)建三元組 , 在本模型中表示:①用戶(hù)u對(duì)商品i有歷史評(píng)分或評(píng)論,而對(duì)商品j沒(méi)有任何歷史評(píng)分或評(píng)論;②用戶(hù)u對(duì)商品i和商品j都有歷史評(píng)分,但對(duì)i的評(píng)分比商品j的評(píng)分高。BPR的優(yōu)化目標(biāo)基于最大后驗(yàn)估計(jì)概率,化簡(jiǎn)后見(jiàn)式(20)

        (20)

        其中,σ是sigmoid函數(shù),是在原始數(shù)據(jù)集中構(gòu)建出的三元組數(shù)據(jù)集,λ是正則化參數(shù)。

        引入貝葉斯個(gè)性化排序后模型的損失函數(shù)為

        (21)

        其中,rij為真實(shí)評(píng)分,r′ij、r′ik為預(yù)測(cè)評(píng)分。

        2.4 推薦解釋性分析

        傳統(tǒng)的推薦算法模型很難在生成推薦結(jié)果時(shí)提供推薦理由。本文特征屬性的權(quán)重可以直接表示用戶(hù)的偏好和商品屬性的質(zhì)量。將特征屬性和權(quán)重作為推薦解釋?zhuān)脩?hù)可以直觀了解推薦理由,以便做出明智的決定。

        應(yīng)該將用戶(hù)關(guān)注度較高且商品有較好質(zhì)量的特征屬性作為解釋。本文綜合考慮2.1.2節(jié)中構(gòu)建的用戶(hù)特征權(quán)重矩陣Wu和商品屬性權(quán)重矩陣Wp, 將對(duì)應(yīng)的特征與屬性權(quán)重相乘作為最終權(quán)重矩陣W(見(jiàn)式(22)),同時(shí)考慮到了用戶(hù)的偏好和商品的屬性質(zhì)量。生成推薦結(jié)果后,選取其中最重要的3個(gè)特征和權(quán)重值作為解釋?zhuān)扑]結(jié)果一起提供給用戶(hù)

        W=Wu?Wi

        (22)

        其中,?表示矩陣對(duì)應(yīng)元素相乘。

        例如給用戶(hù)推薦一家餐廳,EWFEP模型提供的解釋如圖3所示,用戶(hù)可以快速了解自己關(guān)注且餐廳較突出的特征及其權(quán)重,進(jìn)而決定是否在該餐廳用餐。

        圖3 解釋樣例

        3 實(shí)驗(yàn)結(jié)果與分析

        3.1 數(shù)據(jù)集和實(shí)驗(yàn)設(shè)置

        為了驗(yàn)證EWFEP模型的有效性,在Amazon中的Toys_and_Games,Kindle_Store和Movies_and_TV以及Yelp Challenge (下文分別用Toys,Kindle,Movies和Yelp表示)4個(gè)公開(kāi)數(shù)據(jù)集中進(jìn)行實(shí)驗(yàn)。這些數(shù)據(jù)集涵蓋了不同領(lǐng)域,其中Yelp是最大的數(shù)據(jù)集,包含超過(guò)300萬(wàn)條評(píng)論,而Toys是其中最小的數(shù)據(jù)集,僅約16萬(wàn)條評(píng)論。由于原始數(shù)據(jù)非常大且稀疏,本文對(duì)所有數(shù)據(jù)集進(jìn)行了預(yù)處理,僅保留評(píng)分或評(píng)論記錄不少于5,且評(píng)論中提取出特征數(shù)不少于10的用戶(hù)和商品。數(shù)據(jù)集的詳細(xì)信息見(jiàn)表1。

        表1 數(shù)據(jù)集的詳細(xì)特征

        3.2 評(píng)價(jià)指標(biāo)

        評(píng)分預(yù)測(cè)任務(wù)通常用均方根誤差(RMSE)、均方誤差(MSE)或平均絕對(duì)值誤差(MAE)作為評(píng)價(jià)指標(biāo),本文采用RMSE作為模型性能的評(píng)價(jià)指標(biāo),RMSE值越小表示模型性能越好。RMSE的計(jì)算見(jiàn)式(23)

        (23)

        其中, |TestSet| 代表測(cè)試集中的評(píng)分記錄數(shù)。

        3.3 比例系數(shù)k值的影響

        比例系數(shù)k的取值會(huì)直接影響用戶(hù)和商品的表征,進(jìn)而影響模型的性能。本文通過(guò)對(duì)k取不同值進(jìn)行對(duì)比實(shí)驗(yàn)研究k值對(duì)EWFEP模型性能的影響。

        實(shí)驗(yàn)結(jié)果如圖4所示,從圖4中可以看出當(dāng)k取值較小時(shí),EWFEP模型的誤差較大,隨著k值增大,EWFEP模型的性能逐漸提升,當(dāng)?shù)竭_(dá)某個(gè)閾值后,EWFEP模型的效果隨著k值的繼續(xù)增大而逐漸變差。這是因?yàn)檩^小的k值會(huì)影響評(píng)論中挖掘的表征特征屬性的關(guān)系,而較大的k值會(huì)導(dǎo)致評(píng)論中挖掘的表征存在偏差,且具有一定的數(shù)據(jù)稀疏性,影響了模型的性能。從圖中可以看出當(dāng)k取值為0.6時(shí),各數(shù)據(jù)集的誤差都達(dá)到最小,模型性能達(dá)到最佳,因此本文比例系數(shù)k取值為0.6。

        圖4 k值的影響

        3.4 特征權(quán)重的影響

        在本小節(jié),通過(guò)對(duì)比實(shí)驗(yàn)研究特征權(quán)重對(duì)EWFEP模型的影響。將EWFEP模型與其變體EWFEP-b忽略特征權(quán)重進(jìn)行比較,實(shí)驗(yàn)結(jié)果如圖5所示。結(jié)果表明在建模時(shí)考慮不同特征權(quán)重能夠有效減小評(píng)分預(yù)測(cè)誤差。這符合預(yù)期,因?yàn)椴煌挠脩?hù)對(duì)特征的關(guān)注度不同,不同商品屬性的重要程度也不同。在建模時(shí)考慮特征的權(quán)重,學(xué)習(xí)到的用戶(hù)和商品的表征更貼近其真實(shí)表征。

        圖5 特征權(quán)重的影響

        3.5 特征數(shù)的影響

        本小節(jié)通過(guò)實(shí)驗(yàn)研究特征數(shù)n對(duì)EWFEP模型性能的影響。本文依次選取特征數(shù)為 (10,20,30,40,50,60,70,80,90,100) 進(jìn)行實(shí)驗(yàn),結(jié)果如圖6所示。從圖6中可以看出,當(dāng)選取的特征數(shù)n較小時(shí),模型性能不佳,選取的特征數(shù)n太大時(shí),模型的性能也逐漸下降,只有選取合適的特征數(shù)時(shí),模型的性能達(dá)到最佳。因?yàn)檫x取的特征數(shù)較小時(shí),大量有用信息被丟失,不能準(zhǔn)確表示用戶(hù)的偏好和商品的屬性;而特征數(shù)選取太大會(huì)引入大量噪聲,另外用戶(hù)常關(guān)注的特征數(shù)量有限,選取特征數(shù)過(guò)大會(huì)由于大量用戶(hù)未提及這些特征,造成用戶(hù)和商品的表征矩陣更加稀疏,直接影響模型效果,因此針對(duì)不同領(lǐng)域應(yīng)選取合適的特征數(shù)。數(shù)據(jù)集Toys和yelp特征數(shù)為50時(shí),模型的效果達(dá)到最好,而數(shù)據(jù)集Kindle和Movies特征數(shù)為60時(shí),模型表現(xiàn)最好。

        圖6 特征數(shù)的影響

        3.6 性能評(píng)估

        3.6.1 對(duì)比模型

        實(shí)驗(yàn)通過(guò)與幾種基準(zhǔn)方法對(duì)比來(lái)評(píng)估EWFEP模型的性能?;鶞?zhǔn)方法選取了3個(gè)目前較為先進(jìn)的模型:

        (1)DeepCoNN[9]:深度協(xié)同神經(jīng)網(wǎng)絡(luò),利用深度學(xué)習(xí)技術(shù)對(duì)文本評(píng)論中的用戶(hù)和項(xiàng)目進(jìn)行聯(lián)合建模的最早方法。

        (2)Attn+CNN[17]:基于注意力機(jī)制的CNN,同時(shí)使用CNN和對(duì)單詞嵌入的注意力機(jī)制從評(píng)論中學(xué)習(xí)用戶(hù)和商品的表示。

        (3)NARRE[12]:具有評(píng)論級(jí)別解釋的神經(jīng)注意評(píng)分回歸模型,該模型使用注意力機(jī)制對(duì)商品評(píng)論的信息性進(jìn)行建模。

        (4)EWFEP:本文提出的模型,從評(píng)論中提取顯式特征表示用戶(hù)和商品的表征,為用戶(hù)商品交互建模并考慮用戶(hù)和商品特征屬性的重要程度得到最終的表征進(jìn)行評(píng)分預(yù)測(cè)。

        選取的基準(zhǔn)方法中DeepCoNN是僅使用了評(píng)論文本的深度學(xué)習(xí)模型,Attn+CNN和NARRE模型結(jié)合了評(píng)分?jǐn)?shù)據(jù),并加入了注意力機(jī)制,EWFEP模型同時(shí)使用評(píng)分與評(píng)論,并引入注意力機(jī)制和深度學(xué)習(xí)技術(shù),同時(shí)為用戶(hù)商品交互建模時(shí)考慮不同特征屬性的重要程度。各種方法具有的特征總結(jié)見(jiàn)表2。

        表2 各種方法具有的特征

        3.6.2 實(shí)驗(yàn)設(shè)置

        實(shí)驗(yàn)隨機(jī)將每個(gè)數(shù)據(jù)集的80%作為訓(xùn)練集,10%作為驗(yàn)證集,剩下的10%作為測(cè)試集。通過(guò)訓(xùn)練集訓(xùn)練參數(shù),驗(yàn)證集選取參數(shù),測(cè)試集評(píng)估模型性能。EWFEP模型正則參數(shù)λ=0.001,防止過(guò)擬合dropout=0.5,attention_size=64。

        3.6.3 對(duì)比結(jié)果分析

        EWFEP模型與其它對(duì)比模型的實(shí)驗(yàn)結(jié)果見(jiàn)表3。從表中可以得出以下結(jié)論。

        表3 不同模型對(duì)比結(jié)果

        (1)本文的EWFEP模型在4個(gè)數(shù)據(jù)集中的評(píng)分預(yù)測(cè)誤差比次優(yōu)的模型均降低了3%以上,4個(gè)數(shù)據(jù)集的平均預(yù)測(cè)誤差降低了3.62%,最大降低了4.93%。

        (2)同時(shí)考慮評(píng)分?jǐn)?shù)據(jù)和評(píng)論文本的模型比僅考慮評(píng)論文本的性能更好。因?yàn)樵u(píng)分?jǐn)?shù)據(jù)中包含了大量用戶(hù)和商品信息,作為評(píng)論文本的補(bǔ)充,能夠更準(zhǔn)確學(xué)習(xí)用戶(hù)的偏好和商品的屬性。

        (3)引入了注意力機(jī)制的模型比未使用注意力機(jī)制的效果更好。因?yàn)樽⒁饬C(jī)制可以為重要的詞、句子、評(píng)論、用戶(hù)/商品等分配更高的權(quán)重,能更好挖掘用戶(hù)的偏好和商品的屬性。

        (4)考慮了用戶(hù)和商品之間相關(guān)性以及特征屬性重要程度的比未考慮的表現(xiàn)更佳。這與直觀理解相符,用戶(hù)商品之間不是相互獨(dú)立的,用戶(hù)與其相似用戶(hù)和交互商品具有一定的相關(guān)性,商品同樣與其相似商品和交互用戶(hù)有關(guān)聯(lián)性,且用戶(hù)對(duì)不同特征的關(guān)注度不同,商品不同屬性的重要性也不同。

        4 結(jié)束語(yǔ)

        本文提出了一種基于特征權(quán)重與情感偏好的可解釋推薦算法EWFEP,該方法從評(píng)論中提取出特征及其情感程度,構(gòu)建用戶(hù)和商品的表征并利用TF-IDF算法確定特征的權(quán)重。在為用戶(hù)/商品之間的相關(guān)性建模時(shí)考慮不同特征的權(quán)重,可以更準(zhǔn)確學(xué)習(xí)用戶(hù)的偏好和商品的屬性。在生成推薦商品時(shí),結(jié)合商品屬性權(quán)重與用戶(hù)偏好,將權(quán)重最大的3個(gè)特征屬性作為解釋。在4個(gè)真實(shí)數(shù)據(jù)集中的對(duì)比實(shí)驗(yàn)結(jié)果表明,EWFEP模型的準(zhǔn)確度有較大提升。下一步工作將重點(diǎn)研究用戶(hù)商品間的高階交互,更精準(zhǔn)挖掘用戶(hù)的偏好和商品的屬性,進(jìn)一步提升模型的效果。

        猜你喜歡
        特征情感用戶(hù)
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        如何表達(dá)“特征”
        情感
        不忠誠(chéng)的四個(gè)特征
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        抓住特征巧觀察
        關(guān)注用戶(hù)
        關(guān)注用戶(hù)
        關(guān)注用戶(hù)
        中文字幕熟妇人妻在线视频| 那有一级内射黄片可以免费看| 婷婷色综合视频在线观看| 国产高清在线精品一区二区三区| 国产成人精品自在线无码| 日本中文字幕av网址| 青青草视频在线观看网| 18黑白丝水手服自慰喷水网站| 亚洲自偷自偷偷色无码中文| 香蕉久久夜色精品国产| 国产精品国产三级国产剧情| 日本另类αv欧美另类aⅴ| 婷婷丁香社区| 手机在线中文字幕国产| 91色区在线免费观看国产| 亚欧中文字幕久久精品无码| 国产乱子伦精品无码码专区| av永久天堂一区二区三区蜜桃| 偷拍一区二区盗摄视频| 丁字裤少妇露黑毛| 欧美深夜福利网站在线观看| 久久婷婷夜色精品国产| 国产亚洲精品久久午夜玫瑰园| 熟妇高潮一区二区三区| 野外三级国产在线观看| 中文字幕文字幕视频在线| 青青草原亚洲| 人禽无码视频在线观看| 成人国产自拍在线播放| 亚洲成人免费av影院| 白天躁晚上躁麻豆视频| 手机看片福利日韩国产| 亚洲中文字幕一区二区三区多人| 99无码熟妇丰满人妻啪啪| 色偷偷88888欧美精品久久久| 中文字幕在线人妻视频| 亚洲国产成人久久综合碰碰| 亚洲成a∨人片在无码2023| 亚洲国产成人Av毛片大全| 中文字幕34一区二区| 国产裸体舞一区二区三区|