亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向本地和外地用戶情感分析推薦模型

        2021-08-19 06:09:00魏寧袁方劉宇
        河北大學學報(自然科學版) 2021年4期
        關(guān)鍵詞:區(qū)域情感用戶

        魏寧,袁方,2,劉宇

        (1.河北大學 數(shù)學與信息科學學院,河北 保定 071002;2.河北大學 計算機教學部,河北 保定 071002)

        隨著移動終端在社會中的廣泛使用,使得用戶信息的獲取更加容易.通過機器學習的一些算法分析用戶的個人信息,可以精確地得到用戶的個人偏好.當前一些主流的興趣點推薦主要以飯館、人文景點推薦以及其他的各類地點推薦為主.在興趣點推薦中可以把社會因素、地理因素、文本內(nèi)容信息和時間因素融入到模型中.龔衛(wèi)華等[1]提出了一種融合用戶與位置實體及其多維關(guān)系的社區(qū)發(fā)現(xiàn)方法(multi-relational nonnegative matrixfactorization,MRNMF).任星怡等[2]提出一種GTSCP(geography,time,society,content and popularity,地理、時間、社會、內(nèi)容和流行度)聯(lián)合概率模型來實現(xiàn)了對于本地和外地用戶的興趣點推薦.在飯館的推薦領域中,胡川等[3]把推薦融合與模型融合結(jié)合到一起,給出一個組推薦的方法.Wang等[4]給出了ST-SAGE推薦模型,通過分析同區(qū)域中每個用戶的偏好,進而找出相同偏好的用戶,從而給用戶進行推薦生成最終的推薦結(jié)果.Li等[5]主要解決推薦系統(tǒng)中的冷啟動問題,通過用戶的歷史記錄、地理位置和社交網(wǎng)絡信息定義了3類好友,進而定義3種簽到方式,通過矩陣分解的方式融合了3類簽到方式以解決冷啟動問題.Wang等[6]主要考慮興趣點的所有評論信息的整體情感傾向,提出了LSARS推薦模型,實現(xiàn)了本地和外地用戶的推薦,沒有把時間因素對于情感的影響考慮進去.Gao等[7]把用戶的每條評論的情感作為主要的因素來研究,但是缺少了對于整體情感的考慮.

        本文提出了基于地理標簽和用戶評論情感分析的興趣點推薦模型(point-of-interest recommendation model based on geographical position and sentiment analysis of user reviews,GTSA),包括了一種基于地理位置信息的隱含概率模型框架STRM(simple topic region model).該模型將興趣點劃分到所屬的區(qū)域中并且確定用戶是不是屬于本地用戶,從而能夠?qū)崿F(xiàn)本地和外地推薦.考慮到興趣點描述信息的單一,通過對該信息的擴充來實現(xiàn)興趣點之間相似性的衡量.通過分析評論數(shù)據(jù),挖掘興趣點的累計評論的情感走向,提出一種對于無標簽評論數(shù)據(jù)情感挖掘的方法,進而實現(xiàn)情感分析.在推薦列表階段,提出了本地用戶的排序方式和外地用戶的排序方式.實驗是在Yelp和Foursquare 2個數(shù)據(jù)集上進行,通過實驗數(shù)據(jù)驗證 GTSA 模型在其推薦的準確率上有較明顯的提高.

        1 GTSA推薦模型

        用戶簽到某一個興趣點時往往會受到以往用戶態(tài)度的影響,以往用戶的評論信息的情感決定著當前用戶的抉擇,即使該興趣點符合用戶的興趣,但由于消極評論過多會使得用戶更加慎重的選擇.每一個興趣點的群體情緒可以通過歷史的評論信息的情感來獲得.GTSA模型框架如圖1所示.

        圖1 GTSA模型框架Fig.1 GTSA model framework

        1.1 簡易主題地區(qū)模型

        圖2 STRM模型Fig.2 STRM model

        GTSA模型中的地區(qū)劃分采用了簡易主題地區(qū)模型(simple topic-region-model,STRM)[6].該模型將用戶的歷史簽到信息、興趣點的位置信息相融合,如圖2所示.用戶在現(xiàn)實世界中的訪問方式與網(wǎng)絡中的訪問方式不同.網(wǎng)絡中的訪問方式不受地理區(qū)域的限制.現(xiàn)實中由于受到距離的限制,用戶一般只訪問距離相對比較近的興趣點,不會考慮遠的興趣點.通過用戶的軌跡信息看出用戶的活動范圍比較固定且集中.用戶在不同的區(qū)域中會訪問不同類型的興趣點,這就表現(xiàn)出每個區(qū)域也帶有自己的特點.進而體現(xiàn)出用戶在訪問本地和外地興趣點時其興趣的變化.所以,利用該模型實現(xiàn)區(qū)域的劃分并將每個興趣點劃分到所屬的區(qū)域中.將地理空間劃分成R個區(qū)域,并通過模型將每個興趣點劃分到所屬的區(qū)域中.該模型的采樣方式是Gibbs采樣,通過多次的迭代計算最終完成區(qū)域的劃分.

        在現(xiàn)實世界中,用戶的訪問是隨機的且多樣的.劃分出R個區(qū)域,多項分布θu來表示用戶u在R個區(qū)域中的分布,即表示用戶訪問每個區(qū)域的概率.使用高斯分布表示每個區(qū)域r.

        根據(jù)公式(1)對地區(qū)r進行采樣

        (1)

        其中,nu,r表示用戶u在區(qū)域r中簽到的次數(shù)r,nr,v表示區(qū)域r生成興趣點v的次數(shù),p(lv|μr,∑r)是高斯分布函數(shù).經(jīng)過迭代訓練最終確定每個興趣點屬于每個地區(qū)r的概率,將興趣點劃分到概率最大的區(qū)域.

        對于以上模型,用lq表示用戶的當前位置,lu表示用戶家鄉(xiāng)所在的位置,當|lq-lu|大于100 km表示用戶當前處于外地地區(qū),小于100 km時表示用戶在家鄉(xiāng)即本地.根據(jù)公式(2)得到用戶簽到區(qū)域r的概率.

        (2)

        隱藏變量區(qū)域r的先驗概率通過公式(3)

        (3)

        在公式(3)中,Nu為用戶u訪問興趣點的個數(shù).參數(shù)k為偽計數(shù),其目的是防止模型過擬合.

        1.2 用戶評論的情感分析

        用戶的評論數(shù)據(jù)對于挖掘用戶的潛在興趣有著非常重要的作用.當用戶有訪問興趣點的想法時,通常會瀏覽該興趣點評論信息.對于那些自己感興趣的興趣點,其中評論數(shù)量多且好評占比大的興趣點用戶通常會有很高的概率去選擇.由于實驗中使用的是真實數(shù)據(jù)集,數(shù)據(jù)集中的評論是沒有情感標簽的,所以如何挖掘每條評論的情感是必須要解決的問題.因而提出基于Doc2vec和RNN的情感分析方法:

        1)使用python的集成庫TextBlob對除去訓練數(shù)據(jù)和測試數(shù)據(jù)的其他數(shù)據(jù)添加情感標簽.

        2)訓練Doc2vec詞袋模型,將所有評論數(shù)據(jù)中的每一個詞表示成向量.

        3)對于每一條評論進行關(guān)鍵字的提取,使得提取出的詞最能表征該條評論.

        4)上述過程處理過后,將非實驗用的數(shù)據(jù)用于RNN的訓練,再將其結(jié)果輸入神經(jīng)網(wǎng)絡中.將訓練好的模型用于實驗數(shù)據(jù)的情感識別,得到每條評論的情感值.

        本文中興趣點的相似度使用余弦公式來衡量.

        1.3 興趣點的排序方式

        1.3.1 本地排序方法

        對于本地用戶,往往會更加傾向于與自己歷史記錄相似的興趣點.因此用戶會更多的以興趣點的評論信息作為參考依據(jù).那些評論數(shù)量多且好評占比大的興趣點是用戶選擇的重點.一些發(fā)表時間長的評論信息其參考意義會隨著時間的推移變小,越新的評論其參考價值會更大.因此可以看出時間因素對于每一條評論的情感的影響,進而影響到整體的情感偏向.不難看出,其中還會存在同一個興趣點會相似于用戶的多個簽到記錄,這說明該興趣點與用戶的偏好十分相近.綜上所述,提出興趣點的選擇度的計算公式(4).

        (4)

        Si表示興趣點i的得分,即用戶對興趣點i的選擇度.C表示興趣點i的所有評論,c表示C中的第c條評論,Rc(i)表示興趣點i的第c個評論的情感值(該值介于[-1,1]之間).Timecur表示當前時間,TimeRc(i)表示該評論的發(fā)表時間.Sim(i)表示興趣點之間的相似度.listu表示排序前的推薦列表.

        1.3.2 外地排序方法

        用戶出于各種原因來到外地,對于多數(shù)人,腦中的第一想法就是當?shù)氐奶厣鞘裁?特色包含來了美食、特產(chǎn)以及當?shù)氐娜宋木坝^等.本文把特色定義為熱度,即在當?shù)睾芑馃?,火熱在?shù)據(jù)中表現(xiàn)為評論多即訪問量大且評論正向.

        通過上面的描述定義了熱度的計算公式(5).

        (5)

        Sigmoid(C)表示對評論個數(shù)的歸一化,剩余部分和公式(4)相似.

        旅行到外地,盡管主要的目的是體會當?shù)氐娘L土人情,但不排除一些用戶會選擇一些與家鄉(xiāng)相似的興趣點.因此以用戶簽到記錄為依據(jù)的推薦方式也很重要.若當?shù)靥厣呐d趣點與用戶的潛在興趣相似,則表明該興趣點更加符合用戶的選擇.所以該興趣點會有選擇度和熱度2個值,因此將二者相加(即公式(4)和(5)求和).在外地的推薦列表中其興趣點的種類會更加多樣化,因為它包含了特色興趣點以及與用戶潛在興趣相似的興趣點.

        對 GTSA 模型總結(jié)描述如下:

        1)STRM 依據(jù)用戶的歷史記錄將每一個興趣點劃分到所屬的地區(qū)中.

        2)依據(jù)用戶的當前位置信息確定用戶屬于本地用戶或者是外地用戶.

        3)若為本地用戶,基于用戶的歷史信息推薦與歷史記錄相似的興趣點.利用公式(4)對推薦列表中的興趣點進行排序,最終得到本地推薦結(jié)果.

        4)若為外地用戶,除依靠3)中的本地推薦方式外,利用公式(5)對外地地區(qū)興趣點熱度進行排序并與本地推薦相結(jié)合,最終得到外地推薦結(jié)果.

        2 實驗分析

        2.1 模型數(shù)據(jù)集介紹

        本文的實驗是在2個真實的數(shù)據(jù)集Yelp和Foursquare上進行的,如表1所示.

        表1 Yelp和Foursquare的基本統(tǒng)計信息Tab.1 Basic statistics of Yelp and Foursquare

        在Yelp數(shù)據(jù)集中,包含了9 704個用戶,每個用戶的簽到信息包括用戶標識、興趣點標識、興趣點位置信息、興趣點描述信息、興趣點評論信息以及簽到的時間.選取了4個城市的16 853個興趣點.

        在Foursquare數(shù)據(jù)集中,包含了16 426個用戶,每個用戶的簽到信息包括用戶標識、興趣點標識、興趣點位置、興趣點描述信息、興趣點評論信息以及簽到的時間.

        2.2 比較算法與分析方式

        GTSA模型與CKNN 算法[8]、UPS-CF 算法[9]、CAPRF 算法[7]、LCA-LDA算法[10]、JIM 算法[11]和LSARS算法[6]相比較.

        通過文獻[11-13]中給出的計算方法來對模型進行評估.當某個興趣點v,出現(xiàn)在Top-k中,則表示其中一個樣本命中,記為1,否則就記為0.

        對于所有的測試樣本用公式(6)來定義.

        (6)

        其中#hit@k表示測試樣本中滿足hit@k的數(shù)目,|Dtest|表示測試樣本的數(shù)目.

        2.3 實驗結(jié)果

        該部分主要展示GTSA模型與其他模型比較的結(jié)果.圖3和圖4分別展示了各個模型在Yelp和Foursquare數(shù)據(jù)集上本地和外地推薦的性能.各個模型在Top-k上推薦性能有明顯的區(qū)別.本文將k的值設置為1、5、10、15、20.對于經(jīng)典的Top-k推案方法,過大的k值意義不大,因此會被忽略掉.

        a.home-town;b.out-of-town.圖3 在Yelp上的推薦結(jié)果Fig.3 Recommendations on Yelp

        a.home-town;b.out-of-town.圖4 在Foursquare上的推薦結(jié)果Fig.4 Recommendations on Foursquare

        基于圖3、圖4的數(shù)據(jù),可以直觀的看出,GTSA模型均優(yōu)于JIM、CAPRF、LCA-LDA、CKNN、UPS-CF 和 LSARS.進一步分析可以得出:1)由于UPS-CF 和CKNN是基于協(xié)同過濾的方法,受數(shù)據(jù)稀疏的影響較大,因此與JIM、LSARS、LCA-LDA和 GTSA這些基于內(nèi)容的方法相比其效果較差,這說明興趣點內(nèi)容描述文本信息有效地緩解了數(shù)據(jù)稀疏所帶來的問題;2)由于JIM、LSARS和GTSA模型中加入地理位置的原因,其表現(xiàn)效果優(yōu)于LCA-LDA;3)GTSA 和 LSARS將興趣點評論的整體情感加入到模型中,其本地和外地推薦精度優(yōu)于CAPRF,這表明單個情感對于推薦效果的影響弱于整體情感;4)GTSA模型將時間因素對于情感變化的影響加入到模型中,其在本地和外地推薦中優(yōu)與LSARS.

        2.4 參數(shù)的影響

        GTSA模型同樣受到參數(shù)的影響,參數(shù)的適當調(diào)整以獲得最佳性能是至關(guān)重要的.在GTSA模型中,區(qū)域劃分的多少直接影響到最終的推薦精度.而區(qū)域的劃分是由STRM模型來實現(xiàn),因此通過調(diào)整 STRM 模型中的參數(shù)R,來分析不同的參數(shù)R對于 GTSA 模型推薦結(jié)果的影響.

        在STRM模塊中,對于超參數(shù)γ、τ而言,它們與其他的參數(shù)是相互獨立,沒有關(guān)系的,因此將超參數(shù)設置為固定的值γ=50/R,τ=0.01.在STRM中劃分區(qū)域的個數(shù)會影響到其推薦的精度,即模型對R的個數(shù)很敏感.通過圖5和圖6來展示不同的R對模型推薦精度的影響.

        通過圖5和圖6可以看出,區(qū)域數(shù)目的增加使得推薦精度先上升再降低.不僅在Yelp數(shù)據(jù)集上有這樣的結(jié)果,在Foursquare數(shù)據(jù)集上也有類似的結(jié)果.因而將R設置為數(shù)值15最適合.這表明R代表了模型的復雜程度,R越大其復雜程度越高,其模型的擬合度會越好.但當R超過一定的閾值后就出現(xiàn)了過擬合的情況,對于模型產(chǎn)生了不好的影響.同樣R的值越大其訓練的時間成本也會越高,所以最終選擇R的值為15.

        圖5 本地推薦準確率Fig.5 Home-town recommended accuracy

        圖6 外地推薦準確率Fig.6 Out-of-town recommended accuracy

        3 結(jié)束語

        本文提出了GTSA推薦模型,采用了一種基于地理位置信息的隱含概率模型框架STRM,興趣點的內(nèi)容相似度的計算,無標簽的評論數(shù)據(jù)的情感分析的方法,基于本地推薦和外地推薦的興趣點的排序方法.GTSA模型與其他經(jīng)典模型相比在精度上有明顯提高.當前,推薦系統(tǒng)不能夠及時捕捉用戶興趣的實時變化情況.今后從此問題入手,及時捕捉用戶興趣的遷移,并將當前社會的主流因素融入到推薦方法中.同樣,冷啟動一直以來是推薦系統(tǒng)最大的問題,今后也可以將工作重心放到這方面來.

        猜你喜歡
        區(qū)域情感用戶
        如何在情感中自我成長,保持獨立
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        如何在情感中自我成長,保持獨立
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        關(guān)于四色猜想
        分區(qū)域
        基于嚴重區(qū)域的多PCC點暫降頻次估計
        電測與儀表(2015年5期)2015-04-09 11:30:52
        欧产日产国产精品精品| 国产成人大片在线播放| 一边捏奶头一边高潮视频| 无码人妻久久一区二区三区不卡| 免费人成黄页网站在线观看国产| 青青青伊人色综合久久| 自由成熟女性性毛茸茸应用特色| 美女脱了内裤张开腿让男人桶网站| 亚洲中文字幕无码爆乳av| 久久er这里都是精品23| 国产一区二区三区成人 | 亚洲日韩欧美国产高清αv | 亚洲第一页在线免费观看| 久久777国产线看观看精品| 国产精品一区二区无线| 午夜毛片午夜女人喷潮视频| 国产亚洲精品高清视频| 久久午夜精品人妻一区二区三区 | 亚洲国产长腿丝袜av天堂| 91精品91| 亚洲天码一区二区三区| 久久精品女人天堂av免费观看| 乱码一二三入区口| 中文字幕色视频在线播放| 亚洲国产中文字幕一区| 国产女厕偷窥系列在线视频| 日本不卡视频网站| 免费黄网站永久地址进入| 2018天天躁夜夜躁狠狠躁| 免费无码又爽又刺激网站| 99成人无码精品视频| 久久一区二区av毛片国产| 麻豆av一区二区三区| 国产人成午夜免电影观看| 色综久久综合桃花网国产精品| 老鲁夜夜老鲁| 成人做爰视频www| 无码国产一区二区色欲| 美女主播福利一区二区| 五十路丰满中年熟女中出| 三级国产女主播在线观看|