高 麗,楊立身
(1.鄭州經(jīng)貿(mào)學(xué)院 計(jì)算機(jī)與人工智能學(xué)院,河南 鄭州 451191; 2.河南理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,河南 焦作 454003)
在基于位置的社交網(wǎng)絡(luò)(location-based social networks,LBSNs)[1]中,興趣點(diǎn)(point-of-interest,POI)推薦已逐漸成為推薦系統(tǒng)領(lǐng)域的活躍學(xué)術(shù)研究重點(diǎn)[2]。很多現(xiàn)有POI推薦方法主要考慮某一個(gè)或者某幾個(gè)影響因素[3],很少綜合考慮社交、順序、地理、時(shí)間對POI推薦的影響,限制了POI取得更好的推薦效果。此外,日常生活中簽到行為的稀疏性也在一定程度上制約了POI推薦精度[4]。
為了實(shí)現(xiàn)智能化、可擴(kuò)展的多源異構(gòu)信息,進(jìn)行更加準(zhǔn)確的POI推薦,基于多源異構(gòu)簽到數(shù)據(jù),提出了一種利用改進(jìn)型RNN的POI推薦方法。創(chuàng)新點(diǎn)總結(jié)如下:
(1)引入因子分解機(jī)對多源異構(gòu)簽到數(shù)據(jù)進(jìn)行處理,有效降低了數(shù)據(jù)稀疏性帶來的POI推薦不準(zhǔn)確問題。
(2)提出了MMBE模型融合社交關(guān)系、順序、時(shí)間、地理位置4種因素的矩陣,計(jì)算出多源異構(gòu)數(shù)據(jù)的POI影響因子。
(3)將時(shí)間、順序、地理位置、社交關(guān)系因子用于循環(huán)神經(jīng)網(wǎng)絡(luò)選定候選狀態(tài),避免了傳統(tǒng)RNN對較遠(yuǎn)時(shí)間記憶能力的喪失,同時(shí)將其它影響POI推薦的重要因子也考慮進(jìn)來,提高推薦POI的質(zhì)量。
本節(jié)從影響推薦的多源重要因素(社交關(guān)系、順序、地理位置、時(shí)間)介紹相關(guān)的興趣點(diǎn)POI推薦,同時(shí)介紹RNN算法。
文獻(xiàn)[5]將用戶相似性信息作為正則化項(xiàng)并入矩陣分解或張量模型中,取得了不錯(cuò)的POI推薦效果,同時(shí)也驗(yàn)證了社交關(guān)系對POI的影響。文獻(xiàn)[6]將順序?qū)OI的推薦的影響考慮進(jìn)來,提升了推薦效果。文獻(xiàn)[7]將地理影響納入加權(quán)的正規(guī)化MF模型中,取得了不錯(cuò)的POI推薦效果。文獻(xiàn)[8]中首先提出了不均勻性,這種不均勻性表示用戶的簽到偏好隨時(shí)間的變化,將時(shí)間因素考慮進(jìn)來,也驗(yàn)證了時(shí)間對POI推薦的影響,提升了推薦效果。
綜合上述研究可以看到,影響POI推薦的主要因素有社交、順序、地理位置和時(shí)間?,F(xiàn)有方法主要考慮上述兩種或者3種因素進(jìn)行融合以此進(jìn)行興趣點(diǎn)推薦。文獻(xiàn)[9]融合社交關(guān)系和位置影響的地點(diǎn)推薦算法(location recommendation algorithm combined with social relationships and geographic influences,LRACWSRAGI)將社交關(guān)系和地理位置進(jìn)行融合,推薦精度優(yōu)于傳統(tǒng)單一因素的推薦;文獻(xiàn)[10]基于地理-社會-評論關(guān)系的典型化興趣點(diǎn)推薦方法(geo-social-comment relationship-based typical point-of-inte-rest recommendation approach,GRTPRA),融合了地理位置、社會、評論關(guān)系信息,推薦多樣性和準(zhǔn)確率都有較大提高。文獻(xiàn)[11]融合多因素的興趣點(diǎn)協(xié)同推薦方法研究(study on point-of-interest collaborative recommendation method fusing multi-factors,SOPCRMFM),融合了地理位置、社交關(guān)系、情感等因素,準(zhǔn)確率和召回率也都一定程度有所提高。所提方法主要與上述3種方法進(jìn)行對比實(shí)驗(yàn)。
循環(huán)神經(jīng)網(wǎng)絡(luò)是特意用來處理時(shí)序數(shù)據(jù)樣本的一種神經(jīng)網(wǎng)絡(luò),其主要的表現(xiàn)形式是記憶網(wǎng)絡(luò)在簽名時(shí)的信息,并用于當(dāng)前所輸出的計(jì)算中,也就是說隱藏層之間的節(jié)點(diǎn)是相互連接的,且隱藏層的輸入中包含有輸入層的輸出以及上一時(shí)刻隱藏層的輸出。
文獻(xiàn)[12]通過存儲時(shí)間信息,獲得更長的信息,獲得了較好的推薦準(zhǔn)確度。文獻(xiàn)[13]采用循環(huán)神經(jīng)網(wǎng)絡(luò)建模用戶偏好和項(xiàng)目特征化的演化,提出了一種循環(huán)推薦網(wǎng)絡(luò)來預(yù)測用戶軌跡。取得了較好的預(yù)測效果。文獻(xiàn)[14]用門控循環(huán)單元模型對時(shí)間和相關(guān)距離信息進(jìn)行建模,提取用戶興趣特征偏好,對用戶進(jìn)行推薦,取得了較好的推薦效果。
可見,循環(huán)神經(jīng)網(wǎng)絡(luò)不僅能處理時(shí)間序列的樣本,而且能融合其它影響因子,共同提升推薦精度。
使用更加異構(gòu)的信息來構(gòu)建智能POI推薦模型已經(jīng)成為推薦系統(tǒng)領(lǐng)域的科學(xué)共識,盡管這使模型變得更加復(fù)雜。先前的大多數(shù)研究都利用上述一種或多種因素來構(gòu)成它們的POI推薦模型。但是,它們?nèi)狈@些因素對用戶簽到行為的共同影響的綜合分析,這可能是由于難以對異構(gòu)信息進(jìn)行建模以及難以以統(tǒng)一的方式發(fā)現(xiàn)跨異構(gòu)工作流活動(dòng)的多種類型的行為模式所致。此外,影響用戶興趣點(diǎn)的因素還存在稀疏性問題,RNN能夠?qū)灥降臅r(shí)間序列進(jìn)行記憶,但是隨著時(shí)間的變化,記憶會喪失。因此,使本文的工作與以往的大多數(shù)研究區(qū)別最大的地方在于利用因子分解機(jī),緩解數(shù)據(jù)稀疏性對POI推薦的影響,提出了融合上述4個(gè)因素的統(tǒng)一框架即MMBE框架,學(xué)習(xí)了他們之間的內(nèi)在聯(lián)系,得到多源異構(gòu)數(shù)據(jù)的影響因子。傳統(tǒng)方法改進(jìn)RNN網(wǎng)絡(luò),一般只考慮時(shí)序、距離以及上一個(gè)時(shí)刻候選狀態(tài)對候選狀態(tài)的影響,很少考慮到社會關(guān)系。本文通過MMBE模型,統(tǒng)一對上述4種因素建模,改進(jìn)RNN(將得到的多源異構(gòu)因素以及上一個(gè)時(shí)刻的候選狀態(tài),共同作用于候選狀態(tài)的選定),所得推薦更加可靠。
首先,表1列出了模型中使用的所有參數(shù)符號。
其次,將一些初步概念定義如下:
定義1 POI:POI是與地理位置相關(guān)的項(xiàng),例如餐廳或電影院。
定義2 網(wǎng)絡(luò):網(wǎng)絡(luò)G=(U,E) 被定義為基于位置的社交網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),其中U是用戶的集合,E是用戶之間的關(guān)系的集合。
定義3 簽到活動(dòng):簽到活動(dòng)是一個(gè)四元組 (u,v,lv,t), 表示用戶u在時(shí)間t訪問POIv。為了調(diào)查這項(xiàng)工作中嵌入在日常模式中的功能,將一天劃分為多個(gè)時(shí)隙,這些時(shí)隙的持續(xù)時(shí)間以小時(shí)為單位。
定義4 用戶文檔:對于每個(gè)用戶u,定義一個(gè)用戶文檔Du,該文檔是與該用戶關(guān)聯(lián)的一組簽到活動(dòng)。
定義5 主題:對于Du中的每個(gè)簽到活動(dòng),使用相應(yīng)的主題z來建模用戶的興趣或偏好,該主題z是簽到時(shí)間t。
表1 模型中使用的參數(shù)符號
定義6 區(qū)域:對于Du中的每個(gè)簽到活動(dòng),均使用相應(yīng)的區(qū)域r對用戶的空間移動(dòng)性模式進(jìn)行建模,該區(qū)域r是POIs位置上的多項(xiàng)分布。
第三,對POI推薦問題影響因子進(jìn)行了定義。
給定一組用戶簽到活動(dòng)D和目標(biāo)用戶u(u∈U) 及其當(dāng)前位置lu和時(shí)間tu,所提模型能夠預(yù)測t時(shí)刻,用戶u對興趣點(diǎn)v(v|u,lu,tu) 的興趣度p(v|u,lu,tu)v∈V)。 該因子能夠反映社交、順序、地理位置、時(shí)間協(xié)同對興趣點(diǎn)的影響。
為了模擬社會、順序、地理和時(shí)間因素對用戶簽到行為的協(xié)同影響,針對POI推薦提出了一種多模態(tài)貝葉斯嵌入模型(MMBE)。
圖1顯示了MMBE的圖形表示,其中N、K和R分別表示用戶、主題和區(qū)域的數(shù)量。MMBE的輸入數(shù)據(jù)(即用戶的簽到記錄,包括用戶嵌入、POIs嵌入、簽到時(shí)間和簽到位置被設(shè)置為觀察到的隨機(jī)變量(請參見圖1中的4個(gè)灰色圓圈)。在MMBE的圖形表示中,方框是復(fù)制品的“板”。最大的板塊表示用戶文檔,而最大的板塊中的內(nèi)部標(biāo)牌表示文檔中潛在變量(即z和r)和觀察變量(即t,fv和lv)的重復(fù)選擇。此外,外板代表Dirichlet分布或正伽瑪分布的參數(shù),如本節(jié)稍后部分所述。(模型參數(shù)的符號請參見表1)。
圖1 MMBE模型
為了對社會因素和順序因素進(jìn)行建模,MMBE學(xué)習(xí)一個(gè)共享的潛在主題空間,以在兩個(gè)不同的嵌入空間中生成基于網(wǎng)絡(luò)的用戶嵌入和基于序列的POI嵌入。更具體地說,在本文使用Skip-gram[15]模型和DeepWalk[16]分別學(xué)習(xí)編碼順序影響的基于序列的POI嵌入和編碼社會影響的基于網(wǎng)絡(luò)的用戶嵌入。然后,MMBE將預(yù)先訓(xùn)練的用戶嵌入和POI嵌入作為輸入。
受早期用戶興趣和空間移動(dòng)性建模的啟發(fā)[17],假設(shè)用戶的簽到行為主要受其興趣和空間移動(dòng)性模式的影響。為了對地理影響和時(shí)間影響建模,MMBE定義了兩種類型的潛在變量,即主題和區(qū)域,分別表征用戶興趣和空間移動(dòng)性模式。更具體地來說,即用主題z和區(qū)域r共同定義主題變量(即POI主題z和用戶主題y)和區(qū)域變量r,以形成與POIs上的分布相關(guān)聯(lián)的聯(lián)合潛在因子主題區(qū)域。它們負(fù)責(zé)同時(shí)生成用戶的簽到時(shí)間,連續(xù)的POI嵌入和POI位置。同時(shí),用于生成基于網(wǎng)絡(luò)的用戶嵌入的潛在變量yu(用于用戶u)是從Du中所有POIs主題中統(tǒng)一提取的。式(1)是用戶u關(guān)于主題z和主題y在區(qū)域r的聯(lián)合概率計(jì)算公式
(1)
式中:Mu表示Du中簽到活動(dòng)的數(shù)量, 1(·) 表示指標(biāo)函數(shù),s是拉普拉斯平滑的平滑參數(shù)。
在MMBE中,使用Dirichlet分布[18](由Dirichlet()表示)作為變量z、r和t的先驗(yàn),這與LDA(潛在Dirichlet分布)中使用的多模態(tài)技術(shù)相似。對于用戶嵌入和POIs嵌入,本文的模型擴(kuò)展了高斯LDA以對多個(gè)模態(tài)進(jìn)行建模,并通過使用先驗(yàn)的正態(tài)伽馬分布(由NormalGamma()表示)在兩個(gè)單獨(dú)的空間中生成連續(xù)的嵌入。盡管有可能從多元高斯分布中提取嵌入量,但本文還是從單變量高斯分布中分別提取每個(gè)嵌入維數(shù)。該處理更實(shí)用且更具成本效益。根據(jù)LBCPSNs上的空間聚類現(xiàn)象,即用戶最有可能訪問僅限于某些特定地理區(qū)域的大量POIs,所有討論的POIs在地理位置和簽到密度方面都屬于R區(qū)域。本文假設(shè)每個(gè)區(qū)域r的高斯分布和POIv的位置正態(tài)分布并用lv~N(μl,λl) 表示,其概率正態(tài)分布公式如式(2)所示
(2)
上一節(jié)介紹了MMBE模型,考慮了社交關(guān)系、順序、時(shí)間、地理位置對興趣點(diǎn)的協(xié)同影響,但是影響興趣點(diǎn)的因素存在稀疏性,例如,使用熱碼方式對時(shí)間進(jìn)行特征編碼,一年有12個(gè)月,1月可以表示為 <1,0,0,0,0,0,0,0,0,0,0,0>, 傳統(tǒng)方法對這種高維稀疏的矩陣,無法很好地處理,因子分解機(jī)(FM)的出現(xiàn)改變了這種情況,F(xiàn)M算法是一種很高效的模型,可以在線性時(shí)間內(nèi)完成模型的訓(xùn)練,最大的優(yōu)勢是能夠?qū)ο∈钄?shù)據(jù)進(jìn)行很好的學(xué)習(xí)。通過交互項(xiàng)可以學(xué)習(xí)特征之間的關(guān)聯(lián)關(guān)系。
因子分解機(jī)能夠?qū)Ω叨认∈璧臄?shù)據(jù)進(jìn)行參數(shù)學(xué)習(xí)
(3)
式中:w0是全局偏量,wi表示第i個(gè)變量的強(qiáng)度,
W=V·Vt
(4)
其中,W為系數(shù)矩陣,且滿足正定性。
(5)
使用兩個(gè)矢量的點(diǎn)乘來替代Wi,j, 其中v為N*K大小的矩陣。通過這樣的處理,即可以解決數(shù)據(jù)稀疏帶來的參數(shù)難以學(xué)習(xí)的問題。
在興趣點(diǎn)推薦算法中,對于連續(xù)時(shí)間因素方面的研究并不多。在興趣點(diǎn)推薦中,每一個(gè)POI都有自己的地理位置屬性,且用戶的行為是擁有時(shí)序性的,即具有時(shí)間和順序性。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)能夠?qū)π蛄心J竭M(jìn)行建模。但是僅僅考慮用戶時(shí)間和順序影響是不夠的,因?yàn)榕d趣點(diǎn)還被當(dāng)前地理位置以及社交關(guān)系影響。在興趣點(diǎn)推薦算法中,一個(gè)用戶訪問興趣點(diǎn),易受好友影響,同時(shí)訪問興趣點(diǎn)具有時(shí)間規(guī)律以及存在先后順序。此外當(dāng)前所在地理位置也會對接下來要訪問的興趣點(diǎn)產(chǎn)生影響,因此在進(jìn)行興趣點(diǎn)推薦時(shí)需要綜合考慮社交影響、時(shí)間影響、順序影響以及地理位置影響。本文借鑒RNN模型的變種模型,提出了改進(jìn)循環(huán)神經(jīng)網(wǎng)絡(luò)(relation-order-situation-time neural network,ROSTNN),模型結(jié)構(gòu)如圖2所示。
圖2 改進(jìn)型ROSTNN模型
新候選狀態(tài)在t時(shí)刻的表示為
(6)
式中:Wc1、Wc2均表示的是模型參數(shù),在lt位置點(diǎn)的嵌入由Ult進(jìn)行表示,重置門開關(guān)記為ft, 上個(gè)輸出的嵌入記為ht-1, 偏置矢量記作bc。
首先,通過MMBE模型可以得到社交關(guān)系、順序、地理位置、時(shí)間的影響因子Prost(社交關(guān)系R、順序O、地理位置S、時(shí)間T),則上述公式可變換為
(7)
若用戶訪問歷史的時(shí)間較短,或是需要在歷史最開始的部分對隱藏狀態(tài)進(jìn)行計(jì)算時(shí),則t時(shí)刻的候選隱藏狀態(tài)更改為
(8)
式中:初始狀態(tài)由h0表示,每個(gè)用戶都具有相同的初始狀態(tài),并且在這種狀態(tài)下是不會有用于進(jìn)行個(gè)性化預(yù)測的行為數(shù)據(jù)的。
(9)
式中:更新門的開關(guān)用it來表示,分素乘積記為*。以下為更新門與重置門開關(guān)的計(jì)算公式
it=σ(Wi1Ult+Wi2hlt-1+bi)
(10)
ft=σ(Wf1Ult+Wf2hlt-1+bf)
(11)
其中,更新門與重置門的參數(shù)分別由Wi1、Wi2、Wf1、Wf2來進(jìn)行表示,更新門的偏移矢量記為bi,重置門的偏移矢量記為bf,在t時(shí)刻的輸出表示為
ht=tanh(Ct)
(12)
用戶u在特定時(shí)間和空間下動(dòng)態(tài)的興趣點(diǎn)所發(fā)生的變化由ht進(jìn)行捕獲。直到現(xiàn)在,本文對用戶訪問興趣點(diǎn)的局部偏好和連續(xù)時(shí)間序列中的周期性變化特征的提取,是通過采用TD-GRU模型來完成的。
通過提取用戶訪問特征點(diǎn)的偏好,對于給定興趣點(diǎn)l計(jì)算出用戶對該興趣點(diǎn)的預(yù)測值
(13)
圖3為改進(jìn)RNN算法的流程,首先通過因子分解機(jī),構(gòu)建時(shí)間矩陣T、地理位置矩陣S、順序矩陣O和社交關(guān)系矩陣R,使用因子分解機(jī)的思想對稀疏數(shù)矩陣進(jìn)行處理,去除數(shù)據(jù)的稀疏化。然后,使用MMBE模型對多源異構(gòu)因素(社交、順序、地理位置、時(shí)間)進(jìn)行建模,得到影響權(quán)重,將影響權(quán)重協(xié)同上一時(shí)刻的狀態(tài),獲得該時(shí)刻的狀態(tài),使用式(12)和式(13)求得給定任意興趣點(diǎn)l的預(yù)測值p。最后,將其最高的前K個(gè)興趣點(diǎn)推薦給用戶。
圖3 改進(jìn)RNN算法的流程
實(shí)驗(yàn)使用兩個(gè)公開可用的LBSN數(shù)據(jù)集,即Gowalla和Brightkite。這兩個(gè)數(shù)據(jù)集提供了用戶關(guān)系和用戶簽到記錄。其中簽到記錄包含位置ID和相應(yīng)的簽到時(shí)間戳。這兩個(gè)數(shù)據(jù)集中的所有簽到記錄均被視為用戶序列。兩條連續(xù)的簽到記錄之間的間隔大于6個(gè)小時(shí)的每條軌跡都被細(xì)分為多個(gè)部分。還對兩個(gè)數(shù)據(jù)集執(zhí)行了預(yù)處理步驟,以過濾掉不活躍的用戶和不受歡迎的POIs。例如,從Gowalla原始數(shù)據(jù)集中排除了簽到記錄少于16個(gè)且位置覆蓋少于21次訪問的用戶。由于Brightkite中數(shù)據(jù)集的大小很小,因此,僅刪除了簽到少于11個(gè)好友的用戶和簽到少于16個(gè)位置的用戶。表2列出了預(yù)處理數(shù)據(jù)集的統(tǒng)計(jì)信息。
表2 預(yù)處理數(shù)據(jù)集的統(tǒng)計(jì)信息
利用兩種廣泛使用的指標(biāo),即Recall@k(召回率)、Precision@k(精度),同時(shí)使用了F1指標(biāo),來衡量不同POI推薦方法的性能。其中F1指標(biāo)是準(zhǔn)確率和召回率的加權(quán)平均和,能夠避免準(zhǔn)確率和召回率相互制約的缺點(diǎn),更好評價(jià)算法穩(wěn)定性。這3個(gè)性能指標(biāo)定義為
(14)
(15)
(16)
其中,Su(k) 是推薦給用戶u的前k個(gè)POIs的集合,而vu是用戶在測試集中訪問的位置的集合。
為了驗(yàn)證所提方法的有效性,將其與3種對比方法進(jìn)行比較。每個(gè)數(shù)據(jù)集都被劃分為一個(gè)訓(xùn)練集和一個(gè)關(guān)于簽到時(shí)間的測試集,即,先前簽到記錄的80%被用作訓(xùn)練集,其余的為測試集。實(shí)驗(yàn)中所有程序都使用C++實(shí)現(xiàn)。嘗試了運(yùn)行Windows Server 2012的服務(wù)器,該服務(wù)器配置了Intel GRTPRA i7 CPU(3.6 GHz)和32 GB存儲器。
調(diào)整模型參數(shù)(例如主題數(shù)(即K)和區(qū)域數(shù)(即R))對于ROSTNN的性能至關(guān)重要。因此,以Gowalla為例,研究調(diào)整模型參數(shù)對ROSTNN性能的影響。首先,本文測試了超參數(shù)α、β、η、tu和tv改變時(shí)ROSTNN的性能,并且ROSTNN對超參數(shù)的變化不敏感。根據(jù)經(jīng)驗(yàn),為這些超參數(shù)設(shè)置固定值,即α=50/K,β=50/R,η=0.01,μu=μv=0和λu=λv=1E-3。 其次,進(jìn)行了一個(gè)額外的實(shí)驗(yàn)來測量嵌入維數(shù)對POI推薦的影響。當(dāng)嵌入維數(shù)為50~200時(shí),模型的性能相對穩(wěn)定。此外,嵌入維度越多,表達(dá)能力越強(qiáng),也可能導(dǎo)致過度擬合。因此,嵌入維數(shù)被設(shè)置為100。
通過改變主題和區(qū)域的數(shù)量,隨后進(jìn)行了測試ROSTNN推薦前十個(gè)POIs的性能。如表3和表4所示,ROSTNN的推薦精度和召回率隨著K的增加呈類似的上升趨勢,當(dāng)K大于50時(shí)趨于穩(wěn)定。值得注意的是,對于R有類似的觀察,即ROSTNN的推薦精度和召回率也隨著區(qū)域數(shù)的增加而增加,當(dāng)R大于40時(shí)趨于穩(wěn)定。
表3 Gowalla上的POI推薦精度@10
表4 Gowalla上的POI推薦召回@10
從主題和區(qū)域兩個(gè)方面本文都獲得了一致結(jié)果,這在很大程度上歸因于K和R對模型復(fù)雜性。因此,僅僅增加K和R來改善模型性能沒有太大幫助。換句話說,當(dāng)預(yù)測使用ROSTNN的簽到行為時(shí),應(yīng)該考慮是有效性優(yōu)先還是效率優(yōu)先。
將所提ROSTNN方法與LRACWSRAGI、GRTPRA、SOPCRMFM方法進(jìn)行對比,在精度、召回率和F值方面的對比結(jié)果如圖4~圖9所示。
圖4 ROSTNN在Gowalla上精確度對比實(shí)驗(yàn)
圖5 ROSTNN在Gowalla上召回率對比實(shí)驗(yàn)
圖6 ROSTNN在Brightkite上精確度對比實(shí)驗(yàn)
圖7 ROSTNN在Brightkite上召回率對比實(shí)驗(yàn)
圖8 幾種方法在Gowalla數(shù)據(jù)集上F值對比結(jié)果
圖9 幾種方法在Brightkite數(shù)據(jù)集上F值對比結(jié)果
從圖4到圖7可以看到,所有方法在兩個(gè)數(shù)據(jù)集上的精確度都比較低,這是由于兩個(gè)數(shù)據(jù)集中用戶的簽到數(shù)據(jù)比較稀疏,因此,所討論的所有4種方法的推薦準(zhǔn)確性都相對較低。在兩個(gè)數(shù)據(jù)集,本文的方法(ROSTNN)在評估指標(biāo)方面優(yōu)于其它3種對比方法。一方面,ROSTNN和SOPCRMFM的性能優(yōu)于LRACWSRAGI、GRTPRA,這表明綜合多源異構(gòu)數(shù)據(jù)的優(yōu)勢。另一方面,ROSTNN比SOPCRMFM更好,因?yàn)楸疚牡姆椒ㄟ€考慮訪問興趣點(diǎn)的順序,考慮順序能夠縮小興趣點(diǎn)的范圍,減小無用興趣點(diǎn)。本文的方法對于兩個(gè)數(shù)據(jù)集的精度值平均都有較大幅度增加。同樣,本文方法的召回率值平均也都是最大的。在兩個(gè)數(shù)據(jù)集上,本文方法更優(yōu),這是由于ROSTNN融合了社交、順序、地理、時(shí)間4種主要的影響興趣點(diǎn)推薦的因子,所以精度和穩(wěn)定性最好。
從圖8和圖9可以看到,4種對比方法,在Gowalla數(shù)據(jù)集上推薦長度為15時(shí)F值達(dá)到最高。在Brightkite數(shù)據(jù)集上推薦長度為10時(shí)F值達(dá)到最高。表明不同數(shù)據(jù)集上,不同推薦長度對推薦結(jié)果也有影響。
綜上可知,所提方法在兩種數(shù)據(jù)集上都能取得最好的推薦效果,這是由于所提方法融入了多源異構(gòu)數(shù)據(jù),綜合考慮了影響POI推薦的4個(gè)重要因子,避免了僅考慮單一或者某幾個(gè)因子而忽視其它重要影響因子,帶來的推薦準(zhǔn)確性問題,較大程度上提高了推薦的精度。此外,使用的因子分解機(jī),緩解了數(shù)據(jù)稀疏性帶來的問題。實(shí)驗(yàn)結(jié)果表明,所提方法的性能更加穩(wěn)定,同時(shí)推薦效果更好。
為了向LBSNs系統(tǒng)中的目標(biāo)用戶推薦更多相對準(zhǔn)確的POIs,在異構(gòu)工作流活動(dòng)中,綜合考慮了社交、順序、地理和時(shí)間因素對單個(gè)用戶簽到行為的共同影響,提出了一種改進(jìn)RNN的POI推薦方法。該方法通過因子分解機(jī)降低了各個(gè)維度數(shù)據(jù)稀疏性的問題,通過MMBE對4種影響POI推薦的因素進(jìn)行融合,最終和改進(jìn)RNN結(jié)合計(jì)算出興趣點(diǎn)的預(yù)測值,有效提升了推薦性能。實(shí)驗(yàn)結(jié)果表明,所提方法在評估指標(biāo)(精度和召回率)以及F1值方面優(yōu)于其它3種對比方法。
未來將通過整合語義信息和隱式反饋等信息來擴(kuò)展和豐富所提模型,以提高其預(yù)測性能和可擴(kuò)展性。