劉 旸,吳安波,李慧斌
(1.西安科技大學(xué) 管理學(xué)院,陜西 西安 710054; 2.西安交通大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院信息科學(xué)系,陜西 西安 710048)
現(xiàn)如今,基于位置的社交網(wǎng)絡(luò)(location-based social network,LSBN)服務(wù)在人們的日常生活中起著越來(lái)越重要的作用[1-3]。由此,在對(duì)LBSN領(lǐng)域的研究過(guò)程中,感興趣的位置點(diǎn)(point of interest,POI)推薦成為了眾多研究學(xué)者的熱門(mén)關(guān)注話題[4-6]。因此,如何深入挖掘LBSN簽到數(shù)據(jù)中的深層次信息,提升POI推薦準(zhǔn)確率,成為了當(dāng)前研究的熱點(diǎn)。文獻(xiàn)[7]對(duì)社會(huì)和地理影響分別建模,并融合到矩陣分解框架中實(shí)現(xiàn)POI推薦。文獻(xiàn)[8]將POI內(nèi)容上的用戶(hù)首選項(xiàng)與其本身用戶(hù)首選項(xiàng)區(qū)分開(kāi)來(lái),并對(duì)用戶(hù)POI的位置偏好進(jìn)行位置感知建模,通過(guò)組合內(nèi)容和POI位置預(yù)測(cè)進(jìn)行最終的POI推薦。文獻(xiàn)[9]針對(duì)現(xiàn)有方法在POI推薦過(guò)程中融合個(gè)性化、情感傾向等方面的不足,提出了一種融合多因素的POI推薦模型,有效地融合地理相關(guān)、分類(lèi)偏好以及社交情感分?jǐn)?shù),實(shí)現(xiàn)Top-N的POI推薦,但該方法對(duì)于冷啟動(dòng)問(wèn)題還有待進(jìn)一步研究[10]。文獻(xiàn)[11]利用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)對(duì)用戶(hù)的復(fù)雜過(guò)渡行為進(jìn)行建模,很大程度上提升了POI推薦方法使用過(guò)程中的準(zhǔn)確程度。文獻(xiàn)[12]提出了一種基于譜嵌入增強(qiáng)方式的POI推薦算法,具有較好的推薦性能,但該方法不能深度融合LBSN中簽到數(shù)據(jù)上下文的多維特性,難以準(zhǔn)確獲得用戶(hù)最近鄰。文獻(xiàn)[13]提出了一種基于遞歸神經(jīng)網(wǎng)絡(luò)的POI推薦方法,在考慮相似用戶(hù)的位置興趣和包括時(shí)間、位置以及朋友偏好等上下文信息的基礎(chǔ)上,形成了用戶(hù)興趣和上下文信息的網(wǎng)絡(luò)神經(jīng)全特征表示方式。但該模型對(duì)特征向量的處理則忽視了用戶(hù)和POI之間的非線性關(guān)系,不能進(jìn)一步提升推薦準(zhǔn)確性[14]。
針對(duì)簽到數(shù)據(jù)多維度特性融合以及數(shù)據(jù)之間非線性聯(lián)系等問(wèn)題,提出了一種LBSN中利用深度學(xué)習(xí)的POI推薦方法,其主要?jiǎng)?chuàng)新點(diǎn)總結(jié)如下:
(1)構(gòu)建異構(gòu)的LBSN圖,即UP2Vec模型,其能夠整合信息進(jìn)行聯(lián)合建模,提高了信息的使用效率;
(2)為了準(zhǔn)確預(yù)測(cè)用戶(hù)POI偏好,所提方法采用譜嵌入的方式增強(qiáng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)用戶(hù)與POI的非線性關(guān)系,提高了POI推薦的準(zhǔn)確性。
為了便于論述,需要定義使用的關(guān)鍵概念,以及闡述POI推薦研究中的主要問(wèn)題。
定義1 POI:一個(gè)POI(p)被定義為其地理坐標(biāo)可用的唯一地理實(shí)體(如飯店或者電影院),則LSBN中可用的POI集合表示為P。
定義2 Check-in:三元組c=(p,u,t) 表示一個(gè)簽到,即用戶(hù)u在時(shí)間節(jié)點(diǎn)t訪問(wèn)POI(p)的簽到記為C,c∈C。
定義3 冷啟動(dòng)POI:冷啟動(dòng)POI定義為沒(méi)有簽到關(guān)聯(lián)的唯一地理實(shí)體,冷啟動(dòng)POI的集合表示為Pc。
定義4 孤立冷啟動(dòng)用戶(hù):孤立的冷啟動(dòng)用戶(hù)定義為唯一的LBSN用戶(hù),其地理坐標(biāo)可用,但是沒(méi)有遷入歷史紀(jì)錄,并且與其它LBSN用戶(hù)沒(méi)有任何聯(lián)系。孤立冷啟動(dòng)用戶(hù)的集合表示為Uc。
定義5 用戶(hù)位置:給定用戶(hù)u,將用戶(hù)居住地表示為pu(xu,yu), 并且其位置來(lái)自用戶(hù)的簽到記錄。具體而言,將地理空間位置離散為25×25 km的單元,并將簽到次數(shù)最多的單元位置定義為用戶(hù)家庭位置,該集合表示為PU,pu∈PU。
給定一個(gè)LBSN,用戶(hù)之間的簽到(c)和社交關(guān)系(L)是可用的。非孤立的POI(P),其地理信息以及時(shí)間信息可以從簽到中獲得,而非孤立用戶(hù)(U)可以從用戶(hù)之間的社會(huì)關(guān)系中獲得。此外,還考慮了孤立冷啟動(dòng)用戶(hù)(Uc)和冷啟動(dòng)POI(Pc)。
問(wèn)題1:POI推薦:給定用戶(hù)在時(shí)間t之前的歷史紀(jì)錄,POI推薦的目標(biāo)是推薦用戶(hù)在時(shí)間t時(shí)刻可能訪問(wèn)的前k個(gè)POI。
問(wèn)題2:冷啟動(dòng)POI推薦:給定用戶(hù)直到t時(shí)刻的歷史記錄,冷啟動(dòng)POI推薦的目標(biāo)是推薦用戶(hù)未來(lái)可能會(huì)訪問(wèn)的前k個(gè)冷啟動(dòng)POI。
問(wèn)題3:社交鏈接預(yù)測(cè):鏈接預(yù)測(cè)是社交網(wǎng)絡(luò)分析中的一個(gè)常見(jiàn)問(wèn)題,其目的是預(yù)測(cè)一對(duì)用戶(hù)之間是否存在社交關(guān)系。
提出的利用深度學(xué)習(xí)的POI推薦方法的整體架構(gòu)如圖1所示。利用設(shè)計(jì)的偏好增強(qiáng)譜聚類(lèi)(preference enhanced spectral clustering,PSC)算法分析用戶(hù)的簽到信息、社交信息和時(shí)間信息,由此得出用戶(hù)的不同維度的多個(gè)數(shù)據(jù)的空間特征信息,同時(shí)使用偏好增強(qiáng)譜聚類(lèi)算法對(duì)用戶(hù)進(jìn)行精準(zhǔn)分類(lèi)。同時(shí),利用改進(jìn)神經(jīng)網(wǎng)絡(luò)-多層感知器(improved multi-layer perceptron,IMLP)深度挖掘用戶(hù)與POI之間的非線性關(guān)聯(lián)。
深度學(xué)習(xí)的POI推薦方法由5部分組成,即神經(jīng)網(wǎng)絡(luò)輸入層、神經(jīng)網(wǎng)絡(luò)譜嵌入層、神經(jīng)網(wǎng)絡(luò)拼接層、神經(jīng)網(wǎng)絡(luò)隱含層以及神經(jīng)網(wǎng)絡(luò)輸出層。把用戶(hù)群體中的用戶(hù)與POI標(biāo)記對(duì)輸入譜嵌入層,經(jīng)過(guò)兩者的二分圖譜構(gòu)建潛在因子,以獲取兩者的譜特征集合描述。然后,拼接用戶(hù)與POI譜特征集合,從而構(gòu)成拼接集合,將其輸入隱含層,同時(shí),使用神經(jīng)網(wǎng)絡(luò)多隱含層結(jié)構(gòu)實(shí)現(xiàn)對(duì)用戶(hù)與深度學(xué)習(xí)的POI推薦方法間的深層次的關(guān)聯(lián)模仿。最后,利用神經(jīng)網(wǎng)絡(luò)softmax層實(shí)現(xiàn)用戶(hù)對(duì)于深度學(xué)習(xí)的POI推薦方法的偏好的預(yù)估輸出。
所提方法主要使用兩個(gè)公開(kāi)數(shù)據(jù)集(Foursquare和Gowalla)進(jìn)行論證,由于Gowalla和Foursquare數(shù)據(jù)集的分析結(jié)果類(lèi)似,因此僅顯示在Foursquare數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果。
2.1.1 簽到頻率分析
首先分析LBSN中用戶(hù)和POI的簽到頻率,結(jié)果如圖2所示。
從圖2中可以看出,只有少數(shù)POI和用戶(hù)主導(dǎo)了簽到活動(dòng),這意味著POI或用戶(hù)的簽到頻率遵循冪律分布。如果連通圖的度分布遵循冪律分布,那么短隨機(jī)游走中出現(xiàn)的節(jié)點(diǎn)頻率也將遵循冪律分布。因此利用Skip-gram模型構(gòu)建圖嵌入模型進(jìn)行表示學(xué)習(xí),同時(shí)采用隨機(jī)游走將異質(zhì)LBSN圖中的節(jié)點(diǎn)采樣為Node2Vec。
2.1.2 地理影響分析
用戶(hù)的簽到行為受到用戶(hù)地理位置因素的影響,用戶(hù)的地理位置因素也會(huì)對(duì)用戶(hù)在深度學(xué)習(xí)的POI推薦方法之間的轉(zhuǎn)換行為造成一定程度上的作用。在實(shí)際研究過(guò)程中,為深入探討用戶(hù)地理位置對(duì)用戶(hù)簽到行為的作用效果,對(duì)每個(gè)用戶(hù)的簽到時(shí)間進(jìn)行排序,并計(jì)算兩個(gè)相鄰POI之間的距離。然后匯總所有用戶(hù)的結(jié)果,并計(jì)算相同地理距離的累計(jì)簽到頻率。兩個(gè)相鄰POI之間地理距離的分布如圖3所示。其中橫軸表示相鄰簽到之間的距離,縱軸表示相鄰簽到活動(dòng)在此距離發(fā)生的概率,概率越大代表用戶(hù)更愿意訪問(wèn)POI。
從圖3中可以看出,連續(xù)簽到之間的地理距離分布遵循冪律分布,這表明用戶(hù)更愿意訪問(wèn)距訪問(wèn)POI更近的POI。因此,采用冪律分布模擬地理位置對(duì)用戶(hù)的簽到行為和用戶(hù)在POI之間的遷移行為的影響。
2.1.3 時(shí)間影響分析
從圖4中可以看出,用戶(hù)的移動(dòng)性行為在每24 h和每168 h(7天)左右呈現(xiàn)出較強(qiáng)的時(shí)間循環(huán)模式,分別顯示了日循環(huán)模式和周循環(huán)模式。所提方法中關(guān)注的是每日的周期性時(shí)間影響,因此,在日常基礎(chǔ)上對(duì)時(shí)間信息進(jìn)行建模。
根據(jù)上述分析結(jié)果構(gòu)建LBSN異構(gòu)圖,具體來(lái)說(shuō),為了同時(shí)學(xué)習(xí)用戶(hù)和POI的表示,使用Ω表示LBSN異構(gòu)圖
Ω=(V,E)
(1)
式中:V為L(zhǎng)BSN異構(gòu)圖的節(jié)點(diǎn)集合,將包含用戶(hù)集的U、POI的集合P、孤立冷啟動(dòng)用戶(hù)集合Uc和冷啟動(dòng)POI集合Pc等節(jié)點(diǎn)。E為異構(gòu)圖的邊緣集,該邊緣集是基于簽到記錄、用戶(hù)之間的社交關(guān)系、地理影響和時(shí)間信息構(gòu)建的。
2.2.1 簽到信息建模
簽到記錄直接表明用戶(hù)的歷史空間行為,因此,首先僅根據(jù)簽到信息構(gòu)建LBSN異構(gòu)圖,稱(chēng)該基本模型為UP2Vec。在構(gòu)建LBSN異構(gòu)圖時(shí),使用用戶(hù)集U、POI集合P、孤立冷啟動(dòng)用戶(hù)集合Uc和冷啟動(dòng)POI集合Pc構(gòu)建節(jié)點(diǎn)集V。對(duì)于邊緣集E,如果用戶(hù)和POI之間發(fā)生簽到行為,則將其在LBSN異構(gòu)圖中進(jìn)行連接,這種邊緣集表示為Ep,u。 對(duì)于孤立冷啟動(dòng)用戶(hù),連接到LBSN異構(gòu)圖中地理上最近的POI或用戶(hù);對(duì)于冷啟動(dòng)POI,同樣連接到地理上最近的POI或用戶(hù)。因此,UP2Vec中的LBSN異構(gòu)圖表示為
Ω0=(V,E)V=U∪P∪Uc∪PcE=Ep,u∪Ep,p
(2)
為了更加清楚描述LBSN異構(gòu)圖的構(gòu)建過(guò)程,給出了一個(gè)由UP2Vec建立的LBSN異構(gòu)圖的示例,如圖5所示。
圖5中,A、B、C、D、E是用戶(hù)節(jié)點(diǎn),E是孤立冷啟動(dòng)用戶(hù),節(jié)點(diǎn)1至節(jié)點(diǎn)16是POI節(jié)點(diǎn),節(jié)點(diǎn)17是冷啟動(dòng)POI。孤立冷啟動(dòng)用戶(hù)和冷啟動(dòng)POI節(jié)點(diǎn)通過(guò)虛線節(jié)點(diǎn)連接到最近的鄰居節(jié)點(diǎn)[16]。
2.2.2 社交關(guān)系建模
在簽到信息的基礎(chǔ)上,進(jìn)一步擴(kuò)展UP2Vec,將用戶(hù)之間的社會(huì)關(guān)系信息納入到異構(gòu)圖中,得到UP2Vec+。如果用戶(hù)之間存在社交關(guān)系,則連接相應(yīng)的節(jié)點(diǎn)。將UP2Vec表示為Ω′0=(V′,E′), 其中V′定義為V,E′定義為
E′=Ep,u∪Ep,p∪Eu,u
(3)
式中:Eu,u為基于社交關(guān)系構(gòu)建的邊緣集。UP2Vec+的模型結(jié)構(gòu),具有相同的V,但是社交關(guān)系已經(jīng)添加,即用戶(hù)A分別和用戶(hù)B、用戶(hù)C相連。
2.2.3 時(shí)間信息建模
V″=U∪Pτ∪Uc∪Pc
(4)
PSC算法主要是通過(guò)簽到信息、社交信息和時(shí)間信息獲得偏好歸一化相似度集合φ,由此進(jìn)一步得到歸一化的Laplacian集合φsym,根據(jù)φsym得到最小k個(gè)特征值對(duì)應(yīng)的數(shù)據(jù)集合,以此完成聚類(lèi)分析。
2.3.1 偏好提取歸一化相似度集合φ
所提方法同時(shí)考慮簽到與社交關(guān)系,利用偏好相似度?衡量?jī)蓚€(gè)用戶(hù)間的邊權(quán)重,計(jì)算如下
(5)
式中: |Pu1∩Pu2| 為u1與u2一起簽到的POI數(shù)量, ?u為兩個(gè)用戶(hù)之間的興趣偏好相似的程度, |Fu1∩Fu2| 為u1與u2的共有的好友數(shù)量, ?f為雙方友好聯(lián)系的程度。
同時(shí),利用隨機(jī)游走方法把兩用戶(hù)間的相似度作歸一化處理,則歸一化后的相似度集合φ計(jì)算如下
(6)
2.3.2 歸一化的Laplacian集合φsym
譜聚類(lèi)算法把聚類(lèi)問(wèn)題當(dāng)成圖像分解問(wèn)題,聚類(lèi)問(wèn)題的尋優(yōu)過(guò)程始終與 Laplacian的求解結(jié)果的特征集合的過(guò)程保持相同,因此,通過(guò)運(yùn)算獲得用戶(hù)相似度的集合就能得出所對(duì)應(yīng)的Laplacian矩陣[17,18]。則歸一化的Laplacian集合φsym計(jì)算如下
(7)
通過(guò)實(shí)踐研究可知,神經(jīng)網(wǎng)絡(luò)的功能,是通過(guò)對(duì)用戶(hù)的處理信息進(jìn)行檢索,并通過(guò)對(duì)用戶(hù)的推薦任務(wù)進(jìn)行分析,從而獲得用戶(hù)與目標(biāo)物品之間所存在的某些非線性的隱藏關(guān)聯(lián)信息[19]。由此,提出了創(chuàng)新性的譜嵌入增強(qiáng)的LMLP神經(jīng)網(wǎng)絡(luò),利用不同渠道和各種技術(shù)手段對(duì)用戶(hù)的各類(lèi)信息進(jìn)行分析,以完成下一個(gè)深度學(xué)習(xí)的POI推薦,其中IMLP包括了輸入層、譜嵌入層、拼接層、隱含層和輸出層。
現(xiàn)有的研究已經(jīng)論證了神經(jīng)網(wǎng)絡(luò)能夠有效處理信息檢索與推薦任務(wù)中獲取用戶(hù)與物品間非線性的隱藏關(guān)聯(lián)[19]。因此,所提方法設(shè)計(jì)了譜嵌入增強(qiáng)的神經(jīng)網(wǎng)絡(luò)IMLP,通過(guò)分析用戶(hù)的各種信息完成用戶(hù)下一個(gè)POI的推薦,其中IMLP包括了輸入層、譜嵌入層、拼接層、隱含層和輸出層。
用戶(hù)與POI 間的簽到關(guān)聯(lián)能夠以二分圖的形式進(jìn)行描述,其中包括了兩者許多連通的關(guān)聯(lián)信息,而非直接的隱藏連通程度對(duì)獲取用戶(hù)偏好具有非常重要的作用[20,21]。IMLP中的譜嵌入層即利用連通信息圖的譜完成對(duì)用戶(hù)與POI的譜映射,以得到兩者的譜嵌入量,計(jì)算如下
(8)
所提方法利用神經(jīng)網(wǎng)絡(luò)模擬輸入用戶(hù)與POI關(guān)系對(duì)、輸出 POI推薦位置兩者間的聯(lián)系。其中選擇非線性激活函數(shù),采用增加隱含層層數(shù)的方式使得IMLP能夠接近任何復(fù)雜函數(shù),以更為精準(zhǔn)地表述輸入和輸出之間的聯(lián)系,并且把神經(jīng)元的輸出反映至存在邊界的區(qū)域內(nèi)[22,23]。所以,IMLP各個(gè)層次的輸出值計(jì)算如下
x=h0=[ui,pj]Th1(x)=ReLU(ω1h0+b1)h2(x)=ReLU(ω2h1(x)+b2)hq(x)=ReLU(ωqhq-1(x)+bq)
(9)
式中:ωq,bq為第q層的參數(shù),當(dāng)q=0時(shí),x便是用戶(hù)與POI對(duì)的拼接量。
(10)
此外,選擇對(duì)數(shù)損失函數(shù)(llog)當(dāng)作IMLP網(wǎng)絡(luò)的目標(biāo)函數(shù),計(jì)算如下
(11)
實(shí)驗(yàn)中使用兩個(gè)公開(kāi)的真實(shí)數(shù)據(jù)集(Foursquare和Gowalla)對(duì)所提方法的性能進(jìn)行評(píng)估。其中Foursquare數(shù)據(jù)集中包含2009年12月至2013年7月之間來(lái)自California用戶(hù)的483 813條簽到記錄,還包含32 512位用戶(hù)之間的社交數(shù)據(jù)。Gowalla數(shù)據(jù)集是在2010年8月公共收集的,其包含來(lái)自216 734位活躍用戶(hù)的12 846 151次簽到記錄,其中簽到記錄包含1 421 262個(gè)位置和736 778個(gè)社交關(guān)系。這兩個(gè)數(shù)據(jù)集中的每一個(gè)簽到記錄包含唯一的用戶(hù)ID、POI ID、POI類(lèi)別、POI的描述信息、相應(yīng)的經(jīng)緯度坐標(biāo)以及與此簽到相關(guān)的時(shí)間戳。為了測(cè)試UP2Vec的冷啟動(dòng)POI推薦功能,從Foursquare和Gowalla數(shù)據(jù)集中選擇了2000個(gè)POI作為冷啟動(dòng)的POI。
POI推薦的任務(wù)從給定的測(cè)試用戶(hù)可能會(huì)訪問(wèn)的POI集合中選擇POI,具體的說(shuō),給定用戶(hù)和候選POI集合,計(jì)算用戶(hù)表示和POI表示的內(nèi)積,再按照降序?qū)OI進(jìn)行排序。之后,選擇前K個(gè)POI生成推薦列表。所提方法采用廣泛使用的基于排名的評(píng)價(jià)指標(biāo)Acc@K進(jìn)行評(píng)估。對(duì)每個(gè)測(cè)試樣本,若訪問(wèn)的POI出現(xiàn)在前K個(gè)推薦列表中,則Acc@K為1,反之為0??傮wAcc@K取所有測(cè)試樣本的平均值。
在現(xiàn)實(shí)條件下,對(duì)深度學(xué)習(xí)的POI推薦進(jìn)行一系列實(shí)踐實(shí)驗(yàn),對(duì)所有的目標(biāo)用戶(hù),將所有用戶(hù)中前80%的用戶(hù)簽到數(shù)據(jù)作為POI推薦實(shí)驗(yàn)的訓(xùn)練集,將所有用戶(hù)中最新10%的用戶(hù)簽到數(shù)據(jù)作為POI推薦實(shí)驗(yàn)的測(cè)試集,將所有用戶(hù)中最后所剩的10%的用戶(hù)數(shù)據(jù)作為POI推薦實(shí)驗(yàn)的驗(yàn)證集來(lái)對(duì)參數(shù)進(jìn)行調(diào)整。
在論證所提方法的推薦性能之前,需要對(duì)UP2Vec中的參數(shù)進(jìn)行討論。參數(shù)的初始默認(rèn)值分別為:維度d=256、 鄰域范圍ζ=10、 返回參數(shù)υ=1、 輸入-輸出參數(shù)v=1, LBSN異構(gòu)圖中每個(gè)邊的轉(zhuǎn)移概率統(tǒng)一設(shè)置為1。為了研究特定參數(shù)對(duì)模型參數(shù)的影響,當(dāng)分析某個(gè)特定參數(shù)時(shí),該參數(shù)值在一定范圍內(nèi)變化,其它參數(shù)仍取默認(rèn)值。由于UP2Vec、UP2Vec+和UP2Vec++的表示無(wú)明顯差異,因此僅分析UP2Vec++在Fouresquare數(shù)據(jù)集上的推薦結(jié)果,如圖6所示。其中橫坐標(biāo)表示參數(shù)值的變化,縱坐標(biāo)表示在Acc@15下,POI的推薦性能。
從圖6中可以看出,當(dāng)輸入-輸出參數(shù)v變大而返回參數(shù)υ變小時(shí),Acc@15的值在不斷增大,表明UP2Vec++的性能在不斷提高。并且推薦精度隨著維度d的增加而增加,當(dāng)d達(dá)到一定值時(shí),性能達(dá)到峰值趨于飽和狀態(tài)。不過(guò),當(dāng)鄰域范圍大小ζ變大時(shí),推薦精度Acc@15將會(huì)降低。
由于隨著v的增大和υ的減小,將對(duì)更多附近節(jié)點(diǎn)進(jìn)行采樣,因此,更多的信息輸入推薦模型,以進(jìn)行更有效的POI推薦。而鄰域范圍ζ越大,將會(huì)在學(xué)習(xí)特征量時(shí)引入噪聲數(shù)據(jù),這會(huì)降低特征值的可靠性,因此POI推薦的準(zhǔn)確性降低。因此,將UP2Vec的默認(rèn)參數(shù)設(shè)置為d=256、ζ=8、υ=0.24、v=5, 模型在數(shù)據(jù)集Fouresquare和Gowalla上具有最好的推薦性能。綜上所述,針對(duì)地理影響、用戶(hù)社會(huì)關(guān)系和時(shí)間信息之類(lèi)的語(yǔ)境因素共同建模,能為L(zhǎng)BSN異構(gòu)圖中的用戶(hù)和POI提供更好的表示學(xué)習(xí)。
為了論證所提方法的POI推薦性能,將其與文獻(xiàn)[7]、文獻(xiàn)[11]、文獻(xiàn)[13]在POI推薦、POI冷啟動(dòng)推薦、偏好預(yù)測(cè)等3個(gè)方面進(jìn)行對(duì)比分析。其中文獻(xiàn)[7]針對(duì)社會(huì)和地理影響進(jìn)行建模,并利用矩陣分解框架實(shí)現(xiàn)POI推薦。文獻(xiàn)[11]利用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)對(duì)用戶(hù)的復(fù)雜過(guò)渡行為進(jìn)行建模,以完成POI推薦。文獻(xiàn)[13]提出基于遞歸神經(jīng)網(wǎng)絡(luò)的POI推薦方法,通過(guò)相似用戶(hù)的位置興趣和上下文信息的全特征表示提高POI推薦性能。
4.3.1 POI推薦
在Fouresquare和Gowalla數(shù)據(jù)集上,使用不同方法進(jìn)行POI推薦的性能比較結(jié)果如圖7所示。
從圖7中可以看出,所提方法在數(shù)據(jù)集Fouresquare和Gowalla上的推薦性能明顯優(yōu)于其它方法。由于所提方法采用PSC算法方法對(duì)簽到信息、社交信息和時(shí)間信息進(jìn)行聚類(lèi)分析,并利用IMLP網(wǎng)絡(luò)實(shí)現(xiàn)POI推薦,與文獻(xiàn)[13]相比,在兩個(gè)數(shù)據(jù)集上的Acc@N值分別提高了33.33%~47.06%、21.05%~43.75%,因此結(jié)合社交關(guān)系、時(shí)間信息和地理影響可以更好獲取用戶(hù)的POI訪問(wèn)行為。文獻(xiàn)[11]利用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)POI推薦,但單一模型在信息處理過(guò)程中仍不充分,因此性能不佳。由于文獻(xiàn)[7]中用戶(hù)POI矩陣的稀疏性以及缺少對(duì)時(shí)間信息和地理信息的使用,其推薦性能最差,在兩個(gè)數(shù)據(jù)集上的Acc@15均低于0.15。
4.3.2 POI冷啟動(dòng)推薦
由于兩個(gè)數(shù)據(jù)集上冷啟動(dòng)POI推薦實(shí)驗(yàn)結(jié)果相似。因此,僅分析在Fouresquare數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,不同方法的冷啟動(dòng)POI推薦對(duì)比結(jié)果如圖8所示。
從圖8中可以看出,不同的K值下,所提方法的冷啟動(dòng)POI推薦性能優(yōu)于其它對(duì)比方法,以Acc@10為例,所提方法分別高出其它3種方法0.03、0.02、0.07。此外,對(duì)比圖8與圖7(a),可以發(fā)現(xiàn)在POI冷啟動(dòng)推薦中,各方法的推薦性能均明顯降低。當(dāng)K=5時(shí),所提方法的推薦精度降低20%,而其它3種方法分別下降了23.62%、25%、33.33%,因此所提方法在處理冷啟動(dòng)時(shí)的推薦性能下降幅度相對(duì)較小,意味著其在處理POI冷啟動(dòng)問(wèn)題上有更強(qiáng)的魯棒性。由于所提方法考慮了地理特征、POI簽到序列和時(shí)間特征建模POI冷啟動(dòng)推薦,并且采用了更細(xì)粒度的地理信息,而部分方法沒(méi)有考慮多種信息,或者采用的是粗粒度地理信息,因此冷啟動(dòng)POI推薦性能不佳。
4.3.3 偏好預(yù)測(cè)
同樣的,不同方法在偏好預(yù)測(cè)方面的性能對(duì)比結(jié)果如圖9所示。
從圖9中可以看出,在準(zhǔn)確率、召回率、F1值3個(gè)指標(biāo)上,所提方法的預(yù)測(cè)性能均高于其它對(duì)比方法,以準(zhǔn)確率為例,其在兩個(gè)數(shù)據(jù)集上分別為95%和91%,而其它方法均低于90%。主要是因?yàn)樗岱椒ㄍㄟ^(guò)UP2Vec++學(xué)習(xí)用戶(hù)的表示形式,其中包含社交關(guān)系、POI和用戶(hù)的時(shí)空特征,并且利用IMLP進(jìn)行偏好預(yù)測(cè),進(jìn)一步提升了POI推薦的準(zhǔn)確率。文獻(xiàn)[13]利用遞歸神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)POI推薦,其中考慮了用戶(hù)的位置興趣和上下文信息,因此整體性能優(yōu)于文獻(xiàn)[11],而文獻(xiàn)[11]僅利用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)進(jìn)行信息處理,各種用戶(hù)信息考慮得不夠全面。文獻(xiàn)[7]利用矩陣分解框架處理社會(huì)和地理影響,而缺乏用戶(hù)POI矩陣稀疏性的考慮,其推薦性能較差,推薦準(zhǔn)確率大約為75%。
LBSN中含有豐富的語(yǔ)境信息,如簽到信息、時(shí)間信息、社交關(guān)系等,能夠更加全面地推薦用戶(hù)下一個(gè)POI,但各種語(yǔ)境信息存在異構(gòu)性,POI推薦的性能也受到此影響。為此,提出了一種LBSN中利用深度學(xué)習(xí)的POI推薦方法。在UP2Vec模型中整合地理簽到信息、用戶(hù)社會(huì)關(guān)系和時(shí)間信息等語(yǔ)境,并利用PSC算法進(jìn)行分析處理,以得到用戶(hù)群體分組。在此基礎(chǔ)上,結(jié)合POI信息,利用IMLP網(wǎng)絡(luò)深度挖掘用戶(hù)與POI 之間的非線性關(guān)聯(lián),實(shí)現(xiàn)POI的準(zhǔn)確推薦。基于Foursquare和Gowalla數(shù)據(jù)集對(duì)所提方法進(jìn)行實(shí)驗(yàn)論證,結(jié)果表明,將UP2Vec參數(shù)設(shè)置為d=256、ζ=8、υ=0.24、v=5時(shí),模型性能最佳。此外,所提方法在POI推薦、POI冷啟動(dòng)推薦和偏好預(yù)測(cè)3個(gè)方面的推薦性能均優(yōu)于其它對(duì)比方法,其中,在POI推薦的Acc@N值較文獻(xiàn)[13]提高了21.05%~47.06%,在POI冷啟動(dòng)推薦的Acc@10值分別高出0.03、0.02、0.07,并且推薦準(zhǔn)確率分別為95%和91%。因此,通過(guò)該方法學(xué)習(xí)的用戶(hù)和POI表示可用于進(jìn)一步提高LBSN任務(wù)中位置推薦和偏好預(yù)測(cè)的性能。
由于POI推薦過(guò)程中并沒(méi)有根據(jù)用戶(hù)偏好進(jìn)行動(dòng)態(tài)調(diào)整,在接下來(lái)的研究中,將重點(diǎn)關(guān)注注意力機(jī)制的引用,以便在LBSN中更好進(jìn)行POI推薦和用戶(hù)表示學(xué)習(xí)。