亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于潛在地理—社會(huì)關(guān)系感知的興趣點(diǎn)推薦研究

        2017-11-01 21:38:40宋啟祥李玉林戚溪溪
        宿州學(xué)院學(xué)報(bào) 2017年9期
        關(guān)鍵詞:密度估計(jì)集上矩陣

        崔 琳,宋啟祥,李玉林,戚溪溪

        宿州學(xué)院信息工程學(xué)院,宿州,234000

        基于潛在地理—社會(huì)關(guān)系感知的興趣點(diǎn)推薦研究

        崔 琳,宋啟祥,李玉林,戚溪溪

        宿州學(xué)院信息工程學(xué)院,宿州,234000

        針對(duì)已有的興趣點(diǎn)推薦模型大都采用無(wú)地理空間限制的顯式社會(huì)關(guān)系和隱式社會(huì)關(guān)系進(jìn)行興趣點(diǎn)推薦,而基于地理空間限制的顯式社會(huì)關(guān)系和隱式社會(huì)關(guān)系對(duì)興趣點(diǎn)推薦結(jié)果有著極為重要的影響。為此,提出了一種新型的基于潛在地理—社會(huì)關(guān)系挖掘的興趣點(diǎn)推薦模型。使用核密度估計(jì)方法對(duì)用戶簽到行為可達(dá)的地理影響區(qū)域進(jìn)行個(gè)性化分析,然后使用所提出的兩跳隨機(jī)游走算法挖掘用戶之間的顯式社會(huì)關(guān)系和隱式社會(huì)關(guān)系,把用戶可達(dá)地理區(qū)域內(nèi)的顯式社會(huì)關(guān)系和隱式社會(huì)關(guān)系作為一個(gè)正則項(xiàng)融合到傳統(tǒng)的矩陣分解模型中。兩個(gè)真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果顯示所提出的潛在地理—社會(huì)關(guān)系挖掘的興趣點(diǎn)推薦模型優(yōu)于文中所選擇的其他4個(gè)興趣點(diǎn)推薦對(duì)比方法。

        基于位置的社會(huì)網(wǎng)絡(luò);興趣點(diǎn)推薦;地理-社會(huì)關(guān)系;顯式社會(huì)關(guān)系;隱式社會(huì)關(guān)系

        隨著移動(dòng)設(shè)備、無(wú)線通訊和位置獲取技術(shù)的迅速發(fā)展,基于位置的社會(huì)網(wǎng)絡(luò)(Location-based social networks,LBSN)Foursquare、Gowalla、Facebook places和豆瓣網(wǎng)等已吸引了成千上萬(wàn)用戶的注意[1-3]。在這些基于位置的社會(huì)網(wǎng)絡(luò)下,用戶可以分享他們?cè)L問某一具體位置的經(jīng)驗(yàn),并把自己認(rèn)為不錯(cuò)的場(chǎng)所,如飯店、商店和博物館等推薦給其他用戶,這就是興趣點(diǎn)推薦。當(dāng)前,有許多關(guān)于興趣點(diǎn)推薦研究的工作。其中,一些研究顯示人們總是探索他們之前訪問過興趣點(diǎn)附近的位置[4-5],因此被用戶訪問過的興趣點(diǎn)常常呈現(xiàn)出空間聚類的特征。一些研究工作聚焦于使用LBSN中的用戶關(guān)系來(lái)改善推薦性能,此工作把所有存在社會(huì)鏈接關(guān)系的相似度作為正則項(xiàng)融合到推薦系統(tǒng)中來(lái)約束矩陣分解;然而,在推薦任務(wù)中,只依賴于用戶之間直接存在的顯式鏈接社會(huì)關(guān)系是不太有效的[6]。

        在基于位置的社會(huì)網(wǎng)絡(luò)下,挖掘某一特定的地理區(qū)域下用戶之間的顯式—隱式社會(huì)關(guān)系非常重要。例如,對(duì)于用戶Linda,假設(shè)存在兩種類型的用戶和Linda有地理—社會(huì)相關(guān)性,一種類型的用戶是在Linda可達(dá)的地理空間下和Linda有直接聯(lián)系的用戶,被定義為與Linda存在顯式社會(huì)關(guān)系的用戶;另一種類型的用戶是在Linda可達(dá)的地理空間下,Linda朋友的朋友,與Linda之間通過Linda的朋友間接和Linda存在關(guān)系,這種關(guān)系在本文中被定義為用戶之間的隱式社會(huì)關(guān)系。在Linda可以到達(dá)的區(qū)域,借助于顯式—隱式用戶關(guān)系,能夠?yàn)長(zhǎng)inda推薦Linda未簽到的,但又是Linda有可能感興趣的興趣點(diǎn)。

        受上邊例子所啟發(fā),本文提出一種基于潛在地理—社會(huì)關(guān)系感知的興趣點(diǎn)推薦模型(Potential Geo-Social Relationship Awareness for Point of Interest Recommendation,PGSR-PR)。在地理—社會(huì)關(guān)系挖掘階段,用戶間的顯式—隱式地理-社會(huì)關(guān)系使用核密度估計(jì)方法和兩跳隨機(jī)游走算法被識(shí)別出來(lái)。然后,把識(shí)別出的顯式—隱式地理—社會(huì)關(guān)系作為一個(gè)正則項(xiàng)融合到矩陣分解中。最后,使用改進(jìn)的矩陣分解模型實(shí)現(xiàn)把前N個(gè)興趣點(diǎn)的推薦列表(top-N)推薦給用戶。這是第一個(gè)聚焦于某一地理區(qū)域下的顯式—隱式用戶關(guān)系的興趣點(diǎn)推薦模型。為了驗(yàn)證PGSR-PR模型的有效性,與其他4種基線方法在Foursquare和Gowalla數(shù)據(jù)集上作了實(shí)驗(yàn)結(jié)果比較與分析,結(jié)果顯示所提出的PGSR-PR模型在精確率(P@N)、召回率(R@N)和歸一化折扣累計(jì)增益(NDCG)指標(biāo)上優(yōu)于其他4種基線方法。

        1 相關(guān)工作

        以下介紹與本研究相關(guān)的三項(xiàng)研究工作,即傳統(tǒng)推薦方法、矩陣分解技術(shù)、基于地理空間關(guān)系和社會(huì)關(guān)系的興趣點(diǎn)推薦方法。

        1.1 傳統(tǒng)推薦方法

        傳統(tǒng)推薦方法分為基于內(nèi)容的方法和協(xié)同過濾方法兩類[7]。基于內(nèi)容的推薦方法主要依據(jù)推薦項(xiàng)目和用戶畫像內(nèi)容信息的相關(guān)性,為用戶推薦相關(guān)的項(xiàng)目[8],但是不能靈活地結(jié)合與用戶相關(guān)的各種各樣的信息,故很少被用于興趣點(diǎn)推薦。協(xié)同過濾率方法主要分為基于記憶的方法和基于模型的方法兩類[9]。例如,Ye等人采用基于記憶的方法執(zhí)行興趣點(diǎn)推薦,然而,基于記憶的推薦方法通常面臨冷啟動(dòng)和數(shù)據(jù)稀疏性等問題[10]?;谀P偷耐扑]方法已被廣泛應(yīng)用于興趣點(diǎn)推薦[11],這種方法把原始的評(píng)分矩陣擬合為一個(gè)模型,通過概率分布或者低維矩陣減少模型的維度和稀疏性,然后被應(yīng)用于預(yù)測(cè)未評(píng)價(jià)項(xiàng)目的分?jǐn)?shù)。在基于不同模型的方法中,矩陣分解是一種最被常用的方法,由于其可擴(kuò)展性和更為精確的優(yōu)勢(shì),已引起許多關(guān)注。

        1.2 矩陣分解技術(shù)

        矩陣分解已被成功地用于各種各樣的推薦系統(tǒng),它假設(shè)用戶和項(xiàng)目(興趣點(diǎn)、電影和產(chǎn)品等)能夠被建模成潛在表示集合,在一起確定未評(píng)分項(xiàng)目的愛好[12]。許多矩陣分解模型已被用于興趣點(diǎn)推薦領(lǐng)域,例如,Zhao等人通過使用用戶、地點(diǎn)和時(shí)間的異構(gòu)關(guān)系,提出一種貝葉斯概率張量分解模型去抽取推薦的社會(huì)維度[13];Hu等人通過考慮項(xiàng)目的內(nèi)在特征和它的地理鄰居的外在特征,開發(fā)了一種基于矩陣分解的潛在因子模型用于地理評(píng)分預(yù)測(cè),與其他方法相比較,此模型能獲得更低的預(yù)測(cè)誤差[14]。

        1.3 基于地理空間關(guān)系和社會(huì)關(guān)系的興趣點(diǎn)推薦方法

        在基于位置的社會(huì)網(wǎng)絡(luò)下,用戶的朋友比非朋友能分享更多的用戶自身感興趣的信息,一些興趣點(diǎn)推薦方法通過考慮社會(huì)關(guān)系來(lái)改善推薦的質(zhì)量。Berjani等人在基于位置的社會(huì)網(wǎng)絡(luò)下提出基于正則矩陣分解的興趣點(diǎn)推薦方法[15]。Ye等人基于朋友共同訪問的簽到數(shù),提出了基于朋友的協(xié)同過濾方法用于興趣點(diǎn)推薦,基于朋友間的社會(huì)鏈接關(guān)系和他們簽到活動(dòng)的相似度,推導(dǎo)了兩個(gè)朋友間的社會(huì)影響權(quán)重[16]。Li等人開發(fā)了一個(gè)新的社會(huì)朋友概率矩陣分解模型,在社會(huì)朋友空間,用戶愛好被假設(shè)通過社會(huì)網(wǎng)絡(luò)傳播,重復(fù)訪問他的朋友訪問過的歷史興趣點(diǎn)[1]。

        最新研究顯示位置的地理臨近性大大影響用戶的簽到行為。Liu等人觀察發(fā)現(xiàn)用戶總是訪問離家或者辦公室近的位置,也比較感興趣探索他們?cè)L問過的位置就近的地方。他們假設(shè)被同一個(gè)用戶訪問的兩個(gè)位置之間的地理距離遵循冪律分布[17]。Cheng等人論述用戶總是訪問中心周圍(即最經(jīng)常訪問的興趣點(diǎn))的位置,并假設(shè)簽到位置在每個(gè)中心周圍遵循高斯分布[18]。Lian等人提出一個(gè)包含地理因素的加權(quán)正則化矩陣分解模型來(lái)提升興趣點(diǎn)的推薦性能[5]。

        觀察以上研究工作,發(fā)現(xiàn)用戶的簽到行為明顯受用戶的愛好、用戶間的社會(huì)關(guān)系和所處的地理空間影響。已有許多興趣點(diǎn)推薦研究考慮用戶的愛好、他們的社會(huì)關(guān)系和地理空間。然而,仍然沒有同時(shí)考慮在用戶可達(dá)的某一區(qū)域內(nèi),有關(guān)用戶之間顯式—隱式地理—社會(huì)關(guān)系對(duì)興趣點(diǎn)推薦的影響研究。因此,本文聚焦已有研究工作所忽略的在用戶可達(dá)的某一區(qū)域內(nèi)相關(guān)用戶之間顯式—隱式地理—社會(huì)關(guān)系對(duì)興趣點(diǎn)推薦的影響,提出PGSR-PR模型。

        2 研究準(zhǔn)備

        基于位置的社會(huì)網(wǎng)絡(luò)包含豐富的信息,假設(shè)u={u1,u2,…,um}?U,p={p1,p2,…,pn}?P分別是用戶的子集和興趣點(diǎn)的子集。所謂興趣點(diǎn)(Point of Interest),就是指在基于位置的社會(huì)網(wǎng)絡(luò)下,可以被識(shí)別出的具體事件和地點(diǎn)。如果用戶ui已在興趣點(diǎn)pj簽到,則規(guī)定rij≠0,否則rij=0。給定來(lái)自基于位置社會(huì)網(wǎng)絡(luò)下的社會(huì)鏈接,構(gòu)建一個(gè)社會(huì)鏈接關(guān)系矩陣SU×U,如果在不同的用戶ui∈U與uk∈U之間存在鏈接,Sui,uk=1,否則Sui,uk=0。興趣點(diǎn)推薦問題轉(zhuǎn)化為在興趣點(diǎn)P中根據(jù)用戶的簽到行為為用戶u推薦新的未訪問過的興趣點(diǎn)。為便于閱讀,表1描述了本文所用到的一些概念。

        表1 相關(guān)概念列表

        3 基于潛在地理—社會(huì)關(guān)系感知的興趣點(diǎn)推薦方法

        以下詳細(xì)介紹所提出的基于核密度估計(jì)和兩跳隨機(jī)游走算法的潛在地理—社會(huì)關(guān)系感知興趣點(diǎn)推薦方法,把基于核密度估計(jì)和兩跳隨機(jī)游走算法的潛在地理—社會(huì)關(guān)系作為正則項(xiàng)融合到矩陣分解推薦方法中,使用隨機(jī)梯度下降算法(Stochastic Gradient Descent,SGD)學(xué)習(xí)相應(yīng)的模型參數(shù)。

        3.1 挖掘潛在地理—社會(huì)關(guān)系感知信息

        地理位置的個(gè)性化影響在個(gè)性化用戶簽到行為中扮演著重要的角色,本文使用核密度估計(jì)方法建模被用戶訪問的兩個(gè)位置之間的距離的個(gè)性化分布。分析用戶簽到的地理位置,發(fā)現(xiàn)用戶在連續(xù)時(shí)間內(nèi)總是訪問上次簽到興趣點(diǎn)就近的地方,并且訪問一個(gè)位置的意愿隨著離當(dāng)前位置距離的增加而減少。使用核密度估計(jì)方法,首先計(jì)算位置Li和位置lo之間的距離,計(jì)算方法如下:

        dio=distance(Li,lo), ?li∈Li

        (1)

        在距離d∈D上的核密度估計(jì)f,計(jì)算如下:

        (2)

        其中,D是一個(gè)特定用戶的距離樣本,來(lái)自于未知密度f(wàn)的分布,K(·)是核函數(shù),h是路徑距離衰減閾值,叫作帶寬。n是興趣點(diǎn)的個(gè)數(shù),興趣點(diǎn)和其他位置s的距離小于或者等于h。使用正則化核,表示如下:

        (3)

        最優(yōu)化帶寬表示如下:

        (4)

        基于核密度的距離度量后,基于公式(5)來(lái)推斷用戶ui訪問新位置lo的概率,給定訪問位置Li={l1,l2,…,ln}的集合。最后,用戶ui訪問新位置lo的概率,采用公式(5)表述的概率平均值獲得:

        (5)

        另外,本文采用所提出的兩跳隨機(jī)游走算法來(lái)計(jì)算用戶之間顯式—隱式鏈接關(guān)系相似度。兩跳隨機(jī)游走模型是指從一個(gè)給定的用戶節(jié)點(diǎn)游走到一個(gè)任何他的鄰居節(jié)點(diǎn)的過程。用戶ui和用戶uj之間的顯式—隱式關(guān)系被定義為從用戶ui到用戶uj之間隨機(jī)游走的平均步數(shù):

        (6)

        其中,score(e)表示存在用戶節(jié)點(diǎn)ui和用戶uj之間的未知鏈接e的評(píng)分,這個(gè)值也被看作是用戶節(jié)點(diǎn)ui和用戶uj之間的相關(guān)度。paths(i,j)表示節(jié)點(diǎn)ui和用戶uj之間的所有路徑的集合,edges(p)是包含在路徑p中的所有邊的集合,p(e′)是在隨機(jī)游走時(shí)選擇邊e′的概率。p(e′)值的中心思想是,邊e′的權(quán)重越大,p(e′)的值也越大。邊e′起始節(jié)點(diǎn)的鄰接邊集合的權(quán)重之和越大,p(e′)的值就越小,公式定義如下:

        (7)

        其中,w(e′)表示邊e′的權(quán)重,x′表示邊e′的初始邊,〈x′〉表示邊x′的鄰接邊集合。

        在由用戶集合構(gòu)成的無(wú)向圖中,因?yàn)橛脩艏系囊?guī)模非常大,圖也很復(fù)雜,計(jì)算兩個(gè)用戶節(jié)點(diǎn)之間所有路徑集合的計(jì)算成本也非常高。因此,在執(zhí)行隨機(jī)游走操作時(shí),每次游走只在邊數(shù)小于或者等于3的路徑內(nèi)進(jìn)行,也就是本文定義的兩跳(Two-hop)。

        通過推斷目標(biāo)用戶的顯式—隱式朋友在興趣點(diǎn)上的愛好和他們的個(gè)性化移動(dòng)模式(使用核密度估計(jì)計(jì)算),融合這兩個(gè)因素來(lái)推斷目標(biāo)用戶ui在一個(gè)興趣點(diǎn)o簽到的概率。在用戶ui可達(dá)區(qū)域內(nèi),用戶ui和其潛在朋友集合的相似度采用公式(8)進(jìn)行計(jì)算:

        wik=p(loLi)·p(e′)

        (8)

        公式(8)融合了用戶愛好、社會(huì)影響和兩個(gè)用戶居住距離的地理影響到基于位置的興趣點(diǎn)推薦過程中。

        3.2 傳統(tǒng)的矩陣分解模型

        傳統(tǒng)的矩陣分解推薦模型假設(shè)存在潛在因子影響用戶的簽到行為或者評(píng)分行為,在用戶—項(xiàng)目評(píng)分矩陣中執(zhí)行低秩矩陣分解。讓Ui∈Rm×k表示用戶ui的用戶愛好矩陣,Pj∈Rn×k表示興趣點(diǎn)pj的興趣點(diǎn)特征矩陣,其中,K是潛在因子個(gè)數(shù),并假設(shè)K?(m,n)。傳統(tǒng)的基于矩陣分解的推薦模型的主要思想可以通過如下公式表示:

        (9)

        (10)

        3.3 基于潛在地理—社會(huì)關(guān)系感知的興趣點(diǎn)推薦模型

        使用傳統(tǒng)的矩陣分解模型作為基礎(chǔ),嵌入潛在地理—社會(huì)關(guān)系感知因素,引入本文所提出的PGSR-PR模型捕獲潛在地理—社會(huì)關(guān)系感知的興趣點(diǎn)推薦。在傳統(tǒng)低秩矩陣分解模型基礎(chǔ)上,PGSR-PR模型定義的目標(biāo)函數(shù)如下:

        (13)

        其中,參數(shù)β旨在平衡潛在地理—社會(huì)關(guān)系對(duì)興趣點(diǎn)推薦影響的效果,把它作為一個(gè)正則化項(xiàng)來(lái)約束矩陣分解,以獲得更高的推薦準(zhǔn)確率。

        3.4 基于潛在地理—社會(huì)關(guān)系感知的興趣點(diǎn)推薦模型的優(yōu)化

        本文使用隨機(jī)梯度下降算法(Stochastic Gradient Descent,SGD)來(lái)優(yōu)化目標(biāo)函數(shù)。隨機(jī)梯度下降算法隨機(jī)掃描所有的訓(xùn)練數(shù)據(jù)并針對(duì)每一個(gè)用戶—興趣點(diǎn)元素,沿著目標(biāo)函數(shù)梯度下降的方向更新參數(shù)。模型優(yōu)化更新采用如下公式執(zhí)行:

        (14)

        其中,ξ是學(xué)習(xí)率,Λ表示所有被包含的參數(shù),?F(·)對(duì)應(yīng)公式(13)中的目標(biāo)函數(shù)。為了獲得公式(14)中Ui和Pj的梯度,目標(biāo)函數(shù)的最小化可以通過執(zhí)行隨機(jī)梯度算法來(lái)進(jìn)行計(jì)算,分別對(duì)參數(shù)Ui和Pj引入梯度計(jì)算和更新。

        與用戶Ui有關(guān)的梯度采用公式(15)進(jìn)行計(jì)算:

        (15)

        因此,Ui被更新為:

        (16)

        與Pj有關(guān)的梯度采用公式(17)進(jìn)行計(jì)算:

        (17)

        Pj被更新為:

        (18)

        表2 基于潛在地理—社會(huì)關(guān)系感知的興趣點(diǎn)推薦模型算法

        4 實(shí)驗(yàn)結(jié)果和分析

        4.1 實(shí)驗(yàn)數(shù)據(jù)集

        采用從Foursquare和Gowalla網(wǎng)站抓取的數(shù)據(jù)集。第一個(gè)Foursquare數(shù)據(jù)集來(lái)自Gao等人所挖掘的數(shù)據(jù)集[2],第二個(gè)實(shí)驗(yàn)數(shù)據(jù)集來(lái)自Zhao等人所挖掘的數(shù)據(jù)集[19]。這兩個(gè)數(shù)據(jù)集中的每一條簽到記錄包含用戶ID、位置ID以及用戶在某一位置的簽到頻率、用戶畫像、用戶友誼關(guān)系、位置畫像和用戶的簽到歷史。在本實(shí)驗(yàn)中,前期數(shù)據(jù)預(yù)處理時(shí),過濾掉了簽到次數(shù)小于、等于10的用戶和少于10個(gè)用戶簽到的興趣點(diǎn)個(gè)數(shù)。

        4.2 實(shí)驗(yàn)設(shè)置與實(shí)驗(yàn)比較方法

        在實(shí)驗(yàn)設(shè)置中,設(shè)定學(xué)習(xí)率ξ=0.001,潛在因子K從{10,20,30,40,50,60,70,80}中多次進(jìn)行選擇,參數(shù)λ和β從{0,0.01,0.05,0.1,0.5,1}中進(jìn)行選擇驗(yàn)證,觀察發(fā)現(xiàn)當(dāng)K=40,λ=β=0.05時(shí)所提出的模型性能最優(yōu)。為了體現(xiàn)實(shí)驗(yàn)比較的公正性,同樣的參數(shù)設(shè)置用于其他4個(gè)比較方法中。另外,每個(gè)數(shù)據(jù)集被劃分為訓(xùn)練集和測(cè)試集,簽到數(shù)據(jù)的80%用作訓(xùn)練集,剩余的20%當(dāng)作測(cè)試集。

        為了評(píng)價(jià)所提出PGSR-PR模型的性能好壞,把PGSR-PR模型與BasicMF模型[12]、Biased MF模型[14]、PMF模型[20]和GeoCF模型[21]進(jìn)行了實(shí)驗(yàn)結(jié)果比較與分析,有關(guān)這4個(gè)基線比較方法的介紹,詳見相關(guān)參考文獻(xiàn)。

        4.3 評(píng)價(jià)指標(biāo)

        本研究的主要任務(wù)就是為目標(biāo)用戶預(yù)測(cè)一個(gè)精確的興趣點(diǎn)推薦列表,為了評(píng)價(jià)在真實(shí)情景中興趣點(diǎn)推薦的有效性,采用如下三個(gè)評(píng)價(jià)指標(biāo)來(lái)衡量PGSR-PR模型的有效性,即準(zhǔn)確率P@N、召回率R@N和排序度量指標(biāo)(Normalized discounted cumulative gain)NDCG@N。三種指標(biāo)的具體定義如下:

        (19)

        (20)

        其中,#TestSetHits是用戶在測(cè)試集上已簽到的興趣點(diǎn)集合,P@N主要用來(lái)檢查興趣點(diǎn)推薦排序的準(zhǔn)確率問題,R@N主要用來(lái)檢查興趣點(diǎn)推薦排序的召回率問題。使用NDCG@N來(lái)衡量基于推薦實(shí)體評(píng)分相關(guān)性的推薦系統(tǒng)性能,NDCG@N值的范圍從0.0到1.0變動(dòng),值為1.0表示排序列表中實(shí)體的最理想排序。NDCG被定義如下:

        (21)

        N是能被推薦的實(shí)體的最大數(shù),如果在位置j的項(xiàng)是一個(gè)被推薦的項(xiàng)時(shí),rj是1,否則rj=0。

        4.4 在評(píng)價(jià)指標(biāo)P@N和R@N上的實(shí)驗(yàn)結(jié)果比較與分析

        在Foursquare數(shù)據(jù)集和Gowalla數(shù)據(jù)集上,把PGSR-PR模型與已有的4種方法在評(píng)價(jià)指標(biāo)P@N和R@N上進(jìn)行比較分析。首先分析每種方法的P@N和R@N隨著推薦列表長(zhǎng)度Top-N如何變化,N的值分別設(shè)為5、10、15和20。在Foursquare數(shù)據(jù)集上,P@N和R@N比較結(jié)果如圖1所示。從圖1可以看出,PGSR-PR模型在不同的N取值上一直優(yōu)于其他4種基線方法。由于PMF方法優(yōu)于BasicMF方法和Biased MF方法,GeoCF方法又優(yōu)于PMF方法。所以本文提出的PGSR-PR模型在3個(gè)評(píng)價(jià)指標(biāo)上與GeoCF模型相比較,性能又有進(jìn)一步改善。在Gowalla數(shù)據(jù)集上,P@N和R@N的比較結(jié)果如圖2所示,實(shí)驗(yàn)比較結(jié)果與在Foursquare數(shù)據(jù)集對(duì)應(yīng)的比較結(jié)果類似,PGSR-PR模型在P@N和R@N指標(biāo)比較上,依然顯示出最優(yōu)性能。

        圖1 在Foursquare數(shù)據(jù)集上5模型的Top-N推薦性能比較

        圖2 在Gowalla數(shù)據(jù)集上5種模型的Top-N推薦性能比較

        4.5 在評(píng)價(jià)指標(biāo)P@10、R@10和NDCG@10上的實(shí)驗(yàn)結(jié)果比較與分析

        為了更好地驗(yàn)證實(shí)驗(yàn)效果,表3呈現(xiàn)了在Foursquare數(shù)據(jù)集上,當(dāng)N=10時(shí),PGSR-PR模型與其他4種方法中效果最好的Geo-CF模型相比,各評(píng)價(jià)指標(biāo)的相對(duì)改善效果。從實(shí)驗(yàn)結(jié)果可以觀察到,PGSR-PR模型相對(duì)于Geo-CF模型有明顯的改善,P@10的值有18.03%的改善,R@10的值有29.17%的改善,NDCG@N值有13.04%的改善。表4呈現(xiàn)了在Gowalla數(shù)據(jù)集上當(dāng)N=10時(shí),PGSR-PR模型和Geo-CF模型相比,各評(píng)價(jià)指標(biāo)的相對(duì)改善效果。從實(shí)驗(yàn)結(jié)果可以觀察到,PGSR-PR模型相對(duì)于Geo-CF模型有明顯的改善,P@10的值有14.04%的改善,R@10的值有29.79%的改善,NDCG@N值有12.70%的改善??傊?,本文所提出的方法優(yōu)于其他基線方法,顯示了所提出的PGSR-PR模型的優(yōu)越性。

        表3PGSR-PR模型與GeoCF在Foursquare數(shù)據(jù)集上的比較結(jié)果(N=10)

        評(píng)價(jià)指標(biāo)GeoCF模型PGSR-PR模型相對(duì)改善P@100.0610.07218.03%↑R@100.048%0.06229.17%↑NDCG@100.0690.07813.04%↑

        表4PGSR-PR模型與GeoCFO模型在Gowalla數(shù)據(jù)集上的比較結(jié)果(N=10)

        評(píng)價(jià)指標(biāo)GeoCF模型PGSR-PR模型相對(duì)改善P@100.0570.06514.04%↑R@100.0470.06129.79%↑NDCG@100.0630.07112.70%↑

        5 結(jié)束語(yǔ)

        本文提出一種基于核密度估計(jì)和兩跳隨機(jī)游走算法的潛在地理—社會(huì)關(guān)系感知的興趣點(diǎn)推薦模型。所提出的興趣點(diǎn)推薦模型考慮了在用戶可達(dá)區(qū)域內(nèi),用戶的興趣相似度和用戶的顯式—隱式鏈接關(guān)系對(duì)興趣點(diǎn)推薦的影響。實(shí)驗(yàn)結(jié)果驗(yàn)證了所提出的PGSR-PR模型優(yōu)于其他4種被廣泛使用的興趣點(diǎn)推薦方法。這是因?yàn)樗岢龅腜GSR-PR模型考慮了在用戶可達(dá)范圍內(nèi)用戶之間的顯式—隱式地理—社會(huì)關(guān)系相似度。在下一步的研究工作中,有幾個(gè)感興趣的方向可以值得探索。首先,在基于位置的社會(huì)網(wǎng)絡(luò)下,除了考慮某一特定區(qū)域用戶之間的隱式鏈接關(guān)系外,用戶之間的簽到行為會(huì)隨時(shí)間而發(fā)生變化,因此,下一步計(jì)劃探索興趣點(diǎn)推薦中的時(shí)間影響因素。其次,用戶針對(duì)興趣點(diǎn)的評(píng)論信息大大有利于深入挖掘用戶之間的關(guān)系,分析用戶在興趣點(diǎn)推薦的評(píng)論將更值得研究。

        [1]Li H,Hong R,Zhu S,et al.Point-of-interest recommender systems: A separate-space perspective[C]//2015 IEEE International Conference on Data Mining.Atlantic City,2015: 231-240

        [2]Gao H,Tang J,Liu H.gscorr:modeling geo-social correlations for new check-ins on location-based social networks[C]//Proceedings of the 21st ACM International conference on Information and knowledge management.Maui,2012:1582-1586

        [3]Tang J,Hu X,Gao H,et al.Exploiting local and global social context for recommendation[C]//Proceedings of the 23rd International Joint Conference on Artificial Intelligence.Beijing,2013:264-269

        [4]Liu Y,Wei W,Sun A,et al.Exploiting geographical neighborhood characteristics for location recommendation[C]//Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management.Shanghai,2014:739-748

        [5]Lian D,Zhao C,Xie X,et al.Geomf: joint geographical modeling and matrix factorization for point-of-interest recommendation[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining.New York,2014:831-840

        [6]Zhang Q,Wu J,Yang H,et al.Global and local influence-based social recommendation[C]//Proceedings of the 25th ACM International on Conference on Information and Knowledge Management.Indianapolis,2016:1917-1920

        [7]Melville P,Mooney R J,Nagarajan R.Content-boosted collaborative filtering for improved recommendations[C]//The Eighteenth National Conference on Artificial Intelligence.Edmonton,2002:187-192

        [8]Cantador I,Bellogin A,Vallet D.Content-based recommendation in social tagging systems[C]//Proceedings of the fourth ACM conference on Recommender systems.Barcelona,2010:237-240

        [9]Koren Y.Collaborative filtering with temporal dynamics[J].Communications of the ACM,2010,53(4): 89-97

        [10]Ye M,Yin P,Lee W C.Location recommendation for location-based social networks[C]//Proceedings of the 18th ACM SIGSPATIAL International conference on advances in geographic information systems.San Jose California,2010:458-461

        [11]Jiang S,Qian X,Shen J,et al.Author topic model-based collaborative filtering for personalized poi recommendations[J].IEEE Transactions on Multimedia,2015,17(6):907-918

        [12]Koren Y,Bell R,Volinsky C.Matrix factorization techniques for recommender systems[J].Computer,2009,42(8):30-37

        [13]Zhao Y,Nie L,Wang X,et al.Personalized recommendations of locally interesting venues to tourists via cross-region community matching[J].ACM Transactions on Intelligent Systems and Technology,2014,5(3):50

        [14]Hu L,Sun A,Liu Y.Your neighbors affect your ratings:on geographical neighborhood influence to rating prediction[C]//Proceedings of the 37th International ACM SIGIR conference on Research & development in information retrieval.Gold Coast,2014:345-354

        [15]Berjani B,Strufe T.A recommendation system for spots in location-based online social networks[C]//Proceedings of the 4th Workshop on Social Network Systems.New York,2011:4-5

        [16]Ye M,Yin P,Lee W.Location recommendation for location-based social networks[C]//Proceedings of the 18th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems.California,2010:458-461

        [17]Liu X,Liu Y,Aberer K,et al.Personalized point-of-interest recommendation by mining users’ preference transition[C]//Proceedings of the 22nd ACM International Conference on Information & Knowledge Management.San Francisco,2013:733-738

        [18]Cheng C,Yang H,King I,et al.Fused matrix factorization with geographical and social influence in location-based social networks[C]//AAAI Conference on Artificial Intelligence.Ontario,2012:1-2

        [19]Zhao S,King I,Lyu M R.Capturing geographical influence in poi recommendations[C]//International Conference on Neural Information Processing.Springer,2013:530-537

        [20]Salakhutdinov R,Mnih A.Probabilistic matrix factorization[C]//International Conference on Neural Information Processing Systems.Kitakyushu,2007:1257-1264

        [21]Ye M,Yin P,Lee W,et al.Exploiting geographical influence for collaborative point-of-interest recommendation[C]//Proceedings of the 34th International ACM SIGIR Conference on Research and Development in Information Retrieval.Beijing,2011:325-334

        Point-of-interestRecommendationbasedonPotentialGeo-SocialRelationshipAwareness

        CUI Lin,SONG Qixiang,LI Yulin,QI Xixi

        School of Information Engineering,Suzhou University,Suzhou,234000

        Under the location based social networks,the existing POI recommendation models mostly adopt the explicit social relations and implicit social relations without the limitations of geographic space.However,the explicit and implicit social relations within a limited geographical space are rarely considered for points of interest (POI) recommendation.Therefore,a new potential Geo-social POI recommendation model under a certain geographical areas is put forward.The proposed model utilizes the kernel density estimation method to analyze the geographical influence on the users behavior,the two-hop random walk algorithm is proposed to mine the explicit and implicit social influence on users,then in a reachable geographical region,the explicit and implicit social relations are regarded as a regularization term for the matrix factorization.The goal of the proposed model is to recommend new POIs for users in areas where a user can reach.Experiments on two real world datasets show that the proposed POI recommendation model outperforms other state-of-the-art four recommendation methods.

        Location-based Social Network,Point of interest Recommendation,Geo-Social Relationship,Explicit Social Relationship,Implicit Social Relationship

        TP301.6

        A

        1673-2006(2017)09-0096-07

        (責(zé)任編輯劉小陽(yáng))

        10.3969/j.issn.1673-2006.2017.09.023

        2017-04-08

        國(guó)家自然科學(xué)青年基金項(xiàng)目(61702355);安徽高校自然科學(xué)研究重點(diǎn)項(xiàng)目(KJ2016A768);安徽省軟科學(xué)研究計(jì)劃項(xiàng)目(1607a0202071);教育部科技發(fā)展中心“云數(shù)融合科教創(chuàng)新”項(xiàng)目(2017A10014)。

        崔琳(1979-),女,安徽碭山人,碩士,副教授,研究方向:興趣點(diǎn)推薦、數(shù)據(jù)挖掘與分析。

        猜你喜歡
        密度估計(jì)集上矩陣
        中國(guó)人均可支配收入的空間區(qū)域動(dòng)態(tài)演變與差異分析
        m-NOD樣本最近鄰密度估計(jì)的相合性
        面向魚眼圖像的人群密度估計(jì)
        基于MATLAB 的核密度估計(jì)研究
        科技視界(2021年4期)2021-04-13 06:03:56
        Cookie-Cutter集上的Gibbs測(cè)度
        鏈完備偏序集上廣義向量均衡問題解映射的保序性
        復(fù)扇形指標(biāo)集上的分布混沌
        初等行變換與初等列變換并用求逆矩陣
        矩陣
        南都周刊(2015年4期)2015-09-10 07:22:44
        矩陣
        南都周刊(2015年3期)2015-09-10 07:22:44
        最近中文字幕精品在线| 久久久无码人妻精品无码| 国产美女露脸口爆吞精| 乱中年女人伦av| 久久久99精品视频| 国产自拍视频免费在线观看| 偷拍夫妻视频一区二区| 97久久超碰国产精品旧版| 精品久久久久久国产| 纯肉无遮挡H肉动漫在线观看国产| 亚洲区福利视频免费看| 亚洲中文中文字幕乱码| 在线播放五十路熟妇| 亚洲av高清在线一区二区三区 | 国产欧美日韩网站| 午夜在线观看一区二区三区四区| 亚洲综合久久精品少妇av | 尤物网址在线观看| 无码专区久久综合久中文字幕 | 人妻无码AⅤ中文系列久久免费| 久久99精品综合国产女同| 九一免费一区二区三区偷拍视频| 亚洲av成人无码一二三在线观看 | 亚洲午夜成人精品无码色欲| 人妻少妇精品视中文字幕国语| 国产AV秘 无码一区二区三区| 国产黄久色一区2区三区| 国产白嫩护士被弄高潮| 无码手机线免费观看| 亚洲中文字幕久爱亚洲伊人| 少妇勾引视频网站在线观看| 国产精选自拍视频网站| 中文字幕一区二区三区人妻少妇| 精品九九视频| 小草手机视频在线观看| 四虎永久在线精品免费网址| 夜夜嗨av一区二区三区| 欧美亚洲国产丝袜在线| 国产一区二区三区在线影院| 少妇被爽到高潮喷水久久欧美精品 | 国产欧美另类精品久久久|