黃小根
摘? 要: 在現(xiàn)階段的興趣點推薦模型與算法中,對于興趣點間的連續(xù)過渡因素以及區(qū)域影響因素的考量較為忽視,導致推薦準確性的降低?;诖耍疚脑O(shè)計了一種基于語義位置和區(qū)域劃分的興趣點推薦模型,對其中的算法展開了詳細的介紹。利用真實數(shù)據(jù)集進行檢測實驗后,證實了該模型的有效性。
關(guān)鍵詞: 語義位置;區(qū)域劃分;興趣點推薦模型
【Abstract】: In current interest point recommendation model and algorithm, it has been neglected of considering continuous transition factors between interest points and regional factors, which leads to decrease of recomm endation accuracy. Based on this, the paper designs an interest point recommendation model based on semantic location and region partition, and introduces algorithm in details, and verifies validity of the model with experiments on real data sets.
【Key words】: Semantic location; Region partition; Interest point recommendation model
0? 引言
目前,我國對于基于位置的社交網(wǎng)絡的研究與應用更加重視,對于個性化的興趣點推薦更為關(guān)注。就現(xiàn)階段的發(fā)展來看,大眾點評、美團網(wǎng)等都實現(xiàn)了基于用戶歷史簽到記錄而展開個性化的興趣點推薦。在這樣的方式下,不僅能夠為用戶帶來更好的社交體驗,還能為相應的企業(yè)或商家?guī)砀嗟慕?jīng)濟利益。但是,在現(xiàn)有的興趣點推薦模型中,還存在著推薦結(jié)果準確性不高的問題,對于時間、地理位置等的考量并不全面??梢钥闯?,開發(fā)出一款基于語義位置和區(qū)域劃分的興趣點推薦模型有著較高的實用價值。
1? 興趣點推薦的主流技術(shù)分析
1.1? 多特征融合的興趣點推薦算法
現(xiàn)階段,興趣點推薦的常用算法能夠分成以下三類:
第一,直接使用傳統(tǒng)推薦算法。在這一類的算法中,普遍使用了用戶興趣點的簽到次數(shù)作為偏好程度的指標,并構(gòu)建起了用戶-興趣點簽到矩陣,結(jié)合傳統(tǒng)的推薦算法實現(xiàn)了興趣點推薦。這一類算法主要包括基于正則化矩陣分解算法、基于用于與興趣點的混合協(xié)同算法、概率矩陣分解算法等等。對于這類算法來說,由于其數(shù)據(jù)集不夠密集,所以推薦的質(zhì)量相對較低。
第二,引入地理因素的興趣點推薦算法。在這一類算法中,融合了用戶與興趣點的地理距離,將其也視為推薦的一項指標。目前,普遍使用了多中心高斯分布模型加入算法,提升了興趣點推薦的效果。
第三,引入社交影響的推薦算法。這一類算法中,將社交網(wǎng)絡中的“朋友”有著相同興趣作為了前提,結(jié)合朋友的簽到歷史記錄,完成了興趣點推薦。在該類算法中,對于地理因素較為忽視。實踐證明,該類算法的興趣點推薦質(zhì)量相對較低,可以得出,社交關(guān)系對推薦準確率的影響較小。
1.2? 基于評論信息以及地理位置的興趣點推薦技術(shù)
對于社交網(wǎng)絡興趣點推薦來說,基于評價內(nèi)容完成推薦是一項十分有效的方式。通過分析用戶的評價內(nèi)容,能夠準確的捕捉到用戶的興趣偏好。針對這樣的理念,有關(guān)研究人員對用戶評價內(nèi)容展開建模,完成了用戶興趣相關(guān)特征的采集,提升了興趣點推薦的效果。
為了進一步提升該興趣點推薦模型的效果,相關(guān)研究人員也將地理位置因素融入于該模型中,建立起了基于評價信息以及地理位置的興趣點推薦模型。在進行基于地理位置的興趣點推薦模型中,主要使用了用戶的興趣點歷史簽到地理位置,自動生成用戶的地理坐標,為興趣點推薦提供了參考。在基于評價信息以及地理位置的興趣點推薦模型中,雖然參考了用戶興趣偏好以及地理位置,但是,由于評價信息的缺乏或準確性不高,興趣點推薦的實際效果依舊有待提升[1]。
1.3? 基于混合神經(jīng)網(wǎng)絡矩陣分解的興趣點推薦模型
隨著人工智能技術(shù)的不斷發(fā)展,其應用范圍也更加廣泛。神經(jīng)網(wǎng)絡作為一種常用的人工智能技術(shù),在興趣點推薦模型的建立中發(fā)揮著較大的優(yōu)勢。神經(jīng)網(wǎng)絡為興趣點推薦提供了更多的參考指標,提升了推薦的質(zhì)量?,F(xiàn)階段,有關(guān)研究人員已經(jīng)建立起了基于混合神經(jīng)網(wǎng)絡矩陣分解的興趣點推薦模型,在該模型中,利用神經(jīng)網(wǎng)絡對用戶和興趣點的初始化參數(shù)進行學習,最終得出了用戶的簽到特征以及興趣點簽到特征。結(jié)合評論信息的學習,能夠得出潛在的向量特征,最后完成興趣點評分的預測。
2? 基于語義位置的建模分析
2.1? 實際需求分析
在基于位置的社交網(wǎng)絡中,興趣點的推薦主要是用過對用戶歷史簽到記錄展開分析,并向用戶推薦之前并沒有訪問、且可能感興趣的位置信息。此時,基于位置的社交網(wǎng)絡中應當包含用戶在興趣點上的歷史簽到記錄集、用戶集、興趣點集。在基于位置的社交網(wǎng)絡的體系結(jié)構(gòu)中,包含著大量的用戶、興趣點以及多種社交關(guān)系、用戶與興趣點之間的簽到關(guān)系、興趣點之間的關(guān)聯(lián)關(guān)系等等。在基于語義位置和區(qū)域劃分的興趣點推薦模型的建立中,筆者融合了多種源數(shù)據(jù),并對用戶未訪問的興趣點偏好進行預測與推薦[2]。
2.2? 用戶偏好的計算
在進行用戶偏好的計算中,筆者主要使用功了狄利克雷分配算法(LDA算法)。為了對用戶不同地理位置的時間偏好進行考量,筆者將時間偏好引入狄利克雷分配算法中,建立起了基于時間分割的狄利克雷分配算法,完成了用戶偏好的計算[3]。
4? 基于語義位置和區(qū)域劃分的興趣點推薦模型的分析與驗證
4.1? 實驗條件的確定
為了驗證該基于語義位置和區(qū)域劃分興趣點推薦模型的真實性,筆者對其展開了驗證實驗。在本次驗證實驗中,使用了兩個真實的簽到數(shù)據(jù)集。為進一步提升本次驗證實驗的有效性,在數(shù)據(jù)集中剔除了簽到記錄數(shù)少于5以及簽到興趣點少于80的用戶。最終得出數(shù)據(jù)集A中包含637個用戶、數(shù)據(jù)集B中包含732個用戶;數(shù)據(jù)集A中包含80544條簽到記錄、數(shù)據(jù)集B中包含80817條簽到記錄;數(shù)據(jù)集A中包含2756個興趣點、數(shù)據(jù)集B中包含3827個興趣點。在這兩個數(shù)據(jù)集中,隨機抽取每一名用戶的75%條簽到數(shù)據(jù)作為訓練集;25%條簽到數(shù)據(jù)設(shè)為測試集。
在驗證實驗中,筆者對該基于語義位置和區(qū)域劃分的興趣點推薦模型中包含的相關(guān)參數(shù)進行了優(yōu)化確定。設(shè)置主題參數(shù)K為50;時間段為4;共同參數(shù)α與β的數(shù)值為1和0.01。結(jié)合梯度下降法,能夠得出參數(shù)數(shù)值,具體如下:對于數(shù)據(jù)集A,使用的參數(shù)、、、、、分別為0.2、0.3、0.5、0.5、0.2、0.5;對于數(shù)據(jù)集B,使用的參數(shù)、、、、、分別為0.3、0.2、0.6、0.4、0.3、0.2。
為了證明該基于語義位置和區(qū)域劃分的興趣點推薦模型的有效性,筆者使用了推薦準確率以及召回率作為評價指標,并設(shè)置了“不同興趣點推薦數(shù)量下”以及“不同簽到時間間隔下”兩種實驗條件[9]。
4.2? 實驗結(jié)果分析
經(jīng)過實際的實驗與計算能夠得出,在不同興趣點推薦數(shù)量的條件下,該基于語義位置和區(qū)域劃分的興趣點推薦模型的準確率,會隨著推薦興趣點數(shù)量的增加而有所降低。經(jīng)過筆者的進一步分析發(fā)現(xiàn),造成該結(jié)果的主要原因在于:興趣點推薦數(shù)量的增加會提升該模型中時間的復雜程度。而召回率卻與之相反,在推薦興趣點數(shù)量增加的情況下,召回率有所提升。與ULR(基于用戶的簽到記錄數(shù)據(jù)以及地理信息完成推薦)相比,該模型中包含的所有算法在性能上有著較為明顯的提升。相比于USTTM(基于概率生成模型)來說,本文提出的興趣點推薦模型在算法的性能方面有所提升。
在不同簽到時間間隔的條件下,算法的推薦準確性以及召回率均有所降低。造成這一情況的主要原因在于,由于用戶移動至了遠離興趣點的位置,所以導致連續(xù)推薦性能的降低。基于此,對時間間隔進行控制對于該模型預測效果的保證十分重要[10]。
5? 結(jié)束語
綜上所述,在現(xiàn)有的興趣點推薦模型中,并沒有對興趣點間的連續(xù)過渡因素以及區(qū)域影響因素進行重點的考量。筆者結(jié)合這一情況,建立起了一種基于語義位置和區(qū)域劃分的興趣點推薦模型,緩解了數(shù)據(jù)密集程度不足的問題。經(jīng)過驗證實驗,證實了該模型有著更好的功能優(yōu)勢,證明了該模型的有效。
參考文獻
[1]宋亞偉. 融合時空特征的興趣點推薦算法研究[D]. 燕山大學, 2016.
[2]常曉雨. 基于位置的社交網(wǎng)絡中高性能興趣點推薦算法研
究[D]. 杭州電子科技大學, 2016.
[3]王嘯巖, 袁景凌, 秦鳳. 位置社交網(wǎng)絡中基于評論文本的興趣點推薦[J]. 計算機科學, 2017, 44(12): 245-248+278.
[4]丁順, 陳世平. 云計算中基于包簇映射的多目標蟻群資源分配算法[J]. 軟件, 2018, 39(11): 1-6.
[5]黃金金, 陳晶, 張鯤. 基于RS-SVM的無線傳感器網(wǎng)絡安全的應用研究[J]. 軟件, 2018, 39(11): 18-20.
[6]曹妍, 陳偉. 基于MATLAB GUI的指紋圖像增強技術(shù)研究[J]. 軟件, 2018, 39(11): 30-32.
[7]趙璇. 位置服務中基于k匿名的隱私保護方法研究[D]. 河北大學, 2018.
[8]劉妍. 面向移動對象角色發(fā)現(xiàn)的行為模式挖掘算法研究[D]. 遼寧大學, 2018.
[9]俞童. 興趣場約束下空間數(shù)據(jù)多尺度智能化表達研究[D]. 解放軍信息工程大學, 2017.
[10]曾俊. 基于LBS的電子商務個性化推薦研究[D]. 湖北工業(yè)大學, 2016.