呂芳
(唐山職業(yè)技術(shù)學(xué)院,河北唐山 063000)
目前,人們的經(jīng)濟(jì)水平與日俱增,對(duì)旅游的要求越來越趨向精準(zhǔn)化個(gè)性化。本文提出了一種基于游客和景區(qū)信息的推薦算法,為智慧旅游系統(tǒng)提供了良好的解決方案,能夠通過移動(dòng)互聯(lián)網(wǎng)、GPS 定位、LBS等“智慧技術(shù)”措施,利用便攜計(jì)算機(jī)、手機(jī)、pad等終端設(shè)備,將智慧旅游服務(wù)展現(xiàn)給游客,游客還可以獲取如天氣、位置等旅程相關(guān)信息,以便制定最佳的旅游方案,從而獲得更好的旅游體驗(yàn)。
旅游信息推薦算法首先對(duì)旅游導(dǎo)覽問題進(jìn)行了數(shù)學(xué)建模,進(jìn)而建立了以游客和景區(qū)信息為主要參數(shù)的游客興趣評(píng)分矩陣。具體步驟如下,首先游客全集描述為U={u1,u2,u3,…uM},即有M個(gè)游客,景區(qū)導(dǎo)覽相關(guān)信息描述為S={s1,s2,s3…sN},即有景區(qū)導(dǎo)覽相關(guān)信息N個(gè)。游客結(jié)束景區(qū)的游覽后進(jìn)行評(píng)分。將M個(gè)游客對(duì)N個(gè)景區(qū)游覽后的評(píng)分建立相關(guān)性矩陣如下。
該矩陣中 rs為游客U景區(qū)S的評(píng)分值,每一行為某游客對(duì)所有景區(qū)信息的打分,即RS=(rs,rs,…,rs)。每一列為所有游客對(duì)某景區(qū)S的打分,即RS=(rs,rs,…,rs)。評(píng)分標(biāo)準(zhǔn)如表1所示。
由興趣評(píng)分矩陣可量化計(jì)算出為游客推薦的景區(qū)序列,該序列只是對(duì)景區(qū)做出了初步排序,為了得到更加精準(zhǔn)的推薦方案,這里引入了游客的實(shí)時(shí)地理位置信息參數(shù)作為進(jìn)一步篩選的重要依據(jù)。通過計(jì)算景區(qū)位置與游客歷史軌跡的相對(duì)距離,一定程度上可篩選出游客的喜好景區(qū)并進(jìn)行推薦。
在以往的眾多旅游信息推薦算法中,大多采取游客和景區(qū)信息矩陣來推薦信息序列,這樣只能推測(cè)游客的大致喜好,并不能做到精準(zhǔn)推薦,做到有的放矢。對(duì)游客來說景區(qū)信息幾乎是海量數(shù)據(jù)的,如何才能從中篩選出適合自己的景區(qū)呢?
本文的推薦算法依據(jù)旅游導(dǎo)覽實(shí)際情況并結(jié)合了以往算法,引入了游客地理位置信息和游客歷史軌跡等參數(shù),通過分別計(jì)算各景區(qū)與游客位置的距離,進(jìn)行二次篩選過濾信息,與此同時(shí)通過對(duì)游客好友或者與游客具有較高的相似背景信息的用戶進(jìn)行分析,進(jìn)一步確認(rèn)游客對(duì)景區(qū)喜好,從而使為游客推薦的信息更具有參考價(jià)值,為游客做到量身定制旅游路線提供重要依據(jù),使游客獲得更好的旅游體驗(yàn)。具體的推薦算法流程圖如圖1。
該算法中輸入為游客注冊(cè)相關(guān)信息,游客景區(qū)評(píng)分矩陣;輸出為精準(zhǔn)推薦的旅游景區(qū)信息序列。
(1)算法開始后先判斷游客是否已經(jīng)注冊(cè),若沒有注冊(cè)信息則跳轉(zhuǎn)至(5),若為注冊(cè)用戶則執(zhí)行(2);(2)進(jìn)一步檢索數(shù)據(jù)庫判斷該注冊(cè)游客是否存在相關(guān)好友用戶信息;存在則執(zhí)行(3),不存在則跳轉(zhuǎn)至(4);(3)已經(jīng)檢索到該游客好友用戶信息,進(jìn)一步篩選與該游客相關(guān)背景相似度最高的好友用戶,并獲取其相關(guān)喜好景區(qū)作為推薦信息序列項(xiàng),跳轉(zhuǎn)至(5);(4)根據(jù)該游客的職業(yè)、性別、年齡、民族、愛好等相關(guān)注冊(cè)信息與數(shù)據(jù)庫中的注冊(cè)用戶信息進(jìn)行相似性比對(duì),并找出注冊(cè)信息相似度較高的用戶執(zhí)行(5);(5)利用游客景區(qū)興趣評(píng)分矩陣和相似度算法計(jì)算出與游客興趣評(píng)分相似度閾值最接近的用戶,同時(shí)根據(jù)預(yù)設(shè)閾值預(yù)測(cè)出該游客的興趣景區(qū)信息,利用游客地理位置信息和游客歷史軌跡等參數(shù),分別計(jì)算各景區(qū)與游客位置的距離,進(jìn)行二次篩選過濾景區(qū)信息;(6)將游客的興趣數(shù)據(jù)反饋給游客景區(qū)興趣評(píng)分矩陣,并進(jìn)行修正后執(zhí)行(7);(7)利用景區(qū)信息推薦優(yōu)化排序算法得出最終的推薦景區(qū)信息序列并推薦給用戶。
表1 興趣值評(píng)分標(biāo)準(zhǔn)表
圖1 推薦算法流程圖
首先建立游客景區(qū)興趣值評(píng)分矩陣,通過計(jì)算游客相似度獲取游客景區(qū)興趣值并反饋給興趣評(píng)分矩陣進(jìn)行相應(yīng)修正,再次計(jì)算預(yù)測(cè)游客興趣景區(qū)評(píng)分值,通過地理信息參數(shù)進(jìn)一步篩選推薦信息。算法具體實(shí)現(xiàn)如下:
基于用戶景區(qū)評(píng)分的興趣矩陣 RS就是將M個(gè)游客對(duì)N個(gè)景區(qū)游覽后的評(píng)分形成的矩陣。興趣評(píng)分矩陣公式見公式(1)所示,興趣值評(píng)分標(biāo)準(zhǔn)見表1所示。
利用注冊(cè)用戶信息相似度算法來計(jì)游客間的相似程度,詳見公式(2),rs為u游客為s景區(qū)的評(píng)分,rs為u游客為全部景的評(píng)分均值。
采用公式(4)計(jì)算游客對(duì)未評(píng)分景區(qū)項(xiàng)目的預(yù)測(cè)評(píng)分
其中,rs表示游客u所有景區(qū)評(píng)分均值,su為所有相似度閾值范圍內(nèi)的游客,u為滿足相似度的某已游客信息。
通過上述步驟只能推測(cè)游客的大致喜好,并不能做到精準(zhǔn)推薦,對(duì)游客來說景區(qū)信息幾乎是海量數(shù)據(jù)的,為了做到有的放矢的推送景區(qū)信息,還需根據(jù)游客地理位置等信息進(jìn)行計(jì)算進(jìn)一步篩選。通過游客歷史評(píng)分?jǐn)?shù)據(jù)中的地理位置與景區(qū)的位置信息可以計(jì)算出當(dāng)時(shí)游客至景區(qū)的距離集合L1{hdl,hd2,hd3…,hdm}。然后再計(jì)算游客當(dāng)前地理位置與推薦序列中的景區(qū)距離集合L2{ dl,d2,d3…,dn }。公式(5)為利用L1、L2建立相對(duì)距離差矩陣。
通過上述矩陣可計(jì)算景區(qū)位置相對(duì)游客興趣的權(quán)重值,公式(6)中TravelPenalty(u,i)為景區(qū)i與游客u歷史數(shù)據(jù)距離均值。通過修正后重新計(jì)算最終的興趣值為下式所示。
為修正后的興趣值,利用該值對(duì)推薦信息進(jìn)行篩選,得出最終結(jié)果輸出給游客。
本文提出了為游客進(jìn)行景區(qū)信息推薦的一種算法,將基于游客的相似度算法和基于游客地理位置的信息篩選算法相結(jié)合,減緩了游覽大量數(shù)據(jù)的處理壓力大和信息共享不夠的狀態(tài),將更加準(zhǔn)確有效的旅游信息推送給游客,提高了智慧旅游系統(tǒng)的信息推薦效率,滿足了自由行游客的智慧旅游需求。