亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于旅游用戶數(shù)據(jù)和評論的推薦系統(tǒng)的設計

        2019-12-19 02:07:13周家昊李民
        軟件 2019年11期
        關鍵詞:推薦算法數(shù)據(jù)挖掘

        周家昊 李民

        摘? 要: 隨著國民生活水平的提高,旅游業(yè)蓬勃發(fā)展,旅游業(yè)與互聯(lián)網(wǎng)的結合促進了在線旅游業(yè)的形成,也就是當代所說的“智慧旅游”。用戶可以通過互聯(lián)網(wǎng)了解各種各樣的旅游信息,但是,日趨嚴重的過載旅游數(shù)據(jù)現(xiàn)象讓旅游商們難以準確的挖掘出符合用戶興趣的個性化旅游信息,推薦出一個智慧的旅游路線更是如同大海撈針,而旅游推薦系統(tǒng)是解決這一問題的關鍵技術。本文基于個性化推薦算法的研究,將用戶信息,用戶評論,用戶行為,用戶歷史訂單,用戶未來訂單等多項數(shù)據(jù)作為算法的訓練測試集,對功能性需求進行分析,開發(fā)了基于用戶數(shù)據(jù)的推薦系統(tǒng)。

        關鍵詞: 旅游數(shù)據(jù);推薦算法;數(shù)據(jù)挖掘

        【Abstract】: With the improvement of the living standards of the people and the booming tourism industry, the combination of tourism and the Internet has promoted the formation of online tourism, which is also known as “smart tourism”. Users can learn a variety of travel information through the Internet. However, the increasingly serious phenomenon of overloaded travel data makes it difficult for travellers to accurately mine personalized travel information that suits their interests. It is more like recommending a smart travel route. A needle in a haystack, and a travel recommendation system is the key technology to solve this problem. Based on the research of personalized recommendation algorithm, this paper uses user data, user comments, user behavior, user history orders, user future orders and other data as the training test set of the algorithm, analyzes the functional requirements, and studies the system summary design.

        【Key words】: Travel data; Recommendation algorithm; Data mining

        0? 引言

        伴隨著旅游產(chǎn)業(yè)收入快速增長,行業(yè)互聯(lián)網(wǎng)化逐漸加深,在線旅游市場也快速增長。據(jù)Analysys監(jiān)測數(shù)據(jù),2008-2017年,中國在線旅游交易規(guī)模逐年遞增,2017年交易規(guī)模達8923.3億元;2018年前三季度中國在線旅游交易規(guī)模為7342.62億元,逼近中國2016年全年在線度假旅游交易規(guī)模。此外,2018年全年中國在線旅游交易規(guī)模將達9900萬億元,萬億規(guī)模指日可待。從2009-2018年在線旅行預訂用戶規(guī)模變化情況看,用戶規(guī)模逐年遞增,通過線上渠道進行旅游預訂的用戶數(shù)量越來越多;截至2018年6月,在線旅行預訂用戶規(guī)模達到3.93億,較2017年末增長1707萬人,增長率為4.50%;約一半的網(wǎng)民會通過在線業(yè)務進行旅行預訂。

        旅游推薦系統(tǒng)利用數(shù)據(jù)挖掘技術實現(xiàn)一個模擬用戶與旅行社交流的平臺,通過獲取并分析用戶的旅游需求、偏好等信息,主動為用戶推薦盡可能符合其需求的旅游信息或產(chǎn)品(包括單個旅游產(chǎn)品,如景點、酒店等;旅行包以及旅游線路),為用戶制定各套更加智慧的,符合興趣的旅游方案和產(chǎn)品。

        對于旅游路線的推薦技術研究,在國內外已有一些基于旅游資訊,結合景點信息進行推薦。張晗等[1]人使用MD_Apriori算法對已有數(shù)據(jù)信息進行挖掘,設計出旅游服務智能推薦系統(tǒng)。王顯飛等[2]人以會話的形式與用戶進行交互,在不斷的交流中提取出用戶的興趣點,結合用戶的興趣設計出基于約束的旅游推薦系統(tǒng)。朱全[3]設計的利用加權關聯(lián)規(guī)則進行數(shù)據(jù)挖掘的智慧旅游推薦系統(tǒng)。呂紅亮等[4]人提出基于PageRank的一種改進算法來提供個性化旅游路線推薦服務,是以用戶,景點,線路三者為頂點,相互關聯(lián)為邊來表達用戶與物品間的偏好關系,計算出其頂點相對推薦用戶頂點的相關度,并對其進行排名,最后將名次靠前的旅游路線推薦給目標用戶。國外學者Krumm[5]于2004年提出利用地理信息系統(tǒng)對旅游信息進行分析和推薦的系統(tǒng)服務,運用最短徑算法向用戶推薦個性化旅游路線。HUANG.Y和Bian.L[6]在2009年,提議使用異構在線信息分析來推薦目標用戶的旅行路線,該研究主要使用貝葉斯網(wǎng)絡技術,還涉及旅游和旅游興趣的信息指標。Chodhury等[7]人于2010年以Web Albums為數(shù)據(jù)支撐,對Web Albums進行分析,提取相關信息數(shù)據(jù),系統(tǒng)根據(jù)提取出的信息自動向用戶推薦旅游線路。當前的各種研究對旅游路線推薦系統(tǒng)的發(fā)展作出了很大的貢獻,但是依然有一些問題或者某些領域上的困難需要我們去攻克,例如將用戶個人信息作為興趣點的一個參考因素,以及對于新的旅游路線的出現(xiàn)等冷啟動問題。

        1? 個性化推薦算法介紹

        1.1? 基于內容的推薦算法

        基于內容的推薦根據(jù)用戶過去喜歡的物品,為用戶推薦和這些物品內容相似的其它物品。該方法在文本類推薦領域(如新聞、文檔、網(wǎng)頁、書籍等)得到了廣泛應用。在本文中通過對用戶歷史訂單評論文本數(shù)據(jù)的提取,對未來訂單的預測。

        1.2? 基于協(xié)同過濾的推薦算法

        協(xié)同過濾推薦是構建推薦系統(tǒng)最常用的一項技術,它可以直接通過用戶過去的行為(如用戶對訂單的評分)來預測用戶的偏好,它默認用戶未來的興趣愛好是和過去的興趣愛好一致的,這項技術不需要其他任何領域知識作為參考。現(xiàn)有的協(xié)同過濾可分為基于模型(Model based)與基于記憶(Memory based)兩種。其中,基于模型的協(xié)同過濾的目標就是從可觀測評分數(shù)據(jù)中找到一些潛在的影響因子,利用數(shù)據(jù)挖掘與機器學習技術從訓練數(shù)據(jù)中找到模式(patterns),利用產(chǎn)生的這些模式去計算用戶對商品的評分。

        基于記憶的協(xié)同過濾又可分為基于用戶與基于物品兩種:

        第一種是基于用戶(User-based)的協(xié)同過濾是推薦系統(tǒng)中最古老的算法[8]。其主要思想就是找到與目標用戶偏好相似的鄰近用戶,并利用其鄰近用戶對目標物品的評分來預測目標用戶對目標物品的評分。其具體步驟如下:

        (3)推薦階段:在預測目標用戶對所有未評分物品的評分后,也可采取Top-K方法,將評分值最高的K個物品推薦給目標用戶。

        2? 系統(tǒng)需求分析

        2.1? 應用場景介紹

        (1)推薦結果的展示

        前端的頁面將會展示多種基于各種算法下對旅游用戶數(shù)據(jù)的挖掘結果,這些挖掘結果將以訂單服務的形式供用戶瀏覽以及查詢,此類典型的頁面場景即“猜你喜歡”、“您是不是在找”。

        (2)業(yè)務員用戶的后臺管理

        業(yè)務員主要分析每一個用戶的歷史行為數(shù)據(jù)以及個人信息,包括點擊、瀏覽、搜索、評論、交易等,挖掘用戶的興趣偏好數(shù)據(jù),包括偏好列表、物品類別、物品標簽等。另外,利用分類和聚類等機器學習方法對用戶群體進行細分,以進行更精準的推薦,最終得到每個用戶全方位的精準畫像。使用多種推薦算法,得到待推薦的物品列表,使用機器學習的方法進行重新排序,得到最終的推薦物品集合,快速響應用戶復雜行為操作,綜合各種維度的分析挖掘結果呈現(xiàn)給用戶。

        (3)管理員用戶的用戶管理

        管理員用戶可以對任務和權限進行分配,普通用戶只能進行瀏覽推薦內容,而業(yè)務員可以執(zhí)行算法部分。

        2.2? 系統(tǒng)實現(xiàn)目標

        系統(tǒng)實現(xiàn)的目標有:

        (1)旅游用戶可以查詢推薦結果。

        (2)系統(tǒng)業(yè)務員可以執(zhí)行數(shù)據(jù)爬取、協(xié)同過濾、主客觀分析、情感分析等綜合算法模塊,將相關結果導入數(shù)據(jù)庫中并查看各階段的執(zhí)行進度。

        (3)管理員可以對用戶信息進行編輯、查看、增加以及刪除。

        2.3? 系統(tǒng)性能需求

        緩解評分矩陣稀疏性問題。雖然目前旅游業(yè)迅猛發(fā)展,產(chǎn)生了很大的在線旅游數(shù)據(jù),但是這些數(shù)據(jù)集中表現(xiàn)為用戶的信息數(shù)據(jù)以及瀏覽數(shù)據(jù),因為某項旅游服務難以有大量的訂單,或者說用戶在享受完某項特定訂單服務之后沒有產(chǎn)生評論,也就是文本數(shù)據(jù)的缺失,因此本系統(tǒng)可以引導和收集用戶的文本數(shù)據(jù),并有效的緩解數(shù)據(jù)稀疏所帶來的預測模型難以建立問題。

        改善新的旅游訂單服務和新的用戶冷啟動問題。在服務-用戶兩個端都可能出現(xiàn)新的單位,由此產(chǎn)生的歷史數(shù)據(jù)的缺失,本系統(tǒng)會優(yōu)化改善冷啟動問題。

        基于興趣的時效性推薦。雖說人的興趣在短期類不會發(fā)生改變,但是“說走就走的旅行”反應了用戶在一定時間內的未來可能性訂單是緊緊依附的它時下所產(chǎn)生的旅游數(shù)據(jù)的,如果系統(tǒng)的響應時間比較長,就會給用戶造成不好的體驗,因此要在短時間內抓住用戶的胃口,也就是保證在推薦上的時效性。

        3? 系統(tǒng)概要設計與實現(xiàn)

        本論文基于用戶歷史數(shù)據(jù)及用戶評論的推薦系統(tǒng)主要采用MVC模式,結合Struts和Hibernate框架進行開發(fā)。

        MVC是三個單詞首字母縮寫,它們是Model(模型)、View(試圖)和Controller(控制)。這個模式認為,程序不論簡單還是復雜,從結構上看,都可以分為三層。最上面的一層,是直接面向最終用戶的“視圖層”(View)。它是提供給用戶的操作界面,是程序的外殼。最底下的一層是核心的“數(shù)據(jù)層”(Model),也就是程序需要操作的數(shù)據(jù)或信息。中間的一層,就是“控制層”(Controller),它負責根據(jù)用戶從“視圖層”輸入的指令,選取“數(shù)據(jù)層”中的數(shù)據(jù),然后對其進行相應的操作,產(chǎn)生最終結果。這三層是緊密聯(lián)系在一起的,但有時相互獨立的,每一層內部的比那花不影響其他層。每一層都對外提供接口(Interface),供上一層進行調用。這樣一來,軟件就可以實現(xiàn)模塊化,修改外觀或者變更數(shù)據(jù)都不用修改其他層,大大方便了維護的和升級。在本基于旅游用戶歷史數(shù)據(jù)及評論的推薦系統(tǒng)中,采用Struts實現(xiàn)View層和Controller層的交互,Hibernate則用于數(shù)據(jù)持久化。使用JSP頁面來制作前臺頁面,后臺系統(tǒng)代碼使用JAVA,使用python腳本來寫算法部分代碼,而數(shù)據(jù)庫使用My SQL進行信息的存儲。另外,服務器采用tomcat。

        3.1? 功能模塊設計

        本論文結合用戶需求,將基于用戶歷史數(shù)據(jù)和用戶評論的推薦系統(tǒng)劃分為登陸注冊模塊,查詢推薦結果模塊,算法執(zhí)行模塊,管理用戶模塊等??偪蚣軋D如圖1。

        3.2? 算法執(zhí)行模塊的實現(xiàn)

        在前面章節(jié)已經(jīng)介紹了基于協(xié)同過濾推薦算法的原理,主要是根據(jù)過往評分記錄計算用戶與用戶之間的相似度和訂單與訂單間的相似度來預測用戶對商品可能的評分。

        基于用戶的協(xié)同過濾相關代碼如圖2。

        4? 結語

        基于用戶旅游數(shù)據(jù)的推薦系統(tǒng)能夠為旅行商開發(fā)一個信息化以及智能化的旅游APP,這是智慧旅游的一個重要體現(xiàn)。本論文研究了基于用戶信息數(shù)據(jù),用戶評論,用戶歷史訂單數(shù)據(jù)等相關數(shù)據(jù)的挖掘,也運用了情感分析,協(xié)同過濾等多種算法,從設計實驗的預期效果來看系統(tǒng)基本上實現(xiàn)了預期需求,能夠為用戶提供相似度較高的旅游服務,但同時也存在不足。例如對于情感表達不明確的評論數(shù)據(jù)無法進行情感詞的抽取,這對數(shù)據(jù)分析的準確性有一點折扣??傮w而言,本系統(tǒng)的設計研究為智慧旅游,從旅行商角度,在給用戶提供更加個性化和人性化的旅游線路獲取了關鍵思路了關鍵思路,另一方面,旅游用戶能獲取一種接近理想化的旅游? ?線路。

        參考文獻

        [1]張晗, 潘正運, 張燕玲. 旅游服務智能推薦系統(tǒng)的研究與設計[J]. 微計算機信息, 2006, 22(5-3): 170-171.

        [2]王顯飛, 陳梅, 李小天. 基于約束的旅游推薦系統(tǒng)的研究與設計[J]. 計算機技術與發(fā)展, 2012, 22(2): 141-145.

        [3]朱全. 基于加權關聯(lián)規(guī)則挖掘的智慧旅游推薦系統(tǒng)的設計與實現(xiàn)[D]. 湖北: 武漢科技大學, 2004.

        [4]呂紅亮, 王勁林, 鄧峰. 一種個性化旅游推薦算法[J]. 網(wǎng)絡新媒體技術, 2015. 5, 1(3).

        [5]Krumm J Where will they turn: predicting turn propor-tions at intersections. Pers Ubiquit Comput. 2010, (14): 591-599.

        [6]Huang Y, Bian L A Bayesian network and analytic hier-archy process based personalized recommendations for tourist attractions over the Internet. Expert Syst Appl. 2009, (36): 933-943.

        [7]Chodhury MD, Feldman M, Amer-Yahia S, Golbandi N, Lempel R, Yu C Automatic construction of travel itineraries using social breadcrumbs. In: Proceedings of HT 2010, pp35-44.

        [8]項亮. 推薦系統(tǒng)實踐[M]. 北京: 人民郵電出版社, 2012.

        [9]Tang J L, Hu X, Liu H. Social recommendation: a review[J]. Social Network Analysis and Mining, 2013, 3(4): 1113-1133.

        [10]Jannach D, Zanker M, Felfernig A, et al. Recommender systems: an introduction[M]. Cambridge University Press, 2010.

        猜你喜歡
        推薦算法數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        校園社交平臺中標簽系統(tǒng)的研究
        基于相似傳播和情景聚類的網(wǎng)絡協(xié)同過濾推薦算法研究
        社交網(wǎng)絡推薦系統(tǒng)
        數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
        混合推薦算法在電影推薦中的研究與評述
        一種改進的基于位置的推薦算法
        軟件導刊(2016年9期)2016-11-07 17:58:16
        基于情景感知的高校移動社交網(wǎng)絡平臺設計與開發(fā)
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        国产97色在线 | 免| 久久99天堂av亚洲av| 国产乱人伦偷精品视频免观看| 成人做爰69片免费看网站野花| 欧美aaaaaa级午夜福利视频| 国产精品久久无码不卡黑寡妇| 女同另类激情在线三区| 国产不卡在线播放一区二区三区| 亚洲最大中文字幕熟女| 亚洲日韩久久综合中文字幕| 丰满少妇被猛烈进入高清播放| 色妞色视频一区二区三区四区 | 亚洲男同志网站| 国产在线欧美日韩一区二区| 亚洲性码不卡视频在线| 99久久久人妻熟妇精品一区二区| 天天躁日日躁aaaaxxxx| 99re8这里有精品热视频免费| 久久精品亚洲中文无东京热| 午夜男女视频一区二区三区| 成人免费av色资源日日| 国内自拍速发福利免费在线观看| 久久亚洲av午夜福利精品一区| 无码综合天天久久综合网| 国产乱人视频在线观看播放器| 白丝美女扒开内露出内裤视频| 国产毛片视频一区二区| 国产无遮挡又爽又刺激的视频老师| 国产精品va在线播放我和闺蜜| 日韩人妻无码精品系列专区无遮 | 人妻少妇精品视频无码专区| 99久久久精品免费香蕉| 国产精品久久国产精品久久| 91色老久久偷偷精品蜜臀懂色| 中文字幕乱码无码人妻系列蜜桃| 亚洲不卡中文字幕无码| 蜜桃一区二区免费视频观看| 国产精品成人黄色大片| 人妻中文字幕日韩av| 亚洲乱码日产精品一二三| 99久久久无码国产精品免费砚床 |