亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        用戶評分的揚州星級酒店個性化推薦分析

        2021-12-29 11:53:56徐蓉艷繆德俊
        當代旅游 2021年4期
        關鍵詞:星級準確性算法

        徐蓉艷 繆德俊

        1.揚州市職業(yè)大學旅游學院,江蘇揚州 225009;2.揚州市職業(yè)大學電氣與汽車工程學院,江蘇揚州 225009

        引言

        個性化推薦系統(tǒng)目前得到了越來越多的學者的關注,推薦系統(tǒng)的研究包含很多學科知識,例如管理、營銷、機器學習及大數據等,推薦技術通過多門學科的融合迅速發(fā)展,很多推薦系統(tǒng)應運而生[1],基于項目的協(xié)同過濾算法根據相似的項目向用戶推薦是目前運用較為廣泛的一種算法,另一種是根據相似用戶進行推薦的協(xié)同過濾算法,這兩種算法都比較成功,但數據稀疏性、精確度以及擴展性等方面需要進一步優(yōu)化[2]?,F(xiàn)有的大部分推薦系統(tǒng)的推薦依據是通過用戶在各個平臺上對產品各方面的評價信息,用戶的評價信息被表示成其對評分項目在單一維度上的偏好等級,單一維度上的評分信息不能表示不同用戶對產品需求的差異,會影響到推薦系統(tǒng)的推薦準確性。對于用戶來說,因為生活環(huán)境、性格及經濟能力等不同,他們對星級酒店服務需求也不同。因此所制定的推薦系統(tǒng)需要根據用戶不同需求向他們推薦最符合他們要求的星級酒店,這種準確的個性化推薦系統(tǒng)可以節(jié)約時間成本,并且滿足用戶需求的同時使其對此系統(tǒng)產生信任與依賴。

        目前酒店推薦系統(tǒng)著力于分析基于用戶的購買歷史以及瀏覽信息,包括一些注冊信息、購物信息等,現(xiàn)有推薦系統(tǒng)是采集用戶訪問的酒店信息包括提交的對酒店的需求信息等。文獻采用聚類的方法來分析用戶的興趣和產品之間的相似性,從而具體定位符合用戶需求的產品[3]。文獻通過簡單通俗的匹配算法使得產品和用戶的興趣特征量化,這種方法需要列舉產品的特征,但是有些產品特征不容易被量化則被忽略不計[4]。文獻提出采用一種線下評估的方式,首先提取網站上關于產品的用戶評論,得到項目特征矩陣,采用協(xié)同過濾算法,推薦速度得以加快,冷啟動問題得到優(yōu)化但是沒有從根本上解決,這種方法離線資源需要持續(xù)被更新[5-8]。目前現(xiàn)有的推薦系統(tǒng)存在些許問題,例如對用戶行為缺乏分析、冷啟動、數據量少[9]。決定用戶興趣的人性化數據卻很少挖掘,難以推薦用戶真正心儀的酒店資源[10]。以上推薦系統(tǒng)多使用的是單一維度評分的推薦系統(tǒng),推薦的準確性效果不是太好,而采用多維度并且計及用戶特征相對于單一維度評分來說,反應出的信息更具體,能更加準確定位用戶感興趣的星級酒店。計入用戶特征到推薦系統(tǒng)中,能從性格、觀念、知識、經歷等多個維度來找準用戶的喜好,分析得到準確的用戶偏好,并且這樣既能提高算法的準確性,又對揚州星級酒店的銷售額有很大的增加。

        一 基于多維用戶項目評分的協(xié)同過濾算法

        基于多維用戶項目評分的協(xié)同過濾推薦(Colla borative Filteringalgorithm on multi-dimensional user project scoring),主要是收集系統(tǒng)記錄的酒店用戶評分信息,根據不同酒店用戶對某些項目的多角度評分之間的相似性來確定目標用戶的鄰居用戶。兩個項目的關系由項目評分分析確定,再通過項目之間確定關系進行推薦;其中包括通過爬蟲技術得到的網站上所有的酒店的基本信息,用戶對酒店各方面評分的信息等。目標用戶的對各個項目的預估評分可以由鄰居用戶來確定,系統(tǒng)推薦項目按照評分來定,例如計算評價項目X和評價項目Y之間的所有用戶的相似程度,首先收集各大評分網站上的評分信息,選取同時對項目X和Y的評分用戶,然后計算這些用戶間的相似性。

        (一)用戶多維項目評分矩陣

        本文使用的是Python編程語言編寫的爬蟲程序從攜程網站獲取旅游者對揚州星級酒店的評論。根據攜程網對已有的揚州星級酒店評價內容中提取的關鍵詞,確定分別從酒店的地理位置、酒店價格、房間舒適度、酒店食物、酒店設備設施與員工服務態(tài)度六個屬性進行評分數據爬取和收集,并且利用Myeclipse平臺,存入收集到的數據到Mysql當中。

        首先是網頁的抓取,收集并抓取酒店的URL放入隊列當中,選取一些揚州比較流行的星級酒店的URL,因其評論信息比較多。將這些星級酒店的URL裝入待抓取的隊列中。從待抓取的酒店URL隊列中,依次取出酒店的URL,解析得到域名服務器得到IP地址,并把URL對應的網頁下載到已下載網頁庫當中,已經抓取過得不再重復下載。將數據進行循環(huán),直至URL抓取完為止。然后對酒店評分數據的進行解析。根據每個大類事先確定的關鍵詞,判斷酒店評論中是否含有該關鍵詞以及所屬類別,計算分值。解析出來的數據首先存入Mysql再通過Mysql的轉入Excel。在對數據進行處理時,對它進行數據集的劃分。根據劃分出的數據集 ,可以得到酒店的地理位置、酒店價格、房間舒適度、酒店食物、酒店設備設施與員工服務態(tài)度多維的項目評分矩陣。

        (二)Pearson相關系數計算相似度

        sim(i,j)表示項目i與項目j的相關性,,ri,s為用戶S對共同評分項目i的評分,rj,s為用戶S對共同評分項目j的評分,和分別表示項目i和j的平均評分。

        (三)多維用戶項目評分相似度計算

        通過多維度信息準確計算用戶評論的近鄰集,相似度的融合采用融合調節(jié)因子的方式:

        式 中α、β、λ為 權 重 因 子,其 中α+β+λ=1,simobj1(m,n)表示用戶的自身屬性相似度,simobj2(m,n)表示用戶項目評分相似度,simobj3(m,n)表示用戶項目評論的相似度,各項相似度取值范圍均為(0,1)。

        (四)確定用戶的K個鄰居用戶

        根據(1-2)得出的相似性來確定最近鄰居集合S={S1,S2,S3...Sk},S1,S2,S3...Sk相似性按從小到大的排列。如何確定鄰居用戶通常有兩種方式:第一種是目標用戶的推薦鄰居利用相似性的值選擇K個近鄰用戶。第二種是鄰居用戶利用相似性的大小確定;

        (五)為用戶推薦相關列表

        進行預測評分的計算,評分預測方法如公式(1-2)所示,用戶U與用戶V之間的相似程度由式中的simuv表示,用戶V對項目i評分用Rvi,表示,則計算得到該目標用戶對項目i的評分值如公式(1-2):

        然后可以根據預測的評分進行top-n推薦。

        二 星級酒店推薦系統(tǒng)的準確性

        如何評價在推薦系統(tǒng)中獲得用戶的信任需要算法的評估指標,評價指標越好,用戶對推薦系統(tǒng)的依賴性就越大。如果推薦星級酒店系統(tǒng)推薦的酒店不符合顧客要求,也就是說,用戶的需求未得到滿足,用戶容易對該酒店的推薦系統(tǒng)感到厭倦,并且如果覺得該推薦系統(tǒng)不值得信任,最終將不會使用該推薦系統(tǒng)。因此,推薦系統(tǒng)應當確保推薦的準確性,準確性是數據挖掘過程中十分重要的性質。在推薦系統(tǒng)中,準確性越高,代表用戶對推薦系統(tǒng)推薦的產品越感興趣, 也同時表示用戶對推薦系統(tǒng)越信賴。通常評價推薦系統(tǒng)準確性的指標主要包括:準確率、召回率和MAE。MAE(平均絕對誤差)代表的是預測準確率下的指標,它通過計算預測評分與實際評分差的絕對值來表示統(tǒng)計的精度。在每對評分數和預測評分〈pi ,qi〉中,都有N個評分對,平均絕對誤差是每個分數和預測分數的分數總和的平均值。

        其具體公式表達如公式(2-1)所示:

        其中MAE的值越低,代表推薦系統(tǒng)準確性越高。

        三 實驗結果與分析

        通過的收集和處理相關數據,進行多維項目評分過濾與計算,能夠得到最終的推薦結果。推薦的準確性通常是指用戶感興趣的項目在推薦列表項目中所占的比例,代表推薦系統(tǒng)準確推薦的能力;召回率通常是指用戶感興趣的推薦項目在列表中所占的比例,用來代表采用不同值時系統(tǒng)的完全推薦能力。其中n表示n個相似用戶,當n的值不同時,推薦的結果如表1所示。

        表1 n個相似用戶的推薦結果

        由表1可見,當n≤5時,準確率和召回率隨著數值n的增大逐漸升高,當n≥5時,各項指標的上升幅度較小,且上升空間極為有限。

        由表2可見,本文提出的基于多維用戶項目評分的協(xié)同過濾算法能在保障較好準確率的情況下,提高召回率,推薦系統(tǒng)的推薦效率變得更高,系統(tǒng)也更易拓展出其他功能。用戶可以通過輸入個人信息,旅行目的地和出發(fā)時間等更多偏好,在客戶端上提交篩選條件后,利用多維用戶項目評分協(xié)作算法進行篩選和搜索,服務器就能準確推薦出符合輸入條件的星級酒店,最后將篩選結果推送到客戶端,并按評分標準依次排列,用戶可以更方便的從平臺篩選結果中做進一步的篩選,最終選擇適合自己的住星級酒店。

        表2 實驗結果的指標對比

        四 結語

        在國內電子商務平臺中,幾乎都能找到用戶對產品的評價。用戶在進行消費之前,往往首先會瀏覽平臺對相應的產品介紹,再根據已消費用戶對產品的主觀評價,判斷瀏覽的產品項目是否真實為自己所需。產品的評論具有很大的用戶消費導向,滿意度較高的評價往往能帶動更多的用戶進行消費,于是網絡平臺迫切需要了解用戶對平臺產品的確切感受,需要挖掘出更多的用戶消費偏好、用戶評價和一些有用的信息。

        本文基于酒店推薦系統(tǒng),通過處理評論信息,通過挖掘項目特征的方法對用戶的評論進行提取,對用戶的包含項目屬性多維評價與客觀表達進行保留,結構化處理項目屬性。利用爬蟲工具挖掘從多個網頁獲取對國內某酒店實際評論數據,通過進行實驗,分析實驗結果,比較兩種算法的準確性和召回率,驗證了基于多維用戶項目評分的協(xié)同過濾算法具有較好的準確性。

        猜你喜歡
        星級準確性算法
        淺談如何提高建筑安裝工程預算的準確性
        基于MapReduce的改進Eclat算法
        Travellng thg World Full—time for Rree
        “星級聯(lián)創(chuàng)”促進星光黨建的創(chuàng)新實踐
        唐DM 智聯(lián)創(chuàng)享型
        世界汽車(2019年2期)2019-03-01 09:00:08
        大指揮官 2.0T四驅臻享版
        世界汽車(2019年2期)2019-03-01 09:00:08
        進位加法的兩種算法
        一種改進的整周模糊度去相關算法
        美劇翻譯中的“神翻譯”:準確性和趣味性的平衡
        論股票價格準確性的社會效益
        一本大道香蕉视频在线观看| 国产成a人亚洲精品无码樱花| 中文字幕亚洲高清视频| 久久99亚洲精品久久久久 | 国产精品丝袜黑色高跟鞋| 91情侣在线精品国产免费| 亚洲最大av在线精品国产| 男人的天堂av网站| 久久亚洲精品ab无码播放| 国产精品乱子伦一区二区三区 | 久久精品国产亚洲av成人| av在线免费观看你懂的| 国产精品成人av大片| 热久久美女精品天天吊色| 全部孕妇毛片丰满孕妇孕交| 国产亚洲精品A在线无码| 国产视频一区二区三区免费| 久久精品国产亚洲超碰av| 国产97在线 | 中文| 乱人伦视频69| 91久久大香伊蕉在人线国产 | 无码少妇精品一区二区免费动态| 一级午夜视频| 91成人自拍视频网站| 乱码窝窝久久国产无人精品| 久久精品免视看国产成人| 国产精品久久久久孕妇| 美国黄色av一区二区| 色欲网天天无码av| 亚洲性无码av在线| 日韩精品极品视频在线免费 | 亚洲最大免费福利视频网| 亚洲精品92内射| 国产自在自线午夜精品视频在| 亚洲熟女av在线观看| 婷婷久久香蕉五月综合加勒比| 欧美性受xxxx黑人xyx性爽 | 国产精品天堂avav在线| 自拍情爱视频在线观看| 国产成人精品日本亚洲专区61| 少妇性荡欲视频|