亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶特征的酒店推薦模型研究

        2022-04-07 06:19:52
        關(guān)鍵詞:特征文本用戶

        石 洋

        (湖南工程職業(yè)技術(shù)學(xué)院 生態(tài)文旅學(xué)院,湖南 長沙 410151)

        隨著酒店業(yè)的發(fā)展和信息技術(shù)的應(yīng)用,如何借助信息技術(shù)提高酒店服務(wù)水平,成為當(dāng)前信息化背景下應(yīng)思考的重點(diǎn)。其中,面向海量的用戶和酒店,如何找到用戶更感興趣的酒店,是當(dāng)前酒店推薦系統(tǒng)需要解決的難題。針對該問題,丁丁[1]提出依托大數(shù)據(jù)分析模型實(shí)現(xiàn)用戶相同偏好或相似偏好對酒店需求的預(yù)測;李書昊等[2]通過提取酒店用戶評論,提出采用線下酒店評估方法構(gòu)建酒店推薦模型。以上都是基于當(dāng)前協(xié)同推薦算法的研究。錢春琳等[3]、楊博等[4]認(rèn)為協(xié)同推薦需要解決數(shù)據(jù)稀疏性問題,進(jìn)而提高推薦的準(zhǔn)確率。劉巖[5]則提出,先用機(jī)器算法對特征進(jìn)行提取,然后再采用協(xié)同推薦算法進(jìn)行推薦。基于以上思路,本研究首先提取用戶和酒店特征,同時(shí)利用余弦相似度計(jì)算公式減少數(shù)據(jù)的稀疏性,以提高推薦精度。

        1 協(xié)同過濾推薦

        協(xié)同過濾推薦是在現(xiàn)有用戶特征中,利用相似度計(jì)算公式計(jì)算用戶間的相似度,找到興趣愛好相近的用戶,最終產(chǎn)生推薦結(jié)果[6]。根據(jù)協(xié)同過濾目的的不同,協(xié)同過濾推薦可分為基于項(xiàng)目的推薦、基于用戶的推薦和基于模型的推薦[7]。本研究是通過提取酒店用戶的特征,然后針對特征給用戶進(jìn)行推薦,所以采用基于用戶的協(xié)同過濾。先計(jì)算用戶特征的相似度,將相似度接近的用戶歸為一個(gè)集合,然后用項(xiàng)目評分預(yù)測用戶對目標(biāo)項(xiàng)目的評分,最終生成目標(biāo)項(xiàng)目top-N列表。具體步驟如下:

        (1)獲取用戶對項(xiàng)目的評分值,然后用向量R表示“用戶+項(xiàng)目+用戶對項(xiàng)目的評分”建立用戶偏好矩陣:

        (1)

        式中:N表示用戶數(shù)量;n表示項(xiàng)目數(shù)量。某用戶u對項(xiàng)目i的評分用Rui表示,取值為1~5的整數(shù)。

        (2)

        (3)從集合U中選出與目標(biāo)用戶相似度接近的近鄰構(gòu)成集合。由于集合U的數(shù)量對推薦結(jié)果和推薦質(zhì)量影響較大,故參考文獻(xiàn)[5]和文獻(xiàn)[6],將集合U的數(shù)量設(shè)定為[20,50]。

        (4)選擇最近鄰用戶評價(jià)過的且目標(biāo)用戶沒有評價(jià)過的項(xiàng)目,根據(jù)用戶對項(xiàng)目的評分,預(yù)測目標(biāo)對該項(xiàng)目的評分產(chǎn)生合適的項(xiàng)目集并推薦給目標(biāo)用戶。u對i的評分預(yù)測計(jì)算方法如式(3)所示:

        (3)

        (4)

        2 基于用戶特征的酒店協(xié)同推薦

        2.1 推薦基本思想

        本推薦模型的基本思路如下:基于酒店特征和用戶特征構(gòu)建酒店推薦候選集,根據(jù)基于用戶的協(xié)同推薦算法產(chǎn)生推薦結(jié)果,得到top-N推薦列表供酒店用戶選擇。

        2.2 用戶特征矩陣構(gòu)建

        用戶特征矩陣構(gòu)建是推薦的基礎(chǔ),也是關(guān)鍵。用戶特征包括性別、年齡、知識(shí)等多種特征,為更好地提取這些特征,在構(gòu)建用戶模型前對用戶相關(guān)信息文本的語義特征進(jìn)行提取,選取具有代表性的詞作為用戶特征。具體采用詞頻(term frequency,TF)與逆文本頻率指數(shù)(inverse document frequency,IDF)結(jié)合的方法實(shí)現(xiàn)用戶相關(guān)文本信息語義特征的提取。設(shè)V=(t1w1,t2w2,…,tiwi)表示每個(gè)文本文檔,其中的ti表示詞條項(xiàng),wi為對應(yīng)權(quán)值。若第i個(gè)詞在某個(gè)文本中出現(xiàn)的頻率高、在其他文本中的頻率低,則說明第i個(gè)詞區(qū)別能力良好;詞條t在文檔中出現(xiàn)的頻率越低,逆向文件頻率越高,則認(rèn)為t具有良好的類別區(qū)分能力。具體計(jì)算公式如下:

        (5)

        式中:tc表示權(quán)重;tfi表示第i個(gè)詞在訓(xùn)練集文本N中的詞頻;ni表示沒有出現(xiàn)第i個(gè)詞的文本數(shù)量。

        提取語義特征后,結(jié)合用戶信息構(gòu)建用戶偏好矩陣U(f):

        U(f)=(U1,U2,…,Uj),

        (6)

        式中:Uj表示用戶u對第j個(gè)特征的偏好。

        另外,為解決數(shù)據(jù)中存在的稀疏性問題,更好地挖掘用戶間的相關(guān)性,采用余弦相似度計(jì)算用戶間的相似度,具體計(jì)算公式如下:

        (7)

        基于以上的相似計(jì)算,用戶u可用n個(gè)相似用戶和用戶間的相似度表示。

        2.3 酒店特征矩陣構(gòu)建

        酒店特征通常包括房價(jià)、房間設(shè)備、酒店星級(jí)、酒店設(shè)施等。參考王婧虹等[6]對酒店特征的分析,本研究提取了k個(gè)酒店特征,具體特征及賦值見表1。

        表1 酒店特征及賦值

        在以上提取的基礎(chǔ)上,構(gòu)建酒店特征矩陣H(f):

        H(f)=(H11,H12,…,H1j,…,H2j,…,Hij),

        (8)

        式中:Hij表示酒店i的第j個(gè)特征。

        同樣,為減少數(shù)據(jù)的稀疏性,采用余弦相似度計(jì)算公式計(jì)算酒店的相似度,從而得到相似酒店的相似度:

        (9)

        2.4 酒店協(xié)同推薦

        在構(gòu)建酒店特征矩陣和用戶特征矩陣后,利用協(xié)同推薦算法計(jì)算用戶u對酒店i的期望評分pr(u,i),并根據(jù)期望評分篩選出符合用戶特征的前N家酒店作為推薦列。pr(u,i)的計(jì)算如下:

        pr(u,i)=r(v,j)×sim_u(u,v)×sim_h(i,j),

        (10)

        式中:r(v,j)表示用戶v對酒店j的評分;sim_u(u,v)表示用戶u與v之間的相似度;sim_h(i,j)表示酒店i和j之間的相似度。

        2.5 整體推薦框架

        通過以上步驟,得到基于用戶特征的酒店推薦模型(圖1)。在圖1的整體推薦框架中,基于源數(shù)據(jù)信息,通過tf-idf獲取文本特征,然后基于用戶特征和酒店特征,利用協(xié)同推薦算法實(shí)現(xiàn)酒店推薦。

        圖1 基于用戶特征的酒店推薦模型

        3 實(shí)驗(yàn)驗(yàn)證

        3.1 實(shí)驗(yàn)環(huán)境搭建及數(shù)據(jù)來源

        為驗(yàn)證以上方案的可行性,以酒店管理營運(yùn)博弈沙盤為仿真平臺(tái)[8]進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)均來自該平臺(tái)爬取的用戶數(shù)據(jù)和酒店數(shù)據(jù)。對爬取的數(shù)據(jù)進(jìn)行預(yù)處理,最終獲取用戶數(shù)據(jù)11 823條、酒店數(shù)據(jù)958條、訂單數(shù)據(jù)14 847條。

        3.2 實(shí)驗(yàn)評價(jià)指標(biāo)

        本研究選用常用的推薦算法評價(jià)指標(biāo)——準(zhǔn)確率P[9]、召回率R[10]、F1值[11],計(jì)算方法見式(11)至式(13):

        (11)

        (12)

        (13)

        以上3個(gè)指標(biāo)取值為[0,1],值越大,表示酒店推薦效果越好。

        3.3 酒店推薦效果

        結(jié)合構(gòu)建的推薦模型對用戶進(jìn)行酒店推薦,得到如表2所示的推薦結(jié)果。表2中,n表示用戶u存在相似用戶的個(gè)數(shù)。由表2可知:當(dāng)n≤6時(shí),隨著其取值的增大,準(zhǔn)確率、召回率、F1值均逐漸升高;當(dāng)n>6時(shí),隨著n的取值繼續(xù)增大,準(zhǔn)確率、召回率、F1值沒有明顯提升。由此說明,基于用戶特征的酒店推薦模型在相似用戶少于6個(gè)時(shí),推薦效果良好。

        表2 不同n值時(shí)模型推薦效果

        為驗(yàn)證本研究構(gòu)建模型推薦效果的優(yōu)越性,取用戶n=6,與傳統(tǒng)推薦算法進(jìn)行對比,得到如表3所示的結(jié)果。由表3可知,本算法的召回率、F1值均高于對比算法,雖然準(zhǔn)確率略低于基于特征參數(shù)匹配的推薦算法,但其擴(kuò)展性和推薦效果更好,故本算法的推薦效果總體上優(yōu)于對比算法。

        表3 不同推薦算法的推薦結(jié)果

        4 結(jié)語

        本研究提出了基于用戶特征的酒店推薦模型,可根據(jù)用戶特征為用戶推薦類似酒店。相較于傳統(tǒng)的基于特征參數(shù)匹配和基于協(xié)同過濾的推薦算法,本算法的召回率和F1值更高,擴(kuò)展性和推薦效果更優(yōu)。

        猜你喜歡
        特征文本用戶
        如何表達(dá)“特征”
        在808DA上文本顯示的改善
        不忠誠的四個(gè)特征
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        抓住特征巧觀察
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        如何獲取一億海外用戶
        欧美国产亚洲日韩在线二区| 日本免费看片一区二区三区| 超碰性爱| 国产诱惑人的视频在线观看| 91九色老熟女免费资源 | 国产麻传媒精品国产av| 成人国产午夜在线视频| 成人特黄特色毛片免费看| 蜜桃网站免费在线观看视频| 337p人体粉嫩胞高清视频| 99久久久无码国产aaa精品| 亚洲无码美韩综合| 日本系列有码字幕中文字幕| 国产成人喷潮在线观看| 午夜一级韩国欧美日本国产 | 久久精品人妻一区二三区| 久久波多野结衣av| 亚洲精品综合一区二区| 国产三级在线观看完整版| 曰日本一级二级三级人人| 在线观看中文字幕一区二区三区| 试看男女炮交视频一区二区三区| 精品久久有码中文字幕| 免费人成网站在线观看| 久久久久久久国产精品电影| 两个人看的www中文在线观看| 久久精品无码一区二区日韩av| 亚洲中文字幕日韩综合| 一区二区免费国产a在亚洲 | 91情侣在线精品国产免费| 丰满又紧又爽又丰满视频| 手机在线播放av网址| 亚洲va国产va天堂va久久| 精品久久久久久久久免费午夜福利| 亚洲国产精一区二区三区性色| 国产精品内射久久一级二| 中文成人无字幕乱码精品区| 色www亚洲| 热门精品一区二区三区| 亚洲国产a∨无码中文777| 影视先锋av资源噜噜|