周桂如
(福建船政交通職業(yè)技術(shù)學(xué)院公共教學(xué)部,福建 福州 350007)
20世紀(jì)末,美國(guó)、英國(guó)等西方國(guó)家開始研究酒店個(gè)性化信息服務(wù)系統(tǒng),為客戶推送個(gè)性化酒店信息,取得了較好的效果.國(guó)內(nèi),鄭州東方維景國(guó)際大酒店選擇56iq數(shù)字標(biāo)牌全面部署酒店數(shù)字服務(wù)系統(tǒng)[1],為賓客提供了更專業(yè)的服務(wù),大大提升了酒店管理、服務(wù)的質(zhì)量和效率.利用現(xiàn)代信息技術(shù)設(shè)計(jì)成本低廉、方便快捷的信息推送系統(tǒng),建立信息推送服務(wù)機(jī)制,是實(shí)現(xiàn)酒店個(gè)性化信息推薦的有效途徑.[2-3]筆者將RFM模型和協(xié)同過濾技術(shù)進(jìn)行結(jié)合,擬設(shè)計(jì)酒店房型推薦算法,以提升酒店房型的個(gè)性化推薦效果.
RFM模型[4]是客戶關(guān)系管理領(lǐng)域里的一種客戶行為分析模型.其中,近度R(Recency)為客戶最近一次交易距現(xiàn)在的時(shí)間間隔,頻度F(Frenquency)為客戶在某段時(shí)間內(nèi)交易的次數(shù),值度M(Monetary Values)為客戶在某段時(shí)間內(nèi)交易的總金額.RFM模型在客戶購買偏好和客戶價(jià)值兩方面都具有良好的表征[5],是衡量客戶潛在價(jià)值和客戶創(chuàng)利能力的重要工具.近度越小,頻度和值度越大,客戶越有可能與商家達(dá)成新的交易,因此可以通過這3個(gè)指標(biāo)反映客戶對(duì)某種商品的偏好.
協(xié)同過濾推薦算法的最大優(yōu)點(diǎn)是不需要分析目標(biāo)用戶的特征屬性,一般通過計(jì)算用戶相似度來確定目標(biāo)用戶的最近鄰[6],再通過最近鄰對(duì)某項(xiàng)目的評(píng)分加權(quán)平均值預(yù)測(cè)目標(biāo)用戶對(duì)該項(xiàng)目的偏好,從而判斷是否對(duì)目標(biāo)用戶進(jìn)行推薦.協(xié)同過濾推薦算法的實(shí)現(xiàn)主要有3個(gè)步驟.
(1)建立評(píng)分矩陣.用戶輸入的評(píng)分?jǐn)?shù)據(jù)可用如下M×N階矩陣表示:
其中:M行表示M個(gè)用戶;N列表示N個(gè)項(xiàng)目;Ri,j為用戶Ui(i=1,2,…,M)對(duì)項(xiàng)目Ij(j=1,2,…,N)的評(píng)分.
(2)計(jì)算相似度.協(xié)同過濾推薦算法的核心是根據(jù)用戶-項(xiàng)目評(píng)分矩陣發(fā)現(xiàn)目標(biāo)用戶的最近鄰[6],主要有Pearson相關(guān)系數(shù)、Cosine相似度和Tanimoto系數(shù)[7]這3種計(jì)算方法.筆者選用Pearson相關(guān)系數(shù)法計(jì)算客戶最近鄰[8],得到將要預(yù)訂酒店房型的目標(biāo)客戶Ui與其他客戶Uj之間的相似度
(1)
(3)生成推薦項(xiàng)目.根據(jù)(1)式得到目標(biāo)客戶的最近鄰集合,從目標(biāo)客戶的最近鄰中生成N個(gè)房型信息作為推薦項(xiàng).目標(biāo)客戶Ui對(duì)這N個(gè)房型的預(yù)測(cè)評(píng)分Pic′,可以通過其最近鄰對(duì)N個(gè)房型的評(píng)分計(jì)算得到,即
由于傳統(tǒng)的協(xié)同過濾推薦算法依賴于客戶對(duì)商品信息的主觀評(píng)價(jià),因此具有很強(qiáng)的主觀性.為了客觀地反映不同客戶對(duì)酒店不同房型的偏好,筆者首先利用數(shù)據(jù)挖掘技術(shù)提取客戶在酒店管理信息系統(tǒng)中的歷史訂房記錄,對(duì)不同客戶進(jìn)行價(jià)值分析和評(píng)價(jià)統(tǒng)計(jì),然后計(jì)算酒店客戶的RFM綜合值,將RFM綜合值作為協(xié)同過濾相似度度量的輸入,最后為相似客戶生成房型推薦信息,發(fā)掘潛在消費(fèi)者.圖1示出基于RFM模式和協(xié)同過濾技術(shù)的酒店房型推薦算法框架.
圖1 基于RFM模式和協(xié)同過濾技術(shù)的酒店房型推薦算法框架Fig. 1 Hotel Room Recommendation Algorithm Framework Based on RFM Model and Collaborative Filtering Technology
(1)RFM模型各指標(biāo)權(quán)重分配.采用問卷調(diào)查法獲取客戶對(duì)RFM模型各指標(biāo)的重要性程度并應(yīng)用層次分析法進(jìn)行分析,確定各指標(biāo)的權(quán)重Kr,Kf,Km.
(2)標(biāo)準(zhǔn)化RFM模型指標(biāo)值.因?yàn)镽FM模型指標(biāo)值的度量單位不同,所以采用極差正規(guī)化變換進(jìn)行數(shù)據(jù)規(guī)范化處理[4].近度F和值度M是正向影響,標(biāo)準(zhǔn)化公式分別為F′=(F-Fmin)/(Fmax-Fmin),M′=(M-Mmin)/(Mmax-Mmin).其中:F,M為原始值;Fmin,Mmin為該指標(biāo)原始值中的最小值;Fmax,Mmax為該指標(biāo)原始值中的最大值.頻度R是負(fù)向影響,標(biāo)準(zhǔn)化公式為R′=(Rmax-R)/(Rmax-Rmin).其中:R為原始值;Rmin,Rmax分別為該指標(biāo)原始值中的最小值和最大值.
(3)計(jì)算酒店客戶的RFM綜合值.將R′,F(xiàn)′,M′與各指標(biāo)的權(quán)重進(jìn)行加權(quán)求和,得到酒店客戶的RFM綜合值Z=KrR′+KfF′+KmM′,其中Kr+Kf+Km=1.
(4)協(xié)同過濾技術(shù)客戶相似度的改進(jìn).客戶在預(yù)訂酒店房型時(shí)生成的RFM數(shù)據(jù)可以反映客戶對(duì)房型的偏好,因此將處理后的RFM數(shù)據(jù)與協(xié)同過濾技術(shù)相結(jié)合,對(duì)客戶相似度計(jì)算公式進(jìn)行改進(jìn),可以得到改進(jìn)的相似度.目標(biāo)客戶Ui與客戶Uj之間的改進(jìn)相似度
(2)
為了檢驗(yàn)基于RFM模型和協(xié)同過濾技術(shù)的推薦算法(新算法)的推薦效果,將它與傳統(tǒng)的協(xié)同過濾推薦算法(傳統(tǒng)算法)進(jìn)行比較.實(shí)驗(yàn)數(shù)據(jù)選自福州市某酒店集團(tuán)各門店的訂房交易系統(tǒng)數(shù)據(jù)庫,共含923個(gè)客戶在2017年7—10月預(yù)訂房型的有效數(shù)據(jù)記錄4 043條,主要包括用戶信息、訂房交易數(shù)據(jù)和房間類型等.根據(jù)這些實(shí)驗(yàn)數(shù)據(jù)計(jì)算客戶的RFM值,并將數(shù)據(jù)分為測(cè)試集和訓(xùn)練集,分別占20%和80%,即r=0.8.
選用Mobasher給出的覆蓋率(Coverage,C)、準(zhǔn)確率(Precision,P)和F-測(cè)度(F-Measure,F(xiàn)m)[4]這3個(gè)指標(biāo)作為推薦算法的度量標(biāo)準(zhǔn),
覆蓋率和準(zhǔn)確率分別從推薦的廣泛性和精確性對(duì)算法進(jìn)行衡量,F(xiàn)-測(cè)度則是二者的結(jié)合.無論是忽視覆蓋率還是準(zhǔn)確率,都將導(dǎo)致F-測(cè)度降低,只有當(dāng)覆蓋率和準(zhǔn)確率都較優(yōu)時(shí),算法的推薦效果才較好.
實(shí)驗(yàn)中排前N個(gè)房間類型的Top-n值分別設(shè)置為3,5,10,15,20.圖2示出新算法和傳統(tǒng)算法的F-測(cè)度比較結(jié)果.從圖2可以看出,在r=0.8時(shí),新算法的F-測(cè)度比傳統(tǒng)算法高,說明新算法的房型推薦數(shù)據(jù)更準(zhǔn)確.
圖2 2種推薦算法的F-測(cè)度比較Fig. 2 Comparison of Algorithm Performance
設(shè)計(jì)了一種基于RFM模型與協(xié)同過濾技術(shù)相結(jié)合的房型推薦算法,并將該算法應(yīng)用于酒店訂房仿真實(shí)驗(yàn),結(jié)果表明,新算法的推薦方式更符合不同客戶的個(gè)性化需求,更好地實(shí)現(xiàn)了酒店個(gè)性化推薦服務(wù)功能.下一步將考慮基于Google云推送服務(wù)框架設(shè)計(jì)針對(duì)Android智能終端的酒店信息推送系統(tǒng),該系統(tǒng)將公共信息、個(gè)人專屬信息和個(gè)性化酒店推薦信息集成統(tǒng)一的推送信息,以期實(shí)現(xiàn)低成本、低流量和實(shí)時(shí)性的推薦方式.