作者簡介:周楊頔(1999-),女,漢族,北京人。主要研究方向:信息管理與信息系統(tǒng)(大數(shù)據(jù)與商務(wù)分析方向)。
摘要:隨著民用航空運輸?shù)牟粩喟l(fā)展,乘機出行已經(jīng)成為越來越多人的選擇,航空公司也面臨著愈加龐大的客戶群體。那么,了解客戶特點和計算客戶價值成為航空公司必須面臨的課題。本文以某一航空公司為例,分析航空公司客戶群體的整體分類并且利用已有的數(shù)據(jù)對客戶進行流失預(yù)測。通過研究,發(fā)現(xiàn)該航空公司的客戶可以分為五類,對應(yīng)著不同的客戶價值,并從不同角度對分類和價值進行驗證。在此基礎(chǔ)上,本文還分析不同指標(biāo)之間的相互影響和關(guān)聯(lián),幫助航空公司更好的了解客戶和市場。
關(guān)鍵詞:RFM模型改進 客戶細分 Logistic回歸 流失預(yù)測
隨著人們生活水平的不斷提高,我國航空客運業(yè)務(wù)發(fā)展迅速。2014-2019年,我國民航主要客運能力指標(biāo)保持平穩(wěn)增長,其中2019年全行業(yè)完成旅客周轉(zhuǎn)量11705.1億人公里,較2018年增長9.3%。航空客運需求不斷增大的同時,各個航空公司之間的競爭也日益激烈。
一.研究背景及目的
客戶價值理論經(jīng)過前人不斷地研究,例如RFM模型、CRM理論等等相關(guān)研究,已經(jīng)為如今市場面臨的客戶價值分析和客戶關(guān)系建立打下了堅實的基礎(chǔ)。其中,研究的主要目的即為客戶細分和流失預(yù)測。使用改進后的RFM模型對客戶評估打分,量化每一位客戶的客戶價值,并給出航空公司相應(yīng)的營銷策略,幫助航空公司對客戶流失進行預(yù)測,盡可能早地察覺客戶的流失風(fēng)險,為挽留客戶爭取時間和機會。
(一)數(shù)據(jù)處理
樣本數(shù)據(jù)主要包括客戶的會員卡號、入會時間、性別、會員卡級別、飛行里程數(shù)、飛行積分情況、飛行次數(shù)、飛行時間間隔等屬性。根初步分析,將數(shù)據(jù)雜亂和缺失較多的變量刪除并剔除部分分析指標(biāo)上有缺失的個案。
其次,將“WORK_COUNTRY”“GENDER”轉(zhuǎn)換為啞變量“IS_DOMASTIC”(0-國外,1-國內(nèi))和“NGENDER”(0-“男”,1-“女”);將“AGE”大于100的樣本剔除;“LOAD_TIME”有四個省缺值,故將省缺值記為相同日期;計算首末乘機時間差并剔除小于零的個案。
第一和第二年票價“SUM_YR_1”、“SUM_YR_2”兩個變量中均存在觀測值為0的個案,這可能是乘機人購買到零元折扣機票或用積分兌換。由于此類個案所占比例較小,故不納入分析。因此刪除總票價為0,平均折扣率為0(數(shù)值越大,折扣越大),積分兌換次數(shù)為0,而飛行里程大于0或者乘機次數(shù)大于0的個案。
(二)數(shù)據(jù)初步分析
通過獨立樣本T檢驗可知,男性觀測窗口內(nèi)的平均飛行次數(shù)比女性多3.47次。此外,在飛行加權(quán)公里數(shù)、觀測期內(nèi)支付的總票價以及入會時長上,男性均與女性有顯著差異且平均值更大。
通過單因素的方差分析發(fā)現(xiàn),與級別4相比,會員卡級別5、6的客戶支付的總票價較高、乘機次數(shù)較多并且明顯更加活躍,客戶價值明顯高于級別4。通過ANOVA檢驗發(fā)現(xiàn),會員級別越高,平均折扣率越大,這可能更加激勵了高級別會員的乘機選擇。
二.客戶細分
(一)RFM模型
RFM模型是常見的評價客戶價值的模型。R指客戶最后一次消費行為發(fā)生到觀測點之間的時間差,F(xiàn)是指觀測窗口內(nèi)客戶的消費頻率,M是指觀測窗口內(nèi)消費的總金額。[1]為保證模型更加貼近研究,做出如下改進:
1.改進R算法
借鑒季曉芬、賈真在該方向上的研究,R的測算可以做出如下改進:
其中為客戶觀察期內(nèi)首次乘機的時間,為客戶觀察期內(nèi)的末次乘機的時間,為觀測窗口結(jié)束時間。當(dāng)最遠乘機時間差相同時,最近乘機時間差越小,R越小,表示客戶更加活躍。當(dāng)時,R=1,這可能是由新客戶在觀測窗口期內(nèi)僅乘機一次造成的[2]。同時,為保證R大于0,在進行日期之間差運算時,將首末乘機日期均向前推一天。
2.改進后的RFM模型——DRFKM模型
由于原始數(shù)據(jù)中包含的屬性太多,且根據(jù)數(shù)據(jù)的初步探索之后可知有些變量不適合進行計算,故選取與改進后的RFM相關(guān)的屬性進行分析和計算。
因為航空公司會員的加入時間一定程度上可以影響客戶價值,所以我們在航空公司客戶價值分析模型中添加客戶關(guān)系長度 D(Duration),作為區(qū)分客戶價值的一個指標(biāo)[3]。
1.D:Duration,“入會時長”,以天數(shù)為單位
2.R:M_R,即“客戶活躍度”,參考改進后的R算法
3.F:Frequency,“飛行總次數(shù)”
4.K:WEIGHTED_SEG_KM,即“飛行加權(quán)公里數(shù)”
5.M:Monetary,“支付的總票價”
首先,直接對相關(guān)的五個指標(biāo)進行標(biāo)準(zhǔn)化變換。此處沒有取到數(shù)運算是因為逆向指標(biāo)R的聚類結(jié)果更理想。由于樣本數(shù)量較大,故采取隨機抽樣的方式,抽取4%的個案進行系統(tǒng)聚類,確定分為五類比較合適,并將各類的聚類中心作為K-Means聚類時的初始聚類中心。在各分類上,個案的分布情況和不同類別在不同指標(biāo)上的得分區(qū)別亦比較明顯。
(二)綜合評價體系計算客戶價值
1. 綜合評價體系
在前人研究經(jīng)驗的基礎(chǔ)上構(gòu)建綜合評價體系,具體實現(xiàn)方式由圖表1所示[4]:
2. 數(shù)據(jù)處理
(1)將積分類變量進行探索性因子分析
會員積分類變量包含18個相關(guān)變量,建立模型前先對這些指標(biāo)進行初步探索分析,對部分不適于建立模型的變量進行剔除??偣蔡崛×怂膫€因子,分別命名為“乘機積分”、“里程積分比例”、“其他積分”和“積分變動”。因子分析結(jié)果中,KMO 取樣適切性量數(shù)為0.706,同時,為了保證所有指標(biāo)的提取度大于75%,所以提取4個因子,總共解釋了84.214%的方差,提取度較好。
數(shù)據(jù)處理
“AGE(年齡)”與指標(biāo)M“支付的總票價”的散點圖,客戶支付總票價從40歲向兩邊遞減。故將年齡以40為界,大于40歲的個案按照比例:
映射到[10,40)歲的范圍內(nèi),可得“NEW_AGE(年齡N)”。y表示映射后的年齡,x表示個案的真實年齡。
“預(yù)期”指標(biāo)下的“客戶的成長預(yù)期”是:以飛行總次數(shù)、支付的總票價和總累計積分三項指標(biāo)在觀測期的第二年與第一年的差值為基礎(chǔ),再對三項差值用主成分的方法提取一個因子,將因子得分作為觀測值。
“客戶活躍度(x9)”由改進后的RFM模型中R(NEW_R)的倒數(shù)來衡量。
“會員價值”下的指標(biāo)可以從原數(shù)據(jù)和之前已經(jīng)計算的數(shù)據(jù)中獲得;“保持價值”的“積分變動”可以從上述對積分類變量的因子分析中獲得。
3. 層次分析法
判斷矩陣由桂林電子科技大學(xué)市場管理學(xué)院老師做出,以此為參考計算各個客戶的各級指標(biāo)得分以及綜合得分(“SCORE”表示綜合得分)。數(shù)據(jù)規(guī)格化和權(quán)重計算過程用R語言實現(xiàn)。
三.客戶細分基礎(chǔ)上的探究
DRFKM模型和綜合評價體系結(jié)果對比,在數(shù)據(jù)的初步分析階段可知,男性客戶偏向高價值客戶。根據(jù)上述的分析將客戶分類:
重要保持客戶——分類1
這類客戶的飛行總次數(shù)、飛行的加權(quán)公里數(shù)明顯高于其他類型的客戶, 說明此類客戶對航空飛行的依賴程度較大,一般情況下不會改變對出行的選擇,是航空公司重要的優(yōu)質(zhì)客戶群。
重要發(fā)展客戶——分類2
與重要保持客戶相比,這類客戶在各指標(biāo)上的得分或者是數(shù)值明顯小,尤其是這類客戶的入會時長短造。也就是說,只要能持續(xù)吸引此類客戶消費,培養(yǎng)其消費習(xí)慣,這類客戶有很大的發(fā)展?jié)摿?,可以給企業(yè)帶來較高的潛在利潤。
1.重要挽留客戶——分類3
組4應(yīng)當(dāng)屬于重要挽留客戶。這類客戶在入會時長這一項指標(biāo)上明顯較高,但是飛行次數(shù)和活躍度等均不高。這類客戶游走在流失的邊緣,說明這類客戶對本企業(yè)或者是對于航空出行的方式依賴度不高,但是并沒有完全排除這種出行選擇。
2.一般客戶與低價值客戶——分類4、5
組2為一般客戶,這類客戶的入會時長較短,其他指標(biāo)與組別1、3比較來說均比較低。組別5在所有衡量指標(biāo)上都呈現(xiàn)弱勢,所以將此類歸為低價值客戶,這類客戶可能只在能夠獲得低價票時才會消費,所以企業(yè)不應(yīng)將精力過多花費在此類客戶上。
四.Logistic回歸預(yù)測客戶流失
(一)模型建立
對客戶是否流失作預(yù)測,有本文對流失客戶作如下定義:最后一次乘機時間至觀測窗口末端時長大于等于觀測窗口內(nèi)最大乘機間隔[5]。
由于利用SPSS采用“向前:有條件”的方法二元回歸,并將原始數(shù)據(jù)中經(jīng)過數(shù)據(jù)處理后的數(shù)據(jù)均加入模型進行篩選。同時為更好解釋結(jié)果和便于數(shù)據(jù)直接獲得,用轉(zhuǎn)換后的年齡作為“年齡”的觀測值,用“客戶活躍度”用末次乘機至觀測期結(jié)束的天數(shù)差為衡量標(biāo)準(zhǔn)。
(二)結(jié)果分析
經(jīng)過多次迭代,在步驟17篩選出最終的17個變量建立整體顯著且擬合效果較好的回歸模型,最終預(yù)測準(zhǔn)確率達到94%。
對方程中的變量進一步分析可知,“季度平均飛行次數(shù)”每增加一個單位,客戶流失的風(fēng)險與原來相比增加7.525。其他指標(biāo)的影響雖然沒有這項顯著,但是也可以看出整體的影響趨勢。例如,“積分兌換次數(shù)”、“末次乘機至觀測窗口末端時長”兩項指標(biāo)的觀測值偏大的客戶容易流失,會員等級為4的客戶相對于會員等級為6的客戶容易流失。
從Exp(B)小于1的指標(biāo)來看,“第1年乘機次數(shù)比率”對客戶是否流失的影響最大,每增加一個單位,客戶流失的風(fēng)險與原來相比降低。參考其他指標(biāo)的優(yōu)勢比可知,年齡越接近40歲、性別為女性,在國內(nèi)工作以及平均折扣率偏低的客戶流失的風(fēng)險偏小。
結(jié)合DRFKM模型再次對樣本做相應(yīng)分析,用最優(yōu)標(biāo)度法做出類別點的聯(lián)合圖。由圖表2可知,只要各個指標(biāo)水平達到中等及以上,客戶的流失風(fēng)險就會降低。流失趨勢和上述DRFKM模型和綜合評價體系分析結(jié)果相照應(yīng),流失風(fēng)險和指標(biāo)得分呈現(xiàn)負相關(guān)。
五.結(jié)語
通過本文的分析和研究,可以對航空公司的客戶群體細分為五類,并向航空公司提出一下建議:
一.會員等級變更
建立會員制已經(jīng)是大多數(shù)商家的營銷手段,從本文的樣本分析數(shù)據(jù)來看,乘坐過該航空的客戶基本都成為航空公司的會員。通過上述的分析可知,會員等級越高,客戶給航空公司帶來的價值就越高,相應(yīng)的客戶生命周期也越長。級別5比級別6的客戶在總體上大約僅多出3%,對于航空公司而言,應(yīng)當(dāng)注重發(fā)展級別5的客戶,使級別5和6之間的有一定的差異,保證不同會員級別的人數(shù)合理,才能保證會員制度的有效性。航空公司還注重會員等級制度與其他服務(wù)的關(guān)聯(lián),尤其是“平均折扣率”以及“非乘機積分變動”之間的聯(lián)系。
二.積分變動與交叉銷售
從Logistic回歸分析可知,“非乘機積分的變動次數(shù)”越多,客戶流失的風(fēng)險就越小。因此,航空公司可以深入了解客戶非乘機積分的變化情況,分析客戶的主要積分獲取途徑。對于重要挽留客戶而言,如何提升乘機價值是航空公司應(yīng)當(dāng)重點考察的因素。這類客戶入會時間,但是乘機價值并不高,這可能因為此類客戶有一部分的乘機需求具有季節(jié)性。由于消費間隔期較長,客戶容易降低對對航空公司的關(guān)聯(lián)程度,所以航空公司可以通過與其他航空公司或者其他產(chǎn)品聯(lián)合銷售,讓客戶在非乘機期間持續(xù)與航空公司保持關(guān)聯(lián)。
三.保持優(yōu)質(zhì)客戶,挖掘客戶價值
綜合DRFKM模型和綜合評價得分結(jié)果來看,組1重要保持客戶和組3重要發(fā)展客戶的得分差異主要體現(xiàn)在客戶的當(dāng)前價值和潛在價值上,尤其使當(dāng)前價值上的差異。企業(yè)如果采取更積極、恰當(dāng)?shù)臓I銷手段,讓這類客戶充分了解企業(yè)的產(chǎn)品或者提供更多接觸的機會,會從這類客戶身上獲取相當(dāng)?shù)睦鎇7]。
參 考 文 獻
[1]Hughes A M. Making database pay off using recency, frequency and monetary analysis(J}. Journal of Database Marketing, 1995, 3:77-89.
[2]季曉芬,賈真.基于RFM行為模型的服裝企業(yè)VIP顧客數(shù)據(jù)挖掘[J].浙江理工大學(xué)學(xué)報,2015,34(04):131-135.
[3]劉婷婷,王小麗,葛明濤.基于數(shù)據(jù)挖掘的航空公司客戶價值分析[J].山東工業(yè)技術(shù),2017(04):287-288.
[4]陳延杰. 基于數(shù)據(jù)挖掘技術(shù)的航空公司會員客戶價值研究[D].福州大學(xué),2015.
[5]申玉偉. 航空公司客戶分類及流失預(yù)測[D].貴州財經(jīng)大學(xué),2019.