季杰 陳強(qiáng)仁 朱東
摘要:隨著各大航空公司的業(yè)務(wù)競爭越來越激烈,在知名度與航空服務(wù)的競爭已經(jīng)分不出太大差異的情況下,怎樣努力提高用戶客戶滿意度是當(dāng)前航空公司最要注重的問題,可在海量的用戶數(shù)據(jù)面前,傳統(tǒng)的方式顯然不夠用,所以筆者嘗試用機(jī)器學(xué)習(xí)技術(shù)處理航空公司客戶價(jià)值分析問題。解決方案就是使用K-Means聚類均值算法將現(xiàn)有航空公司客戶進(jìn)行分群,這樣航空公司就好針對不同的客戶群體進(jìn)行不同的營銷方案。
關(guān)鍵詞:機(jī)器學(xué)習(xí);客戶價(jià)值分析;K-Means算法
中圖分類號:TP3 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2020)14-0238-02
1引言
在經(jīng)濟(jì)發(fā)展快速的現(xiàn)代社會,飛機(jī)出行已經(jīng)不是難事,各大航空公司的競爭也開始愈演愈烈,從價(jià)格戰(zhàn)轉(zhuǎn)到服務(wù)戰(zhàn),但由于其之間差異又不是很大,導(dǎo)致競爭一直沒有分出個(gè)勝負(fù)。但隨著航空客戶體系越來越成熟,企業(yè)開始注重“以人為本”,注意到以前的營銷方式只會造成資源傾斜,所以新時(shí)代下不同的客戶要有不同的營銷方案。而本案例做的就是針對客戶以往的消費(fèi)以及飛行情況進(jìn)行分析,然后進(jìn)行分群,這樣航空公司就可以針對不同的客戶群體制定不同的個(gè)性化服務(wù),從而達(dá)到留住客戶,吸引客戶的目的。
2航空客戶價(jià)值分析流程&數(shù)據(jù)預(yù)處理
2.1航空客戶價(jià)值分析流程
想要對客戶價(jià)值進(jìn)行分析,我們首先要對航空客戶信息數(shù)據(jù)進(jìn)行預(yù)處理操作,因?yàn)槠渲写嬖谝恍┊惓?shù)據(jù),這些數(shù)據(jù)將會影響到我們的結(jié)果,而預(yù)處理結(jié)束后,我們就可以進(jìn)行特征構(gòu)建了,畢竟用戶信息那么多的情況下,我們必須選取出我們適用的特征指標(biāo),所以我們采用了LRFMC模型來構(gòu)建特征模型,最后我們使用K-Means聚類算法來進(jìn)行客戶人群分類。
2.2航空客戶數(shù)據(jù)預(yù)處理
航空公司客戶數(shù)據(jù)中存在著少量的異常值,若是不處理的話會對之后結(jié)果產(chǎn)生影響。
1)通過對原始數(shù)據(jù)的觀察發(fā)現(xiàn),在數(shù)據(jù)中有票價(jià)為0,折扣率為0,總飛行里程卻大于0的數(shù)據(jù),這很顯然是不正常的,其中還有票價(jià)為空值的數(shù)據(jù),這可能是客戶乘機(jī)記錄不存在導(dǎo)致的,所以我們將這類數(shù)據(jù)丟棄掉。
2)數(shù)據(jù)中也可能存在折扣為0,客戶乘坐0折飛機(jī)的情況發(fā)生,由于原始數(shù)據(jù)集數(shù)量大,所以我將這類數(shù)據(jù)也丟失掉,以免影響分析結(jié)果。
3構(gòu)建航空客戶價(jià)值模型
3.1客戶價(jià)值分析常青樹-RFM模型
想要對用戶進(jìn)行分群,除了進(jìn)行預(yù)處理以外,還要構(gòu)建用戶的特征模型,這樣我們好將用戶區(qū)分開來,而各行業(yè)最常用的客戶價(jià)值模型就是RFM模型。
1)R指的是客戶最后一次消費(fèi)與這次觀測結(jié)束時(shí)間的間隔。
2)F指客戶的消費(fèi)次數(shù),消費(fèi)越多的自然客戶價(jià)值也就越大。
3)M指客戶的消費(fèi)金額,消費(fèi)金額越大的他們的消費(fèi)水平也自然越高。
3.2航空客戶價(jià)值分析-LRFMC模型
與尋常的客戶分析不同,RFM模型的客戶消費(fèi)金額并不能體現(xiàn)航空客戶的價(jià)值水平,所以本案例去掉了客戶的消費(fèi)金額,并選擇了客戶的飛行里程與購買機(jī)票的平均折扣系數(shù),一共五個(gè)特征指標(biāo),記為LRFMC模型。下面是特征詳細(xì)解釋:
1)客戶入會時(shí)間L:客戶第一次購買機(jī)票距離現(xiàn)在的時(shí)間;
2)消費(fèi)時(shí)間間隔R:客戶最近一次乘坐飛機(jī)距離現(xiàn)在的天數(shù);
3)消費(fèi)頻率F:客戶在觀測期間乘坐飛機(jī)的次數(shù);
4)飛行里程M:客戶在觀測期間飛行里程;
5)平均折扣系數(shù)C:客戶在觀測期間獲得的機(jī)票折扣的平均值。
4基于K-Means算法進(jìn)行客戶分群
之所以選擇K-Means算法,因?yàn)檫@是最普及的聚類算法,也是比較適合我這類新手的聚類算法,下面我簡單地介紹下步驟:1)Kmeans算法先要假設(shè)將數(shù)據(jù)分成多少類,我認(rèn)為航空客戶群體可以分為5類。2)隨機(jī)選取k個(gè)目標(biāo)點(diǎn),它們作為聚類中心3)計(jì)算數(shù)據(jù)集中每個(gè)點(diǎn)到K個(gè)聚類中心的距離,然后將它們分配到距離它們最近的聚類中心,這樣就能形成5個(gè)簇。4)因?yàn)楸景咐臄?shù)據(jù)量比較大,所以以上步驟得到簇是比較散的,而我們要的結(jié)果是要相似的越接近,不相似的越遠(yuǎn),所以算法會重復(fù)上面的步驟,直到得到合適的客戶群。
總體來說,K-Means算法的結(jié)果符合我的預(yù)期想法,我們可以從下圖中詳細(xì)地看出各類人群的人數(shù)以及他們分布的原因,比如圖中第三類客戶群體,他們折扣系數(shù)高,人數(shù)少,他們的其他特征指標(biāo)都不突出,但卻能帶來很多利益,所以航空公司要提升這類重要發(fā)展客戶的價(jià)值,又比如第5類人群,他們飛行里程高,飛行次數(shù)也多,為航空公司創(chuàng)造了很多價(jià)值,這類重要保持客戶群的高消費(fèi)水平是航空公司要穩(wěn)定保持的,平時(shí)要多給些優(yōu)惠和折扣讓他們對公司產(chǎn)生依賴,除了上面兩類人群外,航空公司還要防范重要挽留客戶的流水并積極進(jìn)行關(guān)系修復(fù)。至于一般客戶,平時(shí)公司可以給些小優(yōu)惠和福利折扣來進(jìn)行吸引消費(fèi),但不用太多太勤,至于無價(jià)值客戶,建議航空公司不要在這類客戶群身上花功夫,趁早選擇保留還是放棄。
5結(jié)論
在本次航空客戶價(jià)值分析案例中,首先我對航空客戶數(shù)據(jù)進(jìn)行了探查與預(yù)處理,得到了無異常值的數(shù)據(jù),確保之后的模型訓(xùn)練中不會影響結(jié)果,然后我根據(jù)客戶信息,選取并構(gòu)建特征指標(biāo),構(gòu)建了LRFMC航空客戶價(jià)值模型,最后我通過K-Means聚類算法將航空公司客戶群體分為了特征需求比較明顯的五類。這次案例的結(jié)果符合我的預(yù)期,也符合市場銷售的法則,并且在流程結(jié)尾我也對航空公司怎樣針對這五類客戶群體進(jìn)行了建議,最后我感覺不管在哪個(gè)行業(yè),在新時(shí)代對不同客戶群體進(jìn)行精準(zhǔn)營銷勢在必行。