劉婷婷+王小麗+葛明濤
摘 要:伴隨著航空公司的競爭日益劇烈,怎樣改善個性化服務(wù)提高客戶滿意度是公司在體驗(yàn)經(jīng)濟(jì)時代必須面對的問題。面對海量數(shù)據(jù),傳統(tǒng)的統(tǒng)計辦法弊病浮現(xiàn),筆者嘗試用數(shù)據(jù)挖掘技術(shù)處理航空公司客戶價值分析問題。數(shù)據(jù)挖掘技術(shù)應(yīng)用到航空范疇,可以實(shí)現(xiàn)對航空公司現(xiàn)有數(shù)據(jù)資源深度挖掘,為航空公司針對不同的客戶群采取個性化的營銷方案提供科學(xué)依據(jù)。本文的創(chuàng)新之處在于將數(shù)據(jù)挖掘技術(shù)應(yīng)用于解決航空公司具體問題之中,目的在于提高客戶價值分析的準(zhǔn)確性和高效性,提高信息化應(yīng)用水平。
關(guān)鍵詞:數(shù)據(jù)挖掘;客戶價值分析;K-Means聚類分析
DOI:10.16640/j.cnki.37-1222/t.2017.04.248
1 緒論
體驗(yàn)經(jīng)濟(jì)時代消費(fèi)趨勢主要有以下六個方面:體驗(yàn)化、情感化、個性化、主動化、休閑化和求美化。[1]第三次工業(yè)革命以來,現(xiàn)代信息技術(shù)得到迅猛發(fā)展,各行各業(yè)意識到數(shù)據(jù)的重要性,建立了無數(shù)的數(shù)據(jù)庫,面對數(shù)以億計的數(shù)據(jù),傳統(tǒng)的統(tǒng)計方法的弊端日益顯現(xiàn)。人們面對海量的數(shù)據(jù),卻不能挖掘出有用的信息,隨著“數(shù)據(jù)爆炸”困惑的增加,人們迫切需要新的數(shù)據(jù)處理技術(shù),因而數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。法國著名雕塑家羅丹說,生活中從不缺少美,而是缺少發(fā)現(xiàn)美的眼睛。如今,企業(yè)從不缺少數(shù)據(jù),而是缺少挖掘數(shù)據(jù)價值的能力。通過對現(xiàn)有數(shù)據(jù)的挖掘,發(fā)現(xiàn)隱藏在數(shù)據(jù)里的模式,有用信息,指導(dǎo)航空公司作出決策,增加顧客的滿意度,是航空公司必須解決的問題。自從1989年舉行的第十一屆國際聯(lián)合公認(rèn)學(xué)術(shù)會上首次提出數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD),到目前為止,美國人工智能協(xié)會曾經(jīng)舉辦了9次KDD全球研討會。規(guī)模從原來的專題討論會到策略和技術(shù)的集成以及多學(xué)科跨領(lǐng)域融合。數(shù)據(jù)挖掘技術(shù)迅速在航空電子領(lǐng)域,航空安全領(lǐng)域,航空維修等等航空領(lǐng)域得到較好的應(yīng)用與發(fā)展。我國在上世紀(jì)90年代的時候就已經(jīng)開始的對數(shù)據(jù)挖掘的研究,經(jīng)過多年的研究,我國已經(jīng)形成數(shù)據(jù)挖掘基礎(chǔ)理論的框架,并且越來越多的學(xué)者投入數(shù)據(jù)挖掘的研究之中。不過相對于國外來說,我國的數(shù)據(jù)挖掘應(yīng)用并沒有得到較高的發(fā)展,依然面臨著嚴(yán)重的挑戰(zhàn),仍舊有很多問題等待著研究人員去探索和發(fā)現(xiàn)。
2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘有三大步驟:第一數(shù)據(jù)籌備,第二數(shù)據(jù)挖掘,第三結(jié)果表達(dá)和解釋[5]。
數(shù)據(jù)籌備包含數(shù)據(jù)集成,數(shù)據(jù)選擇,目標(biāo)數(shù)據(jù)預(yù)處理。
數(shù)據(jù)挖掘主要是對預(yù)處理后的數(shù)據(jù)進(jìn)行挖掘。
結(jié)果表達(dá)和解釋即我們所說的結(jié)果可視化。
3 航空公司客戶價值分析
3.1 傳統(tǒng)客戶價值分析方法
傳統(tǒng)的客戶價值分析使用RFM方法(Recency--最近購買日期, Frequency--各時期購買頻率, Monetary一段時間內(nèi)消費(fèi)總和)在多數(shù)領(lǐng)域中的多數(shù)情況下能有效地預(yù)測老顧客今后可能的消費(fèi)行為和費(fèi)用,之后對銷售毛利率、關(guān)系營銷費(fèi)用進(jìn)行預(yù)測,就能按不同時間段分析出今后短期內(nèi)的客戶價值。[6]說明, 在這種分析方法中,客戶價值是指CRM毛利。CRM毛利 = 購買金額 - 產(chǎn)品成本 - 關(guān)系營銷費(fèi)用。[7]
RFM模型以Recency為X軸,F(xiàn)requency為Y軸,Monetary為Z軸做一個三維立體模型,可以把客戶價值分為八種:重要發(fā)展客戶、重要價值客戶、一般發(fā)展客戶、一般價值客戶、一般保持客戶、一般挽留客戶、重要保護(hù)客戶、重要挽留客戶。
由于航空公司客戶的獨(dú)特性,RFM方法分析航空公司客戶價值存在多種弊端和不足,造成分析結(jié)果的不準(zhǔn)確和實(shí)用性降低。
(1)在RFM模型中,消費(fèi)金額是一段時間內(nèi)客戶消費(fèi)總和,由于航空票價受到運(yùn)輸距離,艙位等級,閑忙時,天氣等眾多因素的影響,同樣消費(fèi)金額的客戶對于航空公司的價值是不同的。所以用這個指標(biāo)分析航空公司客戶價值存在不妥。
(2)RFM是使用屬性分箱法分析客戶價值的,這種方法細(xì)分客戶群較多,需要逐個識別客戶特征和行為,大大提高的針對性營銷的成本。
(3)RFM方法在處理大量數(shù)據(jù)時由于模型的限制需要的成本較高。
3.2 航空公司客戶數(shù)據(jù)分析方法與步驟
航空客戶信息,包含會員檔案信息和其他乘坐航班記錄信息等
(1)因?yàn)橄M(fèi)金額總和這一指標(biāo)在航空公司客戶價值分析過程中不太實(shí)用,所以我們可以選擇航空客戶在一段時間內(nèi)積累的乘坐距離M和乘坐艙位折扣系數(shù)平均值C來替代消費(fèi)金額總和。同時,因?yàn)楹娇展緯T的加入時間一定程度上可以影響客戶價值,所以我們在航空公司客戶價值分析模型中添加客戶關(guān)系長度L,當(dāng)做區(qū)分客戶價值的另一個指標(biāo),所以我們構(gòu)建出LRFMC模型。
(2)使用聚類分析的方法把客戶進(jìn)行分類,并且分析客戶群的特征,分析客戶價值。
第1步數(shù)據(jù)抽取。
(1)以2014年3月31為結(jié)束日期,選取寬度為兩年的時間段作為分析觀測窗口,抽取觀測窗口內(nèi)有乘機(jī)記錄的所有顧客的詳細(xì)資料形成歷史數(shù)據(jù)。對于后來新增客戶信息利用數(shù)據(jù)中最大的某個時間作為結(jié)束時間,采用同樣的方法進(jìn)行抽取,形成增量數(shù)據(jù)。
(2)根據(jù)末次飛行日期從航空公司系統(tǒng)內(nèi)抽取2012年4月1日至2014年3月31日內(nèi)所有所有乘客的詳細(xì)數(shù)據(jù),共62988條記錄。
第2步數(shù)據(jù)探索分析。
在原始數(shù)據(jù)中存在票價為空的情況,票價為空值的數(shù)據(jù)有可能是航空客戶未有乘機(jī)記錄造成的。票價最小值為0,折扣率最小值為0,總飛行里程不為0的數(shù)據(jù)有可能是顧客使用0折機(jī)票或者是使用積分兌換的機(jī)票造成的。
第3步數(shù)據(jù)預(yù)處理。
(1)數(shù)據(jù)清洗:從航空公司業(yè)務(wù)和數(shù)據(jù)挖掘建模需要考慮篩選出需要的數(shù)據(jù)。
A)不需要票價為空的數(shù)據(jù)。
B)不需要票價為0,平均折扣率不為0,總飛行里程不為0的數(shù)據(jù)。
(2)屬性規(guī)約。在原始數(shù)據(jù)中數(shù)據(jù)屬性太多,我們只需要與LRFMC模型相關(guān)的6個數(shù)據(jù)屬性,所以我們需要刪除不相關(guān),弱相關(guān)和冗余的數(shù)據(jù)屬性。
(3)數(shù)據(jù)變換。A)數(shù)據(jù)屬性構(gòu)造 B)數(shù)據(jù)標(biāo)準(zhǔn)化
第4步建構(gòu)模型。
構(gòu)建航空公司客戶價值分析LRFMC模型
A)客戶K-Means聚類分析 B)客戶價值分析 C)應(yīng)用模型
A客戶K-Means聚類分析。
采用K-Means辦法對所有客戶數(shù)據(jù)進(jìn)行聚類分析,將客戶數(shù)據(jù)聚為5類。(具體情況具體分析,必須依據(jù)實(shí)際狀況決定分幾類)
B客戶價值分析。
對聚類結(jié)果進(jìn)行屬性分析:顧客群1在L、M屬性上最??;顧客群2在R屬性上最大,在F、M上最小;客戶群3在屬性F、M上最大,在R上最小;客戶群4在屬性L上最大;客戶群5在屬性C上最大。
根據(jù)航空公司業(yè)務(wù)定義為五個等級的客戶類別:重要保持客戶,重要發(fā)展客戶,重要挽留客戶,普通價值客戶,低價值客戶。
根據(jù)每種客戶群類型的特征對客戶群進(jìn)行客戶價值排名,以便獲得高價值客戶的信息。
C模型應(yīng)用:根據(jù)每種客戶群的特征,可以采取更多個性化服務(wù)和營銷策略。
由于各種行業(yè)面臨的具體問題不同,數(shù)據(jù)挖掘技術(shù)的發(fā)展受到不同的挑戰(zhàn),不過總大趨勢來說,數(shù)據(jù)挖掘技術(shù)必將會得到更好發(fā)展和更加普遍的運(yùn)用。隨著數(shù)據(jù)量爆炸式的激增,分析決策難度的增加,傳統(tǒng)分析方法弊端的顯現(xiàn),人們對分析決策智能化和自動化的迫切需求,數(shù)據(jù)挖掘技術(shù)與工具將得到更廣泛的使用和發(fā)展。在數(shù)據(jù)爆炸時代,航空公司面臨的新挑戰(zhàn)為數(shù)據(jù)挖掘技術(shù)提供了發(fā)展背景,個性化服務(wù)的發(fā)展為數(shù)據(jù)挖掘技術(shù)提供了很好的基礎(chǔ)和發(fā)展平臺。
數(shù)據(jù)挖掘未來會吸引越來越多的研究人員,會涌現(xiàn)出越來越多的研究成果。從目前來看,數(shù)據(jù)挖掘在中國的研究與應(yīng)用還有很多務(wù)實(shí)的問題沒有解決。本文僅僅是數(shù)據(jù)挖掘技術(shù)在航空公司客戶價值分析中的初步嘗試,展望未來數(shù)據(jù)挖掘的發(fā)展,有以下幾點(diǎn)需要注意的地方:要充分考慮是否有必要進(jìn)行數(shù)據(jù)挖掘。傳統(tǒng)的數(shù)據(jù)分析辦法的確有很多弊病,但是相對于傳統(tǒng)的方法數(shù)據(jù)挖掘需要成本較高。在傳統(tǒng)數(shù)據(jù)分析技術(shù)可以滿足要求的情況下,沒有必要必須進(jìn)行數(shù)據(jù)挖掘,這樣能更加節(jié)省成本。數(shù)據(jù)挖掘需要較大的成本,須要大量的人力,物力和財力用于數(shù)據(jù)籌備,數(shù)據(jù)搜集,問題建模,生成模型和數(shù)據(jù)分析等等。
參考文獻(xiàn):
[1]吳釗.體驗(yàn)經(jīng)濟(jì)時代六大消費(fèi)趨勢[J].商業(yè)研究,2003(24).[2]Jiaweihan,Miche line kan ber.Data ming:Concepts and techniques.Diane Cerra Publisher.20063
[3]劉浩,韓晶.MATLAB R2014a一本通[J].電子工業(yè)出版社.
[4]李定遠(yuǎn).CIO時代網(wǎng).2012,09(29).
[5]耿向華.數(shù)據(jù)挖掘在旅游商務(wù)系統(tǒng)中的應(yīng)用研究[J].魅力中國,2013,5(27).
[6]郭良.基于數(shù)據(jù)挖掘技術(shù)的客戶信息分析[J].華東師范大學(xué)碩士論文,2015.
[7]郭良.基于數(shù)據(jù)挖掘技術(shù)的客戶信息分析[J].華東師范大學(xué)碩士論文,2015.
項(xiàng)目基金:鄭州大學(xué)西亞斯國際學(xué)院2016校級課題,編號2016KY0