鄭州航空工業(yè)管理學(xué)院實驗室管理處計算中心 王海燕 李曉玲
客戶關(guān)系管理(CRM,Customer Relationship Management),可以理解為應(yīng)用信息技術(shù)為企業(yè)提供全面的、個性化的客戶資料,從而使客戶與企業(yè)間所有的過程和互動能夠有助于維系和拓展這種互利關(guān)系的一種商業(yè)戰(zhàn)略。其核心思想來自市場營銷理論,強調(diào)以客戶為中心,通過完善的客戶服務(wù)和深入的客戶分析來滿足客戶的需求,不斷提高客戶的滿意度和忠誠度,進而實現(xiàn)客戶的終生價值。在過去的幾年CRM已經(jīng)變成每個企業(yè)獲得成功的重要部分。
而CRM的核心是客戶理解,“正確的客戶理解和由此引導(dǎo)的行動可提高顧客的終身價值。不恰當(dāng)?shù)目蛻衾斫鈱?dǎo)致冒險盲目的行動和措施 ”。因此本文利用數(shù)據(jù)挖掘中的聚類技術(shù)對客戶進行分析,理解客戶的分布和特征。
不同的數(shù)據(jù)挖掘工具可以從客戶數(shù)據(jù)庫抽取不同目的的信息,同時通過分析顧客的問題來為企業(yè)吸引更多的客戶。在數(shù)據(jù)挖掘中最早和最簡單的分析步驟是描述數(shù)據(jù),例如,總結(jié)它的統(tǒng)計特征(例如平均值和標(biāo)準(zhǔn)差),用圖表和圖形可以形象地觀察,查看數(shù)據(jù)域內(nèi)值的分布情況。用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則來詳細地分析客戶的交易數(shù)據(jù),從中得知顧客同時會購買哪些商品,基于規(guī)則可以組合流行產(chǎn)品,基于規(guī)則可以讓營銷人員和企業(yè)決策者制定市場營銷策略或操作規(guī)則,并且積極提供客戶感興趣的產(chǎn)品[1]。用數(shù)據(jù)挖掘中的聚類來為客戶進行分群,將具有相似消費行為的客戶歸為一組,理解客戶并提供相應(yīng)的個性化服務(wù)。數(shù)據(jù)挖掘中的分類可以用于客戶行為預(yù)測,挖掘潛在消費人群,刺激其消費。
聚類,顧名思義,即物以類聚,人以群分。所以聚類的定義為將物理的或抽象對象的集合分成相似的對象類的過程成為聚類(cl ust er ing)[2]。簇(cl ust er)是數(shù)據(jù)對象的集合,這些對象與同一個簇中的對象彼此相似,而與其他簇中的對象相異。簡單地說,從人類對這個社會具有認(rèn)知性開始聚類活動就一直存在,我們會通過不停地改進下意識的聚類模式來學(xué)習(xí)如何識別蘋果和梨,通過尋找和區(qū)分對象所具有的特征來區(qū)植物和動物等等。
聚類分析已經(jīng)廣泛應(yīng)用于圖像處理、模式識別、數(shù)據(jù)分析和市場研究等領(lǐng)域。在商業(yè)領(lǐng)域聚類能夠幫助市場分析人員根據(jù)顧客的購買模式從客戶數(shù)據(jù)庫中發(fā)現(xiàn)不同的顧客群,總結(jié)顧客群的特征,就是我們所說的“人以群分”,比如可以識別具有高水平索賠額的汽車保險持有者組群,進而提出具有針對性的市場營銷策略。在生物領(lǐng)域,聚類分析可以用來推導(dǎo)不同物種的分類,根據(jù)相似功能對基因進行分類,獲得對種群中固有結(jié)構(gòu)的認(rèn)識。
由聚類所用標(biāo)準(zhǔn)的不同可以將聚類分為劃分方法、層次方法、基于密度的方法和基于網(wǎng)格的方法。
下面依次經(jīng)過數(shù)據(jù)預(yù)處理、算法分析、結(jié)果解釋和提出針對性意見等步驟來實現(xiàn)將聚類分析應(yīng)用到客戶關(guān)系管理中。
本文所用數(shù)據(jù)為某4s店的客戶消費數(shù)據(jù),為了便于分析,需要將某些屬性量化處理。將分類數(shù)據(jù)進行量化處理,以上挑選出的分類屬性有“車主姓名”、“性別”、“所在行業(yè)”、“車主婚姻狀況”、“車主教育狀況”、“車主家庭收入”、“配置”等?!败囍骷彝ナ杖搿钡膶傩灾等〉氖且粋€個的取值范圍,比如“3000-5999元、6000-9999元、10000-14999元……30000-50000元、50000元以上”,所以也要對其進行量化處理。對于有高低之分的屬性取值如“車主教育狀況”、“車主家庭收入”、“配置”量化時就按數(shù)字從高到低進行。
DBSCAN算法為聚類分析技術(shù)中應(yīng)用廣泛且成熟的經(jīng)典算法,因此本文也選用此算法建模對數(shù)據(jù)進行分群分析。DBSCAN[3](Densit y-Based Spat ial Cl ust er ing of Appl icat ions wit h Noise)可處理噪聲的基于密度的空間聚類算法是一個基于密度的聚類算法。表1描述核心對象的定義是如果一個對象的ε鄰域內(nèi)包含至少MinPts個數(shù)據(jù)對象,則此對象被稱為一個核心對象。DBSCAN具體步驟如下:
表1 DBSCAN算法描述
本次建模算法運行中參數(shù)設(shè)置MinPts=4,半徑ε= 0.9。
表2 聚類結(jié)果簇特征分析
經(jīng)過分析數(shù)據(jù)集被劃分成四個簇,簇1包含3578條數(shù)據(jù),所占比例為70%;簇2包含1240條數(shù)據(jù),所占比例為24%;簇3包含123條數(shù)據(jù),所占比例為2%;簇4包含181條數(shù)據(jù),所占比例為4%。最后總結(jié)各個簇的特征,并給出相應(yīng)的建議,如表2所示。
本文將聚類分析應(yīng)用到客戶關(guān)系管理中,目的用來理解客戶,相比傳統(tǒng)的統(tǒng)計總結(jié)而言,本方法不僅可以根據(jù)客戶特征對客戶進行分群,還能更好的總結(jié)出各個群體的特征。
下一步嘗試將關(guān)聯(lián)規(guī)則分析、分類分析也應(yīng)用到CRM中,利用關(guān)聯(lián)規(guī)則來詳細地分析客戶的交易數(shù)據(jù),基于規(guī)則組合流行產(chǎn)品,讓營銷人員和企業(yè)決策者制定市場營銷策略或操作規(guī)則,并且積極提供客戶感興趣的產(chǎn)品,利用分類可以預(yù)測客戶行為,挖掘潛在消費人群,刺激其消費。
[1]Chen R S,Wu R C,Chen J Y,Data Mining Application in Customer Relationship Management Of Credit Card Business,in proceedings of the IEEE,29th Annual International Computer Software and Applications Conference,2005.
[2]Jiawei Han,Micheline Kamber著;范明,孟小峰譯.Data Mining Concepts and Techniques[M].北京:機械工業(yè)出版社,2004.
[3]Ester M,Kriegel H P,Sander J et al.A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise,Proceedings of 2nd Int.Conf.On Knowledge Discovery and Data Mining[C].Portland,OR,1996:226-231.