摘要:本文闡述了CRM的內(nèi)涵和外延及數(shù)據(jù)挖掘技術(shù)常用的算法和分析方法,并在此基礎(chǔ)上重點(diǎn)分析了數(shù)據(jù)挖掘技術(shù)在CRM中的功能和應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘;知識(shí)發(fā)現(xiàn);客戶關(guān)系管理
一、CRM的概念
經(jīng)過(guò)20多年的發(fā)展,市場(chǎng)經(jīng)濟(jì)的觀念已深入人心,一些先進(jìn)企業(yè)的經(jīng)營(yíng)理念正在經(jīng)歷著從以產(chǎn)品為中心向以客戶為中心的轉(zhuǎn)移。在這種背景下,企業(yè)有必要對(duì)客戶的各種活動(dòng)和信息進(jìn)行集成,實(shí)現(xiàn)對(duì)客戶的全面管理,這就是所謂的“客戶關(guān)系管理”(CRM)。
客戶關(guān)系管理(CRM)源于以客戶為中心的商業(yè)模式,其通過(guò)對(duì)客戶關(guān)系的有效管理,以鑒別、獲得、保持為企業(yè)帶來(lái)利潤(rùn)的客戶,是一種新型的管理機(jī)制。到目前為止,CRM還沒(méi)有統(tǒng)一的定義,最早提出CRM概念的Gartner Group認(rèn)為,客戶關(guān)系管理是為企業(yè)提供全方位的管理視角,賦予企業(yè)更完善的客戶交流能力,從而實(shí)現(xiàn)客戶收益率的最大化。根據(jù)企業(yè)資源管理研究中心(AMT)的定義,CRM是一種以客戶為中心的經(jīng)營(yíng)策略,它以信息技術(shù)為手段對(duì)相關(guān)業(yè)務(wù)功能進(jìn)行重新設(shè)計(jì),并對(duì)相關(guān)工作流程進(jìn)行重組,以達(dá)到留住老客戶、吸引新客戶、提高客戶利潤(rùn)貢獻(xiàn)度的目的。筆者認(rèn)為,客戶關(guān)系管理(CRM)是現(xiàn)代企業(yè)管理的核心思想,它貫徹以客戶為中心的經(jīng)營(yíng)理念,利用信息技術(shù)來(lái)充分把握和了解客戶,在適當(dāng)?shù)臅r(shí)候,把適當(dāng)?shù)漠a(chǎn)品,通過(guò)適當(dāng)?shù)耐緩?,提供給適當(dāng)?shù)目蛻?。CRM為企業(yè)提供了一個(gè)收集、分析 和利用各種客戶信息的系統(tǒng),幫助企業(yè)充分利用其客戶管理資源,也為企業(yè)在電子商務(wù)時(shí)代從容應(yīng)對(duì)不同的客戶提供了科學(xué)的手段和方法。
二、數(shù)據(jù)挖掘技術(shù)
1. 數(shù)據(jù)挖掘常用的算法。
(1)決策樹(shù)(decision tree)決策算法。決策樹(shù)是一個(gè)類似于流程圖的樹(shù)結(jié)構(gòu),其中每個(gè)內(nèi)部節(jié)點(diǎn)表示在一個(gè)屬性上的測(cè)試,每個(gè)分枝代表一個(gè)測(cè)試輸出,而每個(gè)樹(shù)葉節(jié)點(diǎn)代表類或類分布。決策樹(shù)算法包括樹(shù)的構(gòu)造和樹(shù)的剪枝,有兩種常用的剪枝方法:先剪枝和后剪枝。
(2)神經(jīng)網(wǎng)絡(luò)(Neural Network)。神經(jīng)網(wǎng)絡(luò)是一組連接的輸入/輸出單元,其中每個(gè)連接都與一個(gè)權(quán)相連,在學(xué)習(xí)階段,通過(guò)調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán),使得能夠預(yù)測(cè)輸入樣本的正確類標(biāo)號(hào)來(lái)學(xué)習(xí)。
(3)遺傳算法(Genetic Algorithms)。遺傳算法根據(jù)適者生存的原則,形成由當(dāng)前群體中最適合的規(guī)則組成新的群體,以及這些規(guī)則的后代。遺傳算法用于分類和其他優(yōu)化問(wèn)題。
(4)粗糙集方法。粗糙集方法基于給定訓(xùn)練數(shù)據(jù)內(nèi)部的等價(jià)類的建立。它將知識(shí)理解為對(duì)數(shù)據(jù)的劃分,每一被劃分的集合稱為概念,利用已知的知識(shí)庫(kù)來(lái)處理或刻畫(huà)不精確或不確定的知識(shí)。粗糙集用于特征歸約和相關(guān)分析。
(5)模糊集方法。基于規(guī)則的分類系統(tǒng)有一個(gè)缺點(diǎn):對(duì)于連續(xù)屬性,他們有陡峭的截?cái)唷⒛:壿嬕?,允許定義“模糊”邊界,提供了在高抽象層處理的便利。
其它還有貝葉斯網(wǎng)絡(luò)、可視化技術(shù)、臨近搜索方法和公式發(fā)現(xiàn)等方法。
2. 數(shù)據(jù)挖掘常用的分析方法。
(1)分類和預(yù)測(cè)。分類和預(yù)測(cè)是兩種數(shù)據(jù)分析形式,可以用于提取描述重要數(shù)據(jù)類的模型或預(yù)測(cè)未來(lái)的數(shù)據(jù)趨勢(shì)。數(shù)據(jù)分類(data classfication)是一個(gè)兩步過(guò)程,第一步,建立一個(gè)模型,描述預(yù)定的數(shù)據(jù)類集或概念集,通過(guò)分析有屬性描述的數(shù)據(jù)庫(kù)元組來(lái)構(gòu)造模型。第二步,使用模型進(jìn)行分類。首先評(píng)估模型的預(yù)測(cè)準(zhǔn)確率,如果認(rèn)為模型的準(zhǔn)確率可以接受,就可以用來(lái)對(duì)類標(biāo)號(hào)未知的數(shù)據(jù)遠(yuǎn)祖或?qū)ο筮M(jìn)行分類。
預(yù)測(cè)是構(gòu)造和使用模型評(píng)估無(wú)標(biāo)號(hào)樣本類,或評(píng)估給定樣本可能具有的屬性值或值區(qū)間。分類和預(yù)測(cè)具有廣泛的應(yīng)用,如信譽(yù)證實(shí)、醫(yī)療診斷、性能預(yù)測(cè)和選擇購(gòu)物。分類和預(yù)測(cè)常用的算法包括決策樹(shù)歸納、貝葉斯分類、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、K-最臨近分類、遺傳算法、粗糙集和模糊集技術(shù)。
(2)聚類分析。聚類是將數(shù)據(jù)對(duì)象分組成為多個(gè)類或簇(cluster),在同一個(gè)簇中的對(duì)象之間具有較高的相似度,而不同簇中的對(duì)象差別較大。作為統(tǒng)計(jì)學(xué)的一個(gè)分支,聚類分析已被廣泛的研究了許多年,現(xiàn)在主要集中在基于距離的聚類分析,基于k-means(k-平均值)、k-medoids(k-中心點(diǎn))和其他的一些聚類分析工具也有不少的應(yīng)用。
(3)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘給定數(shù)據(jù)集中項(xiàng)之間的有趣聯(lián)系。設(shè)I={i1,i2,…im}是項(xiàng)的集合,任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫(kù)事務(wù)的集合,其中每個(gè)事務(wù)T是項(xiàng)的集合,使得T包含于I。關(guān)聯(lián)規(guī)則是形如A=>B的蘊(yùn)涵式,其中A∈I,B∈I,并且A∩B為空。關(guān)聯(lián)規(guī)則的挖掘分成兩步:①找出所有頻繁項(xiàng)集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持計(jì)數(shù)一樣。②由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿足最小支持度和最小置信度。
(4)序列模式。序列模式分析和關(guān)聯(lián)規(guī)則分析類似,也是為了挖掘數(shù)據(jù)項(xiàng)之間的聯(lián)系,不過(guò)序列模式分析的是數(shù)據(jù)項(xiàng)在時(shí)間維上的先后序列關(guān)系,如一個(gè)顧客在購(gòu)買了計(jì)算機(jī)半年后可能再購(gòu)買財(cái)務(wù)分析軟件。
(5)孤立點(diǎn)分析。孤立點(diǎn)是度量錯(cuò)誤或固有的數(shù)據(jù)變異性的結(jié)果。許多數(shù)據(jù)挖掘算法都試圖使孤立點(diǎn)的影響最小,或排除它們。一個(gè)人的噪聲可能是另一個(gè)人的信號(hào),在有些時(shí)候,孤立點(diǎn)是非常有用的。孤立點(diǎn)挖掘可以描述如下:給定一個(gè)n個(gè)數(shù)據(jù)點(diǎn)或?qū)ο蟮募?,以及預(yù)期的孤立點(diǎn)的數(shù)目k,發(fā)現(xiàn)與剩余的數(shù)據(jù)相比是顯著相異的或不一致的頭k個(gè)對(duì)象。孤立點(diǎn)探測(cè)方法可分為三類:統(tǒng)計(jì)學(xué)方法,基于距離的方法和基于偏移的方法。
三、數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用
1. 客戶細(xì)分。
客戶細(xì)分是指將一個(gè)大的客戶群體劃分為多個(gè)較小的客戶群體,在每個(gè)劃分后的客戶群體中,客戶在某個(gè)或幾個(gè)屬性值上具有高度的相似性,而在不同的群體之間客戶則差別較大。對(duì)一個(gè)商業(yè)銀行來(lái)說(shuō),如果問(wèn)“誰(shuí)是企業(yè)客戶?誰(shuí)是私人客戶?”應(yīng)該是一個(gè)容易回答的問(wèn)題,但根據(jù)消費(fèi)行為,“客戶可以分為哪幾個(gè)群體?”卻不是容易回答的問(wèn)題。事實(shí)上,每個(gè)客戶都有一系列的相關(guān)屬性,而對(duì)一些企業(yè)來(lái)說(shuō)重要的分類需綜合一系列屬性而非單個(gè)屬性來(lái)評(píng)判。數(shù)據(jù)挖掘中的聚類方法,能夠幫助企業(yè)按照客戶的類別、行業(yè)、區(qū)域、職業(yè)、收入等企業(yè)感興趣的各種條件細(xì)分市場(chǎng)??蛻艏?xì)分是企業(yè)確定產(chǎn)品和服務(wù)的基礎(chǔ),也是建立一對(duì)一營(yíng)銷的基礎(chǔ)。2000年荷蘭銀行將客戶細(xì)分為頂級(jí)、重要、核心和大眾四類客戶群,提供有針對(duì)性的差別服務(wù),營(yíng)業(yè)收入增長(zhǎng)了一倍以上。
2. 客戶獲得。
獲取客戶的傳統(tǒng)方式一般是通過(guò)各種媒體廣告、散發(fā)傳單等吸引新客戶,但是這種方式有著嚴(yán)重的缺陷,如不能做到有的放矢,造成資源浪費(fèi),預(yù)期效果不理想等.數(shù)據(jù)挖掘中的分類、聚類技術(shù)可以幫助企業(yè)分析現(xiàn)有客戶來(lái)自哪里,他們有什么共同特征,然后建立響應(yīng)模型,估算客戶對(duì)一個(gè)產(chǎn)品與服務(wù)的響應(yīng)概率,挖掘潛在客戶。Eddie Bauer 公司使用SAS公司提供的數(shù)據(jù)挖掘工具,通過(guò)預(yù)期建模來(lái)決定哪些客戶會(huì)購(gòu)買相關(guān)產(chǎn)品,并向那些客戶發(fā)送郵件和產(chǎn)品目錄,收到了良好的效果。
3. 分析客戶行為,進(jìn)行交叉銷售。
交叉銷售是指企業(yè)向原有的客戶銷售新的產(chǎn)品或服務(wù),它是購(gòu)物籃分析中的一個(gè)典型例子。在很多情況下,企業(yè)需要了解顧客的購(gòu)物習(xí)慣,如“顧客在一次購(gòu)物時(shí)會(huì)同時(shí)購(gòu)買什么樣的商品組合?”,以便進(jìn)行市場(chǎng)規(guī)劃、廣告策劃和分類設(shè)計(jì)。如果顧客購(gòu)買計(jì)算機(jī)也傾向于同時(shí)購(gòu)買財(cái)務(wù)管理軟件,那么將硬件擺放得離軟件近一點(diǎn),可能有助于增加二者的銷售。數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘可以幫助發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間的這種有趣的關(guān)聯(lián)或聯(lián)系,
4. 分析客戶忠誠(chéng)度,避免客戶流失。
研究表明:獲得一個(gè)新客戶是留住一個(gè)老客戶的成本的5~8倍;對(duì)客戶保留率提高5%,利潤(rùn)會(huì)提高85%;推銷產(chǎn)品或服務(wù)給一位新客戶和一位老客戶的成交機(jī)會(huì)分別為15%和50%;如補(bǔ)救得當(dāng),70%的不滿意的客戶會(huì)繼續(xù)購(gòu)買企業(yè)的產(chǎn)品或服務(wù);著名的網(wǎng)上書(shū)店Amazon.com獲得了極大的成功,主要的原因是提升了客戶忠誠(chéng)度,來(lái)自160個(gè)國(guó)家的800萬(wàn)的客戶當(dāng)中,有65%的客戶是以前的老客戶。
因此現(xiàn)代企業(yè)要通過(guò)客戶關(guān)系管理提高現(xiàn)有的和潛在客戶的忠誠(chéng)度,避免客戶流失。數(shù)據(jù)挖掘技術(shù)通過(guò)流失建模幫助企業(yè)分析客戶忠誠(chéng)度,了解哪些客戶流失了,他們的共同特征是什么,什么時(shí)候流失的,流失的原因是什么,這種對(duì)客戶保持和流失的分析可以幫助企業(yè)制定有效措施,提高客戶忠誠(chéng)度。
5. 客戶盈利能力分析與預(yù)測(cè)。
根據(jù)20/80規(guī)則,20%的客戶通常會(huì)帶來(lái)80%的利潤(rùn),因此企業(yè)需要了解哪些客戶是給企業(yè)帶來(lái)利潤(rùn)的客戶,哪些客戶會(huì)給企業(yè)帶來(lái)?yè)p失,從而將資源更多的分配給為公司貢獻(xiàn)利潤(rùn)的客戶,減少在不為公司貢獻(xiàn)利潤(rùn)的客戶身上所花的費(fèi)用,杜絕風(fēng)險(xiǎn)極高的客戶。利用數(shù)據(jù)挖掘中的分類與預(yù)測(cè)技術(shù)建立生命周期價(jià)值(LifeTime Value, LTV)模型可以預(yù)測(cè)客戶在預(yù)定時(shí)間長(zhǎng)度內(nèi)的總體利潤(rùn)。如電信公司可以預(yù)測(cè)一個(gè)新客戶的利潤(rùn)貢獻(xiàn)度,并據(jù)此制定相應(yīng)的營(yíng)銷策略。
6. 客戶滿意度分析。
通過(guò)自定義的定量的度量標(biāo)準(zhǔn)和公式,并根據(jù)時(shí)間和其他參數(shù),利用數(shù)據(jù)挖掘技術(shù)和企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)中關(guān)于客戶購(gòu)買、維修、反饋意見(jiàn)、建議、投訴等信息,可對(duì)客戶的滿意度進(jìn)行分析,找出客戶不滿意的原因并制定相應(yīng)的策略,提高客戶忠誠(chéng)度,增加企業(yè)的利潤(rùn)。
7. 異常監(jiān)測(cè)。
利用數(shù)據(jù)挖掘技術(shù)中的孤立點(diǎn)分析可以發(fā)現(xiàn)異常數(shù)據(jù),這些異常數(shù)據(jù)對(duì)分析客戶的信用度是非常有用的,如在金融業(yè)利用孤立點(diǎn)分析可以發(fā)現(xiàn)信用卡惡意透支、洗黑錢等,在零售業(yè)可以分析客戶欺詐、銷售異常等。
參考文獻(xiàn):
1.Jiawei Han,Micheline Kamber著.范明,孟小峰等譯.?dāng)?shù)據(jù)挖掘概念與技術(shù).機(jī)械工業(yè)出版社,2002.
2.Olivia Parr Rud著.朱揚(yáng)勇,左子葉,張忠平等譯.?dāng)?shù)據(jù)挖掘?qū)嵺`.機(jī)械工業(yè)出版社,2003.
3.楊德宏,李玲編著.客戶關(guān)系管理成功案例.機(jī)械工業(yè)出版社,2002.
作者簡(jiǎn)介:南京大學(xué)商學(xué)院碩士生。
收稿日期:2004-01-29。