[摘要] 隨著數(shù)據(jù)挖掘在企業(yè)客戶關(guān)系管理中應用的深入,關(guān)聯(lián)分析越來越成為企業(yè)在CRM中應用最廣泛的數(shù)據(jù)挖掘方法和模式。本文以一家企業(yè)CRM關(guān)聯(lián)分析為例,圍繞關(guān)聯(lián)分析實踐了數(shù)據(jù)挖掘的過程,指明了該過程的意義,并結(jié)合挖掘結(jié)果分析了該企業(yè)CRM的工作重點。
[關(guān)鍵詞] 數(shù)據(jù)挖掘 關(guān)聯(lián)分析 CRM
一、引言
CRM(客戶關(guān)系管理)是指企業(yè)為了獲取最大經(jīng)濟效益,運用現(xiàn)代科學技術(shù)對公司與客戶之間的關(guān)系進行有效管理的新模式,它包括市場調(diào)查、產(chǎn)品銷售、客戶服務(wù)和管理決策等一系列商業(yè)流程。隨著客戶數(shù)量的大量積累,客戶信息的日益復雜,僅限于營銷流程的管理已很難滿足企業(yè)進一步發(fā)展的需要。另外,激烈競爭的市場環(huán)境,迫使企業(yè)必須立足于客戶的個性需求,提供相應的產(chǎn)品和服務(wù),而客戶的個性特征如何獲取,是企業(yè)面臨的難題之一。數(shù)據(jù)挖掘作為一種強有力的數(shù)據(jù)分析工具,在分析型CRM中的關(guān)鍵作用已經(jīng)顯現(xiàn),為企業(yè)進行全面深入和多維的客戶分析提供了強有力的工具。數(shù)據(jù)挖掘技術(shù)在企業(yè)的客戶關(guān)系管理中,可以應用到客戶群體分類分析、交叉銷售、客戶的維護、客戶盈利能力分析和預測、客戶滿意度分析等;而關(guān)聯(lián)分析是商業(yè)分析中應用最廣泛的一種數(shù)據(jù)挖掘方法和模式。
二、基于關(guān)聯(lián)分析的數(shù)據(jù)挖掘
關(guān)聯(lián)分析是數(shù)據(jù)挖掘的一種主要形式,而且是無監(jiān)督學習型系統(tǒng)中最普遍的知識發(fā)現(xiàn)形式。典型的關(guān)聯(lián)分析體現(xiàn)在基于交易數(shù)據(jù)的購物籃分析中。關(guān)聯(lián)分析能夠發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品(項)之間的聯(lián)系,如購買了某一商品對購買其他商品的影響。這種影響有時是正面的,有時是負面的,例如“90%的顧客在一次購買活動中購買商品A的同時購買商品B”,表明商品A與B是正相關(guān)的。這種規(guī)則可以表示為“A=>B”,表明顧客在購買商品A的條件下,購買B的概率。根據(jù)類似規(guī)則可以對顧客的購買模式進行深入分析,發(fā)現(xiàn)對商業(yè)決策有價值的規(guī)則和知識。
用于關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的主要對象是事務(wù)型數(shù)據(jù)庫,其中針對的應用則是售貨數(shù)據(jù),也稱貨籃數(shù)據(jù)。一項事務(wù)一般由事務(wù)處理時間、一組客戶購買的物品、客戶標識號等組成。由于條形碼技術(shù)的發(fā)展,零售部門可以方便地收集存儲大量的售貨數(shù)據(jù)。對這些歷史事務(wù)數(shù)據(jù)進行關(guān)聯(lián)分析,則可對客戶的購買行為提供極有價值的信息。例如,可以幫助規(guī)劃市場(怎樣相互搭配銷售)。從事務(wù)數(shù)據(jù)中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,對于改進銷售業(yè)績等商業(yè)活動的決策是非常重要的。
三、關(guān)聯(lián)分析在企業(yè)CRM中的應用實例
1.數(shù)據(jù)挖掘的主題
某企業(yè)以銷售打印機相關(guān)產(chǎn)品為主要業(yè)務(wù),客戶中有購買商品自用的最終客戶,也有批發(fā)商,多年的業(yè)務(wù)使企業(yè)積累了一定量的銷售數(shù)據(jù)。本次數(shù)據(jù)挖掘的主題就是對這些數(shù)據(jù)展開關(guān)聯(lián)分析,找到最有價值客戶中的購買規(guī)律,從大量的交易數(shù)據(jù)中,獲得這些大客戶購買商品的種類和頻率;通過關(guān)聯(lián)規(guī)則,找出最受大客戶歡迎的商品;并根據(jù)大客戶的喜好,采取相應措施維護客戶關(guān)系,實現(xiàn)客戶價值。
2.數(shù)據(jù)的收集
本次數(shù)據(jù)挖掘我們從該銷售公司的原始銷售表格中提取了以下數(shù)據(jù)作為我們數(shù)據(jù)挖掘的原數(shù)據(jù)(見表1)
(1)客戶名稱:描述客戶關(guān)系管理的對象;
(2)單號、貨品編碼、數(shù)量、銷售貨款:描述每個客戶所購買的貨品、數(shù)量、每一筆交易中每一種貨品的總價格;
(3)銷售收入、銷售毛利:描述哪些商品盈利大,哪些商品最暢銷;
(4)開單日期:描述客戶購買的頻率;
(5)品名規(guī)格、計量單位、單價:描述客戶所購商品的基本信息
3.數(shù)據(jù)預處理
采用關(guān)聯(lián)規(guī)則的挖掘方法,需要先對數(shù)據(jù)進行預處理,就是對數(shù)據(jù)進行篩選,選出數(shù)據(jù)挖掘中需要的數(shù)據(jù),并且對數(shù)據(jù)進行整理。首先以每個客戶的半年交易總額為參考,把交易總額低于10萬的客戶剔除,因這部分客戶大都是零散購買商品的客戶,公司購買商品量比較小,毛利率低,客戶關(guān)系維護的價值不大。其次,把交易總額高于10萬的客戶再進行一次篩選,剔除屬于一次性購買大量的辦公自動化用品的用戶,這樣留下的客戶則是那些與公司有多次交易往來并且交易總額比較大的客戶,當然這些客戶是公司主要的客戶關(guān)系維護目標。
數(shù)據(jù)經(jīng)過篩選以后,在實現(xiàn)數(shù)據(jù)挖掘之前,還需要對數(shù)據(jù)進行二元處理。首先,把商品分為6大類,分別為“復印機”、“墨粉”、“硒鼓”、“復印紙”、“打印機”“送紙器”。其次,判斷大客戶是否購買這些商品,并以二元數(shù)據(jù)加以表示。處理后的數(shù)據(jù)如表2所示。
4.數(shù)據(jù)挖掘的實現(xiàn)
本次數(shù)據(jù)挖掘選用Weka GUI Chooser工具。Weka GUI Chooser是基于Java的用于數(shù)據(jù)挖掘和知識分析的平臺,集合了大量能承擔數(shù)據(jù)挖掘任務(wù)的機器學習算法,包括對數(shù)據(jù)進行預處理、分類、回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化。本文對企業(yè)銷售數(shù)據(jù)的挖掘,只選用關(guān)聯(lián)規(guī)則算法,調(diào)用Weka GUI Chooser挖掘工具中的Associate Rules的模塊,選定關(guān)聯(lián)規(guī)則中的Apriori算法,將預處理好的數(shù)據(jù)轉(zhuǎn)換為文本格式,導入Weka GUI Chooser進行挖掘。
挖掘后的結(jié)果顯示為:
Best rules found:
(1)toner=yes printer=no 400 ==> manifdder=no paper=no 235 conf:(0.59)
(2)manifdder=no automatic-document-feeder=no 566 ==> paper=no printer=no 332conf:(0.59)
(3)manifdder=no 620 ==> toner=yes printer=no 363conf:(0.59)
(4)toner=yes 410 ==> manifdder=no paper=no automatic-document-feeder=no 240conf:(0.59)
(5)toner=no automatic-document-feeder=no 504 ==> manifdder=yes tambour-opc=no printer=no 294 conf:(0.58)
(6)manifdder=no printer=no 530 ==> tambour-opc=no 309conf:(0.58)
(7)paper=no 672 ==> toner=no 390conf:(0.58)
(8) manifdder=no 620 ==> toner=yes printer=no automatic-document-feeder=no 359conf:(0.58)
(9)toner=yes printer=no 400 ==> manifdder=no paper=no automatic-document-feeder=no 231conf:(0.58)
(10)paper=no 672 ==> manifdder=no automatic-document-feeder=no 388conf:(0.58)
……
在所得結(jié)果中,有意義的關(guān)聯(lián)規(guī)則主要有:
1、if automatic-document-feeder=yes 177 then manifdder=yes 123conf:(0.69)
意義:如果客戶購買復印機,那么同時買送紙器,置信度為0.69
2、 if manifdder=yes 218 thenpaper=yes 397conf:(0.55)
意義:如果客戶購買復印機,那么同時復印紙,置信度為0.55
3、if tambour-opc=yes 255 then toner=yes 133 conf:(0.52)
意義:如果客戶購買硒鼓,那么同時購買墨粉,置信度為0.52
四、數(shù)據(jù)挖掘結(jié)果對企業(yè)CRM的作用
1.深入了解重要客戶的需求特征
對重要客戶的數(shù)據(jù)挖掘結(jié)果顯示“if automatic-document-feeder=yes 177 then manifdder=yes 123conf:(0.69)”,即如果客戶購買復印機,那么同時購買送紙器,其置信度為0.69??梢钥闯?,凡是購買復印機類商品的客戶,很大一部分都會購買型號為MB-501的旁路送紙器。在企業(yè)銷售的數(shù)據(jù)中也驗證了這樣的購買特征。由此可見,購買復印機類商品的代理商,都對型號為MB-501的旁路送紙器有相當?shù)男枨罅俊?/p>
2.根據(jù)客戶需求周期,做好重要客戶的關(guān)系維護
所有的客戶都會存在客戶生命周期(客戶生命周期是指一個客戶和一個企業(yè)之間不同的管理階段,客戶的生命周期包括未來潛在的客戶、有意向者、真正的客戶和歷史客戶四個階段)。對于公司經(jīng)營者而言,客戶處在生命周期的第三階段的時間越長,就意味著公司所賺取的利潤會越高。重要客戶則是處于客戶生命周期的第三階段,良好的客戶關(guān)系維護是延長客戶生命周期的重要手段。
挖掘結(jié)果表明,在公司的各類客戶中,代理型客戶都屬于公司的重要客戶。其購買特征是定期大批量進貨,有的是每一個月進一次貨,有的是每兩個月一次。在這些客戶的往來訂單上會發(fā)現(xiàn)有很多的贈送品,其中辦公耗材用品居多??蛻糁詴x擇這些商品,是由于現(xiàn)在大部分公司都需要使用打印機、復印機等辦公自動化設(shè)備,辦公耗材用品(復印紙、墨粉、打印墨水等)的使用量自然就非常大了。
3.關(guān)注潛在客戶的需求
數(shù)據(jù)挖掘結(jié)果關(guān)注的是公司重要客戶購買規(guī)律,公司針對這些客戶進行客戶關(guān)系的維護固然十分重要,然而挖掘潛在的客戶的需求同樣很重要。公司所有的客戶中,除了代理型客戶以外還有自用型客戶,而自用型客戶又可以分為新客戶和老客戶,老客戶是屬于重要客戶的一部分,他們會以一定的周期購進一系列的商品,大部分以耗材用品為主,因為這些客戶本身已經(jīng)有一定量的復印機或打印機之類的辦公自動化設(shè)備,在使用這些設(shè)備的過程中會有很多的消耗,如打印紙、墨盒、鈷粉等。這些用品的消耗速度是一定的,因此到了一定的時間,他們就會發(fā)生購買行為。這樣的客戶一般情況下交易量會很大,而且是長久的定期客戶。至于新客戶,則是那些新公司或新部門成立,需要為辦公室準備一些必須的自動化設(shè)備,往往會先以購進大型的復印機或打印機為主,在使用一段時間之后,再根據(jù)實際情況購進耗材,完善辦公室設(shè)備的需求。這種購買的行為一般會持續(xù)2-3個月左右,他們會在這段時期內(nèi)不斷地發(fā)現(xiàn)自己的新需求,購買行為直到需求基本上被滿足為止。由于這些客戶使用大量的辦公設(shè)備,需要的耗材數(shù)量也很巨大,這些新客戶就是公司潛在的大客戶。公司可以利用一系列的方式維護與這些潛在客戶之間的關(guān)系,這也為公司降低了尋找新客戶的成本,而這些客戶成為重要客戶的機率也會比其他客戶高。
五、結(jié)束語
數(shù)據(jù)挖掘技術(shù)在以客戶為中心的電子商務(wù)時代扮演越來越重要的角色,可以通過對企業(yè)銷售數(shù)據(jù)的關(guān)聯(lián)分析把企業(yè)的大量客戶分成不同的類型,并發(fā)現(xiàn)不同類客戶的需求特征,從而提供不同的產(chǎn)品和服務(wù),維護好老客戶,挖掘新客戶,不斷提高客戶滿意度。
參考文獻:
[1]冀玉苓胡華趙遠華:E商業(yè)時代基于數(shù)據(jù)挖掘的客戶關(guān)系管理.文章編號:1009-8119(2006)04-0045-03
[2]陳京民等編著:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù).北京:電子工業(yè)出版社,2006年1月第三次印刷版,P259,P79
[3]邁克爾.J.A.貝里(Michael J.A.Berry),戈登.S.利諾夫(Gordon S.Linoff):數(shù)據(jù)挖掘--客戶關(guān)系管理的科學與技術(shù).袁衛(wèi)等譯,北京:中國財政經(jīng)濟出版社,2004年1月第1版,P7,P51
[4]李冠乾許亮:CRM數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的應用.昆明理工大學學報(理工版)Vol.29No.1