于春香
(福建信息職業(yè)技術(shù)學(xué)院,福建 福州 350019)
在當(dāng)前經(jīng)濟(jì)危機(jī)席卷全球的大背景下,會展行業(yè)不可避免的受到?jīng)_擊,會展市場比以往更具有競爭性。由于企業(yè)參與展覽的預(yù)算越來越少,并且在選擇展覽會品牌時(shí)越來越注重性價(jià)比和參展的回報(bào)率,參展決策越來越慎重。如何能在低成本的基礎(chǔ)上保留住老客戶,并獲取更多的新客戶,這對會展企業(yè)來說是個考驗(yàn)。
利用客戶關(guān)系管理系統(tǒng),使用數(shù)據(jù)挖掘技術(shù),通過對客戶的數(shù)據(jù)深入分析,了解不同客戶的需求,是當(dāng)前解決這一問題的最好辦法。
客戶細(xì)分評價(jià)是“指企業(yè)在明確的、業(yè)務(wù)模式和特定的市場中,根據(jù)客戶的屬性、消費(fèi)行為、偏好等因素對客戶進(jìn)行分類,并提供有針對性的產(chǎn)品、服務(wù)和營銷模式的過程”。對會展企業(yè)來說參展客戶是其最重要的資源,但不同類型的客戶對企業(yè)的價(jià)值也是不同的。利用客戶細(xì)分評價(jià)系統(tǒng),可將客戶進(jìn)行分類。會展公司可以按參展客戶對公司的價(jià)值,將客戶分為金客戶、銀客戶、普通客戶、潛力客戶和低價(jià)值客戶。
首先從會展公司所存儲的客戶信息數(shù)據(jù)庫中選擇客戶細(xì)分評價(jià)模型有用的屬性。
第一步:目標(biāo)屬性的選擇。
對于會展公司來說,客戶參展的次數(shù)越多,并且在單位時(shí)間內(nèi)客戶參展頻率越高,其帶給會展公司帶來的利潤也越高,即該客戶的價(jià)值就越高。因?yàn)閷傩员碇袥]有直接可以表示客戶參展的頻率,可以用客戶參展次數(shù)除以當(dāng)前時(shí)間與客戶第一次參展時(shí)間的差值,這一新的值作為目標(biāo)屬性。當(dāng)參展頻率≧2時(shí),如參展次數(shù)﹥6,則該客戶是金客戶;如參展次數(shù)﹥3,則該客戶是銀客戶;參展次數(shù)小于3該客戶是潛力客戶。當(dāng)1≦參展頻率﹤2時(shí),如參展次數(shù)≧6,則該客戶是銀客戶;當(dāng)參展次數(shù)﹤6,則該客戶是普通客戶;如果參展頻率﹤1,則該客戶為低價(jià)值客戶。
第二步:決策屬性的選擇。
決策屬性就是用來解釋會展客戶價(jià)值大小的屬性,良好決策屬性的選擇就決定了模型的有效性。在建模過程中,對建模輸入沒有什么用處的屬性,如某些標(biāo)志性屬性(公司名稱,聯(lián)系人姓名、電話、性別等)或?qū)傩灾刀枷嗤蚋叨炔粚ΨQ的屬性及屬性值過多的定類屬性,在建模時(shí)可以將其剔除。在這里我們選擇客戶的參展次數(shù)、簽約次數(shù)、主營產(chǎn)品、所在城市、滿意度等作為決策屬性。
我們采用從業(yè)務(wù)數(shù)據(jù)源中隨機(jī)地抽取出300條的客戶參展的基礎(chǔ)資料,作為客戶價(jià)值評價(jià)的樣本數(shù)據(jù)如表1。
在選取樣本時(shí),有的數(shù)據(jù)需要采用字段運(yùn)算、直接映射和參照轉(zhuǎn)換等方法進(jìn)行轉(zhuǎn)換。
表1 客戶等級評價(jià)決策樹原始樣本
為了使原始數(shù)據(jù)能適應(yīng)數(shù)據(jù)挖掘決策樹算法,并能提高其挖掘的效率,要采用離散的技術(shù)對一些原始的屬性值劃分為區(qū)間,以減少屬性值的個數(shù)。部份的屬性值是文字的改為用數(shù)字如主營產(chǎn)品。詳細(xì)劃分如下表2。
表2 離散化處理規(guī)則
通過處理,最后得到的數(shù)據(jù)樣本如下表3:
表3 客戶等級評價(jià)決策樹修證樣本
根據(jù)以上的數(shù)據(jù)樣本,下面使用ID3算法,建立會展客戶細(xì)分決策樹模型。
首先根據(jù)給定的樣本分類所需的期望值,目標(biāo)屬性(參展頻率)具有三個不同的取值{1,2,3},其它屬性作為決策樹的候選屬性。
即:I(S1,S2,S3)=I(84,60,156)=-(p1log2(p1)+p2log2(p2)+p3log2(p3))=1.4695
下一步:計(jì)算出以每個屬性劃分?jǐn)?shù)據(jù)樣本,所需要的期望信息:
從計(jì)算結(jié)果可以看出具有最高信息增益的是參展次數(shù),所以選它為決策屬性。如下圖1
圖1 客戶等級評價(jià)決策樹
建立決策樹是一個遞歸的過程中,所有的樣本使用參展次數(shù)等級分類后,形成了三個樣本集合,使用同樣的方法分別分析這三個樣本。對于參展次數(shù)≦3的第1集合,計(jì)算其期望信息:
計(jì)算按每個屬性劃分?jǐn)?shù)據(jù),所需要的期望信息。
由于簽約次數(shù)/參展次數(shù)具有最高信息增益,因此將它造作為決策屬性。并且發(fā)現(xiàn)參展次數(shù)為1,簽約頻率為2和4的兩個樣本集合的值都為2,所以建立一個葉子結(jié)點(diǎn),如下圖2。
圖2 客戶等級評價(jià)決策樹
如此反復(fù)直到?jīng)Q策樹不能再生長,就可得到完整的決策樹。然后再通過刪除結(jié)點(diǎn)上分枝,將樹結(jié)點(diǎn)剪掉,以簡化復(fù)雜的決策樹。如下圖3:
圖3 客戶等級評價(jià)決策樹
該決策樹模型,我們采用300個客戶樣本,對建立的決策樹模型的準(zhǔn)確性進(jìn)行評估。經(jīng)過分析可得到以下的決策樹混淆矩陣如表4:
表4 客戶等級評價(jià)決策樹混淆矩陣
矩陣對角線上的數(shù)值是預(yù)測準(zhǔn)確的樣本個數(shù),其余的數(shù)值是犯各類錯誤的個數(shù),利用預(yù)測準(zhǔn)確的樣本個數(shù)與測試樣本個數(shù)的比值,即為該模型的準(zhǔn)確率。得(72+52+133)/300=85.7%,即該模型的準(zhǔn)確率為 85.7%,還應(yīng)該繼續(xù)調(diào)整模型以提高準(zhǔn)確率。
實(shí)驗(yàn)結(jié)果表明,使用該算法對會展客戶的細(xì)分分析和預(yù)測是有效的。利用分析結(jié)果,可使會展管理人員更加充分的了解參展客戶,并為不同客戶量身定做出個性化服務(wù),提高會展公司在行業(yè)中的競爭力。
從以上的決策樹可以得到以下五個結(jié)論:
(1)對于公司的金客戶,這些客戶一般與公司業(yè)務(wù)關(guān)系比較穩(wěn)定,與業(yè)務(wù)員的關(guān)系也比較好,對公司的業(yè)務(wù)很支持,對這些客戶在參展方面不需要做太多的宣傳,對其可以在參展費(fèi)用上給予一定的優(yōu)惠。
(2)對于公司的重要客戶,公司業(yè)務(wù)人員要做好與其溝通和服務(wù)關(guān)懷,爭取將其轉(zhuǎn)變成公司的忠實(shí)金客戶。
(3)對于公司普通客戶,這些客戶是公司的主力軍,應(yīng)特別加強(qiáng)與這些企業(yè)人員的聯(lián)系,加強(qiáng)人文關(guān)懷,加強(qiáng)對其產(chǎn)品的了解,推薦合適的交易會,盡量提高其對展會滿意度,進(jìn)而將其發(fā)展為公司的銀客戶。
(4)對于公司潛力客戶,由于客戶和公司的合作時(shí)間較短,但參展效果還可以,是公司的大力發(fā)展對象??梢约訌?qiáng)對其展會的推薦,將其發(fā)展成公司的穩(wěn)定客戶。
(5)對于公司的低價(jià)值客戶,要加強(qiáng)對客戶的調(diào)查、咨詢分析、客戶投訴分析,同時(shí)加強(qiáng)對客戶展前指導(dǎo)及展后效果調(diào)查和聯(lián)系,積極爭取將其發(fā)展成公司的穩(wěn)定客戶。
本文利用數(shù)據(jù)挖掘技術(shù)對會展公司的參展客戶進(jìn)行了細(xì)分,建立了基于決策樹的客戶細(xì)分模型。從屬性選擇、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)預(yù)處理、構(gòu)建決策樹、決策樹模型結(jié)果與評估五個方面,詳細(xì)介紹了客戶細(xì)分評價(jià)模型的建立過程,并針對建模結(jié)果對公司客戶管理提出合理化建議。在今后應(yīng)用過程中,可以根據(jù)實(shí)際的需要修改算法,研究數(shù)據(jù)挖掘中其他方法,提高其對大數(shù)據(jù)量的運(yùn)算效率及準(zhǔn)確率,以求用更好的方法獲得合理的挖掘結(jié)果。
[1]劉振溪.中國會展業(yè)CRM的現(xiàn)狀分析與開發(fā)研究對策[J].經(jīng)濟(jì)師,2008,(11):34-36.
[2]邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M].北京:中國水利水電出版社,2003.91-125.
[3]楊善林,倪志偉.機(jī)器學(xué)習(xí)與智能決策支持系統(tǒng)[M].北京:科學(xué)出版社,2004.71-72.
[4]葉強(qiáng),鄒鵬,尚維.基于多分類器融合的客戶細(xì)分研究[J].管理科學(xué),2004,17(2):64-67.