[摘要] 在企業(yè)經(jīng)營(yíng)中可以取得客戶信息的若干數(shù)據(jù),對(duì)于如此眾多紛繁復(fù)雜、凌亂的數(shù)據(jù),如何來(lái)發(fā)現(xiàn)對(duì)企業(yè)經(jīng)營(yíng)決策有用的信息,是一個(gè)很重要而且復(fù)雜的過(guò)程。這里我們需要首先談到數(shù)據(jù)挖掘的發(fā)展和在價(jià)值管理中的應(yīng)用。
[關(guān)鍵詞] 數(shù)據(jù)挖掘 粗糙集 客戶價(jià)值
一、粗糙集概述
基于粗糙集理論的數(shù)據(jù)挖掘系統(tǒng)一般由數(shù)據(jù)準(zhǔn)備(包括數(shù)據(jù)清洗、數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理、數(shù)據(jù)表示)、對(duì)象分類、對(duì)象重要性分析、屬性之間的依賴關(guān)系分析、基于粗糙集或其拓廣理論的數(shù)據(jù)約簡(jiǎn)和求核、決策算法、規(guī)則生成、規(guī)則合并、知識(shí)表示、評(píng)價(jià)等部分組成。
粗糙集理論作為數(shù)據(jù)挖掘的一種方法,近年來(lái)得到了廣泛關(guān)注和青睞。這不僅是因?yàn)樗哂辛己玫臄?shù)學(xué)基礎(chǔ)和性質(zhì),而且還因?yàn)樗『梅从沉巳藗冇么植诩椒ㄌ幚聿环置鲉?wèn)題的常規(guī)性,即以不完全信息或知識(shí)去處理一些不分明現(xiàn)象的能力,或依據(jù)觀察、度量到的某些不精確的結(jié)果而進(jìn)行分類數(shù)據(jù)的能力。
二、客戶價(jià)值
一般而言,客戶價(jià)值包含兩個(gè)方面的價(jià)值:一是客戶對(duì)于供應(yīng)商的價(jià)值;二是供應(yīng)商為客戶所提供的價(jià)值。前者是指從供應(yīng)商角度出發(fā),根據(jù)客戶消費(fèi)行為和消費(fèi)特征等變量所測(cè)度出的客戶能夠?yàn)槠髽I(yè)創(chuàng)造出的價(jià)值,它是企業(yè)進(jìn)行客戶細(xì)分的重要標(biāo)準(zhǔn)。后者是從客戶角度出發(fā),對(duì)于供應(yīng)商提供的產(chǎn)品和服務(wù),客戶基于自身的價(jià)值評(píng)價(jià)標(biāo)準(zhǔn)而識(shí)別出的價(jià)值,這一價(jià)值在營(yíng)銷學(xué)中通常稱為客戶讓渡價(jià)值。
兩種價(jià)值的概念是基于不同的出發(fā)點(diǎn),所以,從企業(yè)角度來(lái)看,產(chǎn)品和服務(wù)具有較高的客戶讓渡價(jià)值才有可能銷售出去,而營(yíng)銷活動(dòng)的目的就是要增加這一價(jià)值,并將高的讓渡價(jià)值信息傳遞給客戶。而前一種客戶價(jià)值用于區(qū)分不同價(jià)值客戶,識(shí)別那些價(jià)值高的客戶,有針對(duì)性的提供讓渡價(jià)值,是客戶關(guān)系管理的基礎(chǔ)。
三、基于粗糙集的決策樹(shù)技術(shù)的客戶價(jià)值評(píng)價(jià)
1.客戶價(jià)值評(píng)價(jià)的指標(biāo)體系
在整個(gè)客戶生命周期上管理客戶價(jià)值是CRM的基本思想,因此,企業(yè)在評(píng)價(jià)客戶有價(jià)值與否時(shí),不僅要參照該客戶當(dāng)前的價(jià)值表現(xiàn),更重要的是依據(jù)其對(duì)該客戶潛在價(jià)值的預(yù)測(cè)判斷??蛻舢?dāng)前價(jià)值決定了企業(yè)當(dāng)前的贏利水平,是企業(yè)感知客戶價(jià)值的一個(gè)重要方面??蛻魸撛趦r(jià)值關(guān)系到企業(yè)長(zhǎng)遠(yuǎn)利潤(rùn),直接影響到企業(yè)是否繼續(xù)投資于該客戶關(guān)系的一個(gè)重要因素??蛻魞r(jià)值評(píng)價(jià)指標(biāo)體系如圖所示。
圖 客戶價(jià)值評(píng)價(jià)指標(biāo)體系結(jié)構(gòu)圖
2.基于粗集的決策樹(shù)技術(shù)的客戶價(jià)值評(píng)價(jià)規(guī)則的獲取
決策樹(shù)分析是一種機(jī)器學(xué)習(xí)算法,主要是從大量的歷史數(shù)據(jù),最好是具有專家認(rèn)證的數(shù)據(jù)中,歸納總結(jié)隱藏在其中的知識(shí)模型,并可通過(guò)這個(gè)知識(shí)模型對(duì)新的數(shù)據(jù)進(jìn)行預(yù)測(cè)。決策樹(shù)算法的最大特點(diǎn)是支持非數(shù)值型數(shù)據(jù)。該方法利用信息論中的信息增益尋找示例數(shù)據(jù)庫(kù)中具有最大信息量的屬性字段,建立決策樹(shù)的一個(gè)節(jié)點(diǎn),再根據(jù)該屬性字段的不同取值建立樹(shù)的分支在每個(gè)分支集中重復(fù)建立樹(shù)的下一個(gè)節(jié)點(diǎn)和分支的過(guò)程。樹(shù)的質(zhì)量取決于分類精度和樹(shù)的大小。一般來(lái)說(shuō),決策樹(shù)的構(gòu)造主要由兩個(gè)階段組成。第一階段,建樹(shù)階段。選取部分受訓(xùn)數(shù)據(jù)建立決策樹(shù),決策樹(shù)是按廣度優(yōu)先建立直到每個(gè)葉節(jié)點(diǎn)包括相同的類標(biāo)記為止。第二階段,調(diào)整階段。用剩余數(shù)據(jù)檢驗(yàn)決策樹(shù),如果所建立的決策樹(shù)不能正確回答所研究的問(wèn)題,我們要對(duì)決策樹(shù)進(jìn)行調(diào)整1剪枝和增加節(jié)點(diǎn)直到建立一棵正確的決策樹(shù),這樣在決策樹(shù)每個(gè)內(nèi)部節(jié)點(diǎn)處進(jìn)行屬性值的比較,在葉節(jié)點(diǎn)得到結(jié)論。從根節(jié)點(diǎn)到葉節(jié)點(diǎn)的一條路徑就對(duì)應(yīng)著一條規(guī)則,整棵決策樹(shù)就對(duì)應(yīng)著一組析取表達(dá)式規(guī)則。一般而言,對(duì)于給定的樣本,從隨機(jī)取樣的樣本中抽取中的客戶進(jìn)行決策樹(shù)模型分析,將剩余的客戶用來(lái)檢驗(yàn)?zāi)P偷臏?zhǔn)確度,并列出計(jì)算結(jié)果和規(guī)則。判斷其精度的指標(biāo)是回歸評(píng)估系數(shù)。一般講,回歸評(píng)估系數(shù)大于時(shí)可認(rèn)為回歸擬合比較準(zhǔn)確。
四、結(jié)束語(yǔ)
當(dāng)今的世界人們面臨著越來(lái)越海量的數(shù)據(jù)信息,同時(shí)在更多的機(jī)遇面前,企業(yè)的競(jìng)爭(zhēng)就需要以更低的成本、更加迅疾的速度做出這樣或那樣的大量及時(shí)而準(zhǔn)確的決策。面臨這樣的世界態(tài)勢(shì),一個(gè)組織或企業(yè)要想有活力,并取得豐厚的效益,就要有組織地授權(quán)更多的人適時(shí)供應(yīng)他們準(zhǔn)確無(wú)誤的數(shù)據(jù)信息,并讓他們利用更加得心應(yīng)手,順應(yīng)決策者邏輯思維和他的主導(dǎo)作用的工具做出正確的決策。
隨著數(shù)據(jù)倉(cāng)庫(kù)的出現(xiàn),其面向主題、集成、不可更新、隨時(shí)間變化等等特性可以更好地支持決策分析的數(shù)據(jù)集合。傳統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)用以支持事務(wù)處理,屬操作型數(shù)據(jù)而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是用以支持分析處理的分析型數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)正是為了進(jìn)行快速而有效地決策分析產(chǎn)生的。隨著數(shù)據(jù)倉(cāng)庫(kù)的出現(xiàn),原有的數(shù)據(jù)庫(kù)工具已無(wú)法滿足需求,數(shù)據(jù)挖掘正好可以幫助決策者在數(shù)據(jù)倉(cāng)庫(kù)中尋找數(shù)據(jù)間的潛在關(guān)聯(lián),發(fā)現(xiàn)被忽略的要素,提取隱藏其中的信息,為問(wèn)題的解決提供更多的知識(shí),輔助決策者進(jìn)行趨勢(shì)預(yù)測(cè)及行為決策。
我們通過(guò)綜合運(yùn)用數(shù)據(jù)挖掘的模型和技術(shù)來(lái)對(duì)客戶價(jià)值進(jìn)行分析,得出的結(jié)果應(yīng)該能夠支持管理層做出決策,能夠有利于企業(yè)的經(jīng)營(yíng)目標(biāo)的實(shí)現(xiàn)。但是,建立客戶價(jià)值管理的決策支持系統(tǒng)的前提是具有以客戶為主題的數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)能夠支持大量的數(shù)據(jù)存儲(chǔ),快速并行的處理保存歷史序列數(shù)據(jù),能夠進(jìn)行趨勢(shì)分析支持?jǐn)?shù)據(jù)的集成和綜合。所以,以客戶為主題的數(shù)據(jù)倉(cāng)庫(kù)才是理想的客戶價(jià)值管理的決策支持系統(tǒng)數(shù)據(jù)庫(kù),這也是我們建立決策支持系統(tǒng)的基礎(chǔ)。
參考文獻(xiàn):
[1]康小東:基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘技術(shù).北京:機(jī)械工業(yè)出版社:2004
[2]李雄飛李軍:數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn).北京:高等教育出版社:2003
[3]王實(shí)高文:數(shù)據(jù)挖掘中的聚類方法[J].計(jì)算機(jī)科學(xué),2000,(4)
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。