摘 要 客戶關(guān)系管理是適應(yīng)企業(yè)“以產(chǎn)品為中心”到“以客戶為中心”的經(jīng)營模式的戰(zhàn)略轉(zhuǎn)移和關(guān)系營銷的需要而發(fā)展起來的新的管理理念。數(shù)據(jù)挖掘技術(shù)能很好的進(jìn)行數(shù)據(jù)的分析、處理,有助于客戶關(guān)系的管理。探討了數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的相關(guān)應(yīng)用。
關(guān)鍵詞 數(shù)據(jù)挖掘 客戶關(guān)系管理 關(guān)聯(lián)算法 粗糙集方法 聚類
中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A
對(duì)于企業(yè)而言,“以客戶為中心”的最終目的是企業(yè)自身利潤(rùn)的最大化。因此,企業(yè)還需進(jìn)一步對(duì)真正的客戶的價(jià)值進(jìn)行挖掘。客戶的價(jià)值挖掘工作要求企業(yè)通過數(shù)據(jù)分析,掌握客戶的行為規(guī)律,運(yùn)用于企業(yè)決策中。隨著數(shù)據(jù)倉庫、數(shù)據(jù)挖掘技術(shù)的發(fā)展和成熟,客戶的價(jià)值挖掘工作得到了必要的技術(shù)支持。
1數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘常用的分析方法包括分類和預(yù)測(cè)、聚類分析、關(guān)聯(lián)規(guī)則、序列模式、孤立點(diǎn)分析等。本文分別從關(guān)聯(lián)算法、粗糙集方法和聚類等角度闡述數(shù)據(jù)挖掘技術(shù)在客戶價(jià)值管理中的應(yīng)用。
2數(shù)據(jù)挖掘技術(shù)在客戶價(jià)值管理中的應(yīng)用
2.1發(fā)現(xiàn)新客戶
2.1.1 數(shù)據(jù)挖掘應(yīng)用需求
“以客戶為中心”的CVM,客戶是企業(yè)的生命,不斷獲取新客戶是企業(yè)生存和發(fā)展的必要條件。發(fā)展新客戶的目的是將潛在的客戶轉(zhuǎn)變成消費(fèi)企業(yè)的產(chǎn)品或服務(wù)的現(xiàn)實(shí)客戶。針對(duì)不同的消費(fèi)者需要采用不同的策略才能有效的獲取到需要的新客戶。另外,客戶也分優(yōu)劣,選擇優(yōu)質(zhì)客戶進(jìn)行獲取是企業(yè)獲取新客戶的先決條件。采用數(shù)據(jù)挖掘可以輔助新客戶開發(fā)活動(dòng)。
2.1.2 Apriori算法
APr1ori算法是最著名的關(guān)聯(lián)算法。此算法利用一種逐層搜索的迭代方法:k項(xiàng)集用于探索(k+1)項(xiàng)集。具體方法是:首先找出頻繁1-項(xiàng)集,記為L(zhǎng)1;然后利用L1來挖掘L2,即頻繁2-項(xiàng)集;不斷循環(huán)下去直到無法發(fā)現(xiàn)更多的頻繁K-項(xiàng)集為止。
Apriori算法利用了兩個(gè)重要性質(zhì)。
性質(zhì)1:k維數(shù)據(jù)項(xiàng)目集x是頻繁項(xiàng)集的必要條件是它的所有k-1維子集均是頻繁項(xiàng)集。
性質(zhì)2:若k維數(shù)據(jù)項(xiàng)目集x的任一k-1維子集不是頻繁項(xiàng)集,則x不是頻繁項(xiàng)集。
對(duì)于新客戶的發(fā)展而言,得到了新客戶的市場(chǎng)反饋并收集之后,就可以使用Apriori算法對(duì)客戶數(shù)據(jù)提取特征。
2.2 客戶保留
2.2.1 數(shù)據(jù)挖掘應(yīng)用需求
隨著市場(chǎng)競(jìng)爭(zhēng)的日益激烈,大部分市場(chǎng)己趨于飽和狀態(tài)。獲得一個(gè)新客戶的成本越來越高,因此,保留原有客戶的價(jià)值也顯得越來越重要了。對(duì)于客戶保留,企業(yè)可通過數(shù)據(jù)挖掘?qū)蛻魯?shù)據(jù)庫中大量的客戶信息作針對(duì)性研究,根據(jù)分析結(jié)果制定使?jié)撛陔x開者留下來計(jì)劃和方案,改善客戶關(guān)系,爭(zhēng)取保持客戶并提高收益。
2.2.2 粗糙集算法
粗糙集是由波蘭學(xué)者Z.Pawlak在1982年提出的一種研究不精確、不確定性問題的數(shù)學(xué)工具,其基本思想是,將數(shù)據(jù)庫中的屬性劃分為條件屬性和結(jié)論屬性,把數(shù)據(jù)庫中的元組根據(jù)各個(gè)屬性不同的屬性值分成相應(yīng)的子集,然后根據(jù)條件屬性劃分的子集和結(jié)論屬性劃分的子集之間的上下近似關(guān)系生成判定規(guī)則。其中下近似是指所有對(duì)象都一定被包含,上近似是指所有對(duì)象可能被包含。
設(shè){X1,X2,X3,…}是基于條件屬性的劃分,{Y1,Y2,Y3,…}是基于結(jié)論屬性的劃分,則有:
定義1:Yj最小包含(下近似)X,是指等價(jià)類X,中的所有元素都包含在Yj中;
定義2:Yj最大包含(上近似)X,是指等價(jià)類X,中的所有元素可能包含在Yj中。
2.3 客戶分類
聚類已經(jīng)被廣泛地應(yīng)用于許多領(lǐng)域,聚類分析根據(jù)在數(shù)據(jù)中發(fā)現(xiàn)的描述對(duì)象及其關(guān)系的信息,將數(shù)據(jù)劃分成有意義或有用的簇(也可以稱為組)。其目標(biāo)是,簇內(nèi)的對(duì)象之間是相似的(相關(guān)的),而不同簇中的對(duì)象是不同的(不相關(guān)的)。簇內(nèi)的相似性(同質(zhì)性)越大,聚類就越好。
K-均值算法是一種迭代算法,也是一種最古老的、最廣泛使用的聚類算法。
利用K-均值聚類算法所得到的組,組內(nèi)成員間的相似程度很高,同時(shí)不同組中成員的相異度也很高。給定組K={t1,t2,…,tm},則其均值定義為:
M=(t1+t2+…+tm)/m。
其基本算法如下:
(1)選擇K個(gè)點(diǎn)作為初始均值,K是用戶指定的參數(shù),即所期望簇的個(gè)數(shù);
(2)repeat;
(3)將每個(gè)點(diǎn)指派到最近的均值,形成K個(gè)組;
(4)重新計(jì)算每個(gè)組的均值;
(5)until均值不發(fā)生變化。
3結(jié)語
客戶關(guān)系管理是企業(yè)保持市場(chǎng)競(jìng)爭(zhēng)力的重要手段和不可缺少的重要環(huán)節(jié)。數(shù)據(jù)挖掘作為一種先進(jìn)的數(shù)據(jù)分析的方法,是實(shí)現(xiàn)對(duì)客戶數(shù)據(jù)進(jìn)行深入分析的有效工具。對(duì)于管理人員來說,掌握這方面的知識(shí)是必要的,可以為公司管理客戶提供有價(jià)值的信息。
參考文獻(xiàn)
[1] 李蕾.數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的運(yùn)用[J].企業(yè)活力,2006.03.
[2] 顧桂芳,何有世.數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用研究[J].江蘇商論,2007.07.
[3] 黃潔.基于數(shù)據(jù)挖掘技術(shù)的客戶關(guān)系管理:以電信企業(yè)為例[A].中國企業(yè)運(yùn)籌學(xué)學(xué)術(shù)交流大會(huì)論文集[C],2007.
[4] 莊小將.數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用[J].廣東財(cái)經(jīng)職業(yè)學(xué)院學(xué)報(bào),2008.02.