[摘要] 本文闡述了在CRM中應(yīng)用數(shù)據(jù)挖掘的必要性,給出了CRM的體系結(jié)構(gòu),介紹了應(yīng)用SQLServer2005數(shù)據(jù)挖掘工具的流程,最后總結(jié)了目前存在的主要問題。
[關(guān)鍵詞] CRM 數(shù)據(jù)挖掘 SQLServer2005
一、前言
中小企業(yè)要想在激烈的市場競爭中謀生存求發(fā)展,就要努力提升自己的核心競爭力,從以往的“以產(chǎn)品為中心”的管理模式轉(zhuǎn)變?yōu)椤耙钥蛻魹橹行摹钡墓芾砟J?,這就需要構(gòu)建客戶關(guān)系管理系統(tǒng)(CRM)。數(shù)據(jù)庫技術(shù)的成熟應(yīng)用已使企業(yè)積累了大量的數(shù)據(jù),管理層渴望從數(shù)據(jù)海洋里獲得關(guān)于客戶的準(zhǔn)確的有價(jià)值的“知識”,利用這些“知識”實(shí)現(xiàn)客戶細(xì)分,保持老客戶,獲得新客戶。但是傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)是面向應(yīng)用的,只處理日常的經(jīng)營業(yè)務(wù),不具備智能數(shù)據(jù)處理的功能,如何獲得這些“知識”就促成了數(shù)據(jù)挖掘技術(shù)的產(chǎn)生。反過來,數(shù)據(jù)挖掘技術(shù)的發(fā)展使構(gòu)建智能化CRM系統(tǒng)成為可能。概括地講,數(shù)據(jù)挖掘的任務(wù)是從數(shù)據(jù)倉庫中提取人們感興趣的,事先未知的,有用的或潛在有用的信息。
目前,國際上主流的數(shù)據(jù)挖掘工具有:SAS的Enterprise Miner;SPSS的Clementine;IBM的Intelligent Miner;Oracle的Darwin;Cognos的4Thought以及微軟的SQLServer2005挖掘平臺。選擇什么樣的數(shù)據(jù)挖掘工具,應(yīng)該視企業(yè)的實(shí)際情況來定,功能最強(qiáng)的不一定是最合適的??紤]到中小企業(yè)CRM系統(tǒng)的以下特點(diǎn):軟件開發(fā)和維護(hù)成本相對低;功能不是很復(fù)雜;數(shù)據(jù)量不是很大;容易與其他系統(tǒng)集成等,SQLServer2005挖掘平臺是最佳的選擇。
二、CRM的體系結(jié)構(gòu)
基礎(chǔ)層為CRM系統(tǒng)提供Internet,Intranet,以及數(shù)據(jù)庫,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘,聯(lián)機(jī)分析處理(OLAP)和Web服務(wù)等軟硬件技術(shù)支持。
操作層主要是提供以客戶為中心的市場、銷售、服務(wù)與支持等業(yè)務(wù)流程的自動化及擴(kuò)展。包括銷售力量自動化(Sales force Automation,SFA)、企業(yè)營銷自動化(Enterprise Marketing Automation,EMA)、客戶服務(wù)與支持(Customer ServiceSupport)三個(gè)基本模塊。
分析層主要是利用數(shù)據(jù)挖掘技術(shù),從共享的客戶數(shù)據(jù)倉庫中,提取有價(jià)值的信息,準(zhǔn)確地了解客戶行為、期望、需要、歷史和與企業(yè)全面關(guān)系,為企業(yè)的戰(zhàn)略決策服務(wù)。
協(xié)同層基于協(xié)同產(chǎn)品商務(wù),協(xié)同性不僅體現(xiàn)在對客戶信息的獲得和跟蹤方面,還強(qiáng)調(diào)在與客戶進(jìn)行的一系列業(yè)務(wù)中,內(nèi)部人員之間及內(nèi)部與外部之間的高效互通及協(xié)作。
三、SQLServer2005數(shù)據(jù)挖掘的流程
1.定義企業(yè)問題
確定目前企業(yè)遇到的問題。例如分析客戶的流失情況,就要考慮這些問題:現(xiàn)有的客戶哪些客戶即將流失?現(xiàn)有客戶他們的流失概率如何?哪些因素造成了客戶的流失?不同類別之間客戶的流失情況有什么差別?如果某個(gè)客戶將要流失,他會在多長時(shí)間內(nèi)流失?
2.數(shù)據(jù)準(zhǔn)備
在企業(yè)信息化建設(shè)中,“三分技術(shù),七分管理,十二分基礎(chǔ)數(shù)據(jù)”,所以數(shù)據(jù)準(zhǔn)備是最關(guān)鍵的一個(gè)環(huán)節(jié)。CRM在整個(gè)生命周期中,都以客戶為中心,準(zhǔn)確全面的客戶信息是構(gòu)建CRM系統(tǒng)的基石。為了進(jìn)行有效的客戶分析,這些信息必須在整個(gè)企業(yè)范圍都是一致的,可靠的,并且具有統(tǒng)一的,便于使用的編碼。然而,來源于歷史上各個(gè)數(shù)據(jù)庫的數(shù)據(jù)往往是異構(gòu)的,不一致的,分散的,同時(shí)企業(yè)在收集客戶信息的過程中,存在局部,片面,重復(fù)的現(xiàn)象,因此,建立一個(gè)企業(yè)范圍內(nèi)全局一致的客戶數(shù)據(jù)倉庫就非常必要,這是CRM成功的基礎(chǔ)。
SQLServer2005提供了數(shù)據(jù)平臺整合性服務(wù),即SSIS(SQLServer2000稱之為DTS)。這是一個(gè)全新的企業(yè)級的數(shù)據(jù)抽取、轉(zhuǎn)換和加載(ETL)平臺,SSIS 使得企業(yè)能更容易地集成和分析來自多個(gè)異類數(shù)據(jù)源的數(shù)據(jù),并且實(shí)現(xiàn)了對非傳統(tǒng)數(shù)據(jù)(Web Services,XML)的支持。
3.建立模型及評估
SQLServer2005提供了9種數(shù)據(jù)挖掘算法。用于預(yù)測的算法包括線性回歸,羅吉斯回歸,時(shí)間序列,人工神經(jīng)網(wǎng)絡(luò),用于分類的算法包括決策樹,貝葉斯概率分類,此外,還有關(guān)聯(lián)規(guī)則,聚集,文本挖掘。同一個(gè)商業(yè)問題,可以用幾種算法解決,通過調(diào)整參數(shù)再從中選擇一個(gè)最優(yōu)方案。模型建立后,必須對模型檢測和評估。在數(shù)據(jù)挖掘過程中,通常將數(shù)據(jù)集分為三部分:
(1)訓(xùn)練集:主要用來建立最初的挖掘模型。
(2)評估集: 對同一數(shù)據(jù)集可以建立不同挖掘模型,當(dāng)各個(gè)模型建立后,則需要針對不同模型效果進(jìn)行比較,評估集則是用來評估不同模型的執(zhí)行效果。
(3)測試集:此數(shù)據(jù)集主要用于測試模型,并對模型進(jìn)行修正。在數(shù)據(jù)挖掘建模過程中,建立、測試和評估模型是一種反復(fù)循環(huán)的程序,模型的效果會隨著不同數(shù)據(jù)集而有異,因此模型建立完成后應(yīng)加以測試。同一數(shù)據(jù)集可以采用不同挖掘算法建立不同的挖掘模型,對于不同模型的效果,也必須加以比較評估,選擇最適合的挖掘模型。SQLServer2005提供的評估方法有:Mining Accuracy Chart,Lift Chart-累積增益圖,Classification Matrix-錯差矩陣。
4.模型的發(fā)布與整合
將挖掘的分析結(jié)果發(fā)布到商業(yè)模型中,達(dá)到自動化預(yù)測的效果,以提升營運(yùn)利潤、改善商業(yè)流程。CRM與企業(yè)資源計(jì)劃(ERP),電子商務(wù)(EC),供應(yīng)鏈管理(SCM)和其他遺產(chǎn)系統(tǒng)的集成將有利于把挖掘的分析結(jié)果進(jìn)一步轉(zhuǎn)換成企業(yè)經(jīng)營管理實(shí)實(shí)在在可利用的信息。SQLServer2005提供了DMX、AMO 、XMLA等技術(shù)以及分析服務(wù)(Analysis Services)和報(bào)表服務(wù)(Reporting Services)。
四、結(jié)束語
構(gòu)建基于SQLServer2005挖掘平臺的CRM系統(tǒng),重在應(yīng)用,難在應(yīng)用。一個(gè)企業(yè)要想使技術(shù)投資獲得較高的收益,必須重視決策的效率和準(zhǔn)確性問題。這是目前數(shù)據(jù)挖掘技術(shù)應(yīng)用的薄弱環(huán)節(jié)。具體表現(xiàn)在:數(shù)據(jù)分析過程缺少方法論指導(dǎo);數(shù)據(jù)挖掘過程與特定商業(yè)邏輯脫節(jié);自動化和智能化程度低。因此,在應(yīng)用數(shù)據(jù)挖掘技術(shù)的道路上,還有很多困難,難題等待我們?nèi)タ朔?/p>
參考文獻(xiàn):
[1]Jiawei Han:數(shù)據(jù)挖掘概念與技術(shù).機(jī)械工業(yè)出版社,2002.9出版
[2]Alex Berson:構(gòu)建面向CRM的數(shù)據(jù)挖掘應(yīng)用.人民郵電出版社,2001.8 出版
[3]張阿蘭:數(shù)據(jù)挖掘任務(wù)之二:預(yù)測[J].中國統(tǒng)計(jì).2004.1
[4]米天勝:數(shù)據(jù)倉庫和數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用[J].情報(bào)技術(shù),2006.9
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文