林 輝(渭南師范學(xué)院信息與教育技術(shù)中心,陜西渭南,714000)
基于改進(jìn)聚類算法的客戶分類系統(tǒng)的設(shè)計(jì)與研究
林 輝
(渭南師范學(xué)院信息與教育技術(shù)中心,陜西渭南,714000)
考慮到現(xiàn)有客戶關(guān)系關(guān)系存在的一些問題,本文引入了模糊數(shù)學(xué)的相關(guān)算法,給數(shù)據(jù)對象的隸屬度加上一個(gè)權(quán)值,以及在算法中采用有效性函數(shù)來自動(dòng)確定聚類的初始數(shù)目,理論分析與實(shí)驗(yàn)結(jié)果表明,在客戶關(guān)系管理環(huán)境下所引入的改進(jìn)模糊聚類算法比傳統(tǒng)模糊聚類算法有更好的聚類效果,更快的聚類速度,為企業(yè)對不同客戶采用不同營銷策略提供了依據(jù)。
模糊;聚類;客戶分類
越來越多的企業(yè)都認(rèn)識到到客戶和市場在對企業(yè)的重要性,越來越多的企業(yè)正在提高客戶對企業(yè)的忠誠度。逐步建立以客戶和市場為方向的的經(jīng)營模式。隨著計(jì)算機(jī)計(jì)算的快速發(fā)展,很多科研機(jī)構(gòu)把CRM作為重點(diǎn)研究對象,CRM系統(tǒng)和一定服務(wù)系統(tǒng)的結(jié)合,提高客戶滿意度和忠誠度,能給企業(yè)帶來長久發(fā)展的一種理念。
客戶關(guān)系管理(Customer Relationship Management,簡稱CRM)就是為企業(yè)提供全方位的管理視角,給企業(yè)提供完善的和客戶進(jìn)行交流能力,給公司帶來最大的收益。對CRM我們可以這樣理解。一方面,從經(jīng)營管理的方面考慮,CRM是一種以客戶為中心的思想,采用信息化技術(shù),重新規(guī)劃各個(gè)和客戶交流的模塊以減少單位支出,開拓新的業(yè)務(wù)。在另一方面, CRM也為以客戶為中心的商業(yè)模型提供支持的一套軟件系統(tǒng),包含多種員工與客戶交流的方式。
我們依據(jù)“高內(nèi)聚,低耦合”的軟件設(shè)計(jì)理念,本文采用三層架構(gòu),對三層架構(gòu)各層劃分如下任務(wù):
數(shù)據(jù)訪問層-數(shù)據(jù)源打交道,也就是負(fù)責(zé)數(shù)據(jù)的增刪查改,它不了解數(shù)據(jù)的邏輯性和正確性。
業(yè)務(wù)邏輯層-負(fù)責(zé)系統(tǒng)邏輯性數(shù)據(jù)的處理和轉(zhuǎn)換。對輸入的數(shù)據(jù)的正確性進(jìn)行檢查。
表示層-負(fù)責(zé)檢查數(shù)據(jù)的正確性和邏輯性,發(fā)現(xiàn)數(shù)據(jù)的錯(cuò)誤。系統(tǒng)構(gòu)架如下:
圖1-1系統(tǒng)結(jié)構(gòu)圖
2.1 數(shù)據(jù)庫設(shè)計(jì)
把需求分析得到的具體要求抽象為信息結(jié)構(gòu)即概念模型的過程就是概念結(jié)構(gòu)的設(shè)計(jì)。概念結(jié)構(gòu)設(shè)計(jì)的方式有:自頂向下、自底向上、逐步擴(kuò)張、混合策略、混合策略,本文下面表:客戶信息表,聯(lián)系信息表,賬戶信息、業(yè)務(wù)信息、客戶投訴/服務(wù)信息、信息用戶信息
2.2 邏輯結(jié)構(gòu)設(shè)計(jì)
根據(jù)系統(tǒng)需求,本系統(tǒng)建立如下視圖讓信息統(tǒng)計(jì)模塊使用:賬號,業(yè)務(wù)編號,業(yè)務(wù)流水號,投訴編號,交易流水號。
2.3 數(shù)據(jù)倉庫創(chuàng)建
數(shù)據(jù)倉庫是不斷變化的數(shù)據(jù)的集合,是對單位業(yè)務(wù)數(shù)據(jù)的整合、處理的過程。本系統(tǒng)采用星型構(gòu)架建設(shè)數(shù)據(jù)倉庫。
2.4 數(shù)據(jù)訪問層接口實(shí)現(xiàn)
首先對各層的功能進(jìn)行明確劃分,本文中,數(shù)據(jù)訪問層負(fù)責(zé)數(shù)據(jù)的增刪查改,由于它對業(yè)務(wù)不了解,不負(fù)責(zé)業(yè)務(wù)邏輯的解釋
2.5 業(yè)務(wù)邏輯接口的實(shí)現(xiàn)
業(yè)務(wù)邏輯負(fù)責(zé)完成與系統(tǒng)領(lǐng)域相關(guān)的業(yè)務(wù)邏輯,通過調(diào)用數(shù)據(jù)訪問層來實(shí)現(xiàn),對業(yè)務(wù)相關(guān)的數(shù)據(jù)有效性解釋,不同的領(lǐng)域的業(yè)務(wù)邏輯差別很大,在實(shí)際中,業(yè)務(wù)邏輯的設(shè)計(jì)要業(yè)務(wù)專家結(jié)合。
一般見到的聚類是硬聚類,具有非此即彼的特性。Dunn把模糊數(shù)學(xué)的思想引入到硬聚類算法中,Bezdk給模糊聚類的隸屬度引入了權(quán)重m這個(gè)概念。模糊聚類通過使目標(biāo)函數(shù)最小化從而得到最優(yōu)聚類的結(jié)果,模糊聚類是根據(jù)樣本之間的特征、親疏程度和相似性,通過建立類別之間的模糊劃分,作為數(shù)理統(tǒng)計(jì)中的一種多元分析方法,現(xiàn)在已經(jīng)用于到很多應(yīng)用中。
模糊聚類算法也有下面問題:(1)離群點(diǎn)屬于哪一類很難決定(2)必須在算法執(zhí)行前設(shè)置劃分類別數(shù)目和權(quán)重因子(3)很容易陷入局部極小點(diǎn)或者鞍點(diǎn),從而得不到全局最小值。
4.1 減少離群點(diǎn)的干擾
為了減小離群點(diǎn)對聚類中心的影響,在隸屬度矩陣中加上一個(gè)權(quán)重因子,讓隸屬度低的點(diǎn)對聚類中心起的作用比較小,把隸屬度調(diào)整為為
4.2 對劃分為多少個(gè)類的數(shù)目的確定
提前確定劃分類別不很不科學(xué),會影響聚類的執(zhí)行時(shí)間。將聚類的有效性函數(shù)添加到FCM算法中,采用有效性函數(shù)來決定劃分類別數(shù)的值。具體算法如下:
步驟4:求聚類有效性函數(shù)的結(jié)果,若已經(jīng)達(dá)到最小值,則得到數(shù)據(jù)聚類類別數(shù)目,否則跳轉(zhuǎn)到1重新執(zhí)行程序。
數(shù)據(jù)是采用隨機(jī)抽取的100個(gè)樣本信息,由于客戶的數(shù)據(jù)有5個(gè)參數(shù):年齡、總資產(chǎn)、現(xiàn)金、公司交易量、盈利情況,各個(gè)數(shù)據(jù)的量綱不同,或者量綱相同,但是數(shù)量級不同,直接用原始數(shù)據(jù)計(jì)算會出現(xiàn)“大數(shù)吃小數(shù)”的現(xiàn)象,所以,在實(shí)驗(yàn)之前,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。應(yīng)用改進(jìn)模糊聚類算法,設(shè)定加權(quán)參數(shù)為2,停止閾值為0.0001,差異度采用歐幾里得距離公式計(jì)算。下表列出了聚類中心陣和聚類結(jié)果的檢測指標(biāo)。
表1 聚類結(jié)果Tab.1 The Result of Clustering
得到的劃分矩陣表明用戶對各個(gè)類別的隸屬程度,對其中的兩組用戶數(shù)據(jù)分析:
客戶1:0.0065,0.9550,0.0386
客戶2:0.1575,0.0001,0.8451
隸屬度矩陣的每列數(shù)據(jù)表示該客戶對一個(gè)特定的類別的隸屬程度,每一列數(shù)據(jù)總和為1,表示該客戶對所有分類類別的隸屬度之和為1。根據(jù)樣本判定的選擇原理,該客戶數(shù)據(jù)對某個(gè)類別的隸屬度越大,認(rèn)為該客戶應(yīng)該屬于這個(gè)類別。從上面數(shù)據(jù)可以看出。用戶1對類別2的隸屬度為0.9550,我們認(rèn)為用戶1屬于第2類,樣本2對類別3的隸屬度為0.8451。我們認(rèn)為用戶2應(yīng)該屬于第2類,同時(shí)樣本2隸屬于類別1有的數(shù)值為0.1575,表明客戶2還具有類別1的特征。
本實(shí)驗(yàn)把企業(yè)的客戶劃分成不同的種類,區(qū)別出不用種類的特點(diǎn)。下表對3類客戶的特性進(jìn)行了小結(jié):
表2 用戶特征分析Tab.2 The Analysis of Customer Feature
對于表2的分析結(jié)果,我們可以看到采用年齡、總資產(chǎn)、現(xiàn)金、公司交易量、盈利作為客戶分類的參數(shù),從劃分出的類別可以看出不同客戶類別對企業(yè)的忠誠度,發(fā)現(xiàn)潛在客戶,對企業(yè)利潤的貢獻(xiàn)大小和客戶估計(jì)要流失的可能性。
這次實(shí)驗(yàn)是根據(jù)客戶的以前的交易數(shù)據(jù)進(jìn)行聚類的,客戶最近的交易記錄對聚類結(jié)果的影響很大。企業(yè)通過CRM,能發(fā)現(xiàn)對企業(yè)利潤貢獻(xiàn)大的客戶,對不同的客戶類別,實(shí)施不同的策略,提高客戶對企業(yè)的忠誠度,吸引大客戶,留住現(xiàn)有的客戶,避免客戶的流失,提高企業(yè)的利潤。本文改進(jìn)的模糊聚類算法能夠自動(dòng)產(chǎn)生聚類類別數(shù)目,降低了人工干預(yù)初始化聚類數(shù)目的影響,有比較好的收斂速度和聚類結(jié)果。
[1] 呂延杰、尹濤、王琦,客戶關(guān)系管理與主題分析[M],北京:人民郵電出版社,2002.
[2] 何榮勤,CRM原理、設(shè)計(jì)、實(shí)施[M],北京:電子工業(yè)出版社.2003.
[3] 張躍.模糊數(shù)學(xué)方法及其應(yīng)用[M].北京:煤炭工業(yè)出版社.1992
[4] 高新波.模糊聚類分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社.2004
[5] 何清.模糊聚類分析理論與應(yīng)用研究進(jìn)展[J],模糊系統(tǒng)與數(shù)學(xué),1998,12(2):89-94.
Design and Research on customer classification system based on improved clustering algorithm
Lin Hui
(Weinan Normal University Information and Educational Technology Center,Shaanxi weinan,714000)
In order to overcome the shortrage of CRM,the paper introduces the related algorithm of fuzzy mathematics.degree of membership of the data is added weighted value and the choice for parameter of number of clusters based on cluster validity function.Experiments also show that the modified FCM has a better cluster result and has faster clustering rate,provide the basis for the enterprise to the customer classification
fuzzy clustering;customer classification
TP393
A
林輝(1982-),男,陜西西安人,工程師,碩士,研究方向?yàn)榫W(wǎng)絡(luò)安全。
渭南師范學(xué)院科研重點(diǎn)項(xiàng)目——14ykf005 網(wǎng)絡(luò)及信息安全及其應(yīng)用關(guān)鍵技術(shù)