[摘要] 隨著市場競爭的日益激烈,“以客戶為中心”的企業(yè)經(jīng)營理念已成為共識。本文在分析CRM的功能以及客戶價值評估的重要性基礎(chǔ)上,提出了一種基于聚類算法和模糊推理的客戶價值評估方法,有效實現(xiàn)了對客戶的劃分和價值的評估。
[關(guān)鍵詞] 客戶關(guān)系管理聚類模糊推理
一、引言
CRM是客戶關(guān)系管理的簡稱,由于受到國外管理模式的影響以及周圍激烈競爭環(huán)境的推動,國內(nèi)企業(yè)對CRM的需求日益旺盛。本文提出了一種基于聚類算法和模糊推理的客戶價值評估方法,有效實現(xiàn)了對客戶的劃分和價值的評估。
二、應(yīng)用聚類算法劃分客戶
聚類是數(shù)據(jù)挖掘的一種策略,用來將數(shù)據(jù)對象劃分成多個簇,在同一個簇中的對象之間具有較高的相似度,而不同簇的對象之間差別較大。因而通過聚類分析,能將客戶劃分成不同的類。應(yīng)用聚類算法劃分客戶的過程如下:
1.數(shù)據(jù)準備是數(shù)據(jù)挖掘過程中的重要環(huán)節(jié),完成數(shù)據(jù)預處理和數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)預處理主要解決噪聲問題和處理缺失信息,數(shù)據(jù)轉(zhuǎn)換包括數(shù)據(jù)的規(guī)范化、數(shù)據(jù)類型轉(zhuǎn)換以及選擇屬性和實例等。
我們在眾多屬性中選取了與客戶的價值有較大關(guān)聯(lián)的應(yīng)收款、交易總額、信用額度、訂貨頻率、平均訂單利潤、支付方式以及訂貨頻率、平均訂單利潤和支付方式的標準差等作為特征度量。這些數(shù)據(jù)可以從數(shù)據(jù)庫中通過查詢計算獲得。其中需要注意的是有些非數(shù)值型屬性必須轉(zhuǎn)化成數(shù)值型。如支付方式共有5種,可以分別用0-4這幾個自然數(shù)來表示,取均值即可得到表征客戶支付習慣的“支付方式”屬性的值,最后將所有的數(shù)據(jù)進行歸一化處理。
2.客戶聚類和劃分。常用的聚類算法有劃分方法、層次方法、基于密度的方法、基于網(wǎng)格的方法以及基于模型的方法。K-Means算法是一種效率高,伸縮性相對較強的劃分方法。在執(zhí)行這個算法之前,必須指定簇的數(shù)目k。其基本過程描述為:
第一步,任意選取k個對象作為簇的聚類中心。
第二步,計算對象到每一個簇中心的距離,并將其歸入距離值最小的那一簇。式(1)為某對象到第i個聚類中心的距離:(1)
其中n是維數(shù)(屬性的個數(shù)),xcj代表第j維的值,Cji代表第i個聚類中心的第j維的值。
第三步,計算簇的聚類中心,更新原來的聚類中心;
簇的聚類中心是簇中對象各維向量的平均值,例如:簇中有兩個二維對象,x1(1.0,2.0),x2(4.0,5.0);則簇的聚類中心為x0(2.5,3.5)。
重復第二步、第三步,直到聚類中心不再發(fā)生變化時,處理過程結(jié)束。
由此我們得到各聚類中心的數(shù)據(jù)以及客戶的劃分??蛻魧儆谄涞礁骶垲愔行牡木嚯x值最小的那一簇。
三、客戶價值的評估
為了進一步地確定各類客戶的價值,系統(tǒng)引入模糊推理機制。
模糊邏輯是一種用來推理基于規(guī)則系統(tǒng)中不確定性的啟發(fā)式技術(shù),它使用0.0和1.0之間的值表示一個特定的值屬于某個集合的程度。如下圖所示,年齡34歲的人從某種程度上屬于青年人,但從更多程度上屬于中年人。
年齡的模糊集圖
設(shè)計模糊推理系統(tǒng)要解決三個問題:其一把精確的輸入變量模糊化,其二獲取模糊推理規(guī)則并在給定模糊輸入時得到輸出,其三是解模糊。
為了實現(xiàn)模糊推理,本例首先定義輸入輸出變量以及模糊子集,選擇應(yīng)收款、交易總額、信用額度、訂貨頻率、平均訂單利潤、支付方式為系統(tǒng)輸入變量,客戶等級為輸出變量。所有輸入變量的模糊子集均為低、中、高,輸出變量的模糊子集為:低、中低、中、中高、高。
然后獲取模糊規(guī)則,模糊規(guī)則的一般形式設(shè)為:Ri:IF x1 is Ai1 and x2 is Ai2…….and xn is Ain THEN y is Ci 其中i是規(guī)則的條數(shù),n是輸入變量的個數(shù)。
根據(jù)輸入變量與客戶價值的關(guān)系,按高中低分別賦值,如交易總額值越大,客戶價值越高,因此,對于交易總額按高中低分別賦予1,0,-1;而應(yīng)收款越多,客戶價值越低,因此,對于應(yīng)收款按高中低分別賦予-1,0或1,由此計算出每一條規(guī)則的輸出值: (n為輸入變量的個數(shù))
輸出值與模糊子集之間的對應(yīng)關(guān)系見表1。
表1 輸出值與模糊子集間的對應(yīng)關(guān)系
最后進行模糊推理。在模糊推理的過程中,采用三角形隸屬度函數(shù)模糊化輸入變量,解模糊采用最大隸屬度法,由此推導出每一個聚類中心的等級。表2是對相關(guān)數(shù)據(jù)的分析結(jié)果,說明通過聚類分析,客戶被劃分成6個簇,屬于“0”簇的客戶為高級客戶,占所有客戶的1.67%,屬于客戶“5”簇的客戶為低級客戶,占所有客戶的8.33%。
表2各類用戶的等級
至此,客戶劃分及其價值評估得到實現(xiàn)。當然實際的處理過程要復雜得多,例如數(shù)據(jù)的預處理、合理的k值的獲取以及聚類效果的評估等等。
四、結(jié)論
本文闡述了客戶價值評估在CRM中的重要地位,介紹了聚類分析和模糊推理技術(shù)在客戶價值評估中的應(yīng)用,為客戶價值評估提供了一種新的思路。