耿秀麗, 尤星星, 呂文元
(上海理工大學(xué)管理學(xué)院,上海200093)
基于直覺模糊C-均值的客戶聚類和識別方法
耿秀麗, 尤星星, 呂文元
(上海理工大學(xué)管理學(xué)院,上海200093)
客戶聚類和識別是大規(guī)模客戶化生產(chǎn)中產(chǎn)品/服務(wù)快速有效設(shè)計的基礎(chǔ).考慮客戶需求信息的不確定性,提出了基于直覺模糊C-均值的客戶聚類算法.針對傳統(tǒng)基于歐式距離的C-均值聚類方法無法計算直覺模糊數(shù)組間距離的缺點,采用直覺模糊交叉熵方法處理算法中的距離計算問題.同時,直覺模糊交叉熵還用來計算新客戶和各客戶類間的偏好相似度,進(jìn)行客戶識別.最后以某工程機械企業(yè)服務(wù)開發(fā)中的客戶聚類和識別為例,驗證了所提方法的有效性.
大規(guī)??蛻艋a(chǎn);客戶聚類;C-均值;直覺模糊集;交叉熵
大規(guī)??蛻艋a(chǎn)是基于客戶需求生產(chǎn)定制產(chǎn)品和服務(wù),同時能保持大規(guī)模生產(chǎn)高質(zhì)量和高效率的生產(chǎn)方式.大規(guī)??蛻艋a(chǎn)強調(diào)滿足客戶多樣化的偏好和需求,根據(jù)客戶對產(chǎn)品或服務(wù)的偏好,分析產(chǎn)品或服務(wù)功能,最終獲得個性化的設(shè)計方案.客戶關(guān)系管理(customer relationship management, CRM)系統(tǒng)和累積的設(shè)計知識為客戶化生產(chǎn)提供了支持.通過對市場客戶需求偏好進(jìn)行聚類分析,建立客戶類與產(chǎn)品/服務(wù)方案類間的映射關(guān)系,可以快速分析客戶需求,提高產(chǎn)品/服務(wù)設(shè)計效率.Shao等[1]指出產(chǎn)品客戶化設(shè)計的兩個基本問題是需求配置和配置設(shè)計,其中需求配置是建立客戶類和產(chǎn)品功能需求類間的依賴關(guān)系.Hong等[2]采用模糊C-均值(fuzzy C-means,FCM)聚類方法進(jìn)行客戶需求聚類,通過挖掘客戶類與產(chǎn)品結(jié)構(gòu)類間的關(guān)聯(lián)關(guān)系,支持窗戶產(chǎn)品的大規(guī)??蛻艋a(chǎn).
大規(guī)模客戶化產(chǎn)品/服務(wù)設(shè)計中,客戶聚類的依據(jù)是客戶對產(chǎn)品/服務(wù)不同屬性的偏好差異.客戶對需求屬性的偏好表達(dá)通常是不確定的.常用的傳統(tǒng)模糊集方法僅用一個隸屬度函數(shù)來表達(dá)決策者判斷的信心度,包含的信息量少,難以全面反映評價信息的模糊性和不確定性.為了克服傳統(tǒng)模糊集的缺點, Gau等對模糊集理論進(jìn)行了拓展,提出了直覺模糊集(vague set)的概念[3].直覺模糊集在處理決策者評價信息時,同時考慮了正隸屬度、負(fù)隸屬度和猶豫度3個方面的信息,提高了處理模糊語義信息的能力.客戶間偏好的差異體現(xiàn)為兩組偏好信息的差異,如采用直覺模糊數(shù)表達(dá)客戶對各產(chǎn)品/服務(wù)屬性的偏好,客戶間的偏好差異體現(xiàn)為兩組直覺模糊數(shù)集間的距離大小.
常見的聚類方法有層次聚類、劃分聚類、基于網(wǎng)格聚類、基于密度聚類及模糊聚類等[4].文獻(xiàn)[5]采用模糊聚類法來分析大學(xué)生網(wǎng)絡(luò)行為.文獻(xiàn)[6-7]分別提出了改進(jìn)的層次譜聚類算法和改進(jìn)的FCM聚類算法.FCM是常用的客戶聚類方法,通過優(yōu)化目標(biāo)函數(shù)得到每個樣本點對所有類中心的隸屬度,從而決定樣本點的類屬以達(dá)到自動對樣本數(shù)據(jù)進(jìn)行分類的目的.傳統(tǒng)FCM算法是針對特征空間中的點集設(shè)計的,通常采用歐式距離計算兩點之間的距離,無法處理采用直覺模糊數(shù)表達(dá)條件下的多屬性客戶偏好聚類.直覺模糊交叉熵可以解決這一問題.交叉熵是模糊集理論中的一個重要課題,它是度量兩個系統(tǒng)間差異程度的重要工具[8].文獻(xiàn)[9]根據(jù)概率分布交叉熵的概念,提出了計算兩個直覺模糊數(shù)集間熵的方法.該熵稱為直覺模糊交叉熵,用于計算兩組直覺模糊數(shù)集間的信息相似度.相似度越大表明兩個直覺模糊數(shù)集之間的距離越小.文獻(xiàn)[10]將直覺模糊交叉熵與TOPSIS方法相結(jié)合用于確定方案屬性評價值和正負(fù)理想解之間的距離.此外,直覺模糊交叉熵已成功應(yīng)用在模式識別、疾病診斷等領(lǐng)域.
本文在客戶化服務(wù)開發(fā)背景下,提出了基于直覺模糊C-均值的客戶聚類和識別方法.在客戶聚類中,采用直覺模糊數(shù)處理和表達(dá)客戶個性化的服務(wù)需求偏好信息,將直覺模糊交叉熵引入C-均值聚類算法中,提出了直覺模糊C-均值聚類方法.在客戶識別中,通過采用直覺模糊交叉熵方法計算新客戶和典型客戶類間的信息相似度,進(jìn)行客戶類型識別.最后以某工程機械企業(yè)服務(wù)開發(fā)中的客戶聚類分析為例,驗證了所提方法的有效性.
當(dāng)前我國正處于從“產(chǎn)品經(jīng)濟”向“服務(wù)經(jīng)濟”的轉(zhuǎn)型過程中,很多制造企業(yè)開始加大服務(wù)設(shè)計和供應(yīng)力度.但是,企業(yè)往往在產(chǎn)品使用過程中向客戶銷售服務(wù).這些服務(wù)的設(shè)計和提供并沒有依據(jù)客戶個性化的需求,沒有與客戶使用情景及產(chǎn)品特征相結(jié)合,不能有效提升客戶滿意度,也難以產(chǎn)生規(guī)模效益.目前研究較熱的產(chǎn)品服務(wù)系統(tǒng)理念強調(diào)企業(yè)在客戶購買初期為其提供產(chǎn)品和服務(wù)組合的完整解決方案.為客戶提供個性化的系統(tǒng)服務(wù)方案需要根據(jù)已有的服務(wù)設(shè)計和供應(yīng)經(jīng)驗及數(shù)據(jù)分析客戶對服務(wù)需求偏好及其滿意的服務(wù)方案,從而進(jìn)行客戶需求配置分析.需求配置分析包括客戶需求聚類、服務(wù)方案聚類和需求類與方案類間依賴關(guān)系的識別.通過客戶需求類的識別,根據(jù)獲取的需求類與方案類間的依賴關(guān)系,可有效地獲得客戶化的服務(wù)方案,如圖1所示.
圖1 客戶需求配置分析流程Fig.1 Process of customer requirements configuration analysis
直覺模糊集的定義:設(shè)X是一個論域,則稱
式中,wj表示屬性Aj的權(quán)重.
屬性權(quán)重確定的典型方法有:a.專家直接打分法.該方法簡單直觀,但是主觀性強且不能處理語義評價信息.b.AHP方法[11].該方法適用面廣,但需要調(diào)查大量顧客需求信息,并進(jìn)行兩兩比較,但難以保證方法所要求的評判信息的一致性.c.信息熵方法[12].該方法的原理是根據(jù)屬性值的離散程度確定屬性權(quán)重,但是該方法難以處理直覺模糊數(shù).本文考慮屬性偏好離散程度確定屬性權(quán)重,屬性偏好分布越離散,該屬性的權(quán)重越大;反之,該屬性的權(quán)重越小.本文采用改進(jìn)加權(quán)最小平方法[10],計算出各個屬性偏好程度的中心值;然后分別針對各個屬性,計算所有客戶需求偏好與中心值間的距離和;最后得到各個屬性的權(quán)重.屬性權(quán)重確定的具體步驟如下:
步驟1 針對每個屬性,采用改進(jìn)加權(quán)最小平方法確定該屬性所有客戶需求偏好的中心值x^j= [xjl,xju],xjl表示區(qū)間值的下限,xju表示區(qū)間值的上限,則
步驟2 針對每個屬性,分別計算所有客戶需求偏好和中心值間的距離和,兩直覺模糊數(shù)間距離計算定義如下:
步驟3 將得到的各個屬性偏好的組內(nèi)距離和歸一化,即得到各個屬性的權(quán)重.
3.1 基于直覺模糊交叉熵的模糊C-均值客戶聚類算法步驟
模糊C-均值算法是一種以局部代價函數(shù)最小化為目標(biāo)的聚類算法,將數(shù)據(jù)集劃分為c(c>1)類. c類確定后,選取第一個點作為第一個聚類中心;接著選取離第一個點距離最遠(yuǎn)的點,作為第二個聚類中心;至于第三個聚類中心,選取離第一、二兩個點距離之和最遠(yuǎn)的點;以此類推,直到選出c個聚類中心.假設(shè)從CRM中提取了n個客戶的需求偏好信息,樣本集為X=(X(1),X(2),…,X(n)), X( i)(1≤i≤n)表示第i個客戶對產(chǎn)品不同屬性偏好的一組直覺模糊數(shù).因此,本文中選取聚類中心時,聚類中心不是一個點,而是一組直覺模糊數(shù),設(shè)R={R(1),R(2),…,R(k),…,R(c)}為c個聚類中心.通過迭代方法不斷修正聚類中心,迭代過程以極小化所有的數(shù)據(jù)點到各個聚類中心的距離與隸屬度值的加權(quán)和為優(yōu)化目標(biāo),其目標(biāo)函數(shù)為
3.2 基于直覺模糊交叉熵的客戶類識別
客戶類識別是根據(jù)該客戶的需求,將其與已有的客戶類進(jìn)行匹配,從而將其歸到已有的客戶類當(dāng)中,再根據(jù)已經(jīng)建立的客戶類與產(chǎn)品/服務(wù)功能結(jié)構(gòu)類間的映射關(guān)系,最終設(shè)計出客戶所需的產(chǎn)品/服務(wù).
新客戶需求可以表達(dá)為一組反映客戶需求偏好信息的直覺模糊數(shù)集.此時,利用直覺模糊交叉熵方法依次計算該組直覺模糊數(shù)集與典型客戶類聚類中心的直覺模糊集之間的距離.距離越小,即相似度越大,從而將其歸到某一類當(dāng)中,實現(xiàn)客戶類型的識別.
A公司是國內(nèi)一家著名的工程機械制造企業(yè).近幾年該公司一直致力于滿足客戶要求,向客戶提供各種服務(wù).然而這些服務(wù)的設(shè)計與提供并沒有根據(jù)客戶個性化的需求,沒有與客戶使用情景及產(chǎn)品特征相結(jié)合,不能有效提升客戶滿意度并難以產(chǎn)生規(guī)模效益.公司擬采用本文所提方法對該公司的典型客戶進(jìn)行聚類,從而提高該公司的售后服務(wù)設(shè)計的效率和有效性,提升客戶滿意度.
從A公司的客戶關(guān)系管理系統(tǒng)中,收集到50名客戶對該型號挖掘機5種售后服務(wù)項目的需求偏好信息.該5種售后服務(wù)項目為:節(jié)能環(huán)保、響應(yīng)性、金融需求、再制造、低成本,分別用A1,A2,A3,A4, A5表示.客戶對每個售后服務(wù)項目的指標(biāo)評價值用非常不重要、不重要、較不重要、一般、較重要、重要、非常重要表示.限于篇幅,文中列舉了部分客戶需求信息,如表1所示.
表1 客戶需求偏好信息Tab.1 Customer requirements information
采用本文所提基于直覺模糊C-均值方法對客戶需求信息進(jìn)行分析,實現(xiàn)客戶聚類,步驟如下:
步驟1 利用表2將語言術(shù)語形式的偏好評價信息轉(zhuǎn)換為直覺模糊數(shù),結(jié)果如表3所示.
步驟2 利用改進(jìn)加權(quán)最小平方法確定5個屬性的權(quán)重.首先利用式(2)確定5個屬性偏好程度的中心值,結(jié)果為:x1=[0.4,0.53],x2=[0.56, 0.71],x3=[0.19,0.36],x4=[0.61,0.80],x5= [0.62,0.77].
表2 語言變量和相應(yīng)的直覺模糊數(shù)Tab.2 Linguistic variables and the corresponding vague set numbers
表3 采用直覺模糊數(shù)表達(dá)的客戶需求偏好信息Tab.3 Customer requirements information expressed in vague set numbers
步驟3 針對每個屬性,利用式(3)計算所有客戶需求偏好和中心值的距離和,然后將各個屬性偏好的組內(nèi)距離和歸一化,得到5個屬性的權(quán)重分別為:w1=0.365,w2=0.051,w3=0.380,w4= 0.122,w5=0.082.
步驟4 利用直覺模糊C-均值聚類算法,依據(jù)表3所列客戶需求偏好信息,對該50名客戶進(jìn)行聚類.基于Matlab軟件進(jìn)行聚類運算,最終得到5種不同的客戶類型,分別為環(huán)保型、效率型、成長型、可持續(xù)發(fā)展型、經(jīng)濟型客戶.該5種客戶類型的聚類中心分別為
該公司一名新顧客對該型號挖掘機5種售后服務(wù)項目的需求偏好信息為:I={[0.0,0.1],[0.5, 0.6],[0.9,1.0],[0.5,0.6],[0.6,0.9]}.根據(jù)已獲得的5種客戶類型和聚類中心,采用直覺模糊交叉熵方法對該客戶進(jìn)行需求類型識別.
利用式(1)計算該客戶與上述獲取的5種典型客戶類間的信息相似度,兩者之間的距離越小,相似度越高.計算得到的該客戶需求偏好信息I與5類典型客戶需求偏好信息R(1),R(2),R(3),R(4), R(5)間的距離分別為:D(I,R(1))=1.058,D(I, R(2))=0.662,D(I,R(3))=0.014, D(I,R(4))=0.772,D(I,R(5))=0.263.顯然,該客戶與第三種典型客戶類聚類中心的距離最小,因此該客戶應(yīng)劃分到第三種客戶類,即成長型客戶類中.下一步即可針對成長型客戶類的特點和相關(guān)的服務(wù)方案屬性,快速設(shè)計適合該客戶的服務(wù)方案.
客戶聚類和識別是大規(guī)??蛻艋a(chǎn)的重要前提.本文提出了一種基于直覺模糊交叉熵的直覺模糊C-均值客戶聚類和識別方法.該方法的特點有: a.在客戶需求偏好信息獲取和表達(dá)方面,采用可處理正負(fù)隸屬度信息的直覺模糊集方法,相比于傳統(tǒng)模糊集方法提高了處理需求信息模糊性和不確定性的能力;b.針對直覺模糊數(shù)的特點,提出了采用直覺模糊交叉熵方法計算不同客戶需求偏好信息間的距離,用于構(gòu)建C-均值聚類算法函數(shù);此外,還將直覺模糊交叉熵用于計算新客戶需求偏好和已知客戶類需求偏好間的距離來進(jìn)行客戶類識別.所提方法已用于某公司對挖掘機售后服務(wù)項目的客戶聚類和識別分析,通過實證分析,驗證了所提方法的有效性和可行性.下一步工作將在現(xiàn)有研究工作的基礎(chǔ)之上,研究客戶需求類與產(chǎn)品/服務(wù)方案類之間的映射關(guān)系獲取,實現(xiàn)產(chǎn)品/服務(wù)客戶化方案的設(shè)計.
[1] Shao X Y,Wang Z H,Li P G,et al.Integrating data mining and rough set for customer group-based discovery of product configuration rules[J]. International Journal of Production Research,2006,44 (14):2789-2811.
[2] Hong G,Xue D,Tu Y.Rapid identification of the optimal product configuration and its parameters based on customer-centric product modeling for one-of-akind production[J].Computers in Industry,2010,61: 270-279.
[3] Gau W,Buehrer D.Vague sets[J].IEEE Transactions on Systems,Man and Cybernetics,1993,23(2):610 -614.
[4] Mitra S,Pal S K,Mitra P.Data mining in soft computing framework:a survey[J].IEEE Transactions on Neural Networks,2002,13(1):3-14.
[5] 李云先,彭敦陸.大學(xué)生網(wǎng)絡(luò)行為方式的模糊分析[J].上海理工大學(xué)學(xué)報,2013,35(2):107-112.
[6] 楊曉慧,王莉莉,李登峰.一種新的層次譜聚類算法[J].上海理工大學(xué)學(xué)報,2014,36(1):49-52.
[7] 曹易,張寧.一種改進(jìn)的模糊C-均值聚類算法[J].上海理工大學(xué)學(xué)報,2012,34(4):351-354.
[8] 李香音.區(qū)間直覺模糊連續(xù)交叉熵及其多屬性決策方法[J].計算機工程與應(yīng)用,2013,49(15):234-237.
[9] Zhang QS,Jiang S Y.A note on information entropy measures for vague sets and its applications[J]. Information Sciences,2008,178(21):4184-4191.
[10] Geng X,Chu X,Zhang Z.A new integrated design concept evaluation approach based on vague sets[J]. Expert Systems with Applications,2010,37:6629 -6638.
[11] Lin M,Wang C,Chen M,et al.Using AHPand TOPSIS approaches in customer-driven product design process [J].Computers in Industry,2008,59:17-31.
[12] Chan L,Wu M.A systematic approach to quality function deployment with a full illustrative example [J].Omega,2005,33(1):119-139.
[13] Zhang D,Huang S,Li F.Approach to measuring the similarity between vague sets[J].Journal of Huazhong University of Science and Technology(Natural Science Edition),2004,32(5):59-60.
(編輯:丁紅藝)
Customer Clustering and Pattern Identification Approach Based on Vague C-means
GENGXiuli,YOU Xingxing,LV Wenyuan
(Business School,University of Shanghai for Science of Technology,Shanghai 200093,China)
In the mass customization production,customer clustering and identification are the basis of quick and effective product/service design.Considering the uncertainty of customer requirements,a customer clustering and pattern identification approach based on vague C-means was proposed.Aiming at the problem that the traditional fuzzy C-means based on Euclidean distance cannot deal with the distance between vague sets,a vague cross-entropy approach was adopted to deal with the distance calculating problem in the C-means clustering algorithm.At the same time, the vague cross-entropy was also applied in calculating the similarity between new customer and different customer groups,and then the customer identification was realized.Finally,a case study of customer clustering and identification in a mechanical company’s service development was presented to illustrate the effectiveness of the proposed approach.
mass customization;customer clustering;C-means;vague set;cross-entropy
TH 122;N 94
A
1007-6735(2015)01-0013-05
10.13255/j.cnki.jusst.2015.01.003
2014-03-09
國家自然科學(xué)基金資助項目(71301104,71271138);上海市教委科研創(chuàng)新基金資助項目(14YZ088);上海市一流學(xué)科建設(shè)資助項目(S1201YLXK);高等學(xué)校博士學(xué)科點專項科研基金資助項目(20133120120002, 20120073110096);滬江基金資助項目(A14006)
耿秀麗(1984-),女,講師.研究方向:產(chǎn)品服務(wù)工程、工業(yè)工程.E-mail:xiuliforever@163.com