曾 珠 王 斌 劉 冬
(武漢理工大學(xué)管理學(xué)院 武漢 430070)
研究客戶特征與服務(wù)映射關(guān)系是在日益競爭激烈的市場中企業(yè)尋求提高客戶忠誠度的重要途徑,為客戶提供更周到、更個性化的服務(wù)成為企業(yè)管理的重要任務(wù)之一[1].BP神經(jīng)網(wǎng)絡(luò)基于梯度下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和達(dá)到最小,具有優(yōu)良的分類學(xué)習(xí)和映射能力,但標(biāo)準(zhǔn)BP算法具有收斂速度慢、局部極小值點(diǎn)、隱含層層數(shù)及神經(jīng)元個數(shù)的確定無理論指導(dǎo)等缺陷[2-3].何明等[4]提出基于粗糙集不可分辨關(guān)系的粗糙集神經(jīng)網(wǎng)絡(luò)模型,但未進(jìn)行客戶屬性約簡和指定初始化連接權(quán)值.萬映紅等[5]提出基于粗糙集神經(jīng)網(wǎng)絡(luò)的客戶消費(fèi)分類模型,具有較好的客戶分類效果,但未給出客戶分類與服務(wù)的映射模型.本文提出有導(dǎo)師學(xué)習(xí)下的基于粗糙BP神經(jīng)網(wǎng)絡(luò)客戶特征與服務(wù)映射模型,在客戶細(xì)分的基礎(chǔ)上尋求客戶特征與服務(wù)的映射關(guān)系.
提出根據(jù)客服歷史數(shù)據(jù)對由客戶特征和服務(wù)決策構(gòu)成的決策表進(jìn)行基于屬性重要程度的屬性約簡,得出各服務(wù)決策對各屬性的依賴程度,引入該決策支持度改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法,構(gòu)建客戶群體特征與服務(wù)策略的映射模型.并運(yùn)用該映射模型研究客戶群體特征與服務(wù)的關(guān)系,通過歷史數(shù)據(jù)的分群分組訓(xùn)練,形成多個穩(wěn)定的BP網(wǎng)絡(luò),對客戶的服務(wù)項(xiàng)目和時間進(jìn)行預(yù)測.改變傳統(tǒng)的客戶遇到困難找經(jīng)銷商解決的服務(wù)模式,變?yōu)榻?jīng)銷商主動為客戶提供定制服務(wù)的模式,讓每個客戶都能體驗(yàn)經(jīng)銷商一對一的服務(wù),提高客戶滿意度,從而提高客戶的忠誠度,增加企業(yè)收益.
粗糙集是繼概率論、模糊集、證據(jù)理論之后的又一個處理不確定性的數(shù)學(xué)工具.粗糙集觀點(diǎn)認(rèn)為知識是主體對論域中的客體進(jìn)行分類的能力,分類能力越強(qiáng),主體所具備知識的可靠度越高[6].分類能力受主體分辨能力的影響,因此分類具有近似性.影響分類能力的因素很多,不同的因素重要程度不同,其中某些因素起決定性作用.具有相同屬性的實(shí)體,屬性取值的不同對分類能力也產(chǎn)生影響,屬性之間存在某種依賴關(guān)系[7-8].運(yùn)用粗糙集理論能發(fā)現(xiàn)屬性間的完全或部分依賴,簡化冗余屬性,發(fā)現(xiàn)最重要的屬性,并計算具體的依賴程度.
BP(back propagation)神經(jīng)網(wǎng)絡(luò)算法是模擬人腦思維構(gòu)建的網(wǎng)絡(luò)計算結(jié)構(gòu),通過輸出后的誤差逐層反傳修改各層連接權(quán)值和閾值使網(wǎng)絡(luò)達(dá)到預(yù)期狀態(tài)[9],當(dāng)誤差函數(shù)及全局均方誤差函數(shù)達(dá)到達(dá)到預(yù)設(shè)精度或?qū)W習(xí)次數(shù)達(dá)到設(shè)定的最大次數(shù)時即為BP網(wǎng)絡(luò)最終狀態(tài).
利用BP神經(jīng)網(wǎng)絡(luò),設(shè)客戶特征屬性集為條件屬性,客戶服務(wù)項(xiàng)為決策屬性,進(jìn)行客戶特征與服務(wù)內(nèi)容的映射訓(xùn)練,可以得出基于客戶特征的服務(wù)策略規(guī)則.但BP算法也存在一些不足之處:學(xué)習(xí)算法的收斂速度比較慢,易陷入局部極小值,網(wǎng)絡(luò)隱含層的層數(shù)以及隱含層神經(jīng)元數(shù)的選取尚無理論指導(dǎo)等[10].
1)訓(xùn)練方式的改進(jìn) 在采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行客戶特征與服務(wù)映射訓(xùn)練過程中,由于訓(xùn)練網(wǎng)絡(luò)時的樣本數(shù)量較多,所以在BP改進(jìn)算法中,張國翊等提出先把所有P個訓(xùn)練樣本分為n組[11],讓每組樣本經(jīng)過1次循環(huán)學(xué)習(xí)累積誤差后再調(diào)整學(xué)習(xí)率,而不是每輸入1個樣本就調(diào)整1次學(xué)習(xí)率.其優(yōu)點(diǎn)是既能使不同學(xué)習(xí)率在每組樣本圖像循環(huán)訓(xùn)練完成后得到適當(dāng)調(diào)整,又能減小調(diào)整學(xué)習(xí)率的時間.
該方法可以在一定程度上縮短學(xué)習(xí)時間,使得網(wǎng)絡(luò)可以較為快速收斂,但對于海量的客服數(shù)據(jù),這樣隨機(jī)的毫無明確目標(biāo)的分組,最后并不能提高BP網(wǎng)絡(luò)的精確度.本文提出采用分群分組批處理的訓(xùn)練方式,在對m個學(xué)習(xí)模式對樣本進(jìn)行分組前先采用聚類算法,將樣本劃分為各具特性的客戶群,每個客戶群具有自己的共性特征和個性特征,再針對每個客戶群隨機(jī)均分為r組訓(xùn)練,這樣可以快速獲得多個具有較高準(zhǔn)確度的映射網(wǎng)絡(luò).
圖1 BP網(wǎng)絡(luò)訓(xùn)練方式改進(jìn)機(jī)制圖
此時,不是每輸入一個模式對就進(jìn)行一次誤差修正,而是在每訓(xùn)練完一小組樣本后再調(diào)整,所以輸出層各個單元的校正誤差函數(shù))對應(yīng)的改為累積誤差函數(shù)dt=.
2)網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn) 根據(jù)萬映紅等的研究,提出了基于粗糙集的神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),但沒有明確BP網(wǎng)絡(luò)權(quán)值確定的依據(jù).本文作者提出基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),給出基于典型的3層BP網(wǎng)絡(luò)隱含層神經(jīng)元個數(shù)及網(wǎng)絡(luò)權(quán)值確定的依據(jù).
圖2 基于粗糙集改進(jìn)三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
樣本模式對在進(jìn)入BP網(wǎng)絡(luò)訓(xùn)練之前,先進(jìn)行屬性約簡,剔除冗余屬性,劃分每個條件屬性對于決策屬性的不可分辨關(guān)系,獲取等價關(guān)系.條件屬性集中為核的屬性個數(shù)即為3層BP網(wǎng)絡(luò)的輸入層神經(jīng)元個數(shù),而隱含層的神經(jīng)元個數(shù)即為各個核心屬性的所有等價類數(shù)量之和,輸出層神經(jīng)元個數(shù)為決策屬性所有不同屬性值的個數(shù).
基于改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法及客戶群理論,本文構(gòu)建如圖3所示的客戶服務(wù)映射模型框架.
圖3 基于粗糙BP網(wǎng)絡(luò)的客戶服務(wù)映射框架
客戶群體特征包括客戶屬性、客戶行為屬性和環(huán)境屬性.客戶屬性主要指客戶自身的基本特征,如性別、年齡、年收入等特征,客戶自身的特征對其使用商品或者服務(wù)有著顯著的影響.客戶行為屬性,主要指客戶在使用某種商品的時候的習(xí)慣性行為,不同的習(xí)慣行為對產(chǎn)品造成的影響不同.以汽車客戶為例,若駕駛者在駕駛的時候習(xí)慣經(jīng)常猛踩剎車,則汽車的剎車片和輪胎將會很容易磨損.環(huán)境屬性指客戶所處的自然環(huán)境、人文環(huán)境等,如汽車用戶行駛的道路環(huán)境,環(huán)境屬性對客戶使用產(chǎn)品會造成客觀因素的影響.客戶群體特征包含眾多屬性,每個屬性對客戶所需要的服務(wù)的影響不一樣,本文采用粗糙集理論對客戶特征進(jìn)行分析,計算基于屬性重要程度的客戶特征對服務(wù)項(xiàng)目的隸屬度.
設(shè)由條件屬性集C和服務(wù)決策屬性集D組成的知識表達(dá)系統(tǒng)四元組S=(U,A,V,F(xiàn)),U 為對象的非空有限集合,亦稱論域;A為屬性的非空有限集合,A=C∪D,C∩D=?;V表全體屬性的值域;f為U×A→V的一個映射,稱為信息函數(shù).在客戶群體特征與服務(wù)項(xiàng)目的映射關(guān)系中S表示成一張二維表,其中U是所有服務(wù)記錄的集合,A是所有客戶群特征屬性列的集合,V是二維表中服務(wù)項(xiàng)目取值的集合.
定義:?x,y∈U,如果對?α∈R,R?C都有fα(x)=fα(y),且有fD(x)≠fD(y),則稱對象x,y在等價關(guān)系R下是不可分辨的,否則稱對象x,y在等價關(guān)系R 下是可分辨的,其中fα(x)是對象x在信息函數(shù)f下對應(yīng)的屬性α的值.這種由R決定的不可分辨關(guān)系可表示為IND(R),在不產(chǎn)生混淆的情況下記為R:
對于一個客戶群體特征與服務(wù)項(xiàng)目的決策表,粗糙集理論除了提供知識約簡和求核方法外,還具備從決策表中抽取規(guī)則的能力,這樣就可以在保持服務(wù)決策一致的條件下刪除多余的客戶群體特征屬性.此時:
為客戶群特征α對客戶群特征屬性全集C相對于服務(wù)決策屬性D的重要程度.其中,γC(D)=通過計算客戶群特征的重要程度,篩選影響客戶服務(wù)項(xiàng)目的核心屬性,剔除冗余屬性,以便構(gòu)建客戶群體特征與服務(wù)項(xiàng)目的映射模型.
對客戶服務(wù)歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,運(yùn)用粗糙集基于屬性重要程度的約簡算法對客戶特征屬性進(jìn)行約簡,刪除冗余屬性和數(shù)據(jù),采用K-means算法進(jìn)行客戶群劃分.針對劃分好的每個客戶群,再次運(yùn)用粗糙集基于屬性重要程度的約簡算法,重新計算客戶特征屬性對服務(wù)屬性的支持度,劃分客戶等價類,見表1.根據(jù)約簡后的客戶特征核心屬性數(shù)量確定BP神經(jīng)網(wǎng)絡(luò)輸入層神經(jīng)元的個數(shù),根據(jù)每個輸入層屬性特征的等價類的數(shù)量確定與對應(yīng)屬性相連接的隱含層神經(jīng)元數(shù)量,輸入層每個神經(jīng)元只與其在隱含層的等價類神經(jīng)元相連,其連接權(quán)值為該屬性對服務(wù)屬性的支持度.
表1 客戶服務(wù)決策表
對每個客戶群分別建立單獨(dú)的BP神經(jīng)網(wǎng)絡(luò),并將每個客戶群服務(wù)樣本數(shù)據(jù)進(jìn)行分組.在訓(xùn)練的時,只在每一組樣本數(shù)據(jù)訓(xùn)練完后才計算全局誤差,直到訓(xùn)練結(jié)束.訓(xùn)練完成后,每個客戶群形成自己的BP網(wǎng)絡(luò),對應(yīng)相應(yīng)的客戶特征與服務(wù)映射模型.當(dāng)新客戶數(shù)據(jù)到達(dá)時,先劃分新客戶所屬客戶群,再利用對應(yīng)客戶群的BP網(wǎng)絡(luò)映射其所需服務(wù).
模擬某汽車4S店客戶服務(wù)的3 000條歷史數(shù)據(jù),假設(shè)汽車某類客戶群體特征可分為駕齡、年齡、車輛型號、主要用途、車齡、總行駛里程、月行駛里程、平均車速、道路環(huán)境、氣候環(huán)境、保養(yǎng)意識和保養(yǎng)周期12個方面的特征,以客戶是否需要更換剎車片為例,利用Rosetta軟件進(jìn)行數(shù)據(jù)離散化預(yù)處理等,數(shù)據(jù)離散化結(jié)果見表2.
表2 數(shù)據(jù)離散化
表3 客戶屬性篩選機(jī)隸屬度計算
對所有客戶服務(wù)數(shù)據(jù)運(yùn)用Rosetta軟件進(jìn)行基于屬性重要程度的約簡預(yù)處理,剔除年齡、車輛型號、主要用途、平均車速、氣候環(huán)境及保養(yǎng)周期等重要程度較小的屬性,獲得結(jié)果見表3.依據(jù)表3的結(jié)果,刪除其他列屬性,采用K-means算法對服務(wù)數(shù)據(jù)進(jìn)行聚類分析,本文采用SPSS軟件操作,獲得如表4所列的聚類結(jié)果.
表4 最終聚類中心
根據(jù)聚類分析結(jié)果,對客戶群1(其余各群類似處理)再次運(yùn)用Rosetta進(jìn)行屬性約簡,并計算各個客戶群特征對服務(wù)決策屬性的隸屬度,刪除客戶群特征對服務(wù)決策屬性隸屬度小于0.5的特征獲取核心屬性,核心屬性及其隸屬度見表5.
表5 客戶群特征核心屬性及隸屬度
根據(jù)表5所列,對于客戶群更換剎車片服務(wù)決策的核心屬性及隸屬度分別為駕齡(0.76)、月平均里程(0.90)、平均車速(0.86)、道路環(huán)境(0.78)和保養(yǎng)意識(0.76)五個屬性特征.再利用Matlab軟件編程實(shí)現(xiàn)BP網(wǎng)絡(luò)訓(xùn)練算法,根據(jù)前面數(shù)據(jù)約簡的結(jié)果確定BP網(wǎng)絡(luò)結(jié)構(gòu)為5-7-1三層,將客戶服務(wù)記錄輸入神經(jīng)網(wǎng)絡(luò),以客戶特征為輸入,以服務(wù)為期望輸出,訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),可以得出客戶特征與服務(wù)項(xiàng)目的映射關(guān)系.此時整個收斂且穩(wěn)定的BP神經(jīng)網(wǎng)絡(luò)(包括其神經(jīng)網(wǎng)絡(luò)層數(shù)、各層神經(jīng)元個數(shù)、各層之間的權(quán)值和閾值)構(gòu)成核心條件屬性(駕齡、月平均里程、平均車速、道路環(huán)境和保養(yǎng)意識)與決策屬性(更換剎車片)之間的映射關(guān)系.
通過對模擬數(shù)據(jù)的約簡、BP網(wǎng)絡(luò)訓(xùn)練發(fā)現(xiàn),改進(jìn)之前的收斂速度明顯低于改進(jìn)之后的網(wǎng)絡(luò).在訓(xùn)練次數(shù)同為100的情況下,改進(jìn)前的全局誤差為0.262 753,改進(jìn)后的全局誤差為0.001 136,改進(jìn)后的訓(xùn)練時間也縮短了0.1s左右.所以采用改進(jìn)后的BP網(wǎng)絡(luò)訓(xùn)練方式更能快速收斂,形成穩(wěn)定的BP網(wǎng)絡(luò).同理可以通過該模型訓(xùn)練得出其他各項(xiàng)汽車服務(wù)項(xiàng)目和對應(yīng)服務(wù)時間間隔的BP網(wǎng)絡(luò)結(jié)構(gòu),從而針對客戶群建立客戶特征與服務(wù)的映射關(guān)系.BP網(wǎng)絡(luò)改進(jìn)前后訓(xùn)練收斂對比圖見圖4.
圖4 BP網(wǎng)絡(luò)訓(xùn)練對比圖
同理,以客戶特征為輸入,以服務(wù)時間間隔為為輸出,可以得出對應(yīng)服務(wù)項(xiàng)目的服務(wù)時間映射關(guān)系,從而實(shí)現(xiàn)根據(jù)客戶特征預(yù)測客戶所需服務(wù)項(xiàng)目,以有的放矢地為客戶提供主動服務(wù),提高客戶服務(wù)質(zhì)量.
本文研究了運(yùn)用粗糙集改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法和結(jié)構(gòu),并采用分群分組的方式改進(jìn)BP網(wǎng)絡(luò)的訓(xùn)練方式,構(gòu)建新的BP神經(jīng)網(wǎng)絡(luò)模式.運(yùn)用該BP網(wǎng)絡(luò)結(jié)構(gòu),在分析客戶屬性、客戶行為屬性和環(huán)境屬性的基礎(chǔ)上,研究了客戶特征與服務(wù)間的映射模式.
但本文主要針對客戶群體而研究的群體特征與服務(wù)的映射模式,對于每個獨(dú)立的客戶而言,具有自己的個性特征,其個性特征對所需要的服務(wù)項(xiàng)目和時間有較大的影響.所以在之后研究中,將進(jìn)一步研究客戶個性特征與群體特征的差異,及其對服務(wù)內(nèi)容和時間的影響,以調(diào)節(jié)客戶特征與服務(wù)的映射關(guān)系.
[1]王 虎,喻 立.主動服務(wù)導(dǎo)向下的服務(wù)挖掘模型研究[J].武漢理工大學(xué)學(xué)報:信息與管理工程版,2010,32(2):284-288.
[2]李敏生,劉 斌.BP學(xué)習(xí)算法的改進(jìn)與應(yīng)用[J].北京理工大學(xué)學(xué)報,1999,19(6):721-726.
[3]徐春梅.BP算法改進(jìn)及在控制系統(tǒng)中應(yīng)用[J].計算機(jī)仿真,2010,27(2):188-191.
[4]何 明,馮博琴,馬兆豐,等.一種基于粗糙集的粗糙神經(jīng)網(wǎng)絡(luò)構(gòu)造方法[J].西安交通大學(xué)學(xué)報,2004,38(12):1240-1242.
[5]萬映紅,胡萬平,曹小鵬.基于粗糙神經(jīng)網(wǎng)絡(luò)的客戶消費(fèi)分類模型研究[J].管理工程學(xué)報,2011,25(2):142-148.
[6]葉玉玲.模糊粗糙神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與參數(shù)優(yōu)化[J].系統(tǒng)工程與電子技術(shù),2009,31(12):2989-2993.
[7]薛 鋒,孔 林.粗糙集神經(jīng)網(wǎng)絡(luò)系統(tǒng)在商業(yè)銀行貸款五級分類中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2008,28(1):40-45.
[8]THANGAVEL K,PETHALAKSHMI A.Dimensionality reduction based on rough set theory:A review[J].Applied Sost Computing,2009,9(1):1-12.
[9]MICHAEL C,KEN P,STAN L.Customer satisfaction analysis:identification of key-driver[J].European Journal of Operational Research,2004,154(3):819-827.
[10]李敏生,劉 斌.BP學(xué)習(xí)算法的改進(jìn)與應(yīng)用[J].北京理工大學(xué)學(xué)報,1999,19(6):721-726.
[11]張國翊,胡 錚.改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型及其穩(wěn)定性分析[J].中南大學(xué)學(xué)報:自然科學(xué)版,2011,42(1):115-124.