劉鵬程,孫林夫+,張常有
(1.西南交通大學 信息科學與技術學院,四川 成都 610031;2.中國科學院 軟件研究所,北京 100190)
汽車售后服務是一項非常繁雜的工程,售后服務業(yè)務經(jīng)營的優(yōu)劣不僅直接影響制造企業(yè)的利潤,還對品牌、客戶忠誠度等方面產(chǎn)生不同程度的影響,提供高水平售后維修服務的企業(yè),其市場銷售額往往處于上升趨勢,反之,則處于不利地位[1]。
合理提升售后服務網(wǎng)絡覆蓋面是制造企業(yè)提升售后維修服務水平的基礎支撐,擁有完善的售后服務網(wǎng)絡可以及時響應用戶的服務需求。而構(gòu)建覆蓋全國的售后維修服務網(wǎng)絡則需要投入大量資源,這勢必會導致制造企業(yè)減少對產(chǎn)品研發(fā)、制造等環(huán)節(jié)的資源投入,如此將影響制造企業(yè)核心業(yè)務的發(fā)展,且與當前企業(yè)歸核化[2]發(fā)展趨勢不符,因此多數(shù)汽車制造企業(yè)采取與其他企業(yè)合作經(jīng)營等策略來擴展服務網(wǎng)絡,如汽車制造企業(yè)通過與4S店、汽車維修服務商進行合作,提升售后服務網(wǎng)絡覆蓋面,雙方通過合作不僅為汽車制造企業(yè)節(jié)省了大量資源,還為服務商帶來了更多的利潤。
通過這種合作形成了以制造企業(yè)為核心,同時,通過與服務商群開展服務業(yè)務協(xié)同,為終端用戶提供售后服務的服務價值鏈(如圖1)。汽車服務價值鏈包括汽車制造企業(yè)、售后服務商群、終端用戶群在內(nèi)的價值節(jié)點及其間的服務業(yè)務活動,其中服務商群主要由4S店、加盟維修服務商等構(gòu)成,終端用戶群包括個人和企業(yè)用戶,服務價值鏈通過服務業(yè)務活動產(chǎn)生的物流、信息流,資金流實現(xiàn)價值流動。汽車制造企業(yè)對整條價值鏈進行管控,通過與售后服務商群開展服務業(yè)務協(xié)同,共同為終端用戶群提供售后服務,實現(xiàn)整條價值鏈的增值。
服務價值鏈中的服務業(yè)務活動主要包括兩種:①汽車制造企業(yè)與服務商群之間的服務業(yè)務協(xié)同活動;②服務商群與終端用戶群間的服務業(yè)務活動。服務商群是整條價值鏈中承上啟下的關鍵節(jié)點,制造企業(yè)通過與服務商群開展服務業(yè)務協(xié)同,向各地用戶提供售后服務資源,用戶可以直接從服務商處獲取售后服務資源,所有影響制造企業(yè)與服務商群進行業(yè)務協(xié)同的因素最終將影響終端的服務質(zhì)量,而服務商群的業(yè)務協(xié)同能力就是其中一個重要因素,服務商的業(yè)務協(xié)同能力不僅反映出服務商對核心服務業(yè)務的處理能力,還反映出服務商與制造企業(yè)協(xié)同處理服務業(yè)務的能力,因此該因素是制造企業(yè)對服務價值鏈管控和優(yōu)化的重點。而對服務商進行業(yè)務協(xié)同能力評價是汽車制造企業(yè)管控服務價值鏈和提升售后服務質(zhì)量的重要方法。
當前,對服務商評價的研究已經(jīng)取得了許多成果,主要集中于評價指標體系和評價方法兩個方面。其中:評價體系指對評價對象相關指標內(nèi)容的研究;評價方法主要包括基于賦權(quán)算法的評價方法和基于分類模型的評價算法。
(1)評價指標體系
選擇評價指標形成服務商評價指標體系是開展服務商評價的第一步,通過分析服務商評價指標體系相關研究,可以發(fā)現(xiàn)當前服務商評價指標主要涉及到對服務商與客戶端之間的服務活動進行評價,如文獻[3]構(gòu)建了汽車售后服務客戶滿意度評價指標,以開展汽車售后服務客戶滿意度評價;文獻[4]構(gòu)建了售后服務維修質(zhì)量評價體系,以開展對服務商整車維修質(zhì)量的評價;文獻[5]構(gòu)建了服務商服務能力評價指標體系開展對服務能力的評價;文獻[6-9]圍繞服務商服務質(zhì)量評價指標開展對服務商服務質(zhì)量的評價;文獻[2,10]構(gòu)建了綜合評價指標,開展對服務商服務質(zhì)量、服務能力和維修等多方面的評價。
(2)基于賦權(quán)算法的評價方法
基于賦權(quán)算法的評價方法主要依據(jù)服務商評價指標進行賦權(quán)計算,基于相關評價指標的權(quán)重計算評價結(jié)果。當前評價指標賦權(quán)算法可以歸為主觀賦權(quán)法、客觀賦權(quán)法和主客觀組合賦權(quán)法3種類型,3種賦權(quán)算法從不同層次進行賦權(quán)計算。
1)主觀賦權(quán)算法 主觀賦權(quán)算法依據(jù)人為主觀判斷對各評價指標間的重要程度進行賦權(quán),以實現(xiàn)目標對象量化評價,其中Delphi[2]和層次分析法(Analytic Hierarchy Process, AHP)[4,11-12]等算法是常用的主觀評價算法。Delphi算法側(cè)重于從全局考慮各個指標項間的相對權(quán)重關系,AHP算法側(cè)重于考慮不同層級指標之間的相對權(quán)重,多數(shù)研究以該算法為基礎開展進一步的研究。除直接使用AHP計算評價結(jié)果外,相關研究還將AHP算法與其他模型結(jié)合以優(yōu)化評價結(jié)果,如文獻[12]利用AHP算法結(jié)合服務質(zhì)量差距模型(也稱GAP模型)開展對轎車服務質(zhì)量評價的研究。
2)客觀賦權(quán)算法 客觀賦權(quán)算法是基于評價數(shù)據(jù)計算各指標項所包含的評價信息來確定權(quán)重的方法,其中Critic賦權(quán)算法[2,13]、主成分分析(Principal Component Analysis, PCA)賦權(quán)算法[14]和熵權(quán)法[2,6,8]為常用的客觀評價算法。Critic算法側(cè)重于考慮指標間的對比強度和沖突性。PCA賦權(quán)算法通過轉(zhuǎn)換成n(主成分個數(shù)參數(shù))個互相獨立的主成分后,利用特征向量計算權(quán)重,并不考慮指標間的關系。熵權(quán)法依據(jù)各指標項中包含信息量的多少來確定當前指標項權(quán)重,其在對服務商評價研究中有較多的應用,如文獻[6]基于評價指標收集問卷數(shù)據(jù),利用問卷數(shù)據(jù)和熵權(quán)法實現(xiàn)對汽車4S店售后服務質(zhì)量評價指標進行賦權(quán),找出影響服務質(zhì)量的原因。文獻[8]提出基于售后服務數(shù)據(jù)進行分析,利用熵權(quán)法結(jié)合逼近理想解排序 (Technique for Order Preference by Similarity to Ideal Solution, TOPSIS)算法實現(xiàn)對售后服務商的維修和保養(yǎng)業(yè)務的評價。
3)主客觀組合賦權(quán)算法 主客觀組合賦權(quán)算法是通過相關組合算法將主觀賦權(quán)算法所得權(quán)重和客觀賦權(quán)算法所得權(quán)重進行組合,形成新的評價權(quán)重,通過對主客觀權(quán)重進行特定組合,實現(xiàn)對多組權(quán)重信息的融合,同時兼顧主客觀賦權(quán)算法對評價的影響。文獻[2]提出一種三階段主客觀公平權(quán)重評價算法,組合利用主觀和客觀賦權(quán)算法,設計了一種公平權(quán)重算法,以權(quán)重差異度最小化為目標函數(shù)確定組合權(quán)重。文獻[13]利用AHP等3種主觀賦權(quán)算法與熵權(quán)法和Critic等3種客觀賦權(quán)算法進行組合,實現(xiàn)對評價指標的定權(quán),通過計算3種主觀賦權(quán)和3種客觀賦權(quán)的算術平均值后,計算兩組平均值的幾何均數(shù)作為最后的組合權(quán)重進行評價。文獻[15]提出通過建立以主客觀權(quán)重貢獻趨于均衡為優(yōu)化目標的平衡模型,通過利用平衡系數(shù)來替代經(jīng)驗因子進行主客觀權(quán)重的組合。文獻[16]提出一種混合AHP算法和客觀賦權(quán)數(shù)據(jù)包絡分析法(Data Envelopment Analysis, DEA)的評價方法,利用AHP確定各個指標的主觀權(quán)重,利用DEA評價方法計算評價得分,最后通過TOPSIS算法組合AHP和DEA的結(jié)構(gòu)得出最后評價結(jié)果。
(3)基于分類模型的評價方法
服務商評價問題本質(zhì)上是一類分類問題,該問題是基于不同的指標數(shù)據(jù)將不同的服務商劃分到預定類別中。因為機器學習技術可以實現(xiàn)較好的分類效果,所以一些機器學習分類模型被應用到評價任務中。
1)基于監(jiān)督學習分類模型的評價方法 基于監(jiān)督學習的分類模型從已評價數(shù)據(jù)中學習評價知識構(gòu)建分類模型,訓練完成的分類器模型可以直接對未知對象進行評價,如文獻[17]提出利用相關向量機模型實現(xiàn)對服務商維修服務質(zhì)量的評價,文獻[18]利用決策樹算法實現(xiàn)對目標的評價,文獻[19]提出利用改進支持向量機對目標進行等級分類從而實現(xiàn)對目標的評價。
2)基于非監(jiān)督學習分類模型的評價方法 利用非監(jiān)督學習分類模型不需要已知評價結(jié)果,而是基于對評價數(shù)據(jù)本身進行計算形成分類結(jié)果,但這種分類結(jié)果是一種不明確的評價結(jié)果,因此基于非監(jiān)督學習評價方法常與賦權(quán)算法相結(jié)合形成評價模型,如文獻[4,20]利用AHP算法結(jié)合聚類算法,通過分類實現(xiàn)目標評價。
2.2.1 服務商評價指標問題分析
多數(shù)文獻構(gòu)建的評價體系均以服務商維修質(zhì)量、服務質(zhì)量和服務能力為主,重點關注于服務終端與客戶之間的活動,而忽略了服務價值鏈中服務商與制造企業(yè)的業(yè)務協(xié)同活動,缺少面向汽車制造企業(yè)的服務商業(yè)務評價指標,尤其是汽車制造企業(yè)所關注的三包期內(nèi)索賠、保養(yǎng)、救援等核心售后服務業(yè)務,多數(shù)文獻中均沒有涉及。文獻[2,10]構(gòu)建的評價指標體系中涉及了汽車制造企業(yè)所關注的相關服務業(yè)務指標,但該類評價指標體系存在層次劃分不夠清晰、重復冗余指標、缺失部分重要業(yè)務指標等問題。如文獻[2]關注服務商的業(yè)務效率但卻忽視了服務商的業(yè)務量,文獻[10]缺少對服務業(yè)務真實性評價指標等。
2.2.2 服務商評價算法問題分析
利用指標賦權(quán)算法進行評價是常用的方法,而利用主客觀賦權(quán)算法進行組合賦權(quán)為其中的研究重點,此外基于機器學習的分類算法也成為評價問題的研究內(nèi)容,下面將對這兩大類方法在評價中的應用展開具體分析。
(1)主客觀組合賦權(quán)評價算法分析
主客觀組合賦權(quán)的目的在于將客觀數(shù)據(jù)規(guī)律與主觀人為經(jīng)驗判斷進行融合,在一定程度上緩解數(shù)據(jù)偏差或主觀偏好引起的賦權(quán)偏差,所以當前研究多集中于主客觀組合賦權(quán),而不只考慮一種賦權(quán)方法,從模型結(jié)構(gòu)角度出發(fā)主客觀組合賦權(quán)可以分為單層主客觀權(quán)重組合評價模型和雙層主客觀權(quán)重組合評價模型。
1)單層主客觀權(quán)重組合評價模型。單層指該類模型僅進行一次主客觀權(quán)重組合,即直接將單個主觀賦權(quán)算法與單個客觀賦權(quán)算法進行組合,如圖2所示為該模型的主要結(jié)構(gòu),利用主觀賦權(quán)算法和客觀賦權(quán)算法分別求解主觀權(quán)重和客觀權(quán)重,而后通過主客觀組合權(quán)重實現(xiàn)對指標數(shù)據(jù)的評價。如文獻[15]利用層次分析法作為主觀賦權(quán)算法、變異系數(shù)法作為客觀賦權(quán)算法,利用權(quán)重平衡模型對主客觀權(quán)重進行組合賦權(quán);文獻[21]利用層次分析法作為主觀賦權(quán)算法、通過粗糙集確定各個指標客觀權(quán)重,再將權(quán)重結(jié)合起來對目標進行評價;文獻[22]利用層次分析法作為主觀賦權(quán)算法、主成分分析法作為客觀賦權(quán)算法實現(xiàn)組合賦權(quán)。
2)雙層主客觀權(quán)重組合評價模型。雙層模型主要包括兩個層次,如圖3所示,由第一層的主觀權(quán)重組合和客觀權(quán)重組合及第二層的主客觀權(quán)重組合構(gòu)成。雙層模型較單層模型增加了主觀權(quán)重組合和客觀權(quán)重組合,利用第一層主觀和客觀部分的組合權(quán)重結(jié)果作為第二層的權(quán)重輸入,由第二層實現(xiàn)主客觀權(quán)重的組合。
文獻[2]在第一層的主觀組合維度中分別利用Delphi法和AHP兩種算法,客觀組合維度部分分別利用熵權(quán)法和Critic法兩種算法,在第一和第二層中均利用最小化權(quán)重差異程度的目標函數(shù)實現(xiàn)權(quán)重的組合。文獻[13]在第一層中主觀組合維度部分分別利用對比排序法法、AHP和專家直接評分法3種算法,客觀組合維度部分分別利用標準離差法、熵權(quán)法和Critic法3種算法,并分別利用算法平均數(shù)和幾何平均數(shù)作為各層的權(quán)重組合值。
雖然主客觀權(quán)重組合可以同時融合主觀與客觀兩個維度的信息,但利用單層和雙層主客觀權(quán)重組合評價模型進行權(quán)重組合的方法卻存在以下不足:首先,對主觀權(quán)重和客觀權(quán)重進行組合時,權(quán)重相乘法和最優(yōu)化模型法等算法并不能實現(xiàn)主客觀權(quán)重之間的權(quán)衡,經(jīng)驗因子法會增大主觀意愿的影響等[15]。這些組合算法存在的不足將導致最終的組合權(quán)重偏向于主觀或客觀權(quán)重的一方,不能實現(xiàn)組合權(quán)重進行均衡融合的目的;其次,單層的主客觀權(quán)重組合評價模型僅應用單一的主觀或客觀賦權(quán)算法,較雙層模型而言其組合后的權(quán)重受賦權(quán)算法本身偏差的影響較大。
(2)基于分類模型的評價模型分析
基于分類模型進行評價已經(jīng)成為一種重要的評價方法,但將分類模型應用于評價問題時需要解決訓練數(shù)據(jù)集的標注和提升模型泛化性兩個問題:
1)訓練數(shù)據(jù)集標注。通過對文獻的分析可以發(fā)現(xiàn),分類模型使用的訓練數(shù)據(jù)來源于專家標注和基于賦權(quán)算法計算所得的評價結(jié)果,利用專家標注進行模型訓練易受標注專家主觀偏好影響,利用賦權(quán)算法的計算結(jié)果訓練模型存在同樣的問題,由此引起的訓練數(shù)據(jù)偏差將導致分類模型的分類偏差。
2)提升分類模型的泛化性。模型從訓練數(shù)據(jù)集中學習數(shù)據(jù)規(guī)律,挖掘分類知識,但評價數(shù)據(jù)會隨時間發(fā)生變化造成基于有限數(shù)據(jù)學習的知識成為一種近似知識,因此使用當前訓練數(shù)據(jù)集進行知識挖掘存在不穩(wěn)定性,而通過提升分類模型的泛化性可以緩解這類問題。
設計科學、合理、可靠的評價指標體系是進行服務商業(yè)務協(xié)同能力評價的基礎,本文主要考慮面向汽車制造企業(yè)構(gòu)建服務商業(yè)務協(xié)同能力評價指標,實現(xiàn)制造企業(yè)對售后服務業(yè)務管控和優(yōu)化的目的,該指標體系內(nèi)容主要涵蓋以下兩個方面:
(1)服務業(yè)務協(xié)同能力評價指標
從汽車制造企業(yè)對服務商業(yè)務活動管控的實際需求出發(fā),針對保養(yǎng)、索賠、外出救援、重大質(zhì)量問題等三包期內(nèi)售后服務業(yè)務進行分析得出關鍵指標類別,如表1所示。
表1 服務業(yè)務協(xié)同能力評價指標類別說明
續(xù)表1
(2)維修業(yè)務評價指標
針對服務商維修質(zhì)量,設計維修合格率和配件滿足率兩個指標,其中維修合格率指標反映服務商維修質(zhì)量的合格率,配件滿足率指標反映該服務商能否用原廠配件及時響應客戶的維修需求,不會因為缺件導致客戶維修受阻。通過這兩個指標反映服務商能否高效保質(zhì)地響應客戶維修需求。
在文獻研究、企業(yè)調(diào)研及專家咨詢的基礎上,從以上兩方面出發(fā),本文提出了服務商業(yè)務協(xié)同能力評價指標體系,該指標體系分為目標層、一級指標層和二級指標層,如圖4所示。
定義1A表示目標層,Bi表示一級指標層中第i個指標,Cij表示第i個一級指標下的第j個二級指標。
主客觀權(quán)重組合的目的是通過主觀與客觀的融合實現(xiàn)兩種權(quán)重的相互約束,形成一種均衡的權(quán)重,但由于當前組合算法存在的不足,導致組合后的權(quán)重會偏向主觀或客觀權(quán)重,因此針對單層和雙層評價模型中主客觀權(quán)重組合存在的不足,引入融合組合賦權(quán)與嵌套集成分類器的服務商評價模型,從兩個階段完成對目標的精確評價,其兩階段的總體架構(gòu)如圖5所示。
(1)第一階段。本階段不通過權(quán)重組合這種更為微觀的方式進行主客觀融合,而是從更為宏觀的評價結(jié)果層面進行融合,通過一種更為松弛的約束方式實現(xiàn)對目標的初始評價及部分客觀數(shù)據(jù)的精確標注,完成對服務商的初始評價。
通過雙層主客觀權(quán)重組合評價模型中第一層取得主觀組合權(quán)重和客觀組合權(quán)重,但并不進入第二層進行主客觀權(quán)重組合計算,而是通過評價指標數(shù)據(jù)進行評價結(jié)果計算,對評價結(jié)果進行集合運算取得確定性的相同評價結(jié)果(交集部分)和不確定性的相異評價結(jié)果(對稱差集部分)形成初始評價結(jié)果,此時處于相同評價結(jié)果集中的評價指標數(shù)據(jù)規(guī)律與人為主觀認識基本一致,即交集中評價結(jié)果所對應的數(shù)據(jù)是融合了人為經(jīng)驗和客觀數(shù)據(jù)規(guī)律的共性知識,而相異評價結(jié)果則表示評價數(shù)據(jù)與主觀認識之間存在偏差。
(2)第二階段?;诘谝浑A段形成的確定性的評價結(jié)果(交集部分)形成標注數(shù)據(jù),將泛化性能更高的集成分類模型融入該階段,通過集成分類模型對標注數(shù)據(jù)的學習形成融合人為經(jīng)驗和客觀數(shù)據(jù)規(guī)律的共性知識,利用其對第一階段中不確定性評價結(jié)果(對稱差集部分)進行精確評價,實現(xiàn)對服務商的評價。
以相同評價結(jié)果(交集)形成的標注數(shù)據(jù)構(gòu)建第二階段的嵌套集成分類器,本文提出的嵌套集成分類器在深度和廣度兩個維度同時擴展實現(xiàn)集成,融入更為多樣性的基分類器以提升集成分類器的泛化性。同時將存在相異評價結(jié)果所對應的評價數(shù)據(jù)作為第二階段的待評價數(shù)據(jù)。利用融合主客觀知識和較強泛化性能的嵌套集成分類器對相異評價數(shù)據(jù)進行分類,權(quán)衡偏差評價,實現(xiàn)精確評價。
本文提出嶺回歸的集成分類決策算法對嵌套集成分類器的基分類決策進行集成,通過賦予高性能基分類器的分類結(jié)果以較大權(quán)重來提升嵌套集成分類器的性能,實現(xiàn)對嵌套集成分類器的分類決策集成。
依據(jù)最大熵原理,在給定約束下選擇不確定性最大的概率分布為權(quán)向量的系數(shù),建立如下最大化模型:
(1)
式中m種權(quán)重計算算法會產(chǎn)生m種不同的隨機權(quán)向量,組合權(quán)重值與這m種隨機權(quán)向量越近似,則組合權(quán)重值越接近真實權(quán)重值,文獻[23]利用相對熵來度量組合權(quán)重值與這m種隨機權(quán)向量的符合程度(離散分布相對熵計算如定義5所示),當進行組合權(quán)重計算時,若m種權(quán)重計算算法所產(chǎn)生的m種不同的隨機權(quán)向量有最優(yōu)一致性,利用最小化組合權(quán)重和m種不同隨機權(quán)向量的相對熵實現(xiàn)。
(2)
將式(1)和式(2)兩個目標函數(shù)轉(zhuǎn)化為單目標優(yōu)化函數(shù):
(3)
由于此時兩組評價值處于不同的度量空間,導致兩組結(jié)果不能直接進行比較,通過對兩組評價結(jié)果進行分級劃分,統(tǒng)一度量評價結(jié)果,結(jié)合汽車制造企業(yè)的需求及評價數(shù)據(jù)規(guī)律,對評價結(jié)果進行分級劃分。在文獻[6,11,17]通過主觀設置分段值的方式對服務商等級劃分存在一定的主觀偏差,文獻[4]運用系統(tǒng)聚類方法并結(jié)合定量評分結(jié)果計算售后服務質(zhì)量等級,但系統(tǒng)聚類的聚類個數(shù)仍是主觀設置,并未兼顧考慮評價數(shù)據(jù)本身的特性?;贙-means結(jié)合輪廓系數(shù)探索評價數(shù)據(jù)是一種自動確定聚類數(shù)目的有效方法,如文獻[24]中利用輪廓系數(shù)改進K均值聚類算法(K-means)為神經(jīng)網(wǎng)絡反向傳播算法(Back Propagation, BP)構(gòu)造分類數(shù)據(jù)集,有效提升了BP算法的計算精度。因此,本文基于輪廓系數(shù)和K-means算法(簡稱SC-KC算法)來確定服務商業(yè)務協(xié)同能力評價結(jié)果的分級數(shù)目,實現(xiàn)對服務商業(yè)務協(xié)同能力等級劃分完成一階段初始評價,其流程如圖6所示,主要步驟如下:
步驟4基于輪廓系數(shù)和K-means算法對服務商業(yè)務協(xié)同能力的主觀評價結(jié)果和客觀評價結(jié)果進行等級劃分,將主觀評價結(jié)果和客觀評價結(jié)果劃分到統(tǒng)一的CN個等級的度量空間內(nèi),對分級后的兩組評價結(jié)果進行集合運算,所得交集為主客觀相同分級評價結(jié)果,對稱差集為相異評價結(jié)果,兩集合構(gòu)成服務商初始評價結(jié)果。
集成分類器通過將多個基分類器的分類結(jié)果按照一定規(guī)則進行集成,形成最終分類結(jié)果,將互補且精確的基分類器進行集成分類,其分類性能將優(yōu)于單個基分類器性能[25]。目前,集成分類器在諸多領域[26-30]得到有效應用,但較少應用于服務商評價,本文通過融合組合權(quán)重算法對集成分類器在評價問題的應用展開研究。
集成分類器有較好的泛化性和抗噪性,在泛化性方面,多個多樣性的基分類器(分類正確率>50%)集成為強分類器實現(xiàn)降低分類器過擬合的目的;在抗噪性方面,通過對多個分類器進行集成可以降低分類器的方差和分類結(jié)果對分類器性能的擾動,從而提升分類器抗噪性[31]。此外,集成分類器在針對不平衡數(shù)據(jù)分類的研究方面取得了極大關注,它通過從數(shù)據(jù)集、數(shù)據(jù)特征和算法角度構(gòu)建包含多樣性基分類器的集成分類器提升對不平衡數(shù)據(jù)分類的正確率。
4.2.1 構(gòu)建基于特征選擇的基分類器
基分類器是構(gòu)成集成分類器的基本單元,基分類器的多樣化是影響集成分類器泛化性能的重要因素[25],基于特征選擇產(chǎn)生特征子集是構(gòu)建多樣化基分類器的重要方法[32],特征選擇是基于某種選擇準則,從數(shù)據(jù)特征集中選擇最小特征子集的方法,通過特征選擇可以提升分類器的分類性能[33]。按照選擇準則是否與分類器相關,特征選擇方法分為過濾式、封裝式和嵌入式[32-34],本文運用封裝式方法進行特征選擇,通過與分類器結(jié)合及以分類正確率等指標為準則,選擇出分類正確率較高的特征子集。
特征子集的選擇一般被視為多目標優(yōu)化問題,多目標優(yōu)化問題的一般描述為[35]:
miny=F(x)=(f1(x),f2(x),…,fm(x))T,
s.t.
gi(x)≤0,i=1,2,…,q,
hj(x)=0,j=1,2,…,p。
(4)
其中:x=[x1,x2,…,xn]∈X,X?Rn為n維決策向量,X為n維決策空間,y=[y1,y2,…,ym]∈Y?Rn為m維目標空間,gi(x)≤0定義了q個不等式約束,hi(x)≤0定義了p個等式約束。
近年來,基于多目標的進化算法被應用于特征子集的選擇中,其中帶精英策略的快速非支配排序遺傳算法(fast elitist Nondominated Sorting Genetic Algorithm, NSGAⅡ)[36]作為一種典型的多目標的進化算法被大量應用到此任務中,通過NSGAⅡ算法求得一組非支配解作為各基分類器的訓練數(shù)據(jù)特征,以訓練多樣化的基分類器提升分類器的泛化能力。如文獻[37]利用NSGAⅡ算法同時優(yōu)化3個度量目標,對不平衡數(shù)據(jù)進行特征選擇,文獻[38]利用改進NSGAⅡ算法選擇多種大小不同的局部特征子集實現(xiàn)對全局非支配特征子集的選擇等都對改善分類器性能起到了積極作用。本文基于封裝式特征選擇方法結(jié)合NSGAⅡ算法,設定最小化分類性能指標f1和特征數(shù)目f2兩個目標函數(shù)為適應度函數(shù)構(gòu)建特征子集。
miny=
(5)
4.2.2 構(gòu)建嵌套集成分類器
本文設計了一種嵌套集成分類器模型,該模型分為內(nèi)外兩層次,內(nèi)層包含多組多樣化的基分類器,基于該層基分類器通過逐層有效地集成分類決策形成嵌套集成分類器,下面將從模型結(jié)構(gòu)和分類決策集成兩個方面進行說明。
(1)嵌套集成分離器結(jié)構(gòu)
嵌套集成分類器是一種集成分類器,當前典型的集成分類器框架主要包括Boosting、Bagging和Stacking三類。其中:Boosting串行生成一組互相依賴的基分類器,關注于通過提升基分類器的正確率實現(xiàn)提升集成分類性能目的,如Adaboost、梯度提升樹算法;Bagging并行生成一組相對獨立的基分類器,關注于通過提升基分類器的多樣性來達到提升集成分類性能的目的[20],如隨機森林算法;Stacking通過訓練元模型將一組基分類器的分類結(jié)果進行組合實現(xiàn)集成多個基分類器的分類。
嵌套集成分類器的結(jié)構(gòu)如圖7所示,通過在內(nèi)層構(gòu)造多組多樣化的子集成分類器形成外層集成分類器的基分類器,再經(jīng)外層的集成分類器進行分類決策的集成,進而實現(xiàn)多組基分類器在廣度上的分類組合,在深度上的分類決策集成,實現(xiàn)兩個維度的同時延伸。嵌套集成分類器較Bagging和Stacking算法不僅實現(xiàn)了對多樣性基分類器的集成,還對模型深度進行擴展,實現(xiàn)對更高層維度數(shù)據(jù)特征的提取,通過廣度擴展增加了基分類器的多樣性,保證了集成分類器的泛化能力,深度擴展提升了模型對數(shù)據(jù)特征的提取能力,從這兩個維度提升了分類性能。
(2)基于嶺回歸的分類決策集成算法
基分類器的分類決策集成性能將影響集成分類器的性能,文獻[39-41]研究了5種常用集成分類決策算法,通過對各個基分類器的分類結(jié)果進行取最大值、投票和求和等方法進行集成,但這些算法未能對各集成分類器結(jié)果進行差異化區(qū)分以識別出高性能分類器的分類結(jié)果。本文通過基于嶺回歸的分類決策集成算法對重要分類結(jié)果特征進行識別,并賦予高性能分類器的結(jié)果以較高權(quán)重以提升嵌套集成分類的分類性能。
定義7設數(shù)據(jù)集D中各樣本對應類分布為P=[p1,p2,…,pn]T,其中pi=[p(i,1),p(i,2),…,p(i,m)]T為某樣本xi對應的類分布,Pl=[p(1,l),p(2,l),…,p(n,l)]T為數(shù)據(jù)集D中樣本對應類l的分布。
運用嶺回歸計算子集成分類器中各基分類器的預測類分布與真實類分布的誤差,利用權(quán)重解析解計算各分類器的類分布預測權(quán)重,設子集成分類器ec對l類的分類決策目標函數(shù)為:
(6)
其解析解為:
(7)
其中式(7)為k個基分類器對l類的分類決策權(quán)重向量。嵌套集成分類器的外層分類決策集成與子集成分類器的集成算法相同,將多個子集成分類器視為嵌套集成分類器的基分類器,運用式(7)計算外層嵌套集成分類器的分類決策集成權(quán)重。
(3)嵌套集成分類器構(gòu)建流程
嵌套集成分類器的構(gòu)建包括訓練和測試兩個階段,訓練階段主要包括:訓練數(shù)據(jù)集分割、特征選擇、各內(nèi)層子集成分類器訓練、集成分類決策4個步驟,其中集成分類決策又包括內(nèi)層子集成分類器的集成決策和外層集成分類器的集成決策;測試階段主要包括:測試數(shù)據(jù)集分割、各內(nèi)層子集成分類器測試數(shù)據(jù)的生成、測試各內(nèi)層子集成分類器及集成分類決策、測試嵌套集成分類器及集成分類決策4個步驟,其構(gòu)建詳細流程如圖8所示。
本文以汽車產(chǎn)業(yè)鏈云服務平臺[42]上CQ汽車制造企業(yè)及其與之進行服務業(yè)務協(xié)同的300多家服務商的服務業(yè)務數(shù)據(jù)為基礎,對服務商業(yè)務協(xié)同能力評價模型進行實驗驗證。
汽車產(chǎn)業(yè)鏈云服務平臺支撐CQ與其服務商開展售后服務業(yè)務協(xié)同,累積了多年服務業(yè)務數(shù)據(jù),包括售后保養(yǎng)數(shù)據(jù)、售后索賠數(shù)據(jù)、售后配件數(shù)據(jù)、售后舊件數(shù)據(jù)等。基于對服務商業(yè)務協(xié)同評價指標研究,從平臺服務業(yè)務數(shù)據(jù)庫中抽取所需評價數(shù)據(jù),通過數(shù)據(jù)預處理構(gòu)建服務數(shù)據(jù)集作為評價數(shù)據(jù)源,預處理后形成服務業(yè)務數(shù)據(jù)集,其部分數(shù)據(jù)集如表2所示。
表2 服務業(yè)務數(shù)據(jù)集
5.2.1 主觀組合權(quán)重計算
本實驗利用Delphi算法、AHP算法作為主觀組合賦權(quán)的基礎算法。
(1)Delphi算法計算評價指標權(quán)重
選擇多位來自汽車制造企業(yè)服務部門和服務管理專家對服務商業(yè)務協(xié)同能力評價指標項的全局相對重要性進行評分,單指標項評分值越高,其相應權(quán)重值就越高,對各個專家的評分結(jié)果進行匯總,計算出各專家的評分結(jié)果得出各評價指標項的權(quán)重,如表3所示。
表3 Delphi算法評價指標權(quán)重值
(2)AHP算法計算評價指標權(quán)重
AHP算法權(quán)重計算依然基于專家的知識對各個指標項權(quán)重進行計算,具體步驟如下所示。
步驟1建立服務商業(yè)務協(xié)同能力評價層次模型,將服務商協(xié)同能力評價指標中各項指標劃分為相互聯(lián)系的有序?qū)哟?,形成一級和二級指標體系(如表4),其中各個指標均為正向指標。
表4 服務商業(yè)務協(xié)同能力評價層次模型
步驟2采用1~9標度,依據(jù)各指標間的相對重要程度,計算指標體系中的一級指標權(quán)重,權(quán)重值如表5所示。
表5 AHP服務商業(yè)務協(xié)同能力評價層次模型一級指標權(quán)重
步驟3在各一級指標下,基于各二級指標間的相對重要程度,計算一級/二級指標權(quán)重,權(quán)重值如表6所示。
表6 AHP服務商業(yè)務協(xié)同能力評價層次模型一級/二級指標權(quán)重
步驟4基于步驟2和步驟3中所計算的各個指標權(quán)重計算出最終各二級指標的權(quán)重,形成的評價指標權(quán)重值如表7所示。
表7 AHP算法評價指標權(quán)重值
(3)主觀組合權(quán)重計算
基于Delphi和AHP計算主觀指標權(quán)重,利用式(3)中的目標函數(shù)計算主觀組合權(quán)重,所得主觀組合權(quán)重數(shù)值如表8所示,所得兩種主觀權(quán)重與主觀組合權(quán)重對比如圖9所示。
表8 主觀評價組合權(quán)重值
5.2.2 客觀組合權(quán)重計算
本實驗利用Critic算法、PCA賦權(quán)算法和熵權(quán)法作為客觀組合賦權(quán)的基礎算法。
(1)Critic算法計算評價指標權(quán)重
基于服務商業(yè)務協(xié)同能力評價指標相關性來確定屬性權(quán)重,分析指標數(shù)據(jù)間的對比強度和沖突性,基于此求得各個評價指標的權(quán)重,權(quán)重值如表9所示。
表9 Critic算法評價指標權(quán)重值
(2)PCA賦權(quán)算法計算評價指標權(quán)重
通過線性變換消除服務商業(yè)務協(xié)同能力各指標項間的信息冗余問題,將原指標變量經(jīng)過PCA變換后形成n(主成分個數(shù)參數(shù))個互相獨立的主成分,進而計算服務商業(yè)務協(xié)同能力評價權(quán)重,權(quán)重值如表10所示。
表10 PCA算法評價指標權(quán)重值
(3)熵權(quán)法計算評價指標權(quán)重
針對服務商業(yè)務協(xié)同能力的各項評價指標,計算某項指標對于評價對象的特征比重和熵值,形成評價指標的熵權(quán),求得各個評價指標的權(quán)重,權(quán)重值如表11所示。
表11 熵權(quán)法算法評價指標權(quán)重值
(4)客觀組合權(quán)重計算
基于Critic賦權(quán)算法、PCA賦權(quán)算法和熵權(quán)法計算客觀指標權(quán)重,利用式(3)中的目標函數(shù)計算客觀組合權(quán)重,所得客觀組合權(quán)重數(shù)值如表12所示,所得3種客觀權(quán)重與客觀組合權(quán)重對比如圖10所示。
表12 客觀組合權(quán)重評價指標權(quán)重值
5.2.3 評價結(jié)果等級劃分
基于主觀組合權(quán)重和客觀組合權(quán)重對服務業(yè)務數(shù)據(jù)集中各個服務商業(yè)務協(xié)同指標數(shù)據(jù)進行計算可以得到主觀、客觀兩組評價結(jié)果,從圖11中可以分析出主觀組合權(quán)重與客觀組合權(quán)重在某些具體指標值權(quán)重上存在較大差異,兩組權(quán)重的差異性將導致評價結(jié)果的差異,通過對評價結(jié)果進行等級劃分在統(tǒng)一的度量空間下對主觀及客觀組合權(quán)重的評價結(jié)果進行融合,該融合過程包括以下兩步:
步驟1基于主觀組合權(quán)重和客觀組合權(quán)重計算出主觀和客觀兩組評價結(jié)果(如圖12),通過分析可以發(fā)現(xiàn),主觀組合權(quán)重計算的評價結(jié)果值總體大于主觀組合權(quán)重評價結(jié)果,但主觀組合權(quán)重與客觀組合權(quán)重評價結(jié)果的相對趨勢有較高重合度。
步驟2基于K-Means算法和輪廓系數(shù)對步驟1中所得主觀組合權(quán)重與客觀組合權(quán)重評價結(jié)果進行等級劃分,不同聚類個數(shù)代表著不同的分類等級,如當聚類個數(shù)為n時,意味著將評價結(jié)果劃分為n個等級,依據(jù)各個聚簇中心值大小確定等級順序。如圖13是不同聚類個數(shù)下主觀組合權(quán)重與客觀組合權(quán)重評價結(jié)果的分級輪廓系數(shù)值,對于主觀評價結(jié)果其輪廓系數(shù)在聚類個數(shù)為2和3時數(shù)值較大,對于客觀評價結(jié)果其輪廓系數(shù)在聚類個數(shù)為3和4時輪廓較大,結(jié)合制造企業(yè)對評價等級劃分的需求,將評價等級定為3個等級。
將由權(quán)重計算所得的評價結(jié)果數(shù)據(jù)依據(jù)其數(shù)值的相對大小映射到A級、B級和C級3個等級空間中,其中A級為最高等級,B級為中間等級,C級為最低等級,從分類結(jié)果中隨機抽取150家服務商進行分析,如圖14所示。分析發(fā)現(xiàn),主客觀組合權(quán)重兩種算法對多數(shù)企業(yè)具有相同的評價結(jié)果,但存在一定數(shù)量的相異評價結(jié)果,這些相異評價結(jié)果將在第二階段中進行精確分類。
選擇K最近鄰算法(K-Nearest Neighbor,KNN)、支持向量機算法(Support Vector Machine,SVM)和邏輯斯特回歸算法(Logistic Regression,LR)三種常用分類算法分別作為內(nèi)層子集成分類器的基分類器,構(gòu)建ne1、ne2、ne3三個內(nèi)層子集成分類器,分別運用嶺回歸集成分類決策算法集成各組基分類器的分類結(jié)果形成內(nèi)層分類決策。利用ne1、ne2、ne3組成外層集成分類器構(gòu)建嵌套分類器ne,運用嶺回歸集成分類決策算法集成ne1、ne2、ne3分類結(jié)果形成嵌套集成分類的最終分類結(jié)果。
5.3.1 算法測試數(shù)據(jù)集
由于服務商業(yè)務協(xié)同能力評價可視為多分類問題且服務商的優(yōu)秀等級和不合格等級占整體數(shù)量較少,導致數(shù)據(jù)存在一定程度的不平衡性,基于以上兩個特點,為檢測基于嶺回歸集成分類決策算法的嵌套集成分類器在此類型分類數(shù)據(jù)上的性能,實驗選取來自UCI Machine Learning Repository(UCI數(shù)據(jù)集)中10個以多分類和不平衡數(shù)據(jù)集為主的數(shù)據(jù)集(如表13)用于測試算法性能。
表13 算法性能對比測試所用實驗數(shù)據(jù)
5.3.2 算法性能測試分析
針對本文的多分類問題,在實驗部分利用所有類別中分類正確的樣本數(shù)占總樣本數(shù)的百分比來計算正確率,通過計算各類F1值的平均值作為分類的F1值,其中F1值為精準率和召回率的調(diào)和平均數(shù)是對精準率和召回率的綜合考慮。
對基于嶺回歸集成分類決策算法的嵌套集成分類器(簡稱RREC)進行性能測試(測試結(jié)果如表14所示),與當前主要集成分類算法(包括:梯度提升樹(Gradient Boosting Tree, GBT)、隨機森林(Random Forest, RF)、自適應增強算法(簡稱SAMME)、堆疊集成分類器(Stacking Classifier, SC))進行性能對比。針對每個測試數(shù)據(jù)集,各算法運行30次求出平均正確率和F1值展開對比。
表14 算法性能測試結(jié)果
通過對算法性能測試結(jié)果進行分析可以發(fā)現(xiàn)RREC算法的正確率和F1值較其他對比算法有最優(yōu)或較優(yōu)值,說明RREC算法在正確率(Acc)和F1值指標度量下可以取得整體優(yōu)勢,尤其在較少類別的不平衡數(shù)據(jù)集,如Balance、Soybean、Glass等數(shù)據(jù)集中。
RREC算法運用了嶺回歸集成分類決策算法計算最終的分類結(jié)果,如表15所示為5種常用的分類決策集成算法,將這5種常用算法作為嵌套集成分類器的集成分類決策算法與嶺回歸集成分類決策算法進行性能測試對比,測試指標為分類正確率和F1值。
表15 集成分類決策算法
針對每個測試數(shù)據(jù)集,各算法分別運行30次求出平均正確率和F1值并進行對比。實驗測試結(jié)果如表16所示,對算法性能測試結(jié)果進行分析可以發(fā)現(xiàn)在80%的測試數(shù)據(jù)集上,嶺回歸集成分類決策算法的正確率和F1值較其他集成分類決策算法取得了最優(yōu)值。
表16 集成分類決策算法測試結(jié)果
5.4.1 面向服務商業(yè)務協(xié)同能力評價的嵌套集成分類器構(gòu)建
利用主觀組合權(quán)重與客觀組合權(quán)重對服務商業(yè)務協(xié)同能力進行評價,形成初始評價后,利用相同評價結(jié)果所對應的評價指標數(shù)據(jù)集作為訓練和測試數(shù)據(jù)構(gòu)建嵌套集成分類器,構(gòu)建流程如圖8所示。利用訓練后的嵌套集成分類器對服務商業(yè)務協(xié)同能力評價進行測試,與梯度提升樹、隨機森林、Adaboost、堆疊集成分類器進行性能對比,表17展示了各算法的評價測試結(jié)果,通過對結(jié)果分析可以看出RREC算法較其他算法在Acc和F1值兩個指標上均取得了最優(yōu)值,這與表14中對UCI數(shù)據(jù)集的測試結(jié)果相吻合。
表17 服務商業(yè)務協(xié)同能力評價測試結(jié)果
5.4.2 嵌套集成分類器對服務商業(yè)務協(xié)同能力的精確評價
利用嵌套集成分類器對初始評價中相異評價結(jié)果進行精確評價是構(gòu)建嵌套集成分類器的目的,將不確定的相異評價結(jié)果集作為嵌套集成分類器的輸入實現(xiàn)對服務商業(yè)務協(xié)同能力的最終評價,如圖15所示為嵌套集成分類器的精確評價結(jié)果與主觀組合權(quán)重和客觀組合權(quán)重分級的部分服務商評價結(jié)果對比,經(jīng)過對比分析發(fā)現(xiàn),嵌套集成分類器與主觀組合權(quán)重或客觀組合權(quán)重的評價結(jié)果之一相匹配,沒有生成第3種評價結(jié)果,可以實現(xiàn)對不確定評價結(jié)果的精確評價。
服務商業(yè)務協(xié)同能力評價是制造企業(yè)進行服務價值鏈管控的重要手段,在服務價值鏈優(yōu)化方面發(fā)揮著重要作用。本文面向制造企業(yè)對服務價值鏈管控的實際需求,研究并設計了服務商業(yè)務協(xié)同能力評價指標體系,分析當前主客觀權(quán)重組合模型中存在的不足,提出了融合組合賦權(quán)與嵌套集成分類器的評價模型。
基于該模型通過初始-精確兩個階段完成對服務商業(yè)務協(xié)同能力的評價,在初始評價階段中,結(jié)合多種主客觀賦權(quán)算法模型,利用基于極大熵組合賦權(quán)算法實現(xiàn)對服務商業(yè)務協(xié)同能力的一階段初始評價。在精確評價階段中,針對一階段初始評價中的不確定性評價結(jié)果,構(gòu)建基于嶺回歸集成分類決策算法的嵌套集成分類器模型,嵌套集成分類器通過在廣度和深度兩個維度進行擴展,保證了分類器的泛化能力和特征提取能力,并利用嶺回歸集成分類決策算法實現(xiàn)對分類決策的集成,形成對服務商業(yè)務協(xié)同能力的精確評價結(jié)果。通過開展與同類模型的對比實驗,表明本文模型在服務商業(yè)務協(xié)同能力評價應用方面具有較為突出的性能。
目前,本文所提出的嵌套集成分類器訓練過程較為復雜,尤其在運用特征選擇算法構(gòu)建差異化訓練數(shù)據(jù)集的過程中,其時間復雜度仍然較高。如何實現(xiàn)模型在進行特征選擇過程的同時,完成多樣化基分類器的構(gòu)建以降低時間復雜度,進而提升模型訓練的整體速度將成為下一階段的研究重點。