趙富強(qiáng)
(天津財(cái)經(jīng)大學(xué),天津 300222)
帶缺失值的顧客滿意度指數(shù)的測(cè)評(píng)
趙富強(qiáng)
(天津財(cái)經(jīng)大學(xué),天津 300222)
文章通過(guò)對(duì)國(guó)內(nèi)外顧客滿意度指數(shù)模型的對(duì)比及我國(guó)的現(xiàn)狀分析,提出顧客滿意度指數(shù)測(cè)評(píng)的拓展模型,模型對(duì)感知質(zhì)量潛變量細(xì)化為感知產(chǎn)品質(zhì)量和感知服務(wù)質(zhì)量。在此基礎(chǔ)上對(duì)帶缺失值的顧客滿意度指數(shù)測(cè)評(píng)步驟進(jìn)行研究。針對(duì)該拓展模型,基于均值插補(bǔ)法,提出一種新的缺失值處理方法-分類均值插補(bǔ)法,該方法先對(duì)被調(diào)查對(duì)象問(wèn)卷中的滿意度字段按照分值進(jìn)行分類,然后對(duì)同類中的缺失值用該類的平均值替代。
顧客滿意度;PLS算法;缺失值;均值插補(bǔ)
瑞典、美國(guó)、歐洲、挪威等國(guó)家相應(yīng)建立了自己的顧客滿意度指數(shù)測(cè)評(píng)模型最具代表性為SCSB、ACSI和ECSI[1]。國(guó)內(nèi)對(duì)指數(shù)模型的研究起步較晚,雖然也提出了幾種顧客滿意度指數(shù)模型,但未考慮不同行業(yè)應(yīng)用不同的測(cè)評(píng)模型,未能對(duì)模型中的潛變量感知質(zhì)量進(jìn)行細(xì)化;同時(shí),在進(jìn)行顧客滿意度調(diào)查時(shí),研究人員得到的實(shí)際數(shù)據(jù)往往存在丟失的問(wèn)題,很少有學(xué)者考慮對(duì)缺失值進(jìn)行處理。缺失值表現(xiàn)為三種方式[2,3]:?jiǎn)巫兞咳笔?、單調(diào)缺失型和任意缺失型。缺失值的處理方法主要包括刪除法、插補(bǔ)法和最大似然估計(jì)法[4]等。在文獻(xiàn)[5]中,Lohm?ller’s PLSX對(duì)缺失值的處理采用了刪除法和均值插補(bǔ)法。不同的缺失值處理方法各自的優(yōu)缺點(diǎn)和適用范圍,哪種方法適合顧客滿意度指數(shù)測(cè)評(píng)模型也值得深入研究。
顧客滿意度指數(shù)測(cè)評(píng)拓展模型中包括七個(gè)潛變量:顧客期望、感知質(zhì)量、感知價(jià)值、顧客滿意度、顧客抱怨、顧客忠誠(chéng)和企業(yè)形象。企業(yè)形象為外生變量,其余的六個(gè)潛變量為內(nèi)生變量,顧客滿意度測(cè)評(píng)拓展模型的路徑圖如圖1所示。其中:ξr潛(隱)變量,ξ6為潛自變量(外生變量),其他為潛因變量(內(nèi)生變量);xrt為顯變量(觀測(cè)變量,r=0,1,2,3,4,5,6),即為ξr的指標(biāo),t為潛變量對(duì)應(yīng)觀測(cè)值的個(gè)數(shù)(t=1,2…kr,kr為第r個(gè)潛變量對(duì)應(yīng)觀測(cè)值的個(gè)數(shù));LXr分別為潛變量ξr的PLS估計(jì)值。
顧客滿意度指數(shù)測(cè)評(píng)的一級(jí)指標(biāo)為上述的七個(gè)潛變量,各個(gè)潛變量對(duì)應(yīng)的顯變量為二級(jí)指標(biāo),三級(jí)指標(biāo)定義為問(wèn)卷中二級(jí)指標(biāo)對(duì)應(yīng)的各個(gè)問(wèn)題,顧客滿意度測(cè)評(píng)指標(biāo)體系見(jiàn)表1。
圖1 顧客滿意度測(cè)評(píng)拓展模型路徑圖
表1 模型中的潛變量與測(cè)度指標(biāo)
顧客滿意度指數(shù)模型中,ξr為潛(隱)變量,ξ1為潛自變量(外生變量),其他為潛因變量(內(nèi)生變量);xrt為顯變量(觀測(cè)變量,r=0,1,2,3,4,5),即為ξr的指標(biāo),t為潛變量對(duì)應(yīng)觀測(cè)值的個(gè)數(shù)(t=1,2…kr,kr為第r個(gè)潛變量對(duì)應(yīng)觀測(cè)值的個(gè)數(shù)),LXr分別為潛變量ξr的PLS估計(jì)值。
求解帶缺失值的顧客滿意度指數(shù)步驟如下:
⑴異常值處理
所謂異常值是被調(diào)查顧客在回答問(wèn)卷時(shí),由于各種原因而選擇了“不知道”、“拒絕回答”以及“超出數(shù)值范圍”等選項(xiàng)時(shí)系統(tǒng)默認(rèn)的值。問(wèn)卷采用10分制,從1分到10分供被調(diào)查者選擇,且只能選擇一個(gè)。對(duì)被調(diào)查者不知道或拒絕的回答,在數(shù)據(jù)庫(kù)里進(jìn)行了標(biāo)識(shí)(98表示不知道;99表示拒絕;101表示從來(lái)不購(gòu)買)。這些數(shù)據(jù)在進(jìn)行處理時(shí)按照缺失值處理。
⑵數(shù)據(jù)標(biāo)準(zhǔn)化
使得樣本值的均值為0、方差為1;
⑶缺失值處理
首先對(duì)數(shù)據(jù)庫(kù)里面的缺失值(在數(shù)據(jù)庫(kù)里標(biāo)記為NaN)用0代替;然后,如果一個(gè)潛變量對(duì)應(yīng)的全部顯變量樣本值都缺失,那么該樣本無(wú)效,即估計(jì)該潛變量時(shí)采用成對(duì)刪除法;如果一個(gè)潛變量對(duì)應(yīng)的顯變量樣本值部分缺失,那么缺失值的處理采用“分類均值插補(bǔ)法”。該插補(bǔ)方法通過(guò)對(duì)被調(diào)查對(duì)象問(wèn)卷的分值分析,選取滿意度字段進(jìn)行分類,滿意度的分值從1到10分,共分為十個(gè)類別,同類中的缺失值進(jìn)行均值插補(bǔ)。分類均值插補(bǔ)法與均值插補(bǔ)法均方根誤差如表2所示[8],通過(guò)實(shí)證得出分類均值插補(bǔ)法優(yōu)于均值插補(bǔ)。
表2 預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)的均方根誤差
⑷利用PLS算法反復(fù)迭代得到潛變量估計(jì)值
需要指出的是,含多個(gè)潛變量結(jié)構(gòu)方程模型的塊結(jié)構(gòu)設(shè)定原則是假定塊內(nèi)每個(gè)指標(biāo)分別與對(duì)應(yīng)的潛變量存在線性關(guān)系。模型設(shè)定詳細(xì)步驟在此不在給出。
其中,πrt為指標(biāo) xrt的載荷系數(shù)(測(cè)量模型系數(shù)),εrt為殘差,πrk0為截距值。
含多個(gè)潛變量結(jié)構(gòu)方程模型的內(nèi)部關(guān)系設(shè)定原則是內(nèi)部關(guān)系應(yīng)該構(gòu)成一個(gè)線性因果鏈系統(tǒng)。
νr為殘差;權(quán)重關(guān)系利用信息交換過(guò)程中的部分信息估計(jì)潛變量值。任何一個(gè)潛變量均可以通過(guò)其指標(biāo)變量的加權(quán)和來(lái)估計(jì),而權(quán)重則由所選擇的權(quán)重關(guān)系來(lái)確定。對(duì)路徑模型中潛變量ξr的符號(hào)權(quán)重和定義為Ur。假設(shè)與ξi鄰接的潛變量是ξj。
PLS算法求解步驟如下:
步驟1:迭代估計(jì)權(quán)重和潛變量,從步驟4開(kāi)始,循環(huán)執(zhí)行①至④,直到滿足迭代條件;
步驟2:①內(nèi)部權(quán)重
步驟3:估計(jì)路徑系數(shù)和載荷系數(shù)
步驟4:估計(jì)定位參數(shù)。
至此,整個(gè)PLS算法求解完成。
⑸求出顧客滿意度指數(shù)
根據(jù)第四步求得的權(quán)重系數(shù),計(jì)算出顧客滿意度指數(shù)。
以某汽車公司為研究對(duì)象,顧客滿意度測(cè)評(píng)拓展模型包含7個(gè)潛變量:顧客期望ξ0、感知質(zhì)量ξ1、感知價(jià)值ξ2、顧客滿意度ξ3、顧客抱怨ξ4、顧客忠誠(chéng)ξ5和企業(yè)形象ξ6,17個(gè)顯變量;數(shù)據(jù)的收集采取網(wǎng)上調(diào)查的方式進(jìn)行,參與網(wǎng)上調(diào)查的用戶為225位,因此樣本量為225。x52表示價(jià)格敏感度,包括兩部分:價(jià)格上漲和價(jià)格下降,x52最后取值價(jià)格上漲+25或價(jià)格下降-25;表中的98、99、101用符號(hào)“NaN”替換,表示缺失數(shù)據(jù);對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化處理,設(shè)定權(quán)重迭代條件的初始值。最后求出顧客滿意度指數(shù)值。由上求出PLS路徑模型的各項(xiàng)參數(shù)后,下面對(duì)該模型的合理性進(jìn)行評(píng)價(jià)。模型評(píng)價(jià)主要分為對(duì)測(cè)量模型的評(píng)價(jià)和結(jié)構(gòu)模型的評(píng)價(jià),前者包括信度分析、效度分析,后者主要是對(duì)路徑系數(shù)的分析。對(duì)七組變量分別做主成分分析,求得的第一主成分特征值大于1和第二主成分特征值小于1;C.alpha、DG.rho都大于0.7,七組變量的單一緯度檢驗(yàn)都顯然通過(guò),符合單一緯度條件。測(cè)評(píng)標(biāo)準(zhǔn)化因子負(fù)荷處于0.63-0.82之間,所有概念的AVE值都處于0.74-0.92之間,均大于0.5,這表明本文所設(shè)計(jì)的量表具有良好的內(nèi)斂效度。各解釋潛變量對(duì)其相應(yīng)的潛變量的R2值均大于0,表示模型具有一定的解釋能力,可接受。模型的擬合優(yōu)度用GoF=0.7,表明該模型的擬合效果可以接受。
表3 權(quán)重最終迭代結(jié)果
表4 權(quán)重最終迭代結(jié)果
通過(guò)對(duì)迭代過(guò)程中權(quán)重系數(shù)ω的計(jì)算結(jié)果分析可以得出:只要權(quán)重的初始值不全為0,最終迭代結(jié)果就不會(huì)受到影響;只要調(diào)查樣本相同、迭代中止條件相同,即使初始權(quán)重ω的值不同,但在第四次迭代時(shí)權(quán)重已經(jīng)收斂于一定數(shù)值;也就是說(shuō)整個(gè)迭代過(guò)程是收斂的,不同的權(quán)重初值可能會(huì)影響迭代過(guò)程中的權(quán)重值和迭代次數(shù),但最終的迭代結(jié)果是相同的?;贘ava開(kāi)發(fā)的SmartPLS軟件包括三種權(quán)重模式:質(zhì)心、因子和路徑[6,7],處理同樣的樣本到收斂的迭代次數(shù)分別為9、13和13,本系統(tǒng)僅需要5次。因此,基于PLS路徑模型的顧客滿意度測(cè)評(píng)系統(tǒng)提高了對(duì)模型分析處理速度;在結(jié)構(gòu)模型系數(shù)、潛變量估計(jì)值相關(guān)系數(shù)、權(quán)重系數(shù)及測(cè)量模型系數(shù)等方面與SmartPLS具有一致性。
通過(guò)測(cè)評(píng)系統(tǒng)分析計(jì)算,可以得到各潛變量之間的標(biāo)準(zhǔn)化路徑系數(shù),如表4所示。
由上述實(shí)證分析及評(píng)價(jià)各參數(shù)結(jié)果,網(wǎng)上調(diào)查網(wǎng)民對(duì)該食品公司的顧客滿意度產(chǎn)品具有以下特點(diǎn):
(1)顧客滿意度與感知質(zhì)量、感知價(jià)值、企業(yè)形象和顧客期望都是正相關(guān)。但感知質(zhì)量對(duì)顧客滿意度的相關(guān)性最強(qiáng)0.6171,其次為感知價(jià)值0.2997和企業(yè)形象0.2183。說(shuō)明使得用戶對(duì)該公司產(chǎn)品滿意的首要任務(wù)是提高產(chǎn)品的質(zhì)量,其次是產(chǎn)品的價(jià)格;顧客期望對(duì)顧客滿意度的影響不大。
(2)顧客滿意對(duì)顧客忠誠(chéng)直接影響β53=0.6888,間接影響為β43β54=0.07132,表明顧客滿意對(duì)顧客忠誠(chéng)度間接影響不大,而直接影響很強(qiáng)。
通過(guò)對(duì)國(guó)內(nèi)外顧客滿意度指數(shù)模型的對(duì)比及我國(guó)的現(xiàn)狀分析,提出了顧客滿意度測(cè)評(píng)的拓展模型;模型對(duì)感知質(zhì)量潛變量進(jìn)行了細(xì)化,分為感知產(chǎn)品質(zhì)量和感知服務(wù)質(zhì)量。基于該拓展模型,可以對(duì)既提供產(chǎn)品也提供服務(wù)的企業(yè)(例如:汽車公司或家電企業(yè)等)進(jìn)行帶缺失值的顧客滿意度指數(shù)測(cè)評(píng);基于均值插補(bǔ)法,提出分類均值插補(bǔ)的缺失值處理方法,該方法較均值插補(bǔ)法有效;最后,以某汽車公司為研究對(duì)象,對(duì)構(gòu)建的顧客滿意度測(cè)評(píng)拓展模型進(jìn)行實(shí)證分析和評(píng)價(jià),驗(yàn)證了模型的信度、效度和適合度等,測(cè)評(píng)結(jié)果是滿意和有效的;但論文提出的缺失值處理方法僅與均值插補(bǔ)法進(jìn)行了比較,未能考察其他缺失值處理方法,這是今后需要進(jìn)一步研究的內(nèi)容。
[1]Fornell C.,劉金蘭.顧客滿意度與ACSI[M].天津:天津大學(xué)出版社,2006.
[2]Wang Q H,Rao J N K.Empirical Likelihood for Linear Regression Models under Imputation for Mossing Response[J].The Canadian Journal Statistics,2001,29.
[3]Allison,Paul D.Missing Data Techniques for Structural Equation Mod?els[J].Journal of Abnormal Psychology,2003,112.
[4]Fatukasi,O.Kittler,J.Poh,N.Estimation of Missing Values in Multi?modal Biometric Fusion[J].Biometrics Theory Applications and Sys?tems,2008.
[5]Tenenhaus,M.,Vinzi,V.E.,Chatelin,Y.M.,Lauro,C.PLS Path Model?ing[J].Computational Statistics and Data Analysis,2005,48(1).
[6]Lohm?ller,J.-B.Latent Variable Path Modeling with Partial Least Squares[M].Heidelberg:Physica-Verlag,1989.
[7]Ringle,C.M.,Wende,S.,Will,A.SmartPLS-Version 2.0.Univer?sit?t Hamburg[Z].Hamburg,2005.
[8]MohammadMehdiPourhashem,ManouchehrKelarestaghi,Mir Mohsen Pedram.Missing Value Estimation in Microarray Data Using Fuzzy Clustering and Semantic Similarity[J].Global Journal of Com?puter Science and Technology,2012,10(2).
F275
A
1002-6487(2013)14-0025-03
國(guó)家自然科學(xué)基金資助項(xiàng)目(70672027)
趙富強(qiáng)(1974-),男,河北涉縣人,博士研究生,講師,研究方向:信息管理與信息系統(tǒng)。
(責(zé)任編輯/亦 民)