亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        顧客滿意度測(cè)評(píng)中的缺失值處理方法

        2013-05-10 10:04:04趙富強(qiáng)
        統(tǒng)計(jì)與決策 2013年6期
        關(guān)鍵詞:分類(lèi)滿意度方法

        趙富強(qiáng)

        (天津財(cái)經(jīng)大學(xué),天津300222)

        1 缺失值產(chǎn)生的原因、方式及處理方法

        缺失值(Missing Value)是指在進(jìn)行問(wèn)卷抽樣調(diào)查或?qū)嶒?yàn)性研究中,應(yīng)該從抽樣的樣本單元中得到而實(shí)際上卻由于種種原因而未得到所需的數(shù)據(jù);也稱為缺失數(shù)據(jù)(Missing Data)。

        在進(jìn)行實(shí)驗(yàn)性研究或問(wèn)卷抽樣調(diào)查中,數(shù)據(jù)缺失現(xiàn)象經(jīng)常發(fā)生,主要原因包括:①被調(diào)查者不愿提供調(diào)查所需要的信息;②不可人為控制的因素造成數(shù)據(jù)的缺失;③調(diào)研人員本身或調(diào)查系統(tǒng)的原因沒(méi)有收集到完全的信息;④信息填報(bào)匯總錯(cuò)誤原因造成數(shù)據(jù)的缺失等。產(chǎn)生缺失數(shù)據(jù)原因多種多樣,實(shí)際工作中有時(shí)很難判斷和檢測(cè)缺失數(shù)據(jù)產(chǎn)生的機(jī)制與方式。為了認(rèn)識(shí)和研究缺失的數(shù)據(jù),從形式上將其分為單元缺失與項(xiàng)目缺失兩種。Little和Rubin定義了以下三種不同的數(shù)據(jù)缺失機(jī)制:完全隨機(jī)缺失(Missing Completely at Random,MCAR)、隨機(jī)缺失(Missing at Random,MAR)和不可忽略的缺失(Non-ignorable Missing,NIM)。整個(gè)缺失數(shù)據(jù)的推估過(guò)程中,缺失數(shù)據(jù)的情況表現(xiàn)為三種方式[1,2]:?jiǎn)巫兞咳笔?、單調(diào)缺失型和任意缺失型。

        缺失值的處理方法主要包括刪除法(Deletion)、插補(bǔ)法(Imputation)和最大似然估計(jì)法(Maximum likelihood)[3]等。缺失值插補(bǔ)法包括:均值插補(bǔ)法(Mean Imputation)、隨機(jī)插補(bǔ)法和多重插補(bǔ)方法(Multiple Imputation,MI)等。

        在文獻(xiàn)[4]中,Lohm?ller’s PLSX對(duì)缺失值的處理為:⑴如果所有的顯變量樣本值都缺失,那么該樣本無(wú)效,無(wú)法估計(jì)潛變量。⑵如果該塊的顯變量樣本值不全缺失,那么計(jì)算潛變量估計(jì)時(shí),缺失的顯變量值由該顯變量的均值替代。⑶如果該潛變量估計(jì)值有缺失,那么計(jì)算內(nèi)部估計(jì)時(shí),缺失值由0替代。⑷權(quán)重的計(jì)算:①模式A(Mode A):權(quán)重根據(jù)公式計(jì)算;②模式B(Mode B):當(dāng)沒(méi)有缺失值按照公式計(jì)算;有缺失值時(shí),采用成對(duì)刪除法把對(duì)應(yīng)的缺失樣本值刪除,即不考慮在內(nèi),然后利用公式來(lái)計(jì)算權(quán)重。

        除了上述方法外,缺失值處理方法還有回歸或主成分法、最大似然估計(jì)法、相似反應(yīng)模式算法(Similar Response Pattern Imputation)、EM算法(Expected Maximization Algorithm)和MCMC算法(Markov Chain Monte Carlo)等。

        2 基于分類(lèi)的缺失值處理方法

        基于分類(lèi)的缺失值處理方法是通過(guò)對(duì)被調(diào)查對(duì)象問(wèn)卷分值的分析,選擇關(guān)鍵字段進(jìn)行分類(lèi),然后使用上述的缺失值處理方法進(jìn)行缺失值處理。主要包括:分類(lèi)的均值插補(bǔ)法、分類(lèi)的多重插補(bǔ)法和分類(lèi)的K-means方法等。

        均值插補(bǔ)法是用每個(gè)變量的均值取代該變量的缺失值。分類(lèi)均值插補(bǔ)法是先對(duì)數(shù)據(jù)進(jìn)行分類(lèi),然后同類(lèi)中的缺失值進(jìn)行均值插補(bǔ);在一定程度上克服了均值插補(bǔ)法替代值過(guò)于凝集和容易扭曲目標(biāo)變量分布的弱點(diǎn),使替代值的分布與真值分布更為接近。

        多重插補(bǔ)法由1987年由Dempster教授和美國(guó)哈佛大學(xué)Rubin教授提出。在2000年,Paul D.Allison[5]博士也對(duì)多重插補(bǔ)法進(jìn)行了深入研究。它是一種用兩個(gè)或者更多的可得到的并且能反映數(shù)據(jù)本身分布概率的值來(lái)插補(bǔ)缺失或者不完善數(shù)據(jù)的一種方法。多重插補(bǔ)方法的主要思想是,給每個(gè)缺失值都構(gòu)造m個(gè)估計(jì)值(m>1),這樣就產(chǎn)生出m個(gè)完全數(shù)據(jù)集,對(duì)每個(gè)完全數(shù)據(jù)集分別使用相同的方法進(jìn)行處理,得到m個(gè)處理結(jié)果,最后再綜合這m個(gè)處理結(jié)果,最終得到對(duì)目標(biāo)變量的估計(jì)。多重填補(bǔ)法使得被插補(bǔ)的缺失數(shù)據(jù)能夠接近“真實(shí)”。該方法主要應(yīng)用于生物醫(yī)學(xué)、行為學(xué)和社會(huì)科學(xué)等領(lǐng)域,已成為處理缺失數(shù)據(jù)的最常用方法之一。而分類(lèi)多重插補(bǔ)法是先對(duì)數(shù)據(jù)進(jìn)行分類(lèi),然后同類(lèi)中的缺失值進(jìn)行多重插補(bǔ);

        分類(lèi)K-means方法是先對(duì)數(shù)據(jù)進(jìn)行分類(lèi),然后同類(lèi)中的缺失值進(jìn)行聚類(lèi)中心值插補(bǔ)。

        3 分類(lèi)缺失值處理方法在滿意度測(cè)評(píng)中應(yīng)用

        以某食品公司為研究對(duì)象,以ACSI為測(cè)評(píng)模型,即包含6個(gè)潛變量,15個(gè)顯變量。數(shù)據(jù)的收集采取網(wǎng)上調(diào)查的方式進(jìn)行,參與網(wǎng)上調(diào)查的用戶為252位,因此樣本量為252。

        求解帶缺失值的顧客滿意度指數(shù)步驟如下:

        (1)異常值處理。

        所謂異常值是被調(diào)查顧客在回答問(wèn)卷時(shí),由于各種原因而選擇了“不知道”、“拒絕回答”以及“超出數(shù)值范圍”等選項(xiàng)時(shí)系統(tǒng)默認(rèn)的值。問(wèn)卷采用10分制,從1分到10分供被調(diào)查者選擇,且只能選擇一個(gè)。對(duì)被調(diào)查者不知道或拒絕的回答,在數(shù)據(jù)庫(kù)里進(jìn)行了標(biāo)識(shí)(98表示不知道;99表示拒絕;101表示從來(lái)不購(gòu)買(mǎi))。這些數(shù)據(jù)在進(jìn)行處理時(shí)按照缺失值處理。

        (2)數(shù)據(jù)標(biāo)準(zhǔn)化。

        使得樣本值的均值為0、方差為1;

        (3)缺失值處理。

        通過(guò)對(duì)被調(diào)查對(duì)象問(wèn)卷分值的分析,選擇滿意度字段進(jìn)行分類(lèi),滿意度分值從1到10分,共分為十個(gè)類(lèi)別。分別采用類(lèi)均值插補(bǔ)法、分類(lèi)多重插補(bǔ)法和分類(lèi)K-means方法進(jìn)行缺失值處理。

        (4)利用PLS算法來(lái)估計(jì)模型中各個(gè)參數(shù),反復(fù)迭代得到潛變量估計(jì)值。

        (5)求出顧客滿意度指數(shù)。

        根據(jù)第四步求得的權(quán)重系數(shù),計(jì)算出顧客滿意度指數(shù)[1]。

        圖1和圖2分別表示分類(lèi)多重插補(bǔ)法在20%的缺失值比率下總體期望取值密度分布和總體期望缺失率與取值分布圖;僅給出了總體顧客期望的插補(bǔ)情況,顧客滿意度分類(lèi)值為10,樣本量為112個(gè),迭代次數(shù)為9次,插補(bǔ)效果滿意。

        圖1 總體期望取值密度分布圖

        圖2 總體期望缺失率與取值分布圖

        圖3 表示在不同缺失率下各種缺失值處理方法均方根誤差RMSE比較。其中,(a)圖表示均值插補(bǔ)與分類(lèi)均值插補(bǔ)均方根誤差比較;(b)圖表示多重插補(bǔ)與分類(lèi)的多重插補(bǔ)均方根誤差比較;(c)圖表示K-means與分類(lèi)K-means均方根誤差比較,k的取值不同。

        圖3 缺失率與RMSE關(guān)系圖

        結(jié)果分析:通過(guò)實(shí)驗(yàn)數(shù)據(jù)分析,三種基于分類(lèi)的缺失值處理方法優(yōu)于未采用分類(lèi)的缺失值處理方法。其中分類(lèi)K-means方法RMSE最小,如圖(c)所示;在K-means和分類(lèi)K-means方法中,k的取值不同結(jié)果有差異,k值越大誤差越小。分類(lèi)多重插補(bǔ)法誤差最大,如圖(b)所示(多重插補(bǔ)法缺失值比率超過(guò)50%后,RMSE值大于6。)。

        在顧客滿意度測(cè)評(píng)中,對(duì)滿意度關(guān)鍵字段進(jìn)行分類(lèi),進(jìn)而采用相關(guān)的缺失值插補(bǔ)方法,即基于分類(lèi)的缺失值處理方法是有效的。

        4 結(jié)論與展望

        通過(guò)對(duì)缺失值處理方法分析,提出基于分類(lèi)的三種缺失值處理方法:分類(lèi)的均值插補(bǔ)法、分類(lèi)的多重插補(bǔ)法和分類(lèi)的K-means方法;以某食品公司為研究對(duì)象,分析了帶缺失值的顧客滿意度指數(shù)測(cè)評(píng)步驟:異常值處理、數(shù)據(jù)標(biāo)準(zhǔn)化、缺失值處理等;對(duì)顧客滿意度測(cè)評(píng)常規(guī)模型進(jìn)行帶缺失值的實(shí)證分析和評(píng)價(jià),基于分類(lèi)的三種缺失值處理方法優(yōu)于均值插補(bǔ)法、多重插補(bǔ)法和K-means方法。但論文僅對(duì)顧客滿意度字段進(jìn)行了分類(lèi)研究,沒(méi)有考慮其它字段的分類(lèi)情況、多個(gè)字段分類(lèi)情況及各字段間關(guān)系等,這些是今后深入研究的問(wèn)題。

        [1]Wang Q H,Rao J N K.Empirical Likelihood for Linear Regression Models under Imputation for Missing Response[J].The Canadian Jour?nal Statistics,2001,29.

        [2]Allison,Paul D.Missing Data Techniquesfor Structural Equation Mod?els[J].Journal of Abnormal Psychology,2003,112.

        [3]Fatukasi,O.Kittler,J.Poh,N.Estimation of Missing Values in Multi?modal Biometric Fusion[J].Biometrics Theory Applications and Sys?tems,2008,9.

        [4]Tenenhaus,M.,Vinzi,V.E.,Chatelin,Y.M.,Lauro,C.PLSPath Model?ing[J].Computational Statisticsand Data Analysis,2005,48(1).

        [5]Allison,Paul D.Multiple Imputation for Missing Data:a Cautionary tale[J].Sociological Methodsand Research,2000,28.

        猜你喜歡
        分類(lèi)滿意度方法
        多感謝,生活滿意度高
        分類(lèi)算一算
        16城市公共服務(wù)滿意度排行
        小康(2021年7期)2021-03-15 05:29:03
        淺談如何提升脫貧攻堅(jiān)滿意度
        活力(2019年19期)2020-01-06 07:34:38
        明天村里調(diào)查滿意度
        雜文月刊(2019年15期)2019-09-26 00:53:54
        分類(lèi)討論求坐標(biāo)
        數(shù)據(jù)分析中的分類(lèi)討論
        教你一招:數(shù)的分類(lèi)
        可能是方法不對(duì)
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        五月天国产成人av免费观看| 亚洲精品乱码久久久久久按摩高清 | 天天做天天爱夜夜爽毛片毛片| 乱色精品无码一区二区国产盗| a级国产乱理伦片在线播放| 内射交换多p国产| 欧美xxxx新一区二区三区 | 免费大片黄国产在线观看| 国产男女无遮挡猛进猛出| 精品国产精品久久一区免费式| 国产精品爽爽va在线观看网站| 午夜视频免费观看一区二区| 日本一二三区在线不卡| 亚洲欧洲无码精品ⅤA| 亚洲精品一区二区三区日韩| 国产自拍在线观看视频| 国产毛多水多高潮高清| 一本一道av中文字幕无码| 国产精品亚洲一区二区无码 | 按摩师玩弄少妇到高潮hd| 亚洲成人av大片在线观看| 男人吃奶摸下挵进去啪啪软件 | 婷婷丁香开心五月综合| 国产高清在线观看av片| 欧美极品少妇无套实战| 久久人人玩人妻潮喷内射人人| 欧美自拍丝袜亚洲| 人妻av午夜综合福利视频| 少妇精品揄拍高潮少妇桃花岛| 丰满少妇被猛烈进入高清播放| 男男啪啪激烈高潮cc漫画免费| 成人伊人亚洲人综合网站222| 亚洲日本无码一区二区在线观看| 日本av一区二区三区四区| 久久精品中文少妇内射| 亚洲春色在线视频| 久久精品日韩av无码| 日本老年人精品久久中文字幕| 一区二区精品天堂亚洲av| 久久婷婷五月综合色高清| 国产高潮刺激叫喊视频|