李曉英,周大濤
(湖北工業(yè)大學(xué) 工業(yè)設(shè)計(jì)學(xué)院,武漢 430068)
隨著調(diào)查研究理論的深化,各種調(diào)查方法、技術(shù)和工具等也獲得不斷發(fā)展[1]。而調(diào)查問(wèn)卷作為獲取統(tǒng)計(jì)資料的重要手段,既可以收集性別、年齡等簡(jiǎn)單的人口統(tǒng)計(jì)信息,也可以獲得體驗(yàn)、行為、情感等復(fù)雜信息,并且通過(guò)科學(xué)抽樣,就可以從少量樣本數(shù)據(jù)的研究得到一般性推論,其在企事業(yè)單位、大眾媒體和學(xué)術(shù)研究等部門得到了廣泛應(yīng)用。因此,針對(duì)調(diào)查問(wèn)卷進(jìn)行的方法理論研究具有重要的實(shí)用價(jià)值。
文獻(xiàn)研究發(fā)現(xiàn):現(xiàn)階段的研究成果多是關(guān)注于問(wèn)卷的內(nèi)容設(shè)計(jì)[2]、樣本選擇、實(shí)施過(guò)程[3]及問(wèn)卷的效度、信度檢驗(yàn)方法[4]等方面,對(duì)調(diào)查問(wèn)卷結(jié)果的統(tǒng)計(jì)方法研究卻很少提及;現(xiàn)行的結(jié)果統(tǒng)計(jì)多采用平均賦權(quán)算法,由于未能充分考慮主體人(調(diào)查對(duì)象)對(duì)客體物(調(diào)查目標(biāo)、內(nèi)容)在不同層次或角度上的認(rèn)知差異水平,稍有偏差就會(huì)導(dǎo)致結(jié)果出現(xiàn)不可靠性、誤導(dǎo)性等問(wèn)題。針對(duì)這個(gè)問(wèn)題,提出基于K-means聚類的調(diào)查問(wèn)卷動(dòng)態(tài)賦權(quán)統(tǒng)計(jì)方法,結(jié)合某高校圖書(shū)館服務(wù)質(zhì)量滿意度調(diào)查的實(shí)證研究,驗(yàn)證其可行性、有效性及優(yōu)越性。
由于客觀事物的復(fù)雜性、不確定性,在調(diào)查問(wèn)卷中往往需要對(duì)個(gè)體或事物的屬性特征做綜合、全面的調(diào)查分析。例如,產(chǎn)品市場(chǎng)需求調(diào)查中,就會(huì)涉及到產(chǎn)品的功能、結(jié)構(gòu)、造型、材料以及經(jīng)濟(jì)價(jià)值、社會(huì)環(huán)境影響等多方面的因素調(diào)查,這就要求主體人對(duì)產(chǎn)品的各個(gè)因素有清晰、全面的認(rèn)識(shí)。但由于主體人的經(jīng)驗(yàn)、專業(yè)、文化背景及需求、偏好的不同,缺乏對(duì)事物屬性特征的全面了解,這在一定程度上導(dǎo)致同一主體對(duì)同一客體不同方面的認(rèn)知程度上趨于不一致而非一致,即被調(diào)查者對(duì)待不同問(wèn)題評(píng)分結(jié)果的可信度或權(quán)重是不同的。這一點(diǎn)往往會(huì)被調(diào)查問(wèn)卷的設(shè)計(jì)者所忽略,僅采用傳統(tǒng)的平均賦權(quán)方法對(duì)調(diào)查問(wèn)卷的樣本數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,使由調(diào)查問(wèn)卷樣本數(shù)據(jù)獲得的理論值和由表征客體屬性特征的真實(shí)值之間出現(xiàn)一定程度的誤差,導(dǎo)致研究結(jié)果缺乏可靠性。
針對(duì)上述問(wèn)題,為了保證調(diào)查問(wèn)卷統(tǒng)計(jì)結(jié)果的可靠性,在綜合考慮主體人對(duì)客體物認(rèn)知差異程度的基礎(chǔ)上,提出基于K-means聚類算法的調(diào)查問(wèn)卷動(dòng)態(tài)賦權(quán)統(tǒng)計(jì)方法,具體的應(yīng)用流程如圖1所示。
圖1 基于K-means聚類的調(diào)查問(wèn)卷動(dòng)態(tài)統(tǒng)計(jì)方法流程圖
首先,為便于客觀、真實(shí)地表征主體人對(duì)客體物在不同層次上的認(rèn)知差異,需預(yù)先編制調(diào)查問(wèn)卷層次量表,即圍繞調(diào)查問(wèn)卷評(píng)估的總體目標(biāo)要求,將個(gè)體或事物的屬性特征分解為若干不同的方面。如表1所示,調(diào)查問(wèn)卷層次量表的總體目標(biāo)(Z)由一級(jí)層次(A)和二級(jí)層次(B)的屬性特征組成,下一次層次的屬性特征是對(duì)上一層次屬性的不同角度或?qū)用娴拿枋觥?/p>
其次,采用K-means聚類算法演繹出不同層次下樣本數(shù)據(jù)的歸類分布情況:
定義1:設(shè)有n個(gè)樣本的p維調(diào)查樣本數(shù)據(jù)為:
每個(gè)樣本可以看作p維空間的一個(gè)點(diǎn),則任意兩個(gè)空間點(diǎn)xi和xj之間的Euclid距離為d(xi,xj):
表1 圖書(shū)館服務(wù)質(zhì)量滿意度調(diào)查問(wèn)卷層次量表
其中,當(dāng)P=2或3時(shí),d(xi,xj)為二維或三維空間中的兩點(diǎn)之間的距離。
定義2:設(shè)n個(gè)樣本需要分成k類,則第k個(gè)初始聚類點(diǎn)的集合為:
由公式(1)可記:
將n個(gè)樣本聚成了k類,得到了一個(gè)初始分類集合C0:
從初始聚類C0開(kāi)始計(jì)算新的聚類點(diǎn)集合為H1,計(jì)算:
其中,ni為類C0集合中的樣本數(shù)量,得到一個(gè)新的集合:
從H1開(kāi)始再進(jìn)行分類,并迭代上述步驟m次,得:
其中Cm=Cm+1時(shí),則迭代計(jì)算結(jié)束,獲得最終聚類集合Cm。
定義3:由上述K-means聚類算法將n個(gè)樣本聚成了k類,進(jìn)一步假設(shè)第i個(gè)樣本屬于第t類Ct(顯然1≤t≤k),類別Ct中包含的樣本個(gè)數(shù)Ft(Ft可稱為類容量)與樣本總數(shù)n的比值,稱為樣本i的置信因子Ti,則:
顯然,同一類別中的樣本具有相同的置信因子,也即同一類中樣本所表達(dá)的信息可以認(rèn)為是相似的。其中,F(xiàn)t較大的類中樣本所表達(dá)的信息符合多數(shù)調(diào)查對(duì)象的意見(jiàn),應(yīng)該被賦予較大的權(quán)重,由此有以下權(quán)重系數(shù)βk的確定原則:
其中:
求解方程組(2)有:
由于屬于同一類別的樣本具有相同的置信因子,所以:
由式(3)和式(4)得,樣本權(quán)重系數(shù)βk:
最后,通過(guò)動(dòng)態(tài)賦權(quán)計(jì)算某個(gè)層次的得分匯總,實(shí)現(xiàn)對(duì)客體物特定特征的評(píng)估,進(jìn)一步地通過(guò)各個(gè)層次的得分再加,獲得最終的綜合評(píng)估結(jié)果。
圖書(shū)館作為社會(huì)的服務(wù)性行業(yè)之一,與其他服務(wù)行業(yè)評(píng)估在理論、方法模式方面具有通用性。因此,本文以某高校圖書(shū)館服務(wù)質(zhì)量的滿意度調(diào)查為實(shí)踐案例,進(jìn)一步闡述和驗(yàn)證該方法的可行性、有效性。
現(xiàn)有的圖書(shū)館服務(wù)質(zhì)量滿意度調(diào)查量表有多種形式,結(jié)合某高校的實(shí)際情況,在參考美國(guó)研究圖書(shū)館協(xié)會(huì)(ARL)的LibQUAL+TM體系的基礎(chǔ)上。依據(jù)上述層次量表編制要求,繪制了如表1所示的調(diào)查問(wèn)卷層次量表,以開(kāi)展圖書(shū)館服務(wù)質(zhì)量滿意度調(diào)查工作。
依據(jù)心理學(xué)中的情感梯度理論[5]確定該層次量表的打分準(zhǔn)則,分為7個(gè)等級(jí):很不滿意、不滿意、不太滿意、一般、比較滿意、滿意、很滿意,分別對(duì)應(yīng)1分、2分、3分、4分、5分、6分、7分。
在本次調(diào)查中,共發(fā)放問(wèn)卷250份,回收225份,其中有效問(wèn)卷212份,有效率為94.2%。限于篇幅本文僅給出有形性層次下的部分評(píng)分?jǐn)?shù)據(jù),如表2所示。
采用內(nèi)部一致性系數(shù)(Cronbach α系數(shù))檢驗(yàn)問(wèn)卷信度,采用KMO檢驗(yàn)和Bartlet球形檢驗(yàn)進(jìn)行因子分析的適用性檢驗(yàn)[6],以確定問(wèn)卷的結(jié)構(gòu)效度,具體檢驗(yàn)結(jié)果如表3所示。
表2 圖書(shū)館服務(wù)質(zhì)量滿意度調(diào)查結(jié)果評(píng)分表(部分)
表3 圖書(shū)館服務(wù)質(zhì)量滿意度調(diào)查問(wèn)卷效度、信度檢驗(yàn)結(jié)果
由表3可知:Cronbach α系數(shù)在0.8以上,說(shuō)明問(wèn)卷調(diào)查結(jié)果具有較高的一致性和穩(wěn)定性,信度較高;除了關(guān)懷性的KMO值(0.587)尚可外,其余層次的KMO值都在0.6以上,效度較高;Bartlet球形檢驗(yàn)中的顯著性水平p<0.05,表明變量之間具有明顯的結(jié)構(gòu)性和相關(guān)性,效度較高。
為了便于計(jì)算、描述和說(shuō)明該方法的可行性、有效性,需進(jìn)行兩個(gè)方面的假設(shè):一是認(rèn)為調(diào)查對(duì)象對(duì)二級(jí)層次下的屬性特征無(wú)認(rèn)知差異,僅對(duì)一級(jí)層次下屬性特征的認(rèn)知差異進(jìn)行考慮;二是采用由樣本數(shù)據(jù)的方差和均值所組成的二維數(shù)據(jù)演繹歸類分布情況。結(jié)合定義3中K-means聚類算法的步驟,在Matlab軟件中演繹出一級(jí)層次下樣本數(shù)據(jù)的歸類分布情況。限于篇幅,本文僅說(shuō)明有形性層次下的歸類情況,結(jié)果如圖2所示。
圖2 有形性層次下的樣本歸類分布情況
由圖2可知,212個(gè)樣本被清晰、明確地聚成了7個(gè)類別,證明了K-means聚類算法的可行性。進(jìn)一步地可以確定各個(gè)類別的類容量Ft的大小,有:
Ft={13,19,42,46,11,49,32}
由式(5)可以計(jì)算各調(diào)查對(duì)象的權(quán)重系數(shù)βk,有:
其中,為有形性層次下各樣本類的權(quán)重系數(shù)。進(jìn)一步的重復(fù)此步驟可以獲得其他層次下的樣本類權(quán)重系數(shù):
為了進(jìn)一步說(shuō)明動(dòng)態(tài)賦權(quán)統(tǒng)計(jì)的概念,進(jìn)行隨機(jī)抽樣獲得4個(gè)樣本(20號(hào)、56號(hào)、135號(hào)、205號(hào))在不同層次下的權(quán)重系數(shù)分布情況,結(jié)果如圖3所示:與平均賦權(quán)的水平直線相比,4個(gè)樣本的權(quán)重系數(shù)則是動(dòng)態(tài)變化的曲線,會(huì)隨著各層次屬性特征的改變而變化,能夠真實(shí)地表征主體人對(duì)客體物不同方面的認(rèn)知差異,證明了該方法的有效性。
圖3 動(dòng)態(tài)賦權(quán)與平均賦權(quán)的權(quán)重系數(shù)對(duì)比圖
為了進(jìn)一步證明該方法的有效性、可靠性及優(yōu)越性,進(jìn)行平均賦權(quán)方法與動(dòng)態(tài)賦權(quán)方法下獲得的調(diào)查問(wèn)卷綜合評(píng)分結(jié)果的對(duì)比分析,具體結(jié)果如圖4所示。
圖4 動(dòng)態(tài)賦權(quán)與平均賦權(quán)的綜合評(píng)分結(jié)果對(duì)比圖
由圖4可知,兩種賦權(quán)方法下獲得的評(píng)分結(jié)果存在明顯差異:一方面,在某些屬性特征上,動(dòng)態(tài)賦權(quán)獲得的滿意度評(píng)分較高于平均賦權(quán),尤其在有形性層次下的差異表現(xiàn)最為顯著;另一方面,兩種方法獲得的綜合排序結(jié)果差異較大。通過(guò)數(shù)據(jù)對(duì)比分析發(fā)現(xiàn),導(dǎo)致這種差異的原因是兩種賦權(quán)方法在調(diào)查對(duì)象權(quán)重大小的確定上存在明顯區(qū)別,例如,在針對(duì)B13(電子資源豐富,數(shù)據(jù)庫(kù)全面)的評(píng)分?jǐn)?shù)據(jù)上,平均賦權(quán)對(duì)評(píng)分較低(3分以下)的31號(hào)、43號(hào)、104號(hào)等14個(gè)樣本數(shù)據(jù)賦予了較大的權(quán)重(0.0047),而動(dòng)態(tài)賦權(quán)對(duì)其賦予較小權(quán)重(0.0014)。通過(guò)回訪調(diào)查發(fā)現(xiàn),這14位被調(diào)查者使用圖書(shū)館電子資源的情況不多,甚至從未使用過(guò)圖書(shū)館電子資源,其評(píng)分結(jié)果明顯不可信。但平均賦權(quán)方法下卻對(duì)其賦予了較高權(quán)重,顯然該賦權(quán)方法下的評(píng)分結(jié)果缺乏可靠性。相比之下,動(dòng)態(tài)賦權(quán)方法獲得的評(píng)分結(jié)果更符合實(shí)際情況。
使用同樣的方法對(duì)其他差異點(diǎn)進(jìn)行回訪調(diào)查,結(jié)果表明:平均賦權(quán)方法未能夠識(shí)別出調(diào)查對(duì)象的實(shí)際認(rèn)知情況,導(dǎo)致綜合評(píng)分結(jié)果出現(xiàn)偏差;基于K-means聚類的動(dòng)態(tài)賦權(quán)統(tǒng)計(jì)方法能夠綜合考慮主體人的認(rèn)知水平差異,并減小其對(duì)綜合評(píng)分結(jié)果造成的影響,增強(qiáng)了調(diào)查問(wèn)卷結(jié)果的可靠性,減少誤導(dǎo)。對(duì)比結(jié)果表明調(diào)查問(wèn)卷的動(dòng)態(tài)賦權(quán)統(tǒng)計(jì)方法在有效性、可靠性等方面較平均賦權(quán)方法具有優(yōu)越性。
針對(duì)主體人對(duì)客體物的認(rèn)知差異導(dǎo)致調(diào)查問(wèn)卷綜合統(tǒng)計(jì)結(jié)果出現(xiàn)偏差的問(wèn)題,提出基于K-means聚類算法的調(diào)查問(wèn)卷動(dòng)態(tài)賦權(quán)統(tǒng)計(jì)方法。通過(guò)圖書(shū)館服務(wù)質(zhì)量滿意度調(diào)查的實(shí)證研究,對(duì)比不同賦權(quán)方法下的評(píng)分結(jié)果,驗(yàn)證了該方法的可行性、有效性。但K-means聚類算法需要預(yù)先指定類別數(shù)目,且多數(shù)情況下樣本數(shù)據(jù)的類別數(shù)目及最優(yōu)類別數(shù)目是無(wú)法預(yù)知的。因此,下一步的工作重點(diǎn)將圍繞樣本數(shù)據(jù)最優(yōu)類別數(shù)目的確定方法而展開(kāi),以進(jìn)一步保證調(diào)查結(jié)果的可靠性。