謝 威,趙嵩正
(西北工業(yè)大學(xué)管理學(xué)院,西安710129)
近年來,國際統(tǒng)計界對統(tǒng)計數(shù)據(jù)質(zhì)量的內(nèi)涵進(jìn)行了一些探索,在某些方面也達(dá)成了一致:首先,注重從用戶的角度來衡量統(tǒng)計數(shù)據(jù)質(zhì)量,強(qiáng)調(diào)用戶對統(tǒng)計信息的滿意程度;其次,鑒于統(tǒng)計數(shù)據(jù)質(zhì)量是一個具有豐富內(nèi)涵的概念,需要建立一個開放、透明的統(tǒng)計數(shù)據(jù)質(zhì)量評估管理體系,應(yīng)從多角度、多方面來衡量[1]。因此,統(tǒng)計數(shù)據(jù)質(zhì)量可以定義為:統(tǒng)計數(shù)據(jù)的一組固有特性滿足使用者需要的程度[2]。統(tǒng)計數(shù)據(jù)質(zhì)量具體需要涵蓋哪些特性,則取決于使用者對數(shù)據(jù)的要求。統(tǒng)計數(shù)據(jù)質(zhì)量是一個相對概念,從狹義上講,準(zhǔn)確性是統(tǒng)計數(shù)據(jù)質(zhì)量的同義詞,是指客觀反映現(xiàn)實情況的程度,統(tǒng)計誤差越小越準(zhǔn)確,數(shù)據(jù)質(zhì)量越高。從廣義上講,準(zhǔn)確性僅是數(shù)據(jù)質(zhì)量的一個重要方面,它還包括可獲得性、及時性、相關(guān)性、時間和空間上的一致性以及不同數(shù)據(jù)之間的一致性等。要求我們從統(tǒng)計數(shù)據(jù)提供者、生產(chǎn)者和用戶等多個角度來衡量數(shù)據(jù)質(zhì)量。
本文采用結(jié)構(gòu)方程模型來分析能源統(tǒng)計數(shù)據(jù)質(zhì)量的影響因素。結(jié)構(gòu)方程模型(簡稱為SEM)是基于變量的協(xié)方差矩陣來分析變量之間關(guān)系的一種統(tǒng)計方法,所以也稱為協(xié)方差結(jié)構(gòu)分析[3]。該模型能夠很好地解決了多元回歸分析法存在的弱點,并整合了路徑分析、驗證性因素分析與一般統(tǒng)計檢驗方法,可分析變量之間的相互因果關(guān)系,包括了因子分析與路徑分析的優(yōu)點。因此,廣泛應(yīng)用于社會科學(xué)的各個領(lǐng)域。
結(jié)構(gòu)方程模型通常包括三個矩陣方程式[4]:
相應(yīng)的模型假設(shè)如下:
(1)測量方程誤差項d、e的均值為零;
(2)結(jié)構(gòu)方程殘差項ζ的均值為零;
(3)誤差項d與ξ、e與η之間不相關(guān),d與e不相關(guān);
(4)殘差項ζ與d、e、ξ之間不相關(guān)。
其中,方程(1)和方程(2)被稱之為測量模型,方程(3)則被稱之為結(jié)構(gòu)模型,有關(guān)符號說明見表1。
表1 結(jié)構(gòu)方程模型符號說明
能源統(tǒng)計數(shù)據(jù)質(zhì)量是一個多因素集合,是一個內(nèi)生潛變量,需要通過數(shù)據(jù)的準(zhǔn)確性、可得性、完整性、空間時間一致性、時效性以及對用戶需求的滿足程度來反映。統(tǒng)計方案設(shè)計因素、環(huán)境因素以及統(tǒng)計人員因素是三個外生潛變量,同樣需要通過一系列外生觀測變量來反映。通過文獻(xiàn)分析及多輪次的頭腦風(fēng)暴,本文選取了4大類共計18項影響因素作為本文的研究變量。能源統(tǒng)計數(shù)據(jù)質(zhì)量的影響因素如圖1所示。
圖1 能源統(tǒng)計數(shù)據(jù)質(zhì)量影響因素
通過文獻(xiàn)分析,結(jié)合本文建立的模型,做出如下假設(shè):
(1)基于潛變量之間關(guān)系的假設(shè)
假設(shè)1:假設(shè)統(tǒng)計方案設(shè)計因素、環(huán)境因素以及統(tǒng)計人員因素對能源統(tǒng)計數(shù)據(jù)質(zhì)量具有影響;
假設(shè)2:假設(shè)統(tǒng)計方案設(shè)計因素、統(tǒng)計人員因素受環(huán)境因素的影響;
假設(shè)3:假設(shè)統(tǒng)計人員因素受統(tǒng)計方案設(shè)計因素的影響。
(2)基于潛變量與觀測變量之間關(guān)系的假設(shè)
假設(shè)4:能源統(tǒng)計數(shù)據(jù)質(zhì)量可以用數(shù)據(jù)的準(zhǔn)確性、數(shù)據(jù)的可得性、數(shù)據(jù)的完整性、數(shù)據(jù)的空間時間一致性、數(shù)據(jù)的時效性以及對用戶需求的滿足程度來反映;
假設(shè)5:統(tǒng)計方案設(shè)計因素可以用統(tǒng)計方法的健全性、調(diào)查方式的多樣性、統(tǒng)計方案的可操作性以及統(tǒng)計流程的規(guī)范性來反映;
假設(shè)6:環(huán)境因素可以用資源配置水平、信息化水平、審核制度以及被調(diào)查者的合作化程度來反映;
假設(shè)7:統(tǒng)計人員因素可以用人員數(shù)量、人員穩(wěn)定性、人員基本素質(zhì)以及人員業(yè)務(wù)素質(zhì)來反映。
(3)基于內(nèi)生觀測變量之間關(guān)系的假設(shè)
假設(shè)8:假設(shè)數(shù)據(jù)的空間時間一致性受數(shù)據(jù)的準(zhǔn)確性、可得性、完整性和時效性影響;
假設(shè)9:假設(shè)對用戶需求的滿足程度受數(shù)據(jù)的準(zhǔn)確性、可得性、完整性、空間時間一致性以及時效性的影響。
根據(jù)研究需要,共發(fā)放了200份調(diào)查問卷,回收167份,有效問卷145份,問卷有效回收率72.5%。問卷的測量題目均采用李克特7點量表法測量,“7”代表非常符合,“1”代表非常不符合。
運(yùn)用SPSS16.0進(jìn)行探索性因子分析。各變量間的相關(guān)系數(shù)大部分都在0.4~0.8之間,說明進(jìn)行因子分析的必要性。限于篇幅,本文在此不再列出變量間的相關(guān)系數(shù)矩陣。效度檢驗結(jié)果見表2。從表2可以看出,本文KMO統(tǒng)計量檢驗取值0.864,根據(jù)統(tǒng)計學(xué)家Kaiser給出的標(biāo)準(zhǔn),KMO取值大于0.7,適合進(jìn)行因子分析;同時,在本文給定顯著性水平0.05的條件下,K方統(tǒng)計量較大,且P值小于0.05,通過了Bartlett球形檢驗。
根據(jù)表3所示的方差貢獻(xiàn)率表可以看出,通過因子分析,模型自動提取出3個主成分,12個外生觀測變量能夠解釋總方差的64.262%,涵蓋了原始數(shù)據(jù)的大部分信息。從中可以看出,旋轉(zhuǎn)前的3個主成分分別能夠解釋原有12個外生觀測變量總方差的45.501%、10.102%和8.659%,累積方差貢獻(xiàn)率達(dá)到64.264%,能夠從總體上反映原有變量的大部分信息。另外,因子旋轉(zhuǎn)后累積方差并沒有改變,但重新分配了各個因子解釋原有變量的方差,改變了各個因子的方差貢獻(xiàn),使得因子更易于解釋。
表2 KMO統(tǒng)計量和Bartlett球形檢驗
表3 方差貢獻(xiàn)率表
信度表示對于同樣的對象,運(yùn)用同樣的觀測方法得出同樣觀測數(shù)據(jù)結(jié)果的可能性[5]。通常用量表的內(nèi)部一致性來進(jìn)行信度測試。Cronbach α系數(shù)是檢驗量表的內(nèi)部一致性指標(biāo),介于0到1之間,α值越大表示信度越高。根據(jù)學(xué)者研究,Cronbach α系數(shù)信度一般介于0.7~0.9之間,都可算是高信度值[11]。運(yùn)用SPSS16.0進(jìn)行信度分析,可以得出,本文設(shè)計的問卷量表的Cronbach α系數(shù)達(dá)到0.929,說明信度較高。
依據(jù)研究對象的特點,選取結(jié)構(gòu)方程模型作為研究工具。模型構(gòu)建如下:首先,以能源統(tǒng)計數(shù)據(jù)質(zhì)量作為內(nèi)生潛變量,通過6個觀測變量來體現(xiàn);其次,以統(tǒng)計方案設(shè)計因素、環(huán)境因素以及統(tǒng)計人員因素3項因素作為外生潛變量,分別通過4個觀測變量來體現(xiàn);最后,以調(diào)查問卷題目的協(xié)方差矩陣作為基礎(chǔ)數(shù)據(jù)。利用結(jié)構(gòu)方程軟件AMOS7.0,得到相應(yīng)的驗證性因子模型,如圖2所示。
圖2 能源統(tǒng)計數(shù)據(jù)質(zhì)量影響因素結(jié)構(gòu)方程模型
將數(shù)據(jù)導(dǎo)入AMOS7.0,建立結(jié)構(gòu)方程路徑圖,進(jìn)行模型估計與檢驗,分析顯示:
(1)各潛變量之間的路徑系數(shù)相應(yīng)的P值均小于0.05,說明假設(shè)1、2、3中描述的潛變量之間的關(guān)系在90%的置信度上顯著,即可以說明各潛變量之間具有一定的相關(guān)關(guān)系。
(2)各潛變量與觀測變量間的載荷系數(shù)相應(yīng)的P值除ξ3→x12為0.07以外,均小于0.05,說明假設(shè)4、5、6、7中所描述的潛變量與觀測變量之間的關(guān)系在90%的置信度上顯著,即可以說明利用絕大多數(shù)觀測變量來反映潛變量是合理的。
(3)各內(nèi)生觀測變量之間的載荷系數(shù)相應(yīng)的P值除y2→y4以外,均大于0.05,說明假設(shè)8、9中描述的內(nèi)生觀測變量之間的關(guān)系在90%的置信度上不顯著,即可以說明絕大多數(shù)內(nèi)生觀測變量之間的相關(guān)關(guān)系是不顯著的。
依據(jù)相應(yīng)檢驗標(biāo)準(zhǔn)[6~7],通過6個步驟對模型進(jìn)行修正:第一,修正因子負(fù)荷Λx、Λy;第二,修正因子之間的協(xié)方差矩陣φ;第三,修正測量誤差的協(xié)方差Td、Te;第四,修正路徑系數(shù)B;第五,修正路徑系數(shù)Γ;第六,修正殘差項的協(xié)方差矩陣Ψ。在上述每個步驟中,都要依據(jù)模型給出的修正建議進(jìn)行修正,并重新檢驗參數(shù)。針對每個步驟不斷重復(fù)這些過程,直到模型參數(shù)滿足標(biāo)準(zhǔn)需要。修正后的模型各擬合指標(biāo)如表4所示。
表4 修正后的擬合指標(biāo)
從表4中可以看出,c2/df<3,說明模型與現(xiàn)實情況擬合好;除CFI以外,其余GFI、NFI、IFI均大于0.9,說明模型擬合好;RMSEA<0.05,表明模型與數(shù)據(jù)擬合程度較好??傮w上看,能源統(tǒng)計數(shù)據(jù)影響因素結(jié)構(gòu)方程模型擬合程度較好,具有一定的有效性。
首先,統(tǒng)計方案設(shè)計因素、環(huán)境因素以及統(tǒng)計人員因子對能源統(tǒng)計數(shù)據(jù)的質(zhì)量具有顯著的影響;其次,環(huán)境因素對于統(tǒng)計方案設(shè)計因素以及統(tǒng)計人員因素具有顯著的影響;再次,統(tǒng)計方案設(shè)計因素對于統(tǒng)計人員因素具有顯著的影響。因此,應(yīng)在對統(tǒng)計數(shù)據(jù)質(zhì)量環(huán)境進(jìn)行一定控制的前提下,著重加強(qiáng)統(tǒng)計方案的設(shè)計工作,并提高統(tǒng)計人員的數(shù)量、質(zhì)量與穩(wěn)定性。
首先,在統(tǒng)計方案的設(shè)計因素方面,按照估計的路徑系數(shù)由強(qiáng)到弱依次進(jìn)行控制的是:統(tǒng)計方法的健全性、統(tǒng)計方案的可操作性、統(tǒng)計流程的規(guī)范性、調(diào)查方式的多樣性;其次,在環(huán)境因素方面,按照估計的路徑系數(shù)由強(qiáng)到弱依次進(jìn)行控制的是:被調(diào)查者的合作化程度、資源配置水平、信息化水平、審核制度;再次,在統(tǒng)計人員因素方面,按照估計的路徑系數(shù)由強(qiáng)到弱依次進(jìn)行控制的是:人員基本素質(zhì)、人員數(shù)量、人員的穩(wěn)定性、人員的業(yè)務(wù)素質(zhì)。
雖然大部分變量之間的關(guān)系并未通過顯著性檢驗,但是通過分析我們可以看出,對用戶需求的滿足程度受到數(shù)據(jù)的時效性、可得性、完整性、空間時間一致性以及準(zhǔn)確性的影響;而數(shù)據(jù)的空間時間一致性受到時效性、完整性以及準(zhǔn)確性的影響。因此,對于數(shù)據(jù)的質(zhì)量,應(yīng)重點控制其準(zhǔn)確性、時效性以及完整性,在此基礎(chǔ)上追求數(shù)據(jù)的可得性、空間時間一致性,最終滿足用戶對數(shù)據(jù)的需求。
[1]茍巧玲.普查數(shù)據(jù)質(zhì)量控制存在的主要問題及建議[J].統(tǒng)計與咨詢,2010,(2).
[2]許永洪.統(tǒng)計數(shù)據(jù)質(zhì)量的基本概念與數(shù)據(jù)質(zhì)量評估的基本模型[J].商業(yè)經(jīng)濟(jì)與管理,2010,(12).
[3]李懷組.管理研究方法論(第2版)[M].西安:西安交通大學(xué)出版社,2004.
[4]林嵩,姜彥福.結(jié)構(gòu)方程模型理論及其在管理研究中的應(yīng)用[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2006,(2).
[5]Karen Weber Cullen,Kathy Watson,Issa Zaker I.Relative Reliability and Validity of the Block Kids Questionnaire among Youth Aged 10 to 17 Years[J].Journal of the American Dietetic Association,2008,108(5).
[6]易丹輝.結(jié)構(gòu)方程模型方法與應(yīng)用[M].北京:中國人民大學(xué)出版社,2008.
[7]Paul Barrett.Structural Equation Modeling:Adjudging Model Fit[J].Personality and Individual Differences,2007,42(5).