斯介生 肖宏偉 蔣遠營
摘要:文章在總結(jié)近年來文獻成果的基礎(chǔ)上,通過分析兩類結(jié)構(gòu)方程模型的理論本質(zhì),指出了這兩種方法在綜合評價實踐中的問題,并給出正確運用這兩類方法進行綜合評價的建議。文章認為,基于協(xié)方差分析的結(jié)構(gòu)方程模型(CB-SEM)適用于評價多個指標(biāo)的相關(guān)結(jié)構(gòu)。而基于偏最小二乘的結(jié)構(gòu)方程模型(PLSPM)適用于構(gòu)建綜合指數(shù)進行綜合評價。
關(guān)鍵詞:協(xié)方差分析;偏最小二乘;結(jié)構(gòu)方程模型;綜合評價
一、 引言
近年來,綜合評價方法有了更多的發(fā)展。更為復(fù)雜的統(tǒng)計模型被引入到綜合評價領(lǐng)域,其中,結(jié)構(gòu)方程模型就是最近幾年經(jīng)常被用于綜合評價的新方法之一。結(jié)構(gòu)方程模型是潛變量模型與路徑分析模型的結(jié)合,可以分析不能被直接觀測的潛在概念間的關(guān)系,因而在社會學(xué)、心理學(xué)、教育學(xué)、市場研究等學(xué)科中有著獨特優(yōu)勢。從參數(shù)估計的角度分,有兩種類型,一種基于方差-協(xié)方差分析(CB-SEM),另一種基于偏最小二乘(PLSPM)。通過查閱近幾年的文獻發(fā)現(xiàn),兩類方法的綜合評價研究都有不少成果。例如,前者的文獻涉及的領(lǐng)域有:醫(yī)學(xué)(劉享輝等,2009;劉嶺等,2009),教育(周平紅等,2011;王理峰,2012),管理(任飏等,2007;谷曉燕,2009),經(jīng)濟發(fā)展(高文杰和高旭,2010;張瑛和王惠文,2008),競爭力評價(易麗蓉,2006;羅玉波和王玉翠,2013)等等。后者涉及的領(lǐng)域有:醫(yī)學(xué)(楊威和張拓紅,2012),教育(孫繼紅等,2010),管理(莫一魁和沈旅歐,2009;鮮思東和彭作祥,2011;林盛,劉金蘭和韓文秀,2005;關(guān)子明等2009,區(qū)晶瑩等,2011),經(jīng)濟發(fā)展(阮敬和紀宏,2006)等等??梢?,兩類方法在綜合評價應(yīng)用的領(lǐng)域有很多交叉。并且,從目前的研究成果可以看出,兩類方法進行綜合評價的方式也基本類似,都通過設(shè)計指標(biāo)體系,建立理論模型,然后計算綜合指數(shù)得分實現(xiàn)綜合評價。但是,從統(tǒng)計學(xué)方法論角度而言,這兩類方法的除了目標(biāo)都是路徑模型之外,沒有任何內(nèi)容上的交叉(吳喜之,2013),因此模型的實質(zhì)和解釋都有很大差異。為此筆者認為,在綜合評價實踐中,兩類方法不能用相似的方式應(yīng)用,但是如何區(qū)分對待?目前為止,鮮有文獻對此問題做出明確回答。本文將圍繞該問題,結(jié)合結(jié)構(gòu)方程模型理論要點和綜合評價要求,分析如何正確使用這兩類結(jié)構(gòu)方程模型進行綜合評價,并給出建議。
二、 兩類結(jié)構(gòu)方程模型的理論要點
雖然兩類結(jié)構(gòu)方程模型在理論上有差別,但是在實際建模中,都需要事先設(shè)計指標(biāo)體系,設(shè)定理論模型,才能進行估計。指標(biāo)體系和理論模型的設(shè)定由實際問題的理論背景支撐,模型的估計有現(xiàn)成的軟件,例如CB-SEM的常用軟件有AMOS,而PLSPM則有smartPLS等,因此,應(yīng)用這兩類方法正確與否的關(guān)鍵在于對模型估計的理解。為此我們分析兩類結(jié)構(gòu)方程模型參數(shù)估計的理論要點。
1. CB-SEM的參數(shù)估計。CB-SEM由結(jié)構(gòu)模型和測量模型組成,分別刻畫潛變量與潛變量之間的關(guān)系,潛變量與可測變量之間的關(guān)系。建模時,需要對可測變量劃分為不同的組,每組對應(yīng)一個潛變量,并且設(shè)定好潛變量與可測變量以及潛變量與潛變量之間的關(guān)系。關(guān)于模型的表達式參見易丹輝(2008)。關(guān)于模型的參數(shù)估計,有很多種方法,在實際應(yīng)用中常見的估計方法為似然方法,其擬合函數(shù)為:
FML=ln|?撞(?茲)|+tr(S?撞-1(?茲))-ln|S|-(p+q)
這里的p和q分別為內(nèi)生可測變量和外生可測變量的個數(shù)。還有一些其他方法,如未加權(quán)最小二乘,擬合函數(shù)為:
FULS=■tr[(S-?撞(?茲))2]
以及使得擬合函數(shù)
FGLS=■tr{[(S-?撞(?茲))W-1]2}
最小的廣義最小二乘方法。此外,還有利用工具變量的兩步最小二乘等。其中,S為總體協(xié)方差矩陣,用樣本協(xié)方差矩陣代替。?撞(?茲)為模型預(yù)測值的協(xié)方差矩陣,含有未知參數(shù)?茲,這些方法最終都可以歸結(jié)為?撞(?茲)與S盡可能接近的原理,即協(xié)方差矩陣的重復(fù)問題。如果模型是正確的,協(xié)方差矩陣就可以被準確地重復(fù)出來,這是CB-SEM參數(shù)估計的出發(fā)點和核心。
我們指出兩點需要注意的地方:
(1)由模型產(chǎn)生的協(xié)方差矩陣?撞(?茲)重復(fù)的是總體協(xié)方差矩陣S,但是在實際應(yīng)用中,總體協(xié)方差矩陣不可能知道,為此實際中的S是樣本協(xié)方差矩陣。這就導(dǎo)致了代替的合理性問題,即樣本協(xié)方差矩陣能在多大程度上反映總體協(xié)方差矩陣呢?這個問題很難回答,但是如果樣本量不夠的話,代表性一定不好。這就要求在實際中使用大樣本,使得樣本協(xié)方差矩陣能夠更好地刻畫總體協(xié)方差矩陣。
(2)可測變量的總體協(xié)方差矩陣刻畫了各變量間的相關(guān)關(guān)系,因此,?撞(?茲)對總體協(xié)方差矩陣的重復(fù)本質(zhì)上是用總體協(xié)方差矩陣去考察模型所設(shè)定的不同組可測變量間關(guān)系的合理性,如果參數(shù)通過顯著性檢驗和合理性檢驗,就認為模型設(shè)定的關(guān)系得到了總體信息的驗證。這意味著CB-SEM首先是一種驗證性的方法,驗證的是模型設(shè)定的結(jié)構(gòu)。本質(zhì)上是各可測變量間的相關(guān)關(guān)系。為此需要注意,CB-SEM只是刻畫了不同組可測變量間的相關(guān)結(jié)構(gòu),并通過潛變量具體表達。至于各組可測變量能在多大程度上被對應(yīng)的潛變量刻畫,該方法并不能回答。
2. PLSPM的參數(shù)估計。相比CB-SEM,PLSPM完全是另外一套邏輯,為了分析其特點,我們通過分析其參數(shù)估計過程入手。PLSPM的參數(shù)估計由迭代算法完成,分為兩個部分,第一部分是利用一系列最小二乘和加權(quán)運算進行迭代,得到潛變量的估計值,第二部分利用第一部分的結(jié)果得到路徑模型中的載荷系數(shù)和路徑系數(shù)。這兩部分中,第一部分是核心。
具體而言,首先要分劃好可測變量的歸屬,一個潛變量對應(yīng)一組可測變量。假設(shè)有Q個潛變量?孜1,…,?孜Q,第j個潛變量對應(yīng)的可測變量為Xj=(xj1,…,xjpj)′,j=1,…,Q。則有xjh=?姿jh?孜j+?著jh(h=1,2,…,pj)或者?孜j=?撞pjh=1wjhxjh+?著j,前者為反映型(Reflective),系數(shù)為載荷;后者為反映型(Formative),系數(shù)為權(quán)重,選擇何種形式需要根據(jù)實際問題決定,這種反映可測變量與潛變量關(guān)系的模型為測量模型。其次要設(shè)定好潛變量與潛變量之間的關(guān)系結(jié)構(gòu),即?孜i=?撞j≠i?茁ij?孜j+vij。這部分模型稱為結(jié)構(gòu)模型,模型中的系數(shù)為路徑系數(shù)。潛變量的得分(即潛變量的估計值)是進行綜合評價的關(guān)鍵,對其估計通過迭代實現(xiàn)。由三大步驟組成:
外部逼近:
Yj∝■wjhxjh
Yj是?孜j的外部逼近估計量,∝表示左邊是右邊的標(biāo)準化,Wj=(wj1,…,wjpj)′是外部權(quán)重。
內(nèi)部逼近:
Zj∝■ejiYi
其中,i:i?圮j表示與第j個潛變量直接有關(guān)的潛變量的下標(biāo)。eji是內(nèi)部權(quán)重,有三種不同的形式(Tenenhaus M 2005)。
更新權(quán)重:
內(nèi)部權(quán)重由潛變量間的結(jié)構(gòu)決定,迭代過程中需要更新的是外部權(quán)重,當(dāng)測量模型為反映型時,對于xjh,其新權(quán)重為以Zj為自變量,xjh為因變量的一元線性回歸系數(shù),但由于Zj被標(biāo)準化,因此有wjh=cov(xjh,Zj)
當(dāng)測量模型為構(gòu)成型時,新的權(quán)重以Zj為因變量,與之對應(yīng)的可測變量xjh為自變量的多元線性回歸的回歸系數(shù),即
Wj=(Xj′Xj)-1Xj′Zj
上述步驟反復(fù)迭代,直到權(quán)重變化不大,就認為收斂,得到最終的權(quán)重估計值,潛變量的得分就是可測變量的加權(quán)平均值。
通過上述對迭代過程的描述,我們也得到兩點關(guān)于PLSPM的認識:
(1)在PLSPM框架下,沒有涉及總體協(xié)方差矩陣。迭代過程完全基于樣本信息展開。事實上,Dijkstra. T(1983)證明,PLSPM的迭代本質(zhì)上是不動點的迭代算法,具體為:
反映型:Wj∝?撞i:j?圮ieji·SjiWi,其中Wj′SjjWj=1;
構(gòu)成型:Wj∝S-1jj?撞i:j?圮ieji·SjiWi,其中Wj′SjjWj=1
其中,Sji為第j組可測變量與第i組可測變量的樣本協(xié)方差矩陣,Sjj是第j組可測變量的樣本方差矩陣。
因此,PLSPM挖掘的是樣本信息,對樣本量的要求沒有CB-SEM高。
(2)PLSPM的迭代過程本質(zhì)上通過一系列的最小二乘(OLS)實現(xiàn),因此不必假定分布。另外,PLSPM的迭代事實上是不斷逼近某個潛變量估計值的過程。每次迭代都適用最小二乘,追求潛變量與可測變量間的距離最小化。因此是尋找最能刻畫可測變量的潛變量的過程。而不是CB-SEM那樣驗證可測變量間相關(guān)關(guān)系的過程。這意味著兩種方法的目的很不一樣。
三、 綜合評價中實踐中的問題和評述
將結(jié)構(gòu)方程模型引入綜合評價領(lǐng)域的優(yōu)勢已經(jīng)被很多學(xué)者認同,這是因為,在綜合評價實踐中很多方法都面臨一個共同的問題:很多方法沒有考慮到指標(biāo)變量之間的相關(guān)關(guān)系,因此,當(dāng)所選擇的指標(biāo)變量集合中存在嚴重的多重相關(guān)性時,很可能會夸大系統(tǒng)中某些特征的作用,從而得到不合理的評估結(jié)論。王惠文和付凌暉(2004),張瑛和王惠文(2008)都認為結(jié)構(gòu)方程模型可以解決這樣的問題。但是目前很多研究都利用結(jié)構(gòu)方程模型構(gòu)建綜合指數(shù)實現(xiàn)綜合評價,將兩種理論上存在差異的方法以類似的方式進行綜合評價,筆者認為需要推敲其合理性。為此我們提出:CB-SEM和PLSPM是否都可以通過構(gòu)建綜合指數(shù)實現(xiàn)綜合評價?
下面回答這個問題。我們有以下結(jié)論:
1. CB-SEM不能用于構(gòu)建綜合指數(shù)。
首先我們要明確綜合評價的要義,蘇為華(2005)指出,綜合評價需要將多個因素和指標(biāo)綜合起來,因此,綜合方法構(gòu)成了評價的基本模型。為此,利用綜合指數(shù)進行綜合評價時,對指數(shù)的基本要求是能夠概括多個指標(biāo)各方面的信息。
當(dāng)利用結(jié)構(gòu)方程模型構(gòu)建綜合指數(shù)時,這個要求就變成:首先,每個潛變量是否在某種準則下對其對應(yīng)的可測變量進行了概括。其次,這些潛變量是否反映了各組可測變量的多重相關(guān)性。對于CB-SEM而言,其參數(shù)估計方法決定了該方法構(gòu)建的綜合指數(shù)只能反映各組可測指標(biāo)的多重相關(guān)性。這是因為其參數(shù)估計依據(jù)的優(yōu)化準則本質(zhì)上都是使得由模型得到協(xié)方差矩陣逼近總體協(xié)方差矩陣。如果模型是正確的,那么總體協(xié)方差矩陣就能被準確地重復(fù)出來(易丹輝,2008),所以,模型正確是指正確反映了各組可測變量的協(xié)方差結(jié)構(gòu),即它們的多重相關(guān)性。但是每組可測變量對應(yīng)的潛變量是否將可測變量的信息進行了充分的概括,我們是不知道的。利用這樣的潛變量得分作為綜合指數(shù)不能反映真實情況。事實上,在實際應(yīng)用中,利用CB-SEM分析數(shù)據(jù)時,我們只需要知道一個樣本協(xié)方差矩陣就可以利用軟件估計。言下之意,我們不用去關(guān)心可測指標(biāo)如何取值,量綱如何等綜合評價中關(guān)鍵的問題,只要協(xié)方差矩陣相同,即使具體指標(biāo)完全不同也可以得到相同的估計結(jié)果,這個事實反過來說明CB-SEM構(gòu)建綜合指數(shù)是值得商榷的。
2. PLSPM可以構(gòu)建綜合指數(shù)。與CB-SEM不同,PLSPM的參數(shù)估計是從潛變量在平方損失角度下概括可測變量的角度出發(fā)的,其迭代過程由最小二乘和加權(quán)運算構(gòu)成,本質(zhì)上是在xjh=?姿jh?孜j+?著jh(h=1,2,…,pj)或者?孜j=?撞pjh=1wjhxjh+?著j中,使得?撞j?撞hE(?著2jh)最小或者?撞jE(?著2j)最小,且結(jié)合各潛變量之間的關(guān)系不斷迭代實現(xiàn)的參數(shù)估計。為此,利用PLSPM得到的潛變量得分是在平方損失意義下對各組可測變量的概括,符合構(gòu)建綜合指數(shù)的基本要求。相對CB-SEM,PLSPM更適合構(gòu)建綜合指數(shù)進行綜合評價。但是需要注意的是,PLSPM的最小化準則是最小化平方損失,雖然在統(tǒng)計學(xué)中,這是一種十分常用的方法。例如線性回歸模型、主成分分析、因子分析等都是如此,但是是否適用于綜合評價需要根據(jù)實際問題。關(guān)于這個問題的討論是多元統(tǒng)計方法應(yīng)用于綜合評價的共同問題,蘇為華(2000)曾詳細討論。
3. 兩類方法適用性評述。前面已經(jīng)支出,CB-SEM不適合構(gòu)建綜合指數(shù),但是不意味著這個方法在綜合評價時就一無是處。通過分析其參數(shù)估計的實質(zhì),我們認為,CB-SEM適合考察多組可測指標(biāo)間的多重相關(guān)性。如果只是通過相關(guān)系數(shù),只能很粗略地知道多個可測變量之間的相關(guān)結(jié)構(gòu)。但是通過CB-SEM可以更細致地考察多個可測指標(biāo)間的復(fù)雜結(jié)構(gòu)關(guān)系。PLSPM可以用來構(gòu)建綜合指數(shù),但其參數(shù)估計方法決定了其不能像CB-SEM那樣從整體上對所有可測指標(biāo)的相關(guān)結(jié)構(gòu)進行考察,為此有學(xué)者認為,兩種方法是互補的(邱皓政,2011)。筆者認為,這種相輔相成性是由于兩種方法處理的問題本質(zhì)上是不一樣的,實際應(yīng)用中可以將兩種方法結(jié)合起來一起使用,可能效果更好,但目前在學(xué)術(shù)界沒有看到這方面的研究。
另外,前面分析也指出兩類方法對于樣本和分布的要求是不同的。PLSPM不需要大樣本和分布假定,這被很多人認為是CB-SEM不具備的優(yōu)勢。筆者認為,進行綜合評價從統(tǒng)計學(xué)角度講是利用已有樣本信息,去推測為止的信息,本質(zhì)上是預(yù)測的過程。因此建議,無論用哪一種方法,都盡量使用大樣本,才能得到更加可信的結(jié)果。
四、 結(jié)論和建議
本文通過分析兩類結(jié)構(gòu)方程模型(CB-SEM和PLSPM)的參數(shù)估計理論,明確了兩種方法是兩種不同的方法。結(jié)合綜合評價的要求,我們有以下結(jié)論:
1. CB-SEM的參數(shù)估計過程決定了該方法不適用構(gòu)建綜合指數(shù),因為其中的潛變量在多大程度上概括了對應(yīng)的可測變量是不清楚的;
2. CB-SEM適用于評價多組可測指標(biāo)的多重相關(guān)性,利用該方法可以得到多個可測指標(biāo)間細致的相關(guān)結(jié)構(gòu)的刻畫;
3. 相比CB-SEM,PLSPM更適合用于構(gòu)建綜合指數(shù)進行綜合評價。因為,這個方法是基于平方損失下最大化概括可測指標(biāo)信息實現(xiàn)潛變量得分估計的。符合綜合評價的基本要求。
4. PLSPM沒有從整體上直接對多個可測指標(biāo)的多重相關(guān)性進行刻畫,為此從適用性上,評價多個可測指標(biāo)的相關(guān)結(jié)構(gòu)不如CB-SEM合適。從這個意義上講,兩種方法是互補的。
在實際進行綜合評價時,我們建議,首先需要明確實際問題的側(cè)重,如果側(cè)重評價多重相關(guān)結(jié)構(gòu),就推薦使用CB-SEM,如果需要構(gòu)建綜合指數(shù),就使用PLSPM。
參考文獻:
1. 高文杰,高旭.基于SEM的我國重要城市現(xiàn)代化水平綜合評價模型研究.數(shù)學(xué)的實踐與認識,2010,(18):56-64.
2. 谷曉燕.基于結(jié)構(gòu)方程模型的崗位評價研究.中國管理科學(xué),2009,(2):146-151.
3. 關(guān)子明,常文兵,王薇.基于結(jié)構(gòu)方程模型的銀行員工績效考核方法.經(jīng)濟論壇,2009,(2):108-109.
4. 劉嶺,程迪祥,陳洪,易東.結(jié)構(gòu)方程模型在綜合評價中的應(yīng)用.自動化與儀器儀表,2010,(2):74-75.
5. 劉亨輝,王建生,周脈耕,王駿,王黎君,胡以松,王玉英,葛輝,楊功煥.結(jié)構(gòu)方程模型在中國居民自報健康狀況評價中的應(yīng)用.中國健康教育,2009,(5):333-337.
6. 羅玉波,王玉翠.結(jié)構(gòu)方程模型在競爭力評價中的應(yīng)用綜述.技術(shù)經(jīng)濟與管理研究,2013,(3):21-24.
7. 林盛,劉金蘭,韓文秀.基于PLS-結(jié)構(gòu)方程的顧客滿意度評價方法.系統(tǒng)工程學(xué)報,2005,(6):653-656.
8. 莫一魁,沈旅歐.城市公交系統(tǒng)公眾評價的偏最小二乘通徑模型.深圳大學(xué)學(xué)報(理工版),2009,(4):436-440.
9. 區(qū)晶瑩,張淞琳,俞守華.基于偏最小二乘通徑模型的農(nóng)民工信息能力綜合評價.農(nóng)業(yè)系統(tǒng)科學(xué)與綜合研究,2011,(4):495-501.
10. 阮敬,紀宏.基于PLS結(jié)構(gòu)方程模型的中國西部地區(qū)經(jīng)濟發(fā)展綜合評價.統(tǒng)計教育,2006,(8):4-7.
11. 孫繼紅,楊曉江,繆榕楠.我國高等教育發(fā)展統(tǒng)計特征的PLS通徑模型分析.數(shù)理統(tǒng)計與管理,2010,(2):362-371.
基金項目:國家自然科學(xué)基金(項目號:11361019);廣西自然科學(xué)基金重點項目(項目號:2013GXNSFDA019001)。
作者簡介:斯介生,中國人民大學(xué)統(tǒng)計學(xué)院博士生;肖宏偉,中國人民大學(xué)經(jīng)濟學(xué)博士,國家信息中心經(jīng)濟預(yù)測部助理研究員;蔣遠營,中國人民大學(xué)統(tǒng)計學(xué)院博士生,桂林理工大學(xué)理學(xué)院副教授。
收稿日期:2014-09-22。