任紅梅,王 緌
(四川大學(xué) 工商管理學(xué)院,成都 610064)
結(jié)構(gòu)方程模型(SEM)方法是在20世紀70年代中期由瑞典統(tǒng)計學(xué)家Karl G.Joreskog提出的,受到了管理學(xué)界、心理學(xué)界等社會科學(xué)研究人員的青睞。這主要是因為它具有不同于一般統(tǒng)計分析方法的優(yōu)點:(1)可以同時處理多個因變量;(2)允許自變量和因變量含有測量誤差;(3)可以同時估計因子結(jié)構(gòu)和因子關(guān)系;(4)允許更大的測量模型;(5)能夠估計整個模型的擬合程度[1][2]。
結(jié)構(gòu)方程現(xiàn)已在我國各個領(lǐng)域得到了廣泛的應(yīng)用,然而數(shù)據(jù)的輸入都是采用確定的形式,從數(shù)據(jù)的來源看,結(jié)構(gòu)方程的大多數(shù)數(shù)據(jù)是調(diào)查數(shù)據(jù),通過設(shè)置問卷的方法獲取。然而,這一過程中,存在著大量的不確定性因素。首先,備選答案之間存在中間過渡性,就具有模糊性;其次,在人類的感覺、判斷、經(jīng)驗和情緒起重要作用的領(lǐng)域,本身存在大量的模糊性因素??紤]到大量的實際決策系統(tǒng)中,有時所獲取參數(shù)信息不完全或者所獲取信息的不可量化,Liu給出了模糊集的相關(guān)理論;文獻[3]則研究了具有模糊參數(shù)的規(guī)劃問題,并通過利用模糊集理論知識,給出了相應(yīng)的算法。
不同模糊數(shù)據(jù)的可信性直接影響到結(jié)構(gòu)方程模型結(jié)果的真實性,所以,將模糊變量引到結(jié)構(gòu)方程模型,將一些邊界不清,不易定量的因素轉(zhuǎn)化了某種量化的表達形式,可以提決策的科學(xué)性與正確性。從結(jié)構(gòu)方程數(shù)據(jù)獲取的方式而言,選擇模糊結(jié)構(gòu)方程方法對模型中潛變量之間、潛變量與顯變量之間的關(guān)系系數(shù)進行估計是一條可行也是一條較好的途徑。本文擬采用模糊模擬[3]的算法,求解模糊PLS-結(jié)構(gòu)方程迭代模型。該算法既保持了原結(jié)構(gòu)方程的精華,同時又有許多良好的優(yōu)化性能。
結(jié)構(gòu)方程模型主要通過引入潛在變量來研究抽象變量之間的因果結(jié)構(gòu)關(guān)系,由測量模型和結(jié)構(gòu)模型兩部分組成。PLS作為一種求結(jié)構(gòu)解結(jié)構(gòu)方程的“軟模型”,可以明確求出潛變量估計值[4],以及用PLS求解時不需要預(yù)先假設(shè)總體數(shù)據(jù)某種分布等。本文以2個潛變量的模糊PLS-結(jié)構(gòu)方程進行研究并給出具體的求解過程。模型結(jié)構(gòu)如圖1。
圖1 模糊結(jié)構(gòu)方程模型
模糊PLS的結(jié)構(gòu)方程模型由源結(jié)構(gòu)關(guān)系和隱性結(jié)構(gòu)關(guān)系組成。
源結(jié)構(gòu)關(guān)系由兩部分組成。
1.1.1 外部關(guān)系
其中:π1h0,π2k0為截距值;π1h,π2k為載荷系數(shù);v1h,v2k為誤差(殘差)。
滿足條件假設(shè):(1)期望關(guān)系
(2)非相關(guān)性
1.1.2 內(nèi)部關(guān)系
滿足條件假設(shè):E(η|ξ)=β0+β1ξ;r(ε,η)=0
隱結(jié)構(gòu)關(guān)系包括因果預(yù)測關(guān)系和權(quán)重關(guān)系,為偏最小二乘法分析所特有的。
1.2.1 因果預(yù)測關(guān)系
由(2)和(3)可得:
其中:截距為 μ2k=π2k0+π2kβ0
殘差為 v2k=π2kε+v2k
滿足條件假設(shè):r(v2k,ξ)=0
1.2.2 權(quán)重關(guān)系
權(quán)重關(guān)系分為反映型和構(gòu)成型兩種模型,在圖1中,潛變量η屬于反映型,潛變量ξ屬于構(gòu)成型,其權(quán)重關(guān)系分別為:
設(shè)ξ為模糊變量,它的隸屬函數(shù)是μ,如果u和 r是實數(shù),那么一個模糊事件{ξ≤r}的可能性被描述為Pos{ξ≤r},模糊事件{ξ≤r}的可信為 Cr{ξ≤r}Pos{ξ≤r}+1-Pos{ξ≤r}),在此基礎(chǔ)上,Liu給出了模糊變量期望值的定義。
定義1 設(shè)ξ為模糊變量,則稱
為模糊變量的期望值(為了避免出現(xiàn)∞-∞情形,要求上式兩個積分到少有一個有限)。
那么,假設(shè) f∶Rn→R 是一個實值函數(shù),ξ=(ξ1,ξ2,…,ξn)是可能性空間(Θ,p(Θ),Pos)上的模糊向量,則 f(ξ)也是一個模糊變量,它的期望值定義為
其中:L=Cr{f(ξ)≥r}為模型事件 f(ξ)發(fā)生的可信性,可以由下式估計得到:
對帶有不確定數(shù)的數(shù)學(xué)模型,要進行計算,首先得轉(zhuǎn)化化確定性問題的求解。從模糊數(shù)的特點不難判斷,模糊PLS-結(jié)構(gòu)方程模型的解不是唯一的,而是存在無數(shù)個,根據(jù)模糊數(shù)的性質(zhì),模糊數(shù)取不同值的隸屬度一般不同,因此,由模型PLS結(jié)構(gòu)方程得出的估計值和回歸系數(shù)取不同解的可能性也一般不同。為了在目標值和可能度之間達到某種均衡或折中,我們引入模糊期望的概念,利用模糊模擬的原理,把不確定的數(shù)確定化,求解以上模型。由擴張原理知,由于所求的PLS 估計值 ω1h,ω2k,LXn,LYn都為的函數(shù),記為 f,故都為模糊變量。
以兩個潛變量的模糊PLS-結(jié)構(gòu)方程的迭代模型為例,說明求解過程。該求解過程包括兩大部分,一是運用模糊模擬的主程序;二是求解確定PLS-結(jié)構(gòu)方程模型的迭代函數(shù)f,作為代求期望的模糊向量,向量中的各個元素的期望值即為待求的原結(jié)構(gòu)方程的估計值。
2.2.1 模糊模擬
(1)置向量 e=0。
(2)分別從 Θ 中均勻產(chǎn)生 θk,使得 Pos(θk)≥ε,令 vk=Pos(θk);k=1,2,…,N。 其中 ε 是個充分小的數(shù)。
(3)置向量 a=f(ξ(θ1))∧…∧f(ξ(θN)),向量 b=f(ξ(θ1))∨…∨f(ξ(θN))。
(4)從[ai,bi]中均勻產(chǎn)生 ri,構(gòu)成向量 r。
(5)如果 ri≥0,那么 ei←ei+Cr{f(ξ)i≥ri}。
(6)如果 ri<0,那么 ei←ei-Cr{f(ξ)i≤ri}。
(7)重復(fù)步驟(4)至步驟(6)共 N 次。
(8)E[f(ξ)i]=ai∨0+b∧0+ei(bi-ai)/N
2.2.2 確定PLS-結(jié)構(gòu)方程模型的迭代原理
由模糊區(qū)間隨機產(chǎn)生的數(shù)構(gòu)成確定的輸入數(shù)據(jù)。求解步驟如下:
這里f1,f2是標準化算子。 同理可得f2
重復(fù)以上步驟直到|ω(n)-ω(n+1)|<10-5。
(2)由(1)步得出的潛變量估計值 LXn,LYn后,由以下幾個方程估計出測量模型與結(jié)構(gòu)模型系數(shù)
(3)將所求結(jié)果賦給函數(shù)f
選取學(xué)生能力與成績的一組小樣本數(shù)據(jù),對以上模糊PLS-結(jié)構(gòu)方程模型進行測試。其中潛變量ξ為學(xué)習(xí)能力,η為學(xué)習(xí)成績,其估計值分別為LX,LY。x1為IQ表現(xiàn),x2為高中時綜合成績,x3為去年學(xué)習(xí)動機得分,y1為必修課平均績點,y2為選修課平均績點。由于IQ表現(xiàn)的程度之間本身就具有過渡性,且目前較真實的IQ測量需在失重的狀態(tài)下進行才比較有效。根據(jù)相關(guān)資料和專家意見,對原始數(shù)據(jù)中x1進行模糊化 x1,為形如=(a1,a2,a3)的三角模糊數(shù),見表 1。
表1 模糊處理后的數(shù)據(jù)
表2 潛變量ξ與η的估計值LX與LY
表3 回歸系數(shù)與擬合效果
在matlab7.0下,運用以上模糊PLS-結(jié)構(gòu)方程模型實現(xiàn)程序,循環(huán)2000次,同時為了區(qū)別本文模型與傳統(tǒng)確定的PLS-結(jié)果方程模型,將對比結(jié)果列入表2、表3。
從表3可知,當用確定PLS-結(jié)構(gòu)求解時,由于忽略了大量模糊因素的存在,其結(jié)果與經(jīng)過模糊化的PLS-結(jié)構(gòu)方程有一定差別。當模糊數(shù)的置信水平取為1時,所有的模糊數(shù)都變成確定數(shù)—模糊數(shù)的主值,相當于應(yīng)用確定PLS-結(jié)構(gòu)方程模型。把IQ表現(xiàn)變量定義為三角模糊數(shù)時,與實際相吻合,得出IQ表現(xiàn)與學(xué)習(xí)能力的關(guān)系系數(shù)變小。
對回歸方程進行顯著性檢驗,確定PLS-結(jié)構(gòu)方程模型R2=0.5692(越接近1越好),擬合效果不是很好。如果此時我們把得出回歸系數(shù)解釋模型,必定不合理。相反,從模糊PLS-結(jié)構(gòu)模型得出的結(jié)果可以看出,R2=0.6703>0.5692,F(xiàn)=40.715>>F0.05(1,13)=4.67,因此,由x~1,x2,x3反映的 ξ與由 y1,y2反映的η之間線性關(guān)系顯著存在;且在一定程度上優(yōu)化了傳統(tǒng)的確定PLS-結(jié)構(gòu)方程模型。
本文系統(tǒng)研究了含有兩個潛變量的模糊PLS-結(jié)構(gòu)方程模型的求解方法,給出了具體的求解步驟,并通過算例驗證了模型有效性。由于目前結(jié)構(gòu)方程的應(yīng)用尚未直接引入模糊變量,對所有不確定變量的處理方式大多采用先確定化的方法,這種方式對以問卷獲取輸入數(shù)據(jù)為主要途徑的結(jié)構(gòu)方程模型而言是一個很大的弊端,將影響模型最終的解釋能力。所以,本文的模糊PLS-結(jié)構(gòu)方程模型方法為優(yōu)化結(jié)構(gòu)方程提供了一個有現(xiàn)實意義的數(shù)學(xué)工具;同時本文模糊模擬算法對含有兩個潛變量的模糊PLS-結(jié)構(gòu)方程具有普遍的適用性??紤]到實際中多個潛變量的情形,可結(jié)合該思想,對模型進行改進。
[1]侯杰泰,溫忠麟,成子娟.結(jié)構(gòu)方程模型及其應(yīng)用[M].北京:教育科學(xué)出版社,2004.
[2]林盛,劉金蘭,韓文秀.基于PLS-結(jié)構(gòu)方程的顧客滿意度評價方法[J].系統(tǒng)工程學(xué)報,2005,20(6).
[3]劉寶碇,趙瑞清,王綱.不確定規(guī)劃及應(yīng)用[M].北京:清華大學(xué)出版社,2003.
[4]寧祿喬,劉金蘭.兩個潛變量的PLS算法模擬數(shù)據(jù)分析[J].統(tǒng)計與決策,2007.(8).