亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

關(guān)于二階PLS-PM模型中權(quán)重估計(jì)算法的探討

2011-03-09 06:37:36趙萍

統(tǒng)計(jì)與決策 2011年13期

趙萍

（1.中國(guó)人民大學(xué) 統(tǒng)計(jì)學(xué)院，北京 100872；2.澳門大學(xué) 科技學(xué)院數(shù)學(xué)系,澳門 3001)

0 引言

二階PLS-PM模型（PLS Path Model）首先由H.Wold（1982）提出模型的基本設(shè)計(jì)。Lohmoller（1989）列出了各種外、內(nèi)權(quán)重估計(jì)模式組合，以及得到的不同結(jié)果。2001年C. Guinot（2001）將PLS-PM模型與復(fù)數(shù)據(jù)表分析相結(jié)合構(gòu)建二階PLS-PM模型，并將其應(yīng)用于法國(guó)女性的化妝品使用習(xí)慣中。王惠文（2004），鮮思東(2010),，葉明（2010）,阮敬（2006），劉旭華（2008）將其應(yīng)用于（在多個(gè)領(lǐng)域）建立綜合評(píng)價(jià)指數(shù)，都采用了外部權(quán)重估計(jì)模式A及內(nèi)部權(quán)重估計(jì)重心模式C對(duì)模型進(jìn)行估計(jì)，結(jié)果是各個(gè)一階潛變量均被賦予了相同的內(nèi)部權(quán)重，各個(gè)顯變量也被賦予了幾乎“相同”的外部權(quán)重。正如王惠文在文中所指出，“在實(shí)際問(wèn)題的評(píng)估中，代表不同概念的變量組其重要程度是不一樣的，應(yīng)該具有不同的權(quán)重”，并建議對(duì)此做進(jìn)一步研究。為此，本文將著重對(duì)二階PLS-PM模型在實(shí)際應(yīng)用中的權(quán)重估計(jì)算法模式選擇問(wèn)題進(jìn)行研究：首先討論不同權(quán)重估計(jì)算法模式的統(tǒng)計(jì)意義，以便應(yīng)用時(shí)能正確地作出選擇。由于權(quán)重估計(jì)模式組合不同，模型的優(yōu)化目標(biāo)及作用不同，分析說(shuō)明的問(wèn)題也就不同，如果不能正確選擇，導(dǎo)致結(jié)果可能與預(yù)期不符。其次，討論各種權(quán)重估計(jì)模式組合下，模型不同的優(yōu)化結(jié)果。然后，采用蒙特卡羅模擬方法證明，在二階PLSPM模型中，采用模式A得到的權(quán)重有嚴(yán)重的趨同現(xiàn)象，不能很好地反映實(shí)際問(wèn)題中的信息差別。而模式B得到的權(quán)重具有反映相對(duì)貢獻(xiàn)的效果，具有實(shí)際應(yīng)用價(jià)值。模式A估計(jì)的參數(shù)較穩(wěn)定；模式B估計(jì)的參數(shù)穩(wěn)定性不如模式A,但在一定條件下可以通過(guò)參數(shù)檢驗(yàn)。

1 二階PLS-PM模型簡(jiǎn)介

1.1 模型的基本設(shè)定

二階PLS-PM模型由外部區(qū)組模型與內(nèi)部遞階結(jié)構(gòu)模型兩部分組成（詳見 H.Wold 1982,，Lohmoller 1989，C. Guinot 2001）。假設(shè)對(duì)J個(gè)區(qū)組的顯變量Xj={xj1，…，xjk，…xjkj}均有n個(gè)樣本觀測(cè)值，所有顯變量xjk都是中心化的變量。每一區(qū)組顯變量Xj的所有信息通過(guò)其一階潛變量ηj來(lái)傳遞，即有外部區(qū)組模型①外部區(qū)組模型沒(méi)有“構(gòu)成型”模型，只有唯一的“反映型”外部模型（1）（H.Wold,1982），但在模型估計(jì)算法中，外部模型有模式 A（向外虛線表示）和模式B（向內(nèi)虛線表示）兩種外部權(quán)重估計(jì)算法。使用模式B外部權(quán)重估計(jì)算法并不等于“構(gòu)成型模型”。不可將模型和模型的估計(jì)算法相混淆。模型不同的權(quán)重估計(jì)模式?jīng)Q定了模型不同的優(yōu)化目標(biāo)。：

J個(gè)區(qū)組的一階潛變量ηj之間并非完全獨(dú)立，卻又沒(méi)有特定的因果關(guān)系，但存在公共結(jié)構(gòu)/內(nèi)在關(guān)聯(lián)。設(shè)定內(nèi)部結(jié)構(gòu)模型，目標(biāo)是用二階潛變量ξ來(lái)概括/反映一階潛變量ηj之間的公共結(jié)構(gòu)/內(nèi)在關(guān)聯(lián)信息。內(nèi)部遞階結(jié)構(gòu)模型（即一階LVηj與二階LVξ之間的模型）形式有兩種選擇。外散二階模型（由二階LVξ指向一階LVηj）有J個(gè)內(nèi)部模型關(guān)系；內(nèi)收二階模型 (由一階ηj指向二階ξ)有一個(gè)內(nèi)部模型關(guān)系（H. Wold，1982）。如果二階ξ為構(gòu)成型LV，一階ηj為其構(gòu)成要素，而且我們的研究目標(biāo)是用二階ξ來(lái)概括一階ηj（或通過(guò)一階預(yù)測(cè)二階ξ），應(yīng)選擇二階內(nèi)收結(jié)構(gòu)模型：

圖1 二階pls-pm模型設(shè)定圖（模型設(shè)定圖用實(shí)線表示）

如果二階ξ為反映型LV，一階ηj為其反映指標(biāo)，應(yīng)選擇二階外散結(jié)構(gòu)模型：

分別對(duì)（1）、（2a）、(2b)模型做條件期望假設(shè)。

1.2 權(quán)重估計(jì)算法的基本設(shè)定

輔助估計(jì)關(guān)系：H.Wold(1982)提出，重復(fù)使用MVs來(lái)估計(jì)二階PLS路徑模型，如圖2所示。所有MVs都用兩次，一次用作ηj的指標(biāo)，一次用作ξ的輔助指標(biāo)并放在ξ的后面。

圖2 PLS-PM權(quán)重估計(jì)算法設(shè)定圖（估計(jì)算法設(shè)定圖用虛線表示）

二階PLS-PM模型一方面可以直接求出各階潛變量LVs得分估計(jì)值,并確定各個(gè)顯變量MV對(duì)構(gòu)建一階LV的貢獻(xiàn)及一階LV對(duì)構(gòu)建二階LV的貢獻(xiàn)；另一方面，二階LV既對(duì)所有原始顯變量的代表性最好，又可以由所有一階潛變量進(jìn)行解釋，可以作為概括原始顯變量信息的綜合指標(biāo)。然而，對(duì)同一個(gè)二階外散/內(nèi)收模型，有12種權(quán)重估計(jì)算法模式組合（外部關(guān)系與輔助關(guān)系有AA、AB、BA、BB,內(nèi)部有C、F、P），不同的權(quán)重估計(jì)模式組合會(huì)得到不同的模型估計(jì)結(jié)果。

2 各種權(quán)重估計(jì)算法模式的統(tǒng)計(jì)意義及其選擇原則

2.1 外部權(quán)重估計(jì)算法模式A、B的統(tǒng)計(jì)意義

每一個(gè)LV的外部權(quán)重估計(jì)有兩種算法選擇：模式A及模式B。外部權(quán)重估計(jì)算法模式的選擇是模型估計(jì)的關(guān)鍵，它決定了模型的優(yōu)化目標(biāo)。下面對(duì)這兩種算法模式A、B的統(tǒng)計(jì)意義進(jìn)行較為詳細(xì)的闡述。

為了得到潛變量LV的外部估計(jì)值，即一階LV:Yj=(Xjwj) *和二階LV:Y=（Xw）*，首先要對(duì)外部權(quán)重wj及w進(jìn)行估計(jì)。模式A用簡(jiǎn)單回歸系數(shù)Xj=wjZj來(lái)估計(jì)外部權(quán)重wj；模式B用多元回歸系數(shù)Zj=wjXj來(lái)估計(jì)外部權(quán)重wj。其中Zj為一階LV的內(nèi)部估計(jì)值。

2.1.1 模式A

因?yàn)閏ov(Xj,Zj)=cov(wjZj,Zj)=wjvar(Zj)=wj，即權(quán)重等于協(xié)方差，算法模式A的權(quán)重只考慮每個(gè)MV與其LV的協(xié)方差關(guān)系，沒(méi)有考慮MV與區(qū)組其他MVs的內(nèi)部相關(guān)。

模式A的優(yōu)化目標(biāo)是，尋找ηj的估計(jì)值Yj達(dá)到條件最小化該區(qū)組每個(gè)MV的殘差方差，在收斂的極限，所有MVs的殘差方差聯(lián)合最小化。即在其他參數(shù)給定的條件下，達(dá)到該區(qū)組LV對(duì)MVs的最佳預(yù)測(cè)，MVs為最佳預(yù)測(cè)子。因此，模式A多適用于因變量LV。

模式A中權(quán)重為簡(jiǎn)單回歸系數(shù)，即以載荷作為權(quán)重（此時(shí)權(quán)重與載荷成比例）來(lái)估計(jì)LV值。由于載荷測(cè)量的是每個(gè)MV單獨(dú)/獨(dú)立反映潛在LV的能力；而每個(gè)MV的權(quán)重反映它對(duì)構(gòu)建LV的貢獻(xiàn)。因此，用模式A估計(jì)時(shí)，是以每個(gè)MV獨(dú)立反映潛在LV的能力作為權(quán)重來(lái)構(gòu)建LV的估計(jì)值。由于此時(shí)權(quán)重為每個(gè)MV對(duì)LV的獨(dú)立的貢獻(xiàn)，沒(méi)有研究每個(gè)MV在LV中的相對(duì)重要性。因此，模式A多適用于反映型LV。

2.1.2 模式B

模式B的優(yōu)化目標(biāo)是，尋找ηj的估計(jì)值Yj達(dá)到條件最小化該LV的殘差方差；即在其他區(qū)組參數(shù)給定的條件下，達(dá)到MVs對(duì)該區(qū)組LV的最佳預(yù)測(cè)，LV為最佳預(yù)測(cè)子。因此模式B多適用于自變量LV。

模式B中外部權(quán)重為多元回歸系數(shù)，即以多元回歸系數(shù)為權(quán)重來(lái)估計(jì)LV值。用模式B估計(jì)時(shí)，是以每個(gè)MV對(duì)LV的相對(duì)貢獻(xiàn)作為權(quán)重來(lái)構(gòu)建LV的估計(jì)值。權(quán)重反映一個(gè)區(qū)組中每個(gè)MV（相對(duì)于區(qū)組整體MVs）對(duì)LV的相對(duì)貢獻(xiàn)。因此，在實(shí)際應(yīng)用中,模式 B中每個(gè)MV的權(quán)重即為其相對(duì)重要性。需要指出，外部權(quán)重只代表該區(qū)組內(nèi)的MVs間的相對(duì)重要性，不能與其他區(qū)組的權(quán)重進(jìn)行比較。因構(gòu)成型 LV中，MVs的作用取決于它預(yù)測(cè)其LV的能力。因此構(gòu)成型LV多采用模式B估計(jì)。用模式B估計(jì)時(shí)，要求MVs之間不存在或存在較小的多重共線性。

2.2 內(nèi)部權(quán)重估計(jì)算法模式C、F、P的統(tǒng)計(jì)意義

(1)重心模式C(Centroid)，e.j=ej.=sign(corr(Yj.Y))=+1。重心模式C僅利用一階LVs與二階LV間的關(guān)聯(lián)關(guān)系，賦予相同的內(nèi)部權(quán)重，而不考慮相關(guān)的強(qiáng)度及因果關(guān)系。

(2)因子模式F(Factor)，e.j=ej.=corr(Yj,Y)。因子模式F考慮各個(gè)一階LV與二階LV間的相關(guān)大小，內(nèi)部權(quán)重為相關(guān)強(qiáng)度，但不考慮結(jié)構(gòu)模型關(guān)系。

(3)路徑模式P(Path)，既考慮一階LVs與二階LV間相關(guān)強(qiáng)度，又考慮他們的結(jié)構(gòu)關(guān)系。內(nèi)收模型中內(nèi)部權(quán)重e.j用Y對(duì)Y1,…,YJ的多元回歸系數(shù)；外散模型中內(nèi)部權(quán)重e.j用Yj對(duì)的簡(jiǎn)單回歸系數(shù)，此時(shí)e.j=ej.=corr(Yj,Y)，權(quán)重值等于因子模式F時(shí)的權(quán)重值，結(jié)果與采用因子模式?jīng)]有差別.雖然三種內(nèi)部權(quán)重估計(jì)模式的統(tǒng)計(jì)意義不同，但因?yàn)闈撟兞縇V的值主要由外部權(quán)重加權(quán)得到，模型的參數(shù)值差別不大。

表1 不同的外部、內(nèi)部權(quán)重估計(jì)算法模式組合

3 不同的外部、內(nèi)部權(quán)重估計(jì)算法模式組合，得到不同的二階PLSPM模型優(yōu)化目標(biāo)

由于不同的外部、內(nèi)部權(quán)重估計(jì)模式，及不同的估計(jì)模式組合，將使得模型的優(yōu)化目標(biāo)和作用不同，因此分析說(shuō)明的問(wèn)題不同；如果不能正確選擇，可能導(dǎo)致模型優(yōu)化目標(biāo)及應(yīng)用結(jié)果與期望解決的問(wèn)題不符。因此,以下對(duì)此進(jìn)行說(shuō)明。表2列出了所有系統(tǒng)的權(quán)重估計(jì)算法模式的組合及其應(yīng)用結(jié)果。

組合#2是Lohmoller’s分組主成分分析采用外部模式A、輔助模式A及內(nèi)部模式P情況下,得到所有X的第一主成分Y=(wX)*，各個(gè)區(qū)組Xj的主成分Yj=(wjXj)*。此時(shí)，二階LV既是所有X的主成分（MVs的最佳預(yù)測(cè)元）;也是所有一階LV的主成分（解釋最多的一階LVs的方差）；二階潛變量一方面最大程度反映所有顯變量所包含的信息；另一方面又與其他一階潛變量之間有最強(qiáng)的相關(guān)性。

組合 #7 Carroll’s一般典型相關(guān)分析。采用外部模式B、輔助模式B及內(nèi)部模式F情況下，得到Carroll’s一般典型相關(guān)分析結(jié)果即Yj與Y之間的相關(guān)平方和最大化：Max∑cor2(Yj,Y)。采用外部模式B、輔助模式B及內(nèi)部模式C情況下，得到Horst’s一般典型相關(guān)分析結(jié)果（SUMCOR標(biāo)準(zhǔn)），即Yj與Y之間的相關(guān)和最大化：Max∑cor(Yj,Y)。

組合 #1a：目前國(guó)內(nèi)應(yīng)用二階PLSPM模型建立各種綜合評(píng)價(jià)的文章中，都使用了組合#1a,即外部估計(jì)模式A及內(nèi)部估計(jì)重心模式C。上文已經(jīng)說(shuō)明，采用內(nèi)部估計(jì)重心模式C，僅考慮一階LV與二階LV的相關(guān)關(guān)系，使得各個(gè)一階LV在二階LV中均被賦予相同的權(quán)重值+1。以下將用蒙特卡羅模擬證明，采用估計(jì)模式A,外部權(quán)重也具有嚴(yán)重的“趨同性”，并解釋了造成這種趨同性的原因。因此，這種權(quán)重估計(jì)模式組合并不能很好反映實(shí)際問(wèn)題中的信息差別、不同的重要程度，從而賦予不同的權(quán)重。

組合 #4:適用于綜合評(píng)價(jià)模型。模式B得到的權(quán)重具有反映MV對(duì)LV的相對(duì)貢獻(xiàn)，反映不同數(shù)據(jù)信息的相對(duì)重要性，具有實(shí)際應(yīng)用價(jià)值。采用外部模式B（輔助模式A）及內(nèi)部權(quán)重模式P，得到最佳權(quán)重估計(jì)及最優(yōu)綜合評(píng)價(jià)結(jié)果，適用于構(gòu)成型LV的綜合評(píng)價(jià)模型。

4 蒙特卡羅模擬：比較兩種外部權(quán)重估計(jì)模式A、B所得權(quán)重值

通過(guò)模擬說(shuō)明，不同的外部權(quán)重估計(jì)模式，所反映的數(shù)據(jù)信息不同，模型估計(jì)結(jié)果不同。外部權(quán)重模式A以載荷為權(quán)重，其權(quán)重值具有趨同現(xiàn)象，不能反映各個(gè)顯變量對(duì)構(gòu)建LV的相對(duì)貢獻(xiàn)率;而模式B具有一定區(qū)別信息相對(duì)貢獻(xiàn)率的能力。

表2 外部權(quán)重估計(jì)模式A、B所得權(quán)重值比較

內(nèi)收二階模型產(chǎn)生模擬數(shù)據(jù)：X的取值樣本n=100,獨(dú)立正態(tài)分布;三個(gè)一階潛變量，每個(gè)分別有三個(gè)顯變量;一階潛變量的相關(guān)系數(shù)r=0.6,外部殘差= 0.2,路徑系數(shù)分別為0.2，0.3，0.5；二階LV估計(jì)的輔助關(guān)系采用外部權(quán)重模式A。表2中，比較一階LV外部權(quán)重模式A、B時(shí)的權(quán)重值。

模式A下同一區(qū)組MVs的權(quán)重僅僅在小數(shù)點(diǎn)第二位有微小差別，即模式A下權(quán)重具有“嚴(yán)重”趨同性。模式B下的權(quán)重區(qū)別程度較大，權(quán)重反映相對(duì)重要性，。模式A下模型的穩(wěn)定性大于模式B的穩(wěn)定性，但模式B下，模型也是穩(wěn)定的，全部通過(guò)t檢驗(yàn)。

造成模式A下權(quán)重具有“嚴(yán)重”趨同性的原因是，在二階PLSPM模型中，每個(gè)顯變量MV都使用了兩次，一次在一階LV區(qū)組中，一次在二階LV區(qū)組重復(fù)使用。此時(shí)，對(duì)同一個(gè)顯變量MV，在兩個(gè)相關(guān)的潛變量LVs（一階LV和二階LV）中的兩個(gè)“載荷”代表LVs間的結(jié)構(gòu)系數(shù)，即協(xié)方差系數(shù)，不是LV的載荷系數(shù)，即不是MVs對(duì)LV的回歸系數(shù)。由于同一個(gè)一階LV區(qū)組內(nèi)的各個(gè)MVs載荷均反映該LV與二階LV的協(xié)方差系數(shù)，因而載荷取值嚴(yán)重趨同。由于權(quán)重估計(jì)模式A是以LV在MV中的“載荷”為權(quán)重由此權(quán)重也就會(huì)具有嚴(yán)重的趨同現(xiàn)象。

5 結(jié)論

研究結(jié)果表明，兩種外部權(quán)重估計(jì)模式A、B及三種內(nèi)部權(quán)重模式C、F、P具有不同的統(tǒng)計(jì)意義；尤其是不同的外部權(quán)重估計(jì)模式?jīng)Q定了不同的模型優(yōu)化目標(biāo)。模式A條件最小化區(qū)組每個(gè)MV的殘差方差，LV為最佳預(yù)測(cè)元；模式B條件最小化LV的殘差方差，LV為最佳預(yù)測(cè)子。模式A適用于反映型、因變量LV；模式B適用于構(gòu)成型、自變量LV。模式A下的權(quán)重反映每個(gè)MV對(duì)LV的獨(dú)立的貢獻(xiàn)，模式B下的權(quán)重反映一個(gè)區(qū)組中每個(gè)MV（相對(duì)于區(qū)組整體MVs）對(duì)LV的相對(duì)貢獻(xiàn)。

二階PLSPM模型中，各種不同的估計(jì)模式組合下，模型的優(yōu)化結(jié)果不同。采用蒙特卡羅模擬方法，證明了采用模式A得到的權(quán)重有趨同現(xiàn)象，不能很好地反映實(shí)際問(wèn)題中的信息差別。而模式B得到的權(quán)重具有反映相對(duì)貢獻(xiàn)的效果，具有實(shí)際應(yīng)用價(jià)值。模式A估計(jì)的參數(shù)較穩(wěn)定；模式B估計(jì)的參數(shù)穩(wěn)定性不如模式A,但在一定條件下可以通過(guò)參數(shù)檢驗(yàn)。外部權(quán)重模式B（輔助權(quán)重模式A）及內(nèi)部權(quán)重路徑模式P適用于估計(jì)二階內(nèi)收PLS-PM模型，外部權(quán)重及內(nèi)部權(quán)重均為相對(duì)貢獻(xiàn)率，從而達(dá)到最佳綜合評(píng)價(jià)的目標(biāo)。但需要事先對(duì)顯變量MVs進(jìn)行“因子分析”，消除或減輕多重共線性的影響，提高穩(wěn)定性。此結(jié)論適用于構(gòu)成型一階及二階潛變量。

[1]Wold H.Soft Modelling:the Basic Design and Some Extensions [J].System Under indirect Observation:Causality,Structure,Prediction,North Holland,Amsterdam,1982，（2）.

[2]Lohm?ller J.-B.LatentVariablesPath Modelingwith Partial Least Squares[M].Heildelberg，Physica-Verlag 1989.

[3]Guinot,C.,Latreille,J.,Tenenhaus,M.PLS Path Modeling and Multiple Table Analysis.Application to the Cosmetic Habits of Women in Ile-de-France[J].Chemometrics and Intelligent Laboratory Systems，2001，58.

[4]王惠文，付凌暉.PLS路徑模型在建立綜合評(píng)價(jià)指數(shù)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐，2004，10(10).

[5]鮮思東，楊春德.基于PLS的商業(yè)銀行BSC績(jī)效評(píng)價(jià)[J].統(tǒng)計(jì)與決策，2010,（10）.