如何運(yùn)用多元特性-多重方法確定數(shù)個(gè)治理指標(biāo)的效度①

2016-04-02 05:25:19羅伯特諾依曼彼得格雷夫著闕天舒鑫編譯

探索 2016年5期

[德]羅伯特·諾依曼,[德]彼得·格雷夫著,闕天舒,蔡鑫編譯

(1.德累斯頓工業(yè)大學(xué)社會學(xué)系,德累斯頓01062;2.慕尼黑聯(lián)邦國防軍大學(xué)社會學(xué)系,慕尼黑85579;3.華東政法大學(xué)政治學(xué)研究院,上海201600)

1 導(dǎo)論

在過去20年間,有許多學(xué)者嘗試將一個(gè)國家的政府治理水平指數(shù)化,其目的是能夠?qū)抑卫砟芰M(jìn)行量化研究。我們認(rèn)為,這是一項(xiàng)艱巨的任務(wù),因?yàn)榇祟愌芯勘仨氁獜倪@個(gè)國家的微觀經(jīng)濟(jì)和宏觀經(jīng)濟(jì)兩條途徑分別出發(fā),才能夠發(fā)掘出影響國家治理的潛在因素。以前的研究在這一點(diǎn)上或多或少存在一定的問題,比如,在國家治理問題中使用的單因變量分析可能會使學(xué)者忽略指數(shù)中的部分解釋變量;而時(shí)序分析方法雖然會產(chǎn)生一些比較新穎的結(jié)果,但對國家治理這類宏大議題來說依舊缺乏足夠的說服力。因此,學(xué)者們研究一國治理問題,尤其是腐敗問題的時(shí)候會面臨非常大的挑戰(zhàn),原因就在于此[1]。

盡管所有研究者都試圖從能夠得到的首要數(shù)據(jù)、次要數(shù)據(jù)、多維數(shù)據(jù)或是聚合數(shù)據(jù)中尋找相關(guān)證據(jù),進(jìn)而建立指數(shù)模型,然而腐敗類的相關(guān)數(shù)據(jù)卻總是潛藏其中而難以捉摸。這是因?yàn)楦瘮》肿拥陌迪洳僮魇蛊涓瘮⌒袨殡y以暴露在大庭廣眾之下[1]。因此,只有(1)國家公共部門,(2)獨(dú)立調(diào)查機(jī)構(gòu),(3)專家評估所得到的3類數(shù)據(jù)可以用于調(diào)查腐敗的源頭。換言之,如果要設(shè)計(jì)一個(gè)評估某個(gè)國家腐敗程度的指數(shù),那么經(jīng)常被用到的就是這3類數(shù)據(jù)。

社會科學(xué)的學(xué)者們所熟知的世界上專門用于評估一國腐敗程度的指數(shù)有很多,比如透明國際的清廉指數(shù)(CPI),還有考夫曼[2]等人研發(fā)的腐敗指數(shù),等等。在20世紀(jì)90年代,相關(guān)學(xué)者從這些指數(shù)中發(fā)掘出了大量有價(jià)值的成果——尤其是腐敗潛在的結(jié)構(gòu)性原因及其后果。不過,這類指數(shù)大多數(shù)僅僅運(yùn)用了不包含時(shí)間序列在內(nèi)的跨國信息作為分析材料,意味著這些指數(shù)會產(chǎn)生宏觀層面跨部門分析的典型缺陷,如內(nèi)生性問題或樣本選擇問題,等等。除此之外,也有證據(jù)表明對不同腐敗指數(shù)的研究和使用可能會導(dǎo)致不同結(jié)論的產(chǎn)生,這取決于所要分析的指數(shù)模型。盡管可以通過調(diào)整主要模型使得研究具有可比性,但對兩個(gè)不同的腐敗指數(shù)之間的比較會使得某個(gè)指數(shù)測量工具失去其具有的測量效力。

目前,對于腐敗指數(shù)效度的驗(yàn)證研究尚屬空白,我們所做的就是運(yùn)用多元特性-多重方法(Multitrait-Multimethod,MTMM)來填補(bǔ)這項(xiàng)空白。MTMM分析方法常常用于評估社會科學(xué)中的建構(gòu)效度問題,以往研究主要解決心理或教育領(lǐng)域的微觀數(shù)據(jù),從未用來解決過國家之間指數(shù)一類的宏觀數(shù)據(jù)。我們主要使用MTMM分析法中先進(jìn)的結(jié)構(gòu)方程模型來解決傳統(tǒng)宏觀層次中的數(shù)據(jù)分析問題。

2 指數(shù)及其效度問題

從指數(shù)的角度來說,測量手段的效度不能僅僅集中于指數(shù)本身。建構(gòu)效度指的是在與其他測量工具相比,測量工具所能測量到的理論建構(gòu)和特性的程度,它的獲取是由預(yù)先的建構(gòu)理論進(jìn)行建構(gòu)測量,并從后續(xù)系列測試所驗(yàn)證的其他基本假設(shè)中推導(dǎo)得出。如果一個(gè)理論能夠被不同的獨(dú)立方法或路徑所證實(shí)的話,那么它就會獲得建構(gòu)效度。建構(gòu)效度包括收斂效度和判別效度。如果一個(gè)指數(shù)是有效的,則會擁有收斂性,而當(dāng)其旨在評估被測量的底層建構(gòu)時(shí),該指數(shù)就會將其建構(gòu)從中區(qū)別出來。對于宏觀指數(shù)而言,它可以假設(shè)在這兩類建構(gòu)效度之間有一定的權(quán)衡,而這種權(quán)衡取決于該指數(shù)所在的維度(如圖1所示)。如果指數(shù)中的建構(gòu)只有一個(gè)特征,它也許就會同時(shí)表現(xiàn)出較高的收斂效度和判別效度,因?yàn)樵撝笖?shù)只在一個(gè)方面需求獲得效度。反之,一個(gè)涉及自身不同方面的宏觀建構(gòu)由于自身或其他建構(gòu)相互關(guān)聯(lián)的可能性增加,所以可能會顯示出低水平的判別效度。

圖1 建構(gòu)效度和收斂、判別效度之間的特性

關(guān)于建構(gòu)效度的問題主要集中在定義層面,比如如何確立一個(gè)建構(gòu)的大小,如何判定一個(gè)建構(gòu)是否該被排除,以及如何發(fā)掘一個(gè)使用建構(gòu)的機(jī)會,等等。它們都反映了建構(gòu)的定義及其本身的效度。尤其是在多因變量分析中,解釋變量需要具有一定的獨(dú)立性。目前的研究中,建構(gòu)常常可以用于代表一組比多因分析的目標(biāo)更多的變量。不僅如此,這些建構(gòu)的變量甚至還可以同時(shí)對其進(jìn)行操控。

我們通過對以往研究的梳理,發(fā)現(xiàn)治理指數(shù)相關(guān)數(shù)據(jù)的收斂效度和判別效度出現(xiàn)了很大的異常。在此之中,希爾和赫利首次提出了“數(shù)據(jù)質(zhì)量”,試圖在充足的方法論框架內(nèi)對前人所做的政治測量進(jìn)行二次描述性分析;坎彭[3]的研究重點(diǎn)則是在治理議題調(diào)查中所存在的潛在偏見。通過對政府機(jī)構(gòu)進(jìn)行信任測試,他發(fā)現(xiàn),這類議題的調(diào)查模式和調(diào)查環(huán)境可以同時(shí)影響特定調(diào)查結(jié)果。按照我們在多維建構(gòu)中的假設(shè),調(diào)查模式和調(diào)查環(huán)境既定情形下,調(diào)查中所存在的偏見向治理測量數(shù)據(jù)中的偏見轉(zhuǎn)化的可能性應(yīng)該會增加?？才硭贸龅倪@一結(jié)論既適用于定量維數(shù)(即多少調(diào)查可以被包含在綜合測量中),也適用于單個(gè)調(diào)查的定性維數(shù)(通過特定調(diào)查評估方面的數(shù)量)。

3 腐敗、影子經(jīng)濟(jì)與民主

在這部分,我們評估了腐敗、影子經(jīng)濟(jì)以及民主在理論意義上作為潛在建構(gòu)的不同特征。第一個(gè)潛在建構(gòu)是腐敗。對于相關(guān)指數(shù)來說,腐敗研究主要有兩個(gè)方面的困難。首先是理論層面的困難,即有關(guān)腐敗這一名詞該如何正確定義的問題。從事腐敗產(chǎn)生的社會機(jī)制研究的研究者可能不會用這個(gè)術(shù)語來分析諸如勒索或盤剝現(xiàn)象,因此此類機(jī)制顯然不適用于一個(gè)國家的腐敗現(xiàn)狀。研究公共領(lǐng)域犯罪現(xiàn)象的政治學(xué)者卻會毫不猶豫地將這些概念混雜在一起,導(dǎo)致概念的模糊不清。但對于大多數(shù)的腐敗定義,如“為一己私利而濫用公共職權(quán)”在犯罪學(xué)和政治學(xué)兩個(gè)領(lǐng)域都適用。透明國際或世界銀行這類非政府組織都采用類似的概念,即“盜用職責(zé)之權(quán)以滿足私利”。這個(gè)定義其實(shí)也相當(dāng)寬泛。而特瑞斯曼和蘭凱斯特等人在對比了不同的定義以后,認(rèn)為上述定義既忽視了一個(gè)國家的具體法律,也忽視了國家所公認(rèn)的道德標(biāo)準(zhǔn)。他們更傾向于在不同系統(tǒng)的語境下使用腐敗一詞,并且所做的工作是為了能夠從中提煉出更加具有普遍性意義的腐敗現(xiàn)象。但是在具體的操作和實(shí)施的意義上,他們的定義依舊存在嚴(yán)重的問題。相比而言,莫坎用了一個(gè)與眾不同的方法來定義腐敗,即著眼于腐敗行為的兩個(gè)維度:腐敗行為的廣度和深度。其中,對腐敗的廣度定義為一個(gè)國家中腐敗行為的普遍程度,而深度則是收受的賄賂大小。

其次是共識層面的困難,即有關(guān)腐敗因素從理論層面到行為層面的區(qū)分很難達(dá)成共識。因?yàn)樵谏鐣茖W(xué)中,腐敗被視為評估行為,所以有學(xué)者可能會通過評估一個(gè)腐敗行為來獲得3類資料:一是在調(diào)查資料中,腐敗資料涉及被告或其他人(也許抽象化的個(gè)人)的回答;二是由微觀層面的資料組成的宏觀層面資料——它們集中反映了一個(gè)地區(qū)或一個(gè)國家的平均狀況;三是宏觀評估中專家對于一個(gè)國家“平均腐敗行為”的判斷。那些允許對評估行為進(jìn)行解釋的微觀數(shù)據(jù)組成了多個(gè)維度的腐敗建構(gòu),而對于每一個(gè)來源于這些微觀數(shù)據(jù)的方法來說也是由此得來的。貪腐印象的測量在揭示了其多維特性的同時(shí),也指出了專家評定的宏觀數(shù)據(jù)(或是公共部門統(tǒng)計(jì)的真實(shí)數(shù)據(jù))并不一定會反映腐敗的多維特性,甚至在相關(guān)準(zhǔn)則或法律清楚闡釋了腐敗核心性質(zhì)的情況下亦是如此。

第二個(gè)潛在建構(gòu)是影子經(jīng)濟(jì)。影子經(jīng)濟(jì)的定義是“官方經(jīng)濟(jì)以外的各種經(jīng)濟(jì)活動(dòng)或經(jīng)濟(jì)行為”,也就是林林總總的“地下經(jīng)濟(jì)”現(xiàn)象。經(jīng)濟(jì)合作與發(fā)展組織[5]在2002年的時(shí)候針對此類問題有過概述。施耐德[6]對影子經(jīng)濟(jì)的定義是“客觀存在的、避免繳納直接或間接稅收以及社?？铐?xiàng)的經(jīng)濟(jì)活動(dòng)”。此外,勞動(dòng)法規(guī)違約和行政責(zé)任也屬于影子經(jīng)濟(jì)的范疇。這個(gè)定義基本遵從了譚茲的描述:影子活動(dòng)所產(chǎn)生的收入和產(chǎn)出并不納入國民核算報(bào)告。施耐德研發(fā)了一套指標(biāo)測量一國影子經(jīng)濟(jì)的大小。他在一項(xiàng)動(dòng)態(tài)多維指標(biāo)多因素的方法中應(yīng)用了貨幣需求的方法,從而能夠囊括造成影子經(jīng)濟(jì)的原因的各種變量。這些原因有稅收和社會保障繳款的負(fù)擔(dān)強(qiáng)弱,監(jiān)管的力度大小,失業(yè)比重以及人均國內(nèi)生產(chǎn)總值的高低等。其中,影子經(jīng)濟(jì)所占GDP比值的絕對值大小通過使用當(dāng)前研究中確立的非官方基準(zhǔn)值大小計(jì)算得出。在用這個(gè)方法計(jì)算出110個(gè)國家影子經(jīng)濟(jì)占其官方GDP的比重之后,施耐德對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化并轉(zhuǎn)換成排名形式。這樣,它的權(quán)重范圍相應(yīng)地從高分到低分就變成了0～100分以內(nèi)的任意數(shù)值。施耐德發(fā)現(xiàn),影子經(jīng)濟(jì)規(guī)模最小的國家按順序排分別是美國和日本,分別得分91.3和90.6。而玻利維亞、格魯吉亞和巴哈馬分?jǐn)?shù)位列倒數(shù)前3名,分別得分31.1、32.4和34.9。

第三個(gè)潛在建構(gòu)是民主。雖然民主的狀況應(yīng)該與制度安排的性質(zhì)相聯(lián)系,但是也有學(xué)者認(rèn)為可以假設(shè)民主狀況在某種程度上獨(dú)立于可觀察到的腐敗水平。就像特瑞斯曼所指出的,一個(gè)國家的治理狀況是否民主并不重要,它的政治遺產(chǎn)是否得到審慎的重視才是關(guān)鍵。民主并不是由制度中的細(xì)枝末節(jié)或某種政治形式來界定。但是,還是存在普遍意義上的能夠被學(xué)者們所接受的民主條件。比如,巴格瓦蒂描述了民主、公民權(quán)利和制度安排所需要的“三駕馬車”——選舉權(quán)和政府換屆、出版自由以及司法獨(dú)立。這些基本權(quán)利確立了一個(gè)特定的政治理念,也就是主權(quán)在民原則?；诖怂⑵鸬恼沃贫?可以被定義為擁有民主的政治結(jié)構(gòu)。

在大多數(shù)案例中,民主一般是通過搜集一個(gè)國家民主存在的證據(jù)和民主機(jī)構(gòu)的活力來進(jìn)行測量,這意味著某些“客觀的”尺度將被用于記錄一個(gè)國家的民主活動(dòng)。民主化通常被視作為政治參與而進(jìn)行的制度創(chuàng)設(shè):民主的政治決策過程是在民選的議會中產(chǎn)生,這個(gè)決策過程取決于公民的呼吁以及政治觀點(diǎn)的付諸實(shí)施。這意味著民主制度可以更好地表達(dá)公民的政治偏好,也意味著公民的自由必須由能夠得到信任的政治力量來加以保障。關(guān)于民主和其他兩個(gè)特征之間的關(guān)系,正如前面所提到的,持久的民主社會往往會要求本國公民遵守相應(yīng)的規(guī)范和制度安排。

當(dāng)腐敗作為一個(gè)考量因素時(shí),一般可以用來反映一個(gè)國家中的個(gè)人自由狀況。它包括政治權(quán)利和公民自由兩個(gè)方面。前者著眼于公民自由參與政治進(jìn)程的可能性,而后者更加側(cè)重于人的基本權(quán)利,如個(gè)人自主性和言論自由。從概念上講,腐敗指數(shù)包括了與一個(gè)國家公民地位有關(guān)的政府評估,它由一組專家和顧問通過分析涵蓋了各種因素對上述兩類問題的清單判斷打分而成。該指數(shù)從1到7級,代表上述標(biāo)準(zhǔn)中政治自由和公民自由的平均分?jǐn)?shù)。一個(gè)國家如果得分較低則反映了這個(gè)國家公民較少的個(gè)人自由,或是政府運(yùn)作的不正常。7分則表示這個(gè)國家中的個(gè)人可以在自身的政治環(huán)境中自由行動(dòng)。

盡管腐敗與公務(wù)人員在行政級別上的行為有關(guān),影子經(jīng)濟(jì)活動(dòng)卻是源于某些過度的行政安排造成的私人代理使然。這意味著腐敗在宏觀研究中存在著較為寬泛的定義。整體而言,腐敗行為和影子經(jīng)濟(jì)中的代表策略行為是由于某些機(jī)構(gòu)的刺激所導(dǎo)致。在公共領(lǐng)域,腐敗指的是這樣一個(gè)事實(shí),即公職人員利用其所在的位置為自己或他的“客戶”(如他的同事或其他人)謀求不當(dāng)利益的行為。在此之中,代理人為了能夠順利輸送自己或客戶的利益,打破了由委托人或法律給出的既定規(guī)則。這類現(xiàn)象既包括官員濫用政府權(quán)力或公共職位的權(quán)限以便謀取私利,也包括他們僅僅通過地下私人委托形式進(jìn)行,而自己卻進(jìn)行相應(yīng)的回避。因此,在設(shè)計(jì)指數(shù)時(shí),假如要包含民主的變量在內(nèi)的話,就要有關(guān)于所有國家在內(nèi)的這些潛在現(xiàn)象的一個(gè)普遍假設(shè)的存在,并放棄在定量分析中建立變量之間獨(dú)立性的要求。

4 腐敗的測量

對于腐敗和影子經(jīng)濟(jì)來說,它們的客觀標(biāo)準(zhǔn),如被定罪的人的絕對數(shù)量并不能提供各國之間效度和測量的可比性。因?yàn)檫@些數(shù)據(jù)取決于該國當(dāng)局的數(shù)據(jù)收集能力,并且兩者的關(guān)鍵在于一國的基礎(chǔ)設(shè)施(如監(jiān)獄等)的收容能力。換言之,相對較高的罪犯數(shù)量同樣是政府當(dāng)局腐敗程度的集中體現(xiàn),但是本身并不能體現(xiàn)腐敗。而對于較低數(shù)量的罪犯而言,可能就無法推導(dǎo)得出腐敗行為的頻率較低這一結(jié)論,因?yàn)槠渲锌赡軙嬖谑I(yè)未納稅的狀況。但是,從較低數(shù)量的罪犯能夠推斷出政府當(dāng)局是否記錄了他們的罪行。這幾種考量因素的結(jié)合,促成了我們所熟知的那幾個(gè)腐敗指數(shù)的發(fā)展,它們都沒有陷入一個(gè)國家官方對于貪腐數(shù)據(jù)的不嚴(yán)謹(jǐn)之中。

我們討論的第一個(gè)指數(shù)是本文開頭所提到的透明國際所發(fā)布的清廉指數(shù)。透明國際在1993年的時(shí)候開始構(gòu)建這個(gè)指數(shù),并在之后一段時(shí)間內(nèi)逐漸搜集到了世界上幾乎所有國家的數(shù)據(jù)。如果在一個(gè)研究小組中編制了至少3個(gè)不同類型的調(diào)查用于建構(gòu)國家的腐敗評分,那么這個(gè)國家就會被納入指數(shù)之中。如果可能的話,透明國際對于某個(gè)特定國家的評級將是3年得分的平均分。在這里,不同的調(diào)查類型包括訪談、商務(wù)人士的問卷調(diào)查以及那些對特定國家擁有深刻研究的專家(不管他們是本國還是外國)評估得出。2002年的清廉指數(shù)就來自于9家不同機(jī)構(gòu)的15項(xiàng)投票和調(diào)查。而到了2005年,透明國際已經(jīng)對世界上159個(gè)國家進(jìn)行了15項(xiàng)調(diào)查,搜集到了這些國家的清廉度數(shù)據(jù)。這兩年指數(shù)的主要區(qū)別在于,2002年的調(diào)查排除了諸如普華永道所做的不透明指數(shù)的單項(xiàng)調(diào)查,并且引入了其他風(fēng)險(xiǎn)評級,如商人國際所做的“灰色地帶動(dòng)態(tài)”評級,或是由聯(lián)合國或世界市場研究中心所做的非洲施政報(bào)告,等等。

透明國際得分的編制程序包含兩個(gè)標(biāo)準(zhǔn)化步驟。第一步,先將這些獨(dú)立調(diào)查排序的百分比操作和這些指標(biāo)結(jié)合起來。第二步,為了降低分?jǐn)?shù)的多樣性,他們將其進(jìn)行β-變換。這兩個(gè)步驟得出的平均分即為各個(gè)受評估國家的清廉指數(shù)。該指數(shù)范圍從0～10,分?jǐn)?shù)越高表示其腐敗程度越低,而越低的清廉指數(shù)得分表示國家的腐敗問題越嚴(yán)重。2002年最高得分的國家是芬蘭,得到了9.8分,而最低的國家是孟加拉國,僅有1.2分。

我們討論的第二個(gè)指數(shù)是世界銀行研發(fā)的CCOR指數(shù),它是一項(xiàng)國際治理調(diào)查計(jì)劃的一部分。該指數(shù)源于一系列的數(shù)據(jù)搜集和考夫曼等人的研究成果。除了使用亞洲情報(bào)調(diào)查以外,2002年CCOR的數(shù)據(jù)與透明國際的清廉指數(shù)非常相似,使用了外部和內(nèi)部研究小組的數(shù)據(jù)確定了160個(gè)國家。世界銀行使用了一個(gè)未知的模型來推導(dǎo)出自己的分?jǐn)?shù)。該指數(shù)得分跨度從-2.5到+2.5,腐敗程度越低的國家得分越高,相反,得分越低的國家腐敗程度也越高。在2002年,CCOR指數(shù)中得分最高的是也是芬蘭,得到了2.39分,最低的國家是赤道幾內(nèi)亞,得分-1.89。

我們討論的第三個(gè)指數(shù)是政治風(fēng)險(xiǎn)服務(wù)集團(tuán)(PRS)發(fā)布的政治風(fēng)險(xiǎn)服務(wù)指數(shù),其中包括了3項(xiàng)腐敗指標(biāo)。這個(gè)指數(shù)使用的是與前文所提到的腐敗指數(shù)CPI和CCOR不同的方法,是基于柯普林和奧萊利的“柯普林-奧萊利國家風(fēng)險(xiǎn)評級體系”編制而成,而不是簡單地使用某個(gè)國家具體的數(shù)據(jù)來計(jì)算。PRS的排名也包括了三種不同類型的風(fēng)險(xiǎn)狀況。這些風(fēng)險(xiǎn)狀況一方面是對政治動(dòng)蕩的評估,另一方面是可能會導(dǎo)致制度障礙的幾種不同形式的政治干預(yù)。該指數(shù)不僅針對腐敗是一個(gè)重要的參照指標(biāo),而且對于一國的對外貿(mào)易來說也是如此,因?yàn)橹笜?biāo)體現(xiàn)了最可能的一些政治場景。PRS的得分范圍從0～6分,腐敗和犯罪行為越少的國家可以得到越高的得分。芬蘭得最高的6分,津巴布韋則得到了最低的0分。

5 多元特性-多重方法分析

上述所介紹的3個(gè)與腐敗有關(guān)的潛在建構(gòu)將是我們使用MTMM分析的對象。MTMM分析法的概念化起初源于坎貝爾和菲斯克在心理建構(gòu)研究中用于評估收斂效度和判別效度的手段。從那時(shí)起,它被應(yīng)用到社會科學(xué)的各個(gè)領(lǐng)域。在坎貝爾和菲斯克看來,該方法能夠從特定的測量性狀的方法中分離若干特性測定方差,具有較強(qiáng)的客觀性。MTMM分析法首先需要?jiǎng)?chuàng)建一個(gè)模型,其中的每個(gè)所述性狀是由每種不同的方法進(jìn)行測定;其次,觀測變量的組合之后推導(dǎo)出MTMM矩陣的結(jié)構(gòu);最后可以通過相關(guān)特性及其相關(guān)性之間的異同進(jìn)行比較分析。如果用不同的方法測量出同一性狀之間的相關(guān)性極高,那么就可以進(jìn)行進(jìn)一步的研究。為了確認(rèn)一個(gè)指數(shù)的建構(gòu)效度,研究者必須確認(rèn)是否用不同方法測定性狀會出現(xiàn)相同的矩陣形狀。相比而言,用相同方法測定不同性狀的相關(guān)性應(yīng)大于通過不同的方法測量同一性狀(也就是“判別效度”)的相關(guān)性。此外,已經(jīng)用不同方法測定不同性狀之間的相關(guān)性也應(yīng)該會大于通過不同的方法測量同一特征之間的相關(guān)性。

這些標(biāo)準(zhǔn)最初是由坎貝爾和菲斯克所設(shè)立,但也不乏各路批評者。例如有批評者認(rèn)為,坎貝爾和費(fèi)斯克的方法不允許對特定方差的數(shù)據(jù)進(jìn)行量化,這是MTMM的缺陷。而這類缺陷將用MTMM方法以外的統(tǒng)計(jì)學(xué)方法加以彌補(bǔ),其中具有代表性的就是結(jié)構(gòu)方程模型。此方法不僅是對相關(guān)性進(jìn)行比較和描述,而且是一種比之更復(fù)雜的統(tǒng)計(jì)方法。該方法使用的是協(xié)方差而非MTMM中的相關(guān)矩陣。

將腐敗指數(shù)之間及其指標(biāo)3個(gè)特征之間的統(tǒng)計(jì)相互關(guān)系納入其中,可以建構(gòu)起一個(gè)觀測變量的協(xié)方差矩陣。它假設(shè)了每一個(gè)腐敗指標(biāo)都由其自身無特性的一個(gè)完美的測量方法得出(處于該矩陣中的三角地帶)。比如,下表1就表示一個(gè)MTMM樣本協(xié)方差矩陣。其中的數(shù)字表示了腐敗指數(shù)CCOR,CPI和PRS的腐敗(C)、影子經(jīng)濟(jì)(S)和民主(D)3個(gè)測量數(shù)量之間的協(xié)同變化。其中主對角線的值代表的不同的指標(biāo)的具體變化。

表1 MTMM分析的樣本協(xié)方差矩陣

CCOR、CPI和PRS,這三者的MTMM數(shù)據(jù)分析方法為驗(yàn)證性因素分析(CFA)。通過在CFA中對一組觀察到的變量(MTMM協(xié)方差矩陣)和一組潛在建構(gòu)(特性)之間的關(guān)系進(jìn)行分析,研究者可以建立起與潛在建構(gòu)的預(yù)定數(shù)量和先驗(yàn)定義之間關(guān)系的模型,并可確認(rèn)經(jīng)驗(yàn)上的假想關(guān)系和觀察到的變量關(guān)系之間的相互關(guān)系。

通常一個(gè)驗(yàn)證性因素分析是通過執(zhí)行特定的順序步驟進(jìn)行的。首先,設(shè)置一個(gè)模型的假想結(jié)構(gòu)(通常由一個(gè)相關(guān)路線圖標(biāo)示出)。其次,研究人員必須檢驗(yàn)其標(biāo)示并測試模型的規(guī)范,這是為了能夠加強(qiáng)評估過程。最后,參數(shù)估計(jì)和模型契合度的評價(jià)可以通過改變模型的特殊結(jié)構(gòu)從而獲得一個(gè)更適合的模型表現(xiàn)(不過需要注意,沒有探索數(shù)據(jù)的最佳模式)。盡管在其他因素預(yù)想的結(jié)構(gòu)分析結(jié)果中的關(guān)系源自它們的理論基礎(chǔ),如第一個(gè)步驟中具體模式和方法是從MTMM分析所得來的,它們卻可以在可觀察到的和不可觀察到的變量中擁有更少或更多的預(yù)定建構(gòu)關(guān)系。其中,3個(gè)潛在的特性因子加載在一組變量中,可以表現(xiàn)出九種特性方法與該模型的組合。這其中的模型建構(gòu)如圖2所示。

圖2 3個(gè)潛在變量的路徑示意圖

在以上步驟之后,研究者便可以在3個(gè)不同的參數(shù)矩陣中界定CFA的模型,并將這個(gè)模型記錄在線性結(jié)構(gòu)關(guān)系模型(LISREL)的程序包中。在使用CFA分析該模型的方法中,可觀測到的變量R的方差—協(xié)方差矩陣等于潛在因子(KSI)的方差—協(xié)方差矩陣PHI(即Φ),也就是載入的因子矩陣“Λ”及其倒置,并加上誤差矩陣“Θ-Δ”,形成計(jì)算R的協(xié)方差方程,即:R=ΛΦΛ′+Θ

3個(gè)潛在的特性因子為腐敗C(xi_{1}),影子經(jīng)濟(jì)S(xi_{2})與民主D(xi_{3})。觀測變量Xi(ⅰ=1,…,9)是用一定方法測量各種具有代表性的特性組合而成。它們是由測量誤差ΔI所影響。它們不具備單一的分?jǐn)?shù)作為MTMM協(xié)方差矩陣R的相互關(guān)系的一部分。所有Λ、Φ以及Θ的元素只能夠通過線性結(jié)構(gòu)關(guān)系模型執(zhí)行的迭代方法來估算模型的識別程度。如果有足夠的信息來獲取該模型的參數(shù)估值,就會得出唯一解。除了測量自由度的正值以外,其他值都會由項(xiàng)目的數(shù)據(jù)規(guī)模來確定。這可以通過一個(gè)潛在因子和觀測變量賦值1或設(shè)置潛在因子的變化幅度為1來實(shí)現(xiàn)。除此之外,樣本矩陣R必須是一個(gè)正定矩陣。這是研究的關(guān)鍵——一些研究者沒有對線性結(jié)構(gòu)關(guān)系模型做可受理性檢驗(yàn),所以往往會忽略了它。我們點(diǎn)明了這點(diǎn),并指出腐敗指數(shù)分析樣本的非確定性是在線性結(jié)構(gòu)關(guān)系模型與脊常數(shù)的協(xié)助下自動(dòng)解決的。最后,為了估算出最后的R值,我們使用了最大似然法和最小二乘法。

6 結(jié)論

在闡釋了MTMM分析方法以后,我們通過不同指標(biāo)的擬合優(yōu)度指數(shù)評估它們的計(jì)算結(jié)果。這里適配指標(biāo)的標(biāo)準(zhǔn)源于所選擇的樣本信息,人口信息和其他的相關(guān)信息。由于適配指標(biāo)往往能夠與逐漸增多的已估參數(shù)同時(shí)形成更好的權(quán)重,因此可以促成被稱為簡約適配指標(biāo)的發(fā)展。這一指標(biāo)的目的是建立測量指標(biāo)擬合度的方法,從而可以通過它來測量指數(shù)中的參數(shù)數(shù)量及其相應(yīng)的自由度的模型。不過,所有的擬合優(yōu)度指數(shù)(AGFI)都具有一定的缺點(diǎn),就是只有對數(shù)個(gè)適配指標(biāo)進(jìn)行評估才能夠保證模型擬合度的可用性。為了評估模型適當(dāng)性的卡方統(tǒng)計(jì)使用了均方根值的近似指數(shù)(RMSEA)調(diào)整后的擬合優(yōu)度指數(shù),以及非范擬合指數(shù)(NFI)。此外,所有的待估參數(shù)通過t值的權(quán)重來分別控制。由此得到的結(jié)果如圖3所示。

圖3 已估參數(shù)(標(biāo)準(zhǔn)化)與擬合優(yōu)度指數(shù)的路徑圖

從圖3中可以看出:第一,整體模型的擬合度一般。卡方值,RMSEA值以及NFI值的統(tǒng)計(jì)表明,隱含的模型結(jié)構(gòu)具有較好的代表性,而AGFI值顯示模型擬合度比較而言則相差在0.9以下。第二,可以從所有的模型中看出指數(shù)的參數(shù)得到了識別,并且所有評估的t值擁有統(tǒng)計(jì)意義上的重要性。這就使得估計(jì)值的實(shí)質(zhì)性解釋成為了可能——因子載荷量顯示出了其合理值并且可以被用于效度的評估。

CFA中的效度標(biāo)準(zhǔn)是由觀測變量和潛在變量之間因子載荷量的大小進(jìn)行評估的。收斂效度可以通過因子載荷量平方的標(biāo)準(zhǔn)化來反映。第一,3個(gè)指標(biāo)的方差在解釋腐敗的建構(gòu)共同性方面有足夠的說服力,只有PRS的結(jié)果在解釋其真方差方面力度較弱,僅有73.1%的權(quán)重值可以解釋。第二,以上結(jié)果證實(shí)了腐敗指標(biāo)可以用于反映國家結(jié)構(gòu)中的影子經(jīng)濟(jì)。雖然所有指標(biāo)特性一半以上的方差不能夠被解釋,與總體的因子載荷量0.71比起來更小,但是它們能夠區(qū)分出其中的建構(gòu)大小。第三,所有的腐敗指標(biāo)確實(shí)衡量出了一個(gè)國家的民主結(jié)構(gòu),不過不能完全區(qū)分出其民主的特性。例如CCOR指數(shù)中的方差竟然高達(dá)36%,這顯然是不能作為民主的衡量依據(jù)的——極高的特性因素使得腐敗指數(shù)是否具有識別國家建構(gòu)的效果有待商榷。盡管如此,這依舊是有別于傳統(tǒng)國家治理研究的一條新穎路徑。第四,理論所確認(rèn)的潛在特性之間的相互關(guān)系不足以由經(jīng)驗(yàn)分析得出。腐敗和影子經(jīng)濟(jì)的程度之間在驗(yàn)證中具有很強(qiáng)的相關(guān)性,甚至高于從理論基礎(chǔ)得出的結(jié)果。反觀民主的建構(gòu)和其他兩個(gè)特性之間的關(guān)系卻是有待進(jìn)一步研究的。第五,通過直接比較腐敗指數(shù),我們認(rèn)為,雖然PRS中的腐敗特性的效度系數(shù)在三個(gè)指數(shù)中最低,但是PRS在區(qū)別其他建構(gòu)的方面做得最好;CPI能夠掌控影子經(jīng)濟(jì)的大部分程度,卻相對較為欠缺;世界銀行的CCOR指數(shù)亦是如此。

總體來說,一方面部分CFA分析的測量結(jié)果對所有指標(biāo)的收斂效度來說都存在高度的因子載荷量,因此是合理的。清廉指數(shù)在解釋腐敗結(jié)構(gòu)的真方差方面優(yōu)于其他兩個(gè)指數(shù)。另一方面清廉指數(shù)和CCOR指數(shù)卻在區(qū)別外部建構(gòu)——影子經(jīng)濟(jì)和民主方面要遜于PRS指數(shù)。不過,當(dāng)整體指標(biāo)(與腐敗相關(guān)聯(lián)時(shí))的可靠性被證實(shí)的時(shí)候,該建構(gòu)的部分系數(shù)反映了潛在特性因素之間的關(guān)系,卻沒有與理論的結(jié)果相符合?？傮w模型擬合程度也表明MTMM模型的樣本數(shù)據(jù)最終結(jié)果充其量只能算是正常而已。

參考文獻(xiàn):

[1]Graeff,P.Why should one trust in corruption?The linkage between corruption,trust,norms,and socialcapital.In:Graf Lambsdorff,J.,Taube,M.,Schramm,M.(eds.).The New Institutional Economics of Corruption,pp.21-42.Routledge,London(2005).

[2]Kaufmann,D.,Kraay,A.,Mastruzzi,M.Governance Indicators:Aggregate and Individual Governance Indicator for 1996-2005.The World Bank,Washington(2006).

[3]Kampen,J.K.The impact of survey methodology and context on central tendency,nonresponse and associationsof subjective indicators of government performance.Qual.Quant.41,793-813(2007).

[4]Friedman,E.,Johnson,S.,Kaufmann,D.,Zoido-Lobaton,P.:Dodging the grabbing hand:determinants of unofficial activity in 69 countries.J.Public Econ.76,459-493(2000).

[5]OECD Measuring the Non-Observed Economy-A Handbook.OECD Publications,Paris(2002).

[6]Schneider,F.Shadow economies of 145 countries all over the world:What do we really know?Departmentof Economics,University of Linz,Discussion Paper(2006).