謝宜澤
摘要:數(shù)據(jù)是實證研究的基礎(chǔ),但運用數(shù)據(jù)的前提是對其構(gòu)建理論、統(tǒng)計口徑、適用范圍等基本問題具有全面而深刻的認識。購買力平價、世界治理指數(shù)、全球清廉指數(shù)是國際比較的常用指標,研究和探討其理論基礎(chǔ)、統(tǒng)計方法存在的某些局限,根據(jù)數(shù)據(jù)性質(zhì)指出其適用范圍,并分析可能的認知偏差和量化誤用,可以廓清對數(shù)據(jù)的某些錯誤認識和消解一些不必要的表面爭論,為更進一步的實證研究數(shù)據(jù)選擇及運用提供警示和參考。
關(guān)鍵詞:統(tǒng)計口徑;適用范圍;購買力平價;世界治理指數(shù);全球清廉指數(shù)
文獻標識碼:A 文章編號:1002-2848-2018(04)-0029-10
一、引 言
數(shù)據(jù)資料是實證研究的基礎(chǔ)。在實證方法日漸風靡的社會科學領(lǐng)域,出現(xiàn)了一種庸俗的實用主義傾向,即是罔顧歷史背景和社會現(xiàn)實,在理論結(jié)構(gòu)和數(shù)據(jù)內(nèi)涵尚未明晰的條件下,匆匆地將一堆數(shù)據(jù)代入至計量軟件,然后簡單地得出研究結(jié)論和政策建議?;貧w模型仿佛成了數(shù)據(jù)加工的黑匣子,西方舶來的一些分析框架如狗皮膏藥一樣隨處亂貼在已經(jīng)變化的中國事實上[1]。因而,如今的學術(shù)研究在艱澀難懂的學術(shù)化包裝下,樹立了技術(shù)主義權(quán)威,蒙上了一層神秘的面紗,不僅隔絕了一般人的進入,也邊緣化了自身。《21世紀資本論》作者皮凱蒂[2]指出,經(jīng)濟學家往往沉浸于瑣碎的、只有自己感興趣的數(shù)學問題中;這種對數(shù)學的癡迷是獲取科學表象的一個捷徑,因為這樣不需要回答世界中那些更復雜的問題?;蛞踩缌邪禾璺騕3]所言,虛弱而且緩慢成長的經(jīng)驗基礎(chǔ),已經(jīng)無法支撐純經(jīng)濟理論激增的上層建筑。
本文無意貶低數(shù)據(jù)、模型、理論的價值,而是深切體會到,正是因為數(shù)據(jù)的概括性、直觀性、簡單性養(yǎng)成了研究者深入觀察了解經(jīng)濟社會的學術(shù)惰性,不假思索的數(shù)據(jù)“拿來主義”雖然輕松高效卻會毀掉定量研究的根基;也正是因為對數(shù)據(jù)、模型、理論的暗含邏輯和運用邊界存在認知偏差,衍生了許多既無法推動理論創(chuàng)新又無助解釋現(xiàn)實世界的應用研究。此類研究不僅耗費了學者的心血,還無助于社會科學的建設(shè),可視作智力資源和物質(zhì)資源的極大浪費??梢?,數(shù)據(jù)是研究的一把雙刃劍,在大數(shù)據(jù)時代,更應當注重數(shù)據(jù)的基本問題研究,應當避免在尚未深刻理解的數(shù)據(jù)、模型、理論的情況下包裝研究成果[4]。有鑒于此,本文試圖以社會科學國際比較中的常用指標,購買力平價(Purchasing Power Parity,PPP)、世界治理指數(shù)(World Governance Indicators,WGI)、全球清廉指數(shù)(Corruption Perceptions Index,CPI)為例,研究其統(tǒng)計口徑與適用范圍,以期廓清某些錯誤認識和消解一些不必要的表面爭論,以為更進一步的實證研究數(shù)據(jù)選擇及運用提供警示和參考。
二、購買力平價(PPP)的理論基礎(chǔ)、統(tǒng)計方法與適用范圍
國民經(jīng)濟核算體系(System of National Accounts,SNA)被認為是二十世紀最偉大的發(fā)明之一,是宏觀經(jīng)濟分析刻畫與衡量的基礎(chǔ)。國內(nèi)生產(chǎn)總值(Gross Domestic Product,GDP)是其中的核心總量指標。匯率法和購買力平價法是GDP國際比較的兩種常用方法,二者本質(zhì)上都是一種綜合比價指數(shù)。
(一)GDP國際比較的理論基礎(chǔ)
GDP國際比較的目的在于判斷各個國家和地區(qū)的真實經(jīng)濟規(guī)模,除了剔除價格因素之外,還需要確定空間物量指數(shù),即比價指數(shù)。因此,GDP國際比較的主要技術(shù)問題,幾乎全部集中在如何獲得一個合理的綜合比價指數(shù)
需要解釋的是,比價指數(shù)是不同質(zhì)的商品類別,因各自價格水平變動所引起的相互交換能力發(fā)生變化的趨勢和程度的相對數(shù)。比如,A國和B國生產(chǎn)同等產(chǎn)量的鋼鐵和服裝,鋼鐵和服裝在A國和B國的價格分別為:2000元/噸,100元/件;4000元/噸,200元/件。那么兩國的鋼鐵和服裝的相對價格關(guān)系均為20:1,因而A國和B國的綜合比價指數(shù)為1:2,在進行GDP國際比較時,僅需將A國本國貨幣計價GDP乘以2,即可得出兩國經(jīng)濟規(guī)模相等的結(jié)論。如果鋼鐵和服裝在A國和B國的價格分別為:2000元/噸,100元/件;4000元/噸,100元/件,由于A、B兩國兩種產(chǎn)品的相對比價關(guān)系不同,則無法直觀地獲取GDP國際比較的綜合比價指數(shù)?,F(xiàn)實世界中,由于各國產(chǎn)品豐富多元,獲取一個合理的綜合比價指數(shù)更為復雜。[5]。匯率和購買力平價就是當今GDP國際比較常用的綜合比價指數(shù),其理論基礎(chǔ)是一價定律和購買力平價理論。
GDP具有三種不同的表現(xiàn)形態(tài),即產(chǎn)品形態(tài)、價值形態(tài)和收入形態(tài)。在國際比較中,需要將各國千差萬別的產(chǎn)品物量關(guān)系轉(zhuǎn)換為直接可比較的綜合數(shù)值。然而,世界各國貨幣紛繁復雜,信用貨幣缺乏公認的衡量標尺。于是,價值形態(tài)的GDP比較最終回歸至貨幣的本質(zhì),即其背后所代表的購買力。購買力平價理論認為,不同貨幣之間的兌換比率取決于其購買力之比。如果兩國貨幣的匯率偏離了購買力平價,則會發(fā)生套利行為,直至達到均衡為止。而購買力平價理論背后更深層次所蘊含的機制則是一價定律(Law of One Price),即認為同一種商品在所有地方均會以同樣的價格銷售。
值得一提的是,一價定律和購買力平價理論成立的前提條件通常有三點:首先,商品是同質(zhì)的,任何商品的質(zhì)量在不同地區(qū)是無差別的;其次,運輸費用為零,商品跨國間流動不存在限制,也不存在交通、物流、關(guān)稅等運輸成本以及運輸過程中的變質(zhì)和損耗;再次,交易成本為零,商品價格不存在粘性,可以根據(jù)市場供求自由浮動,同時不存在搜尋成本、議價成本、決策成本等交易費用。以上三點,意味著同一商品在生產(chǎn)、運輸、交換三個環(huán)節(jié)均是無差異的。除此之外,一價定律暗含的假定是,人作為消費者是可以自由移動和自由選擇的,而購買力平價理論則要求所有商品和服務均具有自由競爭和可自由貿(mào)易的屬性。
(二)匯率法的理論缺陷與現(xiàn)實佐證
如果不深刻了解匯率法的缺陷,就無法真正了解購買力平價法的精髓。以匯率作為GDP國際比較的綜合比價指數(shù),最大的好處是簡單易操作,然而,其缺陷也是顯而易見的,最大的缺陷即是匯率與購買力平價始終存在偏離。產(chǎn)生偏離的原因通??梢钥偨Y(jié)為以下三個:一是匯率的決定并非完全取決于購買力平價,同時也受利率差異和國際收支影響,尤其是短期匯率的決定;二是匯率無法反映全部商品的綜合比價關(guān)系,尤其是市場化程度很低的商品和無法進行國際貿(mào)易的服務;三是匯率無法根據(jù)各國要素稟賦差異而調(diào)整,進而更加偏離購買力平價。當然,固定匯率、管理浮動匯率等匯率制度也人為扭曲了匯率與購買力平價之間的關(guān)系。
巴拉薩薩繆爾森效應(BalassaSamuelson Effect)從勞動生產(chǎn)率差異視角,指出市場匯率與購買力平價存在系統(tǒng)性偏差,發(fā)展中國家貨幣幣值相對于購買力平價被低估,發(fā)達國家貨幣幣值相對于購買力平價則被高估[6]。具體可由式(1)—(2)表達:
假定購買力平價法測算結(jié)果更加接近實際GDP,那么利用購買力平價法GDP除以匯率法GDP,得到匯率法偏差指數(shù),可以發(fā)現(xiàn)偏差指數(shù)與人均GDP呈現(xiàn)負相關(guān)關(guān)系。匯率法偏差指數(shù)小于1,表明匯率法高估了真實GDP,反之則低估。根據(jù)世界銀行2016年匯率法GDP(2010年為基年)、購買力平價法總量及人均GDP(PPP,2011國際美元)數(shù)據(jù)匯率法偏差指數(shù)的計算當以相同基年為準,以剔除價格因素影響,限于數(shù)據(jù)的可獲得性,本文選取了2010年為基年的匯率法GDP,以及以2011年第八輪國際比較項目為基年的購買力平價法總量和人均GDP,有效數(shù)據(jù)總共涵蓋188個國家和地區(qū)。,匯率法偏差指數(shù)小于1的絕大多數(shù)是發(fā)達國家,前五位分別是挪威(0.71)、瑞士(0.75)、丹麥(0.76)、澳大利亞(0.80)、日本(0.80),匯率法偏差指數(shù)大于1的幾乎全是發(fā)展中國家,后五位的分別是也門(3.42)、老撾(3.49)、緬甸(3.77)、埃及(3.79)、巴基斯坦(4.12),美國為1.02,中國為2.09。由此說明,利用匯率法判別世界各國的真實經(jīng)濟規(guī)模,確如巴拉薩—薩繆爾森效應所預測,存在系統(tǒng)性偏差,容易高估發(fā)達國家真實GDP而低估發(fā)展中國家真實GDP徐滇慶還間接驗證了匯率法低估中國GDP的事實,其驗證方法雖不夠嚴謹,但是仍然具有非常強的說服力,可以推廣至驗證一般發(fā)展中國家。[7]
(三)購買力平價法的統(tǒng)計方法與適用范圍
正是因為匯率法GDP國際比較的種種缺陷,才催生出構(gòu)造購買力平價指數(shù)估算各國GDP的設(shè)想。PPP指數(shù)測算肇始于1968年賓夕法尼亞大學國際比較項目組(International Comparison Program,ICP)。此項目的牽頭方由賓夕法尼亞大學到聯(lián)合國統(tǒng)計司再到世界銀行,幾經(jīng)更迭,2016年被正式定為永久性全球統(tǒng)計項目。ICP自1970年第一輪開始,截至目前,已經(jīng)開展了八輪基準年份分別為1970年、1973年、1975年、1980年、1985年、1993年、2005年、2011年。,每輪間隔年數(shù)長短不一,2017年正式開展第九輪。ICP數(shù)據(jù)統(tǒng)計分為三個層次,國家、區(qū)域、全球,逐級匯總。2011年第八輪將參與ICP的199個國家和地區(qū)歸為八大區(qū)域,分別為亞太、非洲、獨聯(lián)體、拉美、西亞、加勒比海、太平洋島國、歐盟OECD,中國屬于亞太區(qū)域,該區(qū)域以中國香港為比較基準。
PPP法的基本思想源自于購買力平價理論,即保證1美元在任何國家均具有相同的購買力。因而,在ICP實踐中,測算PPP的方法就是比較世界范圍內(nèi)購買相同一籃子商品和服務所需的本國貨幣。具體步驟就是,首先,確定用以比較的商品和服務(代表性規(guī)格品),并收集其價格與銷售量;其次,選擇指數(shù)形式和產(chǎn)品權(quán)數(shù),以計算得到PPP指數(shù)。在現(xiàn)實操作中,根據(jù)支出法GDP核算,可得的數(shù)據(jù)只有規(guī)格品價格和細類支出支出法GDP分類體系總共有總量、大類、綜合類、細類、代表規(guī)格品五個層次,比如,面包(代表規(guī)格品)屬于面包及主食(細類),又屬于食品(綜合類),而食品又屬于居民消費支出(大類),居民消費支出、政府消費支出、總資本形成三大類構(gòu)成了GDP總量。,因此需要根據(jù)式(3)將代表規(guī)格品價格比綜合成細類價格比。
以國家層面為例,GEKSm,n表示m國相對于n國的購買力平價指數(shù),PPPm,l,PPPn,l分別表示m國與n國相對于l國的購買力平價指數(shù)??梢?,GEKS方法其實也是利用多邊比較結(jié)果以修正兩兩比較結(jié)果,使其更加穩(wěn)健,以此方法可以得到國家、區(qū)域、全球?qū)用娴木C合購買力平價。
相比于匯率法的理論缺陷,PPP法最大的缺陷在于基礎(chǔ)數(shù)據(jù)。就方法論本身而言,PPP法更能反映一國GDP的真實情況,因此PPP法的問題不在方法,而在數(shù)據(jù)是否準確[8]??梢哉J為,ICP項目仍帶有試驗、探索和研究的性質(zhì),其比較結(jié)果的可靠性還存有較大爭議和分歧[9],因而其適用范圍尚有一定局限,需要謹慎對待。
第一,PPP法GDP是統(tǒng)計物量意義上的,不具有市場可支付的購買能力。世界銀行[10]指出,PPP方法主要用于各國產(chǎn)值的比較,而不是用于各國進出口貿(mào)易、對外直接投資、對外發(fā)展援助等貨幣流或貿(mào)易流的比較。相反,根據(jù)匯率法測算的GDP是具有國際可支付購買力的,在可貿(mào)易品的國際比較中,運用匯率法是更加簡單適宜的。由于PPP法和匯率法研究目的的差異,不能因為匯率法在國際比較中缺乏理論基礎(chǔ),而全盤否定其意義或者主張用PPP法GDP替代匯率法GDP。
第二,PPP指數(shù)不同于實際均衡匯率,不能用于指導選擇合理的匯率政策。根據(jù)購買力平價思想,實際匯率應是不變動的,然而現(xiàn)實并非如此。由于決定因素不同,PPP指數(shù)與均衡匯率之間甚至沒有必然聯(lián)系[11]。因此,以PPP指數(shù)作為標準衡量匯率是否高估或者低估,是不恰當?shù)?,或者認為PPP指數(shù)代表了匯率的長期走勢,以此為參考選擇合理的匯率政策,是具有誤導性的,因為即使超長期有效對于選擇匯率政策也是遠遠不夠的[12],更何況匯率與PPP的背離是必然而普遍的現(xiàn)象。
第三,PPP結(jié)果主要用于橫向比較,不能直接用于跨基年的歷史比較。每輪ICP是以對應基年為基礎(chǔ)的,然后推算出非基準年的數(shù)據(jù),以形成完整的時間序列非基準年的PPP數(shù)據(jù)推算方法有總量外推法(IMF與世界銀行)、分類項目外推法(歐盟)、滾動基準年推算法(歐盟與OECD)、縮減信息法(亞洲開發(fā)銀行與非洲開發(fā)銀行)。[13],但是,在ICP尚未完全成熟之前,由于每輪參與的國家數(shù)量、計算方法以及介入深度不同,導致PPP結(jié)果喪失了跨基年比較的基礎(chǔ)。比如2005年第七輪ICP共有146個參與國,而2011年第八輪ICP則有199個,2005年中國僅有11個城市參與2005年第七輪ICP國際比較,中國在1999年7個城市(北京、上海、重慶、哈爾濱、武漢、廣州、西安)參與的基礎(chǔ)上再增加了大連、寧波、廈門、青島4個城市。,而2011年中國則宣布全面參與第八輪ICP測量,調(diào)查范圍則涵蓋30個省級單位。
第四,PPP結(jié)果主要用于總量比較,不能用于分部門產(chǎn)出的國際比較。PPP指數(shù)是一個加權(quán)的綜合價格指數(shù),具有不可加性,只有在總量層面才是有意義的。分部門產(chǎn)出不能直接除以PPP指數(shù)進行國際比較,因而也就無法進行支出結(jié)構(gòu)的國際比較。比如,以PPP指數(shù)為折算因子,測算研發(fā)部門或者軍事部門的實際支出水平,以此結(jié)果作為衡量創(chuàng)新能力或者軍事實力的指標,其實是對PPP方法的一種誤用。
第五,PPP比較最好用于經(jīng)濟結(jié)構(gòu)相似的國家和地區(qū),否則誤差太大。由于PPP估算嚴格受到原始數(shù)據(jù)質(zhì)量的影響,因而PPP法總量比較最好兩國經(jīng)濟結(jié)構(gòu)差別不要太大。因為有時發(fā)展中國家的服務價格相比于發(fā)達國家更加低廉,并非其價值被低估,而是其本身服務的質(zhì)量更低,嚴格意義上都可劃分為兩種不同的服務,因而不具備可比性。因為經(jīng)濟結(jié)構(gòu)不同,中國與美國之間的PPP法GDP標準誤就要遠大于加拿大與美國之間的標準誤[14]。
第六,PPP結(jié)果作為一項研究成果,應當謹慎用于行政領(lǐng)域。由于數(shù)據(jù)采集和更新的困難,PPP測算結(jié)果往往具有滯后性,無法指導短期變化了的現(xiàn)實。而且,PPP法總量數(shù)據(jù)更具有存量意義,無法變現(xiàn)為市場購買力,不宜用作聯(lián)合國會費分攤[15]或世界銀行貸款額度等的依據(jù)。除此之外,根據(jù)PPP估值結(jié)果,認為中國超越美國成為世界第一大經(jīng)濟體,或者得出“中國世紀”開始的結(jié)論,也是對PPP探索性研究成果的片面解讀。
三、世界治理指標(WGI)的數(shù)據(jù)背景、聚合方法與運用商榷
“治理”概念最早可以追溯至亞里士多德時期,如今被重視得益于新制度主義的興起,隨之,治理評估及其指標體系也應運而生,世界治理指標(WGI)即是對“治理”抽象概念的量化測度。由于世界治理指標的全面性、延續(xù)性、公開性,其已被公認為最具影響力的綜合指標之一,并成為國際投資和國際援助的重要參考。世界治理指標由世界銀行1996年創(chuàng)建,2003年之前每兩年發(fā)布一次,之后數(shù)據(jù)每年更新,統(tǒng)計范圍不斷擴展,目前已經(jīng)涵蓋了全球215個國家和地區(qū),其包含六項分指標,分別是話語權(quán)與問責(Voice and Accountability,VA)、政治穩(wěn)定與無暴力或恐怖主義(Political Stability and Absence of Violence/Terrorism,PV)、政府效率(Government Effectiveness,GE)、監(jiān)管質(zhì)量(Regulatory Quality,RQ)、法治程度(Rule of Law,RL)、腐敗控制(Control of Corruption,CC)。
(一)世界治理指標的數(shù)據(jù)背景與聚合方法
世界治理指標作為一項綜合指標,其原始數(shù)據(jù)并非來自于世界銀行的一手調(diào)研資料,而是來自于33個國際組織所建立的35個數(shù)據(jù)庫,其中包括自由之家、世界民意調(diào)查、世界法治指數(shù)、民主動態(tài)調(diào)查、經(jīng)濟學人智庫、全球競爭力報告、貝塔斯曼基金會、全球透視業(yè)務狀況和風險指數(shù)等。世界治理指標的原始數(shù)據(jù)絕大部分是基于調(diào)查問卷的主觀數(shù)據(jù),調(diào)查問卷的發(fā)起方多是歐美發(fā)達國家的大學、智庫、企業(yè)、政府以及NGO組織,由于原始數(shù)據(jù)的得分范圍不一致,在指數(shù)聚合時通常需要進行多次標準化處理。
世界治理指標的聚合方法為未觀測組合模型(Unobserved Components Model,UCM),其基本原理如下:
世界治理指標每一項分指標的估計值取值范圍都在-2.5至2.5之間,負分并不是數(shù)學意義上的,而是標準化處理之后的,并公布指標聚合的數(shù)據(jù)庫來源數(shù)量,該國所處的百分位及其90%置信區(qū)間的百分位上限和下限,以及估計值的標準差,一般來源數(shù)據(jù)庫越多,估計值標準差越小。以中國為例,2015年WGI六項分指標CC、GE、PV、RQ、RL、VA的估計值分別為:-0.27、0.42、-0.56、-0.27、0.33、-1.58;來源數(shù)據(jù)庫數(shù)量分別為:11、10、9、11、13、11;所處的百分位分別為:50%、68%、27%、44%、44%、5%。如圖2所示,1996—2015年間,世界治理指標各項分指標,中國在政府效率(GE)一項表現(xiàn)最好,基本處于世界前50%,話語權(quán)與問責(VA)一項表現(xiàn)最差,基本處于世界后10%。
(二)世界治理指標的理論局限與運用商榷
世界治理指標最核心的在于對“治理”概念的理解,世界銀行將“治理”理解為一國權(quán)力運作的傳統(tǒng)和制度,依靠它們政府得以開展并提供公共產(chǎn)品?;诖?,世界治理指標衡量的是以政府為中心的治理水平,六項分指標分別涵蓋了政府的選舉、執(zhí)行、監(jiān)督。世界銀行定義背后暗含的假設(shè)是,各個國家和地區(qū)存在普世的治理標準,通過WGI可以分辨好的治理與壞的治理,并引導治理不力的國家和地區(qū)見賢思齊、擇善從之。然而,縱觀“治理”概念的解讀,遠未達到共識的地步,世界銀行的定義只是代表了一種狹義理解,忽略了治理主體、治理模式、治理傳統(tǒng)等的多元性及其路徑依賴。WGI的六個維度,比如法治、話語權(quán)、反腐敗等,雖然用的是同一個詞表達,而且都不否認其對完善治理的重要性,但是在不同的文化背景、政治體制、發(fā)展水平下又有不同的含義,比如在民主體制如美國和威權(quán)體制如新加坡,法治概念的細節(jié)和實踐是不同的。
理論框架的缺乏是治理指數(shù)模糊而不準確的原因之一[16],世界治理指標依賴過多未經(jīng)理論論證的假定,可能會使指標變成錯誤的數(shù)據(jù)[17]。除了概念的分歧之外,數(shù)據(jù)來源的主觀性、治理指標的道德性等也是世界治理指標有失公允的重要因素。2015年WGI分指標的來源數(shù)據(jù)庫數(shù)量,多的可以達到15個,少的只有1個,因而估計值的標準差大小也相距甚遠,嚴重影響了WGI的可信度。WGI的一手數(shù)據(jù)來源,多是西方資本主義國家機構(gòu)主導的以專家學者為調(diào)查對象的主觀性問卷,那么,就可以認為,WGI的基礎(chǔ)數(shù)據(jù)主要反映的不是世界各國真實的治理狀況,而是少部分人以西方標準對世界各國治理水平的認知甚至偏見,最終WGI就是一堆看法和偏見的集合??挤蚵萚18]指出,我們評估的是什么?我們應當關(guān)注誰的觀點?對治理評估是至關(guān)重要的。周紅云[19]認為,多數(shù)治理評估都是西方發(fā)達國家以自身立場為出發(fā)點對發(fā)展中國家治理質(zhì)量的評估,是西方發(fā)達國家以外部觀察家和決策者的身份對發(fā)展中國家國內(nèi)治理質(zhì)量的評估。也即是說,世界治理指標背后不可避免地存在道德指向性和價值非中立,它存在較強的西方價值偏好,隱蔽地建構(gòu)國際制度性話語權(quán)[20],忽略各個國家和地區(qū)的區(qū)域性、行業(yè)性差異,而塑造對某些國家的刻板印象。或如盧春龍[21]等的觀點,WGI是在市場失靈和政府失效的雙重背景下關(guān)于公共事務治理當前模式的簡單概括,遠非對其自身或人類歷史經(jīng)驗的總結(jié)。
在社會科學定量研究中,世界治理指標使用廣泛,通常被認為是制度因素的代名詞,作為解釋變量考察國際投資區(qū)位選擇的制度偏好,或者作為控制變量以保證樣本國家處于相似的制度背景。然而,關(guān)于WGI的研究結(jié)論往往有悖于學理常識和現(xiàn)實直覺,比如,一些WGI得分靠后的東亞、南亞國家卻獲得了較快的經(jīng)濟社會發(fā)展,中國對外直接投資偏好于制度質(zhì)量較差而非較好的國家和地區(qū)[2224],治理能力落后的發(fā)展中國家卻比治理能力排名靠前的發(fā)達經(jīng)濟體吸引了更多的外商投資[25]。在直接使用WGI得分絕對值不符合國際主流發(fā)展理論和投資理論時,相關(guān)研究創(chuàng)新了WGI的使用方法,比如,姚凱[26]等結(jié)合世界治理指標與美國傳統(tǒng)基金會經(jīng)濟自由指標創(chuàng)造了新的政治風險指數(shù);蔣冠宏[27]等利用世界治理指標的絕對值之差構(gòu)造了制度距離的概念;楊嬌輝[28]等利用世界治理指標的一階主成分衡量總體制度質(zhì)量并構(gòu)建了相對制度質(zhì)量指數(shù);楊宏恩[29]等則使用世界治理指標六個維度的均值衡量制度環(huán)境;也有研究利用雙邊投資協(xié)定[30]、雙邊政治關(guān)系[31]作為東道國制度缺位的有效補充以解釋前文所述的反?,F(xiàn)象。由此可見,世界治理指標的使用不僅廣泛而且深入,甚至過度,一方面反映了研究者由于缺乏合適的宏觀指標而不得不委曲求全的無奈,另一方面也反映了研究者存在利用現(xiàn)有數(shù)據(jù)套用計量模型和成熟理論的投機傾向。WGI各項指標本身已是二手主觀數(shù)據(jù)的一次綜合,若在此基礎(chǔ)上進行加減乘除運算的二度綜合,無異于將制度質(zhì)量視作單位統(tǒng)一、等距等比的“一般等價物”,不僅損失了有效信息以致于構(gòu)造的數(shù)據(jù)喪失意義,而且曲解了世界治理指標的內(nèi)涵以致于造成指標的誤用。
因此,在使用WGI數(shù)據(jù)時,首先應當意識到其是綜合指標而非專項指標,是模糊指標而非精確指標,因其性質(zhì)而有一定的適用范圍,所以關(guān)注其估計值的同時也應該關(guān)注其標準差,其描述了一般性的制度背景但卻無法對特定領(lǐng)域進行診斷,其反映了現(xiàn)代正式制度的表現(xiàn)但卻隱匿了傳統(tǒng)非正式制度的作用。其次應當認識到其原始資料、聚合方法、理論基礎(chǔ)的局限性,它是基于主觀感覺和評價的“軟指標”而非類似于GDP等的“硬指標”[32],它是世界銀行基于“治理”概念狹義理解的量化表達而非對人類“治理”智慧的全面概括,因而只能作為驗證研究假設(shè)的重要參考而不能作為唯一標準;最后應當謹慎對其進行復雜構(gòu)造和過度使用,數(shù)據(jù)為我所用的前提是深刻理解數(shù)據(jù)背后的邏輯,沒有理論而任意構(gòu)造不僅損失了信息而且不易于解釋,世界治理指標如果過度包裝,就會遠離其欲刻畫的現(xiàn)實,最終使得新構(gòu)造數(shù)據(jù)失去效度、毫無意義,進一步使得實證研究結(jié)果站不住腳。
四、全球清廉指數(shù)(CPI)的數(shù)據(jù)來源、爭論焦點與評價局限
腐敗的定量刻畫是近年來腐敗問題研究的主流趨勢[33],全球清廉指數(shù)(CPI)是反腐敗領(lǐng)域目前使用最多[34]、具有廣泛影響力的定量指標。1993年世界銀行董事彼得·艾根有感于腐敗的危害性,在德國柏林創(chuàng)立了非營利、非黨派、以反腐敗為使命的國際性非政府組織——透明國際(Transparency International,TI),并于1995年開始每年發(fā)布全球清廉指數(shù)及排名。2016年全球清廉指數(shù)176個國家和地區(qū)中,前五位分別是丹麥(90)、新西蘭(90)、芬蘭(89)、瑞典(88)、瑞士(86),后五位分別是也門(14)、敘利亞(13)、朝鮮(12)、南蘇丹(11)、索馬里(10)??傮w而言,北歐地區(qū)發(fā)達國家表現(xiàn)良好,非洲地區(qū)發(fā)展中國家表現(xiàn)較差,亞洲地區(qū)中,新加坡(84)、中國香港(77)、日本(72)表現(xiàn)較好,排名均位于前20,中國得分為40,排名第79,與白俄羅斯、巴西、印度等國處于同一水平,屬于比較腐敗的國家行列。
(一)全球清廉指數(shù)的數(shù)據(jù)來源與計算方法
與購買力平價、世界治理指數(shù)相比,全球清廉指數(shù)的數(shù)據(jù)搜集和計算方法更加簡單。透明國際不參與一手數(shù)據(jù)的編制,CPI的測算基礎(chǔ)源自于13個獨立的主觀調(diào)查機構(gòu),分別是以各國專家為調(diào)查對象的世界銀行國家政策和制度評估指數(shù)、亞洲開發(fā)銀行國家績效評估等級指數(shù)、非洲開發(fā)銀行國家政策和制度評估指數(shù)、美國自由之家轉(zhuǎn)型指數(shù)、美國環(huán)球透視國際風險評級、美國PRS集團國際國家風險指南、德國貝塔斯曼基金會轉(zhuǎn)型指數(shù)、德國貝塔斯曼基金會可持續(xù)發(fā)展指數(shù)、英國《經(jīng)濟學人》國家風險服務和國家預測指數(shù),以企業(yè)管理層為調(diào)查對象的世界經(jīng)濟論壇全球競爭力報告、瑞士洛桑國際管理學院世界競爭力報告、中國香港政治與經(jīng)濟風險咨詢公司亞洲情報通訊,以普通民眾為調(diào)查對象的世界公正項目法治指數(shù)。CPI數(shù)據(jù)源總體保持不變,但每年也多少會有出入,被排名的國家和地區(qū),平均有6個數(shù)據(jù)源,多的可達到9個,為了減少測量誤差,每個國家唯有保證3個及以上數(shù)據(jù)源方才列入CPI計算與排位行列,由此也導致每年參與的國家數(shù)量有所變動。
經(jīng)過2012年改革后,目前CPI的計算方法已經(jīng)非常簡單了,由于之前百分比匹配法的不可比性,2012年之后CPI計算采用的是簡單平均法,即在標準化原始數(shù)據(jù)的基礎(chǔ)上,再將各個國家數(shù)據(jù)進行算術(shù)平均。以飽受爭議的2014年中國CPI計算為例,8個原始數(shù)據(jù)庫標準化處理后得分分別為27.5、36.5、31.1、47.3、40.5、37.6、31.9、36.7,
2014年中國CPI數(shù)據(jù)源分別來自德國貝塔斯曼基金會轉(zhuǎn)型指數(shù)(27.5)、瑞士洛桑國際管理學院世界競爭力報告(36.5)、美國PRS集團國際國家風險指南(31.1)、世界經(jīng)濟論壇全球競爭力報告(47.3)、世界公正項目法治指數(shù)(40.5)、英國《經(jīng)濟學人》國家風險服務和國家預測指數(shù)(37.6)、美國環(huán)球透視國際風險評級(31.9)、中國香港政治與經(jīng)濟風險咨詢公司亞洲情報通訊(36.7)。平均之后得分約為36.1。2012年除了在CPI計算方法改動之外,數(shù)據(jù)源的選取標準也更加嚴格,得分由十分制改為百分制,而且改革后的結(jié)果與之前結(jié)果不能進行比較。中國自1995年CPI創(chuàng)設(shè)以來,歷次為其測評對象(如表1所示),得分總體不高但趨勢大致向好,隨著CPI覆蓋的國家和地區(qū)逐漸增多以致趨于穩(wěn)定,中國基本保持在中位數(shù)水平上下。
(二)全球清廉指數(shù)的爭論焦點與評價局限
全球清廉指數(shù)的產(chǎn)生無疑是意義重大的,不僅吸引世界關(guān)注腐敗和反腐問題,同時也促進了關(guān)于腐敗和反腐敗的經(jīng)驗研究[35],腐敗與政治體制、經(jīng)濟發(fā)展、社會公正等的關(guān)系成為實證研究的熱點[36]。然而,關(guān)于全球清廉指數(shù)的爭議也一直未曾停歇,尤其是十八大之后反腐成效舉世矚目的情況下,中國CPI得分和排位不但沒有顯著提升,反而在2014年出現(xiàn)急劇下降,世界排位較之2013年下降了20名,隨之,CPI的準確性、科學性受到更大的質(zhì)疑。不過,值得澄清的是,Corruption Perceptions Index普遍被譯成“清廉指數(shù)”是不妥當?shù)?,根?jù)字面意思,應為“腐敗感知指數(shù)”或“腐敗印象指數(shù)”,度量的是主觀感知的而非客觀實際的腐敗印象。腐敗的感知度并不等同于真實的腐敗情況[37],公眾的腐敗感知存在一定的非理性,在威權(quán)體制國家,單純地加大反腐敗力度,并不必然換來公眾清廉感知水平的提升,反而有可能會導致更高程度的腐敗感知水平[38]。因此,苛求主觀指標的絕對客觀性是對CPI創(chuàng)設(shè)初衷的誤解,但CPI數(shù)據(jù)來源是否具有代表性、比較參照是否具有統(tǒng)一性、統(tǒng)計方法的科學性是值得討論的。
首先,由于透明國際不參與CPI一手數(shù)據(jù)的調(diào)查,也沒有設(shè)置統(tǒng)一的委托調(diào)查方案,因而CPI的數(shù)據(jù)質(zhì)量非常依賴于數(shù)據(jù)來源的代表性。根據(jù)前文可知,CPI數(shù)據(jù)來源主要反映的是各國專家和企業(yè)管理層的感知水平,各國專家的觀點附帶很強的內(nèi)生性問題,也即是專家對各國的腐敗印象很大程度來自于對應的調(diào)研報告;企業(yè)管理層的感知則主要體現(xiàn)在商業(yè)領(lǐng)域,而沒有涵蓋執(zhí)法、司法、行政等方面,比如美國環(huán)球透視國際風險評級重點關(guān)注的是腐敗對企業(yè)獲得商業(yè)許可證、優(yōu)惠政策和制定計劃等方面的經(jīng)濟影響。除此之外,透明國際公布CPI的同時并沒有公布一手數(shù)據(jù)的樣本數(shù)量和調(diào)研規(guī)模,也影響了該指數(shù)的公信力。所以,CPI反映的是少部分人對特定領(lǐng)域的腐敗認知,不等同于一國全面的廉潔狀況。
其次,主觀評價的特征是相對性,參照標準不同,感知水平也不同,CPI的原始數(shù)據(jù)均是主觀調(diào)查,因而比較參照系的統(tǒng)一性非常重要。CPI的編制基于13個標準不一的數(shù)據(jù)來源,腐敗定義不一、問卷設(shè)計不一、調(diào)研人群不一、評分標準不一,由于文化背景、社會歷史、知識水平、個人偏好等的差異,對同一個評價客體的感知也相差甚遠。除此之外,同一原始數(shù)據(jù)每年或定期更換評估者也會影響CPI最基本的可比性。因此,CPI作為一個感知指數(shù),很多時候是由錯誤的人,在錯誤的時間做出的錯誤判斷[39]。
最后,CPI本質(zhì)是二手數(shù)據(jù)的加工綜合,因而統(tǒng)計方法的科學性也至關(guān)重要。事實上,統(tǒng)計方法科學與否并不在于其簡單或者復雜,而在于能否根據(jù)數(shù)據(jù)特點減少誤差,所以,CPI采用的是百分比匹配法還是簡單平均法不是問題爭論的核心。CPI統(tǒng)計方法的爭論焦點是其對極端值缺乏有效過濾、對系統(tǒng)性偏差缺乏有效避免、對不同數(shù)據(jù)源資料等權(quán)處理。過勇[40]等研究指出,CPI參考的報告在時間、樣本以及準確性等方面差異非常顯著,賦予相同的權(quán)重顯然是不合理的,CPI在統(tǒng)計方法上仍有改進的空間。
當然,也應當認識到,腐敗的測量是非常困難的,任何一種方法都有其局限性,完全準確地測量一國或一地區(qū)的腐敗程度幾乎是不可能的。更清楚地了解CPI因各種主客觀條件限制所產(chǎn)生的固有缺陷,才能更冷靜地對待CPI得分與排位結(jié)果及其對中國的評價。2014年中國CPI測評的8個原始數(shù)據(jù)中,美國環(huán)球透視國際風險評級下降幅度最大,得分由2013年的42.0降至2014年的31.9,其次是世界公正項目法治指數(shù),得分由2013年的45.0降至2014年的40.5。然而,環(huán)球透視報告旨在為客戶提供某一市場的商業(yè)活動風險預測,并不涉及對某項政策的好壞評估。中國的高壓反腐造成地方官員對待外商投資更加謹慎保守,由此導致投資前景充滿潛在風險和不確定性,方才使得環(huán)球透視對中國的國家風險評估稍有調(diào)高
美國環(huán)球透視國際風險評級為5分制,最小單位是0.5分,數(shù)值越高表明風險越高。2013年中國為3.5分,2014年則為4.0分,相差只有0.5分,經(jīng)過CPI標準化處理之后差距變成百分制的10.1分。世界公正項目主要關(guān)注政府官員以權(quán)謀私的程度及受訪者評價,中國強硬的反腐斗爭暴露了更多腐敗官員與貪腐案件,使得世界公正項目調(diào)整了對中國的評估認識和參照標準,隨之降低了對中國的評分。由此可知,就CPI對中國的測評而言,其評價能力的局限性是顯而易見的,既存在于原始數(shù)據(jù)的參照標準變動,也存在于透明國際對原始數(shù)據(jù)的解讀應用。CPI雖然提供了認識一國或一地區(qū)腐敗狀況的定量和國際視角,但盲目地將其作為認識世界和指導實踐的風向標,或者以其否定中國的反腐努力和用于反腐敗實證研究是存在問題且有失于嚴謹?shù)摹?/p>
參考文獻:
[1] 王紹光. 中國公共政策議程設(shè)置的模式 [J]. 中國社會科學, 2006(5): 8699.
[2] 托馬斯·皮凱蒂. 21世紀資本論 [M]. 巴曙松,等,譯. 北京: 中信出版社, 2014: 3233.
[3] 瓦里西·列昂惕夫. 經(jīng)濟學論文集: 理論、事實與政策 [M]. 陳冰,等,譯. 北京: 北京經(jīng)濟學院出版社, 1991: 2332.
[4] 臧雷振. 政治學研究中的數(shù)據(jù): 不深刻的理解與困境消解 [J]. 馬克思主義與現(xiàn)實, 2015(5): 8490.
[5] 高敏雪, 李靜萍, 許健. 國民經(jīng)濟核算原理與中國實踐(第三版) [M]. 北京: 中國人民大學出版社, 2013.
[6] 姜波克. 國際金融新編(第五版) [M]. 上海: 復旦大學出版社, 2014.
[7] 徐滇慶. 世界格局與中國經(jīng)濟發(fā)展策略——世紀之交的理論思考 [M]. 北京: 經(jīng)濟科學出版社, 1998.
[8] 李翀. 國內(nèi)生產(chǎn)總值的國際比較方法研究 [J]. 學術(shù)研究, 2015(2): 6368.
[9] 余芳東. 從ICP結(jié)果引發(fā)“統(tǒng)計地震”說起 [J]. 調(diào)研世界, 2015(9): 6164.
[10] World Bank Group. Purchasing power parities and the real size of world economies: a comprehensive report of the 2011 international comparison program [R]. Washington, DC: World Bank. 2015: 167170.
[11] George J. Gilboy, 鐘寧樺. 度量中國經(jīng)濟: 購買力平價的適當應用 [J]. 經(jīng)濟研究, 2010(1): 2738.
[12] 張曉樸. 購買力平價思想的最新演變及其在人民幣匯率中的應用 [J]. 世界經(jīng)濟, 2000(9): 1018.
[13] 余芳東. 國際上非基準年購買力平價推算方法評價 [J]. 統(tǒng)計研究, 2013(3): 2529.
[14] 王巖. 世界銀行ICP2011的方法、指標與數(shù)據(jù)問題研究 [J]. 東北財經(jīng)大學學報, 2016(4): 6571.
[15] 余芳東. 世界銀行2011年國際比較項目方法、結(jié)果及局限 [J]. 統(tǒng)計研究, 2015(1): 1119.
[16] 馬特·安德魯斯, 羅杰·哈伊, 杰利特·邁爾斯. 治理指標有意義嗎?——關(guān)于特定領(lǐng)域治理測量的新路徑 [J]. 吉磊, 編譯. 探索, 2016(2): 149157.
[17] 臧雷振. 治理定量研究: 理論演進及反思——以世界治理指數(shù)(WGI)為例 [J]. 國外社會科學, 2012(4): 1116.
[18] 丹尼爾·考夫曼, 阿爾特·克拉著. 治理指標: 我們在哪兒, 我們應去向何方? [J]. 龐娟, 閆健,摘譯. 國家行政學院學報, 2008(6): 100103.
[19] 周紅云. 國際治理評估指標體系研究述評 [J]. 經(jīng)濟社會體制比較, 2008(6): 2336.
[20] 游騰飛. 西方如何隱蔽性建構(gòu)國際制度性話語權(quán) ——“世界治理指數(shù)”的剖析及其啟示 [J]. 探索, 2017(3): 164172.
[21] 盧春龍, 張華. 國家治理指數(shù)的國際比較: 發(fā)展、民主與文化——兼評世界銀行“世界治理指數(shù)” [J]. 江蘇行政學院學報, 2017(2): 9097.
[22] Buckley P J, Clegg L J, Cross A R, Liu Xin, Voss H, Zheng Ping. The determinants of Chinese outward foreign direct investment [J]. Journal of International Business Studies, 2007, 38(4): 499518.
[23] Ramasamy B, Yeung M, Laforet S. Chinas outward foreign direct investment: location choice and firm ownership [J]. Journal of World Business, 2012, 47(1): 1725.
[24] Kolstad I, Wiig A. What determines Chinese outward FDI? [J]. Journal of World Business, 2012, 47(1): 2634.
[25] 吳白乙, 史沛然. 社會安全與貿(mào)易投資環(huán)境: 現(xiàn)有研究與新可能性 [J]. 國際經(jīng)濟評論, 2015(3): 7995.
[26] 姚凱, 張萍. 中國企業(yè)對外投資的政治風險及量化評估模型 [J]. 經(jīng)濟理論與經(jīng)濟管理, 2012(5): 103111.
[27] 蔣冠宏, 蔣殿春. 中國對發(fā)展中國家的投資——東道國制度重要嗎? [J]. 管理世界, 2012(11): 4556.
[28] 楊嬌輝, 王偉, 譚娜. 破解中國對外直接投資區(qū)位分布的“制度風險偏好”之謎 [J]. 世界經(jīng)濟, 2016(11): 327.
[29] 楊宏恩, 孟慶強, 王晶, 李浩. 雙邊投資協(xié)定對中國對外直接投資的影響: 基于投資協(xié)定異質(zhì)性的視角 [J]. 管理世界, 2016(4): 2436.
[30] 宗芳宇, 路江涌, 武常岐. 雙邊投資協(xié)定、制度環(huán)境和企業(yè)對外直接投資區(qū)位選擇 [J]. 經(jīng)濟研究, 2012(5): 7182.
[31] 潘鎮(zhèn), 金中坤. 雙邊政治關(guān)系、東道國制度風險與中國對外直接投資 [J]. 財貿(mào)經(jīng)濟, 2015(6): 8597.
[32] 馬得勇, 張蕾. 測量治理: 國外的研究及其對中國的啟示 [J]. 公共管理學報, 2008(4): 101108.
[33] 徐靜. 國內(nèi)外腐敗指數(shù)及其對比研究 [J]. 中國行政管理, 2012(5): 110114.
[34] [ZK(]聶輝華. 腐敗對效率的影響: 一個文獻綜述 [J]. 金[LL]融評論, 2014(1): 1323.
[35] 斯達芬·安德森, 保羅·海伍德. 感知的政治學: 透明國際腐敗測量方法的運用和濫用 [J]. 肖俊奇, 編譯. 經(jīng)濟社會體制比較, 2010(4): 8291.
[36] 肖漢宇, 公婷. 腐敗研究中的若干理論問題——基于2009—2013年526篇SSCI文獻的綜述 [J]. 經(jīng)濟社會體制比較, 2016(2): 4860.
[37] Melgar N, Rossi M, Smith W. The perception of corruption [J]. International Journal of Public Opinion Research, 2010, 22(1): 120131.
[38] 孫宗鋒, 楊麗天晴. “打老虎”如何影響公眾腐敗感知差異?——基于廣東省的準實驗研究 [J]. 公共行政評論, 2016(3): 89107.
[39] 宋旭光. “國家清廉指數(shù)”的統(tǒng)計學批判 [J]. 中國統(tǒng)計, 2005(9): 53.
[40] 過勇, 宋偉. 清廉指數(shù)的腐敗測評方法與局限性 [J]. 經(jīng)濟社會體制比較, 2013(5): 151160.
責任編輯、校對: 鄭雅妮