陳 侃 馬松林
(巢湖學(xué)院數(shù)學(xué)系,安徽 巢湖 238000)
基于主成分分析的安徽省各地區(qū)綜合評(píng)價(jià)探討
陳 侃 馬松林
(巢湖學(xué)院數(shù)學(xué)系,安徽 巢湖 238000)
全面科學(xué)的分析地區(qū)綜合經(jīng)濟(jì)實(shí)力是合理制定地區(qū)發(fā)展政策和促進(jìn)地區(qū)經(jīng)濟(jì)協(xié)調(diào)發(fā)展的基礎(chǔ).本文構(gòu)建測(cè)度地區(qū)綜合經(jīng)濟(jì)實(shí)力的指標(biāo)體系,并運(yùn)用主成分和系統(tǒng)聚類(lèi)法分析了安徽省各地區(qū)綜合經(jīng)濟(jì)實(shí)力,為科學(xué)制定地區(qū)發(fā)展政策提供了理論支撐.
綜合評(píng)價(jià);主成分分析;系統(tǒng)聚類(lèi);累積貢獻(xiàn)率
安徽作為華東地區(qū)的重要組成部分,經(jīng)濟(jì)一直保持著持續(xù)、快速的發(fā)展勢(shì)頭,經(jīng)濟(jì)實(shí)力顯著增強(qiáng),人民生活水平明顯提高,但各地區(qū)間經(jīng)濟(jì)發(fā)展的不平衡性也進(jìn)一步加大,如何準(zhǔn)確地為安徽省各地市的經(jīng)濟(jì)發(fā)展程度定位,也是一個(gè)關(guān)系到安徽省實(shí)施經(jīng)濟(jì)發(fā)展戰(zhàn)略的重要問(wèn)題.本文運(yùn)用多元統(tǒng)計(jì)中的主成分分析法對(duì)全省各個(gè)地市的綜合經(jīng)濟(jì)實(shí)力進(jìn)行分析評(píng)價(jià),系統(tǒng)、客觀地反映出安徽省地區(qū)間經(jīng)濟(jì)實(shí)力的差距,希望能為促進(jìn)地區(qū)間的優(yōu)勢(shì)互補(bǔ)和良性競(jìng)爭(zhēng),為全面協(xié)調(diào)發(fā)展和提升安徽省綜合經(jīng)濟(jì)實(shí)力,可以縮小地域差距,促進(jìn)安徽經(jīng)濟(jì)社會(huì)全面協(xié)調(diào)可持續(xù)發(fā)展.
地區(qū)綜合經(jīng)濟(jì)實(shí)力是一個(gè)具有多角度、多層次、系統(tǒng)性的概念,隨著社會(huì)經(jīng)濟(jì)的發(fā)展也在不斷發(fā)展和完善,評(píng)價(jià)一個(gè)地區(qū)綜合經(jīng)濟(jì)實(shí)力的強(qiáng)弱需要通過(guò)多個(gè)指標(biāo)的綜合分析和比較,因此,挑選的指標(biāo)必須要全面反映所研究對(duì)象的主要特征,具有一定的評(píng)價(jià)和解釋功能,同時(shí)指標(biāo)數(shù)據(jù)要從可信度大的機(jī)構(gòu)或權(quán)威性刊物上獲得.基于以上分析,本文根據(jù)相關(guān)文獻(xiàn)選取了反映地區(qū)經(jīng)濟(jì)發(fā)展水平、對(duì)外貿(mào)易水平、人民生活水平等情況共8個(gè)指標(biāo),構(gòu)成評(píng)價(jià)綜合經(jīng)濟(jì)實(shí)力的指標(biāo)體系,見(jiàn)表1.
表1 綜合經(jīng)濟(jì)實(shí)力指標(biāo)體系
本文利用多元統(tǒng)計(jì)分析中主成分分析方法和聚類(lèi)分析法把以上多個(gè)錯(cuò)綜復(fù)雜的指標(biāo)糅合成幾個(gè)正交的指標(biāo),再通過(guò)客觀賦權(quán)計(jì)算綜合得分,把各個(gè)地區(qū)分類(lèi)加以分析.
2.1主成分分析的基本思想:是將彼此相關(guān)的一組指標(biāo)變量轉(zhuǎn)化為彼此獨(dú)立的一組新指標(biāo)變量,并且其中較少的幾個(gè)新指標(biāo)變量就能綜合反映原來(lái)多個(gè)指標(biāo)變量中所包含的主要信息,又各自帶有獨(dú)特的專業(yè)含義.它是一種數(shù)學(xué)變換方法,即把給定的一組變量通過(guò)線性變換,轉(zhuǎn)換一組不相關(guān)的變量(兩兩相關(guān)系數(shù)為0),在這種變換中,保持變量的總方差-方差之和不變,同時(shí)具有最大方差,稱為第一主成分;具有第二方差,稱為第二主成分,依次類(lèi)推.
2.2 主成分分析基本步驟:
2.2.1 原始數(shù)據(jù)處理
根據(jù)指標(biāo)屬性需要正向化處理,設(shè)原始變量指標(biāo) x1,x2,…,xi,…,xp的樣本觀察矩陣為 X,
2.2.2 建立變量的相關(guān)系數(shù)矩陣
假定標(biāo)準(zhǔn)化后的矩陣仍設(shè)X,求X的相關(guān)陣R=XTX, 求矩陣 R 的特征值 λ1≥λ2≥…≥λp≥0和單位正交化的特征向量 V=(V1,V2,…,Vp),令F=VTX=(F1,…,F(xiàn)i,…,F(xiàn)p),稱 F 為主因子矩陣,F(xiàn)i=VTXa(1,…,p)為 i個(gè)樣本主因子觀測(cè)值.
2.2.3 確定主因子的個(gè)數(shù)m,建立因子模型,一般選取使得,這m個(gè)主因子將矩陣 V 分解為由 F=VTX 可得,X=VF=V(1)F(1)+V(2)F(2),其中V(1)F(1)為 m 個(gè)主因子所能解釋的部分,V(2)F(2)為含信息很少的殘余部分,設(shè)為ξ,這時(shí)有X=V(1)F(1)+ξ,上式稱為因子模型,V(1)稱為因子載荷陣,V(1)稱為主因子.
2.2.4 為了對(duì)主因子的實(shí)際意義有明確的分析和解釋,可對(duì)因子載荷陣V(1)進(jìn)行最大方差正交旋轉(zhuǎn)或斜交旋轉(zhuǎn).
系統(tǒng)聚類(lèi)方法是實(shí)踐應(yīng)用中最為廣泛的一種聚類(lèi)方法,它的基本方法是首先按照被評(píng)價(jià)的評(píng)價(jià)指標(biāo)體系特征,分別確定樣本(點(diǎn))距離和類(lèi)間距離,然后按照以下步驟進(jìn)行分類(lèi).
(1)將被評(píng)價(jià)的n個(gè)個(gè)體看成n個(gè)類(lèi),這時(shí)類(lèi)間距離與樣本間距離是相等的;
(2)按照預(yù)先確定的類(lèi)間距離作為不相似性度量,并求出最小類(lèi)間距離;
(3)將最小距離的兩類(lèi)并為一類(lèi),并求出新類(lèi)與其余類(lèi)之間的距離,并選出最小類(lèi)間距離;
(4)重復(fù)(3)步驟,直至所有類(lèi)歸為一類(lèi);
(5)在所取類(lèi)距離意義下,畫(huà)出按相似或相近程度的譜系圖;
(6)按綜合評(píng)價(jià)的精度要求,選出閾值,確定聚類(lèi)結(jié)果并給出綜合評(píng)價(jià)的結(jié)果;
本文在聚類(lèi)過(guò)程中,選用歐氏距離來(lái)度量類(lèi)與類(lèi)之間的相似程度,聚類(lèi)方法采用最小距離法.
4.1本文選用2010年安徽省統(tǒng)計(jì)局公布的各指標(biāo)的有關(guān)數(shù)據(jù)資料,對(duì)安徽省16個(gè)地市綜合經(jīng)濟(jì)實(shí)力進(jìn)行對(duì)比分析.首先對(duì)原始數(shù)據(jù)正向化處理,計(jì)算8個(gè)指標(biāo)的無(wú)量綱數(shù)據(jù)相關(guān)系數(shù)矩陣(見(jiàn)表 2).
表2 指標(biāo)間相關(guān)系數(shù)矩陣
從上表可以看出,指標(biāo)間相關(guān)性較大,經(jīng)KMO和Bartlett’s檢驗(yàn)證明可以進(jìn)行因子分析.
4.2 利用主成份分析綜合評(píng)價(jià)
對(duì)選取的8個(gè)指標(biāo),采用因子分析中的主成分分析法對(duì)相關(guān)系數(shù)矩陣進(jìn)行初始因子求解,確定公因子數(shù).得相關(guān)矩陣R的特征值、方差貢獻(xiàn)率和累計(jì)方差貢獻(xiàn)率(見(jiàn)表3).利用軟件對(duì)量化后的8個(gè)指標(biāo)進(jìn)行處理,得到8個(gè)主成分Zi(i=1,2,…,8).從表3可以看出,從第2個(gè)主成分起,已含原始數(shù)據(jù)的信息總量的94.44%,因此我們確定主成分個(gè)數(shù)為2個(gè),且主成分具有典型經(jīng)濟(jì)意義,Z1在各項(xiàng)指標(biāo)上的載荷值均為正且相差不大,反映了地區(qū)經(jīng)濟(jì)綜合實(shí)力,在此主成分上的得分越高,表明該地區(qū)的綜合經(jīng)濟(jì)實(shí)力越強(qiáng);主因子Z2在指標(biāo)x4、x5和x6上的載荷值較大,這三個(gè)指標(biāo),反映了地區(qū)人民生活水平,這2個(gè)主成分較好的總括了原來(lái)的8項(xiàng)指標(biāo)。用特征值歸一化后作為權(quán)值進(jìn)行多指標(biāo)綜合:綜合指標(biāo)將主成份表達(dá)式代入,綜合指標(biāo)的表達(dá)式:
表3 各指標(biāo)的主成分、方差貢獻(xiàn)率以及累計(jì)方差貢獻(xiàn)率
利用綜合指標(biāo)算出安徽省16個(gè)市的綜合得分,見(jiàn)表4。
表4 安徽省各地區(qū)綜合得分表
銅陵 0.15968蚌埠 0.12829黃山 -0.0876宣城 -0.0979滁州 -0.1404安慶 -0.1655六安 -0.291毫州 -0.3444宿州 -0.4036池州 -0.4279阜陽(yáng) -0.5369
從表4的綜合分析來(lái)看,明顯發(fā)現(xiàn)合肥作為安徽省省會(huì)城市,是全省政治、經(jīng)濟(jì)、文化、信息、金融和商貿(mào)中心,全國(guó)重要的科研教育基地,擁有比相鄰城市更加優(yōu)越獨(dú)到的區(qū)位資源優(yōu)勢(shì),因此在綜合得分方面遠(yuǎn)遠(yuǎn)超過(guò)了其它的城市.蕪湖、馬鞍山、淮南、淮北及銅陵名列安徽省前茅,它們由于自身發(fā)達(dá)的工業(yè)帶動(dòng)著社會(huì)快速進(jìn)步,正在加速前進(jìn)著.安徽省的其它城市的綜合發(fā)展水平要遠(yuǎn)遠(yuǎn)低于前面這幾個(gè)城市,關(guān)鍵還是區(qū)位優(yōu)勢(shì)不明顯,政策支持力度不夠.工業(yè)增長(zhǎng)不夠強(qiáng)勁.經(jīng)濟(jì)、政治、文化等方面要明顯落后于前面幾座城市.
筆者認(rèn)為要想縮小安徽各個(gè)地區(qū)經(jīng)濟(jì)發(fā)展差距,應(yīng)著眼于加快在經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)推進(jìn)重大基礎(chǔ)設(shè)施建設(shè),打通制約其發(fā)展瓶頸硬件與軟件問(wèn)題,并根據(jù)其區(qū)域特點(diǎn)切實(shí)加強(qiáng)產(chǎn)業(yè)布局的調(diào)整,走新型工業(yè)化道路;合馬蕪等經(jīng)濟(jì)較發(fā)達(dá)地區(qū)在經(jīng)濟(jì)儲(chǔ)備充裕的優(yōu)勢(shì)條件下,加快從傳統(tǒng)工業(yè)產(chǎn)業(yè)向信息、服務(wù)外包、高科技科技產(chǎn)業(yè)轉(zhuǎn)型,注重生態(tài)建設(shè)與環(huán)境保護(hù)的同時(shí)能在政策上給經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)幫助.這樣有利于實(shí)施全省發(fā)展總體戰(zhàn)略,通過(guò)加快安徽省各地區(qū)的經(jīng)濟(jì)發(fā)展,協(xié)調(diào)地區(qū)布局,提升了全省整體發(fā)展水平.
[1]林震巖.多變量分析——SPSS的操作與應(yīng)用[M].北京:北京大學(xué)出版社,2007.
[2]余建英,何旭宏.數(shù)據(jù)統(tǒng)計(jì)分析與SPSS應(yīng)用[M].北京:人民郵電出版社,2003.
[3]劉學(xué)家,陳世國(guó).基于主成分分析的投資決策[J].運(yùn)籌與管理.2006,(2).
[4]雷欽禮.經(jīng)濟(jì)管理多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,2002.
[5]韓娟.因子分析在評(píng)價(jià)綜合中心城市發(fā)展水平上的應(yīng)用[J].北京統(tǒng)計(jì),1998,(8).
[6]田曉文.中國(guó)地區(qū)經(jīng)濟(jì)差距變化的三大趨勢(shì)及其成因初探[R].北京大學(xué)中國(guó)經(jīng)濟(jì)研究中心討論稿系列.No.C1999017,1999-8.
0213
A
1672-2868(2011)06-0014-04
2011-09-26
巢湖學(xué)院院級(jí)自然科學(xué)研究資助項(xiàng)目(項(xiàng)目編號(hào):XLZ-201005)
陳侃(1985-),男,安徽巢湖人。巢湖學(xué)院數(shù)學(xué)系教師,研究方向:多元統(tǒng)計(jì)
責(zé)任編輯:陳 鳳