朱薇姍,張 笑
(河北經(jīng)貿(mào)大學(xué),河北 石家莊 050061)
城市的高質(zhì)量發(fā)展可以改善人民的生產(chǎn)、生活狀況,創(chuàng)造優(yōu)良的宜居環(huán)境。2019年山西省人民政府辦公廳印發(fā)了 《山西省城市品質(zhì)提升行動方案(2019—2022年)》,旨在推進山西省城市高質(zhì)量發(fā)展[1]。要了解山西省各地區(qū)城市建設(shè)與發(fā)展現(xiàn)狀,需從多方面進行綜合評價。
關(guān)于城市發(fā)展的文獻研究視角主要包括兩方面:一是度量城市建設(shè)與發(fā)展的指標方面,寧越敏和唐禮智[2]探討了城市競爭力的概念并設(shè)計了影響城市競爭力的十大指標體系;徐秋云[3]構(gòu)建了濟寧市城市競爭力的六大指標體系,并利用主成分分析對濟寧市的城市發(fā)展進行了綜合評分與評價。二是研究方法方面,張士杰[4]利用主成分分析,對阜陽市城市競爭力進行定量分析,得出阜陽市目前發(fā)展存在的問題并提出相應(yīng)建議;陳智波和尹紅[5]利用聚類分析和主成分分析,對陜西省地級市的城市發(fā)展進行了綜合評價并提出相應(yīng)建議。由文獻分析可知,關(guān)于城市建設(shè)與發(fā)展的研究不少,但關(guān)于山西省城市建設(shè)與發(fā)展的研究少之又少,且大多只以山西省某一個市為例。因此,以山西省的11個主要城市為研究對象,通過主成分分析和聚類分析研究山西省各地區(qū)的城市建設(shè)與發(fā)展很有意義。
本次報告的指標主要通過參考其他文獻選取,最終選取的10個指標如下[5]。
x1常住人口數(shù) (萬人)、x2一般預(yù)算收入 (億元)、x3住宅面積 (萬m2)、x4衛(wèi)生機構(gòu)數(shù) (個)、x5高速公路 (km)、x6中學(xué)個數(shù) (個)、x7地區(qū)生產(chǎn)總值 (億元)、x8農(nóng)林牧漁業(yè)總產(chǎn)值 (億元)、x9工業(yè)企業(yè)單位個數(shù) (個)、x10國內(nèi)旅游人數(shù) (萬人次)。本文所有數(shù)據(jù)均來自 《山西統(tǒng)計年鑒2019》[6],為山西省11個市2018年的城市發(fā)展主要指標。
主成分分析的基本思想是多個變量之間往往存在一定程度的相關(guān)性,可以通過線性變換將原始指標轉(zhuǎn)換成少數(shù)幾個相互獨立且能反映原始數(shù)據(jù)絕大多數(shù)信息的變量,轉(zhuǎn)換后的變量稱為主成分?;灸P蜑?/p>
式中:F1,F(xiàn)2,…,F(xiàn)n為提取的n個主成分;bpn為特征向量;N1,N2,…,Np為經(jīng)過標準化處理后的數(shù)據(jù);λ1,λ2,…,λn為特征根。
聚類分析是通過數(shù)據(jù)建模簡化數(shù)據(jù)的一種方法。傳統(tǒng)的統(tǒng)計聚類分析包括系統(tǒng)聚類法、分解法、加入法、動態(tài)聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。簡單來說就是分析如何對樣品或變量進行量化分類,根據(jù)不同的分類對象,可以分為Q型聚類和R型聚類,Q型聚類是對樣本進行分類處理,R型聚類是對變量進行分類處理[7]。
聚類分析依據(jù)的基本原則:直接比較樣本中各事物的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別比較大的分在不同類。也就是說,同類事物之間性質(zhì)差異小,類與類事物之間性質(zhì)相差較大。
系統(tǒng)聚類的基本思想:將距離相近的樣本或變量先聚成類,距離相遠的后聚成類,一直進行下去,直到每個樣本或變量都聚到合適的類中。
本文主要采用系統(tǒng)聚類法,基本模型如下。
將每個單元看成一類,則單元i與單元j之間的歐幾里得距離為
將距離最近的兩個單元歸為一類,然后通過離差平方和法進行兩個族群間距離的計算,即
由于各指標存在差異,因此在進行主成分分析之前先對數(shù)據(jù)進行標準化處理,然后用標準化后的數(shù)據(jù)進行主成分分析。
進行主成分分析之前,先進行KMO檢驗和Bartlett's球形度檢驗,檢驗結(jié)果見表1。可以看出,KMO檢驗值為0.649(>0.6),且標準化后的數(shù)據(jù)顯著性為0(<0.05),因此判斷其是適合做主成分分析的。
表1 KMO檢驗和Bartlett's球形度檢驗
公因子方差表 (見表2)給出了這次分析中從每個原始變量中提取的信息,從中可以看出除了高速公路 (km)信息損失程度略大外,主成分幾乎包含了其余各變量至少90%的信息。
表2 公因子方差
從碎石圖 (見圖1)也可以看出,第一個主成分與第二個主成分,第二個主成分與第三個主成分特征值相差較大,其他特征值差值都較小,因此保留兩個主成分就可以概括絕大部分信息。
圖1 碎石圖
解釋的總方差見表3,從旋轉(zhuǎn)后的平方和可以看出保留了兩個主成分 (SPSS默認特征值大于1),第一個主成分的特征根λ1=4.193,解釋了總變量的41.931%;第二個主成分的特征根λ2=4.124,解釋了總變量的41.239%,前兩個主成分的累計方差貢獻率達到了83.170%,說明這兩個公因子基本反映了原始變量的絕大部分信息,即這兩個主成分可以代替最初選取的10個衡量山西省建設(shè)與發(fā)展基本情況的指標,分別記為F1,F(xiàn)2。
表3 解釋的總方差
旋轉(zhuǎn)后的成分矩陣表見表4,可以看出第一個主成分在 x1,x5,x6,x8,x9,x10上有較大的載荷,第二個主成分在x2,x3,x4和x7上有較大的載荷。
表4 旋轉(zhuǎn)成分矩陣
表5為成分得分系數(shù)矩陣,可以得出兩個主成分的表達式為
表5 成分得分系數(shù)矩陣
根據(jù)上面得到的主成分的線性方程,將標準化后的數(shù)據(jù)代入,得到綜合得分與排名,見表6。
表6 綜合得分與排名
在本次運用主成分分析方法對山西省各地區(qū)的城市建設(shè)與發(fā)展進行分析時,最后保留兩個主成分因子。用這兩個主成分因子來代替10個指標進行分析,將標準化后的數(shù)據(jù)代入所得主成分的線性方程中,得到各城市的綜合得分與排名。綜合得分為正值,說明該城市建設(shè)與發(fā)展高于平均水平,反之,綜合得分為負值的說明該城市建設(shè)與發(fā)展低于平均水平。排名由大到小依次為太原、運城、晉中、臨汾、呂梁、長治、大同、忻州、晉城、朔州、陽泉。
運用系統(tǒng)聚類分析方法,在聚類過程中,11個城市都參與了聚類,所以可以進行下一步分析。根據(jù)聚類的譜系圖 (見圖2)可以得出,若將樣本聚為4類的話,可以得到最終聚類結(jié)果,見表7。
圖2 譜系圖
表7 聚類結(jié)果
綜合主成分分析和聚類分析的結(jié)果,得到各市綜合得分、排名與聚類情況,見第8頁表8。
表8 綜合得分、排名與聚類情況
本文在對山西省各地區(qū)的城市建設(shè)與發(fā)展狀況進行分析時,采用了主成分分析與聚類分析方法,根據(jù)表8各市綜合得分、排名與聚類情況可以得到以下結(jié)論。
1)在調(diào)研的11個城市中,太原、運城、晉中、臨汾和呂梁的綜合得分是大于0的,說明這些城市的發(fā)展水平在平均發(fā)展水平之上,其他城市均低于平均發(fā)展水平,說明其城市建設(shè)與發(fā)展狀況與前面的城市相比還有一定差距。
2)太原市作為山西省的省會城市,綜合得分不出意外地排在了第一,與其他城市相比自成一類。運城綜合得分排在第二,也自成一類,可以看出運城與綜合得分第三的晉中綜合得分相差較大,說明運城雖然發(fā)展比不上省會城市太原,但是相比其他城市還是拉開了一定差距。
3)晉中綜合得分排在第三,晉中與省會相鄰,所下轄的城市在多個方面都有著不錯的發(fā)展。中心城區(qū)榆次區(qū)已經(jīng)與太原中心城區(qū)相連,城市之間的交往也十分密切。晉中與臨汾、呂梁、長治、大同、忻州和晉城歸為一類,發(fā)展處于全省平均發(fā)展水平。朔州和陽泉的綜合得分最低,歸為一類。