王樂洋, 郭 健, 熊露雲(yún), 余 航
(1.東華理工大學(xué) 測繪工程學(xué)院,江西 南昌 330013;2.國家測繪地理信息局 重點實驗室流域生態(tài)與地理環(huán)境監(jiān)測,江西 南昌 330013)
?
江西省各地級市經(jīng)濟(jì)狀況的系統(tǒng)聚類分析研究
王樂洋1,2,郭健1,熊露雲(yún)1,余航1
(1.東華理工大學(xué) 測繪工程學(xué)院,江西 南昌 330013;2.國家測繪地理信息局 重點實驗室流域生態(tài)與地理環(huán)境監(jiān)測,江西 南昌 330013)
摘要:選取反映區(qū)域經(jīng)濟(jì)發(fā)展?fàn)顩r的8個主要指標(biāo),以系統(tǒng)聚類分析方法研究江西省各地級市的經(jīng)濟(jì)狀況,對系統(tǒng)聚類分析下的結(jié)果進(jìn)行比較。研究認(rèn)為江西省各地區(qū)的經(jīng)濟(jì)發(fā)展水平主要可分為四類:第一類包括南昌,第二類包括景德鎮(zhèn)、萍鄉(xiāng)、鷹潭,第三類包括九江、贛州、吉安、宜春、撫州、上饒,第四類包括新余。研究結(jié)果表明,江西省北部、中南部的地級市間經(jīng)濟(jì)水平差距顯著,建議應(yīng)該對中南部地區(qū)發(fā)展給予更多的重視。
關(guān)鍵詞:經(jīng)濟(jì)狀況;現(xiàn)代地理學(xué);聚類分析;系統(tǒng)聚類
王樂洋,郭健,熊露雲(yún),等.江西省各地級市經(jīng)濟(jì)狀況的系統(tǒng)聚類分析研究[J].東華理工大學(xué)學(xué)報:社會科學(xué)版,2016,35(1):14-19.
Wang Le-yang, Guo Jian, Xiong Lu-yun, et al.The hierarchical cluster analysis of the regional economic situation in Jiangxi province[J].Journal of East China University of Technology(Social Science),2016,35(1):14-19.
經(jīng)過改革開放三十多年的飛速發(fā)展,江西省的經(jīng)濟(jì)發(fā)展取得了重大成果,但由于各地區(qū)的資源、環(huán)境條件,所處的地理位置以及各地區(qū)政策的差異,致使江西省各地級市的經(jīng)濟(jì)狀況表現(xiàn)出明顯的區(qū)域差異[1,2]。對經(jīng)濟(jì)差異區(qū)域進(jìn)行科學(xué)、有效地分類,有利于經(jīng)濟(jì)政策的針對性與合理性[3-5]。本文基于現(xiàn)代地理學(xué)中的數(shù)學(xué)方法,以系統(tǒng)聚類分析方法研究江西省各地級市的經(jīng)濟(jì)狀況,采用目前公認(rèn)的多指標(biāo)評價體系,進(jìn)行極差標(biāo)準(zhǔn)化處理,選取歐氏距離,通過最短距離法計算出類與類之間的距離,并對聚類后的結(jié)果進(jìn)行分析。
1系統(tǒng)聚類分析方法
1.1系統(tǒng)聚類的基本原理
對于一組對象,定義其對象之間的距離,然后將這組對象分成不同類,通過計算對象之間距離,并將每一次聚類距離之間最小的兩個類歸并,將歸并后的類與其他類再次進(jìn)行距離計算,得出的新類與其他類之間距離最小的再次合并為一類,依次類推,得出一個大類[5]。
1.2聚類要素的數(shù)據(jù)處理
對于聚類分析而言,其結(jié)果的可靠度、準(zhǔn)確度與要素的選擇息息相關(guān)。在研究地域分類分區(qū)中,被聚類的對象往往是由多種要素組成的。數(shù)據(jù)往往是不同的元素有不同的量綱與量級,它們數(shù)值的變化可能性大,這樣的分類將一定程度影響結(jié)果的準(zhǔn)確度[4]。因此,在進(jìn)行聚類分析之前,第一步要做的就是對聚類要素進(jìn)行數(shù)據(jù)處理即標(biāo)準(zhǔn)化。
本文對原始數(shù)據(jù)進(jìn)行了極差標(biāo)準(zhǔn)化轉(zhuǎn)換,即對被標(biāo)準(zhǔn)化項目的每個取值減去其最小值,然后除以最大值與最小值的差,新數(shù)據(jù)各要素的極大值為1,極小值為0。若聚類的對象有m個,相應(yīng)聚類對象包含n個要素。其計算公式為[4]:
(1)
1.3對象之間距離的計算
差異越小,對象之間的距離越??;反之,差異越大,對象之間的距離越大。距離是系統(tǒng)聚類的依據(jù),由于距離可以衡量事物之間的差異。若是將其中每一個分類對象中的n個聚類要素看成n維空間的n個坐標(biāo)軸,那么每一個分類對象中的n個要素構(gòu)成的n維數(shù)據(jù)向量就是n維空間中的一個點[4]。如此,對應(yīng)的n維空間中點之間的距離可以用來量度分類對象之間的差別。本文計算分類對象之間的距離采用了歐氏距離。計算公式如下[4]:
(2)
1.4最短距離聚類法
最短距離聚類法,是在原來的m×m距離矩陣的非對角線元素中找出dpq=min{dij},把分類對象Gp和Gq歸并為一類Gr新然后按公式(3)
drk=min{dpd,dqk}(k≠p,q)
(3)
計算原來各類與新類之間的距離,得出一個新的m-1階距離矩陣;從新的距離矩陣中選出最小者dij,把Gi、Gj歸并成新類;再計算各類與新類的距離,循環(huán)計算,直至各分類對象被歸為一類為止[4]。
2江西省各地級市經(jīng)濟(jì)狀況的系統(tǒng)聚類案例
2.1聚類要素的數(shù)據(jù)處理
本文用統(tǒng)計分析SPSS軟件,參照2011—2012年江西統(tǒng)計年鑒[6,7],對2010—2011年江西省11個地級市的8項經(jīng)濟(jì)指標(biāo)進(jìn)行系統(tǒng)聚類分析運算,這8項經(jīng)濟(jì)指標(biāo)包括:地區(qū)總產(chǎn)值、第一產(chǎn)業(yè)、工業(yè)、建筑業(yè)、交通運輸倉儲和郵政業(yè)、批發(fā)零售和住宿餐飲業(yè)、金融業(yè)、人均地區(qū)生產(chǎn)總值,具體見表1、表2。分析過程中,對原始變量進(jìn)行了極差標(biāo)準(zhǔn)化處理,用歐氏距離定義對象之間的距離,并采用最短距離法定義類別。
表1 2010年江西省11個地級市各項經(jīng)濟(jì)指標(biāo)
表2 2011年江西省11個地級市各項經(jīng)濟(jì)指標(biāo)
2.22010年經(jīng)濟(jì)指標(biāo)的系統(tǒng)聚類分析
聚類分析計算過程如表3和圖1所示。由表3可知,該表第一列表示聚類分析的步驟,其中1~11依次表示南昌、景德鎮(zhèn)、萍鄉(xiāng)、九江、新余、鷹潭、贛州、吉安、宜春、撫州、上饒。而群集組合群集1、2表示某步聚類分析中哪兩個對象或類聚成了一類。第四列表示對象之間的距離,距離越小,優(yōu)先聚類。首次出現(xiàn)階群集1、2表示在某步聚類涉及的類型,0表示對象,不小于1的數(shù)字m表示本步與第m步聚類產(chǎn)生的新類聚類。最后一列則表示該步聚類結(jié)果在下面聚類過程中第幾步中將用到。
圖1清晰地表示了聚類分析的全過程,經(jīng)過10步聚類之后11個對象最終聚成了一大類。在該圖中,距離標(biāo)尺上根據(jù)需要(粗分或細(xì)分)選擇一個劃分類的距離值,垂直標(biāo)尺劃線,垂線與水平連線相交的交點數(shù)即為分類的類別數(shù),相交水平連線所對應(yīng)的各案聚成一類[5]。
表3 2010年江西省11個地級市聚類表
然而對于經(jīng)濟(jì)類型區(qū)劃分,既不是越多越好,也不是越少越好。分區(qū)太多,就失去了分區(qū)的意義;分區(qū)太少,則很難做到分類指導(dǎo)和有的放矢。為了更加明顯地體現(xiàn)江西省各地區(qū)的經(jīng)濟(jì)差異,更準(zhǔn)確地為各地區(qū)的經(jīng)濟(jì)發(fā)展程度定位,結(jié)合江西省的實際情況,可將11個地級市的經(jīng)濟(jì)發(fā)展?fàn)顩r分為四類,如圖1中粗豎線位置所示,具體分類情況如表4。
圖1 2010年江西省11個地級市系統(tǒng)聚類樹狀圖
類型地級市第一類南昌市第二類景德鎮(zhèn)市、萍鄉(xiāng)市、鷹潭市第三類九江市、贛州市、吉安市、宜春市、撫州市、上饒市第四類新余市
本文還進(jìn)行了OLAP(在線分析過程)分析,分析結(jié)果見表5,其主要用于對統(tǒng)計數(shù)據(jù)進(jìn)行描述性分析,可以從均值、標(biāo)準(zhǔn)差等方面簡單直觀地研究各類別之間的區(qū)別。結(jié)合表3和圖1可知,第一類只有南昌這一個地級市,它的多項指標(biāo)(均值)比其它類高,其第一產(chǎn)業(yè)相比于第三類較低,人均地區(qū)生產(chǎn)總值低于第四類;第二類的地級市的多項指標(biāo)低于第三類,但人均地區(qū)生產(chǎn)總值高于第三類;第三類的地級市的多項指標(biāo)低于第一類,卻高于第二、四類,然而人均地區(qū)生產(chǎn)總值均值為全省最低;第四類的新余市,多項指標(biāo)介于第二、三類之間,但是人均地區(qū)生產(chǎn)總值均值卻為全省最高。
2.32011年經(jīng)濟(jì)指標(biāo)的系統(tǒng)聚類分析
表6和圖2給出了2011年江西省11個地級市的聚類過程,分類情況與2010年相同,在此不再贅述。
表5 2010年江西省11個地級市系統(tǒng)聚類結(jié)果的OLAP立方體
根據(jù)2011年江西省11個地級市系統(tǒng)聚類結(jié)果的OLAP立方體(見表7)和各項經(jīng)濟(jì)指標(biāo)數(shù)據(jù)可知,各類經(jīng)濟(jì)區(qū)的各項指標(biāo)相比于2010年都有增長,但是各類地級市經(jīng)濟(jì)指標(biāo)的高低情況與2010年情況基本一致,其分類結(jié)果也與2010年相同。
表6 2011年江西省11個地級市聚類表階群集組合群集1群集2系數(shù)首次出現(xiàn)階群集群集1群集2下一階1230.1300022260.17510839110.2140044890.23003558100.2324066780.5180577470.5460688240.5832799250.663801010121.754090圖2 2011年江西省11個地級市系統(tǒng)聚類樹狀圖
表7 2011年江西省11個地級市系統(tǒng)聚類結(jié)果的OLAP立方體
3結(jié)論
本文利用系統(tǒng)聚類分析,基于多元統(tǒng)計與現(xiàn)代地理學(xué)中的數(shù)學(xué)方法,來研究江西省11個地級市經(jīng)濟(jì)發(fā)展實際情況。其中第一類的南昌與江西其他10個地級市有著巨大的差異性。由2010—2011年江西省11個地級市系統(tǒng)聚類結(jié)果的OLAP立方體和2010—2011年江西省11個地級市各項經(jīng)濟(jì)指標(biāo)數(shù)據(jù)統(tǒng)計可知,它的多項指標(biāo)如:地區(qū)生產(chǎn)總值、工業(yè)、建筑業(yè)、交通運輸倉儲和郵政業(yè)、批發(fā)零售和住宿餐飲業(yè)、金融業(yè)均處于首位。因此,作為江西省經(jīng)濟(jì)龍頭的南昌,要增強(qiáng)區(qū)域間的合作與優(yōu)勢互補,帶動其它地級市經(jīng)濟(jì)發(fā)展,達(dá)到共同發(fā)展的目的。
第二類包括景德鎮(zhèn)、萍鄉(xiāng)、鷹潭,這3個城市是除新余之外面積最小的3個地級市,人均地區(qū)生產(chǎn)總值位于前列。這三座城市應(yīng)該積極引進(jìn)和吸收先進(jìn)的技術(shù)和管理經(jīng)驗,改造傳統(tǒng)產(chǎn)業(yè),發(fā)展高技術(shù)產(chǎn)業(yè),促進(jìn)城市經(jīng)濟(jì)結(jié)構(gòu)的優(yōu)化和產(chǎn)業(yè)結(jié)構(gòu)的升級。
第三類包括九江、贛州、吉安、宜春、撫州、上饒,這六個城市經(jīng)濟(jì)情況大體相差不大,但在不同的經(jīng)濟(jì)指標(biāo)上的差距也顯而易見。在這6個城市中又可劃分為2亞類,第一亞類包括贛州、九江,第二亞類包括吉安、宜春、撫州、上饒。第一亞類的九江市在工業(yè)、建筑業(yè)、交通運輸倉儲和郵政業(yè)、批發(fā)零售和住宿餐飲業(yè)、人均地區(qū)生產(chǎn)總值強(qiáng)于贛州,但是贛州在其他指標(biāo)中高于九江,地區(qū)生產(chǎn)總值在11個地級市中排名第二,第一產(chǎn)業(yè)排名第一,人均地區(qū)生產(chǎn)總值卻是倒數(shù)第一至三位,顯示出贛州經(jīng)濟(jì)底子薄。第二亞類中吉安市和撫州市的地區(qū)生產(chǎn)總值、第一產(chǎn)業(yè)、工業(yè)、批發(fā)零售和住宿餐飲業(yè)、金融業(yè)都低于宜春市和上饒市。這6個城市的人均地區(qū)生產(chǎn)總值是江西省11個地級市的中較低的,經(jīng)濟(jì)指標(biāo)的低迷說明城市的經(jīng)濟(jì)結(jié)構(gòu)急需調(diào)整。
第四類包括新余市。新余市雖然由于其面積的偏小導(dǎo)致經(jīng)濟(jì)總量不大,但是新余市的人均地區(qū)生產(chǎn)總值僅次于南昌,排名全省第二。這與其較好的工業(yè)發(fā)展體系和較高的城市化水平是分不開的。新余市應(yīng)當(dāng)繼續(xù)保持這種經(jīng)濟(jì)發(fā)展的勢頭。
本文依托數(shù)理統(tǒng)計工具,將江西省11個地級市按經(jīng)濟(jì)發(fā)展水平分為四類,可以看出江西省各類地級市間經(jīng)濟(jì)水平差距顯著,這將有助于提高我們對各地區(qū)經(jīng)濟(jì)發(fā)展?fàn)顩r的認(rèn)識,同時為相關(guān)政策的制定提供參考依據(jù)。由于本文選取的分類指標(biāo)相對較少,要反映一個地區(qū)經(jīng)濟(jì)發(fā)展水平,更合理的模型應(yīng)該考慮更多的指標(biāo),建立一個更加完善、合理的分類指標(biāo)體系。
[參考文獻(xiàn)]
[1] 彭萍,胡桂開.江西省經(jīng)濟(jì)區(qū)劃及分區(qū)發(fā)展研究[J].東華理工大學(xué)學(xué)報:社會科學(xué)版,2008(2):130-132.
[2] 雷芳,邱衛(wèi)林.城鄉(xiāng)統(tǒng)籌發(fā)展視角下環(huán)鄱陽湖生態(tài)經(jīng)濟(jì)區(qū)的價格障礙分析[J].東華理工大學(xué)學(xué)報:社會科學(xué)版,2011(4):327-330.
[3] 王斌會.多元統(tǒng)計分析及R語言建模[M].廣州:暨南大學(xué)出版社,2010:50-60.
[4] 徐建華.現(xiàn)代地理學(xué)中的數(shù)學(xué)方法[M].北京:高等教育出版社,2002:69-72.
[5] 王薇.對我國各省市2008年經(jīng)濟(jì)狀況的聚類分析[J].經(jīng)濟(jì)師,2010(3):87-89.
[6] 江西省統(tǒng)計局,國家統(tǒng)計局江西調(diào)查總隊.江西統(tǒng)計年鑒2011[M].北京:中國統(tǒng)計出版社,2011.
[7] 江西省統(tǒng)計局,國家統(tǒng)計局江西調(diào)查總隊.江西統(tǒng)計年鑒2012[M].北京:中國統(tǒng)計出版社,2012.
收稿日期:2015-12-08
基金項目:國家自然科學(xué)基金(41204003);測繪地理信息公益性行業(yè)科研專項(201512026);江西省自然科學(xué)基金(20151BAB203042);江西省教育廳科技項目(KJLD12077,KJLD14049);流域生態(tài)與地理環(huán)境監(jiān)測國家測繪地理信息局重點實驗室項目(WE2015005);對地觀測技術(shù)國家測繪地理信息局重點實驗室項目(K201502);東華理工大學(xué)博士科研啟動基金(DHBK201113)。
作者簡介:王樂洋(1983—),男,山東臨沂人,博士,副教授,碩士生導(dǎo)師,主要從事大地測量反演及總體最小二乘平差的理論與應(yīng)用研究。
中圖分類號:F224;F127
文獻(xiàn)標(biāo)識碼:A
文章編號:1674-3512(2016)01-0014-06
The Hierarchical Cluster Analysis of the Regional Economic Situation in Jiangxi Province
WANG Le-yang1,2,GUO Jian1,XIONG Lu-yun1,YU Hang1
(1.FacultyofGeomatics,EastChinaUniversityofTechnology,Nanchang330013,China;2.KeyLaboratoryofWatershedEcologyandGeographicalEnvironmentMonitoring,NASG,Nanchang330013,China)
Abstract:The paper selects eight major indicators that can reflect regional economic development and uses cluster analysis method to study the economy situation around the cities of Jiangxi province. Under the comparison of the results, the study suggests that the level of economic development in Jiangxi province can be divided into four categories. The first category is Nanchang. The second includes Jingdezhen, Pingxiang, Yingtan, the third Jiujiang, Ganzhou, Ji’an, Yichun, Fuzhou, Shangrao, and the last Xinyu. We find that there are significant difference in the economic level between the northern cities and south central cities. The government should attach more importance to the development of south central areas.
Key Words:economic conditions; modern geography; cluster analysis; hierarchical clustering