常 勝,秦 浪,湯弟偉
(湖北民族學(xué)院生物科學(xué)與技術(shù)學(xué)院,湖北恩施445000)
重慶市各區(qū)縣綜合發(fā)展水平差異分析
——基于SPSS主成分分析法和聚類分析法
常 勝,秦 浪,湯弟偉
(湖北民族學(xué)院生物科學(xué)與技術(shù)學(xué)院,湖北恩施445000)
重慶作為我國中西部唯一直轄市,在西部大開發(fā)戰(zhàn)略和長江經(jīng)濟帶建設(shè)的推動下,整體發(fā)展正在邁入一個全新階段.但是,重慶的城鄉(xiāng)區(qū)域差距和城鄉(xiāng)二元結(jié)構(gòu)依然存在.研究發(fā)現(xiàn),其轄區(qū)內(nèi)各區(qū)縣發(fā)展并不協(xié)調(diào),貧富差距仍然較大.基于SPSS統(tǒng)計分析軟件,運用主成分分析法和聚類分析法分析了重慶各區(qū)縣綜合發(fā)展水平差異情況,為決策者更好的制定各區(qū)縣的發(fā)展規(guī)劃提供參考和依據(jù).
重慶;SPSS統(tǒng)計分析;主成分分析;聚類分析;綜合評價;區(qū)域發(fā)展差異
近年來,重慶以其良好的發(fā)展態(tài)勢、發(fā)展速度以及發(fā)展成果吸引了國內(nèi)外的密切關(guān)注,作為一個山地城市,為何發(fā)展如此之好,各地前來學(xué)習(xí)經(jīng)驗的絡(luò)繹不絕.國家發(fā)展戰(zhàn)略的支持,高速增長的資本投入,豐富的自然資源,輝煌的巴渝文化以及優(yōu)越的地理位置都成為重慶發(fā)展的法寶.但重慶畢竟是一個山城,城市發(fā)展空間受到了地理條件的限制,特別是轄區(qū)內(nèi)的部分區(qū)和幾乎全部縣都處在大山中,與城區(qū)的發(fā)展相當(dāng)不平衡.因此,對重慶各區(qū)縣發(fā)展水平的差異情況做一個科學(xué)評價是有必要的,它能夠幫助決策者制定更好的決策和戰(zhàn)略,有利于今后的長期發(fā)展.通過主成分分析法和聚類分析法的分析解釋,能夠得到重慶各區(qū)縣現(xiàn)階段的發(fā)展水平狀況,以及其在整個區(qū)域發(fā)展中的位置,進而幫助決策者充分認(rèn)識到自身的優(yōu)勢和不足以及今后將要著重發(fā)展的方向.當(dāng)前正是“十三五”開局的熱身期,對重慶各區(qū)縣發(fā)展差異的綜合評價既是一次階段性總結(jié),也為更好的發(fā)展“十三五”打下基礎(chǔ).
本文首先通過主成分分析法,利用SPSS統(tǒng)計分析軟件對指標(biāo)體系中的原始數(shù)據(jù)進行初步分析,確定主成分和成分得分比重,最后通過計算得到各區(qū)縣的得分情況并進行排名分析.然后再對數(shù)據(jù)進行Q型聚類分析,按照各區(qū)縣的關(guān)聯(lián)程度對區(qū)縣進行分類,并與主成分分析的結(jié)果進行比較得出最終的分析結(jié)果.
1.1 主成分分析法
1.1.1 方法原理概述.影響一個地區(qū)發(fā)展的因素有很多,涉及到政治、經(jīng)濟、文化、歷史、資源、區(qū)位等,因此在做處理分析時會用到很多指標(biāo)變量,數(shù)據(jù)龐大,分析復(fù)雜,且各變量間往往存在一定的相關(guān)性,數(shù)據(jù)反映的信息經(jīng)常會有重疊,因此人們希望能夠找到用少數(shù)彼此互不相關(guān)的綜合變量來盡可能多的反映原來變量信息,以達到數(shù)據(jù)簡化的目的[1-2].
因子分析就是用少數(shù)幾個因子來描述多指標(biāo)變量之間的聯(lián)系,用少數(shù)幾個因子來反映原始數(shù)據(jù)的大部分信息的統(tǒng)計學(xué)分析方法.主成分分析(Principal Component Analysis,PCA)是因子分析的一種類型,它通過坐標(biāo)變換,將原有的多個指標(biāo)變量,使用線性運算轉(zhuǎn)換為另外一組不相關(guān)的變量.選取前面幾個方差最大的主成分,達到分析較少指標(biāo)變量個數(shù)的目的,同時又能用較少的變量反映原有變量的絕大部分信息[1],而且主成分分析法應(yīng)該用相當(dāng)?shù)膹V泛[3-7].
1.1.2 評價指標(biāo)體系構(gòu)建.依據(jù)指標(biāo)選取的科學(xué)性和系統(tǒng)性原則,本文從經(jīng)濟、文化、生活、基礎(chǔ)建設(shè)等方面選取了18個指標(biāo)(見表1)進行主成分因子分析,并根據(jù)分析結(jié)果進行進一步計算與解釋,得出綜合排名情況.其分析數(shù)據(jù)全部來源于重慶市統(tǒng)計局《重慶統(tǒng)計年鑒2014》[8].
1.2 聚類分析法
聚類分析的實質(zhì)是能夠?qū)⒁慌鷺颖緮?shù)據(jù)按照它們在性質(zhì)上的關(guān)聯(lián)程度且在沒有先驗知識的情況下自動進行分類.可以說聚類分析是一種探索性的分析,在分類之前,不必事先給出一定的分類標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動對數(shù)據(jù)進行分類[9-11].
(1)專創(chuàng)型師資的多渠道培訓(xùn)。①充分利用現(xiàn)有的KAB、SYB、創(chuàng)新創(chuàng)業(yè)教育聯(lián)盟及其他機構(gòu)等開展的創(chuàng)新創(chuàng)業(yè)培訓(xùn);②國內(nèi)開展創(chuàng)業(yè)教育較早的學(xué)校已形成了相對成熟的創(chuàng)新創(chuàng)業(yè)教育體系,如清華大學(xué)、南開大學(xué),政府可以選取一些典型高校設(shè)立固定的國家級培訓(xùn)基地,為其他院校的教師提供創(chuàng)業(yè)教育進修學(xué)習(xí)的機會;③利用政策支持的出境進修和學(xué)院本身已經(jīng)形成的與國外高校的合作關(guān)系推進教師訪問學(xué)習(xí)。這些“走出去”的培訓(xùn)方式對學(xué)院現(xiàn)有市場營銷師資隊伍而言,因經(jīng)費限制等關(guān)系覆蓋面相對較小。因此,“請進來”的培訓(xùn)方式,能更具有針對本校教師需求情況展開,類似“行健講壇”系列,邀請知名的創(chuàng)業(yè)教育專家、風(fēng)險投資人等開展系列培訓(xùn)。
本文采用系統(tǒng)聚類分析中的Q型聚類分析,聚類方法采用組間聯(lián)接,據(jù)此將38個區(qū)縣分為兩大類.分析數(shù)據(jù)采用表1的各項指標(biāo)數(shù)據(jù).
圖1 重慶市區(qū)位圖Fig.1 Location map in chongqing
表1 區(qū)域綜合發(fā)展評價指標(biāo)體系Tab.1 The evaluation index system table
表2 研究區(qū)域Tab.2 The study area
本文選取重慶轄區(qū)內(nèi)的所有區(qū)縣為主要研究對象.重慶現(xiàn)行有38個區(qū)縣(見表2).重慶位于我國內(nèi)陸西南部,地處武陵山、大巴山、四川盆地的交界處,區(qū)內(nèi)多山地丘陵,其中山地占76%,有“山城”之稱.重慶與陜西、四川、云南、貴州、湖南、湖北六省毗鄰,是承接?xùn)|西部的重要省市,地理位置十分突出;“黃金水道”長江穿境而過,航運發(fā)達;國土面積8.24萬km2.到2014年底,重慶市常住人口2991.40萬人,城鎮(zhèn)化率59.6%.轄區(qū)內(nèi)少數(shù)名族眾多,主要分布在秀山等4個民族自治縣,發(fā)展較為落后.
3.1 主成分分析的數(shù)據(jù)處理結(jié)果
通過SPSS分析軟件,對38個區(qū)縣的18個指標(biāo)因子進行分析后得出了影響重慶市各地區(qū)發(fā)展的幾個主要成分的特征值、貢獻率和累計貢獻率以及其它分析結(jié)果.
3.1.1 公因子的提取及選擇.經(jīng)過旋轉(zhuǎn)平方后得到的累計方差貢獻率達到了87.760%,即反映了原有信息的87.760%,按80%的標(biāo)準(zhǔn)來看,說明因子的提取效果很好,因此我們可以暫時選取這4個主成分作為影響重慶市各區(qū)縣發(fā)展的主要因素,解釋的總方差表見表3.
表3 解釋的總方差Tab.3 Explain the total variance
碎石圖特征值的大小代表了主成分的方差貢獻率大小和重要性程度.從碎石圖可以看出,從第4個因子開始后面的曲線開始變得平緩,最后接近一條直線,據(jù)此可以初步確定抽取前4個因子作為主要因子,碎石圖見圖2.
通過SPSS對以上數(shù)據(jù)的處理分析,可以初步確定選取前4個因子作為影響重慶市各區(qū)縣發(fā)展的主要因子,對4個因子的進一步處理分析能夠最終得出合理的結(jié)論.
3.1.2 主成分因子重命名.經(jīng)過SPSS繼續(xù)分析后得到旋轉(zhuǎn)成分矩陣表,旋轉(zhuǎn)成分矩陣表記錄了經(jīng)過旋轉(zhuǎn)后的每個變量在4個主成分上的載荷矩陣.旋轉(zhuǎn)之后的因子載荷矩陣中各變量根據(jù)負(fù)荷量的大小進行了排序,這樣更容易得出原始指標(biāo)是接近哪個主成分變量,也便于對主成分進行命名和解釋[1].下面根據(jù)旋轉(zhuǎn)后的成分矩陣表,對因子進行歸類重命名以及進一步分析,旋轉(zhuǎn)成分矩陣表見表4.
主因子F1與人均地區(qū)生產(chǎn)總值、城鎮(zhèn)非私營單位就業(yè)人員年平均工資、衛(wèi)生技術(shù)人員、城市化率、城鎮(zhèn)居民可支配收入、公共財政預(yù)算收入、社會消費品零售總額、地區(qū)生產(chǎn)總值、衛(wèi)生機構(gòu)床位數(shù)、房屋建筑竣工面積10個指標(biāo)具有較大的相關(guān)性.其方差貢獻率最大為40.079%,反映的是綜合經(jīng)濟發(fā)展?fàn)顩r,可以定義為綜合經(jīng)濟因子.
圖2 碎石圖Fig.2 Gravel figure
表4 旋轉(zhuǎn)成分矩陣Tab.4 Rotating component matrices
表5 成分得分系數(shù)矩陣Tab.5 Component score coefficient matrix
主因子F2與普通中學(xué)在校學(xué)生數(shù)、總?cè)丝凇⑵胀ㄖ袑W(xué)專任教師人數(shù)3個指標(biāo)變量有較大相關(guān)性,其方差貢獻率為21.418%,反映的是科教文化水平,定義為科教文化水平因子.
主因子F3與工業(yè)總產(chǎn)值、進出口總值、商品房銷售面積、全社會固定資產(chǎn)投資四個指標(biāo)變量具有較大相關(guān)性,其方差貢獻率為19.201%,與經(jīng)濟發(fā)展活力有關(guān),可定義為經(jīng)濟活力因子.
主因子F4與規(guī)模以上工業(yè)能源消費總量有較強的相關(guān)性,其方差貢獻率為7.063%,反映的是工業(yè)發(fā)展?jié)摿?,代表一個地區(qū)工業(yè)發(fā)展?fàn)顩r,可定義為工業(yè)發(fā)展因子.
3.2 主成分得分結(jié)果分析
3.2.1 主成分得分及區(qū)縣排名情況.根據(jù)成分得分系數(shù)矩陣表(見表5)中每個指標(biāo)的得分可以得出最終的主因子得分方程.通過得分方程計算的得分可以對主因子進行進一步的分析解釋.由表5可以列出4個主成分因子的得分方程:
式中的X1,X2,…,X18為通過SPSS標(biāo)準(zhǔn)化處理后的數(shù)據(jù).通過計算得到4個主成分的得分及各區(qū)縣單因子排名情況見表6.
3.2.2 各區(qū)縣單因子得分分析.從單項排名可以看出,各個區(qū)縣所具有的優(yōu)勢因子各不相同,從綜合經(jīng)濟因子來看,排名前三為渝中區(qū)、江北區(qū)、九龍坡區(qū),基本分布在主城區(qū)及其周圍,與社會發(fā)展常理相一致,城市具有優(yōu)越的區(qū)位條件和區(qū)位優(yōu)勢.同時,主成分一的方差貢獻率最大為40.079%,最能夠反映真實情況,即在各單項排名中最具說服力.科教文化因子排名與經(jīng)濟因子排名出入較大,排名前三為萬州區(qū)、開縣、云陽縣.由于科教文化因子與總?cè)丝跀?shù)有很大關(guān)系,而這三個地區(qū)的總?cè)丝诙汲^了130萬,優(yōu)勢明顯.經(jīng)濟活力因子排名除渝中區(qū)外與綜合經(jīng)濟因子排名相似,而渝中區(qū)由于地處市中心,經(jīng)濟發(fā)展已達到峰值并于趨于飽和,因此在當(dāng)前發(fā)展模式下,經(jīng)濟發(fā)展難以出現(xiàn)根本性變化,所以經(jīng)濟活力排名低.從工業(yè)發(fā)展因子排名看,排名靠前的并不在主城區(qū),而是分布在主城區(qū)周圍的區(qū)縣,隨著城區(qū)內(nèi)地價的逐步提高,工業(yè)成本加大,同時為貫徹落實可持續(xù)發(fā)展和科學(xué)發(fā)展的政策,經(jīng)濟發(fā)展要求與環(huán)境相協(xié)調(diào),特別是對城市環(huán)境的要求進一步提高,所以工業(yè)布局向城區(qū)外遷移[12].
表6 主成分指標(biāo)得分及區(qū)縣排名情況Tab.6 Principal component index scores and rankings in counties
3.2.3 各區(qū)縣綜合得分分析.每一個主成分從不同的角度反映了影響重慶各區(qū)縣發(fā)展的情況,但僅通過單個因素的比較,難以作出一個綜合的評判,數(shù)據(jù)復(fù)雜,且同一個地方的每個主成分因子排名各有不同,所以需要對各因子做加權(quán)求綜合得分,再進行比較.這里將每個主成分的特征值在總特征值中所占的比重作為權(quán)重數(shù)計算綜合得分[13].
4個主成分經(jīng)過旋轉(zhuǎn)平方后的特征值分別為7.214、3.855、3.456、1.271以此得到4個因子的權(quán)數(shù)分別為0.457、0.244、0.219、0.080,從而得到綜合得分公式:F=0.457F1+0.244F2+0.219F3+0.080F4.通過公式計算得到重慶各區(qū)縣的綜合得分及排名情況見表6.
從綜合得分情況來看,可以得出兩個差異特點:從區(qū)位上看,西部發(fā)展優(yōu)于東部;從行政區(qū)劃上看,區(qū)的發(fā)展優(yōu)于縣的發(fā)展.從得分排名可以看出,排名靠前的分別是萬州區(qū)、渝北區(qū)、渝中區(qū)、九龍坡區(qū)、沙坪壩區(qū)等位于主城區(qū)內(nèi)或者城區(qū)周圍的地區(qū)(萬州區(qū)除外),這些地區(qū)的綜合競爭力最強,是最具有發(fā)展勢頭的地區(qū).從區(qū)位圖上可以看出,這些地區(qū)基本上全部位于西部地區(qū),以長壽區(qū)、涪陵區(qū)、武隆縣為界,界限以東發(fā)展較為落后.在所有的區(qū)縣中,綜合得分大于0的有17個地區(qū),其中只有一個縣,開縣位列其中,說明重慶的區(qū)縣發(fā)展并不協(xié)調(diào),區(qū)縣發(fā)展差異顯著,區(qū)的發(fā)展要比縣的發(fā)展好很多.
在綜合排名里,萬州區(qū)排名第一,有點出乎意料,但細(xì)細(xì)分析萬州區(qū)自身所擁有的發(fā)展條件和發(fā)展情況來看,能夠排名這么好也在情理之中.
萬州區(qū)地理區(qū)位獨特,為渝東北、鄂西南、陜南的重要物資集散地,與湖北恩施一道成為承接中西部的“節(jié)點性”城市,東有武漢城市圈的輻射帶動,西有重慶市的直接影響,交通便利,是擁有機場、鐵路、高速公路、深水港碼頭、高速鐵路的一個交通樞紐城市.萬州轄區(qū)面積大,在所有區(qū)縣中排名第7,人口170多萬排名第一,勞動力資源豐富;城市建設(shè)規(guī)模在重慶各區(qū)縣中除主城區(qū)外為最大,至2014年底,城市建成區(qū)面積62.5km2,城鎮(zhèn)化率61.11%,高出重慶市1.51個百分點.2014年,萬州區(qū)實現(xiàn)地區(qū)生產(chǎn)總值771.22億元,增長11.1%,比全國、重慶市分別高3.7和0.2個百分點[13].
3.3 基于聚類分析法的結(jié)果分析
在上述因子分析的基礎(chǔ)上,將各指標(biāo)數(shù)據(jù)變量再進行聚類分析,可以將各區(qū)縣分為兩類.
表7 群聚成員表Tab.7 Cluster member list table
聚類分析結(jié)果如表8所示.從表8中可以看出聚類分析能夠較準(zhǔn)確的對區(qū)域發(fā)展水平進行科學(xué)分類,分類結(jié)果與實際相一致,當(dāng)然前提要選取適當(dāng)?shù)木垲惙治龇椒ê涂茖W(xué)參數(shù),因為聚類分析使用的方法與參數(shù)不同,往往會得出不同的分類結(jié)論.同時可以看出,聚類分析結(jié)果和主成分分析的綜合得分排名能夠基本保持一致,兩種分析可以相互印證,說明分析有效,可信度較高.
圖4 使用平均聯(lián)接的樹狀圖Fig.4 Use the tree of the average connection
本文通過運用主成分分析法和聚類分析法,利用SPSS統(tǒng)計分析軟件,對重慶各區(qū)縣的綜合發(fā)展情況進行了一系列的分析評價,發(fā)現(xiàn)重慶雖然整體發(fā)展呈現(xiàn)良好態(tài)勢,發(fā)展勢頭迅猛,但其內(nèi)部各區(qū)縣發(fā)展差異大,東西部發(fā)展矛盾比較突出.以重慶市主城區(qū)為中心向外延伸,發(fā)展差距逐漸拉大,且發(fā)展傾向于區(qū)的發(fā)展而忽視對大多數(shù)縣發(fā)展的重視,導(dǎo)致多數(shù)縣的發(fā)展遠(yuǎn)落后于區(qū)的發(fā)展,特別是一些東部邊遠(yuǎn)地區(qū)的縣,如城口縣、巫溪縣、酉陽縣等,經(jīng)分析看,它們在各方面發(fā)展都比較落后.本次分析,萬州區(qū)作為一個新亮點出現(xiàn),值得去思考,給其它各區(qū)縣的發(fā)展做了一個“榜樣”[15].
表8 各區(qū)縣綜合發(fā)展水平分類Tab.8 Comprehensive development level in each district and county of classification
本文分析也有不足之處,例如萬州區(qū)的人口占絕對優(yōu)勢,而科教文化因子由于與最開始選取的總?cè)丝谝蜃?,在校學(xué)生人數(shù)因子和專任教師人數(shù)因子有很大相關(guān)性,所以萬州區(qū)在科教文化因子占的優(yōu)勢很大,排名第1,此為在最開始選取指標(biāo)因子時考慮不周.另外,影響一個地區(qū)發(fā)展的因素還有很多,本文只從其中的一部分選取指標(biāo),雖然具有代表性,但也不夠全面,也沒有做前后的對比分析,不能夠反映地區(qū)的動態(tài)變化.在以后的分析中,需著力把握動態(tài)發(fā)展,因為一個地區(qū)的發(fā)展是不斷變化的,需要時時跟蹤研究,更有利于決策者的決策,同時在研究方法上也要不斷創(chuàng)新,不斷探索更好更科學(xué)的分析方法.
[1] 尹海偉,孔繁花.城市與區(qū)域規(guī)劃空間分析實驗教程[M].南京:東南大學(xué)出版社,2014:178-193.
[2] 崔功豪,魏清泉,劉科偉.區(qū)域分析與區(qū)域規(guī)劃[M].北京:高等教育出版社,2006.
[3] 趙高長,覃飛.基于主成分分析的高校排課算法研究[J].長春大學(xué)學(xué)報,2015,25(2):45-51.
[4] 徐小華,全曉松,張子鋒.基于PCA和PSO-SVM在葡萄酒分類中的應(yīng)用研究[J].云南民族大學(xué)學(xué)報(自然科學(xué)版),2014,23(4):456-459.
[5] 劉宇琴.基于聚類與主成分分析的重慶庫區(qū)經(jīng)濟發(fā)展研究[J].重慶工商大學(xué)學(xué)報(自然科學(xué)版),2015,32(6):11-16.
[6] 劉天彪,柯洪捷,曹雪薇,等.基于主成分分析和Q型聚類分析的2011賽季中國足球超級聯(lián)賽各隊的技戰(zhàn)術(shù)綜合分析[J].河北科技師范學(xué)院學(xué)報,2016,30(1):35-42.
[7] 賈萬敬,何建敏.主成分分析和因子分析在評價區(qū)域經(jīng)濟發(fā)展水平中的應(yīng)用[J].現(xiàn)代管理科學(xué),2007,(9):19-21.
[8] 重慶市統(tǒng)計局,國家統(tǒng)計局重慶調(diào)查總隊.重慶統(tǒng)計年鑒(2014)[M].重慶:中國統(tǒng)計出版社,2014.
[9] 李新蕊.主成分分析、因子分析、聚類分析的比較與應(yīng)用[J].山東教育學(xué)院學(xué)報,2007(6):23-26.
[10] 劉鳳艷.基于聚類分析的證券業(yè)客戶分層實證研究[J].赤峰學(xué)院學(xué)報(自然科學(xué)版),2016,32(8):99-101.
[11] 崔功豪,魏清泉,劉科偉.區(qū)域分析與區(qū)域規(guī)劃[M].北京:高等教育出版社,2006.
[12] 任占峰,李豫新.新疆區(qū)域可持續(xù)發(fā)展水平分析與評價[J].科技進步與對策,2011,28(14):126-129.
[13] 唐功爽.基于spss的主成分分析與因子分析的辨析[J].統(tǒng)計教育,2007(2):12-14.
[14] 于麗英,郭洪晶.長江三角洲地區(qū)城市綜合競爭力的評價研究[J].上海大學(xué)學(xué)報,2011,18(1):79-90.
[15] 杜相,張韻,楊丹.基于因子分析的地區(qū)綜合發(fā)展水平評價研究[J].無錫商業(yè)職業(yè)技術(shù)學(xué)院學(xué)報,2014,14(5):46-51.
責(zé)任編輯:高 山
Analysis of Disparity of Comprehensive Development Level in Each District and County of Chongqing Municipality——Based on SPSS Principal Component Analysis(PCA)and Cluster Analysis
CHANG Sheng,QIN Nang,TANG Diwei
(School of Biological Science and Technology,Hubei University for Nationalities,Enshi 445000,China)
As the only municipality directly under the central government in the central and western regions of China,Chongqing,driven by the western development strategy and the construction of the Yangtze River economic belt,is entering a new stage in its overall development.However,the gap between urban and rural areas and the urban-rural dual structure still exist.The study found that the development of districts and counties within its jurisdiction is inharmonious and the gap between the rich and poor is still large.Based on SPSS statistical analysis software,this paper analyzes the differences between the comprehensive development level in each district and county of Chongqing by using principal component analysis (PCA)and clustering analysis,which can provide reference and basis for policymakers to better plan for the development of the districts and counties.
Chongqing;SPSS statistical analysis;principal component analysis;clustering analysis;comprehensive evaluation;regional development difference
C811;F222
A
1008-8423(2017)01-0114-07
10.13501/j.cnki.42-1569/n.2017.03.026
2016-12-27.
國家自然科學(xué)基金項目(71663017);湖北省新興(戰(zhàn)略)支持產(chǎn)業(yè)人才計劃項目.
常勝(1979-),男,博士,副教授,主要從事土地評價與管理的研究.