陳智波 尹紅
摘? 要: 為了研究陜西省各地區(qū)城市的建設(shè)與發(fā)展狀況,本文以陜西省的11個主要城市為研究對象,選取2015年度各個地區(qū)城市的年底城市總?cè)丝跀?shù)、地方財政收入、城市用水普及率、城市燃氣普及率、住宅面積等15個因素作為評價指標,從陜西省統(tǒng)計年鑒中提取出各個城市的相關(guān)數(shù)據(jù)。采用聚類分析法(系統(tǒng)聚類分析、k-均值聚類分析)和主成分分析法兩種多元統(tǒng)計學方法,運用spss軟件進行分析,最后對陜西省主要地區(qū)的城市建設(shè)和發(fā)展狀況進行綜合評價。
關(guān)鍵詞: 城市發(fā)展;SPSS統(tǒng)計軟件;聚類分析;主成分分析
【Abstract】: In order to study the construction and development of regional cities in Shaanxi Province, this paper takes 11 major cities in Shaanxi Province as the research object. Fifteen factors such as total urban population, local financial revenue, urban water use penetration rate, urban gas penetration rate and residential area at the end of 2015 are selected as evaluation indexes, and each city is extracted from the statistical yearbook of Shaanxi Province. Relevant data. Cluster analysis (system cluster analysis, K-means cluster analysis) and principal component analysis are used to analyze the situation of urban construction and development in Shaanxi Province. Finally, the comprehensive evaluation of urban construction and development in the main areas of Shaanxi Province is carried out.
【Key words】: Urban development; SPSS statistical software; Cluster analysis; Principal component analysis
0? 引言
城市建設(shè)是城市管理的重要組成部分。城市建設(shè)以規(guī)劃為依據(jù),通過建設(shè)工程對城市人居環(huán)境進行改造,對城市系統(tǒng)內(nèi)各物質(zhì)設(shè)施進行建設(shè),城市建設(shè)的內(nèi)容包括城市系統(tǒng)內(nèi)各個物質(zhì)設(shè)施的實物形態(tài),是為管理城市創(chuàng)造良好條件的基礎(chǔ)性、階段性工作,是過程性和周期性比較明顯的一種特殊經(jīng)濟工作[1]。對于省內(nèi)的各個城市來說,如何掌握它們
現(xiàn)階段的發(fā)展情況,并對之后發(fā)展做出規(guī)劃,服務(wù)城市經(jīng)濟社會發(fā)展,真正為市民創(chuàng)造良好的人居環(huán)境是非常重要的。本文運用聚類分析和主成分分析法,借助spss軟件進行數(shù)據(jù)分析[2],根據(jù)結(jié)果對陜西省各地區(qū)城市建設(shè)與發(fā)展狀況做出分析與評價。
1? 聚類分析
聚類分析是建立一種分析方法,將一批樣本和變量,按照他們在性質(zhì)上的親疏、相似程度進行分類的一種多元統(tǒng)計分析方法。聚類分析的內(nèi)容十分豐富,按其聚類的方法可以分為:系統(tǒng)聚類法、動態(tài)聚類法、最優(yōu)化聚類法、模糊聚類法、圖論聚類法和聚類預(yù)報法[3]。
另外,按照分類對象不同可以分為R型聚類和 Q型聚類,R型是對變量進行聚類,Q型是對樣本進行聚類。
4? 數(shù)據(jù)分析
4.1? 聚類分析
利用SPSS軟件首先對數(shù)據(jù)進行系統(tǒng)聚類分析,分析過程及結(jié)果如下[9]。
通過表2個案處理摘要表,我們可以看出,在整個聚類過程中,所選取的11個城市均參與了聚類分析過程,沒有遺失或未參與的樣本。這充分說明此次聚類分析已經(jīng)對11個樣本的各項指標進行了相似聚類,因而可以進行下一步分析。
通過表3樣本聚類表,我們可以看出當11個樣本分別分成2個聚類和3個聚類時的樣本聚類情況。
結(jié)合表3樣本歸類表和圖1聚類樹形圖,當將樣本聚為3類時,我們可以得出表4的聚類結(jié)果。
接下來我們再使用K-均值聚類方法對樣本進行分析:
a. 由于聚類中心中不存在變動或者僅有小幅變動,因此實現(xiàn)了收斂。任何中心的最大絕對坐標變動為0.000。當前迭代為2。初始中心之間的最小距離為6775.821。
根據(jù)K-均值聚類最終得到的表6聚類成員表我們可以看出11個樣本被聚為3類第一類為西安,第二類為榆林、渭南、咸陽、漢中、延安、寶雞、安康,第三類為銅川、商洛、楊凌,由此可見兩種聚類方法得到的結(jié)果是一致的。
4.2? 主成分分析
由于選取的各個指標的單位不相同,因此在進行主成分分析前需要將所有的數(shù)據(jù)進行標準化處理,經(jīng)過標準化處理后的數(shù)據(jù)如表7所示。
由表8總方差解釋表可知特征根λ1=9.667,特征根λ2=2.367,前兩個主成分的累積方差貢獻率達到了80.229%,即涵蓋了大部分信息,這表明前兩個主成分能夠代表最初的15個指標來分析陜西省各地區(qū)的城市發(fā)展與建設(shè)情況,故提取兩個主成分即可[10],分別記為z1,z2。
在運用主成分分析方法對陜西省各地區(qū)的城市建設(shè)與發(fā)展時,我們最后選取了兩個主成分因子即2個主要指標代表了15個指標進行分析,表11綜合得分與排名表給出了各城市的綜合得分與排名,其中綜合得分為正值的,說明城市建設(shè)與發(fā)展高于平均水平,反之,綜合得分為負值的,說明其城市建設(shè)與發(fā)展低于平均水平。排名一列我們可以看出11個城市在綜合兩個主成分因子下的排名,由大到小一次為:西安、咸陽、榆林、渭南、寶雞、漢中、安康、延安、商洛、銅川、楊凌。
5? 結(jié)論
在進行對陜西省各地區(qū)的城市建設(shè)與發(fā)展狀況進行分析時我們采用了聚類分析和主成分分析的方法,綜合聚類分析和主成分分析的結(jié)果,我們可以得到下表12綜合得分與聚類狀況表。
從表中我們可以看出在陜西省的城市中,西安市作為陜西省的省會城市,無論在哪個方面都處于龍頭地位,其城市建設(shè)與發(fā)展遠遠高于同地區(qū)的其他城市,不僅在綜合得分上處于第一位,同時與其他城市相比自為一類。
咸陽市居于第二位,近幾年來陜西省政府在咸陽市成立西咸新區(qū),加大對咸陽市的建設(shè)和發(fā)展投入,使得咸陽市成為西安國際化大都市的核心組成部分,成為西部高端化和先進的制造業(yè)基地,其余6個城市與咸陽建設(shè)發(fā)展狀況較為接近。
商洛、銅川、楊凌同為一類,這說明其城市建設(shè)與發(fā)展狀況與上面的八個城市相比還是很有差距的,這就要求政府在以后的發(fā)展中加大對基礎(chǔ)城市建設(shè)的投資,努力提高各方面的水平。
參考文獻
[1]寧越敏, 唐禮智. 城市競爭力的概念和指標體系[J]. 現(xiàn)代城市研究, 2001, 10(3).
[2]趙楠, 王昕, 李英娜, 等. 利用 spss 軟件分析校園霸凌事件的發(fā)生規(guī)律以及預(yù)防[J]. 軟件, 2018, 39(1): 159-164.
[3]陳磊磊.不同距離測度的K-Means 文本聚類研究[J]. 軟件, 2015, 36(1): 56-61.
[4]田明光, 翟旭, 江穎潔, 等. 基于K均值聚類及高斯過程回歸集成的鉛酸電池荷電狀態(tài)預(yù)測[J]. 軟件, 2018, 39(1): 132-137.
[5]何曉群. 多元統(tǒng)計分析[M]. 北京: 中國人民大學出版社, 2015.
[6]張文宇, 王秀秀, 任露, 等. 改進的主成分聚類分析法在教育信息化中的應(yīng)用[J]. 軟件, 2015, 36(7): 10-16.
[7]高惠璇編著, 《應(yīng)用多元統(tǒng)計分析》北京大學出版社, 2005. 1.
[8]陜西省統(tǒng)計局. 陜西省統(tǒng)計年鑒[Z]. 北京: 中國統(tǒng)計出版社.
[9]吳榮強, 李晉宏. 基于聚類分析的鋁電解槽陽極壓降的分類[J]. 軟件, 2018, 39(3): 166-169.
[10]唐功爽. 基于spss的主成分分析于因子分析的辨析[J]. 統(tǒng)計教育, 2007(2).
[11]張士杰. 基于主成分分析的阜陽市城市競爭力評價[J]. 安徽廣播電視大學學報, 2011, (4).