李戈輝
摘 要:為了分析城市化發(fā)展與人民生活水平的關(guān)系,本文從時序數(shù)據(jù)出發(fā),分別選出了11個反映城市化和體現(xiàn)人民生活的指標,以北京市為研究對象收集了2006年到2016年的數(shù)據(jù),采用主成分分析的方法研究兩者之間的關(guān)系。本文首先分別求出各自的主成分,然后求出每年的得分值,再根據(jù)特征值將主成分得分分別合成城市發(fā)展指標綜合指標和人民生活水平綜合指標,對兩個綜合指標做線性回歸。結(jié)果表明,兩者成正相關(guān)關(guān)系,即隨著城市化發(fā)展,人民生活水平穩(wěn)步提高,進一步地,兩者回歸系數(shù)約為0.9。
關(guān)鍵詞:主成分分析;城市化發(fā)展;人民生活水平
中圖分類號:F291 文獻標識碼:A 文章編號:1671-2064(2018)21-0220-02
1 引言
城市化(又名城鎮(zhèn)化)包含一個地區(qū)生產(chǎn)力發(fā)展、科技進步以及產(chǎn)業(yè)結(jié)構(gòu)調(diào)整,在人口從農(nóng)村地區(qū)到城市集中的過程中完成從農(nóng)業(yè)到工業(yè)和服務(wù)業(yè)的轉(zhuǎn)變過程。在這個過程中,伴隨著人口、社會、產(chǎn)業(yè)以及土地空間結(jié)構(gòu)的變化,復(fù)雜的因素導(dǎo)致對城市化水平進行客觀評價并非易事。同時,城市化的發(fā)展是否有利于人民生活水平的不斷提高?由于衡量人民生活水平也需要考慮很多指標,這給問題的定量分析造成了一定難度。對多個指標的分析一種比較流行的方法是運用主成分分析對多變量進行降維,將多個變量轉(zhuǎn)化為少數(shù)幾個互不相關(guān)的綜合變量(即主成分),其中每個主成分都是原始變量的線性組合,能夠反映始變量的絕大部分信息,且所含的信息互不重疊[1]。利用主成分分析方法對城市化發(fā)展和人民生活水平進行分析已有很多研究,耿海清[2]、史文利[3]和岑曉雪[4]等主要從地理空間上進行分析,本文從指標時序數(shù)據(jù)出發(fā),研究北京市城市化和人民生活之間的關(guān)系。
2 主成分分析方法
2.1 主成分分析的數(shù)學(xué)原理
假設(shè)研究對象為p維隨機向量記為X=(X1,…,Xp)T,主成分分析的目標在于用k(
Fi=ai1X1+ai2X2+…+aipXp=aiX, (1)
其方差Var(Fi)最大能盡可能地反應(yīng)原變量X所代表的信息。令系數(shù)矩陣A={aij},i=1,…,k,j=1,…,p,則主成分分析可以表示為求解:
(2)
其中Cov(Fm,F(xiàn)n)為協(xié)方差,從幾何上理解系數(shù)矩陣A旋轉(zhuǎn)X1,…,Xp構(gòu)成的坐標,使得新坐標系下的軸向樣本方差最大。
在滿足的條件下,運用拉格朗日乘子法,可以求得系數(shù)aij為X的協(xié)方差矩陣特征值λi(λ1≥λ2≥…≥λp)對應(yīng)的單位正交特征向量。主成分一個重要的性質(zhì)是因子載荷量,它反映主成分Fi與原變量Xj之間的相互關(guān)聯(lián)程度:
. (3)
2.2 主成分分析的計算流程
主成分分析的具體步驟如:(1)計算相關(guān)系數(shù)矩陣。為消除變量之間量綱的差異,先對數(shù)據(jù)進行標準化處理,假設(shè)每一隨機變量Xi有n個觀測樣本Xi=(xi1,…,xin),則X的協(xié)方差矩陣,相關(guān)系數(shù)矩陣為;(2)求矩陣R的特征值λi及相應(yīng)的正交化單位特征向量ai,矩陣R的特征值λi對應(yīng)第i個主成分Fi的方差,λi對應(yīng)的單位特征向量ai就是Fi關(guān)于原變量的系數(shù),即Fi=aiX,用主成分Fi的方差貢獻率βi來反映信息量的大小,;(3)選擇主成分。計算方差累計貢獻率βsum來確定βsum=滿足βsum>85%;(4)計算因子載荷量。因子載荷反映主成分Fi與原變量Xj之間的相互關(guān)聯(lián)程度;(5)計算主成分得分。計算樣本在m個主成分上的得分,F(xiàn)i=ai1X1+ai2X2+…+aipXp,i=1,…,m。
3 主成分分析
3.1 城市化和人民生活水平指標數(shù)據(jù)
根據(jù)指標多樣性和代表性原則,從2006年到2016年的《中國統(tǒng)計年鑒》選取11個與城市化發(fā)展相關(guān)的指標和11個反應(yīng)人民生活水平的指標,如表1所示。
3.2 城市化水平主成分分析
先對數(shù)據(jù)進行標準化處理,然后用R語言進行分析,前3個主成分如表2所示,其累計方差貢獻率為93%。主成分的因子載荷如表3所示,空白處表示因子載荷的絕對值小于0.1,表明主成分表示該因子的信息很小,幾乎可以省略。第一主成分各因子的系數(shù)相差不大,表示城市化基本水平,第二主成分主要體現(xiàn)人口土地指標。
3.3 人民生活水平主成分分析
先對數(shù)據(jù)進行標準化處理,然后用R語言進行分析,前3個主成分如表4所示,其累計方差貢獻率為93.6%。主成分的因子載荷如表5所示。第一主成分人民生活整體水平,第二主成分主要體現(xiàn)城市環(huán)境指標。
4 回歸分析
4.1 綜合指標
根據(jù)累計方差貢獻率大于85%和特征值大于1的規(guī)則,分別采用前兩個主成分信息,分別計算城市化發(fā)展和人民生活水平主成分得分F1c,F(xiàn)2c,F(xiàn)1r,F(xiàn)2r,城市化發(fā)展綜合指標得分Fc=,λic為城市化發(fā)展主成分特征值,同理計算可得人民生活水平綜合指標Fr,結(jié)果如表6所示。
4.2 線性回歸分析
首先求得Fc和Fr的相關(guān)系數(shù)為cor(Fc,F(xiàn)r)=-0.948,對其進行回歸分析,得到兩者之間的關(guān)系為Fr=-0.899Fc,回歸的p值為8.76e-6,表明兩者顯著相關(guān)。由于城市化發(fā)展主成分因子載荷為負數(shù),說明這里得到城市化綜和指標F1c,F(xiàn)2c,F(xiàn)c與城市化發(fā)展是相反的關(guān)系,因此我們可以對回歸方程進行解釋,即隨著城市化的發(fā)展,人民生活水平也相應(yīng)提高。
5 結(jié)語
本文定量分析了北京市城市化發(fā)展與人民生活水平之間的關(guān)系,通過主成分分析和回歸分析,城市化發(fā)展是促進人民生活水平提高的,如果將回歸系數(shù)理解為城市發(fā)展轉(zhuǎn)化為提升人民生活水平的轉(zhuǎn)化效率,則北京市的轉(zhuǎn)化效率為0.9,我們相信在不同的城市由于其自身原因轉(zhuǎn)化效率可能存在差異,這需要進一步的研究。
參考文獻
[1]高惠璇.應(yīng)用多元統(tǒng)計分析[M].北京大學(xué)出版社,2005.
[2]耿海清,陳帆,詹存衛(wèi),等.基于全局主成分分析的我國省級行政區(qū)城市化水平綜合評價[J].人文地理,2009,(5):47-51.
[3]史文利,高天寶,王樹恩.基于主成分分析與聚類分析的城市化水平綜合評價[J].工業(yè)工程,2008,(3):112-115.
[4]岑曉雪,秦江濤.基于主成分分析法的西部人民生活水平價[J].改革與開放,2016,(2):81-84.