熊 濤
(青海民族大學數(shù)學與統(tǒng)計學院,青海西寧810007)
因子分析法(Factor Analysis)就是尋找公共因子的模型分析方法,它是在主成分的基礎上構筑若干意義較為明確的公共因子,以它們?yōu)榭蚣芊纸庠甲兞?,以此考察原變量間的聯(lián)系與區(qū)別.因子分析主要用于:減少分析變量個數(shù);通過對變量間相關關系探測,將原始變量進行分類,即將相關性較高的變量分為一組,用共性因子代替改組變量.基本思想:將觀測變量進行分類,將相關性較高,即聯(lián)系比較緊密的分在同一組中,而不同組的相關性則較低,那么每一組變量實際上就代表了一個基本結構,即公共因子.本文采用的數(shù)據(jù)為2010年我國31個省、市和自治區(qū)前三個季度城鎮(zhèn)居民人均消費支出,作出了消費支出的因子得分,根據(jù)因子得分大小對樣本進行排序,我們運用相關的統(tǒng)計知識可以得出一些結論,可以為政府今后的決策作簡單的參考.
本文數(shù)據(jù)來源于中華人民共和國國家統(tǒng)計網(wǎng),采用的數(shù)據(jù)為2010年我國31個省、市和自治區(qū)前三個季度城鎮(zhèn)居民人均消費支出,建立了八項統(tǒng)計指標,分別為:食品,衣著,居住,家用服務,醫(yī)療保健,交通通信,教育娛樂,其他服務.通過SPSS15.0分析軟件,對數(shù)據(jù)作出相關系數(shù)矩陣,以及KMO和Bartlett′s Test檢驗:
表1 相關系數(shù)矩陣
從相關系數(shù)矩陣來看:食品支出與交通通信支出,以及教育娛樂支出與家用服務出的相關程度很高,相關系數(shù)分別是0.883、0.880;而衣著支出與食品、居住、交通通信支出,以及醫(yī)療保健支出與食品、居住、交通通信支出的相關程度較低.
表 2 KMO 和 Bartlett′s Test檢驗
KMO值用于檢驗因子分析是否適用的指標值,若它在0.5~1.0之間,表示適合;小于0.5表示不適合.Bartlett的球體檢驗是通過轉換χ2檢驗來完成對變量之間是否相互獨立進行檢驗.若該統(tǒng)計量的取值較大,因子分析是可用的.這里 KMO值為0.877,在0.5~1.0之間;Bartlett的檢驗也是通過的,因為漸近的χ2值為254.203,值很大,相應的顯著性概率小于0.001為高度顯著,因此數(shù)據(jù)適合使用因子分析方法.
表3 總方差解釋
由方差解釋表看出:特征值λ1=5.641,λ2=1.364,λ3=0.284,λ4=0.265,λ5=0.183,λ6=0.108,λ7=0.08,λ8=0.075.相應的方差貢獻率分別為:第一公因子λ1/∑λ=70.517%,第二公因子λ2/∑λ=17.052%,取前兩個公因子時累計貢獻率達到了87.461%,已經(jīng)超出85%的需求,所以只需提取兩個公共因子.從碎石圖中也可以直觀的看到特征值的大?。害?=5.641,λ2=1.364,λ3=0.284等,從此也能看到其變化率,第一個到第二個變化非常迅速,第二個到第三個的變化銳減,而其它的變化就更加緩慢了.
表4 因子分析的初始解
由表4可見,公共因子的初始值均為1,食品和教育娛樂支出變量的共同度分別為0.907,0.916,都超過了0.9;而余下變量的共同度均超過了0.84.因此由兩個公共因子F1和F2說明食品和教育娛樂支出這兩個變量的信息都超過了90%,說明由三個公共因子提供的信息量還是較多的.
表5 初始因子載荷陣
表6 方差最大正交旋轉后的因子載荷陣
由旋轉后的正交因子載荷陣可知:第一公共因子上高載荷的指標有食品、居住、交通通信、教育娛樂和其他服務,相應的因子載荷值分別為0.947,0.925,0.903,0.864,0.837,0.672.這些支出均為居民基本生活所必需的方方面面,將第一公共因子命名為生活因子.第二公共因子上高載荷的指標有衣著和醫(yī)療保健,相應的因子載荷值分別為0.929,0.903.這兩項指標反映了人們對自身健康和外表上的需求,因此可以命名為健康和外在美因子,在這簡稱健美因子.
表7 因子得分系數(shù)矩陣
根據(jù)因子得分矩陣,可以得到公共因子的模型(ZXi為標準化后的原始數(shù)據(jù)):
現(xiàn)在把原數(shù)據(jù)標準化后的數(shù)據(jù)帶入上面兩個公共因子模型中,算出公共因子的得分,再進行排名:首先對原數(shù)據(jù)進行標準化處理;然后把標準化后的數(shù)據(jù)帶入公共因子的兩個模型中就可算出因子得分;最后對因子得分進行排名.
因子得分的大小沒有絕對的實際意義,而有相對意義,一般可以根據(jù)因子得分大小對樣品進行排序,從排序的結果可以看出:第一公共因子得分排在最前面的是上海市,廣東省,北京市,說明那里的城市居民的生活已經(jīng)達到了比較高的水平;第二公共因子得分排在最前面的是內(nèi)蒙古,北京市,吉林省,說明這些地區(qū)的城市居民在衣著和醫(yī)療保健方面的支出較大.
從上面的公共因子得分表中可以看出,西北地區(qū)和東北地區(qū)的省份在第一公共因子排名上都比較靠后,如:新疆,青海,甘肅,吉林,黑龍江等省份.而第二公共因子上排名靠后的有海南,廣西,江西,西藏,云南等省份,這些省份對第二公共因子的需求不高,所以排名靠后.從上面的分析我們就可以很明顯的看出東西部地區(qū)及東北地區(qū)不管在生活因子還是在健康和外在美因子上都存在著差距.
如今,我國經(jīng)濟步入了新的發(fā)展階段,根據(jù)世界其它國家的經(jīng)驗,能否解決好地區(qū)間經(jīng)濟發(fā)展差距直接影響國家經(jīng)濟的全面持續(xù)發(fā)展以及和諧社會的構建.
因此,現(xiàn)階段應當在保持經(jīng)濟增長速度不變的狀態(tài)下,把經(jīng)濟建設的重心轉移到西部地區(qū)和東北地區(qū),大力開發(fā)西部的特有資源,振興東北老工業(yè)基地,針對各地區(qū)的特點,制定相應的政策,加大對這些地區(qū)的生產(chǎn)、生活投入,繼續(xù)實行擴大內(nèi)需,拉動經(jīng)濟的政策,逐漸縮短與東部發(fā)達省份之間的居民消費水平之間的差距,實現(xiàn)經(jīng)濟的全面發(fā)展,創(chuàng)建美好的和諧社會.
[1]高祥寶,董寒青.數(shù)據(jù)分析與SPSS應用[M].北京:清華大學出版社,2007.
[2]于秀林,任雪松.多元統(tǒng)計分析[M].北京:中國統(tǒng)計出版社,1999.
[3]基于聚類和因子分析的農(nóng)村居民消費結構實證研究[J].遼寧石油化工大學學報,2008(6).
[4]薛薇.統(tǒng)計分析與SPSS的應用[M].北京:中國人民出版社,2001.
[5]王璐.SPSS統(tǒng)計分析基礎、應用與實踐[M].北京:化學工業(yè)出版社,2010.
[6]吳棟.近年居民消費結構統(tǒng)計分析的研究綜述[J].數(shù)理統(tǒng)計與管理,2007(9).
[7]國家統(tǒng)計局.中國統(tǒng)計年鑒2010[M].北京:中國統(tǒng)計出版社,2010.
[8]吳棟.近年居民消費結構統(tǒng)計分析的研究綜述[J].數(shù)理統(tǒng)計與管理,2007(9).
[9]鄧菲.因子分析在我國城鎮(zhèn)居民消費結構變動的應用[J].科技經(jīng)濟市場,2008(11).