馮建中,何先平
(長江大學(xué)信息與數(shù)學(xué)學(xué)院,湖北 荊州 434023)
基于因子和聚類分析的城鎮(zhèn)居民家庭消費性支出應(yīng)用研究
馮建中,何先平
(長江大學(xué)信息與數(shù)學(xué)學(xué)院,湖北 荊州 434023)
以2007年全國31個地區(qū)城鎮(zhèn)居民家庭消費性支出數(shù)據(jù)作為樣本,建立了消費性支出評價指標體系,運用因子分析法進行分析,提取出3個主因子,然后利用聚類分析對各地區(qū)進行了分類。
消費性支出;因子分析;聚類分析
消費是指人們?yōu)榱藵M足生活需要,對物質(zhì)產(chǎn)品的消耗和享受服務(wù)的行為過程。隨著近幾年我國社會和經(jīng)濟的發(fā)展,城鎮(zhèn)居民消費水平不斷提高,消費結(jié)構(gòu)發(fā)生了顯著變化。而且作為社會總需求最重要的組成部分,居民的消費增長直接影響到整個國民經(jīng)濟增長的速度和質(zhì)量。國內(nèi)外對居民消費增長問題的研究由來已久,其中對消費結(jié)構(gòu)變化的研究已成為近年來學(xué)者們研究的熱點[1]。但目前關(guān)于消費結(jié)構(gòu)的研究多集中在其變動趨勢方面,消費性支出的地區(qū)性橫向比較分析[2]則相對較少。而對我國來說各地區(qū)的經(jīng)濟發(fā)展不平衡,居民的消費水平和消費性支出也存在著很大的差異。因此,對我國各地區(qū)城鎮(zhèn)居民人均消費性支出的各項指標進行統(tǒng)計分析,明確我國居民的消費性支出差異的數(shù)量特質(zhì),就顯得尤為必要。
要對城鎮(zhèn)居民消費性支出水平進行準確的描述,必須構(gòu)建合適的指標體系。指標體系的構(gòu)建必須遵循以下原則:全面性原則、整合性原則、代表性原則和實際可操作原則。在總結(jié)相關(guān)研究成果的基礎(chǔ)上,遵循以上原則,本研究建立了如下指標體系(單位:元):食品X1、衣著X2、居住X3、家庭設(shè)備用品及服務(wù)X4、醫(yī)療保健X5、交通和通信X6、教育文化娛樂服務(wù)X7、雜項商品和服務(wù)X8。數(shù)據(jù)來源于《中國統(tǒng)計年鑒2008》[3]。
因子分析的數(shù)學(xué)模型為:
X=AF+ε
式中,X=(X1,X2,…,Xp)′為原指標,F(xiàn)=(F1,F(xiàn)2,…,F(xiàn)m)′為X的公共因子,A為因子載荷矩陣,ε為特殊因子。
本研究使用的因子分析步驟如下[4]:(1)將原始數(shù)據(jù)標準化,仍記為X;(2)建立相關(guān)系數(shù)矩陣R;(3)解特征方程|R-λE|=0,計算特征值和特征向量,當(dāng)累計貢獻率不少于85%時,取前k個主成分代替原來的m個指標,計算因子載荷矩陣A;(4)對A進行最大正交旋轉(zhuǎn)變換;(5)對主因子進行命名和解釋。如需進行排序,則計算各個主因子的得分Fi=αix,以貢獻率為權(quán)重,對Fi加權(quán)計算綜合因子得分。
表1 相關(guān)系數(shù)矩陣特征值與方差貢獻率Table 1 The eigenvalues of correlation coefficient matrix and contribution rate of variance
表2 旋轉(zhuǎn)后的因子載荷矩陣Table 2 Rotated factor pattern matrix
對原始數(shù)據(jù)進行標準化以消除指標間不同量綱對分析結(jié)果的影響,建立指標間的相關(guān)系數(shù)矩陣R,計算其特征值和累計貢獻率[5],前3個特征值及其貢獻率如表1所示。由表1可見,前3個特征值的方差累計貢獻率已經(jīng)達到90.406%,信息損失僅為9.594%,取前3個特征值建立因子載荷矩陣。由于初始因子載荷矩陣結(jié)構(gòu)不夠簡明,各因子的含義不夠突出。為此采用方差最大正交旋轉(zhuǎn)變換,使各變量在某些因子上產(chǎn)生較高載荷,而在其余因子上載荷較小,從而得到旋轉(zhuǎn)后的因子載荷矩陣,如表2所示。
根據(jù)表2將指標分為3類,第一個主因子在X1(食品)、X3(居住)、X4(家庭設(shè)備用品及服務(wù))、X6(交通和通信)、X7(教育文化娛樂服務(wù))、X8(雜項商品和服務(wù))上載荷比較大,特別是在X1、X6、X7上更為明顯,這個因子主要體現(xiàn)了城鎮(zhèn)居民消費性支出的整體水平及日常消費中占主導(dǎo)地位的食品消費,是衡量消費性支出水平的最主要因子,因此可以定義其為基本生活因子。第二個主因子在X5(醫(yī)療保健)上具有較大載荷,稱之為健康投資因子。第三個主因子在X2(衣著)上具有較大載荷,稱之為衣著消費因子。
根據(jù)SPSS程序運行結(jié)果,得到標準因子得分函數(shù)模型為:
F1=0.404X1-0.165X2+0.044X3+0.157X4-0.322X5+0.34X6+0.198X7+0.131X8
F2=0.296X1-0.272X2+0.545X3+0.118X4-0.945X5+0.192X6-0.5X7-0.198X8
F3=0.106X1-0.945X2+0.34X3+0.062X4-0.128X5-0.07X6+0.089X7+0.374X8
利用該模型可以計算從不同角度反映各地區(qū)城鎮(zhèn)居民消費性支出的水平。再以3個主成分對應(yīng)的方差貢獻率為權(quán)數(shù)計算綜合分值,得分只代表在構(gòu)建的指標下各地區(qū)的相對差別。綜合得分公式為:
F=0.7883F1+0.1422F2+0.07F3
用該公式計算各地區(qū)的綜合分值,可以排序出2007年我國31個地區(qū)城鎮(zhèn)居民消費性支出水平的高低,結(jié)果見表3。
根據(jù)表3中各地區(qū)主因子得分數(shù)據(jù),采用系統(tǒng)聚類法進行聚類分析,根據(jù)得到的聚類譜系圖,31個地區(qū)被分為3類的最終結(jié)果如下:
第一類:北京、上海、浙江、廣東。
第二類:天津、江蘇、福建。
第三類:河北、山西、內(nèi)蒙古、遼寧、吉林、黑龍江、安徽、江西、山東、河南、湖北、湖南、廣西、海南、重慶、四川、貴州、云南、西藏、陜西、甘肅、青海、寧夏、新疆。
首先,隨著我國經(jīng)濟的迅速發(fā)展,各地區(qū)在消費性支出方面都有了較大幅度的提高,我國的城鎮(zhèn)居民人均消費性支出也由2002年的6 029.88元增長到2007年的9 997.47元,增幅在65%以上。但是,就反映食品、居住、家庭設(shè)備用品及服務(wù)、交通和通信、教育文化娛樂服務(wù)、雜項商品和服務(wù)的基本生活因子F1而言,我國31個地區(qū)綜合消費水平發(fā)展極不平衡,存在較大的差異。得分最高的上海和得分最低的黑龍江相差4.3分,并且只有上海、廣東、浙江、北京、福建、江蘇、海南、天津、廣西、四川、西藏11個地區(qū)得分在0分以上,其余2/3的地區(qū)得分都小于0,這與我國各地區(qū)整體經(jīng)濟發(fā)展水平的實際情況吻合,說明大部分地區(qū)還處于全國消費平均水平之下,有待進一步提高和引導(dǎo)消費。為此,對于那些F1得分小于0的地區(qū),只有大力發(fā)展經(jīng)濟,使得大家的可支配收入水平提高,才能有效地擴大內(nèi)需,拉動消費。
表3 各地區(qū)因子得分和綜合測評得分及排序Table 3 Factor and comprehensive assessment score of every area and sequence
其次,從健康投資因子F2和衣著消費因子F3的得分來看,各地區(qū)的排序變化相對比F1要大得多。如遼寧、山西、河北、吉林、黑龍江較之前的得分,名次分別上升了16、19、26、26和22位;而上海、四川和西藏較之前的得分名次分別下降了24、19、20位,這與各地區(qū)城鎮(zhèn)居民的消費觀念、所處地理位置和條件以及民族習(xí)慣有著很大的關(guān)系。F2得分靠前的天津、北京、河北和吉林等地區(qū),居民的健康投資意識較強,其醫(yī)療保健等衛(wèi)生條件也相對較好;而西藏、貴州、江西等地區(qū)的F2得分較低,可能是當(dāng)?shù)亟?jīng)濟發(fā)展制約或所處地理環(huán)境較為惡劣所引起的。對于衣著消費因子F3隨意性可能稍微大點,可能與經(jīng)濟發(fā)展水平、消費習(xí)慣以及民族原因有關(guān),如得分前5位分別是內(nèi)蒙古、北京、浙江、上海和新疆就可以看出端倪。
最后,從因子總得分F值來看,得分超過0分(全國平均水平)的僅有8個地區(qū),74.2%的地區(qū)在全國平均水平之下,這說明我國各地區(qū)城鎮(zhèn)居民的消費結(jié)果差異很大,消費性支出水平發(fā)展很不平衡。根據(jù)F值排序,可以把我國31個地區(qū)分為3類:第一類是Fgt;1,包括上海、廣東、北京、浙江,屬于經(jīng)濟較發(fā)達地區(qū),其消費性支出的綜合測評得分遠遠高于其它地區(qū);第二類是0lt;Flt;1,包括福建、天津、海南、江蘇,屬于中等消費水平地區(qū);第三類是Flt;0,包括其余的23個地區(qū),屬于消費水平較低地區(qū)。
另外,從因子分析和聚類分析的結(jié)果可以看出,各地區(qū)綜合測評得分與聚類結(jié)果基本一致,這也充分說明把因子分析法應(yīng)用到多指標城鎮(zhèn)居民消費性支出水平評價中是成功的,所得結(jié)果客觀、可信。
整體上來看,盡管受到就業(yè)壓力加大等不利因素的影響,但由于擴大內(nèi)需、刺激消費等多重政策的實施,2007年我國各地區(qū)城鎮(zhèn)居民消費繼續(xù)保持良好增長態(tài)勢[6]。從消費結(jié)構(gòu)看,基本生存消費(如食品、居住、家庭設(shè)備用品及服務(wù)、雜項商品和服務(wù))比重下降,享受和服務(wù)型需求(如衣著、醫(yī)療保健、交通和通信、教育文化娛樂服務(wù))比重上升。我國各地區(qū)城鎮(zhèn)居民的消費結(jié)構(gòu)差異很大,消費性支出水平發(fā)展很不平衡,很多地區(qū)的消費水平和消費結(jié)構(gòu)都有待進一步的提高。
[1]孫彩虹.我國城鎮(zhèn)居民消費結(jié)構(gòu)變動的因子分析[J].重慶工商大學(xué)學(xué)報(西部論壇),2007,(1):103~105.
[2]余明江,季 麗,胡云霞.我國城鎮(zhèn)居民消費性支出的因子分析[J].安徽工業(yè)大學(xué)學(xué)報,2008,25(2):221~225.
[3]中華人民共和國國家統(tǒng)計局.中國統(tǒng)計年鑒·2008[M].北京:中國統(tǒng)計出版社.2009.
[4]王慶豐,黨耀國,王麗敏.基于因子分析和聚類分析的縣域經(jīng)濟發(fā)展研究——以河南省18個縣(市)為例[J].?dāng)?shù)理統(tǒng)計與管理,2009,28(3):495~501.
[5]盧紋岱.Spss for Windows統(tǒng)計分析 [M].北京:電子工業(yè)出版社,2002.311~315.
[6]祁京梅.2007年消費形勢分析和2008年走勢預(yù)測[EB/OL].http://www.china.com.cn/economic/zhuanti/08jjbg/2008-01/23/content_9575705.htm,2008-01-23.
2009-11-04
馮建中(1980—),男,河南正陽人,理學(xué)碩士,講師,研究方向為高等數(shù)理統(tǒng)計.
10.3969/j.issn.1673-1409(S).2010.01.025
F126.1
A
1673-1409(2010)01-S097-04