陳炫輪 蔣澤坤
◆摘? 要:本文以31個省份和地區(qū)為例,分析了2019年城市居民的消費(fèi)支出狀況,使用主成分分析和聚類分析的方法,結(jié)合SPSS軟件和JMP軟件,對31個省市自治區(qū)的消費(fèi)支出差異情況進(jìn)行研究,并對其進(jìn)行分類。結(jié)論是地區(qū)間經(jīng)濟(jì)發(fā)展水平的差異以及地理位置因素的影響導(dǎo)致了我國不同地區(qū)城鎮(zhèn)居民消費(fèi)支出情況的差異性。
◆關(guān)鍵詞:主成分分析;消費(fèi)支出差異性;聚類分析
一、引言
伴隨著我國經(jīng)濟(jì)的高速發(fā)展,31個省市、自治區(qū)的城市居民的生活水平也在逐步提高,消費(fèi)水平也在逐步提升,但消費(fèi)結(jié)構(gòu)也在不斷地改變。此外,由于各省市自治區(qū)經(jīng)濟(jì)發(fā)展水平各不相同,受地理位置影響,他們的居民消費(fèi)支出情況也各不相同。正確認(rèn)識我國31個省市自治區(qū)之間居民消費(fèi)支出的差異情況,并探究其原因,對于提高我國城鎮(zhèn)居民消費(fèi)水平有著十分深遠(yuǎn)的意義。
國內(nèi)有關(guān)城市居民消費(fèi)支出的研究從未間斷,而主成分分析和聚類分析是本文的主要研究方法。王傳仕等運(yùn)用主成分分析法對我國城市居民的消費(fèi)狀況進(jìn)行了研究,并運(yùn)用綜合得分進(jìn)行了排序;朱建軍分析了中國城市居民的消費(fèi)行為,由此得到城市居民的主要消費(fèi)傾向,并提出了自己的對策和建議;蘇靜初在調(diào)查河南省城市居民的消費(fèi)行為時,找到了他們的消費(fèi)熱點(diǎn)和焦點(diǎn);張?jiān)碌冗\(yùn)用恩格爾指數(shù)來表示城市居民的生活水準(zhǔn),并運(yùn)用聚類分析方法對城市居民的消費(fèi)構(gòu)成進(jìn)行了比較分析,得出了各區(qū)域的消費(fèi)特征。
二、理論基礎(chǔ)
2.1協(xié)方差矩陣與相關(guān)矩陣
在應(yīng)用主成份分析法進(jìn)行實(shí)際問題時,一般有兩種方法,一種是先由原變量的協(xié)方差矩陣,再協(xié)方差矩陣來進(jìn)行主成分分析;另外一種是從原始變量的相關(guān)系數(shù)矩陣來進(jìn)行主成分分析。所以,在實(shí)踐中,我們到底應(yīng)該怎么做?
在通常的情形下,我們會根據(jù)原變量的協(xié)方差矩陣來進(jìn)行主成分分析,這是由于原變量的相關(guān)系數(shù)矩陣等于是將原變量的協(xié)方差矩陣進(jìn)行了歸一化處理,而由相關(guān)系數(shù)矩陣進(jìn)行的主成分分析則是對原資料進(jìn)行歸一化后的數(shù)據(jù)進(jìn)行研究,而在這個時候,數(shù)據(jù)就不再是原來的數(shù)據(jù)了。在資料的維度和變異值差異很大的情況下,采用基于原變量的相關(guān)系數(shù)矩陣進(jìn)行主成分分析。另外,在選擇的主要成份時,基于相關(guān)系數(shù)矩陣的主成分分析所生成的負(fù)荷矩陣與相關(guān)矩陣的功能是相同的,只須選擇一個矩陣就可以對其進(jìn)行說明。
三、實(shí)證分析
3.1數(shù)據(jù)來源與處理
本文收集了31個省市2019年城鎮(zhèn)居民消費(fèi)支出的8個指標(biāo),即X1-X8,食物煙酒、服裝、住房、生活、交通通訊、教育、體育衛(wèi)生、其他用品和服務(wù)。資料來源于《中國統(tǒng)計(jì)年鑒2020》。
由于各項(xiàng)數(shù)據(jù)的差異相對較大,為了便于后續(xù)的分析處理,故首先對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。本文采用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化方法對原始數(shù)據(jù)進(jìn)行處理,操作軟件為SPSS。
3.2相關(guān)系數(shù)矩陣
在得到了規(guī)范化的資料之后,還要對所選取的變量進(jìn)行相關(guān)性檢驗(yàn),檢驗(yàn)所選取的指標(biāo)是否具有進(jìn)行主成分分析的前提。通常,在主成分分析中,選擇的各變量間相關(guān)性越高,就越適宜進(jìn)行相關(guān)的研究。本文使用SPSS對各個變量進(jìn)行了相關(guān)分析。
結(jié)果顯示,除了食品煙酒與醫(yī)療保健之間的相關(guān)系數(shù)僅為0.097以后,大部分變量的相關(guān)性都大于0.6。這說明所選擇的指數(shù)具有很高的關(guān)聯(lián)度,符合主成分分析的前提。
3.3主成分結(jié)果展示
采用 JMP軟件,對31個省區(qū)的8個變量進(jìn)行了主成分分析。首先求出各個主要成份的特性值和累積貢獻(xiàn)率,見表4。在選擇主成分時,原則上通常采用的是大于1的特征值。前兩種主成分的特征值分別為5.2926和1.1077,都超過1,兩種主要成分的累積貢獻(xiàn)率高達(dá)80%,說明前面兩個主要成份包含了31個省市的絕大部分城市居民的消費(fèi)情況,所以我們可以選擇前面兩個主要成份進(jìn)行分析。
由主成分的載荷矩陣(參見下表),得出了上述兩個主要成分的表達(dá)式:Y[1]=0.7328X[1]+0.5315X[2]+0.9032X[3]+0.8791X[4]+0.9148X[5]+0.8452X[6]+0.6667X[7]+0.9427X[8] (1)
Y[2]=-0.5726X[1]+0.5841X[2]-0.1677X[3]+0.0070X[4]-0.2271X[5]-0.0452X[6]+0.5858X[7]+0.1167X[8] (2)
根據(jù)主成分表達(dá)式,我們可以給出一個關(guān)于兩個主要成分是否與真實(shí)的上下文和語義相符的解釋。根據(jù)的表達(dá)式,的值可以衡量全國31個省份城鎮(zhèn)居民消費(fèi)水平的高低;根據(jù)的表達(dá)式,我們可以根據(jù)的值來衡量全國31個省份城鎮(zhèn)居民受氣候影響的消費(fèi)性支出占比的情況,主要影響變量是衣著以及醫(yī)療保健。
四、結(jié)論及建議
結(jié)合主成分分析對全國31個省份城鎮(zhèn)居民消費(fèi)支出情況分析的結(jié)果,我們得到如下結(jié)論和建議:
區(qū)域的發(fā)展水平對居民的消費(fèi)支出有很大的影響,區(qū)域內(nèi)的經(jīng)濟(jì)發(fā)展水平越高,消費(fèi)支出也就越多,因而總成分的得分也就越高。從總體得分上看,31個省市居民的消費(fèi)支出呈現(xiàn)出明顯的區(qū)域失衡。在東部,居民的消費(fèi)水平比較高,而在中西部,他們的消費(fèi)水平比較低。北京市、上海市、天津市、廣東省、浙江省、江蘇省六個省市主要成分的綜合得分最高。由于經(jīng)濟(jì)發(fā)展程度比較高,所以他們的消費(fèi)也比較高。要解決區(qū)域發(fā)展的不平衡問題,必須在宏觀上調(diào)整和調(diào)整中西部的經(jīng)濟(jì)發(fā)展,提高經(jīng)濟(jì)發(fā)展的速度,同時要加強(qiáng)與中西部、東部的合作與交流,以逐漸減少區(qū)域間的不平衡。
參考文獻(xiàn)
[1]王傳仕.我國城鎮(zhèn)居民消費(fèi)水平主成分分析[J].技術(shù)經(jīng)濟(jì),2002(09):40-41.
[2]朱建軍.我國城鎮(zhèn)居民消費(fèi)結(jié)構(gòu)主成分分析[J].無錫商業(yè)職業(yè)技術(shù)學(xué)院學(xué)報,2009,9(01):21-22.
[3]蘇靜.河南城鎮(zhèn)居民消費(fèi)結(jié)構(gòu)的計(jì)量分析[J].河南財(cái)政稅務(wù)高等??茖W(xué)校學(xué)報,2011,25(03):48-51.
[4]張?jiān)拢瑥埥瘌P,王泓娜,關(guān)靜.聚類分析在我國城鎮(zhèn)居民消費(fèi)結(jié)構(gòu)研究中的應(yīng)用[J].遼寧大學(xué)學(xué)報(自然科學(xué)版 ),2004(01):47-49.
作者簡介
陳炫輪(1997-),男,河南信陽人,碩士研究生,主要研究方向大數(shù)據(jù)分析。