劉彥慧LIU Yan-hui
(黑龍江科技大學(xué),哈爾濱 150022)
(Heilongjiang University of Science and Technology,Harbin 150022,China)
消費(fèi)是拉動(dòng)經(jīng)濟(jì)增長(zhǎng)的主要因素之一,消費(fèi)是國(guó)民經(jīng)濟(jì)運(yùn)行的關(guān)鍵因素之一,消費(fèi)對(duì)社會(huì)穩(wěn)定和經(jīng)濟(jì)發(fā)展有著重要作用。通過(guò)對(duì)消費(fèi)狀況的研究,可以知道我國(guó)的經(jīng)濟(jì)成就,也可以了解我國(guó)的經(jīng)濟(jì)競(jìng)爭(zhēng)力。
因子分析是多元統(tǒng)計(jì)分析中常用的處理降維的統(tǒng)計(jì)方法。方法客觀,評(píng)價(jià)結(jié)果正確。是將具有錯(cuò)綜復(fù)雜關(guān)系的變量綜合為數(shù)量較少的幾個(gè)因子,以再現(xiàn)原始變量與因子之間的關(guān)系,主要是通過(guò)變量的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量的少數(shù)幾個(gè)隨機(jī)變量去描述多個(gè)變量之間的相關(guān)關(guān)系,但是,這少數(shù)幾個(gè)隨機(jī)變量是不可觀測(cè)的,通常稱之為因子[1]。然后根據(jù)相關(guān)性的大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,不同組的變量相關(guān)性較低。
1.1 R 型因子的數(shù)學(xué)模型
且滿足以下條件:①m≤p;
②Cov(F,ε)=0 即F 和ε 是不相關(guān)的;
即F1…Fm不相關(guān)且方差皆為1。
即ε1,ε2,…,εp不相關(guān),且方差各不相同。
1.2 因子載荷陣及其估計(jì)方法
①因子載荷的統(tǒng)計(jì)意義。因子載荷aij的統(tǒng)計(jì)意義就表示第i 個(gè)指標(biāo)變量和第j 個(gè)公共因子的相關(guān)系數(shù)即表示Xi依賴于Fj的比重。它反映了第i 個(gè)指標(biāo)變量在第j 個(gè)公共因子上的相對(duì)重要性。
②因子載荷陣的估計(jì)方法(主成分法)。設(shè)隨機(jī)向量X=(X1,X2,…,Xp)′的協(xié)方差矩陣為∑,λ1≥λ2≥…≥λp>0為∑的特征根,e1,e2,…,ep是對(duì)應(yīng)的特征向量,則∑可分解為:
上式是公共因子與變量個(gè)數(shù)一樣多且特殊因子的方差為0 時(shí),因子模型中協(xié)方差陣的結(jié)構(gòu)。∑=AA′。
通常應(yīng)用中總是希望因子的個(gè)數(shù)小于變量的個(gè)數(shù),當(dāng)最后p-m 個(gè)特征根較小時(shí),通常是略去λm+1em+1em+1′+…+λpepep′對(duì)∑的貢獻(xiàn),于是。此時(shí)假定了因子模型中特殊因子是不重要的,如果考慮特殊因子以后,協(xié)方差陣為:
當(dāng)∑未知,可用樣本協(xié)方差陣S 去代替,要經(jīng)過(guò)標(biāo)準(zhǔn)化處理,則S 與相關(guān)陣R 相同。
1.3 因子旋轉(zhuǎn)
建立因子分析數(shù)學(xué)模型的目的不僅要找出公共因子以及對(duì)變量進(jìn)行分組,更重要的是要知道每個(gè)公共因子的意義,以便對(duì)實(shí)際問(wèn)題作出科學(xué)的分析和解釋,這時(shí)根據(jù)因子載荷陣的不唯一性,可對(duì)因子載荷陣實(shí)行旋轉(zhuǎn),使旋轉(zhuǎn)后的因子載荷陣結(jié)構(gòu)簡(jiǎn)化。
數(shù)據(jù)來(lái)源:
本文以2012 年我國(guó)31 個(gè)省、市、自治區(qū)城鎮(zhèn)居民家庭人均消費(fèi)支出數(shù)據(jù)為研究對(duì)象,這里選取了8 個(gè)指標(biāo)作為反映城鎮(zhèn)居民家庭人均消費(fèi)支出結(jié)構(gòu)的因素,這8 個(gè)指標(biāo)分別是:
表1 城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出(2012 年)[2]
實(shí)驗(yàn)步驟[3]:
3.1 對(duì)原始數(shù)據(jù)進(jìn)行初始化
表2
3.2 建立變量的相關(guān)系數(shù)矩陣
表3 Correlation Matrix
3.3 KMO 檢驗(yàn)
表4 KMO and Bartlett's Test
3.4 求R 的特征值和特征
從表5 看出前2 個(gè)特征值的累積貢獻(xiàn)率已經(jīng)達(dá)到83.338%,說(shuō)明前2 個(gè)主成分基本包含了全部指標(biāo)具有的信息,因此取前2 個(gè)特征值,并計(jì)算相應(yīng)的特征向量,得到的前三個(gè)主成分為:
表5 Total Variance Explained
第一主成分:F1=0.832X1+0.583X2+0.824X3+0.905X4+0.923X5+0.939X6+0.577X7+0.925X8
第二主成份:F2=-0.426X1+0.670X2+0.008X3-0.110X4-0.244X5-0.089X6+0.710X7-0.048X8
由上式可以看出:在第一主成分中各項(xiàng)指標(biāo)的系數(shù)都較大,且都比較接近,第一主成分反映的原始指標(biāo)信息比較多,比較平均。在第二主成分中,只有第二項(xiàng)和第七項(xiàng)的系數(shù)比較大,這樣不利于對(duì)原始指標(biāo)進(jìn)行分組,也不利于定義因子。
建立因子載荷陣(表6)。
表6 Component Matrixa
為了能更好地讓主成分全面突出地反映原始信息。我們進(jìn)行因子旋轉(zhuǎn)。
3.5 對(duì)因子載荷陣實(shí)行方差最大旋轉(zhuǎn) 旋轉(zhuǎn)后的矩陣如表7 所示。
表7 Rotated Component Matrixa
因而得到旋轉(zhuǎn)后的主因子表達(dá)式為:
第一主因子:F1=0.935X1+0.221X2+0.733X3+0.858X4+0.934X5+0.879X6+0.198X7+0.848X8
第二主因子:F2=-0.007X1+0.861X2+0.376X3+0.307X4+0.195X5+0.341X6+0.893X7+0.371X8
由上式可以看出,經(jīng)旋轉(zhuǎn)后得到的主成分能更突出、更全面地反映相應(yīng)的各個(gè)指標(biāo)的信息。
3.6 將八指標(biāo)按高載荷分類(lèi) 將八指標(biāo)按高載荷分成兩類(lèi),并結(jié)合專業(yè)知識(shí)給出各因子的命名,如表8 所示。
表8
在第一因子中,X1、X3、X4、X5、X6、X8六項(xiàng)指標(biāo)有較大的載荷,這些是從不同方面反映消費(fèi)支出情況的,因此命名為綜合消費(fèi)因子。
在第二因子中,X2、X7這兩項(xiàng)有較大的載荷,這些是從醫(yī)療保健和衣著兩個(gè)方面反映消費(fèi)狀況的,因此命名為衣著醫(yī)療因子。
3.7 計(jì)算綜合得分 根據(jù)各省市的因子得分計(jì)算相應(yīng)綜合得分,綜合得分的計(jì)算公式為(加權(quán)系數(shù)):
表9
由表9 可知,第一因子得分較高的是上海、北京、天津、廣東、浙江,說(shuō)明這些地區(qū)的消費(fèi)能力比較強(qiáng),第二因子得分較高的是北京、上海、浙江,說(shuō)明這幾個(gè)地區(qū)的居民在衣著和醫(yī)療衛(wèi)生方面消費(fèi)較大。排名也比較靠前,綜合得分較高的是上海、北京、廣東、浙江、天津、江蘇等地,綜合得分較低的是西藏、貴州、青海、江西、山西。
根據(jù)中國(guó)國(guó)家統(tǒng)計(jì)局的實(shí)際結(jié)果為:
2012 年全國(guó)排名城鎮(zhèn)家庭人均消費(fèi)支出排序:
上游區(qū)(1-10 位):上海、北京、廣東、浙江、江蘇、天津、福建、內(nèi)蒙古、遼寧、重慶。
中游區(qū)(11-20 位):山東、陜西、四川、安徽、吉林、湖南、湖北、海南、廣西、寧夏。
下游區(qū)(21-31 位):新疆、云南、河南、黑龍江、甘肅、江西、貴州、甘肅、河北、青海、山西、西藏。
從中可以看出筆者所得到的結(jié)果和國(guó)家統(tǒng)計(jì)局公布的結(jié)果基本一致。從中可以看出因子分析方法處理數(shù)據(jù)的有效性。
城鎮(zhèn)居民的支出同收入相聯(lián)系,有著明顯的地區(qū)性,如,北京、天津和東部地區(qū)排名較高,西部城鎮(zhèn)排名一般不高。這與我國(guó)地區(qū)經(jīng)濟(jì)的發(fā)展結(jié)果基本一致。
第一因子體現(xiàn)的是綜合指標(biāo),第二因子體現(xiàn)的是醫(yī)療衛(wèi)生和衣著,但兩類(lèi)因子在分類(lèi)上并不明顯。一般來(lái)說(shuō)第一因子大的地區(qū),第二因子得分也是較高的。但本文僅用兩個(gè)主因子就得到8 個(gè)變量的城鎮(zhèn)家庭人均消費(fèi)支出分類(lèi)和排序,說(shuō)明因子分析方法的正確性和合理性。
[1]余錦華,楊維權(quán).多元統(tǒng)計(jì)分析與應(yīng)用[M].中山大學(xué)出版社2006:210-224.
[2]中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局.中國(guó)統(tǒng)計(jì)年鑒-2013[M].中國(guó)統(tǒng)計(jì)出版社.
[3]汪東華.多元統(tǒng)計(jì)分析與SPSS[M].華東理工大學(xué)出版社,2010:187-226.