孫曉松,朱鵬程
(1.連云港師范高等??茖W(xué)校 數(shù)學(xué)系,江蘇 連云港 222006;2.連云港市統(tǒng)計局)
因子分析的核心是用較少的互相獨(dú)立的因子反映原有變量的絕大部分信息.將這一思想用數(shù)學(xué)模型表示為:
X=AF+ε
(1)
式中:X=(X1,X2,…,Xp)'為原指標(biāo);F=(F1,F2,…,Fk)'為公共因子;ε為特殊因子;A=(aij)p×k(k
2009年全國14個首批沿海開放城市(大連市、秦皇島市、天津市、煙臺市、青島市、連云港市、南通市、上海市、寧波市、溫州市、福州市、廣州市、湛江市、北海市)實(shí)現(xiàn)地區(qū)生產(chǎn)總值60003.47億元,占全國國內(nèi)生產(chǎn)總值(335353億元)的17.9%,而人口僅占全國總?cè)丝诘?.1%.本文選取反映經(jīng)濟(jì)情況的11項主要指標(biāo),通過因子分析對14個城市的經(jīng)濟(jì)發(fā)展水平進(jìn)行綜合評分,并根據(jù)得分情況將14個城市進(jìn)行了分類.
選取反映經(jīng)濟(jì)情況的11項主要指標(biāo):地區(qū)生產(chǎn)總值X1;人均地區(qū)生產(chǎn)總值X2;社會消費(fèi)品零售總額X3;地方財政一般預(yù)算收入X4;工業(yè)總產(chǎn)值X5;城鎮(zhèn)固定資產(chǎn)投資X6;農(nóng)村居民人均純收入X7;進(jìn)出口總額X8;實(shí)際外商直接投資X9;農(nóng)林牧漁業(yè)總產(chǎn)值X10;城鎮(zhèn)居民人均可支配收入X11.14個首批沿海開放城市各評價指標(biāo)數(shù)據(jù)見表1.
表1 14個沿海開放城市市各評價指標(biāo)數(shù)據(jù) 單位:億元
注:上述數(shù)據(jù)來自沿海開放網(wǎng)(2009).
(1)相關(guān)矩陣
表2 因子相關(guān)矩陣
由表2相關(guān)系數(shù),絕大部分相關(guān)系數(shù)均大于0.3,所以適合進(jìn)行因子分析.
(2)檢驗(yàn)數(shù)據(jù)的可行性
KMO(Kaiser-Meyer-Olkin)檢驗(yàn)是用來比較變量間簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的大小,主要用來檢驗(yàn)數(shù)據(jù)是否適合因子分析的.KMO越接近1,意味著變量間的相關(guān)性越強(qiáng),越適合作因子分析,KMO越接近0,意味著變量間的相關(guān)性越弱,越不適合作因子分析.
表3 KMO和Bartlett 的檢驗(yàn)
表4 解釋的總方差
巴特利特(Bartlett)球度檢驗(yàn)是以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn)的假設(shè)檢驗(yàn),也主要用來檢驗(yàn)數(shù)據(jù)是否適合因子分析.若概率P-值小于給定的顯著性水平α,則拒絕原假設(shè),認(rèn)為相關(guān)系數(shù)矩陣不太可能是單位陣,原有變量適合作因子分析;反之,若概率P-值大于給定的顯著性水平α,則接收原假設(shè),認(rèn)為相關(guān)系數(shù)矩陣與單位陣無顯著差異,原有變量不適合作因子分析.
由表3可以看出,KMO=0.646,巴特利特(Bartlett)球度檢驗(yàn)具有高度顯著性,說明上述數(shù)據(jù)適合作因子分析的.
(3)方差解釋
從表4中可以看到,大于1的特征值有2個,對應(yīng)的累積貢獻(xiàn)率為85.148%≥85%,再由圖1碎石圖可以發(fā)現(xiàn)特征值由大到小的排列順序,因此可以確定保留因子數(shù)量為2個.
表5 解釋的總方差
圖1 碎石圖
(4)確定因子
表6 因子載荷矩陣
由表6各因子載荷可以看出,兩個因子的實(shí)際含義比較模糊,對因子載荷矩陣實(shí)行正交旋轉(zhuǎn)使因子具有命名解釋性.如表7所示.
表7 旋轉(zhuǎn)后的因子載荷矩陣
(5)因子得分
表8 成份得分系數(shù)矩陣
根據(jù)表8寫出以下因子得分函數(shù):
F1=0.130X1+0.047X2+0.131X3+0.145X4+
0.122X5+0.093X6+0.079X7+0.141X8+
0.101X91-0.111X10+0.112X11
F2=-0.041X1+0.322X2-0.063X3-0.178X4+
0.001X5+0.133X6+0.158X7-0.159X8+
0.055X91+0.754X10-0.110X11
以兩個因子的方差貢獻(xiàn)率為權(quán)數(shù),得綜合分?jǐn)?shù):
F=0.72230F1+0.12918F2各沿海城市綜合得分及排名如表9所示.
表9 各沿海城市綜合得分
由表9可以看出,綜合得分上海和廣州遙遙領(lǐng)先,反映出這兩個城市雄厚的經(jīng)濟(jì)綜合實(shí)力,將這兩個城市歸于一類.天津、大連、寧波、青島可歸為一類,他們是首批沿海開放城市發(fā)展的第二梯度,這四個城市雖不像上海、廣州那樣具有雄厚的經(jīng)濟(jì)實(shí)力,但他們也已經(jīng)取得了較好的成績,尤其是未來具有更大的發(fā)展?jié)摿桶l(fā)展空間.煙臺、南通、溫州、福州可歸為一類,構(gòu)成第三梯度,這四個城市發(fā)展相對較緩慢.秦皇島、連云港、北海、湛江可歸為一類,是第四梯度.
參考文獻(xiàn):
[1]薛薇.基于SPSS的數(shù)據(jù)分析[M].北京:中國人民大學(xué)出版社,2006.
[2]全濤,孫雪翰.2008年中國足球超級聯(lián)賽成績與技術(shù)統(tǒng)計因子分析[J].數(shù)理統(tǒng)計與管理,2011,30(2):370-380.
[3]丁偉祥,殷曉旺,張文.因子分析法在農(nóng)村中學(xué)生心理健康綜合評價中的應(yīng)用[J].數(shù)理統(tǒng)計與管理,2011,30(1):185-190.
[4]彭文斌,鄺嫦娥.中國區(qū)域經(jīng)濟(jì)差距與資本流動的因子分析[J].統(tǒng)計與決策,2010(9).
[5]劉曉娥,康艷芳,王立.河南省區(qū)域經(jīng)濟(jì)發(fā)展比較的因子分析[J].統(tǒng)計與決策,2010(5).
[6]杜茂華,陳國生.基于因子分析法的重慶市城鄉(xiāng)統(tǒng)籌發(fā)展評價[J].統(tǒng)計與決策,2010(7).