屈曉陽
摘要:隨著中國經(jīng)濟的深入發(fā)展,工業(yè)作為第二產(chǎn)業(yè),其發(fā)展水平是政府部門加強宏觀調(diào)控和改善企業(yè)管理的重要基準。本文根據(jù)2013年《中國統(tǒng)計年鑒》[1]中的統(tǒng)計數(shù)據(jù),選取規(guī)模以上工業(yè)企業(yè)的18個主要指標,建立31個省市工業(yè)發(fā)展水平的主成分聚類分析模型。
首先用SPSS統(tǒng)計分析軟件將原始數(shù)據(jù)進行標準化處理以排除量綱影響,利用SAS統(tǒng)計分析軟件,將原始數(shù)據(jù)的18個指標進行主成分的提取,以在損失盡可能少的數(shù)據(jù)信息下達到降維的目的,本文選取了前兩個主成分:工業(yè)水平綜合成分以及工業(yè)企業(yè)經(jīng)營水平成分。
然后對主成分提取后的數(shù)據(jù)進行聚類分析,對31個省市進行聚類,根據(jù)各地區(qū)在工業(yè)水平上的差異將相似的地區(qū)聚為一類,剔除異常值后可將各省市分為三類,對聚類后的結(jié)果進行比較分析,從而了解中國各地區(qū)工業(yè)水平發(fā)展的優(yōu)勢和不足,最后得出中國工業(yè)各地區(qū)發(fā)展水平不均衡,同時整體水平較低的結(jié)論。
關(guān)鍵詞:工業(yè)企業(yè);SPSS軟件;SAS軟件;主成分分析;聚類分析
一、選題背景
工業(yè)作為第二產(chǎn)業(yè),在推動國民經(jīng)濟的持續(xù)高速發(fā)展過程中發(fā)揮了不可替代的作用。隨著我國不斷加快工業(yè)化進程,工業(yè)對國民經(jīng)濟增長的主導(dǎo)作用在長期內(nèi)不會改變[2]。近年來,中國各地區(qū)工業(yè)的發(fā)展水平成為理論界和政府各部門等社會各界關(guān)注的焦點。未來的10年里,中國仍將處于快速工業(yè)化、快速城鎮(zhèn)化和工業(yè)現(xiàn)代化快速推進的過程中。在這期間,工業(yè)經(jīng)濟的快速增長仍然是推動中國經(jīng)濟較快增長的重要力量;戰(zhàn)略性新興產(chǎn)業(yè)將逐漸成為推動工業(yè)發(fā)展的重要力量;傳統(tǒng)產(chǎn)業(yè)在高新技術(shù)的改造下將全面升級,產(chǎn)品結(jié)構(gòu)將不斷提升,改造升級后的傳統(tǒng)產(chǎn)業(yè)仍將會以較快速度增長[3]。
二、數(shù)據(jù)來源、指標體系以及分析數(shù)據(jù)集
考慮到工業(yè)發(fā)展水平問題的復(fù)雜性以及問題研究的時效性,本文以2013年《中國統(tǒng)計年鑒》中的數(shù)據(jù)為基礎(chǔ),就規(guī)模以上工業(yè)企業(yè)的18個主要指標進行研究,建立主成分聚類分析模型,力求對31個省市的工業(yè)發(fā)展水平進行盡可能合理的劃分,從中把握中國工業(yè)的發(fā)展水平,希望能更好地為國民經(jīng)濟發(fā)展服務(wù)。
在分析過程中,考慮到各指標單位的不同在分析過程中的影響,利用SPSS統(tǒng)計分析軟件對原始數(shù)據(jù)進行標準化處理以排除量綱不同的影響,將標準化后的數(shù)據(jù)作為分析數(shù)據(jù)集導(dǎo)入SAS軟件進行進一步的統(tǒng)計分析。在處理過程中可以發(fā)現(xiàn)數(shù)據(jù)中并不存在缺失值,可忽略這個問題。對于異常值可在問題的處理過程中進行具體的分析。
三、主成分聚類分析
(一)主成分分析[4]
對31個省的數(shù)據(jù)從相關(guān)矩陣出發(fā)進行主成分分析,計算,x1,x2,…, x18的樣本相關(guān)矩陣。根據(jù)的前三個特征值、特征向量以及貢獻率得到前三個主成分分別為:
1=0272x*1+0278x*2+0274x*3+0279x*4+0275x*5+0275x*6+0274x*7+0278x*8+0280x*9+0280x*10+0239x*11+0274x*12+ 0278x*13+0075x*14-0010x*15+0106x*16-0090x*17+0044x*18
2=0007x*1+0004x*2+0018x*3-0009x*4+0008x*5-0024x*6-0009x*7+0042x*8+0018x*9+ 0018x*10-0016x*11+0047x*12+0005x*13-0092x*14-0670x*15-0201x*16+0388x*17+0587x*18
3=-0040x*1-0111x*2-0145x*3-0012x*4-0018x*5-0136x*6-0147x*7-0080x*8+0011x*9+ 0006x*10+ 0181x*11+0067x*12+0025x*13+0683x*14-0107x*15+0612x*16+0086x*17+0141x*18
其中,前兩個和前三個主成分的累計貢獻率分別達到799%和896%。
第一主成分1在前13個變量上都有近似相等的正載荷,在x*14、x*16、x*18上有較小的正載荷,在x*15、x*17有較小的負載和,其中前13個變量是反映地區(qū)工業(yè)水平的核心指標,1越大,說明該地區(qū)工業(yè)綜合水平越高,因此第一主成分可稱為工業(yè)綜合水平成分。
第二主成分2在x*18(產(chǎn)品銷售率:該指標反映工業(yè)產(chǎn)品已實現(xiàn)銷售的程度,是分析工業(yè)產(chǎn)銷銜接情況,研究工業(yè)產(chǎn)品滿足社會需求的指標)有較大程度的正載和,在x*17(成本費用利潤率:反映企業(yè)投入的生產(chǎn)成本及費用的經(jīng)濟效益,同時也反映企業(yè)降低成本所取得的經(jīng)濟效益)有中等程度的正載和,在x*15(資產(chǎn)負債率:該指標既反映企業(yè)經(jīng)營風險的大小,也反映企業(yè)利用債權(quán)人提供的資金從事經(jīng)營活動的能力)上有很高的負載荷,而在x*1、x*2、x*3、x*5、x*8、x*9、x*10、x*12、x*13有較小的正載荷,在x*4、x*6、x*7、x*11、x*14、x*16有很小的負載荷,可以認為這個主成分度量了該地區(qū)工業(yè)企業(yè)產(chǎn)品銜接及降低風險水平,2越大,表明該地區(qū)工業(yè)產(chǎn)品銜接水平越高且風險越低,可認為經(jīng)營的越好,故第二主成分可稱為工業(yè)企業(yè)經(jīng)營水平成分。第三主成分難以給出明確的解釋,故只取前面兩個主成分。
考慮到前兩個主成分的累計貢獻率已達到799%,接近80%,主成分分析提取的效果較好,故原來18個變量可以使用這兩個主成分來表示,這樣既達到了降維的目的,又能反映原始數(shù)據(jù)799%的數(shù)據(jù)信息。
(二)聚類分析[4]
下面,對由31個省市的工業(yè)企業(yè)指標數(shù)據(jù)提取出來的主成分數(shù)據(jù)進行Q型聚類分析。本文選用K均值法,直接利用SAS程序進行聚類分析,考慮到之前主成分分析已將數(shù)據(jù)標準化,故此處不需再做標準化處理,并簡單分析后將初始聚類數(shù)設(shè)為五。
類均值之間的距離如下:
ⅠⅡⅢⅣⅤ
Ⅰ0000
Ⅱ6.325 0.000
Ⅲ2.983 7.373 0.000
Ⅳ11.477 14.328 9.015 0.000
Ⅴ6.857 10.250 5.189 5.536 0.000
可以看出類與類之間有明顯的距離存在,聚類達到了較好的效果。
由于K均值法對異常值較敏感,從聚類得到的結(jié)果可以看到浙江和西藏自成一類,可以視為異常值點,說明這兩個省的工業(yè)發(fā)展水平與其他省市相比存在一定的特殊性。剔除這兩個異常值的影響,可將31個省市分為三個類:
第Ⅰ類:北京、山西、廣西、海南、重慶、貴州、云南、甘肅、青海、寧夏、新疆
第Ⅱ類:天津、河北、內(nèi)蒙古、遼寧、吉林、黑龍江、上海、安徽、福建、江西、河南、湖北、湖南、四川、陜西
第Ⅲ類:江蘇、山東、廣東
其中第Ⅰ類為工業(yè)發(fā)展水平較低的省市,第Ⅱ類為工業(yè)發(fā)展水平處于中等的省市,第Ⅲ類為工業(yè)發(fā)展水平較高的城市。
四、結(jié)論
(1)中國工業(yè)的整體發(fā)展仍處于較低的水平,工業(yè)企業(yè)發(fā)展現(xiàn)狀十分嚴峻。提取工業(yè)綜合水平成分和工業(yè)企業(yè)經(jīng)營水平成分后,可以看到,除個別省市外,31個省市的大部分地區(qū)面臨工業(yè)綜合水平低的同時工業(yè)企業(yè)經(jīng)營水平也低的現(xiàn)狀,我國仍需要大力推動工業(yè)發(fā)展。
(2)中國31個省市的工業(yè)發(fā)展出現(xiàn)明顯的不均衡,通過對提取的主成分數(shù)據(jù)對31個省市進行聚類,剔除異常值可將各地區(qū)分為三類:
第Ⅰ類:北京、山西、廣西、海南、重慶、貴州、云南、甘肅、青海、寧夏、新疆
第Ⅱ類:天津、河北、內(nèi)蒙古、遼寧、吉林、黑龍江、上海、安徽、福建、江西、河南、湖北、湖南、四川、陜西
第Ⅲ類:江蘇、山東、廣東
其中第Ⅰ類為工業(yè)發(fā)展水平較低的省市,說明這部分地區(qū)的工業(yè)發(fā)展仍需要進一步的提高;第Ⅱ類為工業(yè)發(fā)展水平處于中等的城市,其中的上海、天津、遼寧是早期工業(yè)發(fā)展較快的城市,說明這一部分的省市目前的工業(yè)水平與早期的快速發(fā)展密切相關(guān);而第Ⅲ類只有江蘇、山東以及廣東三個省,這三個省早期工業(yè)發(fā)展較快,同時后期工業(yè)也得到了良好的發(fā)展??梢园l(fā)現(xiàn)中國工業(yè)發(fā)展十分的不均衡,國家仍需大力支持工業(yè)發(fā)展以帶動國民經(jīng)濟發(fā)展,縮小我國與發(fā)達國家之間的差距。(作者單位:遼寧大學(xué))
參考文獻:
[1]中華人民共和國國家統(tǒng)計局.中國統(tǒng)計年鑒(2013)[M]. 中國統(tǒng)計出版社, 2013.
[2]黃麗麗. 我國工業(yè)企業(yè)經(jīng)濟效益水平分析[D]. 中南大學(xué), 2012年.
[3]李平, 石碧華. 中國工業(yè)經(jīng)濟發(fā)展的前景[EB/OL]. [2014-6-23]. http://wenku.baidu.com/view/a7fe910916fc700abb68fcd5.html.
[4]王學(xué)民. 應(yīng)用多元分析[M]. 第三版. 上海財經(jīng)大學(xué)出版社, 2009年:208-284.