【摘 要】近年來,伴隨著國際金融危機(jī)爆發(fā),安陽市經(jīng)濟(jì)發(fā)展進(jìn)入艱難的轉(zhuǎn)型期,面對(duì)復(fù)雜多變的形勢(shì),經(jīng)過市場(chǎng)優(yōu)勝劣汰式篩選后,有些產(chǎn)業(yè)脫穎而出,有些產(chǎn)業(yè)則淡出市場(chǎng),為更清晰反映產(chǎn)業(yè)間關(guān)系,挖掘在安陽本土環(huán)境下適者生存的優(yōu)勢(shì)和潛力產(chǎn)業(yè),撰寫了本文。本文利用安陽市改革開放以來和近五年的產(chǎn)業(yè)結(jié)構(gòu)數(shù)據(jù),從三次產(chǎn)業(yè)和工業(yè)行業(yè)結(jié)構(gòu)角度加以分析,分別采用了多元線性回歸和聚類分析方法,以試探選出適合安陽發(fā)展的優(yōu)勢(shì)和潛力行業(yè)。
【關(guān)鍵詞】R軟件 產(chǎn)業(yè)結(jié)構(gòu) 系統(tǒng)聚類 K-means
一、問題重述
在國際金融危機(jī)沖擊下,安陽產(chǎn)業(yè)結(jié)構(gòu)矛盾凸顯,近幾年引進(jìn)的新能源產(chǎn)業(yè)紛紛停產(chǎn),傳統(tǒng)鋼鐵、煤炭產(chǎn)業(yè)產(chǎn)能過剩,代表性企業(yè)安鋼一度嚴(yán)重虧損,安陽經(jīng)濟(jì)發(fā)展陷入了谷底。如何擺脫目前發(fā)展困境,在經(jīng)濟(jì)轉(zhuǎn)型升級(jí)中取得突破,選擇適合安陽本土環(huán)境、對(duì)經(jīng)濟(jì)發(fā)展貢獻(xiàn)大的行業(yè)成為一個(gè)亟待解決的問題。本文從三次產(chǎn)業(yè)入手,并著重對(duì)工業(yè)行業(yè)大類進(jìn)行了聚類篩選。
一個(gè)地區(qū)工業(yè)優(yōu)勢(shì)行業(yè)的選擇有很多方法,最簡單的就是以該地區(qū)工業(yè)各行業(yè)增加值的比重來確定。但是,全面、準(zhǔn)確地選擇地區(qū)優(yōu)勢(shì)行業(yè),則需要統(tǒng)籌思考工業(yè)發(fā)展的內(nèi)在規(guī)律,既要考慮不同工業(yè)行業(yè)的規(guī)模大小,也要考慮該行業(yè)在一個(gè)地區(qū)的增長情況,從而較為全面的進(jìn)行判斷。近年來受國際金融危機(jī)的影響,安陽市工業(yè)進(jìn)入艱難轉(zhuǎn)型期,工業(yè)增速開始放緩,但工業(yè)中也有相當(dāng)一部分行業(yè)正在異軍突起,在悄悄改變著安陽的工業(yè)結(jié)構(gòu),本文擬用五年的工業(yè)統(tǒng)計(jì)資料,運(yùn)用有關(guān)統(tǒng)計(jì)模型和方法,分析并選擇出安陽工業(yè)行業(yè)中優(yōu)勢(shì)比較明顯、帶動(dòng)作用和貢獻(xiàn)程度較大的行業(yè),作為安陽今后重點(diǎn)發(fā)展的產(chǎn)業(yè),供有關(guān)部門參考使用。
二、R軟件介紹
R是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲(chǔ)和處理系統(tǒng);數(shù)組運(yùn)算工具(其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大);完整連貫的統(tǒng)計(jì)分析工具;優(yōu)秀的統(tǒng)計(jì)制圖功能;簡便而強(qiáng)大的編程語言:可操縱數(shù)據(jù)的輸入和輸出,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。
三、聚類模型的建立
本文分別采用了系統(tǒng)聚類和K-means聚類方法對(duì)相關(guān)數(shù)據(jù)進(jìn)行聚類分析。
系統(tǒng)聚類的思想是把每個(gè)樣本看成一類,計(jì)算兩兩之間的距離,把距離最近的兩個(gè)樣本合并為一個(gè)新類,計(jì)算新類與其他樣本的距離,對(duì)距離最近的再次合并,重復(fù)此過程,直到所有樣本合并為一類;系統(tǒng)聚類的關(guān)鍵點(diǎn)為距離和不同量綱數(shù)據(jù)的標(biāo)準(zhǔn)化。
K-means聚類算法進(jìn)行分析,K-means算法是很典型的基于距離的聚類算法,采用距離作為相似性的評(píng)價(jià)指標(biāo),即認(rèn)為兩個(gè)對(duì)象的距離越近,其相似度就越大。該算法認(rèn)為簇是由距離靠近的對(duì)象組成的,因此把得到緊湊且獨(dú)立的簇作為最終目標(biāo)。
k個(gè)初始類聚類中心點(diǎn)的選取對(duì)聚類結(jié)果具有較大的影響,因?yàn)樵谠撍惴ǖ谝徊街惺请S機(jī)的選取任意k個(gè)對(duì)象作為初始聚類的中心,初始地代表一個(gè)簇。該算法在每次迭代中對(duì)數(shù)據(jù)集中剩余的每個(gè)對(duì)象,根據(jù)其與各個(gè)簇中心的距離將每個(gè)對(duì)象重新賦給最近的簇。當(dāng)考察完所有數(shù)據(jù)對(duì)象后,一次迭代運(yùn)算完成,新的聚類中心被計(jì)算出來。如果在一次迭代前后,J的值沒有發(fā)生變化,說明算法已經(jīng)收斂。
算法過程如下:
(1)從N個(gè)文檔隨機(jī)選取K個(gè)文檔作為質(zhì)心。(2)對(duì)剩余的每個(gè)文檔測(cè)量其到每個(gè)質(zhì)心的距離,并把它歸到最近的質(zhì)心的類。(3)重新計(jì)算已經(jīng)得到的各個(gè)類的質(zhì)心。(4)迭代2~3步直至新的質(zhì)心與原質(zhì)心相等或小于指定閾值,算法結(jié)束。
四、R軟件實(shí)現(xiàn)聚類分析
我們整理了安陽市2013年規(guī)模以上工業(yè)行業(yè)增加值比重和近五年平均增速。按照人們習(xí)慣用法,將煙草、農(nóng)副食品加工、食品制造、以及酒、飲料和精制茶制造業(yè)合并為食品行業(yè),合并后共計(jì)27個(gè)行業(yè)大類。利用聚類方法,按照工業(yè)增加值比重和年均增速將其分為4大類。
使用系統(tǒng)聚類方法將數(shù)據(jù)聚成4類,R代碼如下:
#系統(tǒng)聚類
五、聚類結(jié)果分析
兩種聚類方差檢驗(yàn)表明組間方差均顯著,聚類效果較好。由于k-means聚類在該算法第一步中是隨機(jī)的選取任意k個(gè)對(duì)象作為初始聚類的中心,初始地代表一個(gè)簇,對(duì)聚類結(jié)果具有較大的影響。而系統(tǒng)聚類能更好地反映實(shí)際情況,也便于對(duì)數(shù)據(jù)的解釋。因此,我們采用系統(tǒng)聚類結(jié)果加以分析。
我們將聚類結(jié)果歸納如下:
第1類為發(fā)展緩慢、比重較小的滯衰型行業(yè)。共計(jì)5個(gè)行業(yè),分別為非金屬礦采選業(yè)、計(jì)算機(jī)通信和其他電子設(shè)備制造業(yè)、煤炭開采和洗選業(yè)、木材加工和木、竹、藤、棕、草制品業(yè)、水的生產(chǎn)和供應(yīng)業(yè)。其近5年平均增速均在7.1%以下,比重在5%以下。計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)因?yàn)榘膊什ぎa(chǎn)品的停產(chǎn)而呈負(fù)增長。其他4個(gè)行業(yè)因?yàn)橘Y源的匱乏和枯竭而逐步衰落。
第2類是比重較小,增速較快的潛力行業(yè)。共有18個(gè)行業(yè)。潛力行業(yè)近年來增速高于規(guī)模以上工業(yè)平均增速。排除掉今年受環(huán)保政策限產(chǎn)的有色金屬、造紙、化工行業(yè),以及礦采、煉焦資源枯竭型行業(yè),水電氣基礎(chǔ)行業(yè)外,增速較快的有:紡織、家具制造業(yè)、金屬制品、專用設(shè)備制造、通用設(shè)備制造、醫(yī)藥等6個(gè)行業(yè)。這些行業(yè)發(fā)展迅速,有力拉動(dòng)了全市工業(yè)經(jīng)濟(jì)增長,基本上抵消了鋼鐵行業(yè)下行缺口。應(yīng)成為政策重點(diǎn)支持的行業(yè)。
第3類是發(fā)展平穩(wěn),比重較大的優(yōu)勢(shì)行業(yè)。共3個(gè)行業(yè),食品業(yè)、非金屬礦物制品業(yè)和運(yùn)輸設(shè)備制造業(yè),比重分別為13.2%、8.2%、18%,合計(jì)為39.4%。食品業(yè)由于有農(nóng)業(yè)資源優(yōu)勢(shì),保持著平穩(wěn)增長態(tài)勢(shì)。非金屬礦物制品由于內(nèi)黃陶瓷生產(chǎn)線的引進(jìn)呈現(xiàn)較快發(fā)展。運(yùn)輸設(shè)備制造業(yè)由于適應(yīng)了近年來的市場(chǎng)需求,呈現(xiàn)增速高于全行業(yè)平均、比重提高的走勢(shì)。
第4類是發(fā)展較慢,比重很大的支柱行業(yè)。僅1個(gè)行業(yè)--黑色金屬冶煉和壓延加工業(yè),比重占到整個(gè)工業(yè)的28.6%,是全市的支柱行業(yè)。鋼鐵行業(yè)增加值占到工業(yè)的近三分之一,對(duì)安陽市工業(yè)經(jīng)濟(jì)影響最大,左右著工業(yè)走勢(shì),但由于受產(chǎn)能過剩影響,比重出現(xiàn)下滑,影響力有所減弱。
參考文獻(xiàn):
[1]《安陽市統(tǒng)計(jì)年鑒-2013》
[2]Robert I. Kabacoff. R in Action Data Analysis and Graphics with R。
[3]《結(jié)構(gòu)調(diào)整新進(jìn)展——2013年中國經(jīng)濟(jì)回望之二》新華網(wǎng)。
作者簡介:連鵬偉(1986- ),男,漢族,籍貫:河南 安陽,安陽市統(tǒng)計(jì)局?jǐn)?shù)據(jù)管理中心工程師、學(xué)士學(xué)位,研究方向:數(shù)據(jù)處理。