周建新,付傳秀
(1.皖西學院 應用文科實訓中心; 2.皖西學院 金融與數(shù)學學院, 安徽 六安 237012)
GPCA和遺傳算法聚類分析在中國區(qū)域經(jīng)濟綜合評價中的應用
周建新1,付傳秀2
(1.皖西學院 應用文科實訓中心; 2.皖西學院 金融與數(shù)學學院, 安徽 六安 237012)
本文結(jié)合全局主成分分析(GPCA)和遺傳算法聚類分析,對中國 31 個地區(qū)的經(jīng)濟發(fā)展水平進行綜合評價.首先借助 GPCA 獲得經(jīng)濟水平全局主成分分值,對區(qū)域經(jīng)濟發(fā)展進行縱向、橫向分析;然后在GPCA 基礎上,對區(qū)域經(jīng)濟發(fā)展水平做非線性映射的遺傳算法聚類分析.仿真表明,綜合評價結(jié)果與客觀實際吻合度較高.
區(qū)域經(jīng)濟;全局主成分分析;非線性映射;遺傳算法聚類分析
改革開放以來,中國經(jīng)濟迅猛發(fā)展,綜合國力明顯提高.同時,區(qū)域經(jīng)濟間的發(fā)展差距問題隨之顯現(xiàn).按照科學發(fā)展觀的要求,統(tǒng)籌區(qū)域經(jīng)濟協(xié)調(diào)發(fā)展成為現(xiàn)代化建設中的一個重大戰(zhàn)略問題.正確評價中國各地區(qū)的經(jīng)濟發(fā)展水平,可以為區(qū)域經(jīng)濟均衡發(fā)展提供理論指導.
區(qū)域經(jīng)濟的發(fā)展是一個動態(tài)過程,對其評價應考慮時間因素.全局主成分分析(GPCA)在傳統(tǒng)主成分分析方法的基礎上,融入了時間序列的思想,適合從縱向、橫向兩方面評價中國各地區(qū)的經(jīng)濟發(fā)展水平.非線性映射的遺傳算法聚類分析,是通過智能計算將眾多的評價指標數(shù)據(jù)映射到二維空間,進行聚類分析,聚類結(jié)果的顯示更為直觀.
本文利用 GPCA和遺傳算法聚類分析,對中國31個地區(qū)連續(xù)兩年的經(jīng)濟發(fā)展水平進行綜合評價,得到一些有意義的結(jié)論,可以為區(qū)域經(jīng)濟、社會的統(tǒng)籌發(fā)展提供決策參考.
1.1 區(qū)域經(jīng)濟綜合評價指標體系
區(qū)域經(jīng)濟的發(fā)展受政治、經(jīng)濟、文化、社會諸多因素影響,是一個復雜系統(tǒng).對其客觀評價,需要合理構(gòu)建評價指標體系.
表1 區(qū)域經(jīng)濟發(fā)展水平評價指標體系
本文從經(jīng)濟規(guī)模、經(jīng)濟結(jié)構(gòu)、經(jīng)濟創(chuàng)新及可持續(xù)發(fā)展能力、社會發(fā)展水平等方面綜合衡量,選取反映區(qū)域經(jīng)濟發(fā)展水平的 20項評價指標,建立指標體系如表1:
1.2 全局主成分分析(GPCA)
經(jīng)典主成分分析,是在樣本評價指標組成的數(shù)據(jù)表基礎上進行分析,無法實現(xiàn)不同時點樣本的評價對比.全局主成分分析,是融入了時間序列思想的主成分分析方法,它首先將不同時點的若干數(shù)據(jù)表按時間順序整合,得到一個全局數(shù)據(jù)表,然后進行經(jīng)典主成分分析.
區(qū)域經(jīng)濟的發(fā)展一般以年為時間跨度加以評價分析,評價指標間具有數(shù)據(jù)相關(guān)性.通過 GPCA進行降維處理,保證了區(qū)域經(jīng)濟系統(tǒng)分析的整體性、統(tǒng)一性和可比性.
根據(jù)區(qū)域經(jīng)濟發(fā)展水平的評價指標 A1,A2,…,A20,選取中國 31個地區(qū)連續(xù) 2年的數(shù)據(jù),整合為全局數(shù)據(jù)表,利用 Matlab7.0軟件的 princomp函數(shù)進行全局主成分分析.
2.1 非線性映射
非線性映射分析是 Sammon于 1969年提出的一種幾何降維數(shù)學方法,是通過非線性變換,用少數(shù)幾個綜合變量最大限度地表達高維變量,將高維空間問題轉(zhuǎn)化為直觀的低維空間問題.
非線性映射由高維變換到低維的約束條件,即誤差函數(shù)為:分別為高維空間和低維空間中樣本點 i、j之間的歐氏距離.
2.2 基于遺傳算法工具箱的聚類分析
遺傳算法是借鑒生物界中自然選擇原理、自然遺傳機制的一種全局尋優(yōu)算法,其實質(zhì)是通過群體搜索技術(shù),根據(jù)適者生存的原則逐代進化,最終得到最優(yōu)解或準最優(yōu)解.其構(gòu)成要素:染色體編碼,個體適應度評價,遺傳算子(選擇、交叉、變異),運行參數(shù)設置.
Matlab7.0軟件的遺傳算法與直接搜索(Genetic Algorithm and Direct Search)工具箱可以優(yōu)化目標函數(shù).利用遺傳算法工具箱對非線性映射的誤差函數(shù)做最小化處理,找到合適的二維數(shù)據(jù)結(jié)構(gòu),完成高維數(shù)據(jù)到二維數(shù)據(jù)的非線性映射,實現(xiàn)樣本的聚類分析.
3.1 選取中國 31個地區(qū)連續(xù) 2年的數(shù)據(jù),進行GPCA
根據(jù)區(qū)域經(jīng)濟發(fā)展水平評價指標體系,選取中國 31個地區(qū)在 2010年和 2011年的 31×2×20個數(shù)據(jù),整合為全局數(shù)據(jù)表.經(jīng) GPCA可知,前 4個主成分的累積貢獻率達到 85%,故選擇 4個主成分作為綜合指標,代替原有的 20個指標.2010、2011年地區(qū)經(jīng)濟發(fā)展水平綜合得分及排序如表2:
表 2 2010、2011年地區(qū)經(jīng)濟發(fā)展水平綜合得分及排序
經(jīng)驗證,GPCA綜合得分及排序與中國各地區(qū)經(jīng)濟發(fā)展水平基本相符,表明區(qū)域經(jīng)濟水平的評價指標體系構(gòu)建合理.
由表 2縱向、橫向比較可知,中國經(jīng)濟在 2010年和 2011年發(fā)展平穩(wěn),東部、東北、中部、西部各區(qū)域經(jīng)濟發(fā)展均衡.經(jīng)濟發(fā)展的整體格局穩(wěn)健,其中,東部發(fā)展較迅速,中部尤其是安徽崛起顯著.
3.2 利用遺傳算法工具箱,進行 2011年中國各地區(qū)經(jīng)濟發(fā)展水平的聚類分析
將 2011年的主成分分值作為樣本數(shù)據(jù),在Matlab7.0中調(diào)用遺傳算法工具箱,完成高維數(shù)據(jù)到二維數(shù)據(jù)的非線性映射,實現(xiàn)樣本的聚類分析.
選取一次的仿真結(jié)果并分析如下:
當遺傳算法停止,種群進化完畢,得到如圖 1所示的最優(yōu)個體適應度函數(shù)值變化曲線及最優(yōu)個體.最優(yōu)個體對應的適應度函數(shù)值為 0.0137878,比較接近 0,說明遺傳算法較好地找到了非線性映射時誤差函數(shù)的解.
根據(jù)最優(yōu)個體的值,得到高維數(shù)據(jù)映射到二維空間的結(jié)果如圖 2(標號對應的地區(qū)見表 2),從圖中可看出各樣本的聚類情況.2011年我國 31個地區(qū)的經(jīng)濟發(fā)展水平大致可分為 4類,分別為:A類(經(jīng)濟發(fā)達地區(qū)):北京、上海;B類(經(jīng)濟較發(fā)達地區(qū)):天津、浙江、廣東、江蘇、福建、遼寧、山東、內(nèi)蒙古;C類(經(jīng)濟中等發(fā)達地區(qū)):重慶、海南、吉林、湖北、河北、陜西、黑龍江、山西、湖南、寧夏、江西、安徽、四川、河南、新疆、廣西;D類(經(jīng)濟欠發(fā)達地區(qū)):青海、云南、西藏、甘肅、貴州.其中,北京、上海的經(jīng)濟發(fā)展水平明顯高于其它地區(qū);廣東、浙江、江蘇、天津的經(jīng)濟發(fā)展水平也較高.
由 GPCA和遺傳算法聚類分析的結(jié)果,可以得出以下結(jié)論:
(1)將 GPCA和非線性映射的遺傳算法聚類分析相結(jié)合,可以為區(qū)域經(jīng)濟評價提供了一種新的思路和方法.GPCA可根據(jù)綜合分值對區(qū)域經(jīng)濟發(fā)展水平進行縱向、橫向比較;非線性映射的遺傳算法聚類分析,實現(xiàn)了在二維平面中直觀地看到高維樣本點的近似圖像,避免了其它聚類法的人為選擇因素.
(2)GPCA得分值與遺傳算法聚類分析的結(jié)果基本吻合,實現(xiàn)了定量與定性的統(tǒng)一,結(jié)果較為理想.從 GPCA的結(jié)果來看,中國各地區(qū)經(jīng)濟在 2010年和 2011年期間整體發(fā)展平穩(wěn);從遺傳算法聚類分析的結(jié)果來看,中國各地區(qū)經(jīng)濟發(fā)展的差距較大,特別是東西部間差距明顯,統(tǒng)籌區(qū)域經(jīng)濟協(xié)調(diào)發(fā)展的任務十分緊迫.
本文結(jié)合 GPCA和遺傳算法聚類分析,對中國地區(qū)發(fā)展水平進行綜合評價.首先借助 GPCA獲得經(jīng)濟水平全局主成分分值,對區(qū)域經(jīng)濟發(fā)展進行縱向、橫向分析;然后在 GPCA的基礎上,對區(qū)域經(jīng)濟發(fā)展水平做非線性映射的遺傳算法聚類分析.仿真顯示,綜合評價結(jié)果與客觀實際吻合度較高,表明GPCA和遺傳算法聚類分析相結(jié)合的綜合評價方法,在中國區(qū)域經(jīng)濟評價中的應用是合理有效的.
圖1 遺傳算法中最優(yōu)個體適應度函數(shù)值變化曲線及最優(yōu)個體
圖 2 2011年中國區(qū)域經(jīng)濟發(fā)展水平二維空間映射結(jié)果
〔1〕高洪深.區(qū)域經(jīng)濟學(第三版)[M].北京:中國人民大學出版社,2010.7-21.
〔2〕何曉群.多元統(tǒng)計分析(第三版)[M].北京:中國人民大學出版社,2012.114-128.
〔3〕張建平.基于主成分分析的區(qū)域經(jīng)濟發(fā)展水平的綜合評價[J].農(nóng)業(yè)與技術(shù),2007(6):125-128.
〔4〕耿海清,陳帆,詹存衛(wèi)等.基于全局主成分分析的我國省級行政區(qū)城市化水平綜合評價[J].人文地理,2009(5):47-51.
〔5〕陸仁強,張宏偉,牛志廣等.基于非線性映射理論的城市供水管網(wǎng)壓力監(jiān)測點布置方法研究[J].水利學報,2010(1):25-29.
〔6〕雷英杰,張善文,李續(xù)武等.MATLAB 遺傳 算法工具箱及應用[M].西安:西安電子科技大學出版社,2006.
〔7〕韓瑞鋒.遺傳算法原理與應用實例[M].北京:兵器工業(yè)出版社,2009.25-36.
F224;O29
A
1673-260X(2014)08-0107-03
基金支持:六安市定向委托皖西學院市級研究項目(2012LW 020);安徽高校省級科學研究項目(KJ2013B332)