劉 干,陸 葉
(杭州電子科技大學(xué) 經(jīng)濟學(xué)院,浙江 杭州 310018)
隨著我國經(jīng)濟的快速發(fā)展,區(qū)域經(jīng)濟發(fā)展不平衡問題也變得日益突出,作為解決區(qū)域經(jīng)濟發(fā)展不平衡問題的關(guān)鍵,首先需要解決的是對我國省域按經(jīng)濟狀況做出分類評價。就目前對于該問題的研究成果來看,大多數(shù)學(xué)者都是通過聚類分析法來實現(xiàn)。然而區(qū)域經(jīng)濟發(fā)展水平是一個動態(tài)的變化過程,不同區(qū)域由于各方面條件的差異,其經(jīng)濟發(fā)展速度往往會存在較大差異,因而,對于某一經(jīng)濟總體內(nèi)部不同區(qū)域的評價也應(yīng)是一個動態(tài)的過程。從這個層面上來說,對于總體的一次聚類評價顯然不能很好地反映內(nèi)部動態(tài)變化過程;而通過不同截面分別進行聚類,再比較聚類結(jié)果的差異,一方面,聚類結(jié)果受隨機波動和事物自身可能存在的周期性波動影響較大;另一方面,不同截面聚類結(jié)果之間的可比性無法得到保障。因此,本文從面板數(shù)據(jù)聚類的角度引入了MA聚類法對該問題進行研究,聚類結(jié)果表明該方法具有一定的可靠性。
經(jīng)濟發(fā)展水平反映的是一個地區(qū)在經(jīng)濟總量及增速方面所達到的狀態(tài)。但從廣義上來說,評價一個地區(qū)經(jīng)濟發(fā)展水平的高低不應(yīng)僅僅局限于其經(jīng)濟表現(xiàn),還應(yīng)考慮其在社會生活及生態(tài)環(huán)境方面所達到的標準。因此,本文從經(jīng)濟、社會及環(huán)境三個層面篩選了14個指標構(gòu)建了如下經(jīng)濟發(fā)展水平的評價指標體系(見表1)。
表1 我國經(jīng)濟發(fā)展水平評價指標體系
本文的數(shù)據(jù)選自我國31個省市2005—2015年的經(jīng)濟指標數(shù)據(jù)。為了剔除人口和價格因素的影響,本文的評價指標均采用相對數(shù)來表示,指標中涉及的價格因素均以固定基期(2005)的實際值帶入。特別地,由于貿(mào)易開放程度指標計算中涉及的貨物進出口總額數(shù)據(jù)采用美元計價,對此,本文采用各年的平均匯率加權(quán)處理。對于數(shù)據(jù)缺失問題,本文采用兩種處理方法:一是X11指標2010年的數(shù)據(jù)缺失,可直接采用線性插值法處理;二是西藏的X5指標數(shù)據(jù)完全缺失,對此,本文考慮先對其他30個省市進行完全指標數(shù)據(jù)聚類分析,再根據(jù)未缺失的13個指標運用最近鄰判別法將西藏歸入據(jù)其最近的一類。本文所有的指標數(shù)據(jù)或計算數(shù)據(jù)均來源于《中國統(tǒng)計年鑒》、《中國能源統(tǒng)計年鑒》、《中國科技統(tǒng)計年鑒》、《國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》及各地區(qū)年鑒。
從面板數(shù)據(jù)聚類的角度來考察我國各省市經(jīng)濟發(fā)展水平的動態(tài)變化過程,首先需要解決的是,在滿足可比性的條件下,給出不同時期我國區(qū)域經(jīng)濟發(fā)展水平的類別劃分。為此,本文引入了基于K-means聚類的類別變動分析法,由于其實現(xiàn)過程運用了移動平均法的思想,因此,不妨將其叫做移動平均聚類法,簡稱MA聚類法。下面給出該方法的操作步驟。
(Ⅰ)給定聚類數(shù)K和聚類周期長度TL;
(Ⅱ)從數(shù)據(jù)的起點開始,選取長度為TL的聚類區(qū)間,進行聚類數(shù)為K的K-means聚類分析,得到對總體的 K 類劃分結(jié)果{C1,C2,…,CK};
(Ⅲ)依次將聚類區(qū)間向后平移一期,重復(fù)(Ⅱ)的過程,直到數(shù)據(jù)的終點,則可得到T-TL+1組聚類結(jié)果;
(Ⅳ)對所有聚類結(jié)果進行類的優(yōu)劣排序,不妨將排序后的第i次的聚類結(jié)果仍然記作{C1,C2,…,CK};
(Ⅴ)比較相鄰聚類結(jié)果之間的差異,并做出分析。
關(guān)于MA聚類法的具體實現(xiàn)過程仍需做如下幾點說明:
(1)面板數(shù)據(jù)的K-means聚類法。與截面K-means聚類不同的是,面板數(shù)據(jù)K-means聚類的距離函數(shù)度量的是兩個矩陣之間的距離,樣本點i與聚類中心j之間的歐式距離為:
其中,xi表示第i個樣本點矩陣,其維度為Q×T(Q表示聚類指標個數(shù),本文表示主因子個數(shù);T表示聚類周期的長度),vj表示第j個聚類中心矩陣,其維度與xi相同。||A||F表示矩陣A的Frobenius范數(shù),即矩陣A內(nèi)部所有元素平方和的平方根。
(2)聚類數(shù)K的確定。在K-means聚類之前,一般都需要指定聚類數(shù),而聚類數(shù)K實際上就是最佳聚類數(shù),關(guān)于最佳聚類數(shù)的確定方法有很多,但據(jù)研究[1]表明:在采用K-means聚類法的條件下,CH指標法的性能最優(yōu)。另外,考慮到聚類結(jié)果的統(tǒng)一性要求,即所有T-TL+1組聚類結(jié)果的聚類數(shù)應(yīng)相同。因此,本文通過對整個數(shù)據(jù)區(qū)間運用CH指標法確定最佳聚類數(shù)K*,并以其作為聚類數(shù)K的值,其計算公式如下:
(3)聚類周期長度TL的確定。當聚類總體在目標變量上的變化呈現(xiàn)周期性波動時,聚類周期TL應(yīng)選擇該周期長度的整數(shù)倍;當聚類總體在目標變量上的變化并無明顯的周期性波動時,TL的長度可選擇3,以消除隨機波動。
(4)類的優(yōu)劣判別法。本質(zhì)上,類的優(yōu)劣判別可以歸結(jié)為對聚類結(jié)果的綜合評價問題,關(guān)于多指標綜合評價問題的方法可參考[2],本文由于在聚類之前首先運用因子分析對數(shù)據(jù)進行了降維處理,因此,可直接以類平均因子綜合得分作為各類優(yōu)劣程度的測度值,從而其數(shù)值大小即代表了各自類別的優(yōu)劣。
(5)類預(yù)測法。當分析問題除了需要考察總體內(nèi)部各區(qū)域在歷史一段時間內(nèi)目標變量的動態(tài)變化過程,還需對未來變動趨勢做出預(yù)測時,可以在上述方法之前,通過ARIMA模型對各指標數(shù)據(jù)進行相同期數(shù)的時間序列預(yù)測,并將預(yù)測后的指標數(shù)據(jù)疊加到原有數(shù)據(jù)基礎(chǔ)上進行分析。從而,類預(yù)測的期數(shù)與指標數(shù)據(jù)外推預(yù)測的期數(shù)相同。
由于統(tǒng)計年鑒中公布的數(shù)據(jù)截止到2015年,為了將最新的數(shù)據(jù)納入分析過程,本文運用ARIMA模型對各省市的14個指標分別進行2期的預(yù)測,截取了部分預(yù)測結(jié)果如下:
圖1 指標預(yù)測結(jié)果
從圖1中可以看出,除部分指標波動較大,指標做短期時間序列預(yù)測基本能捕捉到序列的趨勢,因此,后文基于指標預(yù)測結(jié)果進行的類預(yù)測具有良好的可信度。
由于樣本量的限制,即本文只對我國31個省市的經(jīng)濟發(fā)展水平進行聚類,所以,最佳聚類數(shù)的取值不宜太大。為此,根據(jù)式(2)計算出CH指標在2~8區(qū)間內(nèi)的值如表2所示。
表2 不同聚類數(shù)下的CH統(tǒng)計值
從表2可得,隨著聚類數(shù)K的增加,CH指標值先遞增,在K=5處取得最大值,之后又逐漸遞減。因此,從總體來看,將我國省域劃分為5類最為合適。
由于社會經(jīng)濟指標的變化具有一定的周期性,根據(jù)施發(fā)啟[3]的研究表明:我國的經(jīng)濟周期具有一定的特殊性,即經(jīng)濟周期長短不一,但自第9個經(jīng)濟周期后已基本接近尤格拉循環(huán),因此,本文取TL=9進行后續(xù)分析。
考慮到西藏的萬元GDP能耗數(shù)據(jù)完全缺失,因此,聚類過程只針對其余30個省市進行。為了對指標數(shù)據(jù)降維,本文首先進行因子分析,由平行分析法[4]保留了3個主因子;然后,基于30個省市的主因子數(shù)據(jù)進行K=5,TL=9的MA聚類分析,并根據(jù)類平均因子綜合得分法對聚類結(jié)果進行排序,所得結(jié)果如表3和圖2所示。
表3 MA聚類分析結(jié)果
圖2 類平均因子綜合得分
根據(jù)表3,從整體來看,我國30個省市中有超過75%的區(qū)域經(jīng)濟發(fā)展水平落入了中等及以下的類別,區(qū)域經(jīng)濟發(fā)展水平的分布呈現(xiàn)出明顯的右偏性,區(qū)域經(jīng)濟發(fā)展不平衡狀況仍十分嚴重,這點從圖2的類平均因子綜合得分折線圖中也可明顯看出。從局部來看,區(qū)間2005—2013年、2006—2014年和2007—2015年的聚類結(jié)果沒有發(fā)生變動,說明我國各地區(qū)經(jīng)濟發(fā)展水平在2005—2015年間發(fā)展相對平穩(wěn),各類中區(qū)域經(jīng)濟發(fā)展水平的平均增速沒有太大差異。
根據(jù)指標預(yù)測數(shù)據(jù),區(qū)間2008—2016年的聚類結(jié)果相對于上期僅在經(jīng)濟水平較低的兩類間發(fā)生了變動,即甘肅和青海的經(jīng)濟增速相對于C4類其他地區(qū)出現(xiàn)了下滑趨勢,因而被劃分到了經(jīng)濟水平更低的類中。區(qū)間2009—2017年的區(qū)域經(jīng)濟發(fā)展水平聚類結(jié)果波動較大,變動主要表現(xiàn)在C3和C4類元素的交換,其中只有內(nèi)蒙古、重慶和陜西的變動方向為正,其余包括遼寧、河北、吉林、黑龍江、安徽、江西、河南、湖南、四川、山西、云南和新疆的變動方向均為負向。出現(xiàn)如此大面積省市經(jīng)濟波動的原因主要有兩方面:一方面,2008—2016年聚類區(qū)間內(nèi)C3和C4類的經(jīng)濟發(fā)展水平差距并不明顯(這點從圖2可看出),而C4中經(jīng)濟水平較高的內(nèi)蒙古、重慶和陜西的經(jīng)濟增速比C3中的經(jīng)濟水平較低的河北、吉林和黑龍江等的經(jīng)濟增速高,因而實現(xiàn)了反超;另一方面,在原有類別中,經(jīng)濟水平相對較低的遼寧、山西、云南等地區(qū)經(jīng)濟增速低于其余省份,因而,導(dǎo)致與經(jīng)濟水平較低類的距離更近。
從圖2中曲線的走勢來看,我國區(qū)域經(jīng)濟總體均呈現(xiàn)穩(wěn)步上升趨勢,且在2005—2017年間,區(qū)域間的差距沒有被明顯拉大的現(xiàn)象,區(qū)域間經(jīng)濟發(fā)展不平衡問題也沒有得到明顯改善。從圖2中折線的疏密情況來看,我國區(qū)域間經(jīng)濟發(fā)展水平“貧富懸殊”,區(qū)域經(jīng)濟發(fā)展不平衡現(xiàn)象主要表現(xiàn)在經(jīng)濟發(fā)達地區(qū)、中高經(jīng)濟發(fā)展水平地區(qū)和中等及以下經(jīng)濟發(fā)展水平地區(qū)之間,而經(jīng)濟發(fā)展水平較低的3類間的差距并不明顯,這也導(dǎo)致聚類變動主要發(fā)生在這3類間。
為了研究我國31個省市經(jīng)濟發(fā)展水平的空間分布情況,首先需要對西藏的分類情況做出判別,為了簡化分析過程,本文基于除缺失指標(萬元GDP能耗)外的13個指標數(shù)據(jù),通過以熵權(quán)法進行指標加權(quán)的最近鄰判別法將西藏劃分到距其最近的類別。計算結(jié)果如表4所示。
表4 西藏到各類中心的距離
由表4可知,西藏與2005—2013年、2006—2014年及 2007—2015年的 C4類最近,與 2008—2016年和2009—2017年的C5類最近,因此,根據(jù)最近判別法的原理,分別將西藏歸入相應(yīng)的類別。
將西藏的分類結(jié)果添加到表3,并通過ArcGIS 10.5繪出聚類分布圖(見圖3)(由于前3期聚類結(jié)果與第4期的差別僅表現(xiàn)在C4和C5類之間,為了呈現(xiàn)的美觀,這里只給出第4、5期的聚類結(jié)果)。
從圖3的聚類結(jié)果來看,我國經(jīng)濟發(fā)展水平較高的地區(qū)均位于東部地區(qū)的沿海經(jīng)濟帶,西部地區(qū)經(jīng)濟發(fā)展水平相對落后,出現(xiàn)經(jīng)濟發(fā)展水平波動的地區(qū)主要分布在中西部交界地區(qū)。從聚類變動情況來看,重慶、陜西和內(nèi)蒙古的經(jīng)濟發(fā)展較快,開始步入中等經(jīng)濟水平,而遼寧、山西等地的經(jīng)濟增速較為緩慢,甚至出現(xiàn)衰落跡象。結(jié)合指標數(shù)據(jù)來看,近年來,重慶的對外開放程度不斷加深,內(nèi)蒙古的人均GDP增幅明顯,陜西在科技及教育方面成果顯著,而遼寧在三廢處理能力上相對薄弱;山西由于經(jīng)濟類型較為粗放,且主要以煤炭資源帶動經(jīng)濟發(fā)展,隨著近年煤炭市場的低迷,經(jīng)濟出現(xiàn)了嚴重下滑。從圖(a)到(b)的大幅變動也主要是由于這些地區(qū)經(jīng)濟發(fā)展速度的變化造成了聚類結(jié)果的重組。
圖3 聚類結(jié)果分布圖
本文從經(jīng)濟、社會和環(huán)境三個角度構(gòu)建了一套區(qū)域經(jīng)濟發(fā)展水平評價指標體系,相比于只從經(jīng)濟和社會角度去刻畫經(jīng)濟發(fā)展狀況更準確、更全面。另外,采用MA聚類法對區(qū)域經(jīng)濟發(fā)展水平進行動態(tài)聚類和聚類預(yù)測,克服了一次聚類無法給出區(qū)域經(jīng)濟動態(tài)發(fā)展特征和各年度分別聚類帶來的可比性不足的問題。
運用MA聚類法對我國 31個省市 2005—2015年的經(jīng)濟發(fā)展水平數(shù)據(jù)進行動態(tài)聚類,結(jié)果顯示,我國區(qū)域經(jīng)濟發(fā)展水平的分布呈現(xiàn)出明顯的右偏性,區(qū)域間“貧富懸殊”差異顯著;區(qū)域經(jīng)濟發(fā)展不平衡問題主要表現(xiàn)在經(jīng)濟發(fā)展水平高、中高和中等及以下地區(qū)之間差異顯著;雖然區(qū)域經(jīng)濟發(fā)展水平總體呈上升趨勢,但區(qū)域間經(jīng)濟發(fā)展不平衡的狀況并沒有得到明顯的改善。從區(qū)域經(jīng)濟發(fā)展水平變動情況來看,重慶、陜西和內(nèi)蒙古的經(jīng)濟發(fā)展較快,開始步入中等經(jīng)濟水平,而遼寧、山西等地的經(jīng)濟增速較為緩慢,甚至出現(xiàn)衰落跡象。結(jié)合指標數(shù)據(jù)分析,重慶、陜西和內(nèi)蒙古經(jīng)濟發(fā)展水平的提升分別得益于在對外開放、科技教育和人均GDP等方面發(fā)展迅速;而山西受近年煤炭市場低迷的影響,經(jīng)濟下滑嚴重;遼寧在環(huán)保方面的表現(xiàn)欠佳也對其整體經(jīng)濟水平造成了一定的影響。整體來看,解決區(qū)域經(jīng)濟發(fā)展不平衡問題首先需各地區(qū)發(fā)揮自身優(yōu)勢,著力解決阻礙地區(qū)經(jīng)濟發(fā)展的問題,并尋求適合地區(qū)特點的新經(jīng)濟增長點;其次,各地區(qū)應(yīng)加強同周邊區(qū)域的交流互通,實現(xiàn)經(jīng)濟的互補。
【參考文獻】
[1]Arbelaitz O,Gurrutxaga I,Muguerza J,et al.An extensive comparative study of cluster validity indices[J].Pattern Recognition,2013,46(1):243-256.
[2]虞曉芬,傅玳,2014.多指標綜合評價方法綜述[J].統(tǒng)計與決策(11):119-121.
[3]施發(fā)啟,2000.中國經(jīng)濟周期實證分析[J].統(tǒng)計研究(7):59-62.
[4]孔明,卞冉.平行分析在探索性因素分析中的應(yīng)用[J].心理科學(xué),2007,30(4):924-925.