包鑫
由于財政工作經常與數據打交道,財政政策制定實施過程中數據分析測算是非常重要的基礎工作。對于財政實務部門來說,統(tǒng)計計量方法應用本身具有一定知識門檻,如從學界高度復雜的論文中學習相關統(tǒng)計計量方法,更是增加了應用的困難性。所以說財政實務部門迫切需要適用性強、操作簡單、結論直觀的統(tǒng)計計量方法來解決一些實際問題。本文介紹聚類分析這種統(tǒng)計計量方法,并以浙江省縣市區(qū)轉移支付分檔為例,通過統(tǒng)計軟件SPSS計算得出結果。該方法的適用性良好,能夠揭示數據后規(guī)律,并能在一定程度上真正指導實際工作。
所謂物以類聚,人以群分。聚類分析便是研究多要素事物分類問題的數量方法,是當代分類學與多元分析的結合。其基本原理是,根據樣本自身的屬性,即在樣本多指標的情況下,用數學方法按照某種相似性或差異性指標,定量地確定樣本之間的相似程度關系,并按這種關系程度對樣本進行歸類。簡而言之,聚類分析就是按照各事物之間不同的特性進行辨認,將具有相似特性的事物歸別為同類。
聚類分析的方法可以大致分為兩類,系統(tǒng)聚類法(Hierachical Cluster)和非系統(tǒng)聚類法(Non-hierarchical Clustering)。其中K-means Cluster便是非系統(tǒng)聚類分析中最常用的K-均值聚類法,其基本原理是對樣本按照設定的類別數進行快速聚類,將某些樣本作為今后各類的初始核心,通過計算得出各類的中心位置,進而重新計算達到初始核心位置并再次分類。與系統(tǒng)聚類相比,快速聚類的計算量較小,但適用范圍較窄,如要求事先明確分類數量,所使用的變量數據都必須是連續(xù)變量,并且對數據的多元正態(tài)、方差齊次等數據假設要求較高。同時,如樣本量大于100,則需考慮是否使用快速聚類。
系統(tǒng)聚類法(Hierarchical Clustering)是目前國內外使用最多的一種方法,其基本思想是:先將n個樣本各自看成一類,計算類與類之間即樣本間的距離;然后選擇距離最小的一對并成一個新類,計算新類和其他類的距離;再將距離最小的兩類合并,這樣每次減少一類,直至所有的樣本都成為一類為止。系統(tǒng)聚類法的優(yōu)點在于利用樣本在多維度下之間的距離最近原則進行聚類,對數據的要求沒有快速聚類方法高,提供的運算方法也多樣。缺點是計算速度沒有快速聚類快,但在現有計算機硬件水平下基本可以忽略。本文將采用系統(tǒng)聚類法。
本文以浙江省轉移支付縣市區(qū)分類為例,從而說明該方法可以在省級層面,服務于較中觀的財政政策制定。這一案例適用的前提原因便是省級的樣本量可以滿足分類的需要。
轉移支付是政府間平衡財力,促進下級政府有效發(fā)揮經濟發(fā)展、民生保障、維持運轉等各項職能的重要工具。為此,浙江省財政廳于2015年發(fā)文《浙江省財政廳關于深化財政體制改革的實施意見》(浙財預〔2015〕50號),其中提出“優(yōu)化完善轉移支付地區(qū)分類分檔體系,建立換檔激勵獎補機制。以各市、縣(市)經濟社會發(fā)展水平、經濟動員能力、財力狀況等因素為依據分為二類六檔?!本唧w如下:
一類一檔:淳安縣、文成縣、泰順縣、開化縣、慶元縣、松陽縣、景寧縣等7個縣。轉移支付系數為1。
一類二檔:蒼南縣、永嘉縣、武義縣、磐安縣、衢州市、龍游縣、常山縣、江山市、岱山縣、嵊泗縣、麗水市、青田縣、云和縣、龍泉市、縉云縣、遂昌縣、仙居縣、天臺縣等18個市、縣(市)。轉移支付系數為0.9。
一類三檔:三門縣、平陽縣、舟山市、蘭溪市等4個市、縣(市)。轉移支付系數為0.8。
二類一檔:金華市、安吉縣、建德市、桐廬縣、臨安市、嵊州市、新昌縣、浦江縣、東陽市、臨海市等10個市、縣(市)。轉移支付系數為0.6。
二類二檔:海寧市、桐鄉(xiāng)市、平湖市、嘉善縣、海鹽縣、長興縣、德清縣、諸暨市、瑞安市、樂清市、永康市、義烏市、溫嶺市、玉環(huán)縣等14個縣(市)。轉移支付系數為0.4。
二類三檔:杭州市、嘉興市、湖州市、紹興市、臺州市、溫州市等6個市。轉移支付系數為0.2。
轉移支付系數越低,當地經濟能力、財政實力也越強,其中二類三檔主要是浙江10個市區(qū)中的6家(除寧波),而金華市、舟山市、衢州市和麗水市則分布在其他類檔。據筆者了解,轉移支付檔次劃分使用十多個指標,有經濟類、財政類、社會類等,并賦予不同權重從而構成一個復雜的指標體系,這匯聚了浙江省財政廳預算部門整個團隊的智慧。本文僅是從國民經濟發(fā)展角度,對全浙江省縣市區(qū)進行分類分檔,對照省財政廳現有分檔結果,對本文做法進行一定的檢驗。
數據來源于《浙江統(tǒng)計年鑒2015》中各市、縣國民經濟主要指標,同時本文根據多重共線性和缺失值情況對相關指標進行了篩選,最終納入戶籍人口數、GDP、工業(yè)增加值①“營改增”分成調整后,該指標更為重要。、人均GDP、社會消費品零售總額、固定資產投資、財政總收入、地方財政收入、地方財政總支出、城鄉(xiāng)居民儲蓄存款額。本文認為這些指標完全能夠反映當時的地方經濟實力、財政實力以及政府動員經濟社會能力。
1.缺失值計算
缺失值在年鑒中較為常見,但如果因為少量缺失值便舍去整個指標,對數據是一種浪費。比如對金東區(qū)的城鄉(xiāng)居民儲蓄存款額缺失,可以使用Missing Value Analysis進行測算,其中已知EM(即期望最大化)方法,一般均要優(yōu)于Regession多重線性回歸方法,其SPSS操作如下:
(1)Analyze→Missing Value Analysis;(2)Quantitative Variables框選擇所有數量指標;Label Cases by選擇地區(qū)指標;Estimation選擇EM;EM選項下選擇save completed data;file選項下輸入估計出新文件如abc;(3)點擊continue,點擊ok結果如表1所示。
表1 EM均值a
這是EM估計給出的均值,下方是Little的MCAR檢驗,結果認為數據缺失是完全隨機的。同時在新的文件中給出金東區(qū)城鄉(xiāng)居民儲蓄存款額的估計值153.56億元。之后進入正式演算環(huán)節(jié)。
2.數據演算
其操作步驟與之前基本一致,具體操作如下:
(1)Analyze→Classify→Hierachical Cluster;(2)Variables框選擇所有連續(xù)數據變量;Label Cases by選擇地區(qū);Cluster選擇Cases;在plots選項中選擇Dendrongram;(3)點擊continue;在Method選項中選擇標準化Z-Scores,這是因為各變量的單位不統(tǒng)一;點擊ok結果根據樹形圖簡化如表2。
我們可以發(fā)現,浙江省內整體可以分為三類,杭州市區(qū)、寧波市區(qū)第一類,紹興市區(qū)、溫州市區(qū)第二類,其他地區(qū)為第三類。其他地區(qū)數量較多,本文剔出第一類和第二類地區(qū)后,再將第三類進行細化,聚類為四類,根據樹形圖簡化得到表3。
表2 初步聚類結果情況表
從表3可知,經過細分,如將表2中的第三類分為四檔,余杭區(qū)、慈溪市、鄞州區(qū)、蕭山區(qū)和臺州市區(qū)整體經濟體量較大,可以是第三類第一檔;第二檔為余姚市、諸暨市、湖州市區(qū)、嘉興市區(qū)、瑞安市、樂清市、溫嶺市、金華市區(qū)、義烏市、舟山市區(qū)、柯橋區(qū);第三檔為蒼南縣、臨海縣、永嘉縣等地區(qū);第四檔為遂昌縣、松陽縣等地區(qū)。與省廳分類分檔有一定相似之處,特別是上下限。
表3 對第三類地區(qū)分檔情況表
綜合前文計量分析和按照簡化類別的目的,浙江省全省縣市區(qū)按照經濟發(fā)展情況可以分為六類,從簡便起見,可以利用各類別的均值來分析各類特征,且由于各類之間指標最大值與最小值相差過大,可以將相近兩類進行分析比較。
表4 各類地區(qū)指標均值比較情況表
由表4可知:
1.第一類地區(qū)
杭州市區(qū)、寧波市區(qū)作為整個浙江省社會經濟最發(fā)達的市區(qū),各項指標均遙遙領先第二類地區(qū)。從指標數值看,人口為377萬人,GDP達到6283億元,工業(yè)增加值約為2463億元,人均GDP為176948元,社會消費品零售總額2703億元,固定資產投資超過3000億元,財政總收入接近1500億元,地方財政收入為770億元,地方財政總支出735億元,地方財政收支略有盈余,城鄉(xiāng)居民存款年末余額超過4328億元。與第二類地區(qū)相比,GDP以及工業(yè)增加值均為第二類地區(qū)的2.8倍;固定資產投資為2.8倍;社會消費品零售總額是近3倍,財政總收入為4.8倍;財政總支出則為近4倍。其中僅人均GDP均值為176948元,相差較少倍數,為1.5倍。人均GDP以2014年末美元匯率中間價格1∶6.1190計算,為28918美元,城市已經實現現代化目標,成為經濟發(fā)達城市。
2.第二類地區(qū)
紹興市區(qū)和溫州市區(qū)是浙江省社會經濟次發(fā)達市區(qū),這是相比杭州市區(qū)和寧波市區(qū)而言。從指標數值看,人口接近于200萬,GDP達到2000億元以上,工業(yè)增加值接近900億元,人均GDP約為11500元,社會消費品零售總額超過1000億元,固定資產投資超過1200億元,財政總收入超過300億元,地方財政收入超過180億元,地方財政收支大致平衡,城鄉(xiāng)居民存款年末余額超過1700億元。但可以發(fā)現,二三類地區(qū)間指標差距比一二類地區(qū)間要小很多,即GDP值(二三類相差820億元)、社會消費品零售總額(二三類相差560億元)、固定資產投資(二三類相差553億元)以及城鄉(xiāng)居民存款年末余額(二三類相差為777億元),這些為相差大于300億元的指標,而在地方財政收入、財政總支出方面則相差50億元左右,甚至第二類地區(qū)人均GDP要低于第三類4242元,二類比三類人口數多72萬人。二類地區(qū)人均GDP換算為18789美元,超過1萬美元,標志工業(yè)化已經成熟,處于后工業(yè)化發(fā)展的后期。同時,可以發(fā)現第二三類地區(qū)間的差別主要是城市人口規(guī)模因素。
3.第三類地區(qū)
余杭區(qū)、慈溪市、鄞州區(qū)、蕭山區(qū)是浙江經濟實力排名前列的區(qū)或縣級市,臺州市區(qū)經濟實力則與之相近。從指標數值看,人口超過110萬人(其中臺州市區(qū)人口最多達到158萬人),GDP接近1300億元,工業(yè)增加值超過600億元,人均GDP約為120000元,社會消費品零售總額接近500億元,固定資產投資接近700億元,財政總收入超過230億元,地方財政收入超過130億元,地方財政總支出同上,地方財政收支大致平衡,城鄉(xiāng)居民存款年末余額接近1000億元。與第四類地區(qū)相比,優(yōu)勢較大超過100億元的指標為GDP(相差462億元)、工業(yè)增加值(相差257億元)、城鄉(xiāng)居民存款年末余額(相差124億元)、財政總收入(相差116億元)、城鄉(xiāng)居民存款年末余額(相差約320億元)。人均GDP相差27148元。三類地區(qū)人均GDP為19485美元,超過1萬美元,接近2萬美元,說明該地區(qū)即將完成城市現代化,達到經濟發(fā)達城市水平。同時,相比第四類地區(qū),第三類地區(qū)的工業(yè)經濟水平要更突出。
4.第四類地區(qū)
第四類地區(qū)中,4個市區(qū)為湖州市區(qū)、嘉興市區(qū)、金華市區(qū)、舟山市區(qū),1個市轄區(qū)柯橋區(qū),其他6個均為縣級市,可以看作省內最為發(fā)達的縣級市第一梯隊。從指標數值看,人口接近100萬人,GDP超過830億元,工業(yè)增加值超過350億元,人均GDP約為92000元,社會消費品零售總額約為360億元,固定資產投資超過500億元,財政總收入約為117億元,地方財政收入為67.3億元,地方財政總支出約為83億元,地方財政收支差額為15.7億元,城鄉(xiāng)居民存款年末余額約為662億元。相比第五類地區(qū),超過100億元差距的指標主要有GDP(相差約413億元),相比二三類的差距較小;工業(yè)增加值(相差約160億元),相比二三類的差距較??;社會消費品零售總額(相差190億元),相比二三類其差距更大;固定資產投資(相差260億元),相比二三類差距更大,城鄉(xiāng)居民存款年末余額(相差約為370億元),相比二三類差距更大。而財政地方收支也不同于前幾類的略有盈余、總體平衡,開始明顯存在赤字。人均GDP換算為15048美元,同為超過1萬美元,處于向后工業(yè)化發(fā)展的中期。相比第五類地區(qū),可以發(fā)現在城市建設水平、消費能力、服務業(yè)發(fā)展水平等方面更高。
5.第五類地區(qū)
第五類有27個地區(qū),其中市區(qū)有2個為衢州市區(qū)和麗水市區(qū),市轄區(qū)3個奉化區(qū)(規(guī)劃已調整)、上虞區(qū)、富陽區(qū),其余為縣級市或縣,基本上反映了經濟能力的中等水平,也相當于平均線。從指標數值看,人口約為64萬人,GDP約為419億元,工業(yè)增加值接近200億元,人均GDP約為71000元,社會消費品零售總額約為169億元,固定資產投資超過250億元,財政總收入約為61億元,地方財政收入約34億元,地方財政總支出約為46億元,地方財政收支差額約為12億元,城鄉(xiāng)居民存款年末余額約為293億元。與第六類比較,發(fā)現各項指標,除人口數和人均GDP外,均高于第六類1-3倍。人均GDP換算為11593美元,超過1萬美元,處于后工業(yè)化的前期。
6.第六類地區(qū)
第六類共有26個地區(qū),除金東區(qū)為市轄區(qū)外,其他均為縣級市或縣,為浙江經濟實力整體最欠發(fā)達地區(qū)。其中溫州2個、臺州3個、舟山2個、金華4個、衢州3個和麗水8個。從指標數值看,人口均值約為35萬人,GDP約為133億元,工業(yè)增加值約54億元,人均GDP約為41000元,社會消費品零售總額約為56億元,固定資產投資約93億元,財政總收入約為15億元,地方財政收入約9億元,地方財政總支出約為24億元,地方財政收支差額約為13億元,城鄉(xiāng)居民存款年末余額約為106億元。人均GDP同上換算為6679美元,不到1萬美元,高于4000美元,說明還處于城市初步實現現代化,工業(yè)化尚未進入成熟階段。
2017年全面“營改增”后增值稅中央、地方分成重新確定,由原來的75%∶25%調整為50%∶50%,浙江省財政管理體制也隨之調整。轉移支付制度是財政管理體制的三大內容之一,按照上文分析結果,可以針對浙江省提出一些完善建議。
1.轉移支付系數設置原則由公平向公平和效率兼顧調整
從浙江省財政廳二類六檔的轉移系數設置看,基本原則大體是經濟越發(fā)達財力越雄厚的地區(qū),轉移系數越低。從全省均衡發(fā)展、共同建設實現小康社會的角度來說,意義重大。但如果從轉移資金機制來說,存在一定“原地踏步”的逆向激勵效應。以轉移支付系數最高地區(qū)為例,由于人口要素等因素影響,晉升上一檔的動力小,難度也大,激勵不足。很可能存在情況是前一檔地區(qū)努力開拓經濟,工作量較大,財政經濟實力得到一些提升,但經過轉移支付,兩檔地區(qū)財政經濟發(fā)展得到的效用可能是基本相同。因此建議設置動態(tài)類別檔位,遞進激勵機制與收入激勵機制相協(xié)調,并將轉移支付系數設置為“前低-中高-后平均”。其中,“前低”是發(fā)達地區(qū)轉移系數低,本身最為發(fā)達,較易理解;中游地區(qū)轉移支付系數最高,主要是因為中游地區(qū)的財政收支矛盾表現最為明顯,而且處于后工業(yè)化發(fā)展時期中前期,本身已經具備了一定發(fā)展基礎?!昂笃骄笔侵附洕鷮嵙ψ盥浜蟮牡貐^(qū)則采用稍高于省基本保障水平的平均系數,“?;尽笔侵饕繕?。這是因為尚處于工業(yè)化階段,落后其他地區(qū)較多,以及人口規(guī)模較少,大部分處于生態(tài)保護地區(qū),發(fā)展?jié)摿ο鄬^弱。
2.適當調整各檔內地區(qū)
以二類三檔位為例,按照上文分析,杭州市整體經濟實力遠遠超過其他地區(qū),而紹興市區(qū)和溫州市區(qū)屬于第二類,臺州市區(qū)屬于第三類,嘉興和湖州則位于第四類。將這些市區(qū)統(tǒng)一轉移支付系數為0.2,有所不妥??蓪⒑贾菔欣^續(xù)定為系數最低一檔,轉移支付系數保留為0.2;紹興、溫州次之為0.3;分析中第三類慈溪、鄞州、余杭區(qū)分屬杭州和寧波,故可將臺州與第四類地區(qū)合并,該類地區(qū)轉移支付系數定為0.4;接下去便是全省中游地區(qū)即上文分析的第五類,可將系數定為1,滿足其爭先進位的需要;而最后一類地區(qū)則高于平均數即可,可為0.6。
3.適當向寧波市傾斜
由于寧波市為計劃單列市,財政管理體制直接向中央負責,基本與浙江省級平行,所以省內轉移支付地區(qū)無寧波。從上文分析中可知寧波是浙江省內發(fā)展水平僅次于杭州的城市,也是拉動周邊地區(qū)發(fā)展的重要城市增長極,寧波也成為全國首個“中國制造2025”試點示范城市。從全省一盤棋角度出發(fā),按照“干在實處,走在前列,勇立潮頭”的浙江精神要求,發(fā)揮好寧波制造業(yè)橋頭堡以及港口經濟作用,重要性不言而喻。建議將寧波也作為轉移支付地區(qū),支持寧波發(fā)展建設,落實好省級重要部署工作,也十分有必要??蓾u進傾斜,將整體的轉移支付系數定為0.1,先包含市區(qū),再擴大到各縣及縣級市。
本文介紹了聚類分析這一統(tǒng)計計量方法在財政工作中的應用,在實際問題應用中的一般思路為:一是明確分析需求,尋找合適分析方法。本文分析需求是將數量眾多的地區(qū)進行簡化分類,使用分析方法為聚類分析。二是進行數據說明和定性處理。這一方面需要滿足樣本量的有效性,另一方面則需要通過定性分析說明各指標可以滿足分析需要。三是統(tǒng)計數據計算,即使用統(tǒng)計軟件按照相應操作輸出結果,本文說明了SPSS操作的各步驟。四是分析計算結果,提出建議。本文通過計算各類地區(qū)均值數據來說明類別特征,根據分析出的特征及結果,提出相應工作建議。在本文分析中,聚類分析方法表現出了良好的實用性和直觀性,其應用思路和聚類分析方法使用在財政實際工作中具有一定指導意義。
需要說明的是,本文對該方法的應用并不完美:在轉移支付案例中,未使用主成分分析從而定量剔出多重共線性,有可能會影響少許結果。同時還應該考慮使用最新年度數據,以及多年度數據如近三年數據進而綜合動態(tài)得到各縣市區(qū)分類,這樣的結果也更加科學。在解釋類別特征上,利用城市經濟發(fā)展相關理論,不僅僅說明各指標數字特征和利用人均GDP來解釋發(fā)展階段,從而使得分析說明上更加豐富和具有說服力。
[1]馬海祥.聚類分析的方法及應用[EB/OL].http://www.mahaixiang.cn/sjfx/746.html.