李燕燕, 楊昊天, 曾玙璠
(1.鄭州大學(xué) 商學(xué)院,河南 鄭州 450001; 2.鄭州大學(xué) 產(chǎn)業(yè)技術(shù)研究院 電氣工程學(xué)院,河南 鄭州 450001; 3.英國利物浦大學(xué) 數(shù)學(xué)科學(xué)系,利物浦)
城市作為國家經(jīng)濟(jì)增長最有力的支撐,也是各種資本最活躍的空間區(qū)域,各種經(jīng)濟(jì)問題在城市的平臺上表現(xiàn)得最為直接.進(jìn)入新常態(tài),出現(xiàn)了動能困境、結(jié)構(gòu)失衡、脫實(shí)就虛、公共服務(wù)產(chǎn)品短缺等一系列問題,這些問題的背后其實(shí)是資本規(guī)模大小的市場配置狀況.隨著城鎮(zhèn)化進(jìn)程的深入,城市的資本化程度也越來越高,所謂的城市資本化是使納入城市的資產(chǎn)以貨幣化形式進(jìn)行運(yùn)作,是土地資本、金融資本、產(chǎn)業(yè)資本、科技資本(含人力資本)以及公共服務(wù)資本等高度耦合健康循環(huán)發(fā)展的模式.
目前理論界關(guān)于城市資本的研究多是從單個資本的視角來研究,諸如土地財政與城市發(fā)展、金融資本與經(jīng)濟(jì)增長、金融促進(jìn)產(chǎn)業(yè)發(fā)展等,關(guān)于多重資本結(jié)構(gòu)配置的研究相對較少.城市資本結(jié)構(gòu)是一個受到多目標(biāo)多因素交互影響的復(fù)雜問題,單一工具很難對此做出較為全面的解釋.城市資本所涉及的土地資本、金融資本、產(chǎn)業(yè)資本、科技資本以及公共服務(wù)資本雖有各自的運(yùn)行特征和規(guī)律,其作用機(jī)制和強(qiáng)度具有一定差別,但它們之間并非互相割裂,而是互相影響、互動耦合發(fā)生作用.所以,筆者選取30個省級行政中心(拉薩除外)為代表,基于2002~2016年各城市地區(qū)生產(chǎn)總值、人均地區(qū)生產(chǎn)總值、全社會固定資產(chǎn)投資、土地出讓金、第二產(chǎn)業(yè)增加值、規(guī)模以上工業(yè)企業(yè)利潤總額、第三產(chǎn)業(yè)增加值、金融增加值、科教支出(科技支出和教育支出)、年末總?cè)丝跀?shù)、城鎮(zhèn)單位從業(yè)人員期末人數(shù)、城鎮(zhèn)居民人均可支配收入、職工平均工資、當(dāng)年實(shí)際利用外資金額等數(shù)據(jù),透視土地資本、金融資本、產(chǎn)業(yè)資本、科技資本以及公共服務(wù)資本的作用特征,通過利用隨機(jī)森林算法從多維角度考察城市資本結(jié)構(gòu)的復(fù)雜關(guān)系,采用多目標(biāo)粒子群約束優(yōu)化算法構(gòu)建多目標(biāo)多因素影響下的城市最優(yōu)資本結(jié)構(gòu)模型,了解城市資本結(jié)構(gòu)配置的狀況以及相互作用的對沖效應(yīng),尋找最接近目標(biāo)模式的年份和城市,為城市資本內(nèi)部結(jié)構(gòu)調(diào)整和功能提升提供參考價值.
隨機(jī)森林回歸(random forest regression,RFR)算法是Breiman等[1]于2001年提出的.該算法將Bagging集成學(xué)習(xí)理論與隨機(jī)子空間方法結(jié)合[2],是一種基于決策樹的集成學(xué)習(xí)算法.
隨機(jī)算法不但能夠處理連續(xù)的數(shù)據(jù)問題,而且也可以處理具有離散屬性的數(shù)據(jù),其運(yùn)行速度快,且穩(wěn)健性和抗噪性強(qiáng),所以該算法被廣泛應(yīng)用于生物信息領(lǐng)域基因序列的分類和回歸等[3-4]、經(jīng)濟(jì)金融領(lǐng)域客戶信用分析及反欺詐等[5-6]以及數(shù)據(jù)挖掘領(lǐng)域異常檢測和度量學(xué)習(xí)等[7-8]方面.
為了能夠提高模型精度并避免出現(xiàn)過擬合的情況,隨機(jī)森林算法引入了Bagging和隨機(jī)子空間思想[9].筆者通過評價模型的擬合效果和檢驗(yàn)?zāi)P皖A(yù)測結(jié)果來評價模型的預(yù)測能力,通過計(jì)算RFR模型的決定系數(shù)(R2)和均方根誤差(RMSE)來評價模型的擬合效果[9].
由于粒子群優(yōu)化算法(particle swarm optimization)[10]具有編程簡單、直觀易實(shí)現(xiàn)等優(yōu)點(diǎn),所以在工程上得到了廣泛的應(yīng)用.粒子群優(yōu)化算法的思路:初始化種群規(guī)模設(shè)置隨機(jī)為N,粒子群的維度設(shè)置為D,迭代次數(shù)為k時,xi=(xi,1,xi,2,…,xi,D)作為第i個粒子的位置,此時這個粒子通過向它的個體極值pbesti和全局極值gbest學(xué)習(xí)來更新它的位置,之后在迭代過程中不斷計(jì)算每次粒子的個體極值和全局極值.如果此代極值比上一代極值好,那么就將這代極值更新,反之則保留上一代的個體極值和全局極值.接下來,判斷粒子群算法是否達(dá)到設(shè)置的停止條件,若達(dá)到則將最優(yōu)解輸出,反之將繼續(xù)迭代,更新粒子的速度和位置.經(jīng)過不斷地迭代更新后,最優(yōu)解最終會出現(xiàn).粒子群的速度更新如式(1)和位置更新如公式(2).
(1)
(2)
一般情況下,多目標(biāo)優(yōu)化問題的各個子目標(biāo)是相互沖突的,一個子目標(biāo)的改善有可能會引起另一個子目標(biāo)的降低,同時使多個子目標(biāo)一起達(dá)到最優(yōu)值是不可能的,只能在它們中間進(jìn)行協(xié)調(diào)和折中處理,使各個子目標(biāo)都盡可能地達(dá)到最優(yōu)化.與標(biāo)準(zhǔn)的粒子群算法的流程大體一致[11-12],流程參照文獻(xiàn)[13].
粒子群算法已經(jīng)在多領(lǐng)域得到應(yīng)用,如云計(jì)算領(lǐng)域的云計(jì)算消耗源調(diào)度問題[14],電力系統(tǒng)領(lǐng)域用于電力系統(tǒng)的經(jīng)濟(jì)可靠運(yùn)行[15-16],解決電力系統(tǒng)經(jīng)濟(jì)調(diào)度等問題[17],經(jīng)濟(jì)領(lǐng)域用于解決最大利益的股票交易決策多目標(biāo)優(yōu)化等問題[18],數(shù)據(jù)挖掘領(lǐng)域應(yīng)用于多目標(biāo)數(shù)據(jù)分類規(guī)則挖掘以及對數(shù)據(jù)集進(jìn)行分類規(guī)則挖掘等[19].
隨機(jī)森林算法是集成算法,能夠?qū)?shù)據(jù)實(shí)現(xiàn)快速高度擬合.隨機(jī)森林算法可以利用決定系數(shù)(R2)和均方根誤差(RMSE)得出數(shù)據(jù)特征與目標(biāo)特征之間的關(guān)系.當(dāng)然,此時特征與目標(biāo)特征之間的關(guān)系并不能用具體的函數(shù)表達(dá)式表示,而是利用隨機(jī)森林算法通過訓(xùn)練數(shù)據(jù)訓(xùn)練出來的模型來表示特征與目標(biāo)特征之間的關(guān)系.通過這樣的方式,就可以利用隨機(jī)森林模型作為多目標(biāo)粒子群算法的目標(biāo)函數(shù).因?yàn)槔枚嗄繕?biāo)粒子群算法尋優(yōu)需要使得多個目標(biāo)同時達(dá)到最優(yōu),所以使用隨機(jī)森林模型構(gòu)建出各個目標(biāo)特征與其他特征之間的關(guān)系作為目標(biāo)函數(shù).考慮到在實(shí)際應(yīng)用中各個特征必然存在一定的約束條件,所以在使用多目標(biāo)粒子群算法尋優(yōu)之前,需要對各個特征添加約束條件.當(dāng)粒子超過邊界時,則重新隨機(jī)進(jìn)行初始化.用這樣的結(jié)合方式,既可以利用隨機(jī)森林的擬合特性將數(shù)據(jù)特征與所選目標(biāo)特征進(jìn)行高度擬合得出其關(guān)系,又可以根據(jù)多目標(biāo)粒子群算法進(jìn)行尋優(yōu),找到能夠同時達(dá)到多目標(biāo)的最優(yōu)點(diǎn).
此次研究的目標(biāo)是尋找城市最優(yōu)資本結(jié)構(gòu).設(shè)定人均地區(qū)生產(chǎn)總值和城鎮(zhèn)居民可支配收入同時達(dá)到最高時所對應(yīng)的各個特征值為城市資本結(jié)構(gòu)配置最優(yōu)的條件.在進(jìn)行多目標(biāo)優(yōu)化時,需要明確多目標(biāo)的特征值與其他特征值之間的關(guān)系.基于所分析的數(shù)據(jù)邏輯關(guān)系復(fù)雜,計(jì)算量大,使用隨機(jī)森林算法可以快速、準(zhǔn)確、高效地從復(fù)雜的數(shù)據(jù)中提取出多目標(biāo)特征與其他特征值之間的關(guān)系,而粒子群算法是目前傳統(tǒng)又經(jīng)典的尋優(yōu)算法之一,將各個數(shù)據(jù)特征根據(jù)實(shí)際情況進(jìn)行條件約束,隨后利用多目標(biāo)粒子群約束優(yōu)化算法進(jìn)行尋優(yōu).多目標(biāo)粒子群約束優(yōu)化算法與隨機(jī)森林相結(jié)合的隨機(jī)森林多目標(biāo)粒子群算法,既能快速高效地得出合理方案,又減少了算法的復(fù)雜性.利用該算法可以求得最優(yōu)時各個特征的值即為城市最優(yōu)資本結(jié)構(gòu),然后根據(jù)30個城市2002~2016年間數(shù)據(jù)與城市最優(yōu)資本結(jié)構(gòu)的相關(guān)性,得出資本結(jié)構(gòu)配置相對較優(yōu)的城市及年份.
表1中列出本次試驗(yàn)數(shù)據(jù)所選取的城市、城市類別、數(shù)據(jù)年份區(qū)間、數(shù)據(jù)所用到的特征以及目標(biāo)特征.其中,城市類別1代表一線城市;類別2代表新一線城市;類別3代表二線城市;類別4代表三線城市;特征表示實(shí)驗(yàn)中選擇城市的特征值;目標(biāo)特征表示本次研究所選取的目標(biāo)方向.
表1 實(shí)驗(yàn)所選數(shù)據(jù)的結(jié)構(gòu)Tab.1 The structure of data selected for the experiment
由于需要對特征之間的關(guān)系進(jìn)行研究,所以實(shí)驗(yàn)選用兩個特征作為目標(biāo),用隨機(jī)森林進(jìn)行擬合并求得這兩個特征與其他特征之間的關(guān)系.
目前面臨的任務(wù)屬于多特征的數(shù)據(jù),因此為了進(jìn)行復(fù)雜程度較高的擬合方式,參數(shù)需要進(jìn)行一定程度的調(diào)整.隨機(jī)森林中,選擇隨機(jī)個數(shù)為10個,選擇迭代次數(shù)為1 000次,所選擇算法的最大函數(shù)評價次數(shù)均設(shè)置為240 000.粒子群優(yōu)化算法的參數(shù)設(shè)置:種群規(guī)模為50,慣性權(quán)重w隨著迭代次數(shù)從0.9至0.4線性遞減,學(xué)習(xí)因子c1與c2均為1.494 45,r1與r2每次迭代隨機(jī)取0~1的任意數(shù).
關(guān)于擬合效果如何,根據(jù)模型的決定系數(shù)(R2)和均方根誤差(RMSE)來評價模型.利用隨機(jī)森林模型擬合之后得出決定系數(shù)(R2)和均方根誤差(RMSE)分別為0.995 6和0.000 45.結(jié)果發(fā)現(xiàn),隨機(jī)森林模型可以實(shí)現(xiàn)高度的擬合.在對歷史數(shù)據(jù)進(jìn)行高度擬合之后,可以得出歷史各個特征與目標(biāo)特征之間的關(guān)系.
通過擬合效果的評價,可知隨機(jī)森林模型可以實(shí)現(xiàn)與歷史數(shù)據(jù)的高度吻合,能夠準(zhǔn)確地代表歷史中目標(biāo)特征與各個特征之間的關(guān)系.在此基礎(chǔ)上,利用多目標(biāo)粒子群約束算法尋找多個目標(biāo)特征最優(yōu)化時所對應(yīng)的各個特征之間的確定值.利用相關(guān)性函數(shù)式(2),求出最優(yōu)的解集與歷史數(shù)據(jù)的相關(guān)性系數(shù),可以得出最優(yōu)解,即設(shè)定的年份期間中最優(yōu)的城市資本結(jié)構(gòu).
(2)
式中:Cov(X,Y)為X與Y的協(xié)方差;Var[X]為X的方差;Var[Y]為Y的方差.
鑒于中國地區(qū)差異,依據(jù)第一財經(jīng)新一線城市研究所對338個地級以上城市的排名,將城市分為一線城市、新一線城市、二線城市、三線城市.其中,筆者所選用的30個城市中,一線城市有北京、廣州、上海;新一線城市有成都、杭州、濟(jì)南、昆明、南京、沈陽、天津、武漢、西安、長沙、鄭州、重慶;二線城市有福州、貴陽、哈爾濱、???、合肥、蘭州、南昌、南寧、石家莊、太原、烏魯木齊、長春;三線城市有呼和浩特、西寧、銀川[20].
3.4.1 數(shù)據(jù)為真值的結(jié)果分析
當(dāng)所有的數(shù)據(jù)使用真值進(jìn)行實(shí)驗(yàn)時,依次選用2002~2016年間全國的30個城市以及30個城市中的一線城市、新一線城市、二線城市、三線城市的數(shù)據(jù)進(jìn)行實(shí)驗(yàn).這里用熱力圖表示實(shí)驗(yàn)結(jié)果,顏色越深代表相關(guān)性越高,城市資本結(jié)構(gòu)配置越好;顏色越淺則相關(guān)性越低,城市資本結(jié)構(gòu)配置越差.
2002~2016年間全國30個城市中,城市資本結(jié)構(gòu)配置最好的是2007年西安市,相關(guān)系數(shù)為0.994 787;其次是2009年的合肥市,相關(guān)系數(shù)為0.993 822;再次為2002年的成都市,相關(guān)系數(shù)為0.990 588.將各個城市15 a綜合起來分析,全國30個城市中,城市資本結(jié)構(gòu)配置最好的是西安市,相關(guān)系數(shù)之和為14.812 322;其次是南寧市, 相關(guān)系數(shù)之和為14.765 423;再次為合肥市,相關(guān)系數(shù)之和為14.761 251.樣本城市中的一線城市資本結(jié)構(gòu)配置最好的是2002年的廣州市,相關(guān)系數(shù)為0.994 057;其次為2002年的上海市,相關(guān)系數(shù)為0.993 213;再次為2004年的北京市,相關(guān)系數(shù)為0.992 688.將各個城市15 a綜合起來分析,樣本城市中一線城市中城市資本結(jié)構(gòu)配置最好的是廣州市,相關(guān)系數(shù)之和為14.840 293;其次為北京市, 相關(guān)系數(shù)之和為14.820 292;再次為上海市,相關(guān)系數(shù)之和為14.799 533.
2002~2016年間樣本城市中的新一線城市中城市資本結(jié)構(gòu)配置最好的是2011年的沈陽市,相關(guān)系數(shù)為0.995 032;其次為2012年的西安市,相關(guān)系數(shù)為0.994 559;再次為2015年的濟(jì)南市,相關(guān)系數(shù)為0.993 296.將各個城市在2002~2016年共15 a綜合起來分析,樣本城市中新一線城市中城市資本結(jié)構(gòu)配置最好的是濟(jì)南市,相關(guān)系數(shù)之和為14.771 292;其次為重慶市,相關(guān)系數(shù)之和為14.763 693;再次為沈陽市,相關(guān)系數(shù)之和為14.760 872.
2002~2016年樣本城市中的二線城市中城市資本結(jié)構(gòu)配置最好的是2002年福州市,相關(guān)系數(shù)為0.998 697;其次為2015年的太原市,相關(guān)系數(shù)為0.998 690;再次為2009年的南昌市,相關(guān)系數(shù)為0.998 664.將各個城市在2002~2016年15 a綜合起來分析,二線城市中城市資本結(jié)構(gòu)配置最好的是??谑?,相關(guān)系數(shù)之和為14.950 136;其次為南昌市,相關(guān)系數(shù)之和為14.950 021;再次為南寧市,相關(guān)系數(shù)之和為14.948 310.
2002~2016年樣本城市中的三線城市資本結(jié)構(gòu)配置最好的是2004年銀川市,相關(guān)系數(shù)為0.999 594;其次為2006年西寧市,相關(guān)系數(shù)為0.998 408;再次為2006年呼和浩特市,相關(guān)系數(shù)為0.998 250.將各城市15 a綜合起來分析,三線城市資本結(jié)構(gòu)配置最好的是銀川市,相關(guān)系數(shù)之和為14.973 522;其次為西寧市,相關(guān)系數(shù)之和為14.969 383;再次為呼和浩特市,相關(guān)系數(shù)之和為14.968 272.
綜上所述,通過多目標(biāo)粒子群算法得出的最終結(jié)果作為最優(yōu)城市資本結(jié)構(gòu)配置.表2展示了所選數(shù)據(jù)為真值時,得出的與標(biāo)準(zhǔn)模式最接近的年份城市以及15 a綜合分析最接近標(biāo)準(zhǔn)的城市.
表2 數(shù)據(jù)為真值的實(shí)驗(yàn)結(jié)果Tab.2 The experimental result of the data being true
3.4.2 數(shù)據(jù)為增長率的結(jié)果分析
將所有的數(shù)據(jù)使用增長率時再次進(jìn)行實(shí)驗(yàn),仍舊依次選用2002~2016年15 a全國30個城市和30個城市中的一線城市、新一線城市、二線城市、三線城市的數(shù)據(jù)進(jìn)行實(shí)驗(yàn).
2002~2016年間樣本城市中城市資本結(jié)構(gòu)配置最好的是2005年的北京市,相關(guān)系數(shù)為0.992 001;其次為2011年天津市,相關(guān)系數(shù)為0.987 330;再次為2002年的濟(jì)南市,相關(guān)系數(shù)為0.982 865.將各個城市15 a綜合起來分析,樣本城市中城市資本結(jié)構(gòu)配置最好的是上海市,相關(guān)系數(shù)之和為14.553 823;其次為武漢市,相關(guān)系數(shù)之和為14.538 332;再次為北京市,相關(guān)系數(shù)之和為14.489 001.
2002~2016年間一線城市資本結(jié)構(gòu)配置最好的是2016年的上海市,相關(guān)系數(shù)為0.675 601;其次為2011年的廣州市,相關(guān)系數(shù)為0.606 031;再次為2006年的北京市,相關(guān)系數(shù)為0.536 633.將各個城市15 a綜合起來分析,樣本城市中一線城市資本結(jié)構(gòu)配置最好的是北京市,相關(guān)系數(shù)之和為3.205 879;其次為廣州市,相關(guān)系數(shù)之和為2.792 489;再次為上海市,相關(guān)系數(shù)之和為2.679 620.
2002~2016年間樣本城市中的新一線城市資本結(jié)構(gòu)配置最好的是2011年的長沙市,相關(guān)系數(shù)為0.802 936;其次為2006年的重慶市,相關(guān)系數(shù)為0.767 792;再次為2004年的西安市,相關(guān)系數(shù)為0.749 976.將各個城市15 a綜合起來分析,樣本城市中新一線城市中城市資本結(jié)構(gòu)配置最好的是長沙市,相關(guān)系數(shù)之和為3.668 056;其次為西安市,相關(guān)系數(shù)之和為2.916 951;再次為濟(jì)南市,相關(guān)系數(shù)之和為2.760 118.
2002~2016年間樣本城市中的二線城市資本結(jié)構(gòu)配置最好的是2003年的長春市,相關(guān)系數(shù)為0.785 886;其次為2007年的南昌市,相關(guān)系數(shù)為0.677 504;再次為2002年的福州市,相關(guān)系數(shù)為0.667 149.將各個城市15 a綜合起來分析,樣本城市中二線城市資本結(jié)構(gòu)配置最好的是長春市,相關(guān)系數(shù)之和為6.350 041;其次為福州市,相關(guān)系數(shù)之和為4.654 140;再次為太原市,相關(guān)系數(shù)之和為4.347 684.
2002~2016年間樣本城市中的三線城市資本結(jié)構(gòu)配置最好的是2011年西寧市,相關(guān)系數(shù)為0.700 435;其次為2010年呼和浩特市,相關(guān)系數(shù)為0.577 654;再次為2006年銀川市,相關(guān)系數(shù)為0.560 824.將各城市15 a綜合起來分析,樣本城市中三線城市資本結(jié)構(gòu)配置最好的是西寧市,相關(guān)系數(shù)之和為2.057 544;其次為呼和浩特市,相關(guān)系數(shù)之和為1.978 628;再次為銀川市,相關(guān)系數(shù)之和為1.302 793.
綜上所述,通過多目標(biāo)粒子群算法得出的最終結(jié)果作為最優(yōu)城市資本結(jié)構(gòu)配置.表3展示了當(dāng)所選數(shù)據(jù)為增長率時,得出的與標(biāo)準(zhǔn)模式最接近的年份城市和15 a綜合分析最接近標(biāo)準(zhǔn)模式的城市.
表3 數(shù)據(jù)為增長率的實(shí)驗(yàn)結(jié)果Tab.3 The experimental result of the data being growth rate
筆者將人均地區(qū)生產(chǎn)總值和城鎮(zhèn)居民可支配收入同時達(dá)到最高時所對應(yīng)的各個特征值為城市資本結(jié)構(gòu)配置最優(yōu)的條件,然后用真值數(shù)據(jù)和增長率數(shù)據(jù)分別將城市按照一線、新一線、二線、三線4類進(jìn)行劃分后,逐一分析計(jì)算出各個類型中最優(yōu)資源配置的年份和城市.無論是用真值還是增長率實(shí)驗(yàn)的結(jié)果,除了2016年的上海市之外,其余得出的最優(yōu)年份城市均在2002~2011年之間,這期間恰恰是中國經(jīng)濟(jì)持續(xù)快速發(fā)展的十年,2007年中國GDP增速最高,達(dá)到14.2%.用增長率實(shí)驗(yàn)的最優(yōu)年份城市是2005年的北京市,用真值實(shí)驗(yàn)的最優(yōu)年份城市是2007年的西安市,而西安市屬于西北地區(qū)省會城市,相對發(fā)達(dá)地區(qū)發(fā)展要滯后一些,其城市資本結(jié)構(gòu)在全國增速最高的年份趨于最優(yōu)也是合理的.用真值實(shí)驗(yàn)的15 a最接近標(biāo)準(zhǔn)模式的城市仍是西安市,用增長率實(shí)驗(yàn)的15 a最接近標(biāo)準(zhǔn)模式的城市則是上海市.此外,需要關(guān)注的城市是長沙市,不僅在2011年最接近標(biāo)準(zhǔn)模式,而且也是15 a最接近標(biāo)準(zhǔn)模式的城市.后續(xù)的研究需要進(jìn)一步針對不同城市不同發(fā)展階段深入分析其資本結(jié)構(gòu)的變化,為城市資本結(jié)構(gòu)優(yōu)化配置提供更科學(xué)的參考依據(jù).