蔡曉倩, 林 翊
(福建師范大學(xué) 經(jīng)濟學(xué)院, 福州 350108)
對福建省海洋經(jīng)濟發(fā)展進(jìn)行綜合評估分析,探究海洋經(jīng)濟發(fā)展的總體情況和內(nèi)部各子系統(tǒng)之間的關(guān)系,并進(jìn)一步探索海洋經(jīng)濟發(fā)展的主要驅(qū)動因素,將有助于準(zhǔn)確把握海洋經(jīng)濟的可持續(xù)發(fā)展?fàn)顟B(tài)。
目前學(xué)術(shù)界對海洋經(jīng)濟發(fā)展水平的研究通常采用主客觀賦權(quán)評價法來對構(gòu)建的綜合指數(shù)進(jìn)行度量與分析,如魯亞運等[1]的信息熵權(quán)法、Song等[2]的德爾菲法、朱堅真崔曦文[3]的TOPSIS熵權(quán)法、趙暉等[4]的層次分析法以及程曼曼等[5]的全局熵權(quán)法,然而海洋經(jīng)濟發(fā)展綜合指數(shù)編制過程中指標(biāo)之間往往存在多重共線性問題,且海洋經(jīng)濟發(fā)展同評價指標(biāo)之間通常存在復(fù)雜的非線性關(guān)系,簡單地使用線性模型去構(gòu)建發(fā)展指數(shù)可能無法客觀地反映實際經(jīng)濟規(guī)律。值得關(guān)注的是,隨著大數(shù)據(jù)時代的到來,機器學(xué)習(xí)中很多算法能夠很好地克服回歸過程中的非線性問題[6],但已有的文獻(xiàn)僅限于在回歸模型中去尋找指標(biāo)與構(gòu)造的線性指數(shù)的擬合關(guān)系[7-9],根源上還是沒有消除綜合指數(shù)的共線性問題。
基于此,從四個方面進(jìn)行探索:①為了避免綜合指數(shù)編制過程中存在的共線性問題,區(qū)別于以往普遍將融合的綜合指數(shù)作為被解釋變量進(jìn)行分析,直接將海洋GDP作為被解釋變量來反映福建省海洋經(jīng)濟發(fā)展水平。②借鑒《福建省“十四五”海洋強省建設(shè)專項規(guī)劃》中的子系統(tǒng)設(shè)置,從6個維度來評估福建省海洋經(jīng)濟發(fā)展水平,并借助隨機森林算法來規(guī)避指標(biāo)間的多重共線性問題。此外,通過該算法進(jìn)一步測算出評價體系中各指標(biāo)的貢獻(xiàn)度,以此來探索福建省海洋經(jīng)濟發(fā)展的驅(qū)動因素。③區(qū)別于常用的線性回歸模型,借助4種多層感知機模型來驗證并擬合不同貢獻(xiàn)度閾值下篩選出來的評價指標(biāo)與海洋經(jīng)濟發(fā)展水平之間的非線性關(guān)系,由此可以得到更為科學(xué)合理的福建省海洋經(jīng)濟發(fā)展評估體系。④借助實證結(jié)果對福建省海洋經(jīng)發(fā)展驅(qū)動因素進(jìn)行更深層次的分析,對發(fā)展的薄弱環(huán)節(jié)提出對策建議,以促進(jìn)福建省海洋經(jīng)濟綜合實力的進(jìn)一步提升。
指標(biāo)選擇將遵循綜合指標(biāo)體系構(gòu)建原則[10],基于《福建省“十四五”海洋強省建設(shè)專項規(guī)劃》中的子系統(tǒng)設(shè)置,依據(jù)目的性、完備性、可操作性、顯著性與動態(tài)性的設(shè)計原則,進(jìn)一步從海洋科技創(chuàng)新、海洋對外開放、海洋產(chǎn)業(yè)體系、海洋生態(tài)環(huán)境、海洋基礎(chǔ)設(shè)施以及海洋社會民生6個層面(系統(tǒng)層)來評估福建省海洋經(jīng)濟發(fā)展水平。構(gòu)建的初始海洋經(jīng)濟發(fā)展評價指標(biāo)體系如表1所示。
1.2.1 數(shù)據(jù)來源
數(shù)據(jù)主要來源于2006—2019年《中國海洋統(tǒng)計年鑒》《中國能源統(tǒng)計年鑒》《福建省統(tǒng)計年鑒》《福建省國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》《中國港口統(tǒng)計年鑒》以及福建省文化和旅游廳等相關(guān)資料。其中,缺失數(shù)據(jù)通過K近鄰算法處理,即將數(shù)據(jù)集合中每一個記錄進(jìn)行分類,最后通過K近鄰算法訓(xùn)練模型預(yù)估缺失值。
1.2.2 訓(xùn)練集與測試集劃分
基于矢量均值相似性的樣本分割法,提出了一種適用于回歸任務(wù)的樣本集分解方法,可以在劃分訓(xùn)練集和測試集時使得兩者在統(tǒng)計意義上保持一致性。
第一步:假設(shè)采集到的樣本集為D={(x1,y1),(x2,y2),…,(xm,ym)},其中yi為第i個樣本的被解釋變量(因變量GDP),m為樣本數(shù)。
1.2.3 數(shù)據(jù)標(biāo)準(zhǔn)化處理
為消除數(shù)據(jù)中不同代謝指標(biāo)的量綱和值域差異,使用Z-score標(biāo)準(zhǔn)化方法處理,使指標(biāo)數(shù)據(jù)在0與1之間取值。
(1)
隨機森林(random forest,RF)是由Breiman于2001年提出的一種監(jiān)督學(xué)習(xí)算法[11]。實際應(yīng)用中,RF結(jié)合了多個決策樹基學(xué)習(xí)器,借助于集成學(xué)習(xí)方法來為復(fù)雜的分類與回歸問題提供解決方案,且通常具有如下優(yōu)點:在許多主流公共數(shù)據(jù)集上,相對其他算法RF顯示了較好的性能;RF并不需要通過降維方式來處理高維數(shù)據(jù)的多重共線性問題,訓(xùn)練完成后,可以輸出每個特征的重要度;RF對泛化誤差(generalization error)使用的是無偏估計,模型泛化能力強,訓(xùn)練速度快,較易實現(xiàn)并行化處理方法。隨機森林回歸流程如圖1所示。
圖1 隨機森林特征變量貢獻(xiàn)率計算流程
多層感知機(multilayer perceptrons,MLP)主要由輸入層,隱藏層和輸出層構(gòu)成,且不同層之間是全連接的。MLP網(wǎng)絡(luò)結(jié)合梯度下降算法,通過多輪的前向和反向傳播過程實現(xiàn)參數(shù)(權(quán)值、閾值與偏置項)的更新,且對任何連續(xù)非線性結(jié)構(gòu)函數(shù)都具有較好的擬合效果。采用Kolmogorov定理[12]來確定網(wǎng)絡(luò)結(jié)構(gòu)。該定理指出給定任一連續(xù)函數(shù)F:Ud→He,即F(X)=Y,其中U為閉區(qū)間[0,1],那么F可以精確地用一個三層前向網(wǎng)絡(luò)實現(xiàn)。此網(wǎng)絡(luò)的輸入層有q個神經(jīng)元,隱層有2q+1個神經(jīng)元,輸出層有1個神經(jīng)元,如圖2所示。
圖2 多層感知器回歸結(jié)構(gòu)
多層感知機建模流程如下:
首先,將輸入解釋變量提供給輸入層神經(jīng)元,然后將信號逐層向前傳,直到輸出層產(chǎn)生預(yù)測結(jié)果。
其次,計算輸出層的均方誤差,再將誤差逆向傳播至隱層神經(jīng)元,然后根據(jù)隱層神經(jīng)元的誤差來對連接權(quán)和閾值進(jìn)行優(yōu)化(學(xué)習(xí)率設(shè)置為η=0.1)。
最后,該迭代過程循環(huán)進(jìn)行,直到累計均方誤差E<ε(ε=0.1)為止,最終產(chǎn)生的最優(yōu)化連接權(quán)與閾值構(gòu)成了非線性回歸函數(shù)的系數(shù)。
使用福建省海洋GDP作為隨機森林算法中的目標(biāo)值,并運用隨機森林算法對所有數(shù)據(jù)進(jìn)行訓(xùn)練,隨機森林的一個重要功能是測算特征變量的重要度,度量單個特征的重要度主要是通過計算變更該特征排序后整個森林袋外數(shù)據(jù)[13](out of bag,OOB)均方誤差均值[OOBMSE(Xjpermuted)]與不變更該特征排序整個森林OOB均方誤差均值(OOBMSE)的差值來衡量的,即OOBMSE(Xjpermuted)-OOBMSE,詳細(xì)表達(dá)式如下:
(2)
(3)
當(dāng)特定變量Xj的重要性越大,則其求出來的OOBMSEt(Xjpermuted)-OOBMSEt的差就越大。通過Python仿真可知最優(yōu)(袋外誤差最小)決策樹數(shù)量為39,如圖3所示。
圖3 OOB袋外數(shù)據(jù)錯誤率估計
在最優(yōu)決策樹數(shù)量下測算出各指標(biāo)的貢獻(xiàn)度,如表2所示。
表2 指標(biāo)貢獻(xiàn)度
從表2可以看出,由隨機森林算法訓(xùn)練出來的指標(biāo)貢獻(xiàn)度有較大差別。從單個指標(biāo)貢獻(xiàn)度排序來看,排名前5的分別是海洋產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化規(guī)模(X24)、國際旅游外匯收入(X26)、海洋產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型升級規(guī)模(X23)、人均海水產(chǎn)品產(chǎn)量(X42)和接待入境游客人數(shù)外國人(X30),其中指標(biāo)X24和X23屬于海洋產(chǎn)業(yè)體系系統(tǒng),總貢獻(xiàn)率為16.97%,指標(biāo)X26和X30屬于對外開放系統(tǒng),總貢獻(xiàn)率為15.02%,指標(biāo)X42屬于社會民生系統(tǒng),貢獻(xiàn)率為6.11%。由此可以看出,海洋產(chǎn)業(yè)結(jié)構(gòu)、海洋對外開放和社會民生對福建省海洋經(jīng)濟發(fā)展發(fā)揮著重要推動作用。從指標(biāo)體系系統(tǒng)層來看,當(dāng)閾值設(shè)定為0.01(貢獻(xiàn)度大于1%)時篩選出來的指標(biāo)體系為科技創(chuàng)新系統(tǒng)(X2、X5、X7、X8合計貢獻(xiàn)15.10%)(X12、X17、X18合計貢獻(xiàn)7.03%)、產(chǎn)業(yè)體系系統(tǒng)(X23、X24合計貢獻(xiàn)16.97%)、對外開放系統(tǒng)(X26、X27、X29、X30合計貢獻(xiàn)18.43%)、基礎(chǔ)設(shè)施系統(tǒng)(X32、X33、X34、X35、X37、X38、X39合計貢獻(xiàn)23.00%)和社會民生系統(tǒng)(X40、X41、X42合計貢獻(xiàn)13.13%);當(dāng)閾值設(shè)定為0.02(貢獻(xiàn)度大于2%)時篩選出來的指標(biāo)體系為科技創(chuàng)新系統(tǒng)(X2、X5、X7、X8合計貢獻(xiàn)15.10%)、生態(tài)環(huán)境系統(tǒng)(X12、X17合計貢獻(xiàn)5.97%)、產(chǎn)業(yè)體系系統(tǒng)(X23、X24合計貢獻(xiàn)16.97%)、對外開放系統(tǒng)(X26、X29、X30合計貢獻(xiàn)17.29%)、基礎(chǔ)設(shè)施系統(tǒng)(X32、X33、X34、X35、X38、X39合計貢獻(xiàn)21.83%)和社會民生系統(tǒng)(X40、X41、X42合計貢獻(xiàn)13.13%);閾值為0.03(貢獻(xiàn)度大于3%)時篩選出來的指標(biāo)體系為科技創(chuàng)新系統(tǒng)(X7、X8合計貢獻(xiàn)9.99%)、生態(tài)環(huán)境系統(tǒng)(X17合計貢獻(xiàn)3.16%)、產(chǎn)業(yè)體系系統(tǒng)(X23、X24合計貢獻(xiàn)16.97%)、對外開放系統(tǒng)(X26、X30合計貢獻(xiàn)15.01%)、基礎(chǔ)設(shè)施系統(tǒng)(X32、X34、X39合計貢獻(xiàn)13.67%)和社會民生系統(tǒng)(X41、X42合計貢獻(xiàn)10.55%)。
考慮到回歸問題中可能存在的非線性問題,將采用4種(identity激活、relu激活函數(shù)、sigmoid激活和tanh激活)多層感知機網(wǎng)絡(luò)來進(jìn)一步驗證篩選出來的指標(biāo)體系合理性。其中,隨機森林算法的閾值分別設(shè)定為0.01、0.02和0.03。此外,為了更直觀地看出訓(xùn)練過程是否存在過擬合問題,將訓(xùn)練集以及測試集的衡量指標(biāo)進(jìn)行了分開度量。驗證結(jié)果表3所示。
表3 多層感知機網(wǎng)絡(luò)驗證回歸結(jié)果比較
由表3可知:①不同閾值下 identity激活函數(shù)的擬合性能基本都能達(dá)到最優(yōu),擬合優(yōu)度最高能達(dá)到0.99,這驗證了篩選出來的評價指標(biāo)與實際海洋經(jīng)濟發(fā)展存在非線性關(guān)系,且表明了非線性感知機網(wǎng)絡(luò)具備良好的擬合效果;②比較不同激活函數(shù)在貢獻(xiàn)度大于1%、2%和3%指標(biāo)體系中測試集的均方誤差(MSE)、平均絕對誤差(MAE)和擬合優(yōu)度(R2)可知,貢獻(xiàn)度大于3%的指標(biāo)體系擬合結(jié)果最好,說明隨機森林算法按照閾值為0.03時選出來的指標(biāo)體系對福建省海洋經(jīng)濟發(fā)展水平具有較強的解釋能力;③相同閾值相同激活函數(shù)下訓(xùn)練集與測試集在同一度量指標(biāo)的差距并不大,進(jìn)一步驗證了感知機網(wǎng)絡(luò)模型沒有出現(xiàn)過擬合問題。
由表2與表3可知,當(dāng)設(shè)定閾值為0.03時,篩選出來的指標(biāo)體系中科技創(chuàng)新系統(tǒng)貢獻(xiàn)率為9.987 3%、生態(tài)環(huán)境系統(tǒng)貢獻(xiàn)率為3.157 9%、產(chǎn)業(yè)體系系統(tǒng)貢獻(xiàn)率為16.972 4%、對外開放系統(tǒng)貢獻(xiàn)率為15.014 7%、基礎(chǔ)設(shè)施系統(tǒng)貢獻(xiàn)率為13.668 2%以及社會民生系統(tǒng)貢獻(xiàn)率為10.548 7%。從各子系統(tǒng)的貢獻(xiàn)度看,產(chǎn)業(yè)體系系統(tǒng)、對外開放系統(tǒng)和基礎(chǔ)設(shè)施系統(tǒng)對福建省海洋經(jīng)濟發(fā)展水平具有較大的貢獻(xiàn),其次是社會民生系統(tǒng)和科技創(chuàng)新系統(tǒng),最后是生態(tài)環(huán)境系統(tǒng),這也間接表明了福建省海洋經(jīng)濟的發(fā)展在科技創(chuàng)新與生態(tài)環(huán)保上存在明顯的短板效應(yīng)。從各子系統(tǒng)的核心驅(qū)動因素看,指標(biāo)X24(海洋產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化規(guī)模)在產(chǎn)業(yè)體系系統(tǒng)中發(fā)揮著主要驅(qū)動作用,指標(biāo)X26(國際旅游外匯收入)是對外開放系統(tǒng)主要驅(qū)動因素,指標(biāo)X32、X34和X39(分別是鐵路運營密度、港口生產(chǎn)用碼頭泊位和移動電話基站)均對基礎(chǔ)設(shè)施系統(tǒng)產(chǎn)生重要的推動作用,指標(biāo)X42(人均海水產(chǎn)品產(chǎn)量)是社會民生系統(tǒng)的驅(qū)動因素,指標(biāo)X7、X8(海洋相關(guān)畢業(yè)生人數(shù)(專科及以上)和科研機構(gòu)中研究生以上學(xué)歷人員占比)是科技創(chuàng)新系統(tǒng)的主要動力因素和指標(biāo)X17(海洋自然保護區(qū)面積比重)是生態(tài)環(huán)境中最重要的影響因素,在實際經(jīng)濟活動與政策制定中,可以著重觀察這些指標(biāo)的動態(tài)變化情況。
為分析福建省海洋經(jīng)濟發(fā)展水平,尋找福建省海洋經(jīng)濟發(fā)展的驅(qū)動因素,依據(jù)評價指標(biāo)的構(gòu)建原則,在借鑒前人的研究的基礎(chǔ)上,構(gòu)建了6個子系統(tǒng)42個指標(biāo)的福建省海洋經(jīng)濟發(fā)展水平初始評價模型。首先,通過袋外數(shù)據(jù)誤差率尋找到最優(yōu)決策樹數(shù)量,并運用隨機森林算法對初始評價體系進(jìn)行測算,規(guī)避了指標(biāo)之間存在的共線性問題,統(tǒng)計計算后進(jìn)一步得到了福建省海洋經(jīng)濟發(fā)展在各個子系統(tǒng)中的主要驅(qū)動因素以及各子系統(tǒng)的貢獻(xiàn)度。接著,依據(jù)不同的貢獻(xiàn)度閾值(0.01、0.02和0.03)篩選出了3種不同的海洋經(jīng)濟評價指標(biāo)體系。隨后,借助4種多層感知機網(wǎng)絡(luò)對篩選出來的評價體系進(jìn)行回歸擬合,驗證了指標(biāo)與經(jīng)濟發(fā)展水平之間的非線性關(guān)系,且得出了貢獻(xiàn)度閾值為0.03時的指標(biāo)評價體系能夠更好地詮釋福建省海洋經(jīng)濟的發(fā)展?fàn)顩r。
上述實證結(jié)果表明,福建省海洋科技創(chuàng)新系統(tǒng)和海洋生態(tài)環(huán)境系統(tǒng)存在明顯的短板效應(yīng),由此提出如下的建議。
1)針對福建省海洋科技創(chuàng)新水平較低問題。一是打造良好的科技創(chuàng)新環(huán)境。從省、企、校三方同時推進(jìn),加快建設(shè)海洋領(lǐng)域省創(chuàng)新實驗室,鼓勵與支持涉海企業(yè)與“一帶一路”沿岸國家或地區(qū)企業(yè)共建聯(lián)合共建科技創(chuàng)新平臺,推進(jìn)廈門大學(xué)、福州大學(xué)和福建師范大學(xué)等高校涉海實驗室建設(shè)。二是解決海洋人才引進(jìn)和培養(yǎng)問題。鼓勵和引導(dǎo)涉海企業(yè)及高校等平臺引進(jìn)海洋領(lǐng)域的高層次人才,集中力量支持福建省現(xiàn)有涉海專業(yè)的發(fā)展,支持各高校做強涉海學(xué)科。三是發(fā)揮政府的主導(dǎo)作用。完善并出臺人才引培、科研項目資金支出等相關(guān)政策措施,提升科研成果的轉(zhuǎn)化率。如山東省對海洋領(lǐng)域擁有關(guān)鍵核心技術(shù)、全職引進(jìn)的海外頂尖人才團隊,省級財政給予最高5 000萬元綜合資助或6 000萬元直投股權(quán)投資支持。
2)針對福建省海洋生態(tài)環(huán)境水平較低問題。一是鼓勵漁業(yè)從捕撈和養(yǎng)殖并舉向養(yǎng)殖為主轉(zhuǎn)型。漁業(yè)的過渡捕撈,使得近海的漁業(yè)資源已幾乎枯竭,漁民作業(yè)的范圍逐漸向遠(yuǎn)洋靠攏,對漁業(yè)資源的生態(tài)鏈條產(chǎn)生了巨大的影響。二是加快推進(jìn)新型海洋環(huán)境監(jiān)測設(shè)施的完善。利用當(dāng)前的大數(shù)據(jù)、5G、云計算等先進(jìn)數(shù)字技術(shù),推動環(huán)保數(shù)字產(chǎn)業(yè)化,建立安全、高效的海洋環(huán)境監(jiān)測體系,進(jìn)一步加強對沿海地區(qū)的固廢處理、環(huán)境修復(fù)和環(huán)境監(jiān)測,進(jìn)而達(dá)到保護海洋生態(tài)環(huán)境的目的。三是加強政府的法治監(jiān)管力度。圍繞海洋保護地建立、日常管護、科研監(jiān)測等工作,加快出臺海洋保護地管理的相關(guān)法律法規(guī)和制度規(guī)章,使海洋保護地的管理有法可依、有章可循,預(yù)防出現(xiàn)“建而不管,管而不力”的情形。