王志煒,魏 宇,李靈敏,朱曉偉
(山東省國土空間生態(tài)修復(fù)中心,山東 濟(jì)南 250014)
建設(shè)用地需求預(yù)測(cè)是土地需求預(yù)測(cè)過程中的重要步驟,科學(xué)精確的建設(shè)用地需求預(yù)測(cè)是提高國土空間規(guī)劃科學(xué)性與準(zhǔn)確性的核心。在當(dāng)前建設(shè)用地需求預(yù)測(cè)研究領(lǐng)域,能夠應(yīng)用的模型較多,但系統(tǒng)的方法比較研究較少,研究?jī)?nèi)容也不夠全面,有待于進(jìn)一步地發(fā)掘研究,以支撐土地規(guī)劃管理的預(yù)測(cè)模型選擇。因此,通過對(duì)多種建設(shè)用地需求預(yù)測(cè)模型進(jìn)行比較,篩選得到最優(yōu)的建設(shè)用地預(yù)測(cè)模型,在空間規(guī)劃研究中提供理論技術(shù)支撐具有重要意義。
當(dāng)前,國內(nèi)外對(duì)建設(shè)用地需求預(yù)測(cè)的方法主要包括基于GIS的CBR模型[1]、CA模型[2]、馬爾柯夫鏈模型[3]、多元統(tǒng)計(jì)模型[4]、系統(tǒng)動(dòng)力學(xué)模型[5, 6]、灰色預(yù)測(cè)(GM(1,1))模型[7]以及BP神經(jīng)網(wǎng)絡(luò)模型[8]等。在這些方法中,CBR模型多直接使用或者進(jìn)行地理現(xiàn)象的簡(jiǎn)單空間特征合并,較少處理復(fù)雜的地理問題;CA模型需要土地利用變化的先前數(shù)據(jù)[9];馬爾柯夫鏈模型較少應(yīng)用于大尺度空間預(yù)測(cè)并只能應(yīng)用于短期預(yù)測(cè)[10];多元統(tǒng)計(jì)回歸顯著性檢驗(yàn)無法明確表明土地利用變化與因素之間存在明顯的關(guān)聯(lián),數(shù)量數(shù)據(jù)無法與空間關(guān)系對(duì)應(yīng)聯(lián)系起來[6];系統(tǒng)動(dòng)力學(xué)模型雖然可以對(duì)土地利用變化進(jìn)行一定的解釋,但存在規(guī)模效應(yīng)不能納入模型之中的問題[11];灰色預(yù)測(cè)模型處理樣本數(shù)據(jù)低隨機(jī)性問題時(shí)存在較大誤差[12];BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行非線性逼近時(shí)具有良好的性能,但存在學(xué)習(xí)速率不高以及調(diào)整參數(shù)困難的問題[13]。不難看出,目前所采用的預(yù)測(cè)模型各有利弊,需要進(jìn)一步綜合比較得出高精度的預(yù)測(cè)模型,同時(shí)模型缺乏改進(jìn),需要進(jìn)行優(yōu)化。
本文選擇三類GM(1,1)模型、Lasso回歸耦合OLS模型、PCA-BP神經(jīng)網(wǎng)絡(luò)模型、系統(tǒng)動(dòng)力學(xué)模型等4種預(yù)測(cè)模型,以山東省為例,進(jìn)行建設(shè)用地需求預(yù)測(cè)。在滿足模型應(yīng)用條件的前提下,通過對(duì)比不同模型的擬合數(shù)據(jù)與原數(shù)據(jù)的誤差相對(duì)百分比確定模型預(yù)測(cè)可行度,再根據(jù)相關(guān)指標(biāo)如平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)以及平均預(yù)測(cè)精度(R)等進(jìn)行精度評(píng)價(jià)確定最優(yōu)預(yù)測(cè)模型的預(yù)測(cè),最后從模型改進(jìn)情況、數(shù)據(jù)利用形式、數(shù)據(jù)獲取難易度、預(yù)測(cè)過程難易度和模型適用條件等5個(gè)方面對(duì)建設(shè)用地需求預(yù)測(cè)模型進(jìn)行綜合比較。
本文所用數(shù)據(jù)來源于《中國統(tǒng)計(jì)年鑒》(2009~2018年)《山東省統(tǒng)計(jì)年鑒》(2009~2018年)《山東省十六地市的統(tǒng)計(jì)年鑒》(2009~2018年)以及《山東省國民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)》(2009~2018年)。根據(jù)研究目的以及相關(guān)文獻(xiàn)[4, 14, 15],選取GDP、第一產(chǎn)業(yè)增加值、第二產(chǎn)業(yè)增加值、第三產(chǎn)業(yè)增加值、工業(yè)增加值、人均地區(qū)生產(chǎn)總值、總?cè)丝跀?shù)、農(nóng)村人口數(shù)、城鎮(zhèn)人口數(shù)、城鎮(zhèn)化率、固定資產(chǎn)投資、一般公共預(yù)算收入、城鎮(zhèn)居民可支配收入、農(nóng)村居民可支配收入、建筑業(yè)生產(chǎn)總值以及建設(shè)用地總面積等16個(gè)指標(biāo)。
2.2.1 GM(1,1)模型
GM(1,1)模型是在原始非負(fù)離散數(shù)據(jù)基礎(chǔ)上,經(jīng)過一次累加得到隨機(jī)性被削弱的新離散數(shù)據(jù)列,并建立微分方程模型,在離散點(diǎn)處經(jīng)累減處理得到原始數(shù)據(jù)近似估計(jì)值,進(jìn)而得到數(shù)據(jù)預(yù)測(cè)結(jié)果。單變量灰色預(yù)測(cè)模型包含三類:傳統(tǒng)GM(1,1)模型、新信息GM(1,1)模型和新陳代謝GM(1,1)模型,三者計(jì)算公式均一致,不同的是對(duì)原數(shù)據(jù)序列的處理方式,新信息GM(1,1)模型將預(yù)測(cè)得到的新數(shù)據(jù)加入原始數(shù)據(jù)序列末端形成新原始序列進(jìn)行預(yù)測(cè),新陳代謝GM(1,1)模型則是將預(yù)測(cè)得到的新數(shù)據(jù)加入原數(shù)據(jù)列末端的同時(shí),將原數(shù)據(jù)的首個(gè)數(shù)據(jù)剔除形成新數(shù)據(jù)序列,從而進(jìn)行預(yù)測(cè)。
GM(1,1)模型計(jì)算公式[16]:
(1)
2.2.2 Lasso回歸耦合OLS模型
Lasso回歸模型通過加入懲罰項(xiàng)的方式使不重要因素的回歸系數(shù)壓縮至0[17],由于Lasso回歸模型存在一定估計(jì)偏差,于是利用最小二乘法(OLS)對(duì)Lasso回歸模型篩選出的變量進(jìn)行無偏估計(jì),從而獲得更好的模型概化和預(yù)測(cè)精度。
Lasso回歸模型計(jì)算公式[18]:
LReg(β)=Lols(β)+λP(β)
(2)
式(2)中,LReg(β)表示加入懲罰項(xiàng)的損失函數(shù),Lols(β)表示標(biāo)準(zhǔn)OLS損失函數(shù),λ(≥0)表示調(diào)整參數(shù),P(β)表示懲罰函數(shù)。λ控制回歸系數(shù)的壓縮程度,數(shù)值越大控制力越強(qiáng),即懲罰強(qiáng)度越大。當(dāng)λ=0時(shí),LReg(β)為OLS損失函數(shù)。
2.2.3PCA-BP神經(jīng)網(wǎng)絡(luò)模型
2.2.3.1灰色關(guān)聯(lián)分析
采用多因素統(tǒng)計(jì)的新方法—灰色關(guān)聯(lián)分析(GRA),GRA能夠較好地對(duì)數(shù)據(jù)進(jìn)行相關(guān)性的篩選,并在一定程度上彌補(bǔ)回歸相關(guān)方法帶來的不足。
GRA計(jì)算公式[4]:
(1)數(shù)據(jù)變換:
參考數(shù)列:x0=(x0(1),x0(2),x0(3)),…,x0(n)
比較數(shù)列:xi=(xi(1),xi(2),xi(3)),…,xi(n);i=(1,2,…,n)
(2)關(guān)聯(lián)系數(shù)計(jì)算:
(3)
式(3)中,loi(k)為k時(shí)刻兩比較序列的絕對(duì)差,Δmin和Δmin分別為比較序列各個(gè)時(shí)刻絕對(duì)差的最小值和最大值。ρ為分辨系數(shù),一般情況下取0.5。
(3)關(guān)聯(lián)度計(jì)算:
(4)
式(4)中,roi為子序列與母序列關(guān)聯(lián)度;N為比較數(shù)列的長度。
2.2.3.2 BP神經(jīng)網(wǎng)絡(luò)模型
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程包括前向和后向傳播兩部分。在前向傳輸?shù)那闆r下,輸入信息由輸入層處理到隱含層,再傳輸?shù)捷敵鰧?。下層神?jīng)元的參數(shù)收到上層神經(jīng)元影響。當(dāng)輸出層的輸出值不符合預(yù)期期望時(shí),則信號(hào)進(jìn)行反向傳播,在返回過程中,每層神經(jīng)元的權(quán)值等參數(shù)被逐步修改。這個(gè)過程反復(fù)迭代,直到信號(hào)誤差達(dá)到允許的范圍。計(jì)算步驟為[19, 20]:
設(shè)置各權(quán)值或閾值的初始值wji,bj。
選擇訓(xùn)練樣本,輸入向量P=(p1,p2…pR),期望輸出向量T=(t1,t2…tR),對(duì)每個(gè)輸入樣本進(jìn)行后續(xù)的迭代;
計(jì)算網(wǎng)絡(luò)的實(shí)際輸出以及隱含層的狀態(tài):
(5)
式(5)中,akj表示第k個(gè)樣本在第j層的輸出;wji表示第j層和第i層的連接權(quán)值;aki表示第k個(gè)樣本在第i層的輸出;bj表示第j層的閾值。
誤差計(jì)算:
δkj=akj(1-akj)(tkj-akj)(當(dāng)j為輸出層時(shí))
(6)
δkj=akj(1-akj)∑mδkmωmj)(當(dāng)j為隱含層時(shí))
(7)
權(quán)值和閾值的修正:
ωji(t+1)=ωji(t)+ηδjaki+α[ωji(t)-ωji(t-1)]
(8)
bj(t+1)=bj(t)+ηδj+α[bj(t)-bj(t-1)]
(9)
當(dāng)k每經(jīng)歷1~p后,根據(jù)是否達(dá)到要求進(jìn)行判斷,滿足則算法停止。
2.2.4 系統(tǒng)動(dòng)力學(xué)模型
系統(tǒng)動(dòng)力學(xué)(System Dynamics, SD)是一門以系統(tǒng)反饋控制理論為基礎(chǔ),以計(jì)算機(jī)仿真技術(shù)為主要手段,定量地研究系統(tǒng)發(fā)展動(dòng)態(tài)行為的一門應(yīng)用學(xué)科,適合于模擬真實(shí)世界非線性變化過程,土地利用系統(tǒng)是一個(gè)相互影響、相互作用的非線性變化系統(tǒng)。因此,利用系統(tǒng)動(dòng)力學(xué)原理,構(gòu)建土地利用模型,對(duì)山東省建設(shè)用地面積的預(yù)測(cè)較為客觀。
以建設(shè)用地需求量(2009~2018年)為原始數(shù)據(jù),運(yùn)用Matlab2016軟件,首先進(jìn)行準(zhǔn)指數(shù)規(guī)律檢驗(yàn):光滑比小于0.5的數(shù)據(jù)占比為77.7778%,除去前2個(gè)時(shí)期外,光滑比小于0.5的數(shù)據(jù)占比為100%,準(zhǔn)指數(shù)規(guī)律檢驗(yàn)通過。建立傳統(tǒng)GM(1,1)模型、新信息GM(1,1)模型以及新陳代謝GM(1,1)模型,以2016、2017和2018年數(shù)據(jù)作為實(shí)驗(yàn)組,通過比較SSE數(shù)值(表1),選擇新陳代謝GM(1,1)模型進(jìn)行擬合(式10),得到均方差比值(C)為0.0652,小誤差概率(P)為1,后驗(yàn)差檢驗(yàn)通過,平均相對(duì)殘差0.0018,平均級(jí)比偏差0.0024,殘差檢驗(yàn)與級(jí)比偏差檢驗(yàn)表明模型精度較高,可以進(jìn)行建設(shè)用地需求預(yù)測(cè)。
表1 模型參數(shù)
新陳代謝GM(1,1)模型方程:
-216059514.386163
(10)
依據(jù)選取的16個(gè)指標(biāo)數(shù)據(jù),運(yùn)用Stata15.0,首先對(duì)樣本進(jìn)行Zscore標(biāo)準(zhǔn)化處理,再對(duì)處理后的變量進(jìn)行Lasso回歸,種子數(shù)選取1000,依據(jù)交叉驗(yàn)證的方法[18],選取純均方誤差(MSPE)最小處的(Lambda)值(表2),篩選得到GDP(X1)、人均地區(qū)生產(chǎn)總值(X2)、城鎮(zhèn)人口數(shù)(X3)和農(nóng)村居民可支配收入(X4)等四種變量,應(yīng)用SPSS進(jìn)行分析,經(jīng)OLS處理,得到建設(shè)用地需求回歸預(yù)測(cè)方程(式11),F(xiàn)檢驗(yàn)sig值為0,表明檢驗(yàn)通過,方程可以進(jìn)行建設(shè)用地需求預(yù)測(cè)。
表2 Lasso回歸調(diào)整系數(shù)
Lasso回歸擬合方程:
Y=0.7293237X1-0.4323353X2+0.1701092X3
+0.5419265X4-0.0000014
(11)
(1)灰色關(guān)聯(lián)分析。應(yīng)用Matlab2016軟件,通過編寫代碼,將建設(shè)用地面積與GDP(X1)、第一產(chǎn)業(yè)增加值(X2)、第二產(chǎn)業(yè)增加值(X3)、第三產(chǎn)業(yè)增加值(X4)、工業(yè)增加值(X5)、人均地區(qū)生產(chǎn)總值(X6)、總?cè)丝跀?shù)(X7)、農(nóng)村人口數(shù)(X8)、城鎮(zhèn)人口數(shù)(X9)、城鎮(zhèn)化率(X10)、固定資產(chǎn)投資(X11)、一般公共預(yù)算收入(X12)、城鎮(zhèn)居民可支配收入(X13)、農(nóng)村居民可支配收入(X14)、建筑業(yè)生產(chǎn)總值(X15)等做灰色關(guān)聯(lián)分析,根據(jù)分析結(jié)果(表3),選取灰色關(guān)聯(lián)度大于0.6的因子。
(2)因子預(yù)測(cè)。應(yīng)用Matlab2016軟件,對(duì)因子數(shù)據(jù)進(jìn)行函數(shù)擬合,經(jīng)過RMSE對(duì)比,選取最適合的因子數(shù)據(jù)擬合方程(表4),根據(jù)擬合方程進(jìn)行數(shù)據(jù)預(yù)測(cè),得到2028年9個(gè)影響因子的數(shù)據(jù)。
(3)主成分分析(PCA)。依據(jù)灰色關(guān)聯(lián)分析通過的數(shù)據(jù),應(yīng)用Matlab2016進(jìn)行主成分分析,達(dá)到因子降維和去除共線性的作用,選取PC1到PC3等3個(gè)主成分,累計(jì)貢獻(xiàn)率為99.02%,符合大于85%的規(guī)定,結(jié)合因子預(yù)測(cè)數(shù)據(jù)得出主成分得分值,并進(jìn)行歸一化處理(表5)。
(4)BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建。運(yùn)用Matlab2016軟件,選取輸入層的節(jié)點(diǎn)為3,建設(shè)用地總面積作為輸出樣本,輸出層的節(jié)點(diǎn)為1,隱含層的節(jié)點(diǎn)為10,學(xué)習(xí)速度為0.01,選取2015和2016年數(shù)據(jù)作為驗(yàn)證集,其他數(shù)據(jù)作為訓(xùn)練集,運(yùn)用trainlm函數(shù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,最終模型訓(xùn)練誤差值為,可以用于預(yù)測(cè)。
表3 城鎮(zhèn)建設(shè)用地與社會(huì)經(jīng)濟(jì)指標(biāo)的灰色關(guān)聯(lián)度
(1)系統(tǒng)邊界分析。在已有研究的基礎(chǔ)上,借鑒周楊慧設(shè)定的系統(tǒng)動(dòng)力學(xué)(system dynamics,簡(jiǎn)稱SD)模型[21],考慮數(shù)據(jù)的可獲得性、可操作性及代表性等原則,參考上述數(shù)據(jù),確立了人口、經(jīng)濟(jì)、建設(shè)用地、農(nóng)用地、生態(tài)用地這五個(gè)子系統(tǒng),其中人口和經(jīng)濟(jì)為輸入子系統(tǒng),而建設(shè)用地、農(nóng)用地、生態(tài)用地則作為輸出子系統(tǒng),用于考察目標(biāo)的表現(xiàn)形式(圖1)。
表4 因子擬合方程
表5 歸一化樣本值
(2)存量流量圖的構(gòu)建。 存量流量圖用直觀的符號(hào)刻畫系統(tǒng)要素之間的邏輯關(guān)系,明確系統(tǒng)的反饋形式和控制規(guī)律,區(qū)分變量性質(zhì),將變量直接的反饋關(guān)系進(jìn)行量化。圖2為本文系統(tǒng)動(dòng)力學(xué)模型的存量流量圖。圖中建設(shè)用地包括交通用地、水利設(shè)施用地、城鎮(zhèn)村及工礦用地,其中,GDP的增長速度和人口的增加可以增大建設(shè)用地面積,從而影響土地系統(tǒng)。
(3)參數(shù)設(shè)置。 模型以2019年為基年,逐年預(yù)測(cè)直至2028年的情況,其中2009~2018年為模型運(yùn)行和實(shí)際情況的檢驗(yàn)?zāi)晗?,以此可確定相關(guān)參數(shù);2019~2028年為系統(tǒng)仿真的預(yù)測(cè)年限,模型仿真步長為1年,將2013年的價(jià)格視為基期,將各年的GDP數(shù)據(jù)進(jìn)行換算以剔除價(jià)格因素變動(dòng)的影響。模型先后進(jìn)行了直觀檢驗(yàn)、穩(wěn)定性檢驗(yàn)、靈敏度檢驗(yàn)和歷史性檢驗(yàn)。歷史值與仿真值也存在相同的變化趨勢(shì),且誤差不超過5%,表明模型擬合度較高,模型能較準(zhǔn)確地反映實(shí)際研究的系統(tǒng)狀況,因而可以進(jìn)行下一階段的預(yù)測(cè)。
圖1 土地利用系統(tǒng)的理論模型
圖2 土地利用系統(tǒng)動(dòng)力學(xué)模型
精度評(píng)價(jià)采用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均預(yù)測(cè)精度(R)進(jìn)行分析(式12,13,14)。
(12)
(13)
(14)
以樣本實(shí)際建設(shè)用地面積值與不同模型的擬合值為基礎(chǔ),建立平面直角坐標(biāo)系,如圖3所示,樣本點(diǎn)與直線y=x的距離的遠(yuǎn)近,反映了模型預(yù)測(cè)誤差的大小。由圖3可知,上述4個(gè)模型擬合參數(shù)R2均大于0.99且模型預(yù)測(cè)誤差百分比均在5%以內(nèi)(表6),表明4種模型擬合效果均較好,進(jìn)一步用MAE、RMSE和R來篩選模型精度(表7)。在誤差方面,PCA-BP神經(jīng)網(wǎng)絡(luò)模型MAE(2842.74)、RMSE(5655.43)最小,在預(yù)測(cè)精度方面,PCA-BP神經(jīng)網(wǎng)絡(luò)模型R(99.90)最高,因此可知PCA-BP神經(jīng)網(wǎng)絡(luò)可作為該面板數(shù)據(jù)下最優(yōu)的預(yù)測(cè)模型,從而計(jì)算出2028年山東省建設(shè)用地需求量為3063042.75 hm2,相較2018年增長了143646.50 hm2,年均增加14364.65 hm2,年均增長率為0.54%。
表6 模型擬合誤差相對(duì)百分比情況
表7 模型精度比較情況
4.2.1 模型優(yōu)化情況
從模型優(yōu)化情況來看,GM(1,1)模型在原始數(shù)據(jù)列的處理上衍生出3種GM(1,1)模型,3種模型橫向?qū)Ρ龋岣吡藗鹘y(tǒng)GM(1,1)模型的預(yù)測(cè)精度,擴(kuò)展了GM(1,1)模型內(nèi)容并提高了精度;Lasso回歸模型作為新型高效有偏估計(jì)模型,用于處理多元回歸分析中因子多重共線性的問題,利用OLS進(jìn)行耦合,在保證變量篩選的情況下進(jìn)行無偏估計(jì),解決了回歸分析中因子多重共線性問題的同時(shí),減少了Lasso回歸模型有偏估計(jì)帶來的誤差;PCA-BP神經(jīng)網(wǎng)絡(luò)模型既滿足了BP神經(jīng)網(wǎng)絡(luò)模型輸入數(shù)據(jù)的歸一化的條件限制,又對(duì)原始數(shù)據(jù)進(jìn)行了預(yù)處理提高了BP神經(jīng)網(wǎng)絡(luò)的運(yùn)行速度和預(yù)測(cè)精度;系統(tǒng)動(dòng)力學(xué)模型增加了生態(tài)環(huán)境質(zhì)量作為GDP增長的約束,使得模型更貼近于現(xiàn)實(shí),可方便靈活地進(jìn)行決策模擬和多方案的比較。
4.2.2 數(shù)據(jù)利用形式
從數(shù)據(jù)利用形式來看,GM(1,1)模型利用累加產(chǎn)生新的數(shù)據(jù)序列建立模型,以減少原始數(shù)據(jù)的噪聲和波動(dòng)性,在新序列中找尋數(shù)據(jù)變化規(guī)律,不使用原始數(shù)據(jù);Lasso回歸耦合OLS模型和系統(tǒng)動(dòng)力學(xué)模型則利用原始數(shù)據(jù)直接建模;PCA-BP神經(jīng)網(wǎng)絡(luò)模型則對(duì)原始數(shù)據(jù)進(jìn)行灰色關(guān)聯(lián)篩選后,計(jì)算原數(shù)據(jù)的主成分得分作為變量歸一化后作為變量輸入,也不直接使用原始數(shù)據(jù)。
4.2.3 數(shù)據(jù)獲取難易度
從數(shù)據(jù)獲取過程來看,Lasso回歸耦合OLS模型、PCA-BP神經(jīng)網(wǎng)絡(luò)模型以及系統(tǒng)動(dòng)力學(xué)模型均考慮了社會(huì)經(jīng)濟(jì)與人文因素對(duì)建設(shè)用地總量的影響,在進(jìn)行建模分析之前均需對(duì)數(shù)據(jù)進(jìn)行相關(guān)性或驅(qū)動(dòng)力分析,需要?dú)v史數(shù)據(jù)較為充分,3種模型對(duì)數(shù)據(jù)獲取難度較大;GM(1,1)模型只對(duì)預(yù)測(cè)因子原始數(shù)據(jù)序列進(jìn)行累加處理,無需考慮其他因子的影響,只需收集近期數(shù)據(jù)即可,數(shù)據(jù)獲取難度較小。
圖3 樣本的實(shí)際面積與模型擬合值
4.2.4 預(yù)測(cè)過程難易度
從預(yù)測(cè)過程來看,GM(1,1)模型需要利用MATLAB進(jìn)行編程建立3種GM(1,1)模型,并對(duì)其進(jìn)行比較分析;Lasso回歸耦合OLS模型需要利用Stata進(jìn)行簡(jiǎn)單編程,再利用SPSS進(jìn)行應(yīng)用OLS進(jìn)行處理分析;PCA-BP神經(jīng)網(wǎng)絡(luò)模型需要利用Matlab編程進(jìn)行灰色關(guān)聯(lián)、主成分分析、BP神經(jīng)網(wǎng)絡(luò)建模、參數(shù)設(shè)定、樣本訓(xùn)練以及結(jié)果預(yù)測(cè);系統(tǒng)動(dòng)力學(xué)則需要用Vensim軟件進(jìn)行系統(tǒng)仿真模擬,確定系統(tǒng)邊界,構(gòu)建系統(tǒng)的存量流量圖,檢驗(yàn)?zāi)P偷臏?zhǔn)確性,最后設(shè)置不同的情景進(jìn)行仿真模擬。因此預(yù)測(cè)過程難易度由小到大依次為Lasso回歸耦合OLS模型、GM(1,1)模型、系統(tǒng)動(dòng)力學(xué)模型和PCA-BP神經(jīng)網(wǎng)絡(luò)模型。
4.2.5 模型適用條件
結(jié)合圖4、表6、表7以及綜合以上方面的模型分析可知,GM(1,1)模型適用于小樣本、數(shù)據(jù)不充分和歷史數(shù)據(jù)波動(dòng)較大的建設(shè)用地需求量預(yù)測(cè);Lasso回歸耦合OLS模型適用于原始數(shù)據(jù)所受影響的因素較多且目標(biāo)數(shù)據(jù)隨時(shí)間變化趨勢(shì)一致,數(shù)據(jù)波動(dòng)性不大的建設(shè)用地需求量預(yù)測(cè);PCA-BP神經(jīng)網(wǎng)絡(luò)適用于歷史數(shù)據(jù)波動(dòng)性變化復(fù)雜、目標(biāo)所受影響的因素較多、對(duì)預(yù)測(cè)精度以及誤差有要求的建設(shè)用地需求量預(yù)測(cè);系統(tǒng)動(dòng)力學(xué)適用于解決復(fù)雜系統(tǒng)的結(jié)構(gòu)功能協(xié)調(diào)和研究中長期系統(tǒng)動(dòng)態(tài)發(fā)展預(yù)測(cè)。
(1)進(jìn)行建設(shè)用地需求預(yù)測(cè)時(shí),應(yīng)結(jié)合所需或已有的數(shù)據(jù)特點(diǎn)和收集難度選擇不同模型;在滿足數(shù)據(jù)要求的支持下,選擇多種模型進(jìn)行預(yù)測(cè),應(yīng)從多方面考慮,對(duì)不同預(yù)測(cè)模型進(jìn)行誤差和精度綜合比較,從而選取精度較高的預(yù)測(cè)模型;在進(jìn)行建設(shè)用地需求預(yù)測(cè)模型比較時(shí),所考慮的方面應(yīng)至少包括數(shù)據(jù)利用形式、數(shù)據(jù)獲取難易度、預(yù)測(cè)過程難易度、模型精度評(píng)價(jià)和模型適用條件等5個(gè)方面進(jìn)行綜合考量和比較,為土地資源的可持續(xù)利用和國土空間合理規(guī)劃提供基礎(chǔ)和保障。
(2)為更好地進(jìn)行結(jié)果預(yù)測(cè),在已有的模型研究的基礎(chǔ)上進(jìn)行適當(dāng)改進(jìn),綜合利用4種優(yōu)化模型進(jìn)行研究和討論,誤差百分比均小于5%,模型擬合參數(shù)R2均大于0.99,表明4種模型均達(dá)到了較好的擬合效果,結(jié)合MSE、RMSE以及R的比較后得出PCA-BP神經(jīng)網(wǎng)絡(luò)模型為該面板數(shù)據(jù)條件下的最優(yōu)預(yù)測(cè)模型,可作為山東省建設(shè)用地需求量預(yù)測(cè)模型。
(3)本文以山東省為例,參考了2009~2018年的相關(guān)統(tǒng)計(jì)數(shù)據(jù),利用PCA-BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行分析和預(yù)測(cè),得到2028年建設(shè)用地需求量為3063042.75 hm2,相較2018年增長了143646.50 hm2,年均增加14364.65 hm2,年均增長率為0.54%,為土地規(guī)劃和經(jīng)濟(jì)發(fā)展提供科學(xué)參考依據(jù)。
(4)本文嘗試將Lasso回歸模型應(yīng)用到建設(shè)用地需求預(yù)測(cè)領(lǐng)域,為提高預(yù)測(cè)精度進(jìn)一步與OLS耦合從而達(dá)到無偏估計(jì)的目的,也取得了較為理想的效果,對(duì)于Lasso回歸模型能否進(jìn)一步優(yōu)化和擴(kuò)展應(yīng)用場(chǎng)景有待于進(jìn)一步的研究;BP神經(jīng)網(wǎng)絡(luò)不需要進(jìn)行關(guān)系設(shè)定即可進(jìn)行模型模擬,模型的適應(yīng)性較強(qiáng),收斂速度也存在著一定的限制,有待于進(jìn)一步地優(yōu)化;系統(tǒng)動(dòng)力學(xué)模型在誤差允許范圍之內(nèi)的前提下,模型擬合情況并不樂觀,由于系統(tǒng)是一個(gè)復(fù)雜且綜合的體系,需要進(jìn)一步探索優(yōu)化的條件以提高模型精度。