車明亮,聶宜民,劉登民,張建華,陳紅艷,王 碩
(1.山東農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,山東 泰安,271018;2.山東省費(fèi)縣國土局,山東 費(fèi)縣,273400)
隨著社會經(jīng)濟(jì)的發(fā)展與人口增長,人類活動與土地系統(tǒng)之間的矛盾日益突出,其中耕地是土地系統(tǒng)中最基本的自然資源,是人類賴以生存的基本條件[1],耕地的數(shù)量與質(zhì)量反映了一個(gè)國家的基本國情,決定了國家的人口承載量與可持續(xù)發(fā)展能力[2],準(zhǔn)確預(yù)測未來耕地變化趨勢和數(shù)量,對政府決策具有重要的現(xiàn)實(shí)意義。根據(jù)耕地變化驅(qū)動力的相關(guān)研究文獻(xiàn)[3-6],影響耕地變化的因素很多,對應(yīng)的預(yù)測方法也有多種[7]。本文以山東省費(fèi)縣為例,在分析選擇耕地變化影響因子的基礎(chǔ)上,分別應(yīng)用改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)、灰色模型和多元線性回歸模型等方法對費(fèi)縣的耕地?cái)?shù)量變化進(jìn)行預(yù)測,并結(jié)合實(shí)地情況對預(yù)測結(jié)果進(jìn)行對比分析,以期為相關(guān)部門合理地確定耕地保有量、推進(jìn)耕地保護(hù)與可持續(xù)利用發(fā)展戰(zhàn)略提供科學(xué)依據(jù)。
費(fèi)縣地處山東省東南部沂蒙山區(qū),總面積1892.58km2,其中山丘面積占76.4%,屬于典型的山地丘陵區(qū)。費(fèi)縣耕地類型主要為旱地,占耕地總面積的67.1%,全縣水資源總量約12.3×108m3。
本文數(shù)據(jù)主要來源于《費(fèi)縣統(tǒng)計(jì)年鑒(1997—2007)》,2010年部分?jǐn)?shù)據(jù)摘自《費(fèi)縣國民經(jīng)濟(jì)和社會發(fā)展第十一個(gè)五年規(guī)劃綱要》,其他數(shù)據(jù)均通過數(shù)學(xué)模型計(jì)算得出。本文研究所用方法主要是改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法、灰色模型和多元線性回歸模型法;在耕地變化影響因子分析中使用了Pearson相關(guān)分析法;最后總結(jié)不同預(yù)測方法的預(yù)測精度及其優(yōu)缺點(diǎn)。
本研究在參照前人研究的基礎(chǔ)上[3-6],結(jié)合新一輪土地利用總體規(guī)劃實(shí)踐,選取可能對耕地變化產(chǎn)生影響的因素作為備選因子,然后利用Pearson相關(guān)分析對各項(xiàng)備選因子進(jìn)行篩選,提取出影響耕地變化的關(guān)鍵性因子。
通過分析費(fèi)縣歷年耕地變化情況,從時(shí)間因素、人口因素、社會經(jīng)濟(jì)因素、氣候因素和檢測條件等方面確定其影響因子,主要包括:時(shí)間序列(X1,年),年末總?cè)丝冢╔2,人),國民生產(chǎn)總值(X3,108元),國內(nèi)生產(chǎn)總值(X4,108元),農(nóng)林牧漁總產(chǎn)值(X5,108元),農(nóng)業(yè)機(jī)械總動力(X6,108W),工業(yè)總產(chǎn)值(X7,108元),建筑業(yè)總產(chǎn)值(X8,108元),全社會固定資產(chǎn)投資(X9,108元),地方財(cái)政預(yù)算收入(X10,108元),公路通車?yán)锍蹋╔11,hm2),農(nóng)民人均純收入(X12,元),糧食產(chǎn)量(X13,104t),化肥折純用量(X14,t),農(nóng)作物播種面積(X15,103hm2),糧食作物播種面積(X16,103hm2),有效灌溉面積(X17,103hm2),全年平均降雨量(X18,mm),平均氣溫(X19,℃),平均風(fēng)速(X20,m/s),耕地面積(Y,hm2)。共計(jì)20個(gè)自變量,1個(gè)因變量。
為降低計(jì)算量和保持計(jì)算精度,對備選因子降維處理,即對耕地變化影響較大的因子進(jìn)行保留,反之則剔除。
2.2.1 用Pearson相關(guān)系數(shù)篩選關(guān)鍵因子 Pearson相關(guān)系數(shù)是通過兩個(gè)觀察樣本的協(xié)方差與各自標(biāo)準(zhǔn)差的比值來衡量彼此的線性密切程度。本文在計(jì)算相關(guān)系數(shù)時(shí),為了消除由于不同量綱所造成的因素之間可比性差的影響,對原始數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化處理,最終經(jīng)計(jì)算后的耕地與備選因子的相關(guān)系數(shù)見表1。
對Pearson相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn)是計(jì)算t統(tǒng)計(jì)值,取置信水平α=0.05,自由度f=9,則臨界值R=0.6021,國民生產(chǎn)總值(X3),國內(nèi)生產(chǎn)總值(X4),農(nóng)民人均純收入(X12),時(shí)間序列(X1),農(nóng)業(yè)機(jī)械總動力(X6),工業(yè)總產(chǎn)值(X7),全社會固定資產(chǎn)投資(X9),農(nóng)林牧漁總產(chǎn)值(X5),公路通車?yán)锍蹋╔11),年末總?cè)丝冢╔2),地方財(cái)政預(yù)算內(nèi)收入(X10),農(nóng)作物播種面積(X15),糧食作物播種面積(X16)在該置信水平下均通過檢驗(yàn),即與耕地(Y)關(guān)系顯著。
2.2.2 檢驗(yàn)結(jié)果分析 從上述結(jié)果來看,經(jīng)濟(jì)發(fā)展是影響費(fèi)縣耕地變化的主要因素,包括:國民生產(chǎn)總值,國內(nèi)生產(chǎn)總值,農(nóng)林牧漁總產(chǎn)值,工業(yè)總產(chǎn)值,全社會固定資產(chǎn)投資,地方財(cái)政預(yù)算內(nèi)收入和農(nóng)民人均純收入。其次是時(shí)間序列和人口變化因素,時(shí)間變化對耕地變化的影響也很大,這是因?yàn)樯鐣⒆匀恍袨楫a(chǎn)生的影響通常具有慣性(時(shí)間持續(xù)性),此外土地系統(tǒng)主要受人類活動影響,所以人口因素對耕地變化也具有較大的影響。最后是農(nóng)業(yè)、科技因素,包括農(nóng)業(yè)機(jī)械總動力,公路通車?yán)锍?,農(nóng)作物播種面積和糧食作物播種面積,農(nóng)業(yè)科技的發(fā)展對耕地變化的影響也較大。氣候因素、建筑業(yè)的發(fā)展、糧食產(chǎn)量以及化肥折純用量等因素對費(fèi)縣耕地的變化影響較小,這是由于費(fèi)縣屬于山區(qū)丘陵地帶,耕地的主要類型為旱地。
表1 耕地與備選因子的Pearson相關(guān)系數(shù)Tab.1 Pearson correlation coefficients of cultivated land and potential factors
根據(jù)上述結(jié)果,最終選擇時(shí)間序列、年末總?cè)丝?、國民生產(chǎn)總值、國內(nèi)生產(chǎn)總值、農(nóng)民人均純收入、農(nóng)業(yè)機(jī)械總動力、工業(yè)總產(chǎn)值、全社會固定資產(chǎn)投資、農(nóng)林牧漁總產(chǎn)值、公路通車?yán)锍?、地方?cái)政預(yù)算內(nèi)收入、農(nóng)作物播種面積、糧食作物播種面積共計(jì)13個(gè)變量作為耕地變化的自變量。
本文選取了13個(gè)自變量和1個(gè)因變量,自變量與因變量之間的映射關(guān)系難以明確,且部分自變量之間存在較強(qiáng)的線性相關(guān)關(guān)系,并存在著測量誤差,這些因素都會對預(yù)測的結(jié)果造成影響。針對測量數(shù)據(jù)本身的特點(diǎn),本文分別使用了BP神經(jīng)網(wǎng)絡(luò)算法、灰色模型和多元線性回歸模型對耕地?cái)?shù)量變化進(jìn)行了預(yù)測。
本文統(tǒng)計(jì)了費(fèi)縣自1997—2007年期間的相關(guān)數(shù)據(jù),為了預(yù)測費(fèi)縣2010年和2015年的應(yīng)變量耕地值,還需準(zhǔn)備這兩年的自變量數(shù)據(jù)。根據(jù)《費(fèi)縣國民經(jīng)濟(jì)和社會發(fā)展第十一個(gè)五年規(guī)劃綱要》的相關(guān)預(yù)定目標(biāo)可以獲得費(fèi)縣2010年的總?cè)丝跀?shù)、國內(nèi)生產(chǎn)總值、農(nóng)民人均純收入和地方財(cái)政預(yù)算內(nèi)收入等自變量值,剩下的自變量可由時(shí)間序列模型、多元線性回歸模型和灰色模型預(yù)測得出,預(yù)測值均通過系數(shù)檢驗(yàn)。
BP算法也表現(xiàn)出學(xué)習(xí)速度慢和容易陷入局部極小困境的不足,為了減少BP算法容易陷入局部極小值的可能,提高收斂速度,本文采用改進(jìn)的BP算法——動量法來實(shí)現(xiàn),修正BP算法的權(quán)值變化形式如下:
式1中,μ為動量因子;η為學(xué)習(xí)效率;E為誤差函數(shù);權(quán)值Vkj和閾值T[α或β]的修正類同。
3.2.2 模型結(jié)構(gòu)及預(yù)測結(jié)果 本文采用的動量法BP算法模型屬于三層前向神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。根據(jù)經(jīng)驗(yàn)[7-11]及多次實(shí)驗(yàn)結(jié)果的穩(wěn)定性,確定模型結(jié)構(gòu)及參數(shù)如下:輸入層神經(jīng)元個(gè)數(shù)設(shè)為n1=11,隱層神經(jīng)元個(gè)數(shù)設(shè)為n2=26,輸出層神經(jīng)元個(gè)數(shù)設(shè)為n3=1;迭代次數(shù)設(shè)為t=2000;動量因子設(shè)為μ=0.62;學(xué)習(xí)效率設(shè)為η=0.05;輸入層與隱層之間的激勵函數(shù)為曲線函數(shù)tansig();隱層與輸出層之間的激勵函數(shù)為曲線函數(shù)tansig();輸出層到外界值的映射函數(shù)為線性函數(shù)purelin();訓(xùn)練函數(shù)使用帶動量的批處理梯度下降函數(shù)traingdm()。約束條件設(shè)定為:誤差精度為ε=1e-5;每年的擬合值與真實(shí)值的殘差項(xiàng)r≤100hm2;用2007年的真實(shí)值來驗(yàn)證訓(xùn)練好的BP網(wǎng)絡(luò)的預(yù)測值,誤差項(xiàng)err≤100hm2。
BP算法的學(xué)習(xí)效果受網(wǎng)絡(luò)初始狀態(tài)影響較大,不好的選擇權(quán)值系數(shù)會導(dǎo)致網(wǎng)絡(luò)中神經(jīng)元進(jìn)入飽和,即誤差變化量較小,神經(jīng)元調(diào)節(jié)作用不明顯,為了避免這種情況及提高BP網(wǎng)絡(luò)的收斂速度,可選擇較小范圍內(nèi),比如[-1,1]區(qū)間內(nèi)均勻分布的隨機(jī)數(shù)來初始化網(wǎng)絡(luò)權(quán)值。同時(shí)為了消除樣本數(shù)據(jù)之間數(shù)量級的差異性,需要將樣本數(shù)據(jù)進(jìn)行歸一化處理,本文使用最大最小值方法,即:
然后,用BP網(wǎng)絡(luò)對1997—2006年樣本數(shù)據(jù)進(jìn)行訓(xùn)練,當(dāng)BP網(wǎng)絡(luò)收斂速度趨于穩(wěn)定,BP算法滿足設(shè)定的約束條件時(shí),網(wǎng)絡(luò)停止訓(xùn)練。
由于BP網(wǎng)絡(luò)權(quán)值初始化的隨機(jī)性,使得網(wǎng)絡(luò)訓(xùn)練權(quán)值陣和閾值陣具有不穩(wěn)定性,訓(xùn)練好的BP網(wǎng)絡(luò)并不唯一,預(yù)測值出現(xiàn)波動性。在滿足上述約束條件下,對2010年和2015年耕地面積預(yù)測值分別進(jìn)行100次的樣本采集,通過數(shù)據(jù)分布檢驗(yàn),發(fā)現(xiàn)預(yù)測值樣本均呈現(xiàn)正態(tài)分布(圖1、圖2),因此可用樣本的期望值作為預(yù)測值,2010年費(fèi)縣耕地預(yù)測值為74951.24hm2,置信度為95%的置信區(qū)間為[73912.79,75989.21];2015年耕地預(yù)測值為74225.51hm2,置信度為95%的置信區(qū)間為[72987.10,75464.89]。
圖1 2010年耕地面積預(yù)測值采樣直方圖Fig.1 The histogram of cultivated land area prediction results in 2010
圖2 2015年耕地面積預(yù)測值采樣直方圖Fig.2 The histogram of cultivated land area prediction results in 2015
3.3.2 預(yù)測結(jié)果 通過GM(1,1)模型對訓(xùn)練數(shù)據(jù)集1997—2007年耕地面積值進(jìn)行預(yù)測,經(jīng)過2次殘差序列分析,其小誤差概率P=0.9899和方差比C=0.3243均通過檢驗(yàn),得到迭代公式:X(2)(t+1)=127055.3738e0.021675t+(-124079.2498),其中t值在1997年取0,1998年取1,依次類推,最終得到費(fèi)縣2010年耕地面積為75196.98hm2,2015年耕地面積為83766.84hm2。
3.4.2 預(yù)測結(jié)果 由于樣本數(shù)據(jù)之間存在多重共線性,不能直接使用多元線性回歸[12],可通過主成分分析[13]將樣本自變量數(shù)據(jù)進(jìn)行降維處理,從而減少樣本之間的相關(guān)性。經(jīng)過主成分分析之后,根據(jù)樣本相關(guān)矩陣的特征值及其貢獻(xiàn)率提取累計(jì)貢獻(xiàn)率達(dá)到符合要求的主成分變量,對提取后的主成分變量進(jìn)行多元線性回歸方程擬合,回歸系數(shù)均通過置信水平為0.05的檢驗(yàn)。費(fèi)縣2010年耕地面積為74503.84hm2,置信度為95%的置信區(qū)間為[67319.49,81688.19];2015年耕地面積為81907.18hm2,置信度為95%的置信區(qū)間為[72263.91,91550.45]。
(1)從表2不同模型預(yù)測結(jié)果和殘差對比中,可以看出BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度最高,相比多元線性回歸模型和灰色模型,殘差標(biāo)準(zhǔn)差最小,而且BP神經(jīng)網(wǎng)絡(luò)擬合歷史數(shù)據(jù)每年的殘差絕對值均小于100hm2,相比另外兩種模型預(yù)測效果更好。
(2)根據(jù)不同預(yù)測方法的預(yù)測值置信區(qū)間的對比,BP神經(jīng)網(wǎng)絡(luò)預(yù)測值的置信區(qū)間的長度較小,這表明BP神經(jīng)網(wǎng)絡(luò)比多元線性回歸模型具有更好的實(shí)際指導(dǎo)意義。
(3)1997—2007年數(shù)據(jù)摘自統(tǒng)計(jì)年鑒,難免存在噪聲,盡管耕地面積總體呈上升趨勢,但耕地?cái)?shù)量的變化存在“尖點(diǎn)”,使得耕地預(yù)測存在困難。從表2中可以看出多元線性回歸預(yù)測值在2000—2003年以及2007年距離實(shí)際值偏差均很大,灰色模型預(yù)測值在2001—2006年距離實(shí)際值偏差也比較大,在此期間BP神經(jīng)網(wǎng)絡(luò)預(yù)測效果較好,表明BP神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)存在噪聲時(shí),相比多元線性回歸模型和灰色模型具備較高的預(yù)測精度。
從預(yù)測結(jié)果的對比分析中,可以看出BP神經(jīng)網(wǎng)絡(luò)相對傳統(tǒng)的多元線性回歸模型和灰色模型等預(yù)測方法具備較高的預(yù)測精度和較好的實(shí)際指導(dǎo)意義。
從預(yù)測模型原理來看,灰色模型預(yù)測基于自身變量的差分規(guī)律進(jìn)行自回歸,一般適用于對數(shù)據(jù)趨勢作初步分析,在數(shù)據(jù)存在偽趨勢下,其預(yù)測結(jié)果距離真實(shí)值差距較大,而且灰色模型預(yù)測只考慮了變量本身,沒有考慮其他相關(guān)變量對該變量的影響,其預(yù)測結(jié)果難以讓人信服;多元線性回歸模型是利用回歸方程進(jìn)行最小二乘擬合,在具體應(yīng)用的同時(shí)需滿足其基本假設(shè)條件,比如要求自變量無多重共線性,而一般的社會經(jīng)濟(jì)變量之間往往是相關(guān)的,此外社會經(jīng)濟(jì)變量常帶有噪聲,使得利用多元線性回歸模型具有一定的難度,很容易出現(xiàn)偽回歸現(xiàn)象;而BP神經(jīng)網(wǎng)絡(luò)屬于啟發(fā)式搜索算法,具備較強(qiáng)的學(xué)習(xí)性和自適應(yīng)性,特別是它的黑箱機(jī)制適于處理因變量與自變量之間難以確定映射關(guān)系,以及自變量存在噪聲問題,在技術(shù)上和結(jié)果上具有先進(jìn)性。但也有其不足之處:(1)使用監(jiān)督學(xué)習(xí)方式,在滿足設(shè)定的約束條件下,訓(xùn)練好的BP網(wǎng)絡(luò)不唯一,導(dǎo)致輸出結(jié)果具有波動性,但大量的數(shù)據(jù)統(tǒng)計(jì)呈現(xiàn)穩(wěn)定性的正態(tài)分布;(2)神經(jīng)網(wǎng)絡(luò)的隱層神經(jīng)元個(gè)數(shù)的設(shè)定沒有明確的標(biāo)準(zhǔn),不合適的神經(jīng)元個(gè)數(shù)容易導(dǎo)致輸出值不穩(wěn)定或容易陷入局部極小值,目前只能憑借經(jīng)驗(yàn)或?qū)嶒?yàn)進(jìn)行調(diào)整;(3)盡管本文使用改進(jìn)的BP算法——動量法,但實(shí)驗(yàn)時(shí),還是表現(xiàn)出學(xué)習(xí)進(jìn)入平緩區(qū),因此可將神經(jīng)網(wǎng)絡(luò)與其他優(yōu)化算法(比如遺傳算法)結(jié)合,以改善神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率和收斂速度。
表2 不同預(yù)測方法的預(yù)測結(jié)果對比 單位:hm2Tab.2 Results comparison of different predictingmethods unit:hm2
(References):
[1]鄒玉川.全國耕地保護(hù)工作全書[M].北京:中國農(nóng)業(yè)科學(xué)技術(shù)出版社,2002.
[2]李平,李秀斌,劉學(xué)軍.我國現(xiàn)階段土地利用變化驅(qū)動力的宏觀分析[J].地理研究,2001,20(2):129-138.
[3]曹銀貴,袁春.中國耕地變化的驅(qū)動因子及其省域差異分析[J].中國土地科學(xué),2008,22(2):17-22.
[4]黃秀欣,張基凱,徐儀紅.山東省耕地?cái)?shù)量變化及驅(qū)動力分析[J].山東國土資源,2009,25(4):33-37.
[5]夏淑芳,許紅衛(wèi),王珂,等.浙江省耕地?cái)?shù)量演變及其驅(qū)動力研究[J].科技通報(bào),2006,22(3):345-351.
[6]陳利根,龍開勝.耕地資源數(shù)量與經(jīng)濟(jì)發(fā)展的計(jì)量分析[J].中國土地科學(xué),2007,21(4):5-10.
[7]徐建華.現(xiàn)代地理學(xué)中的數(shù)學(xué)方法[M].北京:高等教育出版社,2006.
[8]刑文訓(xùn),謝金星.現(xiàn)代優(yōu)化計(jì)算方法[M].北京:清華大學(xué)出版社,2007.
[9]Martin T.Hagan,Howard B.Dcmuth,Mark Beale.Neural Network Design[M].北京:機(jī)械工業(yè)出版社,2002.
[10]夏定純,徐濤.計(jì)算智能[M].北京:科學(xué)出版社,2008.
[11]飛思科技.神經(jīng)網(wǎng)絡(luò)理論與MATLAB 7實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2005.
[12]龐皓.計(jì)量經(jīng)濟(jì)學(xué)[M].北京:科學(xué)出版社,2007.
[13]范金成,梅長林.數(shù)據(jù)分析[M].北京:科學(xué)出版社,2009.