陳亦新 鄢冉
隨著社會的發(fā)展,人們改造自然,利用自然的能力和效率不斷提高。本研究的目的是為了探討自然和人類活動對人們生產的影響??紤]到自然的數(shù)據(jù)是非線性的,傳統(tǒng)的辨識系統(tǒng)的方法就無能為力了,這時候我們選擇更穩(wěn)定的神經網(wǎng)絡模型。
一、數(shù)據(jù)來源
數(shù)據(jù)來源于“中國統(tǒng)計局”和“中國氣象數(shù)據(jù)網(wǎng)”。
從“中國統(tǒng)計局”中獲取了河南省和四川省的第一產業(yè)增加值和財政支農支出;從“中國氣象數(shù)據(jù)網(wǎng)”中獲得了全國824個氣象站點的日均氣溫、降水量、光照時長等月度數(shù)據(jù)。
由于第一產業(yè)對自然的依賴相比其他兩個產業(yè)來說更顯著一些,決定將研究對象定為對氣象最為敏感的第一產業(yè)。
自然對生產的影響最普遍的就是通過氣象來影響。所以本研究中用年均氣溫(℃),年均降水(mm),年均光照時長(h)來表示自然的數(shù)據(jù)。
人類活動數(shù)據(jù)使用該省份財政支農支出的數(shù)據(jù)??紤]到財政對農業(yè)的投入不能第一時間轉化為實際的增加值,再加上所能獲取到的支農支出的統(tǒng)計年份的限制,將滯后年份設置為4年,即現(xiàn)在的投入會對四年后的第一產業(yè)增加值產生最顯著的影響。
二、數(shù)據(jù)處理
因為氣象數(shù)據(jù)是月數(shù)據(jù),所以我們首先需要將月數(shù)據(jù)轉化成年數(shù)據(jù)。轉化方式如下:首先找出研究省份內的所有氣象點,因為氣象點的數(shù)量可能會有波動,河南省內大約有11個氣象點,四川省內大約有17個氣象點。將這些氣象點的數(shù)據(jù)提取出來,然后相加求和再除以氣象點數(shù)量和月份的乘積,得到省份的年均氣象數(shù)據(jù)。
(一)BP神經網(wǎng)絡介紹
Back propagation神經網(wǎng)絡是1986年被提出的,是一種按照誤差逆向傳播算法訓練的多層前饋神經網(wǎng)絡,也是目前應用最廣泛的神經網(wǎng)絡。
人工神經網(wǎng)絡不需要事先確定輸入輸出映射關系的方程,而且通過隨機數(shù)確定權矩陣,然后通過輸入訓練集,來訓練網(wǎng)絡,訓練之后,使用時候,用事先確定好的預測集進行預測檢驗?;舅枷刖褪翘荻认陆捣?,利用梯度搜索技術,是神經網(wǎng)絡的實際輸出值和期望輸出值之間的誤差均方差為最小。
我們把對Matlab中的輸入的數(shù)據(jù)看成神經細胞的輸入信號,然后每一個都會乘上一個權值w_ij,然后求和。但是以上這些只是線性變化,為了達到非線性的目的,我們將處理過的結果,又做為新的輸入輸給別的神經元,很多這樣的神經元就構成了神經網(wǎng)絡。
但是BP神經網(wǎng)絡是具有一定缺陷的。首先就是存在麻痹現(xiàn)象,由于優(yōu)化的目標函數(shù)很復雜,必然會在神經元輸出接近0或者1的時候,出現(xiàn)一些平坦區(qū),使得權值的變化極小,使訓練過程停止。其次是BP算法是一種局部搜索的優(yōu)化方法,很可能陷入局部極值導致訓練失敗。
(二)設計思路及代碼解釋
1、設計思路
使用matlab引用Excel表格中的數(shù)據(jù)。
對引入數(shù)據(jù)進行處理,把月度數(shù)據(jù)轉化成年度數(shù)據(jù)。
對所有數(shù)據(jù)進行歸一化。
創(chuàng)建神經網(wǎng)絡。
使用數(shù)據(jù)訓練神經網(wǎng)絡。
檢驗神經網(wǎng)絡,并且作圖。檢驗分為三部,只用氣象數(shù)據(jù)進行訓練;只用支農支出數(shù)據(jù)進行訓練;同時使用氣象數(shù)據(jù)和支農支出數(shù)據(jù)訓練。通過計算結果的均方差來判斷擬合效果。
2、代碼解釋
xlsread(‘SiChuanData.xlsx)引用名為‘SiChuangData的Excel中的數(shù)據(jù),切記目前matlab還不支持.xls后綴的Excel文件。
[inputn,inputs]=mapminmax(input)是歸一化函數(shù),input是原序列,然后inputn是歸一化之后的數(shù)列,inputs是歸一化的結構和方法。稍后可以利用inputs進行反歸一化mapminmax(‘reverse,歸一化數(shù)據(jù),歸一化結構)。
newff(inputn,output,10)是創(chuàng)建只有一個有10個神經元的隱含層神經網(wǎng)絡。
trainParam是可以更改創(chuàng)建的神經網(wǎng)絡的屬性的?!?epochs是迭代次數(shù);‘.lr是學習速率;.goal是目標誤差;‘.max_fail是連續(xù)進行了未能減少誤差的迭代就終止訓練的最大迭代次數(shù)。
train(net,inputn,outputn)是對net神經網(wǎng)絡進行訓練。
(三)運行結果及分析
1、運行結果
2、結果分析
(1)雖然每一次運行神經網(wǎng)絡的結果都是不一樣的(因為初始的權矩陣是隨機的),但是經過20次的運行,可以發(fā)現(xiàn)無論是四川省還是河南省,都是支農支出加上氣象數(shù)據(jù)得到的擬合效果最好,均方差也最小。然而稍微對比一下finance和meteorology的圖像,不看看出,氣象的變化對于第一產業(yè)增加值的影響遠遠小于支農支出的影響。但是可以在一定程度上,彌補支農支出的均方差,更好的解釋一下第一產業(yè)增加值的在增長大趨勢下的細微波動。
(2)財政支農支出與第一產業(yè)增加值呈現(xiàn)同步的持續(xù)增長,而且近年來財政支農支出占財政支出的比重不斷增加,這也體現(xiàn)了人們對第一產業(yè)的重視和影響力的提升,這也意味著削弱了氣象的隨機性變化對第一產業(yè)的影響。
(3)基于劉宏杰2008年中國財政支農支出對第一產業(yè)增加值的影響的研究結論,中國財政支農支出對產業(yè)的貢獻份額不斷上升,而且兩者之間存在穩(wěn)定的協(xié)整關系和雙向的格蘭杰因果關系。
(4)近些年來,我國沒有發(fā)生什么嚴重的氣象災害,所以氣象對第一產業(yè)的影響一直處于一個正常的低水平的程度,但是隨著環(huán)境的逐漸惡化,全球變暖的加劇,氣候的波動會隨之加劇,而這意味著氣象對第一產業(yè)的影響會顯著增加,氣象也會成為不得不考慮的重要因素。
綜上所屬,本研究得到最終結論:人為因素(支農支出)是影響第一產業(yè)增加值的第一要素,氣象的波動對增加值的影響極小。但是研究結果也表明了氣象數(shù)據(jù)確實對預測第一產業(yè)增加值起到了正向的作用?;跉庀髷?shù)據(jù)和財政數(shù)據(jù)可以更精確的預測第一產業(yè)增加值。