□崔海朋 邢貞相 關(guān)長(zhǎng)瑜
水稻是我國(guó)主要糧食作物之一,不同年景對(duì)糧食產(chǎn)量影響較大。經(jīng)研究證明,水稻生長(zhǎng)季節(jié)≥20℃的積溫與產(chǎn)量高低有密切關(guān)系。當(dāng)≥20℃的積溫在2100℃以下時(shí),就會(huì)因熱量不足而發(fā)生延遲型或障礙型冷害,最終造成糧食嚴(yán)重減產(chǎn)。只有≥20℃的積溫得到基本滿(mǎn)足,且光、水條件適宜時(shí),糧食才能獲得高產(chǎn)。由此可見(jiàn),≥20℃積溫的多少,對(duì)保證糧食產(chǎn)量至關(guān)重要。B P神經(jīng)網(wǎng)絡(luò)模型是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的數(shù)學(xué)模型,具有較強(qiáng)的非線(xiàn)性映射能力,近年來(lái)應(yīng)用B P模型通過(guò)積溫對(duì)水稻產(chǎn)量進(jìn)行預(yù)報(bào),效果良好。
由于年際積溫變化大,必須按照常規(guī)氣候指標(biāo)安排生產(chǎn)。作者利用沈陽(yáng)市統(tǒng)計(jì)局1951~1990年水稻單產(chǎn)(k g/畝)與沈陽(yáng)≥10℃和≥20℃積溫資料進(jìn)行相關(guān)分析,采用5年滑動(dòng)平均法分解氣象產(chǎn)量,通過(guò)與≥10℃和≥20℃積溫的相關(guān)計(jì)算,得出≥20℃的積溫與水稻產(chǎn)量有密切關(guān)系。
表1 1955~1990年分型種類(lèi)表
上表對(duì)各年分型的預(yù)報(bào)采用的是相關(guān)分析法,算法繁瑣,技術(shù)復(fù)雜,且精度不高。由于B P人工神經(jīng)網(wǎng)絡(luò)有很強(qiáng)的函數(shù)映射功能,每一個(gè)特定的網(wǎng)絡(luò)都能夠表達(dá)十分復(fù)雜又難以用數(shù)學(xué)表達(dá)式表達(dá)的函數(shù)關(guān)系,尤其是非線(xiàn)性關(guān)系。但神經(jīng)網(wǎng)絡(luò)的收斂速度較慢,且由于訓(xùn)練樣本容量的限制而影響網(wǎng)絡(luò)的學(xué)習(xí)能力和預(yù)報(bào)準(zhǔn)確性。為克服訓(xùn)練樣本容量不足,本文采用馬爾可夫鏈蒙特卡羅模擬技術(shù)模擬足夠多的樣本為B P模型訓(xùn)練所用,并將其用于各年分型預(yù)報(bào)中。
在多層前饋B P網(wǎng)絡(luò)的應(yīng)用中,以圖1所示的網(wǎng)絡(luò)應(yīng)用最為普遍。所謂三層包括了輸入層、隱層和輸出層。在三層前饋網(wǎng)絡(luò)中,輸入為X=(x1,x2,…,xr)T,再加入x0=1,可為隱層引入閾值;隱層輸出向量為Y=(y1,y2,…ym)T,再加入y0=1,可引入閾值;輸出層的輸出向量為O=(o1,o2,…,ok,ol)T;期望輸出向量為:d=(d1,d2,…,dk,dl)T。輸入層到隱層間的權(quán)值矩陣V=(V1,V2,…,Vj,Vm),其中列向量Vj為隱層第j個(gè)神經(jīng)元對(duì)應(yīng)的權(quán)向量;隱層到輸出層間的權(quán)值矩陣W=(W1,W2,…,Wk,Wl),其中列向量Wk為輸出層第k個(gè)神經(jīng)元對(duì)應(yīng)的權(quán)向量。在隱層中的轉(zhuǎn)移函數(shù)多采用S型激活函數(shù),可有效地避免出現(xiàn)過(guò)飽和現(xiàn)象,而輸出層多采用線(xiàn)性函數(shù),以適應(yīng)實(shí)際問(wèn)題的需要。
網(wǎng)絡(luò)誤差的定義如下式所示(以三層神經(jīng)網(wǎng)絡(luò)為例,拓?fù)浣Y(jié)構(gòu)見(jiàn)圖1):
進(jìn)一步展開(kāi)至輸入層,得:
由上式可看出,網(wǎng)絡(luò)的輸入誤差是各層權(quán)值wij、vij的函數(shù),因此不斷調(diào)整權(quán)值就可以改變誤差使之達(dá)到預(yù)定的精度。
B P算法的權(quán)值調(diào)整計(jì)算公式為:
式中α為學(xué)習(xí)速率,其他符號(hào)意義同上。
作為隨機(jī)模擬方法的馬爾可夫鏈蒙特卡羅(MCMC)方法早已被許多學(xué)者應(yīng)用到物理、天文、氣象、通信等方面。常用的采樣方法有Metropolis-Hastings算法、吉布斯(Gibbs)采樣和Adaptive Metropolis (AM)算法。這三種方法中只有AM算法不依賴(lài)于事先確定的推薦分布且能夠考慮多維變量間的相關(guān)性,收斂速度快,故本文采用A M算法。
AM (Adaptive Metropolis)算法是Haario于2001年提出的一種改進(jìn)的MCMC采樣器,相比傳統(tǒng)的M-H與Gibbs采樣,AM不再需要事先確定變量的推薦分布,而是決定于初始抽樣的協(xié)方差。將推薦分布定義為參數(shù)空間的多維正態(tài)分布形式,其初始協(xié)方差可根據(jù)先驗(yàn)信息確定。在抽樣過(guò)程中根據(jù)馬爾可夫鏈的歷史抽樣信息調(diào)整推薦密度(即協(xié)方差矩陣),且可并行運(yùn)算,從而提高了算法的收斂速度。
為獲得B P網(wǎng)絡(luò)訓(xùn)練過(guò)程所需的足夠樣本,首先根據(jù)實(shí)測(cè)數(shù)據(jù)利用MCMC算法模擬出指定容量的訓(xùn)練樣本,具體作法如下:
由于實(shí)測(cè)數(shù)據(jù)在測(cè)量過(guò)程中存在不可避免的隨機(jī)誤差,且觀測(cè)數(shù)據(jù)具有隨機(jī)性,故本文假定觀測(cè)數(shù)據(jù)符合以實(shí)測(cè)數(shù)據(jù)為均值的白噪聲分布,設(shè)方差為實(shí)測(cè)值的5%。利用MCMC算法從高斯分布中隨機(jī)模擬20個(gè)樣本,將樣本容量增加20倍,以其中的4/5作為BP網(wǎng)絡(luò)訓(xùn)練樣本,其余作為其驗(yàn)證樣本。
實(shí)驗(yàn)證明BP網(wǎng)絡(luò)收斂的速度與網(wǎng)絡(luò)的初始權(quán)值和閾值有密切關(guān)系,好的初始權(quán)值和閾值會(huì)大大提高其收斂速度。
神經(jīng)網(wǎng)絡(luò)輸入神經(jīng)元采用1個(gè),即為該年的積溫值,當(dāng)輸入值為1時(shí),由于sigmoid轉(zhuǎn)移函數(shù)對(duì)[0,1]區(qū)間的輸入比較敏感,故對(duì)積溫值進(jìn)行歸一化處理。將數(shù)據(jù)變換為[0,1]區(qū)間的值的變換公式為:
式中:xi代表輸入或輸出數(shù)據(jù),xmin代表數(shù)據(jù)變化的最小值,xmax代表數(shù)據(jù)變化的最大值。
輸出層神經(jīng)元采用4個(gè),即分別對(duì)應(yīng)高溫型、正常偏高型、正常偏低型、冷害型四種年景分型,和該年的積溫值。當(dāng)輸入值為1時(shí),表示該年為相應(yīng)的分型年;當(dāng)輸入值為0時(shí),則不屬于該分型年,形式分別為(1,0,0,0),(0,1,0,),(0,0,1,0),(0,0,0,1)。
BP算法,經(jīng)過(guò)1868次訓(xùn)練,最后收斂到總體能量函數(shù)值為4.5137×10-4,平均誤差為3.1345×10-6,擬合率達(dá)到93%,此時(shí)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)為1-5-4,訓(xùn)練結(jié)果見(jiàn)表2。
表2 MCMC-BP對(duì)年景分型的訓(xùn)練結(jié)果
由表2可看出,用本文提出的MCMC-BP模型對(duì)水稻生長(zhǎng)季≥20℃積溫進(jìn)行預(yù)報(bào),擬合度較高。利用訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)報(bào)1991~1994年的年景分型種類(lèi),結(jié)果見(jiàn)表3。
表3 MCMC-BP對(duì)1991~1994年景類(lèi)型預(yù)報(bào)表
由表3可以看出,用MCMC-BP訓(xùn)練收斂后的網(wǎng)絡(luò)結(jié)構(gòu)來(lái)預(yù)報(bào)水稻產(chǎn)量年景,預(yù)報(bào)結(jié)果與實(shí)際年景完全相同,可見(jiàn)預(yù)報(bào)精度高,方法切實(shí)可行。
(一)MCMC-BP能夠準(zhǔn)確地映射水稻生長(zhǎng)季≥20℃積溫與相應(yīng)年景類(lèi)型之間的非線(xiàn)性關(guān)系,且具有較高的預(yù)報(bào)精度。
(二)本文提出的MCMC-BP模型采用Matlab語(yǔ)言編寫(xiě),便于操作、推廣,計(jì)算速度快、精度高,適于大量數(shù)據(jù)的計(jì)算。
(三)MCMC-BP模型的訓(xùn)練不受人為因素的干擾,同時(shí)可考慮增加其他影響水稻產(chǎn)量年景因素,使預(yù)測(cè)結(jié)果更準(zhǔn)確。
(四)本文提出的MCMC-BP模型還可應(yīng)用到其他與預(yù)報(bào)、預(yù)測(cè)有關(guān)的問(wèn)題中,具有廣闊的應(yīng)用前景。