楊昕馨
摘要 掌握農(nóng)田土壤水分和養(yǎng)分的空間分布特征是實現(xiàn)農(nóng)田土壤精確管理及實施精確農(nóng)業(yè)的重要依據(jù)。該文將貝葉斯最大熵法(Bayesian maximum entropy,BME)和貝葉斯人工神經(jīng)網(wǎng)絡(luò)方法(Bayesian neural networks,BNN)結(jié)合形成一種空間插值新方法,用融入BNN法結(jié)果的BME法(Bayesian maximum entropy method combined with Bayesian neural networks,BMENN)模擬土壤變量的空間分布。以新疆希尼爾水庫周邊某田塊的土壤水分、堿解氮、速效鉀和速效磷這4種土壤特性的采樣數(shù)據(jù)為例,運用交叉驗證法,將BMENN法對土壤變量的估值精度與BNN法、普通克立格法(ordinary Kriging,OK)進行了比較。結(jié)果表明:與OK法和BNN法相比,BMENN法將估計方差(mean squared error,MSE)縮小2.26%~23.54%,具有最小的估計方差和接近于0的平均絕對誤差(mean error,ME);BMENN法的估計值與實測值相關(guān)系數(shù)更大(r=0.62~0.89),具有更高的相關(guān)程度;MSE的組成分析表明,BMENN法再現(xiàn)變量波動程度和波動大小的能力更強。BMENN法對于利用有限數(shù)據(jù)信息提高土壤變量空間分布模擬精度具有重要意義,并可為土壤管理、精準(zhǔn)農(nóng)業(yè)的實施以及區(qū)域環(huán)境規(guī)劃等提供科學(xué)依據(jù)。
關(guān)鍵詞 土壤變量;空間分布;貝葉斯最大熵法;變異
中圖分類號 S151.9 文獻標(biāo)識碼 A 文章編號 1007-5739(2015)18-0193-02
定量化描述土壤特性(尤其是與作物產(chǎn)量、水質(zhì)等有關(guān)的土壤特性)的空間分布特征是土壤的分布式管理和精確農(nóng)業(yè)的實施的前提條件。然而,密集型土壤網(wǎng)格采樣和大量實驗室分析需要投入大量的人力和資金,靠這類方法精確評價土壤特性空間變異特征不太現(xiàn)實。貝葉斯最大熵法(Bayesian maximum entropy,BME)是由Christakos[1]提出的一種嚴(yán)格系統(tǒng)的非線性現(xiàn)代時空地統(tǒng)計學(xué)方法,它以實測數(shù)據(jù)為基礎(chǔ),融入具有不確定性的“軟數(shù)據(jù)”及其他先驗信息等多源數(shù)據(jù),來分析時空變量的變異規(guī)律[2]。土壤數(shù)據(jù)空間分析的重要工具克立格法僅是BME法的特例,當(dāng)只利用硬數(shù)據(jù)且數(shù)據(jù)服從正態(tài)分布和二階平穩(wěn)假設(shè),先驗信息只考慮均值、協(xié)方差函數(shù)或變異函數(shù)時,克立格估值與BME估值是相近的。BME法不僅能利用多源數(shù)據(jù),且克服了各種克立格方法要求的數(shù)據(jù)正態(tài)分布、各向同性、線性估值等缺陷,被證明是一種更高效且適用范圍更廣的時空數(shù)據(jù)分析方法[3]。
貝葉斯神經(jīng)網(wǎng)絡(luò)(Bayesian neural networks,BNN)法是通過貝葉斯方法定量化神經(jīng)網(wǎng)絡(luò)權(quán)參數(shù)的不確定性,進而產(chǎn)生所研究變量的后驗預(yù)測分布,使得置信區(qū)間的計算成為可能。BNN法不僅繼承了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)法(artificial neural network,ANN)的優(yōu)點,即處理非線性系統(tǒng)能力較強,不依賴數(shù)據(jù)分布和各種假設(shè),還克服了其許多缺點,如可自動控制模型的復(fù)雜性,避免了過度擬合,大大減小了陷入局部最優(yōu)的可能性。雖然傳統(tǒng)ANN法被不斷被應(yīng)用于水土科學(xué)領(lǐng)域進行空間數(shù)據(jù)分析[4],但BNN法在這一領(lǐng)域的應(yīng)用卻未見報道。
BNN法具有神經(jīng)網(wǎng)絡(luò)良好的非線性表達(dá)能力和貝葉斯后驗概率重現(xiàn)的真實性(估值的不確定性),但由于是在純數(shù)據(jù)驅(qū)動下,著重表達(dá)變量在整個研究空間上的變異性,不能很好地反映鄰域內(nèi)土壤數(shù)據(jù)的幾何構(gòu)形。該文的目的是將BME法和BNN法結(jié)合,從不同角度充分利用有限的實測數(shù)據(jù)信息,以提高土壤特性數(shù)據(jù)的繪圖精度。
1 理論與方法
1.1 貝葉斯神經(jīng)網(wǎng)絡(luò)方法
大量研究表明土壤水分和養(yǎng)分特性是具有區(qū)域化特征的隨機場,其空間點和直角坐標(biāo)之間的關(guān)系可以用神經(jīng)網(wǎng)絡(luò)模型進行非線性擬合。BNN法的主要原理是在給定數(shù)據(jù)樣本的情況下建立神經(jīng)網(wǎng)絡(luò)權(quán)參數(shù)的后驗概率分布,進而生成所研究變量的后驗預(yù)測分布。由于預(yù)測值的求解過程屬高維度復(fù)雜積分,通常借用馬爾科夫鏈蒙特卡羅法(markov chain montecarlo,MCMC)對其進行數(shù)值積分近似[5]。
1.2 貝葉斯最大熵方法
BME基本原理是以硬數(shù)據(jù)點為基礎(chǔ),融入“軟數(shù)據(jù)”點及廣義知識G(general knowledge)等多源數(shù)據(jù),來估計待估點處的值。硬數(shù)據(jù)指那些測量上沒有誤差或者誤差較小可以忽略不計的數(shù)據(jù);而軟數(shù)據(jù)則包含了一定的不確定性,這些數(shù)據(jù)以區(qū)間、概率或函數(shù)的形式表示,與硬數(shù)據(jù)相比,軟數(shù)據(jù)可結(jié)合更多的專業(yè)認(rèn)知、經(jīng)驗知識等信息。硬數(shù)據(jù)和軟數(shù)據(jù)構(gòu)成特定知識S(special knowledge)。廣義知識G是對于變量通常的了解,包括自然規(guī)律、科學(xué)理論和統(tǒng)計數(shù)據(jù)等,與特定知識S構(gòu)成總知識庫T。
在BME框架下,為估計待估點處的值,需首先用Shannon信息熵函數(shù)表示包含于先驗概率密度函數(shù)的信息期望,并以定量化表示的廣義知識G為數(shù)學(xué)約束,使信息熵最大化,得到多維隨機變量及先驗概率密度函數(shù)。本文中廣義知識G為由已知數(shù)據(jù)(包括硬數(shù)據(jù)和軟數(shù)據(jù))統(tǒng)計得到的協(xié)方差函數(shù)。然后,根據(jù)貝葉斯法則,以硬數(shù)據(jù)和軟數(shù)據(jù)為條件將先驗概率密度函數(shù)轉(zhuǎn)換為后驗概率分布函數(shù)。
1.3 插值精度評價準(zhǔn)則
為了評價BMENN分析土壤水分和養(yǎng)分空間分布特征的效果,本文將其插值結(jié)果與普通克立格法(Ordinary Kriging,OK)和BNN法進行了比較。將實測點分為2組,一組為建模數(shù)據(jù)點,用以建立貝葉斯神經(jīng)網(wǎng)絡(luò)模型,并且是BME法中的硬數(shù)據(jù)和OK法中的實測數(shù)據(jù);另一組為驗證數(shù)據(jù)點,用以通過交叉驗證法評價3種方法的估值精度,亦即插值后這些點上會存在3對估計值-實測值,可據(jù)此計算相應(yīng)的插值評價指標(biāo)。
評價指標(biāo)采用平均誤差(mean error,ME)和均方誤差(或稱估計誤差,mean squared error,MSE),其中:ME體現(xiàn)的是估值的平均偏離程度,MSE體現(xiàn)的是估值的絕對偏離程度。ME越接近0、MSE越小估值精度越高。endprint
2 研究區(qū)概況及試驗方案
希尼爾水庫位于新疆庫爾勒市境內(nèi),是塔里木河流域近期綜合治理工程之一,水庫從孔雀河第一分水樞紐引水,經(jīng)庫塔干渠總干渠輸水注入。設(shè)計庫容0.98億m3,設(shè)計水位913.6 m,設(shè)計水面面積16.74 km2。水庫周邊屬溫帶大陸性干旱氣候,降雨稀少,蒸發(fā)強烈。多年平均氣溫11.5 ℃,日照時數(shù)3 036.2 h,降水量53.3~62.7 mm,蒸發(fā)量2 673~2 788 mm(E20小型蒸發(fā)器),無霜期194 d,最大凍土深0.8 m。研究區(qū)土壤質(zhì)地以沙土、砂壤土為主,適宜農(nóng)業(yè)種植業(yè)的發(fā)展。土壤樣品分析成果包括土壤含水率(烘干法測質(zhì)量含水率)、堿解氮質(zhì)量分?jǐn)?shù)(氫氧化鈉堿解擴散法測定)、速效磷質(zhì)量分?jǐn)?shù)(浸提-鉬藍(lán)比色法測定)、速效鉀質(zhì)量分?jǐn)?shù)(浸提-火焰光度計法測定)。
3 結(jié)果與分析
土壤水分和養(yǎng)分的統(tǒng)計特征值和空間變異結(jié)構(gòu)見表1??梢钥闯?,土壤含水率、堿解氮質(zhì)量分?jǐn)?shù)的最大值均為最小值的1.8倍左右,速效鉀接近4倍,速效磷則為6.63倍;從變異系數(shù)(Coefficient of variation,Cv)看,土壤水分屬弱變異性(Cv≤0.1),各種養(yǎng)分質(zhì)量分?jǐn)?shù)都屬于中等變異(0.1≤Cv≤1.0),其中土壤水分變異性最小,速效鉀變異最大。土壤含水率和堿解氮質(zhì)量分?jǐn)?shù)的偏度系數(shù)和峰度系數(shù)均接近于0,近似服從正態(tài)分布;速效磷和速效鉀的峰度系數(shù)和偏度系數(shù)較大,且峰態(tài)系數(shù)為正值,表明二者峰態(tài)左偏(即負(fù)偏),經(jīng)對數(shù)變換后,大致接近正態(tài)分布,即服從對數(shù)正態(tài)分布。土壤水分和養(yǎng)分的理論變異函數(shù)模型均采用球狀模型。若用C表示球狀模型的結(jié)構(gòu)方差,C0為塊金方差,則C/(C+C0)可以反映出土壤變量的空間自相關(guān)性大小。對于土壤水分和全氮量,25%
MSE的組成能更詳細(xì)地刻畫估計值與實測值之間的差異。MSE各組成部分的絕對數(shù)值(其中:SB是估計樣本均值與實測樣本均值的離差平方,反映均值的估計精度,該值越小,精度越高;SDSD是估計值與實測值均方差的離差平方,反映了估計值和實測值離散程度的差別,該值越小表明估計值離散程度越接近實測值;LCS是以均方差為權(quán)重的1-r值,反映估計值和實測值波動程度的差別,該值越小表明估計值與實測值的波動程度越接近)如表2所示。各土壤變量的3種插值結(jié)果均表明,LCS對MSE的貢獻均最大,且占絕大部分,SB則很小,這表明估計誤差絕大部分由于估計值與實測值的波動程度差異引起的,而估計值與實測值的均值之間的差異很小,幾乎可以忽略,亦即各種方法的插值結(jié)果都接近于無偏估計。從MSE大小及其組成比例分析,3種方法中,BMENN法對各土壤變量的離散程度和波動程度具有最好的再現(xiàn)能力,OK法對變量波動程度的再現(xiàn)能力略好于BNN法。對于除水分外的各土壤變量,LCS對BNN法的MSE貢獻都大于OK法,表明BNN法土壤變量的波動程度方面表現(xiàn)較差。與OK法相比,水分的BMENN法估計值的MSE和LCS都較小,顯然BMENN法在水分插值中表現(xiàn)更好;雖然堿解氮的BMENN法估計值的LCS對MSE的貢獻比例較大,但絕對數(shù)值卻比較小,說明其OK法的LCS貢獻比例的縮小是以MSE的增加為代價的;速效磷和速效鉀的BMENN法估計值的LCS對MSE的貢獻比例與OK法相近,但BMENN法的MSE比OK法分別縮小20.2%和21.4%,可見BMENN法較OK法插值精度高。對于土壤水分,BNN法的MSE的3種組份所占比例均不大,似乎組成更為合理,但與BMENN法相比仍然會發(fā)現(xiàn),其LCS所占比例(76.1%)縮小主要是因為BNN法MSE(2.895)最大引起的,就絕對值而言,BMENN會更好地再現(xiàn)水分波動程度。
BMENN法對4種土壤變量的插值精度各不相同。由表2可知,對于速效鉀,BMENN法的估計方差MSE比BNN法和OK法分別縮小23.2%和21.4%;對于速效磷,MSE分別縮小10.8%和20.2%;堿解氮MSE分別縮小10.5%和9.9%;水分MSE分別縮小19.4%和2.3%。結(jié)合以上對MSE組成的分析,可得出以下結(jié)論:與其他2種方法比較,BMENN法對速效鉀、速效磷和堿解氮具有較高的插值精度,而對水分插值精度則較低。其原因是速效鉀、速效磷及堿解氮具有強烈的空間自相關(guān)性,水分空間自相關(guān)程度較弱(表1),BMENN法通過地質(zhì)統(tǒng)計學(xué)的BME法和人工神經(jīng)網(wǎng)絡(luò)的BNN法從不同角度發(fā)掘,能將實測數(shù)據(jù)攜帶的空間自相關(guān)信息運用到極佳,且變量的空間自相關(guān)程度越強,BMENN法估值精度越高。
4 結(jié)論
本文將現(xiàn)代地質(zhì)統(tǒng)計學(xué)的貝葉斯最大熵法(Bayesian maximum entropy,BME)和貝葉斯人工神經(jīng)網(wǎng)絡(luò)方法(Bayesian neural networks,BNN)相結(jié)合(BMENN法),對土壤水分和養(yǎng)分變量進行插值估計;并以未參與構(gòu)建模型的實測點(驗證數(shù)據(jù)點)為基礎(chǔ),采用交叉驗證法對比了BMENN法、BNN法與普通克立格法(ordinary kriging,OK)3種方法的插值估計精度。得出如下結(jié)論:①BMENN法估計值與實測值的相(下轉(zhuǎn)第198頁)
關(guān)系數(shù)r略大于其他方法,表明BMENN法估值與實測值相關(guān)性更好;②與OK法和BNN法相比,BMENN法能將估計方差(mean squared error,MSE)縮小2.26%~23.54%,表明總體上BMENN法估值更精確;③BMENN法估值接近于無偏估計,并比其他2種方法表現(xiàn)更穩(wěn)定;④估計方差MSE的組成分析表明,BMENN 法再現(xiàn)變量波動程度和波動大小的能力更強。
以上結(jié)論表明,多方法融合力求充分利用所擁有的信息,是在數(shù)據(jù)信息有限的條件下,提高變量空間分布模擬精度的另一途徑。本文利用BME法和BNN法各自的特點,將二者結(jié)合起來模擬土壤水分和養(yǎng)分空間分布,獲得了較好的結(jié)果,對于提高空間變量的估值精度和豐富空間變異理論具有重要意義。但也存在不足之處:①由于數(shù)據(jù)信息有限,并沒有充分發(fā)揮BMENN法的優(yōu)勢,今后有待進一步開展多尺度、多源信息利用方面的研究;②本文整個試驗區(qū)的作物種植結(jié)構(gòu)、施肥、灌水等條件都是基本一致的,沒有考慮這些因素對所提出方法插值精度的影響;實際上,這些人類活動會影響土壤變量的隨機性,進而影響空間變異理論的插值精度,關(guān)于人類活動對該方法的插值影響有待在將來的工作中開展研究。
5 參考文獻
[1] CHRISTAKOS G.A Bayesian maximum entropy view to the spatial estim-ation problem[J].Mathematical Geology,1990,22(7):763-777.
[2] CHRISTAKOS G,LI X.Bayesian maximum entropy analysis and mapping:a farewell to kriging estimators[J].Mathematical Geology,1998,30(4):435-462.
[3] DOUAIK A,MEIRVENNE M V,T?譫TH T.Soil salinity mapping using spatio-temporal kriging and Bayesian maximum entropy with interval soft data[J].Geoderma,2005,128(3-4):234-248.
[4] LI Qi-quan,YUE Tian-xiang,WANG Chang-quan,et al.Spatially distr-ibuted modeling of soil organic matter across China:An application of artificial neural network approach[J].Catena,2013,104(5):210-218.
[5] BAYAT B,NASSERI M,ZAHRAIE B.Identification of long-term annual pattern of meteorological drought based on spatiotemporal methods:evaluation of different geostatistical approaches[J].Nat Hazards,2015,76(1):515-541.