曾招財,梁藉,吳豪,曾志強
(華中科技大學水電與數(shù)字化工程學院,湖北武漢430074)
中國是一個農業(yè)大國,保證糧食安全的一大前提就是要使農業(yè)用水得到充分保障。隨著中國農業(yè)現(xiàn)代化的不斷發(fā)展,“農業(yè)經(jīng)濟用水量[1]”這個概念被相關研究人員廣泛地提及。在中國的農業(yè)用水量中,很重要的組成部分就是農作物需水量,在整個國民經(jīng)濟的總耗水量中占據(jù)著非常大的比重。參考作物需水量(以下簡稱ET0)用以確定具體地區(qū)的農作物需水量,從而得出區(qū)域的農業(yè)灌溉用水量,為相關部門制定作物灌溉制度提供可靠的現(xiàn)實基礎,同時也是流域布局規(guī)劃、地區(qū)水利工程及灌溉排水工程的規(guī)劃、設計和運營管理的基本依據(jù)[2]。作物需水量的計算可以分為直接測定法和間接推求法。間接推求作物需水量的方法最早由Penman在1948年提出。通過引入表面阻力的相關概念,Monteith于1963年在Penman等人對于作物騰發(fā)量研究的相關理論的基礎上得出了后來被FAO(國際糧農組織)確定為參考作物需水量的標準方法的彭曼-蒙特斯方法[3]。Doorenboos和Pruit于1977年在Makkink公式中引入調整系數(shù)來解決空氣動力學因素的影響問題,提出了適用于干旱地區(qū)的FAO-Radiation法[4]。時間序列分析法最開始由英國統(tǒng)計學家G.U.Yule于1972年提出,并成功預測了市場的變化趨勢和規(guī)律[5]。經(jīng)過不斷的應用和發(fā)展,時間序列分析的相關研究方法已經(jīng)廣泛應用于于經(jīng)濟學、工程學、氣象學、水文學、醫(yī)學、信息學、環(huán)境科學、社會科學、數(shù)據(jù)挖掘等各個領域[6]。
利用時間序列分析方法對江西省境內贛江流域需水量變化特征及其預測的相關研究,可以充分利用歷史氣象資料,研究流域內參考作物的需水特性及規(guī)律,有利于當?shù)毓?jié)水灌溉的發(fā)展。在建設節(jié)約型社會的今天,水資源高效利用一直是一個熱點話題,掌握區(qū)域作物需水規(guī)律正是為了更好地利用水資源,提高水資源的利用效率。論文從分析贛江流域參考作物需水量年際、年內變化特征出發(fā),利用SPSS統(tǒng)計分析軟件對ET0時間序列建立季節(jié)性ARIMA模型,對ET0的變化進行了擬合及預測。
作為長江的主要支流之一,贛江也是江西省最大的河流。贛江位于長江中下游南岸,其源頭是江西省和福建省交接處的武夷山脈西邊,自南向北縱貫全省,從九江湖口匯入長江。贛江共有13條主要支流匯入,總長766 km,流域面積83 500 km2。從河源至贛州市為上游,稱貢水,在贛州市城西和章水匯流后開始被稱為贛江。貢水為贛江東源全長255 km,發(fā)源于江西省贛州市石城縣橫江鎮(zhèn)。章水是贛江西源,又名章江,發(fā)源于贛州市崇義縣的聶都山。贛州至新干為中游,長303 km,穿行于丘陵之間。新干至吳城為下游,長208 km。
論文原始數(shù)據(jù)為選自中國氣象數(shù)據(jù)網(wǎng)的12個氣象站1961—2010年50 a的逐日實測氣象數(shù)據(jù)(氣溫、水汽壓、濕度、日照時數(shù)、風速、太陽輻射)。采用FAO-Penman-Monteith公式計算得到ET0的逐日數(shù)據(jù)。根據(jù)流域內站點的分布特點,按照站點所在的地理位置,將其分為上游站點(龍南、贛縣)、中游站點(井岡山、遂川、吉安、寧都、永豐、蓮花)和下游站點(宜春、宜豐、樟樹、南昌)3個子研究區(qū)域。選取的12個氣象站點(其中11個選取自贛江流域內,1個位于流域外)的空間分布見圖1。
圖1 贛江流域氣象站空間分布
參考作物是一種假想的草類參照作物,其高度為0.12 m,具有固定的表面阻力70 s/m和反射率0.23。根據(jù)《參考作物需水量計算指南》書中的描述,此假想?yún)⒄兆魑锩骖愃埔粋€面積很大、高度均勻、生長旺盛、完全遮蔽地面且供水充分的綠色草地。國際糧農組織推薦在濕潤地區(qū)采用Penman-Monteith[7]公式來計算參考作物需水量(也稱參考作物騰發(fā)量),該方法已經(jīng)得到了廣泛的應用,其表達式如下:
ET0=
(1)
式中ET0——參照騰發(fā)速率,mm/d;Rn——凈太陽輻射,MJ/(m2·d);G——土壤熱通量,MJ/(m2·d);T——2 m高度處的日平均氣溫,℃;u2——2 m高度處的風速,m/s;es——飽和水汽壓,kPa;eq——實際水汽壓,kPa;γ——濕度計常數(shù),kPa/℃;Δ——飽和水汽壓曲線斜率。
對于季節(jié)性ARIMA(p,d,q)(P,D,Q)S模型[8],可以用下式來表示:
(2)
將計算得到的各個站點ET0日數(shù)據(jù)進行整理得到了ET0年平均值數(shù)據(jù)并在Matlab軟件中繪制序列,得到圖2。從圖中可以看出全流域內ET0的年際變化較大,全流域ET0最大值為1963年的1 228.7 mm/a,最小值1997年的937.5 mm/a,極差為291.2 mm/a。由于氣候變化,1986年到2005年這連續(xù)20 a內ET0經(jīng)歷了從1986—始波動下降而后波動上升的變化過程。從上游、中游、下游3個子研究區(qū)域的ET0年際變化來看,上游的年ET0值最大,三者的變化特征和趨勢和全流域的ET0變化規(guī)律相似。從50 aET0年平均值來看,全流域平均值為1 061.0 mm/a,上游為1 116.5 mm/a,中游為1 036.1 mm/a,下游為1 038.5 mm/a,整體變化并不大。
圖2 贛江流域參考作物需水量年際變化
對于全流域ET0日均值的年內變化情況,圖3給出了其日時序和月時序年內分布。從圖中可以發(fā)
a) 日時序圖3 贛江流域參考作物需水量年內變化
b)月時序續(xù)圖3 贛江流域參考作物需水量年內變化
現(xiàn),ET0在一年中的中期即6、7月的時候達到最大值然后開始下降。在6、7月份處于夏季溫度較高,降雨也多,導致作物騰發(fā)量較大,所以作物參考需水量也大。過了夏季,氣溫降低使得作物騰發(fā)量開始顯著減小,所以其分布曲線在6、7月份之后開始呈現(xiàn)下降趨勢。
時間序列建模要求數(shù)據(jù)必須為平穩(wěn)序列[9]。利用SPSS軟件作出研究序列的時間序列圖和自相關系數(shù)圖。從圖4可以看出,全流域ET0月數(shù)據(jù)序列為非平穩(wěn)序列,其數(shù)值圍繞平均值88.42 mm/月上下波動。同時,圖5自相關圖也表現(xiàn)為非截尾性和非拖尾性,可以認為序列非平穩(wěn)。因此,需要對數(shù)據(jù)進行差分運算。經(jīng)研究發(fā)現(xiàn),對其進行一階季節(jié)性差分可以使序列趨于平穩(wěn),序列差分后序列的時序見圖6,其自相關系數(shù)見圖7。
圖4 贛江流域月參考作物需水量時序
圖5 月ET0序列自相關系數(shù)
圖6 月ET0序列一階季節(jié)性差分后時序
圖7 ET0序列一階季節(jié)性差分后自相關
3.4.1模型階數(shù)識別
時間序列模型階數(shù)的確定是建立模型的重要一步。隨著統(tǒng)計軟件和計算機技術的不斷發(fā)展,可以運用統(tǒng)計軟件根據(jù)擬合效果的信息準則法來確定時間序列模型的階數(shù)。常見的判別準則有FPE準則、AIC準則和BIC準則。論文結合SPSS軟件,采用BIC準則來確定模型的階數(shù)。BIC準則表達式如下:
(3)
如果在某一階數(shù)p0下滿BIC(p0)=minBIC(p)(1≤p≤L),式中L是預先假定的所研究的模型階數(shù)的上限值,則認為模型的最佳階數(shù)為p0。利用贛江全流域的參考作物需水量數(shù)據(jù),經(jīng)過不斷試驗和調整并結合BIC準則法,選定合適的時間序列模型[10]。論文采用1961—2010年50 a月時序數(shù)據(jù)進行模型的建立。首先以前49 a作為模型的訓練期,2010年作為檢驗期,利用SPSS軟件得到贛江流域的季節(jié)性ARIMA模型形式為SARIMA(2,0,1)(0,1,1)。
3.4.2模型參數(shù)估計
ARIMA模型參數(shù)的估計有比較多的方法,例如矩估計、極大似然估計最小二乘估計等。利用SPSS軟件的分析工具可以得到模型的各項參數(shù)。對于贛江流域參考作物月需水量時間序列模型。其模型統(tǒng)計量和模型的相關參數(shù)見表1,可以得到贛江流域ET0預測模型的表達式為:
(1+0.8B-0.195B2)(1-B12)xt=
(1+0.85B12)(1-0.999B)wt
表1 模型SARIMA(2,0,1)(0,1,1)參數(shù)
3.4.3模型的診斷檢驗
模型的顯著性檢驗,即模型的有效性檢驗,驗證模型是否充分地提取了數(shù)據(jù)的有關信息。從圖8中,可以看出殘差序列的自相關系數(shù)非常小,接近于0。這說明,模型殘差是白噪聲序列,建立的模型已經(jīng)充分提取了數(shù)據(jù)的有效信息。表2給出了模型的統(tǒng)計量和LB(Ljung-Box)值。可以知道,當LB值較大時,拒絕原假設,說明模型擬合不顯著,當LB值較小時,說明模型擬合顯著顯著。經(jīng)計算得到LB統(tǒng)計量的值15.412,其 Sig.值大于顯著性水平0.05,所以不能拒絕原假設,模型的殘差序列是白噪聲序列,模型擬合顯著有效,可以用于預測。
圖8 殘差自相關
模型擬合統(tǒng)計量平穩(wěn)R2統(tǒng)計量Ljung-Box Q(18)R2BICSig.0.420.914.9115.41140.35
3.4.4預測結果分析
一般認為時間序列模型的短期預測較為準確。利用1961—2009年月數(shù)據(jù)來預測2010年各月的參考作物需水量,結果見表3。結果顯示最小相對誤差為2.25%,最大相對誤差為23.04%,平均相對誤差為10.02%,在正常允許范圍之內。為了避免模型預測結果的偶然性,利用2001—2010年作為檢驗期,進行滾動預測,發(fā)現(xiàn)月尺度下ARIMA模型預測的平均相對誤差最小為2006年的4%,最大為2002年的15%,10 a平均相對誤差為9.1%,年尺度下最小相對誤差0.41%,最大相對誤差8.61%,10 a平均相對誤差4.35%,均在合理范圍之內。年尺度預測結果見表4。2001—2010年月尺度實際值和預測值擬合見圖9。從圖9中可以看出,實際值和預測值擬合較好,模型的預測精度滿足要求,說明考慮季節(jié)性因素的ARIMA模型運用于贛江流域ET0預測具有一定合理性。
表3 2010年月參考作物需水量預測結果
表4 2001—2010年參考作物需水量預測結果
圖9 實際值和預測值對比
a) 贛江流域ET0在1961—2010年50 a間經(jīng)歷了先波動遞減后波動上升的過程。且3個子研究區(qū)域的ET0年際變化和全流域的變化規(guī)律大體一致,說明贛江流域ET0在整個流域內分布較為均勻。ET0年內變化則呈現(xiàn)明顯的季節(jié)性特征。贛江流域參考作物需水量時間序列為非平穩(wěn)序列,在考慮季節(jié)性因素的情況下進行一階差分可使序列平穩(wěn)。
b) 預測結果表明,月尺度下ARIMA模型預測的平均相對誤差最小為2006年的4%,最大為2002年的15%,10 a平均相對誤差為9.1%;年尺度下最小相對誤差0.41%,最大相對誤差8.61%,10 a平均相對誤差4.35%,均在合理范圍之內。說明ARIMA模型在考慮季節(jié)性因素的情況下運用于贛江流域參考作物需水量預測,具有實際意義,可以為農業(yè)生產(chǎn)和相關研究提供參考。