曾彥欣,鐘獻(xiàn)詞,劉 芳
(1.廣西大學(xué) a.土木建筑工程學(xué)院;b.數(shù)學(xué)與信息科學(xué)學(xué)院,南寧 530004;2.中國能源建設(shè)集團(tuán)廣西電力設(shè)計研究院有限公司,南寧 530007)
水是人類生存發(fā)展不可或缺的重要資源, 是保證社會經(jīng)濟(jì)發(fā)展的基礎(chǔ)。隨著社會的不斷發(fā)展和進(jìn)步, 人類對水的需求量逐漸增大, 水資源短缺和分配不均成為制約社會、 經(jīng)濟(jì)、 環(huán)境可持續(xù)發(fā)展的重要因素。在全球水資源短缺的現(xiàn)狀下, 科學(xué)地對城市需水量進(jìn)行預(yù)測, 對有效解決社會水資源短缺及合理分配具有重要意義。
國內(nèi)外開展了大量對需水量的預(yù)測研究。Zhou等[1]利用自適應(yīng)學(xué)習(xí)算法提出了一種短期需水預(yù)測模型; Yasar等[2]基于多因素對用水量影響建立了多元非線性需水預(yù)測模型; Felfelani等[3]利用人工神經(jīng)網(wǎng)絡(luò)對城市用水量預(yù)測進(jìn)行了研究; Abu-Mahfouz等[4]建立了可減少用水損失的需水預(yù)測模型以及針對供水管網(wǎng)壓力管理與漏損區(qū)域識別的預(yù)測模型; 付強(qiáng)等[5]利用神經(jīng)網(wǎng)絡(luò)模型對水稻的灌溉需水量進(jìn)行了預(yù)測; 王景雷等[6]基于DEM提出了針對冬小麥的需水預(yù)測模型; 張清周等[7]建立了基于信息?;闹С窒蛄繖C(jī)預(yù)測模型,能夠較好地實現(xiàn)城市短期(最高) 時用水量的預(yù)測。此外, 為了發(fā)揮不同算法的優(yōu)勢, 尋求更好的預(yù)測效果, 一些學(xué)者將多個算法組合,來預(yù)測需水量, 如:章恒全等[8]結(jié)合灰色關(guān)聯(lián)分析與神經(jīng)網(wǎng)絡(luò)對江蘇省需水量進(jìn)行了預(yù)測; 宋帆等[9]將聚類方法和灰色關(guān)聯(lián)分析相結(jié)合, 對吉林省用水量進(jìn)行了預(yù)測;韋文淵等[10]采用用水定額等方法計算了柳州市生產(chǎn)生活、生態(tài)環(huán)境及生態(tài)市建設(shè)等的需水量。還有一些學(xué)者改進(jìn)了已有的預(yù)測方法, 如查木哈等[11]利用BP神經(jīng)網(wǎng)絡(luò)建立了雙層隱層模型, 陳磊[12]構(gòu)建了基于ν-SVM的需水量預(yù)測模型, 得到了更精確的結(jié)果。
綜上, 上述研究均屬于考慮確定性方法的點預(yù)測, 而實際水資源的分布及利用充滿著不確定性, 點的預(yù)測值不能準(zhǔn)確表達(dá)這些不確定性, 因此考慮不確定方法的區(qū)間預(yù)測更符合實際情形。郭強(qiáng)等[13]提出了基于貝葉斯準(zhǔn)則的BP神經(jīng)網(wǎng)絡(luò)需水預(yù)測模型; 楊利納等[14]利用灰色關(guān)聯(lián)分析和遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)對校園需水預(yù)測區(qū)間進(jìn)行了研究; 吳澤寧等[15]運(yùn)用定額法、 回歸分析法和系統(tǒng)動力學(xué)方法得出各自的確定性需水預(yù)測結(jié)果后, 將最大、 最小值分別取為區(qū)間的上下限, 再隨機(jī)生成數(shù)據(jù)進(jìn)行正態(tài)檢驗, 若隨機(jī)數(shù)不符合正態(tài)分布則對隨機(jī)數(shù)進(jìn)行正態(tài)轉(zhuǎn)化后計算95%置信區(qū)間, 并對鄭州市工業(yè)需水量作出了估計。
本文以玉林市農(nóng)業(yè)需水預(yù)測為研究對象, 提出了結(jié)合定額法、 趨勢分析法、 BP神經(jīng)網(wǎng)絡(luò)模型、 灰色模型、 ARIMA模型5種確定性預(yù)測方法以及統(tǒng)計分析的不確定性區(qū)間預(yù)測方法, 獲得了玉林市2030年農(nóng)業(yè)需水區(qū)間預(yù)測結(jié)果, 為該地區(qū)的水資源優(yōu)化配置及評價方案構(gòu)建提供一定的參考。
玉林市地處廣西東南部, 全市多年平均水資源量為116.89億 m3, 人均水資源量僅為2 065 m3, 在廣西全區(qū)14個地級市中排名末位。2019年, 玉林市GDP在全區(qū)14個地級市中排名第4, 玉州、 北流、 福綿一體化城市及周邊土地面積約2 130 km2, 約占全市土地面積的17%, 耕地面積約7×104hm2, 約占全市耕地面積的32%, 但該地區(qū)水資源量還不足全市的1/5, 可利用水資源量不足以支撐玉林市核心區(qū)域的經(jīng)濟(jì)社會發(fā)展。玉林市2019年農(nóng)林牧漁業(yè)總產(chǎn)值為546.8億元, 第一產(chǎn)業(yè)生產(chǎn)總值指數(shù)為103.6%, 年總用水量為24.2億 m3, 其中農(nóng)業(yè)灌溉用水量為16.75億 m3。2009—2019年玉林市農(nóng)業(yè)灌溉用水總量及農(nóng)林牧漁業(yè)總產(chǎn)值見表1。
表1 2009—2019年玉林市農(nóng)田灌溉用水量及農(nóng)林牧漁業(yè)總產(chǎn)值
根據(jù)《農(nóng)林牧漁業(yè)及農(nóng)村居民生活用水定額》(DB45/T 804—2019)及《玉林市水資源綜合規(guī)劃(2016—2030)》, 采用保證率p=75%時各類作物灌溉定額、 灌溉水利用系數(shù)和各類作物灌溉面積, 見表2; 依據(jù)《玉林市養(yǎng)殖水域規(guī)劃》《玉林市水資源綜合規(guī)劃(2016—2030)》《農(nóng)林牧漁業(yè)及農(nóng)村居民生活用水定額》(DB45/T 804—2019)確定規(guī)劃水平年全市的魚塘面積、 牲畜數(shù)量以及漁畜業(yè)用水定額, 見表3。
表2 2020、 2030年玉林市農(nóng)田灌溉用水量定額指標(biāo)
表3 2020、 2030年玉林市漁畜業(yè)用水量定額指標(biāo)
確定性方法給出的是點預(yù)測值, 但水資源調(diào)查和使用中不可避免地存在大量不確定因素, 點估計值與客觀實際情況之間存在一定的不兼容性?;诓煌椒A(yù)測結(jié)果的統(tǒng)計分析, 可在一定程度上改善單一方法造成的結(jié)果偏差。本文使用定額法、 趨勢分析法、 BP神經(jīng)網(wǎng)絡(luò)模型、 灰色模型、 ARIMA模型5種方法組合以及統(tǒng)計分析對需水量進(jìn)行區(qū)間預(yù)測。定額法采用經(jīng)濟(jì)社會發(fā)展指標(biāo)和相應(yīng)的定額預(yù)測需水量, 是需水預(yù)測中的常用方法。趨勢分析法基于歷史數(shù)據(jù), 利用增長曲線進(jìn)行擬合預(yù)測。BP神經(jīng)網(wǎng)絡(luò)模型不僅進(jìn)行信號正向傳播, 同時還進(jìn)行誤差的反向傳播, 是一種具有自學(xué)習(xí)、 非線性和自組織、 大規(guī)模并行等優(yōu)點的人工神經(jīng)網(wǎng)絡(luò)模型。灰色預(yù)測模型所需樣本量少、 樣本無需規(guī)律性分布, 且可以通過對時間序列進(jìn)行分析和擬合、 估計出合適的模型系數(shù), 從而進(jìn)行數(shù)據(jù)預(yù)測。
使用定額法預(yù)測農(nóng)田灌溉需水量需要3個重要因素: 各種類型作物的凈灌溉定額、 灌溉水利用系數(shù)、 灌溉面積[15]。農(nóng)田灌溉用水定額法的需水量[16]
Q農(nóng)田灌溉=∑(ωiυi)/λi,
(1)
其中:Q農(nóng)田灌溉為規(guī)劃水平年農(nóng)田灌溉需水量, 億m3;i表示作物類型;ωi表示各類作物灌溉定額, m3/hm2;υi為各類作物灌溉面積, 萬 hm2;λi為灌溉水利用系數(shù)。
參考DB45/T 804—2019, 漁業(yè)用水定額法的漁業(yè)需水量
Q漁業(yè)=∑(PiAi),
(2)
其中:Q漁業(yè)為規(guī)劃水平年漁業(yè)需水量, 億m3;i表示魚的類型;Pi為養(yǎng)殖場年內(nèi)單位養(yǎng)殖面積補(bǔ)水量定額, m3·hm-2·a-1;Ai為補(bǔ)水面積, hm2。
參考DB45/T 804—2019, 畜禽用水定額法的畜禽需水量
Q畜禽=∑(WiNiTi)/1 000,
(3)
其中:Q畜禽為規(guī)劃水平年畜禽需水量, 億 m3;i表示畜禽類型;Wi為各類牲畜、 家禽用水定額, L·只-1·d-1;Ni為養(yǎng)殖數(shù)量, 只;Ti為各類牲畜、 家禽生育期天數(shù), d。
綜上,Q農(nóng)業(yè)需水量=Q農(nóng)田灌溉+Q漁業(yè)+Q畜禽。
采用趨勢分析法預(yù)測農(nóng)業(yè)需水量主要是通過對比時間序列上的農(nóng)業(yè)需水量, 明確其變動增減的方向與幅度。在不同類型的趨勢線中選擇R2最大, 擬合程度最高的多項式曲線。
BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程包括正向傳播和反向傳播, 分為輸入模式順傳播、 輸出誤差逆?zhèn)鞑ァ?循環(huán)記憶訓(xùn)練、 學(xué)習(xí)結(jié)果判別4部分。正向傳播中, 輸入信息經(jīng)過輸入層傳遞到隱含層, 經(jīng)過函數(shù)計算后傳向輸出層; 若輸出層未得到期望輸出的結(jié)果, 則進(jìn)行反向傳播, 將誤差信號返回, 根據(jù)修改各層神經(jīng)元的權(quán)值和閾值調(diào)整誤差, 直到誤差小于期望值后才終止學(xué)習(xí)過程。
本文構(gòu)建了一個3層的BP神經(jīng)網(wǎng)絡(luò)模型, 其中輸入層節(jié)點數(shù)為3, 隱含層節(jié)點數(shù)為8, 輸出層節(jié)點數(shù)為1, 期望均方差為1×10-3。通過主成分分析可知, 有效灌溉面積和糧食作物產(chǎn)量對農(nóng)業(yè)需水量影響很大, 在分析農(nóng)業(yè)需水量時具有重要意義, 因此將兩者作為影響因素, 根據(jù)2007—2019年的有效灌溉面積、 糧食作物產(chǎn)量和農(nóng)業(yè)用水量的數(shù)據(jù)對規(guī)劃水平年2030年的農(nóng)業(yè)需水量進(jìn)行預(yù)測。
灰色模型是運(yùn)用灰色系統(tǒng)理論研究部分信息已知、 部分信息未知的不確定性系統(tǒng), 通過對已知部分的挖掘, 實現(xiàn)對演化規(guī)律的正確描述。本文使用的GM(1,1)模型是一階一個變量的灰色預(yù)測模型, 可利用較少的數(shù)據(jù)預(yù)測較多的序列[18]。
ARIMA模型全稱為自回歸積分滑動平均模型(auto-regressive integrated moving average model), 是一種將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列, 通過確定模型的參數(shù)和階數(shù)來進(jìn)行時間序列預(yù)測的統(tǒng)計模型。ARIMA模型也記作ARIMA(p,d,q), 3個參數(shù)分別是時序數(shù)據(jù)本身的滯后數(shù)、 時序數(shù)據(jù)需要進(jìn)行差分化的階數(shù)和預(yù)測誤差的滯后數(shù)。ARIMA用數(shù)學(xué)形式可表示為
(4)
將5種方法計算結(jié)果的最大、 最小值作為區(qū)間上下限, 使用RAND函數(shù)產(chǎn)生100個隨機(jī)數(shù), 并對所得的隨機(jī)數(shù)進(jìn)行正態(tài)檢驗。若隨機(jī)數(shù)不符合正態(tài)分布則運(yùn)用Minitab軟件, 使用Johnson變換函數(shù)對隨機(jī)數(shù)進(jìn)行正態(tài)轉(zhuǎn)化[14]。經(jīng)檢驗確認(rèn), 轉(zhuǎn)換后的數(shù)據(jù)符合正態(tài)分布X′~N(μ,σ2), 對轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行95%置信區(qū)間的求解, 具體步驟如下:
①構(gòu)造一個符合自由度為n-1的t分布的隨機(jī)數(shù)列
(5)
(6)
②根據(jù)給定的置信水平95%, 查t分布表得tα/2(n-1)值, 可對置信區(qū)間進(jìn)行計算
(7)
在求得區(qū)間的上下限后, 可通過正態(tài)轉(zhuǎn)換前后數(shù)據(jù)的關(guān)系式推求確定5種方法組合的95%置信區(qū)間預(yù)測值。
利用定額法、 趨勢分析法、 BP神經(jīng)網(wǎng)絡(luò)模型、 灰色模型和ARIMA模型預(yù)測玉林市2030年農(nóng)業(yè)需水量, 結(jié)果見表4。
表4 2030年玉林市農(nóng)業(yè)需水量預(yù)測結(jié)果
定額法是采用式(1)~(3)計算的各類需水量的總和。
趨勢分析法根據(jù)趨勢線方程預(yù)測玉林市規(guī)劃水平年農(nóng)業(yè)需水量
y=0.002 4x2+0.079 5x+15.403,
(8)
式中:y為農(nóng)業(yè)需水量, 億 m3;x為從2001年開始的時間序列號, 趨勢線見圖1。
圖1 農(nóng)業(yè)需水量趨勢分析Fig.1 Analysis of agricultural water consumption trend
利用BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測玉林市規(guī)劃水平年農(nóng)業(yè)需水量, 在迭代1 921次后達(dá)到理想效果, 誤差為9.96×10-4, 2007—2019年農(nóng)業(yè)用水量的預(yù)測值與實際值如圖2。
圖2 2007—2019年農(nóng)業(yè)用水量實際值與預(yù)測結(jié)果比較Fig.2 Comparison of actual and forecast values of agricultural water consumption from 2007 to 2019
利用灰色模型預(yù)測玉林市規(guī)劃水平年農(nóng)業(yè)需水量, 采用玉林市2001—2019年農(nóng)業(yè)用水量數(shù)據(jù)建立模型, 計算結(jié)果的絕對誤差為70.29%, 相對誤差為0.04%, 小誤差概率p>0.7, 且方差比c<0.65。
利用ARIMA模型預(yù)測玉林市規(guī)劃水平年農(nóng)業(yè)需水量, 采用2001—2019年的時間序列, 殘差檢驗結(jié)果為194.49×10-2, 接近于2, 殘差接近正態(tài)分布且相互獨立。將19個數(shù)據(jù)用于訓(xùn)練, 運(yùn)算結(jié)果落在95%置信區(qū)間, 2030年的預(yù)測值符合要求。
將以上5種方法的預(yù)測結(jié)果的最大、 最小值作為規(guī)劃水平年2030年的玉林市農(nóng)業(yè)需水量預(yù)測范圍, 即2030年的農(nóng)業(yè)需水量為16.34億~19.95億 m3。使用RAND函數(shù)產(chǎn)生區(qū)間內(nèi)的100個隨機(jī)數(shù)并進(jìn)行正態(tài)分布檢驗。發(fā)現(xiàn)玉林市2030年的預(yù)測值區(qū)間隨機(jī)數(shù)不符合正態(tài)分布, 故對它們進(jìn)行正態(tài)分布轉(zhuǎn)化
(9)
所得的隨機(jī)數(shù)頻率分布如圖3所示。
圖3 2030年隨機(jī)數(shù)頻率分布Fig.3 Frequency distribution of random numbers in 2030
正態(tài)轉(zhuǎn)換后的隨機(jī)數(shù)呈現(xiàn)出正態(tài)分布特征,P值為0.912, 可知轉(zhuǎn)換后的數(shù)據(jù)符合正態(tài)分布, 再進(jìn)行95%置信區(qū)間求解, 計算結(jié)果見表5。
表5 2030年正態(tài)分布數(shù)據(jù)的置信區(qū)間
由式(9)中X′和X的對應(yīng)關(guān)系可計算出玉林市2030年農(nóng)業(yè)需水量預(yù)測值的95%置信區(qū)間為17.84億~18.37億 m3。
為了驗證方法的有效性和優(yōu)越性, 組合定額法、 回歸分析法和系統(tǒng)動力學(xué)法對玉林市2020年農(nóng)業(yè)需水量預(yù)測值進(jìn)行比較。定額法值根據(jù)式(1)~(3)進(jìn)行計算。由回歸分析法可知,糧食產(chǎn)量對玉林市農(nóng)業(yè)用水量有較大影響,將其作為農(nóng)業(yè)需水的影響因素,采用冪函數(shù)分析糧食產(chǎn)量隨時間變化規(guī)律,擬合度為0.64。
Y=-0.002 5(lnX)3+0.142 3(lnX)2-
0.101 2lnX+11.727 8,
(10)
X=255.69x0.258 9,
(11)
式中:Y為農(nóng)業(yè)需水量,億 m3;X為糧食作物產(chǎn)量,萬 t;x為時間(為減小誤差,以1,2,3,…,22代替)。農(nóng)業(yè)需水量SPSS回歸分析顯著性水平小于0.05,回歸方程合理。
系統(tǒng)動力學(xué)法利用Vensim PLE軟件建模模擬農(nóng)業(yè)需水量[20]。Vensim模擬中一階方程的基本形式為
LK=LJ+ΔTVKJ,
(12)
式中:LK、LJ為K、J時刻的狀態(tài)變量;ΔT為時間間隔;VKJ為J時刻到K時刻的速率變化向量。
本文Vensim模型模擬年限為2010—2030年, 模擬步長設(shè)為1 a, 以2009年數(shù)據(jù)作為初始計算值, 初始農(nóng)業(yè)總產(chǎn)值為257.21億元, 初始農(nóng)業(yè)灌溉面積為14.64萬 hm2。為防止結(jié)果溢出, 建模時參考《玉林市水資源綜合規(guī)劃(2016—2030)》中2030年農(nóng)業(yè)總產(chǎn)值為477.60億元, 農(nóng)業(yè)灌溉面積為16.14萬 hm2。
模型中農(nóng)業(yè)總產(chǎn)值Y與農(nóng)業(yè)灌溉面積X隨時間變化的變化規(guī)律由模型內(nèi)置表函數(shù)決定
Y=WITHLOOKUP(X,{[(xmin,ymin)~(xmax,ymax)]}),
(13)
式中,x為時間,y為增長率。
采用定額法、 回歸分析法和系統(tǒng)動力學(xué)法對2020年玉林市農(nóng)業(yè)需水量的預(yù)測結(jié)果如表6所示。將3種方法計算的結(jié)果確定為農(nóng)業(yè)需水預(yù)測范圍,即15.96億~20.73億 m3,在區(qū)間范圍內(nèi)隨機(jī)產(chǎn)生數(shù)據(jù)進(jìn)行正態(tài)檢驗,結(jié)果表明隨機(jī)數(shù)P值為0.015<0.05,因此,需對數(shù)據(jù)進(jìn)行正態(tài)轉(zhuǎn)化后計算其95%置信區(qū)間,得到2020年玉林市農(nóng)業(yè)需水量的置信區(qū)間為18.027 3億~18.697 6億 m3。
表6 3種方法對2020年玉林市農(nóng)業(yè)需水量的預(yù)測
使用本文的5種方法組合對2020年玉林市農(nóng)業(yè)需水量的預(yù)測結(jié)果如表7所示。
表7 5種方法對2020年玉林市農(nóng)業(yè)需水量的預(yù)測
將以上5種方法預(yù)測結(jié)果范圍作為2020年玉林市農(nóng)業(yè)需水量預(yù)測范圍, 即17.15億~20.73億 m3, 通過正態(tài)檢驗及正態(tài)轉(zhuǎn)化后計算其95%置信區(qū)間, 得到2020年玉林市農(nóng)業(yè)需水量的置信區(qū)間為18.73億~19.30億 m3。根據(jù)《玉林市水資源綜合規(guī)劃(2016—2030)》, 2020年農(nóng)業(yè)需水量的預(yù)測值為18.80億 m3, 該數(shù)值在本文方法預(yù)測區(qū)間, 而不屬于定額法、 回歸分析法和系統(tǒng)動力學(xué)法組合計算的預(yù)測區(qū)間。通過比較說明, 本文使用的確定性與不確定性組合區(qū)間預(yù)測方法是可行的, 并具有一定的優(yōu)越性。另外, 本文使用的BP神經(jīng)網(wǎng)絡(luò)考慮了需水量的影響因素, 具有一定基于系統(tǒng)動力學(xué)法考慮要素間的因果制約關(guān)系進(jìn)行預(yù)測的優(yōu)點, 同時通過不斷迭代計算提高了結(jié)果精度。
綜上, 由計算結(jié)果可知, 本文預(yù)測的區(qū)間有95%的可能包含了實際農(nóng)業(yè)用水量, 預(yù)測值具有較高的預(yù)測準(zhǔn)確性, 且在5種方法預(yù)測的需水量相差較大的情況下, 最終計算結(jié)果的區(qū)間范圍較小, 說明本文提出的方法適用于區(qū)域的需水量區(qū)間計算, 并可后續(xù)的水資源配置提供科學(xué)依據(jù)。
(1)本文采用定額法、 趨勢分析法、 BP神經(jīng)網(wǎng)絡(luò)模型、 灰色模型、 ARIMA模型5種方法進(jìn)行玉林市農(nóng)業(yè)需水量預(yù)測, 并利用置信區(qū)間估計理論進(jìn)行不確定性預(yù)測, 結(jié)果表明, 在95%的置信水平下規(guī)劃水平年2030年的農(nóng)業(yè)需水量的置信區(qū)間為17.84億~18.37億 m3。與傳統(tǒng)取最大最小值作為區(qū)間上下限的方法比較, 本文確定的置信區(qū)間范圍更小, 提高了預(yù)測的精度。
(2)組合定額法、 回歸分析法和系統(tǒng)動力學(xué)法3種方法應(yīng)用于玉林市2020年農(nóng)業(yè)需水量預(yù)測, 將其計算結(jié)果與本文方法計算結(jié)果進(jìn)行對比, 本文的預(yù)測結(jié)果符合實際規(guī)劃, 具有較高科學(xué)性和可行性。
(3)影響需水量的因素眾多, 本文使用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行需水量預(yù)測時, 只是基于主成分分析法確定輸入因素并建模, 對于因素輸入的選擇還可以進(jìn)一步研究。另外, 樣本的數(shù)據(jù)量較少, 在一定程度上限制了預(yù)測模型的精度, 今后也可嘗試在更多數(shù)據(jù)的基礎(chǔ)上, 考慮賦予不同預(yù)測方法科學(xué)的權(quán)重因子對需水量預(yù)測開展進(jìn)一步的研究。