李志新,龍云墨
(貴州理工學(xué)院土木工程學(xué)院,貴州 貴陽 550003)
水資源是維持自然界生態(tài)系統(tǒng)不可或缺的基礎(chǔ)性資源之一,同時也是社會經(jīng)濟(jì)發(fā)展的重要因素,與水資源有關(guān)的水文現(xiàn)象及規(guī)律即水文水資源系統(tǒng)。作為水文水資源系統(tǒng)預(yù)測的重要部分,徑流預(yù)測是水文水資源系統(tǒng)運(yùn)行方案制定的依據(jù)之一,在水電站運(yùn)行、水庫調(diào)度、水資源保護(hù)與分配、防洪抗旱等方面有重要的應(yīng)用價值[1,2,3]。尤其是中長期徑流預(yù)測,可對能造成災(zāi)害損失的水文現(xiàn)象作出提前預(yù)報,從而預(yù)先采取措施將損失降至最低,對防洪減災(zāi)具有重要意義;在水庫調(diào)度和水電站運(yùn)行管理中,防洪與抗旱之間,或者蓄水與棄水之間存在一定程度矛盾關(guān)系,精度較高的中長期徑流預(yù)測,可優(yōu)化調(diào)度措施,使水資源綜合利用效益最大化[4,5,6]。
因此,為實現(xiàn)較高精度的中長期徑流預(yù)測,提出了各種方法,傳統(tǒng)常用的有成因分析、水文統(tǒng)計等方法。其中成因分析法預(yù)測徑流主要根據(jù)歷史大氣環(huán)流、海溫分布以及太陽活動信息等因素,影響徑流最重要的因子是降雨,而上述因素與降雨密切相關(guān)且通過降雨來影響徑流,因此利用上述關(guān)聯(lián)關(guān)系來對徑流進(jìn)行預(yù)測是研究熱點之一[5];而水文統(tǒng)計方法通過對歷史水文資料進(jìn)行統(tǒng)計分析進(jìn)行預(yù)測,如利用河川徑流系列自身時變特性規(guī)律預(yù)測,或?qū)搅饔绊懸蜃优c徑流相關(guān)性進(jìn)行多元回歸分析。以上方法不足之處是在確定輸入因子以及預(yù)測可能出現(xiàn)的極值難度較大[7,,8,9]。水文系統(tǒng)不確定因素眾多,且系統(tǒng)高度復(fù)雜、變化隨機(jī),具有高度非線性,故傳統(tǒng)線性方法為主模型的年徑流預(yù)測精度和效果還不夠理想[10,11,12]。
人工神經(jīng)網(wǎng)絡(luò)具有并行處理和自學(xué)習(xí)能力,容錯性能較強(qiáng),因而廣泛應(yīng)用于各領(lǐng)域,成效顯著。BP神經(jīng)網(wǎng)絡(luò)作為主流網(wǎng)絡(luò)之一,映射能力強(qiáng)、性能好,但也存在一些固有缺陷,其網(wǎng)絡(luò)結(jié)構(gòu)屬于靜態(tài)性質(zhì),對歷史輸入輸出值缺乏記憶聯(lián)想,對于時間系列如徑流系列時變特性的適應(yīng)能力不強(qiáng),從而影響其年徑流模擬預(yù)測效果[13,14,15]。因此,本文采用具有動態(tài)反饋性的有外部輸入非線性自回歸神經(jīng)網(wǎng)絡(luò)NARX,構(gòu)建基于NARX神經(jīng)網(wǎng)絡(luò)的年徑流量預(yù)測模型,并以年降雨量及氣溫為影響因子,利用1961—2017年構(gòu)皮灘站年徑流數(shù)據(jù)對其年徑流量變化規(guī)律進(jìn)行了實例研究分析,并對NARX和BP網(wǎng)絡(luò)模型預(yù)測性能進(jìn)行了對比分析。
NARX是帶有外部輸入的非線性自回歸網(wǎng)絡(luò),因而具有動態(tài)反饋性,即其輸出結(jié)果是當(dāng)前外部輸入和歷史輸出結(jié)果的非線性函數(shù),由于網(wǎng)絡(luò)結(jié)構(gòu)中存在時延以及反饋,因此NARX網(wǎng)絡(luò)對歷史信息有記憶和聯(lián)想功能,對時間序列的時變規(guī)律特性適應(yīng)能力強(qiáng)[16,17]。NARX網(wǎng)絡(luò)模型可表示如下:
y(t)=f(y(t-1),y(t-2),…,y(t-ny),u(t-1),u(t-2),…,u(t-nu))
(1)
式中,f為非線性函數(shù);y(t)為期望目標(biāo)向量;u(t)為外部輸入向量;y(t-1),y(t-2),…,y(t-ny)為時延后的期望目標(biāo)向量;u(t-1),u(t-2),…,u(t-nu)為時延后的外部輸入向量。NARX神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖示如下:
圖1 NARX神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
圖中u(t)為外部輸入向量;d為時延階數(shù);m為隱層神經(jīng)元數(shù)目;W和b分別為神經(jīng)網(wǎng)絡(luò)的權(quán)值及偏置;f1、f2則為各層激活函數(shù),其中隱層的激活函數(shù)f1選取tansig函數(shù),輸出層的激活函數(shù)f2選取purelin函數(shù),分別表示為下式:
(2)
f(x)=x
(3)
NARX神經(jīng)網(wǎng)絡(luò)訓(xùn)練采用的是Levenberg-Marquards算法,假設(shè)一個最大位移作為區(qū)域半徑,然后在該區(qū)域內(nèi)尋找代價函數(shù)的極小值點,若目標(biāo)代價函數(shù)值增大,則調(diào)整該區(qū)域半徑改變范圍,繼續(xù)求解;若目標(biāo)代價函數(shù)值減小,則繼續(xù)迭代計算[18,19,20]。
為了評價NARX神經(jīng)網(wǎng)絡(luò)模型模擬性能,本文采用以下評價指標(biāo):均方誤差MSE、相關(guān)系數(shù)R、誤差的自相關(guān)度及輸入與誤差的互相關(guān)度等[21,22,23]。其中均方誤差MSE反映了訓(xùn)練輸出值與目標(biāo)值之間的誤差,該值越小,則NARX神經(jīng)網(wǎng)絡(luò)模擬效果就越好,其表達(dá)式如下:
(4)
式中,N為訓(xùn)練樣本總數(shù);y(t)為期望輸出值;y’(t)為網(wǎng)絡(luò)訓(xùn)練輸出值。
相關(guān)系數(shù)R值范圍在0到1之間,該值越大,則說明模擬數(shù)據(jù)和實測數(shù)據(jù)相關(guān)度越高,模型的模擬精度也越高;誤差的自相關(guān)度表示的是模擬結(jié)果與實測數(shù)據(jù)之間的關(guān)聯(lián)度,不同時延下,誤差的自相關(guān)度值在置信限內(nèi)越多,則說明模擬效果越好;輸入與誤差的互相關(guān)度表示的是,在不同時延下,輸入與誤差之間的互關(guān)聯(lián)度,其值在置信限內(nèi)越多,則說明模擬效果越好[24,25]。
根據(jù)水量平衡原理,結(jié)合物理成因分析,降水、氣溫及下墊面是徑流形成、演變的主要因素,其中降水和氣溫因素變化相對較快,而降水又是最主要的因素。實測資料表明:年降水與年徑流曲線關(guān)系密切,一致性較強(qiáng),有研究采用相關(guān)概率法探討降水、氣溫與徑流之間的相關(guān)性,結(jié)果顯示相關(guān)關(guān)系顯著,可將其作為預(yù)測因子預(yù)報徑流[25,26]。因此本文選擇年年降水量及氣溫作為模型輸入因子,以年徑流量作為模型預(yù)測對象。
本文采用的是構(gòu)皮灘站1961—2017年共57年的年徑流量、降雨及氣溫資料系列。該站所在區(qū)域地形總體上東北較低,而西南較高,且其在垂直方向上的變化特征較明顯,高差大、切割強(qiáng)。該地屬中亞熱帶季風(fēng)氣候,季節(jié)性較顯著,溫和多雨,濕度較大,日照較少,平均氣溫為13℃~18℃,多年平均降雨為1 159 mm,年降雨量在900~1 400 mm之間。河流受降雨補(bǔ)給,洪水形成主要因素是暴雨,集中時間在5~10月,暴雨量占全年90%左右,尤其是6~7月最為集中,暴雨及匯流迅疾,因而洪水快速漲落且洪量集中。年徑流量等水文特征在下墊面條件變化不大時,其變化主要受降水和蒸發(fā)影響,實質(zhì)上受氣候變化過程等物理原因制約。
NARX神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)關(guān)鍵參數(shù)為隱含層節(jié)點數(shù)目以及輸入時延階數(shù),對神經(jīng)網(wǎng)絡(luò)模型的模擬精度效果影響較顯著,本文根據(jù)經(jīng)驗進(jìn)行初擬,并經(jīng)過反復(fù)試湊確定隱層神經(jīng)元數(shù)目m為10,時延階數(shù)d為3,輸入層x(t)以及輸出層y(t)向量維數(shù),取決于本文具體外部輸入向量和預(yù)測對象情況,分別為2和1。構(gòu)建的NARX神經(jīng)網(wǎng)絡(luò)年徑流預(yù)測模型拓?fù)浣Y(jié)構(gòu)如下圖所示:
圖2 NARX神經(jīng)網(wǎng)絡(luò)年徑流預(yù)測模型的拓?fù)浣Y(jié)構(gòu)
同時,在上述構(gòu)皮灘站1961—2017年共57年的年徑流量、降雨及氣溫資料系列共57組數(shù)據(jù)樣本中,按照各占總樣本數(shù)量55%、20%、25%的比例,選取31組作為訓(xùn)練集,12組作為驗證集以及14組作為測試集。其中訓(xùn)練集樣本在訓(xùn)練過程中輸入到網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)在完成初始化之后,根據(jù)輸出值與標(biāo)注值之間的誤差不斷進(jìn)行權(quán)值和偏置值的調(diào)整;驗證集樣本不直接參與到上述的訓(xùn)練調(diào)整,主要用于測度在訓(xùn)練過程中網(wǎng)絡(luò)泛化能力的表現(xiàn),在泛化能力停止改進(jìn)時就停止訓(xùn)練,從而防止神經(jīng)網(wǎng)絡(luò)訓(xùn)練中發(fā)生過擬合現(xiàn)象,導(dǎo)致泛化能力的下降;測試集樣本對訓(xùn)練過程不施加影響,而是在訓(xùn)練期間及訓(xùn)練后,作為獨(dú)立于訓(xùn)練的樣本數(shù)據(jù),對神經(jīng)網(wǎng)絡(luò)的性能進(jìn)行測試、分析及評價。
NARX神經(jīng)網(wǎng)絡(luò)模型的誤差自相關(guān)性、輸入誤差互相關(guān)性以及回歸分析分別如下圖3、4、5、6所示:
圖3 誤差自相關(guān)圖
圖4 輸入誤差互相關(guān)圖
圖5 NARX模型訓(xùn)練結(jié)果的相關(guān)性分析
由圖3、圖4以及圖5可以看出,誤差自相關(guān)和輸入誤差互相關(guān)在初始時,其關(guān)聯(lián)度較高,而其它大部分都在置信區(qū)間范圍內(nèi),故能滿足要求。另外,MSE值接近0;NARX模型訓(xùn)練及測試時,模擬結(jié)果與實測值的相關(guān)系數(shù)R值為0.94、0.89,較接近1,顯示模擬精度效果較好。
模擬結(jié)果值與實測數(shù)據(jù)的比較結(jié)果如下圖所示:
圖6 NARX模型預(yù)測結(jié)果的相關(guān)性分析
圖7 NARX模型訓(xùn)練輸出值與期望值的擬合
圖8 NARX模型預(yù)測值與實測值的擬合
從圖7、8中可以看出,預(yù)測值和實測值之間的誤差值總體較小,兩者之間擬合性表現(xiàn)良好,其中測試時數(shù)據(jù)擬合情況如下表1所示,表明利用NARX神經(jīng)網(wǎng)絡(luò)模型對年徑流預(yù)測是可行的,其精度效果較好。
為了對傳統(tǒng)常用的逐步線性回歸、BP神經(jīng)網(wǎng)絡(luò)與本文構(gòu)建的NARX神經(jīng)網(wǎng)絡(luò)年徑流預(yù)測模型進(jìn)行對比分析,本文對上述模型采用完全相同的數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練及測試。下表1反映了上述模型在年徑流預(yù)測性能方面的差異。
表1 NARX、BP、及逐步線性回歸模型預(yù)測性能對比
從表1比較中可以看出:共14組測試樣本的平均相對誤差、均方根誤差為:NARX模型分別為5.03%、54.81 mm;BP模型分別為7.71%、67.33 mm;而逐步線性回歸模型分別為12.09%、96.78 mm。因此,整體預(yù)測效果NARX模型性能表現(xiàn)最佳,以下依次為BP模型和逐步線性回歸模型。上述結(jié)果表明,神經(jīng)網(wǎng)絡(luò)模型徑流預(yù)測效果整體上優(yōu)于逐步線性回歸方法,人工智能方法和線性回歸方法原理和特點各異,神經(jīng)網(wǎng)絡(luò)方法更能精確反映和表達(dá)復(fù)雜系統(tǒng)中動態(tài)和非線性的映射關(guān)系。在徑流預(yù)測分析中,影響因子和預(yù)測對象是動態(tài)且高度非線性的關(guān)系,因此采用基于線性方法為主的模型存在一定局限性,在本文實例研究中,采用人工智能方法用于年徑流預(yù)測分析更為合理,預(yù)測精度更高,但該結(jié)論的普適應(yīng)仍有待進(jìn)一步探討。
表1比較分析還顯示:NARX模型預(yù)測性能表現(xiàn)優(yōu)于BP模型。徑流受到降水、氣候及下墊面等重要因素的影響,但徑流變化規(guī)律及其預(yù)測分析并不僅僅體現(xiàn)于徑流與影響因子的靜態(tài)關(guān)系,徑流及其影響因素同時具有時變特性規(guī)律,有一定的趨勢、周期和突變規(guī)律,因此對徑流的變化規(guī)律及預(yù)測分析研究僅從靜態(tài)聯(lián)系的角度反映是不夠的,同時也應(yīng)反映其時變特性規(guī)律,才能取得更好的預(yù)測分析效果。BP神經(jīng)網(wǎng)絡(luò)屬于靜態(tài)神經(jīng)網(wǎng)絡(luò),輸出僅依賴于當(dāng)前的輸入,僅根據(jù)當(dāng)前誤差調(diào)整權(quán)值。NARX神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)上增加了承接層,具備動態(tài)遞歸的特點,通過承接層保存某一層或者基層結(jié)點上一次的輸出,并作用于本次的計算,能充分體現(xiàn)數(shù)據(jù)的時序性,因而在具有時變特性的年徑流預(yù)測分析中,采用如NARX動態(tài)遞歸神經(jīng)網(wǎng)絡(luò)比BP靜態(tài)網(wǎng)絡(luò)更為合理,從而能夠明顯改善年徑流預(yù)測效果。
本文針對傳統(tǒng)BP網(wǎng)絡(luò)靜態(tài)性質(zhì)在時間系列年徑流預(yù)測中的適應(yīng)性問題,提出基于動態(tài)反饋性的NARX神經(jīng)網(wǎng)絡(luò)的年徑流預(yù)測方法。將年降雨量及氣溫作為預(yù)測輸入因子、以年徑流量為預(yù)測對象,構(gòu)建了基于NARX神經(jīng)網(wǎng)絡(luò)的年徑流預(yù)測模型,對構(gòu)皮灘站年徑流模擬效果較好,可為時間系列年徑流預(yù)測實踐起到參考指導(dǎo)作用。另外,對NARX模型與傳統(tǒng)BP及逐步線性回歸模型的性能對比分析顯示:對于年徑流預(yù)測,人工智能方法相比基于線性方法的模型,其預(yù)測分析精度效果更好。同時,NARX神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果及預(yù)測精度明顯優(yōu)于BP網(wǎng)絡(luò),其由于具有動態(tài)反饋性質(zhì),因而對于時間系列預(yù)測具有更好的適應(yīng)性。