曾思明,吳杰康2,陳永進,趙俊浩2,翁興航
(1.廣東電網(wǎng)有限責任公司韶關供電局,廣東 韶關 512000; 2.廣東工業(yè)大學自動化學院,廣東 廣州 510006)
韶關市地理位置是在廣東省的中北部,由于地處溫帶而且受濕潤的季風氣候影響[1],所以全年降水量充足,而且河流數(shù)目非常多,水量以及水力資源都十分豐富,非常有利于小水電的開發(fā)與建造。
其中,南水河作為韶關主要河流之一,其集水面積是1489 km2,多年的平均年徑流量是1.34×109m3,由于南水河地貌的特點為峽谷非常多、河流落差較大,所以流域內(nèi)已經(jīng)建造了中大型的水庫[2]。因此,如果能對南水河的徑流量進行研究以及準確的預測,對于合理利用南水河的水資源有著重要的意義,也為開發(fā)小水電提供重要的科學依據(jù)。
近年來,許多學者已經(jīng)使用了多種預測方法對徑流量進行了預測與研究[3-6]。例如針對流溪河水庫,文獻[7]使用BP神經(jīng)網(wǎng)絡方法預測該水庫的徑流量。文獻[8]以石泉水庫為例,研究了BP神經(jīng)網(wǎng)絡以及馬爾科夫預測的優(yōu)劣,提出了BP神經(jīng)網(wǎng)絡馬爾科夫模型來預測河流徑流量。文獻[9]采用灰色系統(tǒng)理論中的GM(1,1)模型,研究了黃河年徑流量的變化特點,擬合并預測了唐乃亥河花園口的年徑流量。在此基礎上,文獻[10]結合了R/S分析,采用R/S灰色預測的方法對黑河出山年徑流量進行預測。文獻[11]使用了支持向量機預測模型,以黃河上游蘭州站為例,預測該水文站的年徑流量。文獻[12]則在支持向量機的基礎上作出了改進,將改進后的模型應用在開都河年徑流量的預測上。綜合上述學者的研究,現(xiàn)在用于徑流量的預測基本是利用多年的徑流量數(shù)據(jù)作為模型的輸入輸出,利用各種算法找到輸入輸出之間的數(shù)學關系,以此來擬合并預測河流的徑流量。
由于不同預測模型都有自己不一樣的特點,如何在某一地點選擇恰當?shù)念A測模型成為評估該地區(qū)水資源的一個難點。下面首先分析了灰色系統(tǒng)預測、基于遺傳算法神經(jīng)網(wǎng)絡以及支持向量機3種預測方法對韶關市南水河徑流量預測結果;然后對比3種方法的預測值與實際值的誤差;最后評價各模型的性能,為研究南水河區(qū)域水資源以及評估該區(qū)域水資源豐富度提供科學的決策依據(jù),對于在該區(qū)域研究以及建立微電網(wǎng)有著重要的意義。
由于韶關市南水河的徑流量數(shù)據(jù)較少,而且該河流徑流量的隨機性以及波動性較大,為了更好研究韶關水資源的變化趨勢,在預測方法中,采用了灰色系統(tǒng)理論中的GM(1,1)模型、基于遺傳算法的BP神經(jīng)網(wǎng)絡以及支持向量機3種方法對南水河的年徑流量進行擬合以及預測。
在傳統(tǒng)的系統(tǒng)行為分析中,大多數(shù)的數(shù)據(jù)分析法都是要通過分析大量的歷史數(shù)據(jù),從中得到數(shù)據(jù)相關的數(shù)學規(guī)律。但是對于徑流量這一物理量來說,其變化一般是隨機波動的且歷史數(shù)據(jù)量難以獲取。而在灰色系統(tǒng)中,其預測方法是可以從少量的數(shù)據(jù)尋找系統(tǒng)的變化規(guī)律,并且灰色預測方法計算較為簡單,所以首先使用灰色系統(tǒng)理論中的GM(1,1)模型[13-15],并在此模型基礎上作出改進用于徑流量的預測。
1.1.1 GM(1,1)模型
GM(1,1)模型所對應的白化形式微分方程為
(1)
(2)
(3)
(4)
求解模型的微分方程,可以得到徑流量的預測模型方程為
k=0,1,2,...,n
(5)
1.1.2 改進GM(1,1)模型
由于GM(1,1)模型只能應用于一階線性微分方程,但是南水河的年徑流量的變化是不符合這一條件的,直接使用GM(1,1)模型對南水河的年徑流量進行預測是很難得到一個理想結果的,需對GM(1,1)模型進行改進。具體步驟如下:
1)在坐標軸上繪出南水河年徑流量的逐年變化曲線圖;
(6)
3)作閾值L與曲線的交點圖,可以得到遞增的時間序列;
4)將GM(1,1)模型用在該時間序列中,得到該閾值的預測模型;
5)作出其他閾值的GM(1,1)預測模型;
6)根據(jù)上述得到的一系列預測模型,作出徑流量的預測圖。
由于BP神經(jīng)網(wǎng)絡在全局中的搜索能力差,比較容易陷入局部極值且算法的收斂速度較慢,當BP神經(jīng)網(wǎng)絡的權值和閾值選擇不恰當?shù)臅r候,網(wǎng)絡輸出的結果不理想,模擬精度較低,誤差較大。所以針對徑流量的預測,利用遺傳算法在全局搜索能力強且速度較快的優(yōu)點,將BP神經(jīng)網(wǎng)絡的權值和閾值放進遺傳算法中進行優(yōu)化,以BP神經(jīng)網(wǎng)絡輸出的徑流量預測值與實際值的誤差作為遺傳算法的適應度函數(shù),得出最優(yōu)的權值閾值。最后使用BP神經(jīng)網(wǎng)絡在這一組權值和閾值中進行仿真,得到最后的徑流量預測輸出值[16-20]。該優(yōu)化模型的具體步驟如圖1所示。
圖1 基于遺傳算法的BP神經(jīng)網(wǎng)絡流程
在統(tǒng)計學習的理論當中,認為當經(jīng)驗風險函數(shù)最小的時候,模型對于訓練集的學習是最好的。但是這存在著約束條件,訓練樣本的數(shù)目需要足夠大,這樣經(jīng)驗風險最小化的模型才能夠更好地進行學習。當訓練樣本較少的時候,根據(jù)這一經(jīng)驗風險最小化的理論來對模型進行訓練則會出現(xiàn)過擬合。1995年,Corinna Cortes和Vapnik兩位學者首次提出了支持向量機這一概念,這是基于上述統(tǒng)計學習理論所提出的一種新的算法。他們認為當某一數(shù)據(jù)集遵循某一規(guī)律分布的時候,如果要使得模型的實際輸出值能更好地模擬實際值,就要使得結構風險最小化,而不是經(jīng)驗風險最小化。而支持向量機(support vector machine,SVM)則能很好地實現(xiàn)這一結構風險最小化的理論,在小樣本的條件下,支持向量機可以在統(tǒng)計學習中的分類和回歸的研究中起到非常理想的效果[21-25]。
支持向量機回歸(support vector regression,SVR)是使用核函數(shù)將樣本數(shù)據(jù)從地位空間映射到高維空間,然后在這個高維空間求解問題的回歸方程。SVR對于徑流量的預測回歸步驟如下:
1)利用多年的徑流量數(shù)據(jù),徑流量的回歸預測函數(shù)在高維空間的形式為
f(x)=ωx+b
(7)
式中:ω是權值向量;b為偏置量。
2)若樣本數(shù)據(jù)點在超平面與支持向量之間,則認為該數(shù)據(jù)點沒有損失,定義如下:
(8)
式中:y為實際的徑流量;ε為反應允許偏差的參數(shù)。
3)引入松弛系數(shù),則徑流量回歸問題可以表示為
(9)
(10)
4)根據(jù)拉格朗日乘子,將徑流量回歸問題變成對偶形式:
(11)
(12)
5)最后求解可得徑流量回歸預測函數(shù)為
表1 南水河年徑流量預測模型
(13)
為了對比上述3種方法對于徑流量預測的結果,以韶關市的南水河為研究對象,利用Matlab軟件[26-28]分別使用灰色預測、基于遺傳算法的BP神經(jīng)網(wǎng)絡以及支持向量機對南水河1978—2015的年徑流量進行仿真研究。
由于根據(jù)南水河1978—2010年徑流量的數(shù)據(jù),該河域在這33年最大流量為1.451×109m3,最小流量為5.35×108m3,所以使用灰色預測時,在設定閾值時,從最小值開始每次往上增加0.5×108m3,直到最大值,且當某些年份沒有相對應的閾值,則設定該年份實際值也作為一個閾值,要求每個閾值對應的樣本數(shù)不少于4個,因此對于南水河一共建立了14個模型,結果如表1所示。
圖2是灰色預測對南水河徑流量的擬合值與實際徑流量的對比,可以看出擬合出來的曲線大部分年份的擬合值與實際值相差不大,灰色系統(tǒng)對于南水河年徑流量的擬合精度為84.24%,而且擬合曲線與實際曲線的變化趨勢基本一致,可見灰色系統(tǒng)可以較好擬合出南水河年徑流量。表2為利用灰色系統(tǒng)的預測模型對2011—2015年南水河年徑流量進行預測。根據(jù)水文預報的標準(誤差低于20%)來看,可見預測的合格率為80%,而且最高年份的誤差為22.80%,最低誤差為2.71%,因此灰色預測模型對于南水河年徑流量的預測結果較為理想。
對于南水河的年徑流量預測,使用基于遺傳算法的BP神經(jīng)網(wǎng)絡是在Matlab軟件下進行實驗編程仿真的,具體參數(shù)設置如下:遺傳算法中適應度函數(shù)選為模型輸出值與實際徑流量的誤差;個體數(shù)目為50;選擇方法采用隨機遍歷采樣方法;最大遺傳代數(shù)設為100代;代溝為0.95;使用單點交叉算子以及離散變異算子,交叉概率以及變異概率的參數(shù)分別為0.7和0.001。在BP神經(jīng)網(wǎng)絡中使用3層網(wǎng)絡,使用traingdm作為網(wǎng)絡的訓練函數(shù),隱含層的激活函數(shù)選擇S型的正切函數(shù),輸出層則選擇純線性函數(shù)作為激活函數(shù),迭代次數(shù)為1000,徑流量預測誤差取值為0.001,學習速率則設為0.001。
圖2 灰色預測徑流量擬合值與實際值的比較
年份預測值/(108 m3)實際值/(108 m3)誤差/(108 m3)相對誤差/%201110.188.29-1.8922.80201210.5011.140.645.75201311.1111.420.312.71201411.809.961.8418.4720158.009.461.4615.43
經(jīng)過Matlab對于GA-BP神經(jīng)網(wǎng)絡對南水河年徑流量的仿真,如表3所示,可以知道GA-BP神經(jīng)網(wǎng)絡對于南水河往年徑流量的擬合誤差過大,有部分年份誤差甚至超過100%,所以此模型不適用于南水河徑流量的擬合。但是從表3可以看出,GA-BP神經(jīng)網(wǎng)絡對于未來年份徑流量的預測中,除了2012年的相對誤差為38.45%,其他年份以水文預報誤差標準來看,都是滿足水文預報的標準的,該模型對于這4年的預測都是合格的。
表3 GA-BP神經(jīng)網(wǎng)絡徑流量預測結果
在對南水河年徑流量預測的支持向量機模型中,采用1978—2010年作為模型的訓練集,2011—2015年作為模型的測試集。支持向量機的具體參數(shù)設定為:核函數(shù)類型選擇RBF徑向基函數(shù);SVM設置類型選為epsilon-SVR回歸分析,設置損失函數(shù)p為0.01;核函數(shù)的gamma參數(shù)設為0.022 097,懲罰系數(shù)設為1024。在Matlab軟件的環(huán)境下進行徑流量的擬合預測仿真。
圖3為支持向量機對南水河1984—2010年徑流量的擬合圖??梢娭С窒蛄繖C模型對于這27年的擬合結果非常接近,除了少量年份外,其他年份的擬合值與實際值基本重合,支持向量機對于南水河往年年徑流量擬合的平均精度為95.67%。根據(jù)水文預測的相對誤差標準,其中只有1年的擬合值相對誤差大于20%,合格率達到96%,故支持向量機模型用于南水河年徑流量的擬合效果非常理想。
圖3 支持向量機徑流量輸出值與實際值的比較
表4為支持向量機徑流量預測,從表中可以看出,支持向量機對2011—2015年南水河徑流量的預測值與實際值的變化趨勢基本一致,除了2011年誤差為3.05%之外,其他4年誤差低于1%,因此該支持向量機徑流量預測模型用于韶關南水河十分合適,預測效果非常理想。
表4 支持向量機徑流量預測結果
圖4為利用上述支持向量機模型對南水河未來年份進行預測,可以看出,2016—2025年南水河年徑流量的波動趨勢基本與往年一致,其中最大年徑流量是2019年的1.197×109m3,最小年徑流量預計在2025年,大小為5.29×108m3。
圖4 2016—2025年南水河年徑流量預測
1)灰色系統(tǒng)理論、基于遺傳算法的BP神經(jīng)網(wǎng)絡以及支持向量機3種方法對于南水河年徑流量的預測合格率都在80%以上。其中,基于遺傳算法的BP神經(jīng)網(wǎng)絡雖然預測合格率高,但是其對南水河往年徑流量的擬合度低,所以這種方法不適用于南水河徑流量的擬合?;疑到y(tǒng)理論則可以應用于南水河年徑流量的擬合及預測中,但其擬合精度以及預測精度不是非常高。而支持向量機無論是對南水河往年年徑流量的擬合,還是對年徑流量的預測,兩者的精度都非常高,所以支持向量機在南水河徑流量研究中的效果是十分理想的。
2)通過支持向量機對南水河2016—2025年的年徑流量的預測中,可以看出,該河域未來徑流量的變化趨勢基本與往年一致,說明南水河的水資源比較穩(wěn)定,對于微電網(wǎng)的建設來說,可以利用南水河水資源補給比較穩(wěn)定,建設合理數(shù)量以及容量的小水電站。