朱穎潔
(梧州水文中心,廣西 梧州 543002)
西江是中國七大江河之一珠江的第一大水系,干流自西向東流經(jīng)滇、黔、桂、粵4省(自治區(qū)),依次稱為紅水河、黔江、潯江,在梧州與西北來的桂江匯合后稱西江。西江水量占珠江的50%以上,西江上連滇黔,橫貫八桂,下接珠江水網(wǎng)直達港澳,與國際海運網(wǎng)對接,是構筑泛珠三角區(qū)域經(jīng)濟體系與建設中國—東盟自由貿(mào)易區(qū)的重要出海動脈,是名副其實的黃金水道。2014年8月1日,國家發(fā)改委正式印發(fā)《珠江-西江經(jīng)濟帶發(fā)展規(guī)劃》,珠江-西江經(jīng)濟帶發(fā)展正式上升為國家戰(zhàn)略。為了提升西江航運能力,提高航道通行效率,保障船舶運行安全,航道水位預測也變得日益迫切。水位預測是一個較復雜的非線性系統(tǒng),其動態(tài)受多種因素的影響,包括氣象、水文、地質(zhì)等。對西江水位的準確短期預測及航道管理及電子航道圖系統(tǒng)功能完善等方面具有重要的理論和實踐意義。
河道水位預測研究是新歷史時期下水文拓展服務的重要研究課題之一。趙思遠等[1]選用基于混合線性回歸模型的黑箱模型方法對黑龍江干流中上游段包括漠河、鷗浦、三道卡、長發(fā)屯、烏云、勤得利6個站點進行水位過程模擬;溫泉等[2]采用多元回歸模型,開展了長江中游水位短期預測預報研究;李小韻[3]利用多元門限回歸模型,建立了松花江干流肇源、三家子、澇洲、木蘭、富錦5個水位站的水位預報模型;余青容[4]研究“互聯(lián)網(wǎng)+”背景下長江航道水位預測;卞寧[5]利用改進型灰色系統(tǒng),預測長江航道水位;楊瑋[6]提出了優(yōu)化GM(1,1)模型與ARIMA 模型的混合預測算法,算法可有效應用于水位變化劇烈的站點(如長江上游朱沱站);余珍[7]建立了基于時間序列分析ARIMA模型的短時水位預測模型,預測長江中游河段航道水位變化;包紅軍等[8]基于人工神經(jīng)網(wǎng)絡,建立淮河中游河道水位預報多斷面實時校正模型;李永凱等[9]采用水文模型與水力學模型相結合的方法進行沮漳河河溶水文站洪峰水位預報;周勇強等[10]提出一種基于SFLA-CNN和LSTM的組合預測模型,應用于江蘇省太湖區(qū)域的水位預測,有效地提高了預測準確率;姬戰(zhàn)生等[11]基于二維卷積神經(jīng)網(wǎng)絡,構建了東苕溪瓶窯水文站水位預報方法;趙輝等[12]分別采用單—函數(shù)法、曲線插值法和多元線性擬合法計算三斗坪水位,并分析了其影響因素;劉濤等[13]采用分段套索最小角回歸交叉驗證算法預測長壽站水位;郁爽等[14]依據(jù)NARX神經(jīng)網(wǎng)絡模型對永定河北京段水位進行模擬預測。但是還沒有對西江黃金水道水位預測進行系統(tǒng)研究的成果。本文根據(jù)水位歷史觀測數(shù)據(jù),采用支持向量機數(shù)學建模的方法,建立了西江水位短期預測模型,提高了水位預測精度,全面提升西江航道管理服務的水平和能力,可為西江黃金水道的建設提供技術支撐,為西江流域國民經(jīng)濟的發(fā)展提供決策依據(jù)。
本文選取西江中游河段為研究區(qū)域,利用梧州站2018—2019年逐日平均水位觀測歷史數(shù)據(jù)。以2018年數(shù)據(jù)為訓練樣本,2019年數(shù)據(jù)作為驗證樣本,建立支持向量機日平均水位短期預測模型。
支持向量機(SVM,Support Vector Machine)建立在線性可分和結構風險最小原理基礎上,線性不可分時可把低維線性不可分轉為高維線性可分;同時能依據(jù)有限的樣本信息,在模型的復雜性和模型的學習能力之間尋求最優(yōu)方案,并確保最終模型具有良好的泛化能力[15]。SVM是一種良好的預測算法,本文采用支持向量機對西江梧州站水位進行預測研究。
對于線性情況,支持向量機函數(shù)擬合首先考慮利用線性回歸函數(shù)f(x)=ω·x+b擬合(xi,yi),i=1,2,…,n,xi∈Rn為輸入量,yi∈R為輸出量,即需要確定ω和b。
線性擬合函數(shù)為:
(1)
非線性SVR的基本思想是通過事先確定的非線性映射將輸入向量映射到一個高維特征空間(Hilbert空間)中,在此高維空間中再進行線性回歸,從而取得在原空間非線性回歸的效果。
非線性擬合函數(shù)的表示式為:
f(x)=ω·Φ(x)+b
(2)
研究利用納什效率系數(shù)(Nash-Sutcliffe efficiency coefficient,簡稱NSE)驗證SVM水文模型模擬結果的可靠性。根據(jù)《水文情報預報規(guī)范》(GB/T 22482—2008),NSE大于0.9時為甲等方案,介于0.7~0.9之間為乙等方案,介于0.5~0.7之間為丙等方案。
(3)
其中:
Qmi——某一時間段日平均水位的實測值;
Qsi——某一時間段日平均水位的模擬值;
根據(jù)西江水位變化的主要規(guī)律,綜合考慮資料獲取的可行性,將西江梧州站前4 d日平均水位作為系統(tǒng)輸入,以西江梧州站日平均水位作為系統(tǒng)輸出。因此,西江梧州站的水位模擬問題轉化為由4個輸入和1個輸出的支持向量機的數(shù)值模擬問題。研究基于R軟件的e1071軟件包,日尺度上對西江梧州站水位進行模擬。選取2018—2019年西江梧州站日平均水位數(shù)據(jù),建立支持向量機模型,預測梧州站日水位數(shù)據(jù)。
通過優(yōu)選分析,Sigmoid核函數(shù)比較適合西江梧州站日水位模擬,以總體方差最小為原則,對SVM gamma、cost和epsilon參數(shù)進行調(diào)試,結果如下:
Gamma=0.01;cost=10000;epsilon=0.1。
在西江梧州站日水位模擬訓練階段,利用2018年的資料進行模型參數(shù)調(diào)試并建立SVM模型,利用2019年資料進行模型預測檢驗,得到西江梧州站日水位數(shù)值模擬結果和絕對誤差分布示意(見圖1~圖4)。SVM模型模擬結果表明:在模型訓練階段和預測階段,汛期西江中游逐日平均水位波動頻繁、劇烈,導致汛期個別月份誤差較大,其他月份誤差較小;西江梧州站日水位序列數(shù)值模擬納什效率系數(shù)NSE均為0.999,均超過0.9的甲等方案標準,滿足日水位預報要求,具有較高的精度和可靠性,本文所建立的西江中游逐日平均水位SVM模型具有較好的短時預測能力。
圖1 日水位SVM模型訓練結果示意
圖2 日水位SVM模型絕對誤差分布示意
圖3 日水位SVM模型預測結果示意
圖4 日水位SVM模型預測結果絕對誤差分布示意
為了解日平均水位SVM模型實測值與模擬值之間的差別,研究利用模擬值與實測值建立了過原點的直線擬合方程(直線方程的截距為零,其形式為Y模擬值=KX實測值,方程均通過了置信度為99%的顯著性檢驗)。擬合直線方程的斜率K可近似代表模擬值與實測值的比值,若比值大于1說明模擬值整體大于實測值,比值小于1說明模擬值整體小于實測值,比值越接近1說明二者越接近。紅色的線為95%置信區(qū)間的上下界;在SVM模型訓練階段和預測階段(見圖5),日平均水位模擬值與實測值的比值分別為0.988 6和1.002 9,二者都非常接近于1。本文所建立的西江日平均水位SVM模型具有較好的短時預測能力。
圖5 西江梧州站日平均水位SVM模型實測值與模擬值的比較示意
將西江梧州站前4 d日平均水位作為自變量,以西江梧州站日平均水位作為因變量,分別利用SVM模型和自回歸模型進行了模擬預測,從模擬效果(見表1)可知,訓練階段和預測階段SVR模型的納什效率系數(shù)NSE均高于自回歸模型, SVM模型預測效果比自回歸模型好。
表1 SVM模型與自回歸模型納什效率系數(shù)對比
水位預測在提供航道維護管理效能、提升航道公共服務品質(zhì)等方面具有重要作用。針對水位時空變化影響因素多、規(guī)律復雜等,本文建立了西江中游梧州站基于支持向量機水位預測模型,以總體方差最小為原則優(yōu)選分析各模型變量,基于逐日平均歷史數(shù)據(jù)的變化趨勢,對2019年的日平均水位變化進行了預測,并與自回歸模型進行模擬效果對比分析,結果表明:西江梧州站日平均水位SVM模型預測效果比自回歸模型好;日平均水位SVM模型具有良好的短時預測能力,精度較高,可為船舶航線優(yōu)化、船舶合理配置、航道維護管理等提供技術支撐。