王燕,鐘建,張志遠(yuǎn)
(中國(guó)人民解放軍91001部隊(duì),北京100161)
海浪周期、波向、有效波高等海況特征是海洋工程建設(shè)、海上運(yùn)輸、環(huán)境保護(hù)和軍事行動(dòng)等活動(dòng)必須考慮的重要安全因素[1]。其中,海浪有效波高最為重要,其預(yù)測(cè)的時(shí)效和準(zhǔn)確性依然是目前亟需解決的關(guān)鍵問題。為提高海浪預(yù)測(cè)的準(zhǔn)確性,國(guó)內(nèi)外學(xué)者開展了不同的預(yù)測(cè)方法研究,主要有經(jīng)驗(yàn)?zāi)P?、?shù)值模擬[2]和機(jī)器學(xué)習(xí)法等?;诮?jīng)驗(yàn)?zāi)P?,通過(guò)先驗(yàn)?zāi)P图僭O(shè)進(jìn)行海浪預(yù)測(cè),例如自回歸移動(dòng)平均方法(Auto-Regression and Moving Average Model,ARMA),但預(yù)測(cè)能力有限?;跀?shù)值模型,例如海浪模型(WAve Model,WAM)[3]、近岸海浪數(shù)值模型(Sim-ulated WAves Nearshore,SWAN)[4]、第三代海浪模型(WAVEWATCH III)[5]和海浪數(shù)值模式(MArine Science and NUmerical Modeling,WASNUM)[6]等,通過(guò)求解海浪譜控制方程來(lái)模擬和預(yù)測(cè)海浪要素,該方法對(duì)于廣闊海域海浪具有顯著的預(yù)測(cè)能力,但對(duì)于復(fù)雜地形的近岸海域,其預(yù)測(cè)能力欠佳。
由于機(jī)器學(xué)習(xí)方法不受高性能計(jì)算和大樣本數(shù)據(jù)集輸入的限制,近年來(lái),人工神經(jīng)網(wǎng)絡(luò)[2,7-12]、模糊推理系統(tǒng)[2,13-14]和遺傳規(guī)劃[15-17]等機(jī)器學(xué)習(xí)方法被廣泛應(yīng)用于海浪要素預(yù)測(cè),有效彌補(bǔ)了其他兩種海浪預(yù)測(cè)方法的不足。支持向量機(jī)(Support Vector Machine,SVM)[18]作為一種新穎的機(jī)器學(xué)習(xí)方法,已廣泛用于海上活動(dòng)和沿海工程大氣海洋環(huán)境要素的預(yù)測(cè)。Mohandes等[19]利用SVM方法進(jìn)行風(fēng)速預(yù)測(cè)。Asefa等[20]利用SVM方法實(shí)現(xiàn)了對(duì)復(fù)雜海況的海流預(yù)測(cè)。Salcedo-Sanz等[21]利用SVM方法開展了風(fēng)電場(chǎng)風(fēng)力渦輪機(jī)中的風(fēng)速預(yù)測(cè)。Raghavendra等[22]詳細(xì)闡述了SVM方法在水文領(lǐng)域的應(yīng)用情況,并指出其對(duì)大氣海洋環(huán)境的預(yù)測(cè)能力已得到社會(huì)廣泛認(rèn)可。2009年,Mahjoobi等[1]利用支持向量回歸(Support Vector Regression,SVR)方法建立了海浪有效波高預(yù)測(cè)模型,將風(fēng)速作為輸入信息,并指出SVR方法對(duì)有效波高的預(yù)測(cè)技巧優(yōu)于人工神經(jīng)網(wǎng)絡(luò)模型、多層感知機(jī)模型和徑向基函數(shù)模型,且所需計(jì)算時(shí)間相對(duì)較少。
海浪通??煞譃轱L(fēng)浪和涌浪。風(fēng)浪是受局地風(fēng)影響的海浪,當(dāng)海浪傳播到遠(yuǎn)離其產(chǎn)生區(qū)域時(shí),或當(dāng)它們的傳播相速度超過(guò)局地風(fēng)速時(shí),則為涌浪[23]。由于涌浪的存在,如果在SVR預(yù)測(cè)模型中僅考慮風(fēng)速作為輸入信息,則無(wú)法達(dá)到最佳預(yù)測(cè)效果。針對(duì)這個(gè)問題,本文考慮歷史海浪狀態(tài)的影響,設(shè)計(jì)了多組風(fēng)浪信息組合方案,利用SVR方法建立了渤海海域有效波高預(yù)測(cè)模型,并開展不同風(fēng)浪信息組合對(duì)有效波高預(yù)測(cè)的敏感性試驗(yàn),分析對(duì)比不同輸入信息對(duì)有效波高預(yù)測(cè)技巧的影響。
渤海屬于我國(guó)內(nèi)陸海,海岸線崎嶇,島嶼眾多,地形、地貌復(fù)雜,對(duì)該海域近岸海浪的準(zhǔn)確預(yù)測(cè)存在較大難度。隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展和軍事實(shí)力的增強(qiáng),對(duì)渤海海域海浪的預(yù)測(cè)需求日益迫切。本文選取渤海海域?yàn)轭A(yù)測(cè)區(qū)域(見圖1),研究采用的觀測(cè)數(shù)據(jù)為近岸浮標(biāo)數(shù)據(jù)(121°40′48″E、38°9′31″N),觀測(cè)要素為海浪有效波高和10 m風(fēng)速,時(shí)間分辨率為1 h,時(shí)間區(qū)間為2012年11月15日—2013年2月15日。本文將觀測(cè)數(shù)據(jù)集分為兩組,第一組(810個(gè)樣本)用于預(yù)測(cè)模型訓(xùn)練,第二組(480個(gè)樣本)用于預(yù)測(cè)結(jié)果驗(yàn)證。
圖1 預(yù)測(cè)區(qū)域和浮標(biāo)位置(見黑色小框)
渤海灣屬于半封閉海,太平洋涌浪很難影響到渤海灣海域,因此該海域主要為風(fēng)浪。Pierson等指出風(fēng)速U和有效波高遵循如下經(jīng)驗(yàn)關(guān)系[24],
式中:g是重力加速度,U是10 m風(fēng)速?;谠擄L(fēng)浪經(jīng)驗(yàn)關(guān)系公式,得到風(fēng)浪狀態(tài)和涌浪狀態(tài)之間擬合曲線(見圖2),曲線下方(上方)的值表示風(fēng)浪(涌浪)為主的海浪狀態(tài)。統(tǒng)計(jì)發(fā)現(xiàn)涌浪為主的海浪狀態(tài)所占比例約為30%,表明該海域涌浪存在且不能忽視。
圖2 海面風(fēng)速和有效波高的散點(diǎn)分布圖
SVM是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來(lái)的基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的機(jī)器學(xué)習(xí)理論[18],其具有較高的泛化推廣能力。通過(guò)將低維的樣本空間映射到高維空間來(lái)實(shí)現(xiàn)低維非線性問題向高維線性問題的轉(zhuǎn)化,能夠較好地處理小樣本、高維度、非線性等問題。研究發(fā)現(xiàn),SVM方法在數(shù)據(jù)分類和數(shù)據(jù)回歸方面具有顯著優(yōu)勢(shì),且其預(yù)測(cè)技巧優(yōu)于人工神經(jīng)網(wǎng)絡(luò)模型和模糊推理模型[20]。
SVR方法是通過(guò)SVM方法進(jìn)行回歸分析的一種機(jī)器學(xué)習(xí)方法。為簡(jiǎn)化SVR模型復(fù)雜度并提升預(yù)測(cè)技巧,SVR模型通過(guò)構(gòu)造核函數(shù)解決上述問題。核函數(shù)的選擇能夠很好地解決維數(shù)問題,并克服機(jī)器學(xué)習(xí)方法中存在的收斂速度慢、局部極值、過(guò)學(xué)習(xí)與欠學(xué)習(xí)等問題。常用的核函數(shù)有:線性函數(shù)、S函數(shù)、多項(xiàng)式函數(shù)和徑向基函數(shù)等。本文通過(guò)敏感性數(shù)值試驗(yàn)評(píng)估后,選擇徑向基核函數(shù),與其它核函數(shù)相比,徑向基核函數(shù)所需輸入?yún)?shù)少,數(shù)值計(jì)算限制少。具體表示為:
式中:x∈Rn,xi是輸入要素向量,γ是徑向基核函數(shù)參數(shù)。
徑向基核函數(shù)的參數(shù)γ和SVM模型中的懲罰參數(shù)C的選擇會(huì)極大的影響模型的預(yù)測(cè)結(jié)果,應(yīng)根據(jù)不同的應(yīng)用領(lǐng)域來(lái)取值。為了優(yōu)化參數(shù)γ和C,本文使用粒子群優(yōu)化(particle swarm optimization,PSO)算法選擇最佳匹配參數(shù)。PSO方法最初由Kennedy等提出[25],與遺傳算法相比,PSO沒有復(fù)雜的繼承、變異、選擇和交叉的操作,實(shí)施更為簡(jiǎn)單,通過(guò)交叉驗(yàn)證進(jìn)一步確定PSO算法在本文可用。
本文基于SVR機(jī)器學(xué)習(xí)方法,建立了渤海海域有效波高短期預(yù)測(cè)模型,并利用浮標(biāo)觀測(cè)數(shù)據(jù)進(jìn)行3 h、6 h、12 h和24 h有效波高預(yù)測(cè)試驗(yàn)和結(jié)果驗(yàn)證。前人研究成果表明,與風(fēng)向、風(fēng)作用時(shí)間和風(fēng)區(qū)長(zhǎng)度等輸入信息相比,風(fēng)速對(duì)海浪預(yù)測(cè)技巧的提升更為重要[2]。此外,由于歷史海浪狀態(tài)能夠改變海面粗糙度分布,因此本文在考慮風(fēng)速影響的情況下,同時(shí)考慮海浪狀態(tài)的影響,在預(yù)測(cè)模型中引入歷史海浪狀態(tài)作為輸入信息。為分析不同的風(fēng)浪輸入信息組合對(duì)有效波高預(yù)測(cè)能力的影響,本文開展了多組有效波高預(yù)測(cè)的敏感性試驗(yàn),共設(shè)計(jì)了32組數(shù)值試驗(yàn)(見表1),分別以M1—M32命名,表中符號(hào)H和U分別表示有效波高和10 m風(fēng)速,下標(biāo)表示時(shí)間,例如U0表示前當(dāng)風(fēng)速,U-3表示預(yù)測(cè)前3 h風(fēng)速,U3表示未來(lái)3 h風(fēng)速,H0表示當(dāng)前有效波高,H3表示未來(lái)3 h有效波高。
表1 不同輸入信息組合的數(shù)值試驗(yàn)
為定量評(píng)估SVR模型的預(yù)測(cè)能力,本文選擇均方根誤差(Root Mean Square Error,RMSE),相關(guān)系數(shù)(R)和一致性指數(shù)(Index of Agreement,IA)作為評(píng)估指標(biāo),其定義如下:
式中:xi(yi)是觀測(cè)(預(yù)測(cè))值,n表示樣本總數(shù)。xˉ(yˉ)表示觀測(cè)(預(yù)測(cè))值的平均值。
基于SVR模型,將當(dāng)前風(fēng)速U0作為輸入信息,設(shè)計(jì)了5組數(shù)值試驗(yàn)(M1、M2、M3、M4、M5)來(lái)評(píng)估當(dāng)前風(fēng)速U0對(duì)有效波高的預(yù)測(cè)技巧。預(yù)測(cè)結(jié)果誤差統(tǒng)計(jì)表明(見表2),在只考慮當(dāng)前風(fēng)速U0情況下,僅對(duì)未來(lái)6 h以內(nèi)的有效波高具有較高的預(yù)測(cè)能力,尤其對(duì)未來(lái)3 h的有效波高預(yù)測(cè)技巧達(dá)到最高,其RMSE、R、IA分別為0.277、0.913和0.935,但對(duì)6 h以上的有效波高沒有顯著的預(yù)測(cè)能力。
表2 僅輸入10 m風(fēng)速信息的預(yù)測(cè)試驗(yàn)的有效波高預(yù)測(cè)誤差
由于歷史海浪狀態(tài)能夠影響海面粗糙度,本文設(shè)計(jì)了4組(M6、M7、M8、M9)數(shù)值試驗(yàn),將當(dāng)前有效波高H0作為SVR模型的輸入信息,評(píng)估其對(duì)有效波高的預(yù)測(cè)技巧。從不同預(yù)測(cè)時(shí)刻的有效波高誤差統(tǒng)計(jì)結(jié)果可見(見表3),未來(lái)3 h有效波高預(yù)測(cè)的RMSE、R、IA分別為0.291、0.886、0.937,其具備一定預(yù)測(cè)技巧,但隨著預(yù)測(cè)時(shí)效的延長(zhǎng),誤差越來(lái)越大,12 h后完全失去預(yù)測(cè)能力。此外,比較表2和表3的誤差結(jié)果,作為輸入信息,當(dāng)前風(fēng)速U0對(duì)有效波高預(yù)測(cè)的貢獻(xiàn)要高于當(dāng)前有效波高H0,但當(dāng)前有效波高H0的作用不可忽視,因此基于SVR模型的有效波高預(yù)測(cè)應(yīng)當(dāng)考慮當(dāng)前有效波高H0的影響。
表3 僅輸入當(dāng)前海浪信息的預(yù)測(cè)試驗(yàn)的有效波高預(yù)測(cè)誤差
基于上述試驗(yàn)結(jié)果,本文將當(dāng)前有效波高H0與不同時(shí)刻的風(fēng)速Ut作為SVR模型的輸入信息,設(shè)計(jì)了23組數(shù)值試驗(yàn)(M10—M32),深入分析不同的風(fēng)浪輸入信息組合對(duì)有效波高預(yù)測(cè)技巧的影響。表4列出了利用當(dāng)前有效波高H0和不同時(shí)刻的風(fēng)速Ut作為輸入信息(H0和U-3、H0和U0、H0和U3)的試驗(yàn)結(jié)果,可以看出將H0和U3作為輸入信息對(duì)有效波高的預(yù)測(cè)技巧最高,其未來(lái)3 h有效波高預(yù)測(cè)的RMSE、R、IA分別為0.179、0.963、0.977,對(duì)未來(lái)12 h有效波高仍然具備一定的預(yù)測(cè)能力,但預(yù)報(bào)誤差變化特征表明,隨著預(yù)測(cè)時(shí)效的延長(zhǎng)預(yù)測(cè)誤差也隨之增加。此外,綜合表2、表3和表4的誤差統(tǒng)計(jì)結(jié)果可見,使用風(fēng)浪組合作為輸入信息的預(yù)測(cè)結(jié)果更接近實(shí)測(cè)有效波高。
為進(jìn)一步提高對(duì)12 h和24 h有效波高的預(yù)測(cè)能力,本文考慮將預(yù)測(cè)時(shí)刻的風(fēng)速作為SVR模型的輸入信息,進(jìn)而分別針對(duì)12 h和24 h有效波高預(yù)測(cè)目標(biāo)獨(dú)立訓(xùn)練其最優(yōu)預(yù)測(cè)參數(shù)。根據(jù)輸入的預(yù)測(cè)風(fēng)速時(shí)效不同,將數(shù)值試驗(yàn)分為當(dāng)前有效波高H0和預(yù)測(cè)時(shí)刻前6 h風(fēng)速、當(dāng)前有效波高H0和預(yù)測(cè)時(shí)刻前3 h風(fēng)速、當(dāng)前有效波高H0和預(yù)測(cè)時(shí)刻風(fēng)速共3類數(shù)值試驗(yàn)。誤差統(tǒng)計(jì)結(jié)果表明(見表5)。對(duì)12 h和24 h的有效波高預(yù)測(cè)技巧最高的是M25和M28,其中12 h有效波高預(yù)測(cè)的RMSE、R、IA分別為0.295、0.892、0.929,也就是說(shuō)采用當(dāng)前有效波高H0和預(yù)測(cè)時(shí)刻前3 h風(fēng)速作為輸入信息,其12 h和24 h有效波高預(yù)報(bào)技巧達(dá)到最高。如表5所示,該方法對(duì)12 h和24 h有效波高預(yù)測(cè)誤差基本相當(dāng),也就是說(shuō)該方法對(duì)24 h有效波高預(yù)測(cè)結(jié)果可用。
為進(jìn)一步評(píng)估多組輸入信息對(duì)有效波高預(yù)測(cè)效果的影響,本文在上述數(shù)值試驗(yàn)的基礎(chǔ)上,將8個(gè)變量Hi和Ui(i=-3、-2、-1和0)均作為SVR模型的輸入信息,設(shè)計(jì)了3組試驗(yàn)(M30、M31、M32)。實(shí)驗(yàn)結(jié)果表明(見表6),在認(rèn)為所有輸入信息都具有同等重要性的前提下,同時(shí)引入多個(gè)輸入信息的并不能有效提升預(yù)測(cè)效果,反而增加了SVR模型的計(jì)算時(shí)間。
表4 利用當(dāng)前有效波高H0和不同時(shí)刻的風(fēng)速Ut作為輸入信息的預(yù)測(cè)試驗(yàn)的有效波高預(yù)測(cè)誤差
表5 輸入當(dāng)前有效波高H0和不同預(yù)測(cè)時(shí)刻的風(fēng)速Ut作為輸入信息的預(yù)測(cè)試驗(yàn)的有效波高預(yù)測(cè)誤差
表6 使用8個(gè)變量作為輸入信息的誤差
本文利用PSO算法,建立了基于SVR的有效波高短期預(yù)測(cè)模型,并開展了不同風(fēng)浪輸入信息組合對(duì)有效波高預(yù)測(cè)影響的敏感性試驗(yàn)。通過(guò)優(yōu)化徑向基核函數(shù)的參數(shù)γ和模型中的懲罰參數(shù)C,以及采用最優(yōu)化風(fēng)浪組合方案作為模型輸入信息,開展了對(duì)渤海海域近岸有效波高3 h、6 h、12 h和24 h的預(yù)測(cè)可靠性研究。試驗(yàn)結(jié)果表明:風(fēng)速是影響有效波高預(yù)測(cè)最重要的因素,利用當(dāng)前風(fēng)速信息能夠準(zhǔn)確實(shí)現(xiàn)對(duì)3 h和6 h有效波高的預(yù)測(cè),但隨著預(yù)測(cè)時(shí)效增加,12 h和24 h預(yù)測(cè)準(zhǔn)確性迅速降低;當(dāng)前有效波高僅對(duì)3 h有效波高預(yù)測(cè)具備一定預(yù)測(cè)技巧,其影響作用不可忽視;同時(shí)引入當(dāng)前有效波高和不同時(shí)刻的風(fēng)速作為輸入信息可有效改善預(yù)測(cè)能力,當(dāng)預(yù)測(cè)時(shí)效延長(zhǎng)至12 h后,將預(yù)測(cè)風(fēng)速作為模型的輸入信息,可有效提高12 h和24 h的有效波高預(yù)測(cè)準(zhǔn)確性;此外,若模型輸入信息與預(yù)測(cè)對(duì)象不存在顯著的相關(guān),多個(gè)輸入信息不能有效提高模型的預(yù)測(cè)能力。綜上所述,SVR模型對(duì)于小樣本數(shù)據(jù)具有較高的學(xué)習(xí)能力和適應(yīng)能力,為復(fù)雜地形近岸海域有效波高短期預(yù)測(cè)提供了一種有效的機(jī)器學(xué)習(xí)方法,可在海洋環(huán)境業(yè)務(wù)保障中推廣應(yīng)用。