丁 苑,郝明磊,行鴻彥,曾祥能
(1.南京信息工程大學 a.氣象災害預報預警與評估協(xié)同創(chuàng)新中心;b.江蘇省氣象探測與信息處理重點實驗室,南京210044; 2.空軍研究院 戰(zhàn)場環(huán)境研究所,北京 100085)
海面風場中風速和風向的觀測對軍事活動和海上生產作業(yè)有極其重要的影響,尤其是風速直接影響海上行動的安全。遙感測量海面風速已經成為大尺度風浪觀測的重要手段,針對特定遠洋海域,其能夠彌補傳統(tǒng)單點觀測數(shù)據的缺失。合成孔徑雷達(Synthetic Aperture Radar,SAR)對海平面粗糙度的變化十分敏感,且其微波成像方式對云霧穿透性強,受天氣狀況干擾較小[1],因此廣泛應用于海面風速的反演。SAR從其成像中根據不同海面的粗糙度來獲取不同的后向散射信號,并按照該信號與風速、風向和雷達入射角之間的數(shù)量關系,提取出需要的風場信息[2-3]。SAR按照其發(fā)射波束振動方向的不同,可以分成水平極化(H)和垂直極化(V),并按照雷達波束發(fā)射-接收的振動方向可分為同極化方式(HH、VV)和交叉極化方式(VH、HV),不同的極化方式接收到的后向散射強度不同,由此對應不同的海面風速反演模型。本文結合以往國際學者的研究,利用逐步回歸模型和BP神經網絡模型,對我國高分三號(GF-3)交叉極化數(shù)據用于海面風速反演進行初步的模型探索。
目前,研究人員利用地球物理模型函數(shù)(Geophysical Model Function,GMF)對海面風速進行反演[4]。經典的C波段單極化GMF模型,最早是由歐洲中長期預報中心(ECMWF)基于遙感衛(wèi)星ERS-1/2為散射計設計的CMOD系列函數(shù),且該模型后被證實同樣適用于C波段VV極化的SAR雷達。CMOD系列函數(shù)是一種半經驗模型,與SAR雷達后向散射系數(shù)、海面風矢量和雷達入射角等參數(shù)相關,其經典表達式為:
C(u10,θ)cos 2φ)
(1)
由于經典模型利用單極化SAR圖像反演風速必須提前知道相對風向,并將雷達入射角和圖像處理后得到的歸一化雷達散射截面(Normalized Radar Cross Section,NRCS)作為已知量輸入函數(shù)模型,通過迭代計算得到海面風速[5],因此選擇準確的輸入風向非常必要。目前,在海面風場反演研究中,常用的輸入風向主要有業(yè)務化散射計風向數(shù)據、實測浮標數(shù)據以及歐洲的風向預報模式,按照不同風速反演精確性的要求選擇不同的輸入風向[6]。
全極化SAR具備同時獲取同極化和交叉極化數(shù)據的能力,比單極化SAR數(shù)據包含更多的海洋環(huán)境信息,特別是交叉極化數(shù)據,且其可以獲取比同極化數(shù)據更豐富的海洋表征信息[7]。隨著全球C波段全極化SAR衛(wèi)星的發(fā)射,除了經典單極化模型函數(shù)之外,海風反演研究工作者也逐步將研究重心轉移到對交叉極化數(shù)據(VH、HV)的研究當中[8-9],并研究出一系列新的數(shù)據規(guī)律。2011年,VACHON等人[10]利用加拿大全極化SAR衛(wèi)星RADARSAT-2影像,統(tǒng)計出加拿大東西海岸的實測浮標風速,與VH極化的NRCS相結合建立了C-2PO海面風速反演模型:
(2)
該模型認為交叉極化數(shù)據的NRCS與海面風速之間是單一的線性關系,且能夠降低風場反演模型的復雜程度。隨后,文獻[11]利用機載步進微波輻射計(SFMR)獲取風速數(shù)據,并建立了將海面風速與交叉極化NRCS相結合的二次函數(shù)模型:
(3)
颶風的研究反演過程認為相對風向對風速反演具有一定的影響力,且隨著風速增加相關性不斷減弱。文獻[12]在C-2PO模型的基礎上進一步分析研究,發(fā)現(xiàn)交叉極化的NRCS與雷達入射角之間也具有緊密聯(lián)系,據此提出與風速和入射角相關的C-3PO模型:
(4)
綜合上述學者的研究,SAR交叉極化數(shù)據運用于海面風場反演的研究表明了相較于經典單極化模型的優(yōu)越性。但與此同時,運用交叉極化數(shù)據反演海面風場的模型仍在學術界未有定論,影響交叉極化反演的因素仍有爭論,因此具有進一步研究的價值。
2016年,中國發(fā)射了GF-3,該衛(wèi)星是我國第一顆C波段分辨率為1 m的SAR衛(wèi)星。GF-3的發(fā)射極大推動了我國對SAR的成像觀測能力,躋身國際先進行列。由于GF-3正式運行時間尚短,GF-3數(shù)據在海面風場反演中的應用研究仍處于起步階段,準確地對觀測海域進行風場反演并驗證結果,不僅能推進后續(xù)海洋探測,還可以使得我國自主發(fā)射收集的SAR衛(wèi)星數(shù)據在軍事、國防等領域發(fā)揮重要作用[13]。隨著機器學習的迅速發(fā)展,具有自主學習能力的人工神經網絡模型應用于海洋氣象領域也獲得廣泛關注,強大的非線性映射能力使其對復雜應用問題具有良好的適應性。本文選用80幅GF-3全極化條帶1(QPSI)的交叉極化(VH)數(shù)據,分析風速、相對風向及雷達入射角等各因素與提取的NRCS之間的關系,隨后分別利用逐步回歸模型和BP神經網絡模型進一步研究各變量之間的相關關系,初步探索我國GF-3交叉極化數(shù)據的風速反演模型。
GF-3具有全極化條帶、精細條帶、波模式等12種成像模式[14],其空間分辨率為1 m~500 m不等,幅寬為10 km~650 km,常規(guī)入射角為20°~50°。本文研究選擇的是全極化條帶1(QPSI)模式,該模式下的產品是單視復數(shù)據,SAR圖像標準空間分辨率為8 m,標準成像幅寬為30 km。
原始SAR圖像數(shù)據存在相干斑噪聲、幾何畸變等問題不能直接用于風速反演,需要進行圖像預處理。首先,預處理操作是輻射定標,即將像元灰度值按照一定的標準轉換成以dB為單位的雷達后向散射系數(shù),從而建立目標NRCS與雷達影像強度的定量模型關系。本文利用PIE對GF-3數(shù)據進行逐個像元的輻射定標。其次,由于SAR影像的斜視成像機理,為了獲取其正確空間地理位置信息,需要對圖像進行必要的幾何校正[15],使其轉換到統(tǒng)一的地理坐標系中,具體如圖1所示。由于本文研究的是遠離陸地的海洋區(qū)域,海面相對陸地起伏較為平緩,可忽略疊掩等造成的幾何畸變,因此本文采用WGS84地心坐標系對圖像進行橢球體編碼。
圖1 地理編碼示意圖
為了有效抑制SAR圖像中普遍存在的斑點噪聲,對圖像進行濾波處理是有效剔除噪聲的方法,基于完全的斑點乘性噪聲模型提出Lee濾波[16],它是經典的SAR圖像斑點噪聲濾波方法,但其對于圖像邊緣等細節(jié)信息方面的保持不理想,因此本文選用改進的增強型Lee濾波,可以在減少斑點噪聲的同時,兼顧保持雷達圖像的紋理信息,其濾波效果如圖2所示。
圖2 改進的Lee濾波效果
ERA-Interim海面風場資料是由歐洲中期天氣預報中心(ECMWF)提供的覆蓋全球區(qū)域的大氣分析產品。該產品提供全球1979年1月至2019年3月的海面10 m高的水平(U)、垂直(V)風矢量分量,根據分量計算得出相應風速、風向,后續(xù)數(shù)據仍在持續(xù)更新中,覆蓋全球0°E~360°E、90°S~90°N[17],且有多種空間分辨率選擇范圍,本文選擇最精細的0.125°×0.125°分辨率以使得在空間上與GF-3圖像最匹配。在ERA-Interim產品的時間分布上,分為分析數(shù)據(Analaysis)和預報數(shù)據(Forecast)。對于分析數(shù)據,其時間分辨率為6 h(00:00,06:00,12:00,18:00)。在每日00:00與12:00時提供預報數(shù)據,用戶可根據需求選擇預測時間步長,如圖3所示。本文為更準確地驗證反演結果,在時間數(shù)據選取上按照實測優(yōu)于預測、與SAR圖像采集時間最近為原則選取模式資料。
圖3 ERA-Interim數(shù)據時間分布
為了更準確地建立多變量回歸模型,在回歸之前首先對各變量之間的相關性進行分析。根據單極化業(yè)務GMF模型的各變量關系,參考以往研究學者對RADARSAT-2交叉極化數(shù)據建立的C-2PO模型,本文對VH雷達后向散射系數(shù)(σVH)、10 m高風速(u10)、相對風向(φ)、雷達入射角(θ)4個變量之間的線性相關性進行分析。
皮爾遜相關系數(shù)是用來描述2個變量之間線性相關性的系數(shù),其取值反應了兩者的線性相關程度。該系數(shù)定義為2個變量的協(xié)方差除以標準差,具體表示方法為:
(5)
式(5)定義了總體相關系數(shù),為進一步計算出協(xié)方差和標準差,常用r表示皮爾遜相關系數(shù):
(6)
皮爾遜相關系數(shù)r的取值范圍為-1≤r≤1,r>0時表示正相關,r<0時表示負相關,|r|=0表示不存在線性相關,|r|=1表示完全線性相關,0<|r|<1表示存在不同程度的線性關系,且|r|≤0.3表示不存在線性相關,0.3<|r|≤0.5表示為低度線性相關,|r|>0.5表示為顯著線性相關。
利用上述關系求解得到本文各變量之間的皮爾遜相關系數(shù),如表1所示。根據各變量之間的相關性,可初步判斷方程的因變量與自變量之間的線性關系,排除多重共線性干擾,為回歸模型的建立提供判斷依據。
表1 各變量間的皮爾遜相關系數(shù)
由表1可知,在GF-3交叉極化數(shù)據中,雷達后向散射系數(shù)與風速呈顯著線性正相關關系、與雷達入射角呈顯著線性負相關關系,且其余各變量之間不存在線性關系。
多元逐步回歸分析是用于研究因變量y與p個因子x之間的定量統(tǒng)計關系,其基本應用原理是對全部自變量按照其對因變量的顯著性從大到小逐個引入回歸方程。與此同時,對每一個代入的自變量逐個進行F檢驗,同時,對所有已經引入的自變量進行t檢驗。如果當前回歸方程由于引進了新的自變量而變得不顯著,則剔除該變量[18]。逐步回歸方程形式如下:
y=β0+β1x1+β2x2+…+βpxp
(7)
基于以上變量之間的相關性分析,將雷達后向散射系數(shù)(σVH)作為因變量,逐個引入風速(u10)、相對風向(φ)、雷達入射角(θ)可作為自變量因子,根據引入新變量后回歸方程的可決系數(shù)、t檢驗、F檢驗,若檢驗都通過則引入,否則剔除。逐步回歸后,得到如表2的預測回歸結果。
表2 逐步回歸結果
由數(shù)據分析結果可知,在逐步回歸過程中,相對風向φ變量被剔除,F檢驗與t檢驗均能拒絕原假設,排除了變量間的多重共線性,與相關性分析結果具有較好的一致性。因此,最終交叉極化雷達后向散射系數(shù)的最優(yōu)多元逐步回歸方程為:
σVH=0.343u10-0.227θ-16.502
(8)
根據最終得到的回歸方程,風速反演方程可表示為:
(9)
在逐步回歸的線性模型中,排除了相對風向因子,但非線性并不意味著無關性,不能直接排除相對風向因子對風速反演的貢獻。在已知風速反演與雷達后向散射系數(shù)、雷達入射角相關的情況下,進而探究相對風向作為非線性因子對風速反演的影響。當工程中遇到復雜的非線性系統(tǒng),系統(tǒng)狀態(tài)方程復雜或無法用數(shù)學方法直接建模時,可建立人工神經網絡模型表達這種系統(tǒng)[19],即“黑盒”處理。BP神經網絡的拓撲結構如圖4所示。
BP神經網絡是一種帶有隱含層的前饋神經網絡,其將信號通過輸入層輸入網絡,隨后經過中間的隱含層逐層訓練計算,再到輸出層輸出結果,這是網絡的前向傳遞,每一層的計算結果只影響與其關聯(lián)的下一層神經網絡狀態(tài)[19]。如果輸出的結果不是預期結果,網絡會進入反向傳播計算,按照誤差計算規(guī)則改變網絡權值的閾值,重復整個過程直至得到期望輸出結果。本文選用經典的三層BP神經網絡建立2個風速預測模型,第一模型是參考前文的逐步回歸模型,建立以σVH與θ為輸入、u10為輸出訓練的神經網絡預測模型,并將該80組數(shù)據作為訓練樣本,通過BP神經網絡的自適應能力預測海面風速。第二模型是在原基礎輸入層上加入φ,隨后將2種模型的訓練效果進行對比,側面判斷風向φ是否影響海面風速的預測,BP神經網絡模型如圖5所示。
圖5 BP神經網絡模型拓撲
從BP神經網絡模型拓撲可以明顯看出,BP神經網絡在數(shù)學上表達的是一種函數(shù)的非線性映射關系。其中,隱含層神經元個數(shù)的設定通常有如下公式[20-21]:
(10)
其中,n為隱含層的神經元數(shù)目,α為輸入層神經元數(shù)目,β是輸出層數(shù)目,θ是整數(shù),取值區(qū)間為[1,10]?;诖?2個模型隱含層神經元個數(shù)分別設為5與6。本文的激活函數(shù)選擇Sigmoid函數(shù),訓練中選擇基于梯度下降法的Learngdm算法作為權閾值的學習法則,設置最大訓練迭代次數(shù)為1 000次。BP神經網絡模型流程如圖6所示。
圖6 BP神經網絡模型流程
2種模型的訓練結果如圖7、圖8所示。從圖7可以看出,2種BP神經網絡模型的訓練數(shù)據、驗證數(shù)據、測試數(shù)據的均方誤差都迅速減小并最終收斂,所有集合數(shù)據對應的擬合R值均超過70%,說明建立BP神經網絡預測海面風速是有效的。同時,通過第一模型與第二模型訓練效果的對比可看出,相對風向的加入并沒有使得模型的訓練效果得到顯著提升,從而運用排除法基本排除交叉極化數(shù)據中風向因素對風速反演的影響。
圖7 迭代訓練結果
圖8 2種BP神經網絡模型的訓練效果
為評價建立的逐步回歸模型與BP神經網絡預測模型對海面風速的計算效果,本文另取10幅相同模式GF-3圖像作為測試組數(shù)據,分別采用逐步回歸模型、BP第一模型、BP第二模型和C-3PO模型對海面風速進行反演和驗證。模型以ERA-Interim的風場數(shù)據作為初始風向與風速驗證數(shù)據,4種模型對測試組SAR圖像數(shù)據的風速反演相對誤差與風速反演效果分別如圖9、圖10所示。為更好地體現(xiàn)新模型探究和建立的必要性,本文從宏觀數(shù)據源到測試樣本誤差進行了對比與分析。以ERA-Interim的風場數(shù)據作為初始風向與風速驗證數(shù)據,用測試數(shù)據組的平均相對誤差(Average Relative Error,ARE)以及樣本的均方根誤差(Root Mean Square Error,RMSE)作為評價標準,結果如表3所示。
圖9 4種模型對SAR圖像數(shù)據的風速反演相對誤差
圖10 4種模型對SAR圖像數(shù)據的風速反演效果
表3 4種模型的實驗結果對比
結果表明,當前關于交叉極化數(shù)據反演海面風速的模型,在數(shù)據源上使用的主要是國外衛(wèi)星,在初始風場數(shù)據選擇上,C-3PO模型對大量NDBC浮標實測數(shù)據進行統(tǒng)計,而我國自主發(fā)射的GF-3運行時間尚短且成像區(qū)域能夠匹配的NDBC數(shù)據很少,該模型不能完全適應我國GF-3衛(wèi)星數(shù)據,因此探索建立新模型非常必要,測試數(shù)據誤差對比也說明了這一點。本文建立的逐步回歸模型對測試樣本的平均相對誤差最小,而BP神經網絡預測模型的均方根誤差最小,同時,4種模型對GF-3圖像交叉極化數(shù)據的海面風速反演均方根誤差均小于2 m/s,說明模型的建立是顯著有效的。與此同時,BP第二模型在訓練效果與測試樣本誤差分析中的效果均未超過第一模型,這些對比排除了風向因子對交叉極化數(shù)據雷達后向散射系數(shù)的影響,反映了BP神經網絡能夠較好地模擬風速影響模型,對風速預測的訓練具有較強的自學習能力。
本文利用80幅GF-3全極化圖像對GF-3交叉極化數(shù)據進行海面風速反演,并初步探索了回歸方程。實驗結果表明,交叉極化數(shù)據的雷達后向散射系數(shù)與海面風速、雷達入射角之間存在線性關系,與國際學者的研究具有良好的一致性。同時,將BP神經網絡引入交叉極化數(shù)據對海面風速的反演,一方面說明了神經網絡模型在該領域的良好適用性,為未來將更多的人工智能技術運用于海面風場反演提供可能性。另一方面通過2種BP神經網絡模型的對比排除了相對風向對海面風速反演的影響,使得風速反演不需要依賴于外部風向的輸入,極大簡化了反演模型,證明了使用交叉極化數(shù)據進行海面風場反演具有單極化數(shù)據不可替代的優(yōu)越性和發(fā)展?jié)摿?。隨著高分三號衛(wèi)星的繼續(xù)運行和各幅圖像的等效噪聲校準,能夠得到更顯著的數(shù)據規(guī)律和更精準的反演模型。后續(xù)將利用遺傳算法來優(yōu)化BP神經網絡,進一步研究機器學習與深度學習在SAR圖像海面風場反演領域中的應用。