楊俊鋼,穆佳棟,谷浩然,荀佳偉
(1.自然資源部第一海洋研究所,山東 青島 266061;2.自然資源部海上絲路海洋資源環(huán)境組網(wǎng)觀測技術(shù)創(chuàng)新中心,山東 青島 266580;3.青島大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,山東 青島 266071;4.中國石油大學(xué)(華東) 海洋與空間信息學(xué)院,山東 青島 266580)
71%的地球表面被海洋覆蓋,海洋運(yùn)動變化與人類生活息息相關(guān),認(rèn)識和了解海洋物理屬性與運(yùn)動特征對于海洋環(huán)境保護(hù)、海洋資源開發(fā)、海洋工程建設(shè)和海洋環(huán)境安全保障至關(guān)重要。溫度和鹽度是描述海洋物理屬性的基本參量,是海水密度的主要確定因素,在中緯度的上層海洋(0~500 m)中溫度是決定聲速的主要參數(shù),鹽度在降雨多或海冰較多的高緯度地區(qū)至關(guān)重要。海水溫度和鹽度的變化與大洋環(huán)流、全球水循環(huán)、海洋-氣候系統(tǒng)變化密切相關(guān),影響著海洋對全球氣候變化的調(diào)節(jié)能力。溫度和鹽度是最早被人類觀測的海洋參數(shù),通過現(xiàn)場儀器或衛(wèi)星遙感手段可以直接或間接觀測海水溫度和鹽度。海水溫度和鹽度現(xiàn)場觀測受觀測手段與條件的限制,存在觀測時空分布不均和觀測頻次和時間序列長度有限的不足。衛(wèi)星遙感為海洋表層溫度和鹽度觀測提供了重要的手段,隨著傳感器和衛(wèi)星平臺技術(shù)的發(fā)展,國內(nèi)外出現(xiàn)了眾多用于海洋表層溫度和鹽度觀測的衛(wèi)星及遙感器。海面溫度遙感觀測手段主要為微波和紅外輻射計(jì),國內(nèi)外相關(guān)衛(wèi)星或傳感器有AVHRR、MODIS、VIIRS、TMI、GMI、SSM/I、AMSR/AMSR-E、AMSR2、Envisat AATSR、Windsat、Sentinel-3 SLSTR、HY-1/2等。海面鹽度遙感觀測手段為微波輻射計(jì),相關(guān)衛(wèi)星或遙感器主要有SMOS、Aquarius 和SMAP。此外,衛(wèi)星遙感可獲取海面高度和海面風(fēng)場等觀測數(shù)據(jù),而海面高度和海面風(fēng)場與海水溫鹽變化也密切相關(guān)。
海洋三維溫鹽場信息是描述海洋物理屬性特征和掌握海洋物理運(yùn)動過程的重要參數(shù),獲取準(zhǔn)確的海洋三維溫度和鹽度信息對于認(rèn)識海洋、開發(fā)利用海洋和海洋科學(xué)研究等具有重要意義?,F(xiàn)場觀測手段獲取的海水溫鹽場信息時空分布稀疏且時間連續(xù)性差。衛(wèi)星遙感可獲取全球海洋海面溫度和鹽度信息,但無法獲取海洋次表層三維溫鹽場信息?;诿枋龊K锢磉\(yùn)動過程的水動力學(xué)方程組,采用一定的數(shù)值求解方式并同化海水溫鹽現(xiàn)場或衛(wèi)星遙感觀測數(shù)據(jù),建立海洋數(shù)值模型計(jì)算可得到時空分布均勻且連續(xù)的海水三維溫鹽場信息。但因海洋數(shù)值模型的物理規(guī)則不完整、部分物理過程只是近似計(jì)算,海水溫度和鹽度計(jì)算精度難以保證,特別在對于海洋動力環(huán)境復(fù)雜且變化劇烈的區(qū)域。因此,如何準(zhǔn)確獲取海洋三維溫鹽場信息是海洋科學(xué)研究的重要方向之一。從豐富的海洋表層衛(wèi)星遙感觀測數(shù)據(jù)(海面溫度、海面鹽度、海面高度和海面風(fēng)場等)和稀疏的現(xiàn)場剖面觀測數(shù)據(jù)出發(fā),國內(nèi)外已開展了海洋三維溫鹽場反演或構(gòu)建研究。三維溫鹽場構(gòu)建的主要內(nèi)容是基于海洋表層多源衛(wèi)星遙感數(shù)據(jù)和溫鹽剖面實(shí)測數(shù)據(jù)建立由表層到水下的映射關(guān)系,最終實(shí)現(xiàn)基于海洋表層多源遙感數(shù)據(jù)的時空連續(xù)的次表層三維溫鹽場數(shù)據(jù)的獲取?;诤Q蟊韺有l(wèi)星遙感的次表層三維溫鹽場探測的主要方法可分為:統(tǒng)計(jì)類方法、動力學(xué)方法和基于聲傳播時間的經(jīng)驗(yàn)方法[1]。統(tǒng)計(jì)類方法是建立海洋表層衛(wèi)星遙感觀測要素和次表層海水溫鹽信息的統(tǒng)計(jì)關(guān)系,主要包括回歸統(tǒng)計(jì)和經(jīng)驗(yàn)正交分解及變分方法。經(jīng)驗(yàn)正交分解將溫鹽剖面觀測數(shù)據(jù)進(jìn)行EOF分解,找出某幾個模態(tài)所對應(yīng)的振幅與海面溫度或海面高度建立回歸關(guān)系。變分法是采用數(shù)據(jù)同化方法將觀測數(shù)據(jù)與氣候態(tài)數(shù)據(jù)結(jié)合,生成三維溫鹽場。美國海軍于20 世紀(jì)90年發(fā)展的模塊化海洋數(shù)據(jù)同化系統(tǒng)(MODAS)[2]是動力學(xué)方法三維溫鹽場重構(gòu)的成功案例,通過同化衛(wèi)星遙感海面溫度和海面高度,并結(jié)合傳統(tǒng)靜態(tài)氣候態(tài),可生成高分辨率的三維溫鹽場數(shù)據(jù)。動力學(xué)方法運(yùn)用動力模型結(jié)合海面信息模擬海洋內(nèi)部動力過程,一般采用一定的動力學(xué)約束條件或數(shù)值模式,將海表衛(wèi)星遙感觀測數(shù)據(jù)轉(zhuǎn)化為動力學(xué)控制變量,實(shí)現(xiàn)表層數(shù)據(jù)到水下的映射。表面地轉(zhuǎn)(Surface Quasi Geostrophic,SQG)和iSQG 是具有代表性的動力學(xué)方法,該方法基于準(zhǔn)地轉(zhuǎn)方程、將內(nèi)部解投影到第一斜壓模態(tài)和正壓模態(tài),利用海面觀測數(shù)據(jù)約束求解實(shí)現(xiàn)利用海面高度、海面溫度和海面鹽度等反演次表層參數(shù)?;诼晫W(xué)傳播時間的經(jīng)驗(yàn)方法根據(jù)聲傳播時間建立經(jīng)驗(yàn)?zāi)P?,反演水下溫鹽結(jié)構(gòu)。
近年來,隨著人工智能與深度學(xué)習(xí)方法的發(fā)展,人們開始采用深度學(xué)習(xí)方法開展海洋次表層三維溫鹽場探測研究。本文從海洋溫鹽觀測數(shù)據(jù)集、傳統(tǒng)機(jī)器學(xué)習(xí)三維溫鹽智能探測、一般神經(jīng)網(wǎng)絡(luò)三維溫鹽智能探測和深度學(xué)習(xí)三維溫鹽智能探測等方面對與海洋三維溫鹽場智能探測相關(guān)的研究進(jìn)展進(jìn)行綜述。
海水溫度和鹽度的現(xiàn)場和衛(wèi)星遙感觀測數(shù)據(jù)是海水溫鹽場數(shù)據(jù)集的主要數(shù)據(jù)來源,首先針對基于多種現(xiàn)場觀測平臺和手段獲取的溫鹽現(xiàn)場剖面觀測數(shù)據(jù)、多源衛(wèi)星遙感獲取的海面溫度和海面鹽度遙感數(shù)據(jù)所構(gòu)建出的海洋溫鹽觀測數(shù)據(jù)集進(jìn)行回顧,上述數(shù)據(jù)集是現(xiàn)有海洋三維溫鹽場數(shù)據(jù)集的主要數(shù)據(jù)源,也是進(jìn)一步深入開展海洋三維溫鹽場重構(gòu)的主要基礎(chǔ)數(shù)據(jù)。以下從溫鹽現(xiàn)場觀測數(shù)據(jù)集、海面溫度遙感觀測數(shù)據(jù)集和海面鹽度遙感觀測數(shù)據(jù)集分別展開介紹。
海水溫鹽剖面現(xiàn)場觀測的主要手段包括CTD、XBT、MBT 和ARGO 浮標(biāo),其中以ARGO 浮標(biāo)最具代表性且觀測數(shù)據(jù)不斷豐富,圖1 是2023年12月10日的全球在用ARGO 浮標(biāo)分布圖(來自https://argo.ucsd.edu/)?;诙喾N現(xiàn)場觀測手段獲取的全球海洋溫鹽剖面數(shù)據(jù),主要形成了如下幾類溫鹽現(xiàn)場觀測數(shù)據(jù)集。
圖1 ARGO 浮標(biāo)全球分布示意圖Fig.1 Global distribution of ARGO buoys
1)ARGO 網(wǎng)格數(shù)據(jù)。利用變分插值方法由時空分布不均勻的溫鹽剖面數(shù)據(jù)生成全球網(wǎng)格數(shù)據(jù),數(shù)據(jù)空間分辨率為1°,垂向0~2 000 m 共分為27層,時間分辨率為月均,時間跨度為2005年至今。
2)WOD(World Ocean Database)。世界上最大的統(tǒng)一格式、質(zhì)量可控、公開可用的海洋剖面數(shù)據(jù)集,是海洋學(xué)、氣候和環(huán)境研究的強(qiáng)大工具。WOD 數(shù)據(jù)涵蓋從1772年至今的海洋氣候分析資料,WOD 數(shù)據(jù)集可通過NCEI 獲得[3]。
3)GTSPP(Global Temperature and Salinity Profile Programme)。一些海洋科學(xué)組織發(fā)起的國際合作項(xiàng)目,旨在為研究人員和海洋業(yè)務(wù)化管理人員提供準(zhǔn)確、最新的溫度和鹽度數(shù)據(jù)。世界氣象組織(WMO)和政府間海洋學(xué)委員會(IOC)共同管理該項(xiàng)目的數(shù)據(jù)獲取、歸檔和分發(fā),以確保持續(xù)的質(zhì)量控制、存儲和訪問,NCEI 提供存儲和質(zhì)量控制服務(wù)。GTSPP 數(shù)據(jù)集包括經(jīng)質(zhì)量控制和重處理并保存為統(tǒng)一格式的CTD、XBT 和ARGO 溫鹽剖面數(shù)據(jù)。
4)EN4[4]。英國氣象局哈德利中心提供的一系列溫鹽剖面數(shù)據(jù)集,經(jīng)質(zhì)量控制和客觀分析形式的1900年至今的次表層溫度和鹽度數(shù)據(jù)。EN4 中的數(shù)據(jù)來自:ARGO、北極全流域天氣海洋學(xué)(ASBO)項(xiàng)目、全球溫度和鹽度剖面計(jì)劃(GTSPP)和2018年世界海洋數(shù)據(jù)庫(WOD18)。
除現(xiàn)場觀測外,衛(wèi)星遙感是獲取大面積同步海洋溫鹽觀測的重要手段。海面溫度衛(wèi)星遙感數(shù)據(jù)眾多,綜合多源衛(wèi)星遙感數(shù)據(jù)已形成了多種海面溫度融合數(shù)據(jù),特別是由高分辨率海面溫度小組(Group for High Resolution Sea Surface Temperature ,GHRSST)提供的數(shù)據(jù)。GHRSST 的成立旨在促進(jìn)國際關(guān)注并協(xié)調(diào)新一代全球、多傳感器、高分辨率近實(shí)時SST 產(chǎn)品的開發(fā),該小組匯集了國際航天機(jī)構(gòu)、研究機(jī)構(gòu)、大學(xué)和政府機(jī)構(gòu),總體目標(biāo)是通過國際合作和科學(xué)創(chuàng)新,為短、中、十年的氣候時間尺度應(yīng)用提供最優(yōu)質(zhì)的海面溫度數(shù)據(jù)。目前不同機(jī)構(gòu)生成多種不同數(shù)據(jù)源、不同分辨率的海面溫度遙感數(shù)據(jù)產(chǎn)品,基本情況見表1。
海面鹽度衛(wèi)星遙感數(shù)據(jù)主要來源于3 顆鹽度遙感衛(wèi)星,分別為SMOS(Soil Moisture and Ocean Salinity,SMOS)、Aquarius 和SMAP(Soil Moisture Active and Passive),海洋鹽度遙感衛(wèi)星及數(shù)據(jù)產(chǎn)品信息見表2。
表2 鹽度衛(wèi)星信息表Table 2 Information of salinity satellite
受海洋物理過程約束,利用海洋表層遙感觀測數(shù)據(jù)反演次表層三維溫鹽場的傳統(tǒng)方法是一個復(fù)雜過程。機(jī)器學(xué)習(xí)方法在三維溫鹽場智能探測中的應(yīng)用,為三維溫鹽場數(shù)據(jù)獲取提供了一種新的手段。用于三維溫鹽場智能探測的傳統(tǒng)機(jī)器學(xué)習(xí)方法主要有:支持向量機(jī)(Support Vector Machine,SVM)、支持向量回歸(Support Vector Regression,SVR)、隨機(jī)森林(Random Forest,RF)、基于提升樹的加法模型(XGBoost)和輕量級梯度提升機(jī)(Light Gradient Boosting Machine,LightGBM)等。
SU 等人[5]提出了一種支持向量機(jī)(SVM)方法,利用包括海面溫度異常(SSTA)、海面高度異常(SSHA)和海面鹽度異常(SSSA)等海洋表層遙感數(shù)據(jù)估計(jì)印度洋的次表層海水溫度異常(STA),ARGO STA 數(shù)據(jù)用于訓(xùn)練和測試的現(xiàn)場觀測數(shù)據(jù),結(jié)果表明SVM 很好地估計(jì)了印度洋上層1 000 m 的STA,除了SSTA 和SSHA 外,SSSA 也可以幫助探測和描述更深海洋的熱結(jié)構(gòu),并提高STA 估計(jì)的準(zhǔn)確性。黎文娥等人[6]基于支持向量回歸(SVR)方法利用海面遙感觀測數(shù)據(jù)開展了海洋次表層海水溫度異常(STA)反演研究,該反演最優(yōu)選取海面高度異常(SSHA)、海面溫度異常(SSTA)、海面鹽度異常(SSSA)和海面風(fēng)速異常(SSWA)等海面遙感觀測數(shù)據(jù)的組合,利用ARGO數(shù)據(jù)進(jìn)行結(jié)果精度驗(yàn)證,研究表明SVR 模型可準(zhǔn)確估算全球海洋1 000 m 以淺的STA。SU 等人[7]提出了一種基于隨機(jī)森林(RF)的機(jī)器學(xué)習(xí)方法,從多源衛(wèi)星觀測數(shù)據(jù)中反演全球水下0~1 000 m 的溫度異常(STA),研究使用2010年全球海洋的月均海面高度異常(SSHA)、海面溫度異常(SSTA)、海面鹽度異常(SSSA)和海面風(fēng)速異常(SSWA),使用ARGO 數(shù)據(jù)作為目標(biāo)值來對RF 模型進(jìn)行訓(xùn)練和測試,反演不同深度的海水溫度異常。實(shí)驗(yàn)結(jié)果表明,RF 可以準(zhǔn)確反演全球海洋海水溫度異常,反演結(jié)果隨深度增加到500 m 后精度逐漸下降,與支持向量回歸(SVR)方法相比,RF 方法更準(zhǔn)確。
SU 等人[8]基于極限梯度增強(qiáng)(XGBoost)提出了一種用于全球海洋上層2 000 m 的次表層海水溫鹽異常的反演模型,該模型使用海面衛(wèi)星觀測和現(xiàn)場ARGO 數(shù)據(jù)進(jìn)行估計(jì),研究結(jié)果表明所提出的XGBoost 模型能夠反演海水溫鹽異常,且反演結(jié)果優(yōu)于梯度增強(qiáng)決策樹模型,從反演結(jié)果中發(fā)現(xiàn)上層(0~500 m)海水溫鹽異常表現(xiàn)出明顯的季節(jié)變化信號且隨深度增加而變?nèi)?,不同季?jié)模型性能存在差異,海面風(fēng)速異常對海水溫鹽異常估計(jì)的貢獻(xiàn)大于其他表面參數(shù)。張?zhí)煲坏热薣9]利用LightGBM 算法結(jié)合隨機(jī)森林方法開展了全球海洋次表層(0~1 000 m)海水溫度異常(STA)與鹽度異常(SSA)的重構(gòu)研究,研究以海面遙感數(shù)據(jù)(海面高度異常(SSHA)、海面溫度異常(SSTA)、海面鹽度異常(SSSA)和海面風(fēng)速異常(USSWA、VSSWA)并結(jié)合位置信息作為重構(gòu)輸入變量,使用ARGO 次表層溫鹽數(shù)據(jù)作為模型訓(xùn)練與測試數(shù)據(jù),開展了不同模型輸入?yún)?shù)組合研究,結(jié)果表明經(jīng)緯度位置信息在STA 和SSA 重構(gòu)中發(fā)揮不同的作用,單時相和時序預(yù)測STA 中經(jīng)緯度信息對模型的貢獻(xiàn)隨著深度的增加逐漸增大,該研究發(fā)現(xiàn)LightGBM 較隨機(jī)森林精度更高魯棒性更強(qiáng)。湯貴艷等人[10]提出一種融合高斯混合模型和輕量級梯度提升機(jī)(LightGBM)算法的海洋次表層溫度反演模型,利用2005-2018年的月均海面溫度、海面鹽度、海面高度和海面風(fēng)速等遙感數(shù)據(jù)和ARGO 數(shù)據(jù)反演了印度洋海域的次表層海水溫度,結(jié)果表明所提出的模型可以準(zhǔn)確反演印度洋海域的海水溫度分布特征和季節(jié)變化規(guī)律,采用所有海表參數(shù)的模型反演結(jié)果最好,反演結(jié)果優(yōu)于極限梯度增強(qiáng)模型(XGBoost)。
綜合比較傳統(tǒng)機(jī)器學(xué)習(xí)方法的研究結(jié)果發(fā)現(xiàn),模型輸入增加海面風(fēng)速數(shù)據(jù)會略微提升三維溫鹽場的反演精度,加入經(jīng)緯度信息也會提升反演精度;SVM、SVR 和RF 都可用于0~1 000 m 的三維溫鹽場重構(gòu),SVM 和SVR 反演結(jié)果類似,RF 模型反演結(jié)果稍優(yōu)于SVR,LightGBM 模型的反演結(jié)果優(yōu)于RF 和XGBoost。
除了常用的傳統(tǒng)機(jī)器學(xué)習(xí)方法已用于基于海洋表層遙感數(shù)據(jù)的三維溫鹽場智能探測外,已有研究基于聚類方法和BP 神經(jīng)網(wǎng)絡(luò)、廣義回歸神經(jīng)網(wǎng)絡(luò)等常規(guī)神經(jīng)網(wǎng)絡(luò)開展了三維溫鹽場智能探測研究。
LU 等人[11]使用預(yù)聚類過程和神經(jīng)網(wǎng)絡(luò)(NN)方法,利用全球海洋海面溫度、海面高度和海面風(fēng)速觀測數(shù)據(jù)來探測海水溫度異常,月均ARGO 網(wǎng)格數(shù)據(jù)用于模型訓(xùn)練與驗(yàn)證,在大時間范圍(2004-2010年)和深度(0~1 900 m)內(nèi)進(jìn)行了測試,結(jié)果表明預(yù)聚類的神經(jīng)網(wǎng)絡(luò)方法比沒有聚類的相同方法更好,也優(yōu)于聚類線性回歸器和隨機(jī)森林方法。WANG 等人[12]基于多源海面遙感數(shù)據(jù)(海面溫度、海面鹽度、海面高度和海面風(fēng)速),利用人工神經(jīng)網(wǎng)絡(luò)(ANN)反演0~2 000 m 的海洋水下溫度場,分別選取2005-2015年和2016年的網(wǎng)格化月平均數(shù)據(jù)作為訓(xùn)練集和測試集,研究發(fā)現(xiàn)海洋上層(0~200 m)存在明顯的季節(jié)變化信號且隨深度增加而逐漸減弱,同時比較發(fā)現(xiàn)ANN 模型精度高于隨機(jī)森林、MLR 和XGBoost。CHENG 等人[13]利用一種反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)方法,通過選擇衛(wèi)星觀測海面參數(shù)的最佳組合來反演北太平洋的次表層海水溫度,該研究除海面高度(SSH)、海面溫度(SST)、海面鹽度(SSS)和海面風(fēng)速(SSW)外,還引入海面速度(SSV)作為新的參量,結(jié)果表明BPNN 模型可以準(zhǔn)確地估計(jì)北太平洋1 000 m 以上的海水溫度,SSV 的輸入對BPNN 模型具有積極影響,并有助于提高估計(jì)的準(zhǔn)確性。CHEN 等人[14]針對直接同化衛(wèi)星觀測數(shù)據(jù)對數(shù)值模型次表層結(jié)構(gòu)約束不足的問題,使用間接同化方法建立了一個三維溫鹽重建模型,該模型首先使用廣義回歸神經(jīng)網(wǎng)絡(luò)與果蠅優(yōu)化算法(FOAGRNN)合成T/S 剖面,然后利用增量強(qiáng)約束四維變分同化算法將合成的T/S 剖面同化到區(qū)域海洋模式系統(tǒng)(ROMS)中,實(shí)驗(yàn)結(jié)果表明間接同化后的溫度和鹽度均方根誤差相對于直接同化分別降低26.0%和23.1%。聶旺琛等人[15]利用果蠅優(yōu)化廣義回歸神經(jīng)網(wǎng)絡(luò)算法(FOAGRNN)構(gòu)建了海面溫度、海面鹽度、海面高度與次表層溫鹽場之間的投影關(guān)系模型,并在全球范圍使用SODA 和衛(wèi)星遙感數(shù)據(jù)評估了模型的應(yīng)用性能,2016年SODA 海面數(shù)據(jù)的理想全球重構(gòu)試驗(yàn)的溫鹽平均均方根誤差分別為0.36 ℃和0.08‰,衛(wèi)星觀測海面數(shù)據(jù)的應(yīng)用重構(gòu)試驗(yàn)結(jié)果與ARGO 剖面比較的溫鹽平均均方根誤差分別為0.79 ℃和0.16‰,重構(gòu)溫度RMSE 從海面向下迅速增大,至100 m 達(dá)到峰值1.35 ℃后又迅速回落,躍層往下不斷減小,重構(gòu)鹽度RMSE 基本隨深度增大而減小。
已開展的常規(guī)神經(jīng)網(wǎng)絡(luò)三維溫鹽場智能探測主要針對全球或北太平洋海域,使用的海面遙感數(shù)據(jù)與第2 節(jié)介紹的一致,個別研究增加了海面流速數(shù)據(jù)后探測精度有所提高,總體海水溫度智能探測結(jié)果的均方根誤差為0.3~0.8 ℃左右。
隨著深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型與方法的不斷發(fā)展,海洋科學(xué)研究和數(shù)據(jù)處理中也廣泛應(yīng)用了深度學(xué)習(xí)人工智能技術(shù)。次表層水下三維溫鹽場智能探測使用的深度學(xué)習(xí)方法有:卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、生成對抗神經(jīng)網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)、長短時記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)、自組織映射(Self-Organizing Map,SOM)神經(jīng)網(wǎng)絡(luò)以及將不同神經(jīng)網(wǎng)絡(luò)相結(jié)合的組合網(wǎng)絡(luò)模型等。下面按照神經(jīng)網(wǎng)絡(luò)分類綜述次表層三維溫鹽場智能探測研究進(jìn)展。
CNN 是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是一種多層的監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),一般由卷積層、池化層、全連接層和激活函數(shù)組成,隱藏層的卷積層和池化層是實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的核心模塊。CNN 主要應(yīng)用于計(jì)算機(jī)視覺和自然語言處理等領(lǐng)域,目前在三維溫鹽場智能探測方面也得到了較多應(yīng)用。圖2 是CNN 模型三維溫鹽場智能探測流程的示意圖。
近年來已開展較多基于CNN 的三維溫鹽場智能探測研究。HAN 等人[16]提出了一種基于海面溫度、海面高度和海面鹽度數(shù)據(jù)預(yù)測次表層海水溫度的卷積神經(jīng)網(wǎng)絡(luò)方法,建立了不同月份的CNN 模型用于預(yù)測和重建太平洋海洋次表面海水溫度,并與ARGO 現(xiàn)場數(shù)據(jù)進(jìn)行比較驗(yàn)證準(zhǔn)確性,結(jié)果表明所建立的模型可以準(zhǔn)確估計(jì)太平洋的海洋次表層溫度,平均均方誤差在0.26~0.52 ℃之間,研究發(fā)現(xiàn)0~300 m 海水溫度變化較大,所建立的模型在500 m 以下的深度預(yù)測準(zhǔn)確性逐漸降低。SU 等人[17]基于CNN 模型提出了一種結(jié)合衛(wèi)星遙感和剖面浮標(biāo)觀測數(shù)據(jù)反演全球海洋0~1 000 m 高分辨率海水溫度場的方法,基于提出的方法將海水溫度場的空間分辨率從1°提高到0.25°,該研究分別基于單時間(2015年12月)建模和時間序列(2010年1月—2015年11月)的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,2015年12月的數(shù)據(jù)作為測試數(shù)據(jù)集建模,分析了不同深度的反演結(jié)果,使用EN4 網(wǎng)格數(shù)據(jù)進(jìn)行精度驗(yàn)證,結(jié)果表明在大訓(xùn)練樣本的情況下 CNN 優(yōu)于LightGBM,平均均方根誤差為1.162℃,時間序列CNN 模型具有更高的精度且反演結(jié)果中包含更多尺度的動力過程。MENG 等人[18]基于CNN 模型開展了衛(wèi)星觀測海面數(shù)據(jù)反演水下0~2 000 m 的不同深度溫度異常和鹽度異常的研究,提出了一種滑動區(qū)域方案從小區(qū)域估計(jì)網(wǎng)格點(diǎn)的水下溫鹽異常,將反演的溫鹽異常數(shù)據(jù)從ARGO 網(wǎng)格數(shù)據(jù)的水平分辨率1°提高到1/4°,使用的衛(wèi)星海面觀測數(shù)據(jù)包括海面高度異常、海面溫度、海面鹽度和海面風(fēng)速等數(shù)據(jù)??紤]到躍層存在對三維溫度預(yù)測精度會有很大影響,ZUO 等人[19]提出了立體時空四維卷積模型(SST-4D-CNN)來預(yù)測海水溫度,該模型充分考慮了時間序列和海洋空間關(guān)系以提高預(yù)測精度,該模型包括4D 卷積模塊、殘差模塊和重新校準(zhǔn)模塊,其中4D 卷積模塊用于提取海洋時間和空間特征,重新校準(zhǔn)模塊用于探索和量化各區(qū)域特征的貢獻(xiàn)以提高模型的質(zhì)量,研究利用2016-2018年每日的西北太平洋海水溫度數(shù)據(jù),預(yù)測了0~2 000 m 的緯向斷面和水平各層溫度,結(jié)果顯示SST-4D-CNN的準(zhǔn)確率高于SVR、LSTM 以及3D-CNN 等模型。MENG 等人[20]基于多源衛(wèi)星遙感觀測的海面高度異常、海面溫度、海面鹽度、海面風(fēng)速數(shù)據(jù)和全球海洋再分析數(shù)據(jù)GLORYS12V1,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的海洋次表層溫鹽重構(gòu)的深度學(xué)習(xí)方法,并開展了高分辨率(1/4)°和超高分辨率(1/12)°太平洋次表層海水溫度異常和海水鹽度異常重構(gòu),所提出的方法提高了從衛(wèi)星觀測中估算海洋內(nèi)部參數(shù)的分辨率和準(zhǔn)確性,并且模型在更深的范圍也是可靠的。
CNN 雖然能夠更好地捕捉空間特征,但在卷積過程中不可避免地會丟失信息,這可能會丟失一些關(guān)鍵的細(xì)節(jié)特征,并導(dǎo)致重建精度降低。針對于此,MAO 等人[21]提出了一種基于雙路徑卷積神經(jīng)網(wǎng)絡(luò)(DP-CNN)的智能方法,使用CMEMS 的月均再分析的海面溫度(SST)、海面鹽度(SSS)和海面高度(SSH)數(shù)據(jù)開展海洋溫鹽場重建研究,解決傳統(tǒng)CNN(卷積神經(jīng)網(wǎng)絡(luò))模型中細(xì)節(jié)信息丟失的問題,實(shí)驗(yàn)結(jié)果表明DP-CNN 模型比CNN模型具有更高的重建精度,有效地減少了CNN 模型中詳細(xì)信息的損失。
作為經(jīng)典深度學(xué)習(xí)方法,CNN 已在三維溫鹽場智能探測方面得到較多應(yīng)用,已有研究使用的海面遙感數(shù)據(jù)同樣與第2 節(jié)介紹的相同,在考慮躍層影響和充分利用數(shù)據(jù)的時空特征方面嘗試對方法做了改進(jìn)研究,因研究區(qū)域和使用數(shù)據(jù)的不同,不同研究結(jié)果得到的三維溫鹽場構(gòu)建精度相差較大。
GAN 網(wǎng)絡(luò)是一種無監(jiān)督學(xué)習(xí)算法,通過同時訓(xùn)練2 個模型來實(shí)現(xiàn)捕捉訓(xùn)練集分布的生成式模型、判別模型估計(jì)樣本來自訓(xùn)練數(shù)據(jù)而非生成模型的概率。GAN 由2 個互相對抗的神經(jīng)網(wǎng)絡(luò)組成,1個生成器和1 個判別器,它們彼此競爭推動整個模型學(xué)習(xí)。已有研究基于GAN 模型開展了次表層溫度場和鹽度場的預(yù)測。海洋內(nèi)部溫度的預(yù)測通常是基于物理的數(shù)值模型或基于數(shù)據(jù)驅(qū)動的模型。數(shù)據(jù)驅(qū)動的預(yù)測模型其物理解釋性差且依賴訓(xùn)練數(shù)據(jù),泛化能力有限。MENG 等人[22]提出了一種基于生成對抗性網(wǎng)絡(luò)(GAN)和數(shù)值模型相結(jié)合來預(yù)測次表層溫度場的方法,該方法首先基于GAN 模型學(xué)習(xí)數(shù)值模型中海面溫度和次表層海水溫度間的簡化物理關(guān)系,然后使用ARGO 數(shù)據(jù)校準(zhǔn)網(wǎng)絡(luò)模型參數(shù)以獲得更好的預(yù)測,該研究使用HYCOM 海洋再分析數(shù)據(jù)預(yù)訓(xùn)練網(wǎng)絡(luò)模型,使用 ARGO 和OISST 數(shù)據(jù)微調(diào)部分網(wǎng)絡(luò)模型參數(shù),并預(yù)測中國南海區(qū)域三維溫度場,結(jié)果顯示所提出的網(wǎng)絡(luò)框架有效地利用了數(shù)值模型和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),提出的網(wǎng)絡(luò)模型性能優(yōu)于PGsim、PGNN 和PGConvLSTM等模型,三維溫度場的均方根誤差為0.9~1.2 ℃。針對傳統(tǒng)海洋次表層海水鹽度重建方法經(jīng)常受到附加約束、先驗(yàn)物理假設(shè)和特定回歸系數(shù)等因素的影響,ZHANG 等人[23]提出了一種基于生成對抗網(wǎng)絡(luò)(GAN)的深度學(xué)習(xí)框架,從純數(shù)據(jù)驅(qū)動的角度直接構(gòu)建近實(shí)時、高分辨率的每日三維海洋表層以下2~200 m(分為12 層)海水鹽度數(shù)據(jù)集;實(shí)驗(yàn)使用HYCOM 再分析數(shù)據(jù),在中國邊緣海域設(shè)計(jì)了一個原始3D-GAN 模型以及在此基礎(chǔ)上加入殘差結(jié)構(gòu)、初始化結(jié)構(gòu)和同時加入殘差及初始化結(jié)構(gòu)的另外3 個3D-GAN 模型,研究結(jié)果表明加入殘差和初始化結(jié)構(gòu)的3D-GAN 網(wǎng)絡(luò)模型性能最優(yōu),平均均方根誤差為0.135 psu,整體性能超過傳統(tǒng)的MODAS 模型。
基于GAN 網(wǎng)絡(luò)的水下三維溫鹽場智能探測研究較少,已有研究實(shí)現(xiàn)了對每日三維溫鹽場的智能探測,這是相對于其他智能方法最大的優(yōu)勢,但目前研究探測的水深在200 m 以內(nèi)。
LSTM 網(wǎng)絡(luò)是一種循環(huán)神經(jīng)網(wǎng)絡(luò)的特殊形式,通過門單元的邏輯控制決定數(shù)據(jù)是否更新或丟棄,克服了循環(huán)神經(jīng)網(wǎng)路權(quán)重影響太大、容易產(chǎn)生梯度消失和爆炸的問題。LSTM 包含遺忘門、輸入門和輸出門,遺忘門用于選擇性地遺忘之前的信息,輸入門決定新輸入的信息中哪些將被保留,并更新神經(jīng)元狀態(tài)。輸出門使用更新后的神經(jīng)元狀態(tài)和tanh激活函數(shù)更新隱藏狀態(tài),隱藏狀態(tài)在每個時間步作為模型的輸出。LSTM 模型已廣泛應(yīng)用到海洋次表層三維溫鹽場智能探測研究中了,具體應(yīng)用流程如圖3所示。
使用衛(wèi)星遙感數(shù)據(jù)大規(guī)模探測和預(yù)測海洋次表層溫度和鹽度結(jié)構(gòu)是一項(xiàng)極具挑戰(zhàn)的任務(wù)。經(jīng)典的機(jī)器學(xué)習(xí)方法難以顧及海洋數(shù)據(jù)的空間和時間序列特征,循環(huán)神經(jīng)網(wǎng)絡(luò)的LSTM 模型已被廣泛應(yīng)用于基于表層遙感的次表層水下三維溫鹽場重構(gòu)研究。SU 等人[24]提出了一種基于雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(Bi-LSTM)的次表層溫躍層結(jié)構(gòu)預(yù)測模型,該模型基于月均海面遙感數(shù)據(jù)(海面溫度異常、海面高度異常、海面鹽度異常、海面風(fēng)速異常)、經(jīng)緯度信息和ARGO 網(wǎng)格數(shù)據(jù),預(yù)測全球海洋次表層海水溫度和鹽度異常,該研究測試了不同表層輸入?yún)?shù)組合下的精度,預(yù)測結(jié)果與ARMOR3D數(shù)據(jù)集具有較好的吻合度,研究結(jié)果表明更多輸入變量有利于提高網(wǎng)絡(luò)性能。
除了常規(guī)LSTM 網(wǎng)絡(luò)外,卷積LSTM 模型被廣泛應(yīng)用到三維溫鹽場智能探測研究中。XIAO 等人[25]提出了一種卷積LSTM 模型用于預(yù)測長時間序列海洋內(nèi)部溫度,基于BOA-ARGO 數(shù)據(jù)重構(gòu)了南太平洋1年的海洋內(nèi)部溫度,結(jié)果表明所提出模型在所有測試樣本和所有深度層的表現(xiàn)上均優(yōu)于AdaBoost 模型和BPNN 模型,這表明所提出的網(wǎng)絡(luò)模型能夠較好地長期預(yù)測月均三維海洋溫度場。SONG 等人[26]基于卷積長短期記憶神經(jīng)網(wǎng)絡(luò)提出了一種利用海面衛(wèi)星觀測(海面溫度、海面鹽度、海面高度和海面風(fēng)速)和ARGO 數(shù)據(jù)反演2 000 m深度以內(nèi)海洋次表層溫鹽場的方法,通過考慮海洋變化的顯著空間和時間相關(guān)性特征來提高反演模型的穩(wěn)健性和可推廣性,結(jié)果表明海面溫度異常、海面鹽度異常、海面高度異常和海面風(fēng)速異常是獲得準(zhǔn)確次表層水下溫鹽場估計(jì)的有價值參數(shù),該研究提出的方法優(yōu)于經(jīng)典的隨機(jī)森林和LSTM 方法。SU 等人[27]提出了一種基于卷積長短期記憶神經(jīng)網(wǎng)絡(luò)的全球海洋次表層海水溫度重構(gòu)方法,將多源遙感觀測數(shù)據(jù)與 ARGO 網(wǎng)格數(shù)據(jù)相結(jié)合,生成了1993-2020年2 000 m 以淺全球海洋次表層海水溫度數(shù)據(jù),利用ARGO 網(wǎng)格數(shù)據(jù)、EN4-Profile 數(shù)據(jù)驗(yàn)證反演結(jié)果,研究結(jié)果表明ConvLSTM 模型可以學(xué)習(xí)海洋觀測數(shù)據(jù)的時空特征,反演結(jié)果優(yōu)于LighGBM 模型。
以往基于深度學(xué)習(xí)方法預(yù)測海水溫度只局限于一些孤立點(diǎn)的時間序列預(yù)測,沒有考慮它們的空間聯(lián)系,同時將CNN 與LSTM 相結(jié)合成為LSTM網(wǎng)絡(luò)應(yīng)用的一個方向。ZHANG 等人[28-29]提出了一個多層卷積長短期記憶神經(jīng)網(wǎng)絡(luò)(M-convLSTM)模型,使用2005-2017年ARGO 浮標(biāo)標(biāo)準(zhǔn)全球1°網(wǎng)格月均數(shù)據(jù)預(yù)測太平洋三維海水溫度,輸入數(shù)據(jù)為預(yù)測月份前28 個月的歷史溫度數(shù)據(jù)。該模型包括CNN 和LSTM 的多層疊加,模型使用27 個深度層的輸入數(shù)據(jù)集來預(yù)測海面到2 000 m 深度的水平和垂直月均溫度變化,研究結(jié)果表明隨深度增加預(yù)測精度略有下降,預(yù)測結(jié)果精度高于CFCCLSTM 模型。SU 等人[30]基于XGBoost 和RFs 集成學(xué)習(xí)與Bi-LSTM 和CNN 深度學(xué)習(xí)方法,通過將多源衛(wèi)星觀測海面高度、海面溫度、海面鹽度和海面風(fēng)速數(shù)據(jù)和ARGO 現(xiàn)場數(shù)據(jù)相結(jié)合,開展了不同方法的次表層溫躍層智能提取研究,研究結(jié)果表明適用于小數(shù)據(jù)建模的集成學(xué)習(xí)算法能夠很好地提取單一時刻的次表層溫躍層結(jié)構(gòu),而適用于大數(shù)據(jù)建模的深度學(xué)習(xí)算法則能夠很好地預(yù)測時序次表層溫躍層結(jié)構(gòu)。
基于 LSTM 模型的智能探測方法從傳統(tǒng)的LSTM 發(fā)展到BiLSTM、ConvLSTM 以及與CNN結(jié)合等,三維溫鹽場探測精度有所提高。
除了主流的CNN、GAN 和LSTM 模型外,也有部分研究使用了SOM、U-net 或其他深度學(xué)習(xí)模型。WU 等人[31]為了從遙感數(shù)據(jù)中估計(jì)次表層海水溫度異常,采用自組織映射(SOM)神經(jīng)網(wǎng)絡(luò),使用ARGO 網(wǎng)格月均海面溫度(SST)、海面高度(SSH)和海面鹽度(SSS)異常數(shù)據(jù)進(jìn)行訓(xùn)練,以2005-2010年的ARGO STA 數(shù)據(jù)為目標(biāo)特征,根據(jù)海面遙感數(shù)據(jù)估計(jì)北大西洋不同深度的海水溫度異常(STA),研究結(jié)果表明墨西哥灣流區(qū)域的STA 估計(jì)從海面到700 m 與現(xiàn)場測量一致性良好,SOM 訓(xùn)練過程中SSS 異常數(shù)據(jù)揭示了SSS 信息的重要性,同時該研究根據(jù)遙感 SST 和測高時間序列估計(jì)了1993-2004年北大西洋中緯度的STA 時間序列。針對海洋內(nèi)部溫度場重構(gòu)沒有足夠重視估計(jì)結(jié)果的不確定性的問題,CHEN 等人[32]將DERN 方法與EOF 方法相結(jié)合提出了DERN-EOF 方法,利用WOD18 全球溫鹽剖面數(shù)據(jù)重構(gòu)三維溫度場,首先對溫度剖面數(shù)據(jù)進(jìn)行EOF 分解以得到EOF 系數(shù)和向量,然后通過DERN 方法建立EOF 系數(shù)與SST、SLA 間的回歸關(guān)系;使用WOD18 溫度剖面數(shù)據(jù)建立海面和水下溫度場間的回歸數(shù)據(jù)庫。XIE 等人[33]針對高精度地預(yù)測南海內(nèi)部三維溫度場這一難題,提出了一種注意力U-Net 網(wǎng)絡(luò),根據(jù)衛(wèi)星觀測到的海面溫度、海面高度異常、海面風(fēng)速以及風(fēng)應(yīng)力旋度重建高時空分辨率的南海三維溫度場,海洋再分析數(shù)據(jù)SODA 用于模型的訓(xùn)練和評估,研究結(jié)果表明注意力U-Net 模型在中國南海上層100 m 的海水溫度重建中表現(xiàn)良好。SUN 等人[34]設(shè)計(jì)了一個3D U-Net 模型來提取過去12 個月內(nèi)次表層溫度場的時空相關(guān)性,嘗試預(yù)測未來12 個月太平洋及其周邊海洋0~400 m 的次表層溫度場,將3D U-Net與季節(jié)性樸素模型、M-ConvLSTM 模型和簡單的3D-CNN(S3D-CNN)進(jìn)行比較,所提出的方法能夠比以往方法更準(zhǔn)確地預(yù)測大多數(shù)深度的海水溫度。
其他深度學(xué)習(xí)方法和經(jīng)典方法的組合使用在三維溫鹽場智能探測中也進(jìn)行了應(yīng)用,使用的海面遙感數(shù)據(jù)與前述研究一致,三維溫鹽場的反演精度也類似。
基于海洋表層衛(wèi)星遙感觀測數(shù)據(jù),結(jié)合深度學(xué)習(xí)方法對次表層三維溫鹽場進(jìn)行智能探測已成為海洋學(xué)研究的前沿?zé)狳c(diǎn)之一,為獲取時空分辨率和精度更高的三維溫鹽場數(shù)據(jù)提供了一種新的途徑。近年來已開展了較多基于各種機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法的次表層三維溫鹽場智能探測研究,次表層三維溫鹽場探測在不同的研究中表述為三維溫鹽場反演、重構(gòu)或重建,有時也表述為次表層海水溫度和鹽度預(yù)測??偨Y(jié)相關(guān)研究可以發(fā)現(xiàn):
1)使用的海洋表層衛(wèi)星遙感數(shù)據(jù)主要有海面高度、海面溫度、海面鹽度和海面風(fēng)速等的網(wǎng)格數(shù)據(jù),個別研究使用了海面流速或增加了經(jīng)緯度位置信息。用于構(gòu)建訓(xùn)練數(shù)據(jù)集的現(xiàn)場數(shù)據(jù)主要是ARGO 浮標(biāo)溫鹽剖面網(wǎng)格化數(shù)據(jù),EN4 等數(shù)據(jù)集用于方法精度評估。為了突出相關(guān)參數(shù)的變化特征,大多研究采用的均為各變量相對于平均態(tài)的異常值,如海面高度異常、海面溫度異常、海面鹽度異常等智能反演次表層溫度異常和鹽度異常。
2)已有研究均是純數(shù)據(jù)驅(qū)動,采用的智能方法包括傳統(tǒng)機(jī)器學(xué)習(xí)、一般神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等方法,機(jī)器學(xué)習(xí)方法主要包括SVR、SVM、RF、XGBoost 和LightGBM 等,一般神經(jīng)網(wǎng)絡(luò)方法有NN、BPNN 等,深度學(xué)習(xí)方法主要包括CNN、GAN、LSTM 等及其相互結(jié)合使用的組合模型。
3)次表層三維溫鹽場智能探測的最大水深一般為500 m、1 000 m,最大至2 000 m,智能探測的三維溫鹽場絕大部分為月均數(shù)據(jù),大多智能探測是按水深分層分別建立模型,探測結(jié)果在躍層和深海區(qū)域誤差較大。已有研究中各種智能探測方法的三維溫鹽場探測精度相差較大,三維海水溫度場最優(yōu)可達(dá)0.02 ℃,一般為0.3~1.7 ℃左右;三維海水鹽度場最優(yōu)達(dá)0.025 psu,不同研究差異較大的原因可能與使用的月均數(shù)據(jù)、研究區(qū)域和研究時間段的不同有關(guān)。
目前已開展的次表層三維溫鹽場智能探測都是基于網(wǎng)格化的海洋表層遙感數(shù)據(jù),未使用原始遙感數(shù)據(jù),而原始遙感數(shù)據(jù)網(wǎng)格化處理會平滑掉部分高頻小尺度信號,現(xiàn)場觀測數(shù)據(jù)使用的是ARGO剖面溫鹽網(wǎng)格數(shù)據(jù)而不是真實(shí)的ARGO 剖面溫鹽數(shù)據(jù),智能方法均為純數(shù)據(jù)驅(qū)動。未來該研究方向應(yīng)從原始海面遙感和現(xiàn)場溫鹽剖面數(shù)據(jù)出發(fā),結(jié)合海水運(yùn)動的動力和熱力學(xué)機(jī)制,發(fā)展物理機(jī)制約束下的次表層三維溫鹽場智能探測方法,實(shí)現(xiàn)基于表層遙感數(shù)據(jù)對每天或更高時間分辨率的次表層三維溫鹽場數(shù)據(jù)的同時獲取。