文 | 郝伊一 唐偉 周勇 王喆
1.中國(guó)氣象局氣象干部培訓(xùn)學(xué)院 2.中國(guó)氣象局發(fā)展研究中心
衛(wèi)星在氣象預(yù)報(bào)、生態(tài)監(jiān)測(cè)、水利資源及開(kāi)發(fā)等方面的應(yīng)用非常廣泛。衛(wèi)星資料有圖像資料(衛(wèi)星云圖)和探測(cè)資料(定量數(shù)字資料)兩大類(lèi)。以衛(wèi)星云圖為例,它是由氣象衛(wèi)星(或個(gè)別陸地衛(wèi)星)自上而下觀測(cè)到的云層覆蓋和地表面特征的圖像,利用衛(wèi)星云圖可以彌補(bǔ)常規(guī)探測(cè)資料的不足,為天氣分析和天氣預(yù)報(bào)提供依據(jù),對(duì)提高預(yù)報(bào)準(zhǔn)確率起了重要作用。對(duì)于衛(wèi)星資料的處理,傳統(tǒng)以閾值法、聚類(lèi)法為主,21世紀(jì)以來(lái)由于人工智能的迅速發(fā)展,基于機(jī)器學(xué)習(xí)的方法陸續(xù)被提出。
機(jī)器學(xué)習(xí)是指通過(guò)計(jì)算機(jī)學(xué)習(xí)數(shù)據(jù)中的內(nèi)在規(guī)律性信息,獲得新的經(jīng)驗(yàn)和知識(shí),以提高計(jì)算機(jī)的智能性,使計(jì)算機(jī)能夠像人那樣去決策[1]。作為人工智能的技術(shù)基礎(chǔ),與傳統(tǒng)的統(tǒng)計(jì)方法相比,機(jī)器學(xué)習(xí)不僅擁有通過(guò)算法對(duì)計(jì)算機(jī)數(shù)據(jù)進(jìn)行快速處理的能力,還擁有統(tǒng)計(jì)模型所具有的對(duì)問(wèn)題進(jìn)行預(yù)測(cè)、分類(lèi)的能力[2],并且準(zhǔn)確率較傳統(tǒng)方法有明顯提高。在當(dāng)前的“大數(shù)據(jù)”時(shí)代,機(jī)器學(xué)習(xí)在海量的衛(wèi)星資料中有著巨大的應(yīng)用潛力。本文簡(jiǎn)要梳理了國(guó)內(nèi)外機(jī)器學(xué)習(xí)算法在衛(wèi)星資料的云識(shí)別、降水估計(jì)等相關(guān)領(lǐng)域的主要應(yīng)用情況。
利用氣象衛(wèi)星云圖進(jìn)行云的檢測(cè)和分類(lèi)是基于“在衛(wèi)星觀測(cè)視角內(nèi),地表和云有不同的特征”這一假設(shè)的基礎(chǔ)上進(jìn)行的,云檢測(cè)和云分類(lèi)是氣象衛(wèi)星云圖最基本也是最重要的研究?jī)?nèi)容之一。
云檢測(cè)是利用云和晴空像元在不同光譜段上輻射特性的不同,采用多通道輻射信息,將衛(wèi)星觀測(cè)像元分為有云像元和晴空像元。已有研究利用神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、遷移學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)等方法,成功地對(duì)衛(wèi)星圖像進(jìn)行云檢測(cè)。師春香等人采用多閾值和人工神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,對(duì)日本靜止氣象衛(wèi)星GMS紅外云圖進(jìn)行自動(dòng)分割,輸出分割出的每一個(gè)云區(qū),同時(shí)還包括云區(qū)的邊界鏈碼、起始點(diǎn)、周長(zhǎng)、面積,并保留了原始圖像數(shù)據(jù),結(jié)果顯示云檢測(cè)正確率達(dá)到90%以上[3]。宋小寧等人利用一種基于空間結(jié)構(gòu)分析和神經(jīng)網(wǎng)絡(luò)的云自動(dòng)檢測(cè)算法,對(duì)美國(guó)極軌氣象衛(wèi)星Terra和Aqua上搭載的中分辨率成像光譜儀(MODIS)圖像進(jìn)行了云檢測(cè)研究,研究表明利用MODIS圖像可成功地檢測(cè)云點(diǎn)像元[4]。胡根生等人提出一種云量自動(dòng)評(píng)估和加權(quán)支持向量機(jī)相結(jié)合的云檢測(cè)算法對(duì)美國(guó)陸地衛(wèi)星(Landsat)圖像進(jìn)行云檢測(cè)。結(jié)果表明,該方法既具有云量自動(dòng)評(píng)估算法的云檢測(cè)優(yōu)勢(shì),還對(duì)云量自動(dòng)評(píng)估算法難以識(shí)別的半透明云有較好的檢測(cè)效果。[5]胡凱等人利用遷移學(xué)習(xí)中的多源加權(quán)(Tradaboost)算法(內(nèi)部采用極限學(xué)習(xí)機(jī)作為分類(lèi)器)對(duì)我國(guó)環(huán)境與災(zāi)害監(jiān)測(cè)預(yù)報(bào)小衛(wèi)星星座(HJ-1A/B)的衛(wèi)星圖像進(jìn)行云的檢測(cè),利用多人(多源)標(biāo)注的大量厚云的樣本構(gòu)成多源輔助樣本集,利用少量標(biāo)注的薄云樣本構(gòu)成目標(biāo)樣本集。結(jié)果表明遷移學(xué)習(xí)可以充分利用容易獲得的大樣本厚云輔助樣本知識(shí),對(duì)同類(lèi)型有關(guān)聯(lián)的小樣本薄云分類(lèi)器進(jìn)行識(shí)別提高。[6]夏旻等人利用卷積神經(jīng)網(wǎng)絡(luò)方法,針對(duì)HJ-1A/B衛(wèi)星圖像進(jìn)行云的檢測(cè),并利用空間相關(guān)法計(jì)算總云量,結(jié)果表明,通過(guò)對(duì)卷積網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)的優(yōu)化,卷積神經(jīng)網(wǎng)絡(luò)可以很好地提取云圖的特征,云分類(lèi)時(shí)厚云和薄云之間的過(guò)渡區(qū)域清晰,云的識(shí)別率以及云量計(jì)算的準(zhǔn)確率都比傳統(tǒng)閾值法、動(dòng)態(tài)閾值法以及極限學(xué)習(xí)機(jī)模型的結(jié)果要好。[7]
云分類(lèi)是利用可見(jiàn)光和紅外通道觀測(cè)數(shù)據(jù)對(duì)云進(jìn)行分類(lèi),從宏觀角度一般可將云分為:積雨云、厚卷云、薄卷云、雨層云、中云、低云和層云(霧);根據(jù)云頂特性,可以從云的相態(tài)將云分為冰云、水云和混合相態(tài)云。已有研究利用神經(jīng)網(wǎng)絡(luò)、遺傳算法、支持向量機(jī)方法,成功地對(duì)衛(wèi)星圖像進(jìn)行云分類(lèi)。白慧卿識(shí)別了日本靜止氣象衛(wèi)星GMS云圖中的四類(lèi)云系,并與傳統(tǒng)的統(tǒng)計(jì)識(shí)別方法進(jìn)行了對(duì)比,結(jié)果表明神經(jīng)網(wǎng)絡(luò)方法更適合于云系的特征識(shí)別。[8]洪梅等人提出一種結(jié)合了遺傳算法全局尋優(yōu)、模糊C均值聚類(lèi)算法局部尋優(yōu)、模糊減法聚類(lèi)算法客觀估算聚類(lèi)數(shù)三種方法的綜合方法(FSC-GA-FCM),對(duì)GMS-5衛(wèi)星云圖進(jìn)行云分類(lèi)判別。試驗(yàn)結(jié)果表明,綜合方法的云分類(lèi)效果明顯優(yōu)于單一的模糊C均值聚類(lèi)算法和遺傳算法,可運(yùn)用于實(shí)況云圖的云分類(lèi)客觀、自動(dòng)判別。[9]黃兵等人建立了自組織神經(jīng)網(wǎng)絡(luò)(SOFM)和概率神經(jīng)網(wǎng)絡(luò)(PNN)的綜合云分類(lèi)器優(yōu)化方法,對(duì)GMS-5衛(wèi)星云圖多光譜云類(lèi)樣本進(jìn)行云分類(lèi),試驗(yàn)結(jié)果表明,該方法可有效提高云類(lèi)判別效果,分類(lèi)結(jié)果的總正確率達(dá)到92.4%,Kappa系數(shù)為90.82,明顯優(yōu)于單一的統(tǒng)計(jì)分類(lèi)器判別效果。[10]張振華等人采用兩層嵌套的BP人工神經(jīng)網(wǎng)絡(luò)模型,基于我國(guó)靜止氣象衛(wèi)星風(fēng)云二號(hào)C星(FY-2C)可見(jiàn)光和紅外、水汽亮溫資料進(jìn)行云分類(lèi)研究,結(jié)果表明,嵌套模型的分類(lèi)結(jié)果比傳統(tǒng)模型的分類(lèi)結(jié)果更合理,特別是在中低云和薄卷云的云量和位置分辨能力上有了較大提高。[11]Lee Y等人應(yīng)用多參數(shù)支持向量機(jī)方法全局優(yōu)化分類(lèi)(MSVM)來(lái)模擬MODIS數(shù)據(jù)進(jìn)行云的分類(lèi),取得很好的分類(lèi)效果。[12]嚴(yán)衛(wèi)等人構(gòu)建了聯(lián)合美國(guó)云-氣溶膠激光雷達(dá)和紅外探路者衛(wèi)星(CALIPSO)和云探測(cè)衛(wèi)星(CloudSat)資料的云相態(tài)識(shí)別模型,并和溫度閾值法進(jìn)行比較,結(jié)果表明支持向量機(jī)云相態(tài)識(shí)別技術(shù)具有較高的識(shí)別精度,能夠更為準(zhǔn)確地反演云相態(tài)的垂直分布信息。[13]
氣象衛(wèi)星的降水估計(jì)(降水分類(lèi))是指根據(jù)天氣學(xué)云的知識(shí),利用云圖識(shí)別原理來(lái)估計(jì)一些天氣系統(tǒng)的降水分布(或是識(shí)別出產(chǎn)生降水的主要云類(lèi)),具有重要的應(yīng)用價(jià)值。[14]已有研究人員利用人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林等方法,成功地利用衛(wèi)星資料進(jìn)行降水估計(jì)。
利用日本GMS衛(wèi)星紅外圖像和地面資料估計(jì)降雨率,Kou-Lin Hsu等人提出一種基于自適應(yīng)人工神經(jīng)網(wǎng)絡(luò)的降水估計(jì)算法,結(jié)果顯著提高了對(duì)不同地理區(qū)域、不同時(shí)間降水特征的估計(jì)性能。[15]熊秋芬等人采用人工神經(jīng)網(wǎng)絡(luò)方法對(duì)GMS衛(wèi)星多通道資料進(jìn)行地面降水估計(jì),結(jié)果表明,該方法提供的客觀定量的降水量估算平均相關(guān)系數(shù)為0.57,較使用單通道紅外云圖資料和簡(jiǎn)單閾值和函數(shù)方法更佳。[16]夏雙等人基于三層前向型反向傳播神經(jīng)網(wǎng)絡(luò)的衛(wèi)星降水估算模型,利用我國(guó)FY-2C數(shù)據(jù)對(duì)藏北高原進(jìn)行了降水估計(jì)研究。結(jié)果表明,人工神經(jīng)網(wǎng)絡(luò)能較好地刻畫(huà)該地域衛(wèi)星降水特征的非線性規(guī)律,三層前向型反向傳播神經(jīng)網(wǎng)絡(luò)衛(wèi)星降水估算模型的估算結(jié)果與雨量計(jì)實(shí)測(cè)值間的相關(guān)性可以達(dá)到0.57。[17]劉建朝等人利用支持向量機(jī)方法,基于FY-2C/D資料和我國(guó)氣象部門(mén)預(yù)報(bào)業(yè)務(wù)系統(tǒng)Micaps 1小時(shí)雨量資料,建立預(yù)測(cè)降水與非降水的分類(lèi)模型。結(jié)果表明,降水類(lèi)的預(yù)測(cè)準(zhǔn)確率在40%~60%,非降水類(lèi)的預(yù)測(cè)準(zhǔn)確率在90%以上。[18]Bellerby T等人結(jié)合美國(guó)靜止氣象衛(wèi)星GOES衛(wèi)星圖像和熱帶降雨測(cè)量任務(wù)衛(wèi)星(TRMM)降水雷達(dá)數(shù)據(jù),生成巴西某地區(qū)0.12°的空間分辨率、半小時(shí)的降水估計(jì),將相應(yīng)的降水雷達(dá)觀測(cè)值與四波段GOES圖像數(shù)據(jù)進(jìn)行匹配,形成人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)集,將多個(gè)GOES像素的統(tǒng)計(jì)信息與每次降水觀測(cè)進(jìn)行匹配,將云紋理和變化速率的信息納入到估計(jì)過(guò)程中。結(jié)果表明降水雷達(dá)和GOES數(shù)據(jù)的組合可以用來(lái)生成大尺度長(zhǎng)時(shí)間序列的高時(shí)空分辨率降水估計(jì)。[19]Grimes D I F等人將歐洲靜止氣象衛(wèi)星Meteosat的熱紅外圖像中獲得的冷云期(CCD)圖像與數(shù)值天氣模式分析數(shù)據(jù)一起作為人工神經(jīng)網(wǎng)絡(luò)輸入,得到非洲地區(qū)的降水估計(jì),結(jié)果比標(biāo)準(zhǔn)CCD方法有一定改進(jìn),特別是對(duì)較大降雨量的改進(jìn)很明顯。[20]
除了云識(shí)別和降水估計(jì)以外,衛(wèi)星資料在氣象資料反演、災(zāi)害性天氣識(shí)別、生態(tài)監(jiān)測(cè)等方面也有很多成功應(yīng)用,在防災(zāi)減災(zāi)救災(zāi)和生態(tài)文明建設(shè)中可以發(fā)揮重要作用。
氣象衛(wèi)星資料反演是指將衛(wèi)星探測(cè)的原始數(shù)據(jù)經(jīng)一定的變換、訂正與計(jì)算, 反求出表征衛(wèi)星探測(cè)對(duì)象某種特性狀態(tài)的演算過(guò)程。在地面觀測(cè)數(shù)據(jù)不足時(shí),氣象衛(wèi)星資料反演得到的均勻的、高時(shí)空分辨率的氣象要素資料具有很高的價(jià)值。胡文東等人利用BP人工神經(jīng)網(wǎng)絡(luò)和最優(yōu)擬合回歸方法,基于日本GMS-5衛(wèi)星紅外資料,建立了反演大氣相對(duì)濕度場(chǎng)的數(shù)學(xué)模型。[21]鮑艷松等人利用人工神經(jīng)網(wǎng)絡(luò)方法,研究了我國(guó)靜止氣象衛(wèi)星風(fēng)云四號(hào)的高光譜紅外載荷大氣溫度廓線反演方法。[22]涂滿(mǎn)紅等人研究了基于中國(guó)北斗導(dǎo)航衛(wèi)星反射信號(hào)的支持向量機(jī)海面風(fēng)速反演方法。[23]
災(zāi)害性天氣識(shí)別是對(duì)人民生命財(cái)產(chǎn)有嚴(yán)重威脅、對(duì)工農(nóng)業(yè)和交通運(yùn)輸會(huì)造成重大損失的天氣進(jìn)行歸類(lèi)和定性。[24]利用我國(guó)極軌氣象衛(wèi)星風(fēng)云一號(hào)D星(FY-1D)遙感數(shù)據(jù),劉年慶等人提出了一種基于支持向量機(jī)的大霧判別方法。[25]Lakshmanan V等人基于美國(guó)GOES衛(wèi)星和多普勒天氣雷達(dá)(WSR-88D)獲得的反射率數(shù)據(jù)和云頂紅外溫度資料,研究了一種用于識(shí)別不同尺度風(fēng)暴的天氣圖像的分層K均值聚類(lèi)方法。[26]周康輝等人利用模糊邏輯算法,結(jié)合風(fēng)云氣象衛(wèi)星的紅外亮溫和地面氣象觀測(cè)、雷達(dá)等多源數(shù)據(jù),實(shí)現(xiàn)了雷暴大風(fēng)與非雷暴大風(fēng)的有效識(shí)別和實(shí)時(shí)監(jiān)測(cè)。[27]
衛(wèi)星生態(tài)監(jiān)測(cè)是利用衛(wèi)星監(jiān)測(cè)天氣、農(nóng)作物生長(zhǎng)狀況、森林病蟲(chóng)害、空氣和地表水的污染情況等,其最大的優(yōu)點(diǎn)是覆蓋面寬,可以獲得人工難以到達(dá)的高山、叢林資料。楊俊濤等人利用決策樹(shù)分類(lèi)方法,基于美國(guó)靜止氣象衛(wèi)星GOES數(shù)據(jù)生成了雪蓋產(chǎn)品,同時(shí)融合被動(dòng)微波輻射計(jì)(AMSR-E)雪水當(dāng)量產(chǎn)品進(jìn)行雪蓋聯(lián)合監(jiān)測(cè)。[28]梁益同等人利用神經(jīng)網(wǎng)絡(luò)方法實(shí)現(xiàn)了基于美國(guó)極軌氣象衛(wèi)星NOAA的森林火點(diǎn)自動(dòng)識(shí)別。[29]樓琇林等人利用美國(guó)NOAA衛(wèi)星可見(jiàn)光和熱紅外波段遙感數(shù)據(jù),研究了基于人工神經(jīng)網(wǎng)絡(luò)的赤潮監(jiān)測(cè)方法。[30]Roberts D A等人基于光譜混合分析和決策樹(shù)分類(lèi)方法,利用1975年至1999年期間在三個(gè)相鄰地區(qū)獲得的33個(gè)Landsat場(chǎng)景,描述了巴西隆多尼亞中部超過(guò)80000km土地覆蓋的時(shí)空變化。[31]彭靜等人對(duì)美國(guó)Landsat影像資料進(jìn)行決策樹(shù)分類(lèi),得到土地利用/覆蓋分類(lèi)圖像,來(lái)研究背景城市熱島的時(shí)空變化;[32]李建楠等人采用監(jiān)督分類(lèi)支持向量機(jī)方法,利用美國(guó)Landsat衛(wèi)星遙感影像進(jìn)行了呼和浩特地區(qū)地表覆蓋類(lèi)型的識(shí)別。[33]何文莉等人基于我國(guó)環(huán)境與災(zāi)害監(jiān)測(cè)預(yù)報(bào)衛(wèi)星HJ-1A/B數(shù)據(jù)對(duì)濕地地表類(lèi)型進(jìn)行識(shí)別,提取了鄱陽(yáng)湖自然濕地的湖泊濕地類(lèi)型變化數(shù)據(jù)。[34]
目前,我國(guó)有8顆風(fēng)云氣象衛(wèi)星在軌業(yè)務(wù)運(yùn)行,為全球93個(gè)國(guó)家和地區(qū)提供服務(wù),是世界氣象組織全球業(yè)務(wù)應(yīng)用氣象衛(wèi)星序列的重要成員。風(fēng)云衛(wèi)星數(shù)據(jù)逐日遞增,僅2018年的數(shù)據(jù)服務(wù)總量就達(dá)到近5PB,如何認(rèn)識(shí)、理解和用好衛(wèi)星數(shù)據(jù)是當(dāng)前的一個(gè)重大課題。未來(lái)應(yīng)加強(qiáng)機(jī)器學(xué)習(xí)的應(yīng)用,提高風(fēng)云衛(wèi)星資料中云識(shí)別、降水估計(jì)、災(zāi)害性天氣識(shí)別等信息提取和判別的準(zhǔn)確性,同時(shí)在生態(tài)監(jiān)測(cè)中發(fā)揮重要作用,為國(guó)家防災(zāi)減災(zāi)、經(jīng)濟(jì)建設(shè)、生態(tài)文明建設(shè)等提供科技支撐。