耿丹,劉婷婷,李超
(1.江蘇省氣象信息中心,江蘇 南京 210041;2.江蘇省氣象服務(wù)中心,江蘇 南京 210041;3.江蘇省氣象臺(tái),江蘇 南京 210041)
海霧是海上中低層大氣層水汽凝結(jié)造成的天氣現(xiàn)象,凝結(jié)水汽或冰晶積聚形成的海霧會(huì)造成海上的水平能見(jiàn)度降至1000 m 以下。海上大霧一般分平流霧和輻射霧等多種類型,其中平流霧對(duì)人類日常危害性最大,嚴(yán)重影響海上運(yùn)輸、海產(chǎn)養(yǎng)殖和漁業(yè)捕撈等行業(yè)。
隨著海上各行業(yè)的蓬勃發(fā)展,海霧造成的損失越來(lái)越大。由于海上海霧監(jiān)測(cè)點(diǎn)有限,常規(guī)觀測(cè)和船載觀測(cè)基本無(wú)法實(shí)現(xiàn)對(duì)海霧區(qū)域大范圍和長(zhǎng)時(shí)間的實(shí)時(shí)監(jiān)測(cè)[1]。衛(wèi)星遙感技術(shù)的發(fā)展,使人類通過(guò)衛(wèi)星遙感影像對(duì)海上大霧的監(jiān)測(cè)成為可能。鄭新江[2]結(jié)合地球同步氣象衛(wèi)星(Geostationary Meteorology Satellite,GMS)資料分析了黃海海霧生成及演變的特征;Ellrod[3]通過(guò)對(duì)地靜止環(huán)境工作衛(wèi)星(Geostationary Operational Environmental Satellite,GOES)的雙通道紅外資料對(duì)沿海夜間海霧和低云進(jìn)行分析研究;鮑獻(xiàn)文等[4]使用GMS-5 和美國(guó)國(guó)家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)衛(wèi)星遙感資料,分析出海霧在衛(wèi)星遙感資料的光譜和輻射特征特點(diǎn),實(shí)現(xiàn)對(duì)云和霧的識(shí)別及分離的定量分析;何月等[5]通過(guò)多用途運(yùn)輸衛(wèi)星(Multifunctional Transport SATellites,MTSAT)衛(wèi)星遙感影像,采用分級(jí)判識(shí)太陽(yáng)高度角閾值和大霧指數(shù)的方式反演出浙江海上大霧的每小時(shí)發(fā)生情況;Shang 等[6]結(jié)合“葵花8 號(hào)”衛(wèi)星中紅外與長(zhǎng)波紅外通道亮溫差與植被和雪覆蓋指數(shù)等建立了日間陸霧識(shí)別模型;張培等[7]將星載雙波長(zhǎng)偏振Mie 散射激光雷達(dá)(Cloud-Aerosol LIdar with Orthogonal Polarization,CALIOP)數(shù)據(jù)獲得的樣本點(diǎn)用于“葵花8號(hào)”衛(wèi)星對(duì)日間海霧通道及閾值選擇的研究,實(shí)現(xiàn)了一種日間海霧的監(jiān)測(cè)方法;衣立[8]和Wang 等[9]通過(guò)不同方式不斷提升閾值法海霧識(shí)別模型(簡(jiǎn)稱“閾值法”)在海霧識(shí)別中的精度;張春桂等[10]使用中分辨率成像光譜儀(MODerate-Resolution Imaging Spectroradiometer,MODIS)衛(wèi)星數(shù)據(jù)分析出不同下墊面的可見(jiàn)光和紅外輻射的特征特點(diǎn),確定海霧識(shí)別閾值,建立日間海霧識(shí)別模型;孫藝等[11]借助MTSAT可見(jiàn)光衛(wèi)星云圖、“葵花8 號(hào)”可見(jiàn)光衛(wèi)星云圖和韓國(guó)氣象廳(Korea Meteorological Administration,KMA)地面天氣圖對(duì)控制海霧產(chǎn)生的天氣形勢(shì)進(jìn)行了分析,進(jìn)一步討論了各天氣型下黃海海霧的高度特征;于海鵬等[12]使用GOES9 衛(wèi)星的可見(jiàn)光云圖和地面探空站資料對(duì)海霧天氣進(jìn)行識(shí)別。
閾值法是通過(guò)分析云霧在遙感輻射的差異來(lái)實(shí)現(xiàn)對(duì)海霧的監(jiān)測(cè),最難的是如何選擇合適的閾值,而且閾值法不能充分使用各個(gè)波段遙感數(shù)據(jù)內(nèi)容。隨著機(jī)器學(xué)習(xí)在衛(wèi)星遙感領(lǐng)域的不斷應(yīng)用,能夠充分利用衛(wèi)星遙感影像提供的各波段數(shù)據(jù)內(nèi)容。Kim 等[13]通過(guò)決策樹算法結(jié)合“葵花8 號(hào)”和地球靜止 水 色 衛(wèi) 星(Geostationary Ocean Color Imager,GOCI)遙感數(shù)據(jù)的方法實(shí)現(xiàn)了海霧識(shí)別,并利用衛(wèi)星遙感數(shù)據(jù)與朝鮮3個(gè)島嶼能見(jiàn)度觀測(cè)值匹配進(jìn)行模型訓(xùn)練及驗(yàn)證。Shin等[14]基于通信、海洋和氣象衛(wèi)星(Communication、Ocean and Meteorological Satellite,COMS)紅外通道亮溫差,使用無(wú)監(jiān)督學(xué)習(xí)方法實(shí)現(xiàn)對(duì)朝鮮半島西部海霧區(qū)域的識(shí)別。許赟等[15]利用隨機(jī)森林算法結(jié)合衛(wèi)星遙感影像對(duì)云、雪和霧進(jìn)行分類識(shí)別,并通過(guò)增加兩次檢測(cè)減少有效區(qū)域的錯(cuò)檢率。姜紅等[16]通過(guò)歸一化差值沙塵指數(shù)和隨機(jī)森林算法等3 種方法,利用“風(fēng)云四號(hào)”(FY-4A)衛(wèi)星遙感影像實(shí)現(xiàn)對(duì)塔里木盆地沙塵情況的監(jiān)測(cè)研究,通過(guò)試驗(yàn)檢驗(yàn)分析可知隨機(jī)森林模型和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)模型都具有較強(qiáng)的沙塵監(jiān)測(cè)能力。張環(huán)宇等[17]基于衛(wèi)星數(shù)據(jù)的中紅外到熱紅外波段遙感影像數(shù)據(jù)和ERA5水汽再分析產(chǎn)品等數(shù)據(jù),結(jié)合隨機(jī)森林算法實(shí)現(xiàn)對(duì)晴空大氣可降水量的反演,該算法可有效提升大氣可降水量的精度。柳青青等[18]結(jié)合隨機(jī)森林算法,利用海表面鹽度遙感機(jī)理和土壤濕度及海水鹽度(Soil Moisture and Ocean Salinity,SMOS)衛(wèi)星遙感數(shù)據(jù)鹽度反演理論建立海表面鹽度反演模型,能夠大幅提高鹽度反演精度。
本文利用機(jī)器學(xué)習(xí)中的隨機(jī)森林算法,結(jié)合FY-4A衛(wèi)星遙感影像對(duì)江蘇及周邊省份沿海日間海霧進(jìn)行識(shí)別研究。相對(duì)于海霧反演的傳統(tǒng)經(jīng)驗(yàn)閾值算法,隨機(jī)森林算法能處理高維度的數(shù)據(jù)(即具有很多特征的數(shù)據(jù)),不用特征選擇,減少人為經(jīng)驗(yàn)的誤差,能更客觀地表現(xiàn)數(shù)據(jù)聯(lián)系和結(jié)果。該研究成果將為今后FY-4A 衛(wèi)星數(shù)據(jù)在海霧監(jiān)測(cè)業(yè)務(wù)中的應(yīng)用提供重要依據(jù)。
通過(guò)分析江蘇及周邊省份沿海城市發(fā)生大霧的預(yù)警信號(hào),選取日間江蘇及山東省沿海城市發(fā)生大霧天氣60 個(gè)個(gè)例(見(jiàn)表1),從中隨機(jī)選取20 個(gè)個(gè)例作為檢驗(yàn)識(shí)別模型的檢驗(yàn)個(gè)例集,剩下40個(gè)個(gè)例作為構(gòu)建隨機(jī)森林海霧識(shí)別模型的訓(xùn)練個(gè)例集。
表1 (續(xù))Tab.1 (Continued)
表1 江蘇省和山東省沿海城市60個(gè)大霧個(gè)例Tab.160 cases of dense fog in the coastal cities of Jiangsu and Shandong provinces
作為我國(guó)自主研發(fā)的第二代地球靜止氣象衛(wèi)星, FY-4A 是一種三軸穩(wěn)定地球靜止氣象衛(wèi)星。除了常規(guī)的成像探測(cè)設(shè)備外,還配備能夠大幅提升我國(guó)短臨天氣預(yù)報(bào)和應(yīng)對(duì)極端氣候變化等防災(zāi)減災(zāi)能力的設(shè)備——紅外高光譜垂直探測(cè)儀和閃電探測(cè)設(shè)備。FY-4A 多通道掃描成像輻射計(jì)(AGRI)具有6 個(gè)可見(jiàn)/近紅外波段、2 個(gè)中波紅外波段、2 個(gè)水汽波段和4 個(gè)長(zhǎng)紅外波段(見(jiàn)表2),這14個(gè)探測(cè)波段范圍為0.45~13.8 μm,并涉及(0—3)4個(gè)不同級(jí)別的衛(wèi)星產(chǎn)品。
表2 FY-4A 多通道掃描成像輻射計(jì)主要技術(shù)參數(shù)Tab.2 Main technical parameters of FY-4A multi-channel scanning imaging radiometer
為了獲得滿足沿海海霧識(shí)別所需的衛(wèi)星遙感影像,需要將AGRI的掃描成像數(shù)據(jù)經(jīng)過(guò)0級(jí)數(shù)據(jù)格式變換、定位和定標(biāo)等處理生成1 級(jí)高頻次中國(guó)區(qū)域產(chǎn)品數(shù)據(jù)。該產(chǎn)品數(shù)據(jù)包括14個(gè)波段信息,無(wú)全圓盤觀測(cè)時(shí)進(jìn)行5 min 中國(guó)區(qū)域觀測(cè),空間分辨率為4 km,符合沿海海霧動(dòng)態(tài)監(jiān)測(cè)時(shí)空分辨率要求。
本文使用4 km 分辨率中國(guó)區(qū)域產(chǎn)品數(shù)據(jù)和對(duì)地靜止軌道(GEostationary Orbit,GEO)定標(biāo)數(shù)據(jù),通過(guò)Python中H5py功能包進(jìn)行數(shù)據(jù)解析獲得14個(gè)波段數(shù)據(jù),結(jié)合GEO定標(biāo)文件和遙感圖像處理軟件對(duì)這些波段數(shù)據(jù)進(jìn)行幾何校正,然后利用自動(dòng)站時(shí)次和經(jīng)緯度信息獲取FY-4A 衛(wèi)星14 個(gè)通道影像上對(duì)應(yīng)的像素值,組成樣本點(diǎn)像素組。
本文使用江蘇省及山東省沿海及近海約40 個(gè)自動(dòng)氣象站觀測(cè)FY-4A 的1 級(jí)數(shù)據(jù)產(chǎn)品,空間分辨率為4 km,通過(guò)空間插值到站點(diǎn)。由于衛(wèi)星數(shù)據(jù)在無(wú)全圓盤觀測(cè)時(shí)的時(shí)間周期為5 min,而自動(dòng)站能見(jiàn)度觀測(cè)數(shù)據(jù)時(shí)間周期為5 min,這樣每個(gè)衛(wèi)星數(shù)據(jù)時(shí)間時(shí)次都能夠獲得自動(dòng)站能見(jiàn)度觀測(cè)數(shù)據(jù),因此本文獲取了全天165次中國(guó)區(qū)觀測(cè)衛(wèi)星像素。
氣象大數(shù)據(jù)云平臺(tái)簡(jiǎn)稱為“天擎”,作為國(guó)省共建的氣象部門核心的業(yè)務(wù)支撐系統(tǒng),該系統(tǒng)能夠提供實(shí)時(shí)及歷史各類氣象數(shù)據(jù)。本文通過(guò)“天擎”系統(tǒng)獲取所涉及的自動(dòng)站能見(jiàn)度數(shù)據(jù)。
本文通過(guò)分析海霧天氣過(guò)程個(gè)例發(fā)生海霧的大致區(qū)域及時(shí)間段,從“天擎”系統(tǒng)查詢大致區(qū)域及時(shí)間段內(nèi)所涉及自動(dòng)站能見(jiàn)度值首次小于1000 m的觀測(cè)時(shí)次。若查詢?cè)摃r(shí)次后連續(xù)2個(gè)時(shí)次(5 min/次)能見(jiàn)度值都小于1000 m,則確認(rèn)該時(shí)次為有效海霧出現(xiàn)時(shí)次;若后續(xù)連續(xù)2 個(gè)時(shí)次能見(jiàn)度值不都小于1000 m,則繼續(xù)查詢,直到查詢超過(guò)該個(gè)例大致時(shí)間段終止本次查詢。
當(dāng)確認(rèn)所涉及自動(dòng)站的有效海霧出現(xiàn)時(shí)次,通過(guò)“天擎”系統(tǒng)查詢有效海霧出現(xiàn)時(shí)次之后能見(jiàn)度值首次大于1000 m出現(xiàn)時(shí)次(5 min/次)。若該時(shí)次后續(xù)連續(xù)2個(gè)時(shí)次(5 min/次)能見(jiàn)度值都大于1000 m,則確認(rèn)該時(shí)次為有效海霧消散時(shí)次;若后續(xù)連續(xù)2個(gè)時(shí)次不都大于1000 m,則繼續(xù)查詢,直到查詢超過(guò)該個(gè)例大致時(shí)間段終止本次查詢。
獲取涉及自動(dòng)站有效海霧出現(xiàn)時(shí)次—有效海霧消散時(shí)次之間每個(gè)觀測(cè)時(shí)次,剔除能見(jiàn)度值大于1000 m 的觀測(cè)時(shí)次(5 min/次),同時(shí)剔除無(wú)法獲得中國(guó)區(qū)域產(chǎn)品數(shù)據(jù)的觀測(cè)時(shí)次(5 min/次),獲得涉及自動(dòng)站的有效海霧時(shí)次數(shù)據(jù)集,然后對(duì)應(yīng)有效海霧時(shí)次和經(jīng)緯度獲取FY-4A 衛(wèi)星14 個(gè)通道影像上對(duì)應(yīng)的像素值,形成樣本點(diǎn)像素組,然后由該個(gè)例所有涉及自動(dòng)站發(fā)生海霧的樣本點(diǎn)像素組組成有效海霧衛(wèi)星像素集。
獲取涉及自動(dòng)站有效海霧出現(xiàn)時(shí)次之前和有效海霧消散之后一段時(shí)間(不少于1 h)每個(gè)觀測(cè)時(shí)次,通過(guò)剔除能見(jiàn)度值小于1000 m 的觀測(cè)時(shí)次,同時(shí)剔除無(wú)法獲得中國(guó)區(qū)域產(chǎn)品數(shù)據(jù)的觀測(cè)時(shí)次(5 min/次),獲得涉及自動(dòng)站非海霧時(shí)次數(shù)據(jù)集,然后對(duì)應(yīng)涉及自動(dòng)站非海霧時(shí)次和經(jīng)緯度獲取FY-4A衛(wèi)星14個(gè)通道影像上相對(duì)應(yīng)的像素值,形成樣本點(diǎn)像素組,然后由該個(gè)例所有涉及自動(dòng)站未發(fā)生海霧的樣本點(diǎn)像素組組成非海霧衛(wèi)星像素集。
利用閾值法和隨機(jī)森林算法作為海霧識(shí)別方法,結(jié)合FY-4A 中AGRI的L1 級(jí)空間分辨率為4 km的數(shù)據(jù),利用14 個(gè)不同波段光譜值作為輸入要素,對(duì)江蘇及周邊省份沿海海霧天氣開展識(shí)別研究。
2.3.1 閾值法
首先,獲取可見(jiàn)光通道數(shù)據(jù)后剔除陸地,再利用可見(jiàn)光通道數(shù)據(jù)計(jì)算得到表觀反射率,基于此數(shù)據(jù)初步剔除海面;其次,由于霧頂溫度與云頂溫度存在差異,利用剔除陸地后的長(zhǎng)波紅外通道亮溫做初步判斷,進(jìn)而剔除中高云;最后,結(jié)合雙通道差值技術(shù)剔除低云進(jìn)而識(shí)別日間沿海海霧。具體識(shí)別流程見(jiàn)圖1。
圖1 基于閾值法日間海霧識(shí)別流程圖Fig.1 Flow chart of daytime sea fog recognition based on threshold method
(1)剔除海面:獲取可見(jiàn)光通道數(shù)據(jù)后,利用海陸掩膜文件把陸地去除(剔除陸地),再將可見(jiàn)光通道數(shù)據(jù)除以太陽(yáng)天頂角的余弦得到可見(jiàn)光通道的表觀反射率,其值大于0.2 為云或霧,初步剔除海面。
(2)剔除中高云:由于霧頂溫度與云頂溫度存在差異,利用剔除陸地后的長(zhǎng)波紅外通道(13 通道波長(zhǎng)12 μm)亮溫做初步判斷,即大于273 K 可剔除中高云。
(3)剔除低云:雙通道差值指剔除陸地后的紅外通道亮溫差(14通道—12通道)。當(dāng)太陽(yáng)天頂角≤10°或太陽(yáng)天頂角≥80°,-2 <雙通道差值≤3 時(shí),剔除低云;當(dāng)10°<太陽(yáng)天頂角<80°,3<雙通道差值≤20,剔除低云。
2.3.2 隨機(jī)森林海霧識(shí)別模型
隨機(jī)森林模型是通過(guò)隨機(jī)方式建立一個(gè)具有很多分類樹的森林,且每個(gè)分類樹之間沒(méi)有關(guān)聯(lián)。每當(dāng)有一個(gè)新的樣本輸入隨機(jī)森林模型中,每棵決策樹都需要進(jìn)行判斷,通過(guò)投標(biāo)票方式得出最終分類結(jié)果(見(jiàn)圖2)。
圖2 隨機(jī)森林模型結(jié)構(gòu)示意圖Fig.2 Schematic diagram of random forest structure
隨機(jī)森林模型構(gòu)造流程為:
(1)假設(shè)具有n個(gè)樣本,進(jìn)行有放回的隨機(jī)選擇n 個(gè)樣本(即每次隨機(jī)選擇一個(gè)樣本,然后放回繼續(xù)選擇),使用這n個(gè)樣本訓(xùn)練一個(gè)分類樹。
(2)當(dāng)每個(gè)樣本的屬性為M,在分類樹的每個(gè)節(jié)點(diǎn)需要分裂時(shí),隨機(jī)從M 個(gè)屬性中選取m 個(gè)屬性(m< (3)分類樹形成過(guò)程中每個(gè)節(jié)點(diǎn)都要按照步驟2 來(lái)分裂(如果下一次該節(jié)點(diǎn)選出來(lái)的那個(gè)屬性為剛剛父節(jié)點(diǎn)分裂時(shí)所用的屬性,則該節(jié)點(diǎn)已到葉子節(jié)點(diǎn),不用繼續(xù)分裂),這個(gè)過(guò)程到不能夠再分裂為止,整個(gè)分類樹形成過(guò)程中無(wú)需剪枝。 (4)按照步驟1—3 建立n 個(gè)分類樹,如此構(gòu)成1個(gè)隨機(jī)森林模型。 利用隨機(jī)森林算法確定最優(yōu)參數(shù)n_estimators和m。n_estimators 是指對(duì)原始數(shù)據(jù)集進(jìn)行有放回抽樣生成的子數(shù)據(jù)集個(gè)數(shù),即決策樹的個(gè)數(shù)。若n_estimators太小容易欠擬合,太大則不能顯著地提升模型,所以n_estimators 需要選擇適中數(shù)值,默認(rèn)值是100 個(gè)。研究中分別選取設(shè)置100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900 和2000,子特征數(shù)m選取從2 增大到9,通過(guò)超參數(shù)訓(xùn)練得到最優(yōu)參數(shù),即n_estimators=200,m=6,最優(yōu)參數(shù)評(píng)估均方根誤差(Root Mean Square Error,RMSE)誤差最小。 利用Sklearn框架對(duì)隨機(jī)森林算法進(jìn)行表達(dá),對(duì)于建模需要的圖像數(shù)據(jù)集,首先獲取為隨機(jī)森林海霧識(shí)別模型(簡(jiǎn)稱“隨機(jī)森林模型”)建模所用的訓(xùn)練個(gè)例集,通過(guò)計(jì)算獲得個(gè)例的有效海霧衛(wèi)星像素集和非海霧衛(wèi)星像素集,以此組成隨機(jī)森林模型建模所用的標(biāo)識(shí)后衛(wèi)星像素集,其中有效海霧衛(wèi)星像素集有8356 個(gè)樣本點(diǎn)像素組,非海霧衛(wèi)星像素集有52346 個(gè)樣本點(diǎn)像素組。將標(biāo)識(shí)后衛(wèi)星像素集按照8:2 隨機(jī)分為訓(xùn)練樣本點(diǎn)像素組集和測(cè)試樣本點(diǎn)像素組集,以隨機(jī)森林函數(shù)對(duì)所有訓(xùn)練樣本點(diǎn)像素組集進(jìn)行隨機(jī)森林分類訓(xùn)練,逐步建立隨機(jī)森林模型。 為了分析閾值法和隨機(jī)森林模型的效果,利用事先選取的20 個(gè)江蘇及山東沿海城市大霧發(fā)生個(gè)例的檢驗(yàn)個(gè)例集,在每個(gè)個(gè)例涉及自動(dòng)站觀測(cè)時(shí)次,分別從海霧發(fā)生前、發(fā)生中和消散后選取一定數(shù)量的衛(wèi)星遙感影像,組成該個(gè)例的檢驗(yàn)輸入樣本集,同時(shí)記錄對(duì)應(yīng)所涉及自動(dòng)站觀測(cè)時(shí)次,通過(guò)查詢”天擎”系統(tǒng)獲得該個(gè)例所涉及自動(dòng)站能見(jiàn)度實(shí)測(cè)值,組成該個(gè)例檢驗(yàn)樣本點(diǎn)集。 利用海霧識(shí)別模型逐一對(duì)個(gè)例的檢驗(yàn)輸入樣本集進(jìn)行海霧霧區(qū)識(shí)別,獲得海霧霧區(qū)信息,利用該時(shí)次樣本所涉及自動(dòng)站觀測(cè)時(shí)次和經(jīng)緯度信息獲取對(duì)應(yīng)位置的海霧信息(有或無(wú)),并獲得個(gè)例檢驗(yàn)樣本點(diǎn)集中該時(shí)次所涉及自動(dòng)站的實(shí)測(cè)值,如果實(shí)測(cè)能見(jiàn)度值小于1000 m,則為有海霧,如果大于等于1000 m,則為無(wú)海霧。統(tǒng)計(jì)該個(gè)例衛(wèi)星識(shí)別結(jié)果和自動(dòng)站實(shí)測(cè)結(jié)果都有海霧的樣本點(diǎn)個(gè)數(shù)、衛(wèi)星識(shí)別結(jié)果有海霧而自動(dòng)站實(shí)測(cè)結(jié)果沒(méi)有海霧的樣本點(diǎn)個(gè)數(shù)以及衛(wèi)星識(shí)別結(jié)果沒(méi)有海霧而自動(dòng)站結(jié)果有海霧的樣本點(diǎn)個(gè)數(shù)。 通過(guò)POD 檢驗(yàn)方法檢測(cè)不同海霧識(shí)別模型的準(zhǔn)確性,POD檢驗(yàn)公式如下: 式中,POD(Probability Of Detection)為命中率,F(xiàn)AR(False Alarm Rate)為誤報(bào)率,CSI(Critical Success Index)為臨界成功指數(shù);NH為衛(wèi)星識(shí)別結(jié)果和自動(dòng)站實(shí)測(cè)結(jié)果都有海霧的樣本點(diǎn)個(gè)數(shù);NM為衛(wèi)星識(shí)別結(jié)果有海霧而自動(dòng)站實(shí)測(cè)結(jié)果沒(méi)有海霧的樣本點(diǎn)個(gè)數(shù);NF為衛(wèi)星識(shí)別結(jié)果沒(méi)有海霧而自動(dòng)站結(jié)果有海霧的樣本點(diǎn)個(gè)數(shù)。 利用閾值法識(shí)別模型對(duì)每個(gè)個(gè)例的檢驗(yàn)輸入樣本集進(jìn)行海霧霧區(qū)識(shí)別,統(tǒng)計(jì)結(jié)果見(jiàn)圖3。20 個(gè)檢驗(yàn)個(gè)例中,POD 最大值為0.9531,CSI 最大值為0.7940,F(xiàn)AR最大值為0.3903;平均POD為0.6984,平均CSI為0.5890,平均FAR為0.2121。綜上說(shuō)明,基于閾值法FY-4A 衛(wèi)星沿海海霧識(shí)別模型能夠有效地反映實(shí)況海霧的分布情況。 圖3 基于閾值法FY-4A衛(wèi)星沿海海霧識(shí)別模型檢驗(yàn)結(jié)果圖Fig.3 Test results of FY-4A satellite coastal sea fog recognition model based on threshold method 利用隨機(jī)森林識(shí)別模型對(duì)每個(gè)個(gè)例的檢驗(yàn)輸入樣本集進(jìn)行海霧霧區(qū)識(shí)別,統(tǒng)計(jì)結(jié)果見(jiàn)圖4。20個(gè)檢驗(yàn)個(gè)例中,POD最大值為0.9327,CSI最大值為0.8719,F(xiàn)AR最大值為0.1433;平均POD為0.8346,平均CSI 為0.7946,平均FAR 為0.0570。綜上說(shuō)明,基于隨機(jī)森林FY-4A 衛(wèi)星沿海海霧識(shí)別模型能夠更精確地反映實(shí)況海霧的分布情況。 圖4 基于隨機(jī)森林FY-4A衛(wèi)星沿海海霧識(shí)別模型檢驗(yàn)結(jié)果圖Fig.4 Test results of FY-4A satellite coastal sea fog recognition model based on random forest 通過(guò)對(duì)兩種海霧識(shí)別模型的對(duì)比分析,我們可以看出,相比閾值法,隨機(jī)森林模型在平均POD 和平均CSI具有較大的提升,同時(shí)平均FAR大幅降低,這說(shuō)明隨機(jī)森林模型具有更高的精準(zhǔn)性。另外,與閾值法中海霧識(shí)別效果忽高忽低相比,隨機(jī)森林模型具有更好的穩(wěn)定性,對(duì)于識(shí)別難度較大的海霧,隨機(jī)森林模型也能夠有較好的效果。 為了更好地揭示隨機(jī)森林模型的性能,本文選取2021 年4 月12 日黃渤海區(qū)域發(fā)生的海霧天氣過(guò)程進(jìn)行分析。我們分別利用這兩種海霧識(shí)別模型對(duì)10:30(北京時(shí),下同)時(shí)刻衛(wèi)星遙感影像進(jìn)行海霧霧區(qū)識(shí)別。 圖5 分別為FY-4A 衛(wèi)星華東區(qū)域3 個(gè)紅外通道亮度溫度圖以及經(jīng)過(guò)隨機(jī)森林模型和閾值法識(shí)別后的海霧霧區(qū)圖。紅外通道3.75 μm、7.33 μm 和10.8 μm亮度溫度對(duì)霧的識(shí)別具有重要作用,確實(shí)能夠從圖5a—c 的亮溫顏色看到與識(shí)別海霧霧區(qū)具有很大重疊,同時(shí)可以發(fā)現(xiàn)隨機(jī)森林算法識(shí)別霧區(qū)更貼合(綠色為識(shí)別出的海霧霧區(qū))。為了檢驗(yàn)本次海霧霧區(qū)識(shí)別的實(shí)際效果,選取了所涉區(qū)域6 個(gè)自動(dòng)站作為檢驗(yàn)樣本點(diǎn),通過(guò)查詢“天擎”系統(tǒng)獲得的該時(shí)次6 個(gè)自動(dòng)站能見(jiàn)度值都小于1000 m,應(yīng)該判定為有海霧發(fā)生。通過(guò)對(duì)比圖5d和5e發(fā)現(xiàn),閾值法未識(shí)別到1 個(gè)自動(dòng)站海霧發(fā)生點(diǎn),通過(guò)分析本次海霧發(fā)生過(guò)程,可知2021年4月12日上午該區(qū)域海霧正在逐步生成,該時(shí)次海霧霧區(qū)正在逐步變大,對(duì)那些剛剛達(dá)標(biāo)生成海霧霧區(qū)的識(shí)別難度大幅度增加,這可能是造成閾值法未識(shí)別到的原因,而隨機(jī)森林模型因訓(xùn)練樣本點(diǎn)較充分,能夠準(zhǔn)確識(shí)別到這個(gè)海霧霧區(qū),因此說(shuō)明隨機(jī)森林模型具有更精準(zhǔn)的識(shí)別效果。 圖5 2021年4月12日10:30時(shí)刻海霧識(shí)別圖Fig.5 Sea fog identification map at 10:30(UTC+8)on April 12,2021 圖5 (續(xù))Fig.5 (Continued) 本文選取2019年8月—2021年7月江蘇省及周邊省份60個(gè)大霧天氣個(gè)例,分別用閾值法和隨機(jī)森林算法結(jié)合FY-4A 衛(wèi)星AGRI 中4 km 分辨率的14個(gè)波段數(shù)據(jù)對(duì)研究區(qū)域的沿海海霧霧區(qū)進(jìn)行識(shí)別。結(jié)論如下: (1)閾值法海霧識(shí)別模型對(duì)海霧具有一定的識(shí)別能力,但對(duì)不同時(shí)期和不同階段的海霧天氣衛(wèi)星遙感影像,需要取不同閾值范圍,才能更好地識(shí)別出海霧區(qū)域。 (2)通過(guò)40個(gè)個(gè)例的訓(xùn)練個(gè)例集建立的隨機(jī)森林海霧識(shí)別模型,具有較高的精準(zhǔn)性,該模型的參數(shù)配置合理。 (3)分別用閾值法和隨機(jī)森林模型對(duì)檢驗(yàn)個(gè)例集的20 個(gè)個(gè)例進(jìn)行海霧霧區(qū)識(shí)別,對(duì)比閾值法,隨機(jī)森林模型具有更精準(zhǔn)的識(shí)別能力和更穩(wěn)定的識(shí)別性能,對(duì)于識(shí)別難度較大的海霧,隨機(jī)森林模型表現(xiàn)更加優(yōu)異。 本文嘗試?yán)瞄撝捣ê碗S機(jī)森林兩種算法來(lái)實(shí)現(xiàn)海霧識(shí)別,隨機(jī)森林算法在海霧識(shí)別方面具有較大的應(yīng)用潛力,相比傳統(tǒng)的閾值法,效果提高顯著。雖然隨機(jī)森林模型在訓(xùn)練時(shí)取得較高的精度,但是在實(shí)際識(shí)別中,當(dāng)外在條件復(fù)雜或者遇到異物同波譜時(shí),會(huì)出現(xiàn)錯(cuò)誤識(shí)別。今后如果要將海霧識(shí)別結(jié)果投入到業(yè)務(wù)應(yīng)用中,在訓(xùn)練建模時(shí),必須提供更加多樣的海霧天氣個(gè)例,增加模型的容錯(cuò)性,其次,必須將隨機(jī)森林算法與其他算法相結(jié)合,建立更加健壯的模型,提高模型的性能,在不同復(fù)雜條件下對(duì)海霧精準(zhǔn)識(shí)別,從而實(shí)現(xiàn)FY-4A 氣象衛(wèi)星海霧識(shí)別的業(yè)務(wù)化。3 結(jié)果與分析
3.1 閾值法對(duì)海霧識(shí)別有效性
3.2 隨機(jī)森林模型對(duì)海霧識(shí)別有效性
3.3 不同海霧識(shí)別模型對(duì)比分析
4 結(jié)論與討論