杜凱, 馬 毅, 姜宗辰, 楊俊芳
海面太陽(yáng)耀斑區(qū)的溢油光學(xué)遙感CNN檢測(cè)方法研究
杜凱1, 2, 馬 毅2, 3, 4, 姜宗辰1, 2, 楊俊芳5
(1. 山東科技大學(xué), 山東 青島 266590; 2. 自然資源部第一海洋研究所, 山東 青島 266061; 3. 自然資源部海洋遙測(cè)技術(shù)創(chuàng)新中心,山東 青島 266061; 4. 空天地海一體化大數(shù)據(jù)應(yīng)用技術(shù)國(guó)家工程實(shí)驗(yàn)室, 陜西 西安 710072; 5. 中國(guó)石油大學(xué)(華東), 山東 青島 266580)
海面發(fā)生大面積溢油事故時(shí), 由于太陽(yáng)耀斑區(qū)的存在, 海面的油膜在遙感影像上會(huì)發(fā)生明暗的變化。這對(duì)溢油的檢測(cè)會(huì)產(chǎn)生嚴(yán)重的干擾。如何在海面太陽(yáng)耀斑區(qū)準(zhǔn)確地檢測(cè)出溢油是目前溢油檢測(cè)的難題。針對(duì)這一問(wèn)題, 本文利用Landsat7 ETM+多光譜影像數(shù)據(jù), 開(kāi)展了基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的海面太陽(yáng)耀斑區(qū)溢油檢測(cè)方法研究。通過(guò)設(shè)置對(duì)照實(shí)驗(yàn), 對(duì)比支持向量機(jī)、最大似然、隨機(jī)森林等分類(lèi)方法, 我們發(fā)現(xiàn)在相同實(shí)驗(yàn)條件下CNN模型的分類(lèi)精度為95%~99%, Kappa系數(shù)為0.92~1, 均高于其他三種分類(lèi)方法, 表明了CNN模型在海面太陽(yáng)耀斑區(qū)溢油的檢測(cè)具有更高的精度與一致性。
遙感; 海面溢油; 太陽(yáng)耀斑區(qū); 卷積神經(jīng)網(wǎng)絡(luò)(CNN); 分類(lèi)
根據(jù)國(guó)際油船所有者污染聯(lián)盟(ITOPF)的數(shù)據(jù)統(tǒng)計(jì), 在20世紀(jì)90年代, 共有358次大、中型溢油事故, 造成約113萬(wàn)噸石油泄漏。在20世紀(jì)初, 有181次大、中型溢油事故, 造成19.6萬(wàn)噸石油泄漏。2010年至2018年, 發(fā)生了59起大、中型的溢油事故, 造成了16.3萬(wàn)噸石油泄漏。海面溢油會(huì)污染海洋, 嚴(yán)重破壞海洋生態(tài)。2010年4月, 墨西哥灣深水地平線(xiàn)石油平臺(tái)發(fā)生泄漏, 污染了路易斯安那州160多千米的海岸線(xiàn), 破壞了海灘, 殺死了大量的魚(yú)類(lèi), 破壞了整個(gè)墨西哥灣生態(tài)系統(tǒng)[1]。2011年6月, 山東省蓬萊19-3油田漏油事件, 污染了油田周?chē)捌湮鞅辈亢S騕2]。
海上溢油檢測(cè)主要以衛(wèi)星遙感為主, 主要包括微波遙感和多光譜遙感兩種手段。在發(fā)生海面大面積溢油事故時(shí), 由于太陽(yáng)耀斑區(qū)的存在, 溢油在海面的油膜會(huì)在遙感影像上發(fā)生明暗的變化, 對(duì)遙感影像的分類(lèi)產(chǎn)生嚴(yán)重的干擾, 如何在海面太陽(yáng)耀斑區(qū)準(zhǔn)確地檢測(cè)出溢油是目前海面溢油檢測(cè)面臨的難題。
為了解決噪聲影響溢油遙感檢測(cè)問(wèn)題, 一些研究首先進(jìn)行圖像濾波, 進(jìn)而特征提取, 然后利用該特征對(duì)溢油進(jìn)行分類(lèi)[3]。許多研究人員采用傳統(tǒng)的模式識(shí)別方法, 如支持向量機(jī)、光譜角度匹配法、人工神經(jīng)網(wǎng)絡(luò)算法等。如孫元芳等[4]輔加紋理特征量的光譜角度匹配法進(jìn)行油膜提取, 精度高達(dá)90%以上。陳韓等[5]利用支持向量機(jī)分類(lèi)法在TM遙感影像溢油識(shí)別上的總體精度可達(dá)99.96%。Del Frate等[6]提出了一種用于ERS-SAR圖像中溢油半自動(dòng)檢測(cè)的神經(jīng)網(wǎng)絡(luò)方法。
2006年, Hinton等[7]提出了一種基于人腦學(xué)習(xí)思想的深層神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)方法, 但受制于當(dāng)時(shí)計(jì)算機(jī)較為落后的計(jì)算能力, 深層神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)方法沒(méi)有體現(xiàn)太大的優(yōu)勢(shì)。近幾年來(lái), 隨著數(shù)據(jù)量的指數(shù)式增長(zhǎng), 人類(lèi)進(jìn)入“大數(shù)據(jù)時(shí)代”, 計(jì)算能力也突飛猛進(jìn)地發(fā)展, 這種基于人腦學(xué)習(xí)思想的深層神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)方法開(kāi)始在各個(gè)領(lǐng)域廣泛應(yīng)用。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN), 已經(jīng)成為直接從海量圖像數(shù)據(jù)中學(xué)習(xí)圖像特征表達(dá)的強(qiáng)大框架[8-12], 已成為遙感圖像分類(lèi)研究的熱門(mén)。將卷積神經(jīng)網(wǎng)絡(luò)(CNN)應(yīng)用于太陽(yáng)耀斑區(qū)溢油影像分類(lèi)研究中, 有望提高其分類(lèi)精度。
本文研究區(qū)是位于北美洲大陸東南沿海水域連接著大西洋和佛羅里達(dá)海峽的美國(guó)墨西哥灣, 開(kāi)采石油的海上石油鉆井平臺(tái)位于坎佩切灣和海灣西部地區(qū), 墨西哥灣是美國(guó)重要的石油和天然氣的供應(yīng)地[12]。
英國(guó)BP公司的墨西哥灣石油平臺(tái)于2010年4月22日發(fā)生大規(guī)模漏油事件, 當(dāng)時(shí)一個(gè)石油鉆探平臺(tái)遭遇爆炸并從距離路易斯安那州約80 km的海灣沉沒(méi)。溢油清理和罰款耗資650億美元[13]。
1.2.1 遙感數(shù)據(jù)與處理
本次實(shí)驗(yàn)使用的數(shù)據(jù)是2010年5月1日的Lansat7 ETM+遙感影像數(shù)據(jù)。本次實(shí)驗(yàn)選取了3個(gè)實(shí)驗(yàn)區(qū), 影像實(shí)驗(yàn)區(qū)域大小分別為200×302、200×300和200×300,共8個(gè)波段。圖1為研究區(qū)多光譜影像的真彩色合成圖, 紅、綠、藍(lán)3個(gè)通道分別對(duì)應(yīng)662.0 nm, 560.0 nm和483.0 nm。
圖1 實(shí)驗(yàn)區(qū)真彩色影像
Landsat7衛(wèi)星按近極點(diǎn)太陽(yáng)同步軌道繞地球飛行, 軌道高度705.3 km, 軌道傾角98.2°, 每98.9 min繞地球一周, 16 d覆蓋地球一次, 降交點(diǎn)時(shí)間為當(dāng)?shù)貢r(shí)間上午10時(shí)。Landsat7搭載ETM+傳感器, 提供四種模式的地面測(cè)量: 可見(jiàn)光和近紅外(VNIR), 短波紅外(SWIR), 全色(PAN)和熱紅外(TIR)。2003年5月31日, 補(bǔ)償衛(wèi)星前向運(yùn)動(dòng)的掃描校正器發(fā)生故障, 導(dǎo)致了大約四分之一的數(shù)據(jù)丟失, 產(chǎn)生條帶空白。本文使用插件對(duì)條帶空白進(jìn)行了修復(fù)。
Landsat7 ETM+傳感器的主要參數(shù)見(jiàn)表1。
由于研究區(qū)影像的存在噪聲會(huì)影響分類(lèi)精度, 故本文選用模板大小為3×3的中值濾波器對(duì)整幅多光譜影像進(jìn)行濾波處理, 抑制噪聲對(duì)實(shí)驗(yàn)結(jié)果的影響。本文在實(shí)驗(yàn)前將三維的多光譜實(shí)驗(yàn)數(shù)據(jù)進(jìn)行降維處理, 轉(zhuǎn)化成CNN模型可以識(shí)別并讀取的二維光譜矩陣。
表1 ETM+各通道主要參數(shù)
本文在存在太陽(yáng)耀斑的區(qū)域選取了大小分別為200×302和200×300的實(shí)驗(yàn)區(qū)1和實(shí)驗(yàn)區(qū)2共兩個(gè)實(shí)驗(yàn)區(qū)域, 在非太陽(yáng)耀斑區(qū)域選取了大小為200×300的實(shí)驗(yàn)區(qū)3。Landsat7影像共有八個(gè)波段, 本文實(shí)驗(yàn)在對(duì)影像進(jìn)行輻射定標(biāo)和大氣校正時(shí), 為了保證各波段的空間分辨率相同舍棄了B6和B8波段, 故三個(gè)實(shí)驗(yàn)區(qū)的數(shù)據(jù)分別為200×302×6、200×300×6和200×300×6的多光譜遙感影像, 通過(guò)矩陣重塑及降維操作, 將影像中每一個(gè)像素的光譜信息轉(zhuǎn)化為1×6維的光譜向量, 原始數(shù)據(jù)即轉(zhuǎn)變?yōu)榱?0 400×6、60 000×6和60 000×6的光譜向量。為了適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的輸入, 對(duì)其進(jìn)行了復(fù)制擴(kuò)展運(yùn)算, 擴(kuò)展為60 400×144、60 000×144和60 000×144的光譜向量, 然后運(yùn)用升維操作將原來(lái)的二維數(shù)據(jù)轉(zhuǎn)化為三維數(shù)據(jù), 即將光譜向量轉(zhuǎn)化為60 400×12×12、60 000×12× 12和60 000×12×12的光譜矩陣, 作為CNN模型輸入層神經(jīng)元的輸入數(shù)據(jù)。
1.2.2 樣本數(shù)據(jù)
在實(shí)驗(yàn)區(qū)1中選取制作了700個(gè)樣本點(diǎn)的訓(xùn)練數(shù)據(jù)和3 142個(gè)樣本點(diǎn)的測(cè)試數(shù)據(jù), 在實(shí)驗(yàn)區(qū)2中選取制作了700個(gè)樣本點(diǎn)的訓(xùn)練數(shù)據(jù)和1 510個(gè)樣本點(diǎn)的測(cè)試數(shù)據(jù), 包括海水、暗油膜、亮油膜3個(gè)類(lèi)別, 在非太陽(yáng)耀斑區(qū)域?qū)嶒?yàn)區(qū)3中選取制作了420個(gè)樣本點(diǎn)的訓(xùn)練數(shù)據(jù)和390個(gè)樣本點(diǎn)的測(cè)試數(shù)據(jù), 包括海水和暗油膜兩個(gè)類(lèi)別。訓(xùn)練樣本與測(cè)試樣本空間分布分別如圖2、圖3和圖4所示。
圖 2 實(shí)驗(yàn)區(qū)1訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)
圖3 實(shí)驗(yàn)區(qū)2訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)是一種深度學(xué)習(xí)方法, 適合于圖像的特征提取, 可提高圖像分類(lèi)的精度, 已廣泛應(yīng)用于圖像處理中。本文綜合考慮海面太陽(yáng)耀斑區(qū)溢油檢測(cè)模型的分類(lèi)效果與訓(xùn)練效率, 通過(guò)設(shè)置對(duì)照實(shí)驗(yàn), 比對(duì)模型的分類(lèi)效率, 設(shè)計(jì)了卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu), 如圖5所示。
圖4 實(shí)驗(yàn)區(qū)3訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)
圖5 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
網(wǎng)絡(luò)輸入層用于接收輸入數(shù)據(jù), 由于輸入數(shù)據(jù)為12×12×60 400的光譜矩陣, 因而將卷積神經(jīng)網(wǎng)網(wǎng)絡(luò)的輸入層的大小為12×12。
卷積層用于提取輸入的不同特征, 卷積是一種有效的圖像特征提取方法[14]。一般情況下, 使用平方卷積核遍歷圖像中的每個(gè)像素。將卷積核中對(duì)應(yīng)點(diǎn)的權(quán)值乘以圖像與卷積核重疊區(qū)域中每個(gè)像素的值求和, 再加上偏移量, 得到輸出圖像中的像素值, 公式為:
其中, Z表示卷積后的結(jié)果, p、q分別表示卷積核的行數(shù)和列數(shù), wi、vi表示卷積核和輸入矩陣中i點(diǎn)的權(quán)值和像素值, b表示偏置值。
卷積后引入非線(xiàn)性激活函數(shù)進(jìn)行激活, 主流的非線(xiàn)性激活函數(shù)有Relu、Sigmoid等[15]。本文實(shí)驗(yàn)采用的是Sigmoid, 公式為:
其中, Sigmoid()表示表示激活后的值,表示激活前的值。
在本文中通過(guò)設(shè)置對(duì)照實(shí)驗(yàn), 考慮到海面太陽(yáng)耀斑區(qū)溢油的空間尺度, 對(duì)比不同結(jié)構(gòu)模型的分類(lèi)精度, 確定了卷積層1和卷積層2的卷積核的大小均為3×3, 卷積層1輸出的特征圖個(gè)數(shù)為5, 卷積層2輸出的特征圖個(gè)數(shù)為7。
關(guān)于全連接層, 首先將卷積層2中輸出的特征圖連接成為一個(gè)(8×8)×7=448的向量, 作為單層感知機(jī)的輸入。根據(jù)海面太陽(yáng)耀斑區(qū)溢油檢測(cè)的場(chǎng)景, 設(shè)置最后的輸出類(lèi)別數(shù)為3, 即海水、暗油膜、亮油膜。
全連接層中的每個(gè)神經(jīng)元與其前一層的所有神經(jīng)元進(jìn)行完全連接, 它可以整合卷積層或者池化層中提取到的區(qū)分性信息從而進(jìn)行用于最后的分類(lèi)工作[16]。全連接層中每個(gè)神經(jīng)元均經(jīng)過(guò)Sigmoid函數(shù)進(jìn)行激活。
本文實(shí)驗(yàn)中采用Softmax函數(shù)進(jìn)行分類(lèi), 公式如下:
其中, Softmax(y)表示第個(gè)像素是各個(gè)類(lèi)別的概率,y表示第個(gè)像素的值。
為了驗(yàn)證本文方法的有效性, 實(shí)驗(yàn)將其與近幾年文獻(xiàn)中用于溢油分類(lèi)的支持向量機(jī)(support vector machine, SVM), 最大似然(maximum likelihood, ML)和隨機(jī)森林(random forests, RF)三種方法進(jìn)行對(duì)比。在相同實(shí)驗(yàn)條件下對(duì)處于太陽(yáng)耀斑區(qū)的研究區(qū)亮油膜、暗油膜與海水進(jìn)行分類(lèi)實(shí)驗(yàn), 表2和表3展示了CNN模型分類(lèi)結(jié)果的混淆矩陣。
表2 實(shí)驗(yàn)區(qū)1CNN混淆矩陣
表3 實(shí)驗(yàn)區(qū)2CNN混淆矩陣
通過(guò)計(jì)算得到相應(yīng)分類(lèi)方法的分類(lèi)精度、品質(zhì)因數(shù)、Kappa系數(shù), 如表4和表5所示。
表4 實(shí)驗(yàn)區(qū)域1不同分類(lèi)方法結(jié)果對(duì)比
表5 實(shí)驗(yàn)區(qū)域2不同分類(lèi)方法結(jié)果對(duì)比
由表5、表6數(shù)據(jù)可以看出, 在兩個(gè)實(shí)驗(yàn)區(qū)中CNN模型的分類(lèi)精度分別為99.97%, 95.89%, Kappa系數(shù)分別為1, 0.92, 品質(zhì)因數(shù)分別為1, 0.98, 均高于其他三種分類(lèi)方法, 表明了本文所構(gòu)建的CNN模型對(duì)于海面太陽(yáng)耀斑區(qū)溢油的分類(lèi)具有更高的精度與一致性, 而其他三種方法中, 隨機(jī)森林和最大似然的分類(lèi)精度較高, 而支持向量機(jī)的分類(lèi)精度最低。
表6 實(shí)驗(yàn)區(qū)域3不同分類(lèi)方法結(jié)果對(duì)比
由圖6、圖7中可以看出, 本文模型對(duì)太陽(yáng)耀斑區(qū)下油膜分類(lèi)效果很好, 精度可達(dá)95%~100%, 可以有效避免太陽(yáng)耀斑對(duì)油膜分類(lèi)的影響。本文模型對(duì)油膜邊緣的檢測(cè)精度高, 在一定程度上避免了油膜與海水的錯(cuò)分, 而其他三種分類(lèi)方法表現(xiàn)則相對(duì)粗糙, 產(chǎn)生了部分海水與油膜的錯(cuò)分。這表明CNN的局部連接、權(quán)值共享等特點(diǎn)使得它能夠自動(dòng)挖掘溢油的深層信息, 學(xué)習(xí)到更多更本質(zhì)的特征, 從而獲得更好的分類(lèi)準(zhǔn)確率。
圖6 實(shí)驗(yàn)區(qū)1分類(lèi)成果圖
在非太陽(yáng)耀斑區(qū), 本文提出的卷積神經(jīng)網(wǎng)絡(luò)模型與近幾年文獻(xiàn)中用于溢油分類(lèi)的支持向量機(jī)分類(lèi), 最大似然分類(lèi)和隨機(jī)森林分類(lèi)三種方法進(jìn)行油膜與海水的分類(lèi)實(shí)驗(yàn)對(duì)比, 分類(lèi)結(jié)果如圖8所示, 通過(guò)計(jì)算得到相應(yīng)分類(lèi)方法的分類(lèi)精度、品質(zhì)因數(shù)、Kappa系數(shù), 如表6所示。
圖7 實(shí)驗(yàn)區(qū)2分類(lèi)成果圖
圖8 實(shí)驗(yàn)區(qū)3分類(lèi)成果圖
由圖8分類(lèi)結(jié)果圖和表6數(shù)據(jù)可以看出, 在非太陽(yáng)耀斑區(qū)域中, 隨機(jī)森林分類(lèi)方法精度最高, 分類(lèi)精度為97.72%, Kappa系數(shù)為0.97, 品質(zhì)因數(shù)為1。本文的CNN模型分類(lèi)精度次之, 與支持向量機(jī)分類(lèi)精度相同, 分類(lèi)精度、Kappa系數(shù)、品質(zhì)因數(shù)分別為96.95%, 0.96, 1。而最大似然分類(lèi)方法的精度最差, 分類(lèi)精度僅為91.12%, Kappa系數(shù)為0.89。
表7、表8展示了CNN模型分類(lèi)結(jié)果的混淆矩陣。借助混淆矩陣可以獲得各類(lèi)方法對(duì)于亮油膜、暗油膜以及海水的分類(lèi)精度, 如表9、表10所示。
表7 實(shí)驗(yàn)區(qū)1CNN混淆矩陣
表8 實(shí)驗(yàn)區(qū)2CNN混淆矩陣
表9 實(shí)驗(yàn)區(qū)1不同類(lèi)別分類(lèi)結(jié)果對(duì)比
表10 實(shí)驗(yàn)區(qū)2不同類(lèi)別分類(lèi)結(jié)果對(duì)比
由表7、表9數(shù)據(jù)可以發(fā)現(xiàn), 在實(shí)驗(yàn)區(qū)1中亮油膜、暗油膜與海水三者相互間的光譜差異較大, 卷積神經(jīng)網(wǎng)絡(luò)模型能有效地識(shí)別出三者之間的光譜差異, 進(jìn)行準(zhǔn)確分類(lèi)。而表8、表10中的數(shù)據(jù)顯示, 實(shí)驗(yàn)區(qū)2中亮油膜與海水間的光譜有差異, 而暗油膜與海水則存在一定的異物同譜現(xiàn)象, 有少量的暗油膜樣本被錯(cuò)誤地分類(lèi)到了海水和暗油膜類(lèi)別當(dāng)中, 導(dǎo)致其分類(lèi)精度相對(duì)亮油膜較低。
通過(guò)調(diào)整CNN模型的各項(xiàng)參數(shù), 包括卷積核大小、特征圖個(gè)數(shù)、學(xué)習(xí)率等, 分析各項(xiàng)參數(shù)對(duì)于CNN模型分類(lèi)結(jié)果的影響。
2.4.1 卷積層
在實(shí)驗(yàn)條件一致的基礎(chǔ)上, 對(duì)比卷積層1、卷積層2的卷積核大小為3×3, 5×5, 7×7時(shí), 輸出特征圖個(gè)數(shù)為1, 2, 3, 4, 5, 6, 7, 8, 9, 10的分類(lèi)精度。實(shí)驗(yàn)結(jié)果如圖9、圖10所示。
圖9 卷積層1卷積核大小及輸出特征圖個(gè)數(shù)調(diào)整實(shí)驗(yàn)
圖10 卷積層2的卷積核大小及輸出特征圖個(gè)數(shù)調(diào)整實(shí)驗(yàn)
由結(jié)果圖9中可以發(fā)現(xiàn), CNN模型對(duì)太陽(yáng)耀斑區(qū)油膜的分類(lèi)精度隨卷積層1的卷積核輸出特征圖的個(gè)數(shù)的增多而提高。當(dāng)卷積層1的卷積核大小為3×3, 輸出特征圖個(gè)數(shù)為5時(shí), 分類(lèi)效果達(dá)到最佳。
在此基礎(chǔ)上對(duì)卷積層2的卷積核大小及輸出特征圖個(gè)數(shù)進(jìn)行實(shí)驗(yàn), 結(jié)果如圖10所示。
從結(jié)果圖10中可以看出, 當(dāng)卷積層2的卷積核大小為3×3, 輸出特征圖個(gè)數(shù)為7時(shí), 分類(lèi)效果達(dá)到最佳。
在本實(shí)驗(yàn)中特征圖增多可以使得提取的特征更加多樣, 從而增強(qiáng)網(wǎng)絡(luò)的性能, 選用最小的3×3卷積核則是由于在本實(shí)驗(yàn)中所用到的有效波段較少, 更小的卷積核可以提高效率, 減少性能浪費(fèi), 使得特征提取在空間上的視野更為寬廣。
2.4.2 學(xué)習(xí)率
卷積神經(jīng)網(wǎng)絡(luò)模型是按照隨機(jī)梯度下降算法進(jìn)行訓(xùn)練, 需要引入學(xué)習(xí)率來(lái)調(diào)整訓(xùn)練過(guò)程的節(jié)奏[17]。學(xué)習(xí)率表示了每次參數(shù)更新的幅度大小。學(xué)習(xí)率過(guò)大, 會(huì)導(dǎo)致待優(yōu)化的參數(shù)不收斂; 學(xué)習(xí)率過(guò)小, 會(huì)導(dǎo)致待優(yōu)化的參數(shù)收斂過(guò)慢。
本文通過(guò)調(diào)整學(xué)習(xí)率大小, 在其他實(shí)驗(yàn)條件一致的基礎(chǔ)上, 對(duì)比學(xué)習(xí)率分別為0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65和0.7時(shí)的分類(lèi)精度。實(shí)驗(yàn)結(jié)果如圖11所示。
圖11 學(xué)習(xí)率調(diào)整實(shí)驗(yàn)
結(jié)果表明卷積神經(jīng)模型的分類(lèi)精度隨學(xué)習(xí)率的變化而變化。學(xué)習(xí)率小于0.35時(shí), CNN模型的分類(lèi)精度隨學(xué)習(xí)率的提高而增加, 當(dāng)學(xué)習(xí)率為0.35時(shí), 卷積神經(jīng)模型的分類(lèi)精度達(dá)到最佳, 當(dāng)學(xué)習(xí)率大于0.35時(shí), CNN模型出現(xiàn)了過(guò)擬合的現(xiàn)象, 分類(lèi)精度呈下降趨勢(shì)。
2.4.3 批訓(xùn)練次數(shù)
在CNN模型的各項(xiàng)超參數(shù)都確定以后進(jìn)行批訓(xùn)練次數(shù)的調(diào)整實(shí)驗(yàn), 在其他實(shí)驗(yàn)條件一致的基礎(chǔ)上, 對(duì)比訓(xùn)練次數(shù)為30, 40, 50, 60, 70, 80, 90, 100時(shí), CNN模型的分類(lèi)精度。實(shí)驗(yàn)結(jié)果如圖12所示。
圖12 訓(xùn)練次數(shù)調(diào)整實(shí)驗(yàn)
結(jié)果表明卷積神經(jīng)模型的分類(lèi)精度隨訓(xùn)練次數(shù)的變化而變化。當(dāng)訓(xùn)練次數(shù)過(guò)低時(shí), CNN模型的分類(lèi)精度隨訓(xùn)練次數(shù)的增加而提高, 迭代次數(shù)為50時(shí), 模型分類(lèi)精度達(dá)到最佳, 之后隨著訓(xùn)練次數(shù)的增加, 模型出現(xiàn)了過(guò)擬合導(dǎo)致精度下降。
CNN的訓(xùn)練過(guò)程分為兩個(gè)階段。第一個(gè)階段是數(shù)據(jù)由低層次向高層次傳播的階段, 即前向傳播階段, 其主要作用是網(wǎng)絡(luò)進(jìn)行權(quán)值的初始化以及輸入數(shù)據(jù)經(jīng)過(guò)卷積層、池化層、全連接層的向前傳播得到輸出值; 另外一個(gè)階段是反向傳播階段, 主要作用是求出網(wǎng)絡(luò)的輸出值與目標(biāo)值之間的誤差, 根據(jù)求得誤差進(jìn)行權(quán)值更新。CNN的多次訓(xùn)練對(duì)于提高其分類(lèi)精度十分重要, 但過(guò)多的訓(xùn)練也可能會(huì)使卷積神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練數(shù)據(jù)產(chǎn)生過(guò)擬合, 從而導(dǎo)致其在測(cè)試數(shù)據(jù)集上的分類(lèi)精度降低。
在上節(jié)實(shí)驗(yàn)的基礎(chǔ)上通過(guò)調(diào)整訓(xùn)練樣本的數(shù)量, 對(duì)比訓(xùn)練樣本數(shù)量分別為目前的訓(xùn)練樣本數(shù)量, 1/2, 1/3, 1/4和1/5時(shí)的分類(lèi)精度。
實(shí)驗(yàn)結(jié)果如圖13所示, 從結(jié)果圖中可以看出, 當(dāng)訓(xùn)練樣本數(shù)量減半時(shí), CNN模型對(duì)太陽(yáng)耀斑去油膜的分類(lèi)精度保持不變。當(dāng)訓(xùn)練樣本數(shù)量為原來(lái)樣本數(shù)量的1/3時(shí), 分類(lèi)效果下降到了95.21%, 隨后隨著訓(xùn)練樣本數(shù)量的減少分類(lèi)精度迅速下降, 可以得出當(dāng)訓(xùn)練樣本數(shù)量為原來(lái)的一半即750時(shí), 為最佳的訓(xùn)練樣本數(shù)量。
圖13 訓(xùn)練樣本數(shù)量調(diào)整實(shí)驗(yàn)
本文構(gòu)建了一種基于卷積神經(jīng)網(wǎng)絡(luò)的海面太陽(yáng)耀斑區(qū)溢油的分類(lèi)方法, 文中通過(guò)構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的海面太陽(yáng)耀斑區(qū)溢油提取模型, 實(shí)現(xiàn)了對(duì)海面太陽(yáng)耀斑區(qū)油膜的提取, 并獲得了較好的分類(lèi)結(jié)果, 通過(guò)與支持向量機(jī)、最大似然、隨機(jī)森林等經(jīng)典分類(lèi)方法進(jìn)行比較, CNN模型在兩個(gè)實(shí)驗(yàn)區(qū)的分類(lèi)精度(OA)分別為99.97%、95.23%, Kappa系數(shù)為1、0.92, 均高于其他三種分類(lèi)方法, 表明了本文所構(gòu)建的CNN模型對(duì)于海面太陽(yáng)耀斑區(qū)溢油的分類(lèi)具有更高的精度與一致性, 事實(shí)上是CNN的局部連接、權(quán)值共享等特點(diǎn)使得它能夠自動(dòng)挖掘溢油圖像的深層信息, 學(xué)習(xí)到更多更本質(zhì)的特征, 從而獲得最優(yōu)的分類(lèi)準(zhǔn)確率。
雖然本文研究可以發(fā)現(xiàn)CNN分類(lèi)方法能夠有效提高海面太陽(yáng)耀斑區(qū)溢油分類(lèi)精度, 但是仍然存在不足之處, 例如所構(gòu)建的CNN太陽(yáng)耀斑區(qū)溢油提取模型只開(kāi)展基于多光譜數(shù)據(jù)進(jìn)行分類(lèi)實(shí)驗(yàn), 高光譜數(shù)據(jù)的應(yīng)用能力還需檢驗(yàn)。
[1] 馬英杰, 于曉華. 美國(guó)《墨西哥灣恢復(fù)法》特點(diǎn)及其對(duì)我國(guó)海洋生態(tài)修復(fù)的啟示[J]. 中國(guó)海洋大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2016(2): 59-64. MA Yingjie, YU Xiaohua. The characteristics of Mexico Gulf restore act and inspirations for Chinese coastal ecogical restoration[J]. Journal of Ocean University of China (Social Sciences), 2016(2): 59-64.
[2] 吳文鋒. 葫蘆島港船舶溢油風(fēng)險(xiǎn)評(píng)價(jià)研究[D]. 大連: 大連海事大學(xué), 2009.WU Wenfeng. The oil spill risk assessment of the port of Hu ludao[D]. Dalian: Dalian Maritime University, 2009.
[3] 李瑩. 基于SAR圖像的海洋溢油檢測(cè)系統(tǒng)的研究與設(shè)計(jì)[D]. 青島: 山東科技大學(xué), 2012. LI Ying. Research and design of marine oil spill detection system based on SAR images[D]. Qingdao: Shandong University of Science and Technology, 2012.
[4] 孫元芳, 周斌, 蓋穎穎, 等. 遙感監(jiān)測(cè)墨西哥灣溢油目標(biāo)識(shí)別算法[J]. 測(cè)繪科學(xué), 2015, 40(3): 63-67.SUN Yuanfang, ZHOU Bin, GAI Yingying, et al. Extraction algorithm of oil spill cases in Gulf of Mexico with RS data[J]. Science of Surveying and Mapping, 2015, 40(3): 63-67.
[5] 陳韓, 謝濤, 徐輝, 等. 基于TM遙感影像溢油識(shí)別方法的比較研究[J]. 武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版), 2019, 41(3): 305-311.CHEN Han, XIE Tao, XU Hui, et al. Comparative analysis of oil spill recognition based on TM remote sensing image[J]. Journal of Wuhan University of Technology (Information & Management Engineering), 2019, 41(3): 305-311.
[6] DEL FRATE F, PETROCCHI A, LICHTENEGGER J, et al. Neural networks for oil spill detection using ERS- SAR data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2000, 38(5): 2282-2287.
[7] HINTON G, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.
[8] BREKKE C, SOLBERG A H S. Oil spill detection by satellite remote sensing[J]. Remote Sensing of Environment, 2005, 95(1): 1-13.
[9] WANG T, SUN W, QI H, et al. Aerial image super reso-lution via wavelet multiscale convolutional neural net-works[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(5): 769-773.
[10] ZHONG C, MU X, HE X, et al. Classification for SAR scene matching areas based on convolutional neural net-works[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(9): 1377-1381.
[11] ZHAN Y, HU D, XING H, et al. Hyperspectral band selection based on deep convolutional neural network and distance density[J]. IEEE Geoscience and Remote Sensing Letters, 2017, 14(12): 2365-2369.
[12] 陳怡. 海上石油鉆井平臺(tái)責(zé)任制度研究[D]. 上海: 復(fù)旦大學(xué), 2012.CHEN Yi. Study on liability system of offshore oil drilling platform[D]. Shanghai: Fudan University, 2012.
[13] LAVROVA O Y, KOSTIANOY A G. Catastrophic oil spill in the Gulf of Mexico in April–May 2010[J]. Izvestiya, Atmospheric and Oceanic Physics, 2011, 47(9): 1114-1118.
[14] 陳琛, 馬毅, 胡亞斌, 等.一種自適應(yīng)學(xué)習(xí)率的卷積神經(jīng)網(wǎng)絡(luò)模型及應(yīng)用——以濱海濕地遙感分類(lèi)為例[J]. 海洋環(huán)境科學(xué), 2019, 38(4): 621-627.CHEN Chen, MA Yi, HU Yabin, et al. A convolution neural network model with adaptive learning rate and its application - a case study of remote sensing classification of coastal wetland[J]. Marine Environmental Science, 2019, 38(4): 621-627.
[15] 李彥冬, 郝宗波, 雷航. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計(jì)算機(jī)應(yīng)用, 2016, 36(9): 2508-2515. LI Yandong, HAO Zongbo, LEI Hang. Survey of convolutional neural network[J]. Journal of Computer Applications, 2016, 36(9): 2508-2515.
[16] 王飛飛. 基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)算法的研究與應(yīng)用[D]. 南京: 南京郵電大學(xué), 2016, 36(9): 2508-2515.WANG Feifei. Research and applications based the improved convolutional neural network[D]. Nanjing: Nanjing University of Posts and Telecommunications, 2016, 36(9): 2508-2515.
[17] 張偉, 鄭柯, 唐娉, 等. 深度卷積神經(jīng)網(wǎng)絡(luò)特征提取用于地表覆蓋分類(lèi)初探[J]. 中國(guó)圖像圖形學(xué)報(bào), 2017, 22(8): 1144-1153.ZHANG Wei, ZHENG Ke, TANG Ping, et al. Land cover classification with features extracted by deep convolutional neural network[J]. Journal of Image and Graphics, 2017, 22(8): 1144-1153.
Detection of oil spill in the sun glint region of optical remote sensing data based on the convolutional neural network method
DU Kai1, 2, MA Yi2, 3, 4, JIANG Zong-chen1, 2, YANG Jun-fang5
(1. Shandong University of Science and Technology, Qingdao 266590, China; 2. First Institute of Oceanology, Ministry of Natural Resources, Qingdao 266061, China; 3. Technology Innovation Center for Ocean Telemetry, MNR, Qingdao 266061, China; 4. National Engineering Laboratory for Integrated Aero-Space-Ground-Ocean Big Data Application Technology, Xi’an 710072, China; 5. China University of Petroleum (East China), Qingdao 266580, China)
When a large oil spill occurs on the sea surface, it produces a sun glint region that changes the brightness and darkness levels of the optical remote sensing images of the oil spill, which seriously interferes with its classification. Developing a method for the accurate detection of oil spills in the sun glint region is an important problem. Given the urgent need for a solution and the associated practical difficulties, we conducted a study of oil-spill detection methods using Landsat7 ETM+ multi-spectral images in sun glint regions based on the convolutional neural network (CNN). By comparing its performance with that of the support vector machine, maximum likelihood, and random forest classification methods, we found that the CNN model under the same experimental conditions obtained a classification accuracy between 95% and 99%, and a Kappa coefficient of 0.921. These results that were higher than those obtained by the other classification methods prove that for the sun glint regions of oil spills, the CNN has higher classification accuracy and consistency.
remote sensing; oil spill; sun glint region; convolutional neural network (CNN); classification
Jan. 5, 2020
P76
A
1000-3096(2021)04-0022-09
10.11759/hykx20200105001
2020-01-05;
2020-05-23
國(guó)家自然科學(xué)基金重大項(xiàng)目課題(61890964); 山東省聯(lián)合基金項(xiàng)目(U1906217)
[National Natural Science Foundation of China Major Project, No. 61890964; National Natural Science Foundation of China Joint Fund, No. U1906217]
杜凱(1995—), 男, 碩士研究生,通信作者, 主要從事高光譜遙感圖像處理與應(yīng)用研究, E-mail: rsdukai@fio.org.cn; 馬毅(1973—), 共同通信作者, 男, 研究員, 主要從事海島海岸帶遙感與應(yīng)用研究, E-mail: mayimail@fio.org.cn
(本文編輯: 楊 悅)