李連偉,張源榆,岳增友,薛存金,付宇軒,徐洋峰
(1.中國石油大學(xué)(華東)海洋與空間信息學(xué)院,山東 青島 266580;2.微山縣自然資源和規(guī)劃局,山東 濟寧 277600;3.中國科學(xué)院 a.空天信息創(chuàng)新研究院;b.數(shù)字地球重點實驗室,北京 100094)
目前全球漁業(yè)捕撈的產(chǎn)量已趨于穩(wěn)定,但全球人口卻在不斷增長,隨之增長的水產(chǎn)品需求只能依靠水產(chǎn)養(yǎng)殖來滿足[1]。水產(chǎn)養(yǎng)殖的方式主要為坑塘養(yǎng)殖、浮筏養(yǎng)殖和網(wǎng)箱養(yǎng)殖,坑塘養(yǎng)殖位于人工開挖或者天然的池塘中,而浮筏養(yǎng)殖和網(wǎng)箱養(yǎng)殖依賴于浮在水面上的養(yǎng)殖設(shè)備。因空間資源限制和生產(chǎn)成本控制等原因,水產(chǎn)養(yǎng)殖正逐步向集約化的網(wǎng)箱養(yǎng)殖發(fā)展[2]。據(jù)統(tǒng)計,我國的淡水網(wǎng)箱養(yǎng)殖已占據(jù)全球主導(dǎo)地位,面積超過70萬公頃,占全球報告總量的68.4%[2]。然而集中的水產(chǎn)養(yǎng)殖對周邊環(huán)境造成嚴重的破壞,不僅會對當?shù)丨h(huán)境造成污染,還會導(dǎo)致淡水生態(tài)系統(tǒng)服務(wù)功能的喪失[3],且有研究顯示工業(yè)化水產(chǎn)養(yǎng)殖甚至?xí)欧鸥嗟臏厥覛怏w[1]。近年來,國家對生態(tài)環(huán)境保護和可持續(xù)發(fā)展愈加重視,故對水產(chǎn)養(yǎng)殖區(qū)特別是網(wǎng)箱養(yǎng)殖區(qū)的監(jiān)督和管理也亟需加強。
衛(wèi)星遙感是最高效的對地觀測方法之一,具有成本低、時間序列長、覆蓋范圍廣等優(yōu)點。近年來,高分辨率遙感技術(shù)得到了快速的發(fā)展[4],能夠為養(yǎng)殖區(qū)的長期觀測提供質(zhì)量更高、數(shù)量更多的遙感數(shù)據(jù)。不少學(xué)者針對遙感影像的養(yǎng)殖區(qū)提取方法進行了深入的研究,如Wang等[5]提出了一種基于多尺度特征融合和空間規(guī)則歸納的浮筏養(yǎng)殖區(qū)提取方法;Wang等[6]根據(jù)養(yǎng)殖區(qū)葉綠素濃度高的特點,結(jié)合面向?qū)ο蠓椒ê妥⒁饬C制實現(xiàn)了沿海高分影像的浮筏養(yǎng)殖區(qū)提??;Kang等[7]基于面向?qū)ο蠓椒▽?000—2018年遼寧省的海水養(yǎng)殖區(qū)進行分析;Zeng等[8]利用支持向量機根據(jù)輪廓規(guī)則度、周長和面積對內(nèi)陸湖泊的水產(chǎn)養(yǎng)殖坑塘進行提取;Luo等[3]利用K近鄰聚類方法對陽澄湖的圍欄養(yǎng)殖區(qū)進行識別,并研究了養(yǎng)殖區(qū)與水體質(zhì)量的變化關(guān)系。除了以上提到的基于光學(xué)影像的提取方法之外,Ottinger等[9]結(jié)合數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù),利用合成孔徑雷達(synthetic aperture radar,SAR)影像對河流三角洲的坑塘養(yǎng)殖區(qū)進行提取。上述方法不僅需要人為對參數(shù)進行反復(fù)調(diào)整,且提取的精度取決于參數(shù)的設(shè)置,導(dǎo)致穩(wěn)定性較低。
隨著深度學(xué)習(xí)在圖像識別領(lǐng)域的快速發(fā)展,很多學(xué)者將深度學(xué)習(xí)應(yīng)用于遙感的各個領(lǐng)域中[10],特別是深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural networks,DCNNs)已經(jīng)在遙感影像的分類[11-12]、目標檢測[13]和語義分割[14-15]等方面得到了廣泛的應(yīng)用。其中語義分割模型對輸入圖像的每個像元進行分類,包括全卷積網(wǎng)絡(luò)(fully convolutional networks,F(xiàn)CN)[16]、U-net[17]和DeepLab[18]等。FCN模型是最常用的語義分割模型之一[16],已有不少學(xué)者將FCN模型應(yīng)用于沿海水產(chǎn)養(yǎng)殖區(qū)的提取,如Shi等[19]基于FCN模型設(shè)計了雙尺度同質(zhì)卷積神經(jīng)網(wǎng)絡(luò)(dual-scale homogeneous convolutional neural network,DS-HCN)以識別海陸邊界和提取浮筏養(yǎng)殖區(qū)。因DS-HCN網(wǎng)絡(luò)易將相鄰養(yǎng)殖區(qū)間的水域誤判為養(yǎng)殖區(qū)[20],為解決該問題,Cui等[20]基于U-Net提出了浮筏養(yǎng)殖區(qū)提取算法UPS-Net;Sui等[21]基于DeepLab V3提出了一種沿海離岸養(yǎng)殖區(qū)提取算法OAE-V3,并將其應(yīng)用于山東省東部沿海。因內(nèi)陸水體葉綠素和懸浮物等物質(zhì)的濃度常比沿海水體更高,故內(nèi)陸?zhàn)B殖區(qū)的水體光譜和背景水體的光譜差距更小[6,21],導(dǎo)致內(nèi)陸水體養(yǎng)殖區(qū)的提取難度更大。而上述方法均是針對沿海離岸養(yǎng)殖區(qū)設(shè)計,未必適用于內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)的提取,目前基于深度學(xué)習(xí)的內(nèi)陸?zhàn)B殖區(qū)提取研究較少。針對內(nèi)陸坑塘養(yǎng)殖區(qū)的提取問題,Zeng等[22]考慮到坑塘的路堤在行向和列向上較為規(guī)則,結(jié)合行列自注意(row column self-attention,RCSA)機制和FCN提出了RCSANet模型。但由于浮在水上的網(wǎng)箱養(yǎng)殖區(qū)分布零散,各網(wǎng)箱養(yǎng)殖區(qū)間相隔一定的距離,在行向和列向上沒有固定的模式,故RCSANet無法應(yīng)用于內(nèi)陸水域的網(wǎng)箱養(yǎng)殖區(qū)。
傳統(tǒng)的內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取方法需要人為對參數(shù)進行反復(fù)調(diào)整,準確性和穩(wěn)定性較低。深度學(xué)習(xí)已被廣泛應(yīng)用于近海養(yǎng)殖區(qū)的提取并且達到較高的精度,但是因為內(nèi)陸水體和近海水體之間存在較大差異,所以針對近海養(yǎng)殖區(qū)設(shè)計的深度學(xué)習(xí)提取模型未必適用于內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)。因此,本文針對內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)探討了基于深度學(xué)習(xí)FCN模型的養(yǎng)殖區(qū)提取,收集了福建省北部的GF-1和GF-2遙感影像并建立了2個內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)樣本庫,利用樣本庫訓(xùn)練了2個FCN模型并進行模型精度驗證。
網(wǎng)箱養(yǎng)殖是利用漂浮在水面上的網(wǎng)箱進行水產(chǎn)養(yǎng)殖,單個網(wǎng)箱為竹竿、木板或鋼管結(jié)構(gòu),面積較小,養(yǎng)殖者常將幾個或十幾個網(wǎng)箱連接成串線陣、面陣排列,部分成面狀點陣排列。據(jù)統(tǒng)計,福建省的普通網(wǎng)箱(不包括深水網(wǎng)箱)養(yǎng)殖區(qū)面積超過4.336×107m2,占全國總計的84%[23]。福建省淡水養(yǎng)殖產(chǎn)量最大的地方是古田縣,該縣2014年淡水漁業(yè)總產(chǎn)量達1.92×104t,其中閩江古田段水口庫區(qū)就占了46.3%[24]。閩江古田段位于福建省古田縣西南部,研究區(qū)域范圍為118°25′43″E—118°46′37″E、26°19′2″N—26°28′9″N,全長60.32 km,如圖1所示。該地區(qū)的網(wǎng)箱養(yǎng)殖主要以草魚、鰱魚和白刀魚等為主,網(wǎng)箱養(yǎng)殖已成為當?shù)鼐用裰匾慕?jīng)濟來源。
圖1 閩江(古田段)的遙感影像
內(nèi)陸網(wǎng)箱養(yǎng)殖的幾何特征表現(xiàn)為形狀規(guī)則,單個網(wǎng)箱為矩形,多個網(wǎng)箱連接為長條狀矩形;光譜特征表現(xiàn)為單個網(wǎng)箱邊緣呈灰白色。
我國自主研發(fā)的高分系列衛(wèi)星是中國高分辨率對地觀測重大專項計劃的重要成果之一。GF-1是首顆發(fā)射升空的高分系列衛(wèi)星,其特點是高空間分辨率、多光譜與高時間分辨率的結(jié)合[25];GF-2是我國第一顆亞米級空間分辨率的民用光學(xué)遙感衛(wèi)星,其裝載的全色相機空間分辨率達到1 m[26]。GF-1和GF-2現(xiàn)已被廣泛應(yīng)用于土地利用情況監(jiān)測、地質(zhì)災(zāi)害調(diào)查和城鄉(xiāng)規(guī)劃等領(lǐng)域[27]。
本文獲取了閩江古田段的GF-1影像和GF-2影像,圖1為影像的覆蓋范圍,綠線為閩江古田段的具體位置,GF-1影像和GF-2影像的技術(shù)指標如表1所示。
表1 遙感影像的技術(shù)指標
本文基于FCN模型開展內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取的方法思路如圖2所示。收集覆蓋研究區(qū)域GF-1和GF-2遙感影像;進行包含影像融合、波段選擇和影像裁剪的遙感影像預(yù)處理;經(jīng)數(shù)據(jù)預(yù)處理后,通過樣本標注、真值制作和樣本增強構(gòu)建樣本庫;設(shè)置初始參數(shù),進行FCN模型訓(xùn)練,并對FCN模型進行測試驗證;最后進行精度驗證分析。
圖2 基于FCN模型內(nèi)陸網(wǎng)箱養(yǎng)殖提取流程圖
為將遙感影像數(shù)據(jù)運用于FCN模型中,需要對數(shù)據(jù)進行預(yù)處理,具體步驟包括影像融合、波段選擇和影像裁剪。
2.1.1 影像融合
GF-1和GF-2衛(wèi)星都搭載了全色和多光譜相機。全色波段具有空間分辨率高、光譜分辨率低的特點,而多光譜波段具有空間分辨率較低、光譜分辨率較高的特征。因此,本文首先將全色波段和多光譜波段融合成與全色波段空間分辨率一致的多波段影像,GF-1和GF-2遙感影像融合后空間分辨率分別為2 m和1 m。
2.1.2 波段選擇
因FCN模型的輸入數(shù)據(jù)為常規(guī)的RGB(Red/Green/Blue,紅/綠/藍)三通道圖像,并基于內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)的特點,需要在融合影像中選擇合適的三個波段組合成三通道圖像。經(jīng)對比分析,紅、綠和近紅外波段合成的假彩色遙感影像更能突出內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)的邊緣以及陸地和水體之間的差異(圖3),故本文采用假彩色遙感影像的波段組合。
圖3 真彩色和假彩色影像的對比
2.1.3 影像裁剪
為了成為政府提供社會福利服務(wù)的主要專業(yè)力量以及消除弗蘭克斯納(Abraham Flexner)對其非專業(yè)評價的影響,社會工作沿著里士滿的個人主義價值路徑,更加強調(diào)運用精神病學(xué)和心理治理方法關(guān)注個人治療和改變,越來越多地從事個案服務(wù)活動,開始走向過度專業(yè)化而不認同志愿服務(wù)[7]。由此出現(xiàn)了注重個人治療的醫(yī)學(xué)實踐模式與社會工作專業(yè)價值理念之間的沖突,以及社會工作者與志愿者之間平等關(guān)系的斷裂。隨著全球化下社會福利服務(wù)多元模式的發(fā)展,社會工作開始反思僅關(guān)注個人治療的醫(yī)學(xué)模式的局限,重新強調(diào)個人與社會關(guān)系,通過重建與志愿服務(wù)間的平等合作關(guān)系優(yōu)化整合資源,為服務(wù)對象提供本土化的專業(yè)服務(wù)。
由于計算機圖形處理器(graphics processing unit,GPU)顯存的限制,完整的一景高分影像無法直接輸入FCN模型進行訓(xùn)練,故在建立樣本庫之前,依據(jù)網(wǎng)箱養(yǎng)殖區(qū)的大小以及設(shè)備的性能將原遙感影像裁剪成400×400的遙感影像。
影像的空間分辨率是影響內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取的關(guān)鍵因素。相對于實地拍攝的普通照片,衛(wèi)星遙感影像的像元大小相對于內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)面積而言比較有限,本文分別建立了GF-1影像的樣本庫和GF-2影像的樣本庫。
2.2.1 樣本制作
首先通過Labelme軟件對遙感影像中的內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)進行人工標注,在人工標注時要確保誤差不超過3個像素。然后將人工標注得到的矢量圖像轉(zhuǎn)換為二值柵格圖像,其中灰度值1代表內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū),0代表非內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū),并將二值柵格圖像與原遙感影像組成一組樣本(圖4)。經(jīng)過人工標注之后,初步得到216組樣本,其中GF-1影像和GF-2影像樣本各108組。
圖4 GF-2和GF-1影像樣例及相應(yīng)的養(yǎng)殖區(qū)標注
2.2.2 樣本數(shù)據(jù)增強
為提高FCN模型的泛化能力,需要對初步得到的樣本作增強處理以增加樣本數(shù)量。樣本增強能充分利用原有的樣本,常用的樣本增強方法包括旋轉(zhuǎn)、縮放和鏡像。本文對原樣本進行連續(xù)的水平鏡像、縮小50%和放大150%,以及90°、180°和270°旋轉(zhuǎn),最后共得到216×2×3×4=5 184組樣本,其中GF-1影像和GF-2影像樣本各2 592組。
FCN模型是一個端到端的神經(jīng)網(wǎng)絡(luò),該模型奠定了語義分割網(wǎng)絡(luò)模型的基本結(jié)構(gòu)[16]。在原始的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)中,最底部的網(wǎng)絡(luò)層是緊跟于多個卷積層之后的全連接層,其輸出的特征向量是分類的依據(jù)。而FCN模型將CNN模型的全連接層替換為反卷積層(圖5),反卷積層的作用是對特征圖向上采樣,還原至與輸入圖像相同大小的尺寸,通過分類器實現(xiàn)對每個像素的分類。
圖5 FCN結(jié)構(gòu)圖
因內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)的提取屬于二分類問題,故將二分類的交叉熵作為損失函數(shù):
(1)
(2)
本文利用TensorFlow框架構(gòu)建了內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取的FCN網(wǎng)絡(luò)模型,采用VGG19模型的前5層作初始化,設(shè)置的學(xué)習(xí)率為10-6,批樣本數(shù)量為8,最大迭代次數(shù)為10萬次。訓(xùn)練的軟件和硬件環(huán)境如表2所示。
表2 軟件和硬件環(huán)境
采用以下5個常用指標作為FCN模型提取內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)結(jié)果的精度評價指標:精確率(precision)、召回率(recall)、F值(F-measure)、準確率(accuracy)和Kappa系數(shù),分別用變量P、R、F、A和K表示。精確率代表提取為養(yǎng)殖區(qū)的水域中提取正確的概率,而召回率代表實際的養(yǎng)殖區(qū)中被提取到的概率。精確率和召回率分別從不同的角度衡量提取結(jié)果的有效性和準確性,但是兩者相互制約,往往不能同時達到最優(yōu)。F值是精確率和召回率的調(diào)和平均,能夠綜合反映整體的精度。此外,準確率是提取結(jié)果中各像元正確的概率,而Kappa系數(shù)衡量提取結(jié)果與真值的一致性。
P=NTP/(NTP+NFP),
(3)
R=NTP/(NTP+NFN),
(4)
F=(2×P×R)/(P+R),
(5)
A=(NTP+NTN)/Nt,
(6)
(7)
K=(A-Pe)/(1-Pe),
(8)
式中:N表示所有像素個數(shù),NTP表示正確提取的養(yǎng)殖區(qū)像素數(shù),NFP表示錯誤提取的養(yǎng)殖區(qū)像素數(shù),NFN表示未提取的養(yǎng)殖區(qū)像素數(shù),NTN表示未提取的非養(yǎng)殖區(qū)像素數(shù),具體如表3所示。
表3 混淆矩陣
首先利用GF-1樣本庫和GF-2樣本庫分別對2個FCN模型進行訓(xùn)練,然后對訓(xùn)練后的FCN模型進行驗證,驗證結(jié)果如圖6所示,圖6中區(qū)域A和B的原始影像為GF-1,區(qū)域C和D的原始影像為GF-2。
圖6 內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取結(jié)果
圖6中對提取結(jié)果和人工標注的真值進行了疊加分析,其中綠色表示正確提取為內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū),紅色為漏提的區(qū)域,藍色為錯提的區(qū)域。由圖6可知,2個FCN模型提取的結(jié)果基本與人工標注結(jié)果一致,只是在養(yǎng)殖區(qū)邊緣或者末端存在較小的出入,且能夠排除水草、船只和板房等其他地物。圖7為區(qū)域D提取結(jié)果與遙感影像疊加的細節(jié)圖,由圖7可知,即使是細節(jié)圖左下角的鋸齒狀養(yǎng)殖區(qū),所構(gòu)建的FCN模型也能夠準確地對其進行識別和提取。
圖7 區(qū)域D提取結(jié)果細節(jié)圖
由圖6和圖7可知,因GF-2影像分辨率較GF-1更高,故基于GF-2提取的養(yǎng)殖區(qū)棱角分明,更接近規(guī)則的矩形,更符合內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)的實際情況,除了部分寬度較窄的區(qū)域被漏提之外,其他區(qū)域均能完整地提取出來。基于GF-1影像提取的養(yǎng)殖區(qū)邊緣比較粗糙,且提取結(jié)果的錯提區(qū)域更多,錯提像元容易出現(xiàn)在養(yǎng)殖區(qū)分布較為密集而且形狀較為復(fù)雜的水域,如圖6 B區(qū)的左下角中,數(shù)個相鄰養(yǎng)殖區(qū)之間的水域被錯誤地識別為養(yǎng)殖區(qū),導(dǎo)致養(yǎng)殖區(qū)密集分布的水域被誤判為一整片養(yǎng)殖區(qū)。此外,GF-1影像提取結(jié)果存在藍色的斑點,即獨立的小面積錯提區(qū)域,說明空間分辨率相對較低的GF-1影像易受到其他地物的干擾。
本文統(tǒng)計了各區(qū)域的混淆矩陣和各項精度評價指標,如表4所示。由表4可知:
表4 精度評價
(1)GF-1提取結(jié)果的精確率、召回率和F值均達到80%以上,GF-2提取結(jié)果的精確率、召回率和F值也超過90%,其中區(qū)域C的召回率為96.09%,說明GF-1和GF-2提取的結(jié)果均達到較高的精度。
(2)GF-1提取結(jié)果的精確率都高于召回率,說明錯提的像元少于漏提的像元;而GF-2的提取結(jié)果則完全相反,漏提的像元少于錯提的像元
(3)GF-2和GF-1提取結(jié)果的Kappa系數(shù)都達到了0.8以上,說明2種影像提取結(jié)果與人工標注真值的一致性都比較高。
SUI等[21]曾利用最大似然法對山東省的近海網(wǎng)箱養(yǎng)殖區(qū)進行提取,結(jié)果精度為69.8%。內(nèi)陸水域葉綠素和懸浮物等物質(zhì)的濃度通常高于近海水域,因此內(nèi)陸?zhàn)B殖區(qū)的水體光譜和背景水體的光譜差距更小[6,21],養(yǎng)殖區(qū)提取難度更大。但本文基于FCN的內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取精度仍高于69.8%。LIU等[28]也曾結(jié)合面向?qū)ο蟮乃w指數(shù)和邊緣檢測算法對福建省沿海的浮筏和網(wǎng)箱養(yǎng)殖區(qū)進行提取,提取結(jié)果的F值為82.80%。而本文內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取結(jié)果的F值在福建省閩江段區(qū)域A、C和D均達到了85%以上。
總之,GF-2提取結(jié)果的各項指標均明顯優(yōu)于GF-1提取結(jié)果,印證上文對圖6的分析,說明空間分辨率更高的遙感影像可以顯著提升內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取的精度。但由于GF-1具有重訪周期短、幅寬大的優(yōu)點,所能提供的遙感影像時間分辨率更高,覆蓋范圍更廣,更有利于內(nèi)陸?zhàn)B殖區(qū)的長期實時監(jiān)測。
為了實現(xiàn)對內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)的快速自動提取,本文利用GF-1和GF-2衛(wèi)星遙感影像通過人工標注和數(shù)據(jù)增強構(gòu)建了2個內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)的樣本庫,并將樣本庫用于訓(xùn)練內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取的深度學(xué)習(xí)FCN模型。對訓(xùn)練后的FCN模型進行了測試,結(jié)果表明,GF-1和GF-2提取的F值分別為83.37%和92.56%,表明訓(xùn)練的FCN模型能夠準確地識別和提取內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū),且2種影像的提取結(jié)果與人工標注的養(yǎng)殖區(qū)基本一致,同時也證明GF-2影像的提取效果顯著優(yōu)于GF-1影像的提取效果;GF-2漏提的像元少于錯提的像元,而GF-1錯提的像元少于漏提的像元;分辨率較低的GF-1影像易受水面其他地物的干擾,且在養(yǎng)殖區(qū)密集的水域難以區(qū)分多個養(yǎng)殖區(qū),會錯提養(yǎng)殖區(qū)之間的水域。近年來,我國的高分衛(wèi)星數(shù)量逐步增多,影像分辨率也不斷提高,故未來可考慮將FCN模型應(yīng)用于我國其他高分衛(wèi)星遙感影像的內(nèi)陸網(wǎng)箱養(yǎng)殖區(qū)提取,為內(nèi)陸?zhàn)B殖區(qū)的監(jiān)管提供詳實可靠的數(shù)據(jù)支撐。