謝錦瑩 丁麗霞 王志輝 劉麗娟
(1. 浙江農林大學省部共建亞熱帶森林培育國家重點實驗室 杭州 311300; 2. 浙江省森林生態(tài)系統碳循環(huán)與固碳減排重點實驗室 杭州 311300; 3. 浙江農林大學環(huán)境與資源學院 杭州 311300; 4. 浙江遠卓科技有限公司 杭州 310012)
濕地被譽為“地球之腎”,與森林、海洋一起并稱為全球三大生態(tài)系統,在世界各地分布廣泛,不僅可為人類提供大量食物、原料和水資源,而且在維持生態(tài)平衡、保持生物多樣性和珍稀物種資源以及涵養(yǎng)水源、蓄洪防旱、解除污染、調節(jié)氣候、補充地下水、控制土壤侵蝕等方面均起到重要作用(Corcoranetal., 2013)。當前,濕地的研究焦點主要在生態(tài)環(huán)境退化和可持續(xù)發(fā)展上,開展?jié)竦貢r空變化監(jiān)測研究,對濕地資源科學利用與合理開發(fā)具有重要意義,可為生態(tài)環(huán)境與經濟社會的協調發(fā)展提供科學參考(祁增營等, 2012)。濕地植被多樣性是濕地生態(tài)環(huán)境的重要因素,濱海濕地植被是濱海濕地生態(tài)系統的主要組成部分,植被演替是濱海濕地形成和演變的重要標志,監(jiān)測濱海濕地植被,對于認識濱海濕地的演變機制和趨勢意義重大(鄭云云等, 2013)。
近年來,遙感技術在濕地植被監(jiān)測方面發(fā)揮了非常大的促進作用,國內外的監(jiān)測研究大多使用中等分辨率的TM/ETM+遙感影像或高分辨率的航拍影像、QuickBird、WorldViewⅡ、RSAT-2、SAR影像等,采用的分類方法包括最大似然法、支持向量機、人機交互目視解譯、分層分類法、BP神經網絡以及面向對象分類等(周禹, 2017; 周在明等, 2016; 和曉風等, 2015; Boonetal., 2017; Pengeretal., 2007; Raoetal., 1999)。隨著機器學習新算法不斷涌現,對影像處理效果日益增強,許多學者也嘗試利用機器學習算法進行遙感數據處理,其中全卷積神經網絡(fully convolutional networks,FCN)(Shelhameretal., 2017)以其自動提取特征能力強、人工干預少且不受影像輸入大小限制等優(yōu)異特性受到廣泛關注。目前,已有不少學者將該方法用于高分辨率遙感影像處理,并得到了不錯的分類效果,但研究區(qū)均是小面積區(qū)域,且分類對象多為城市地表覆蓋,或只對某一種地物進行分類提取,對象具有類別邊界清晰、地物混雜現象少等特點(湯浩等, 2016; Sherrah , 2016; Piramanayagametal., 2016; Fuetal., 2017; Lietal., 2017; Bittneretal., 2017; 方旭等, 2018; Sunetal., 2018; 徐逸之等, 2018)。而濱海濕地植被豐富多樣,植物混雜生長現象普遍,空間邊界交錯,這些都會給遙感影像自動分類增加難度,全卷積神經網絡提取濱海濕地植被效果如何尚不清楚。
全卷積神經網絡是一種端對端的網絡模型,可直接得到單個像元的分類結果(Shelhameretal., 2017),但會造成結果缺乏空間一致性,存在椒鹽現象; 而面向對象分類方法能夠有效克服該問題,優(yōu)化基于像元的分類結果(張猛等, 2017)。鑒于此,本研究提出一種基于FCN與面向對象的濱海濕地植被分類方法,以期提高濱海濕地植被監(jiān)測效果。
研究區(qū)位于浙江省慈溪市西北部杭州灣南岸地區(qū),30°16′—30°21′N,121°4′—121°10′E,面積約10 000 hm2。該區(qū)具有明顯的海岸帶土地覆蓋特點,自海岸線向內陸依次順序分布有淺?!鉃H馑懖?Scirpusmariqueter)→互花米草(Spartinaalterniflora)→養(yǎng)殖塘、蘆葦(Phragmitescommunis)、南方堿蓬(Suaedaaustralis)→耕地、不透水地表。海三棱藨草生于潮間帶濕地,互花米草生于潮間帶,耐鹽耐淹,蘆葦生于江河湖澤、池塘溝渠沿岸和低濕地,常連片生長,南方堿蓬生于海灘沙地、鹽田堤埂等處。根據土地覆蓋特點和濱海植被分類需要,將研究區(qū)土地覆蓋分為13類,即水體、光灘、海三棱藨草、互花米草、蘆葦、南方堿蓬、不透水地表、耕地、裸露地表、睡蓮(Nymphaeatetragona)、樹木、大棚和其他,其中睡蓮生在溝渠、河塘中,樹木泛指行道樹、人工喬木等高大喬木、灌木等,一些雜草和陰影則歸于其他類。
1.2.1 遙感數據 遙感數據為2013年9月的QuickBird影像,空間分辨率0.6 m,影像大小16 426×17 059像元。在ENVI 5.1軟件中,對遙感數據進行輻射定標和大氣校正,并運用Gram-Schmidt方法融合影像,提高數據分辨率。最佳指數法(Chavezetal., 1982)用于影像波段組合評價分析,最終確定4、3、2波段為最優(yōu)組合,該波段組合可將地物光譜差異通過影像色彩差異得到最佳呈現。如圖1所示,蘆葦在影像上表現出成片分布、紋理細膩平滑、紅色的特征,互花米草在影像上表現出團簇分布、亮紅色的特征,海三棱藨草在影像上表現出成片分布、暗紅色的特征,而睡蓮在圖像上則表現出亮粉紅色的特征。
1.2.2 樣本數據 樣本數據經地面調查獲得一部分,樣點分布如圖1中圓點所示。由于灘涂考察環(huán)境惡劣,實地獲得樣本有限,為補充樣本,本研究結合地物的影像特征、地理位置特征等建立目視判讀標志,根據各類地物的影像特征選定訓練樣本。
為滿足FCN模型訓練要求,需標注樣本以獲得樣本標簽圖。觀察影像發(fā)現,各類地物的邊界和形狀特征均可在100×100窗口下體現,因此本研究以100×100窗口對影像進行裁剪,將目視判讀結果以灰度圖模式保存成樣本標簽圖。
圖1 QuickBird遙感影像以及樣點分布
樣本選取完成后對其進行翻轉、旋轉等操作,以增加樣本數量,選取10%作為測試樣本,最終獲得訓練樣本4 904對、測試樣本544對。
本研究采用2種方案: 1) 基于FCN對影像進行分類,得到結果后進行精度檢驗; 2) 將FCN與面向對象分割方法相結合對影像進行分類,得到結果后進行精度檢驗。同時,比較分析2種方案的分類結果。試驗流程如圖2所示。
圖2 試驗流程
Shelhamer等(2017)對比分析以AlexNet(Krizhevskyetal., 2012)、VGGNet16(Simonyanetal., 2014)、GoogleNet(Szegedyetal., 2015)為基礎網絡的FCN在同一數據集上的分類結果,得出VGGNet16表現最優(yōu); Simonyan等(2014)比較不同數量卷積層的VGG網絡分類結果,認為網絡深度增加有利于提高分類精度?;谝陨?點,本研究確定采用以VGGNet19為基礎網絡的FCN開展分類試驗。
FCN主要包括卷積層、池化層和上采樣層(Shelhameretal., 2017)。卷積層由多個特征面組成,每個特征面由多個神經元組成,用于對輸入影像進行特征提取,層的每個特征都接收來自前一層一個局部接受域的一組特性輸入,后面通常會加一個激活函數,給網絡增加一些非線性因素,以更好地解決復雜問題。池化層跟在卷積層后面,起到二次提取特征的作用,通過池化可降低卷積層輸出的特征向量,減少計算量,減小模型復雜度,同時改善結果,防止過擬合出現。上采樣(up sampling)是FCN的一大特點,也可稱為反卷積(deconvolution),反卷積與卷積類似,都是相乘相加運算,不過卷積是多對一,而反卷積是一對多。
FCN網絡結構包含16層卷積核均為3×3的卷積層和5層池化層,每層卷積層后的激活函數均為ReLU函數,池化層窗口大小均為2×2,且步長為2。前4個池化層采用平均池化,最后1層池化層采用最大池化。后接3層卷積層,同樣以ReLU函數激活,再接1層反卷積層對其特征影像進行上采樣恢復至輸入影像大小。隨著網絡層次加深,獲取的特征更加抽象,而淺層網絡獲得的信息較豐富,因此將不同層次上的結果進行融合即可以獲取更多信息。最后將pool 5、pool 4、pool 3的結果都進行上采樣,將三者疊加對其進行上采樣輸出,提升結果精度。模型結構示意如圖3所示。
圖3 模型結構示意
由于該網絡采用多層3×3的卷積層堆疊,而3×3是最小的能夠捕獲上、下、左、右和中心概念的尺寸,2層3×3的卷積層堆疊相當于1層5×5的濾波器,因此,多層3×3的卷積層比1層具有大尺寸濾波器的卷積層具有更多的非線性,同時參數更少(Simonyanetal., 2014)。此外,卷積層次越多,網絡結構越深,影像的細節(jié)信息能得到更好的提取,但也會造成網絡的計算量十分龐大。
面向對象處理的最小單元不再是像元,而是含有更多語義信息的多個相鄰像元組成的影像對象,其更多的是利用對象的幾何信息以及影像對象之間的語義信息、紋理信息和拓撲關系,而不僅僅是單個對象的光譜信息(張春曉等, 2010),故可以提高影像信息的利用以及分類結果的精度,消除椒鹽現象。多尺度分割是面向對象影像分析中常用的分割方法,對于不同地物適合的分割尺度不同(王露, 2014),因此對于最優(yōu)尺度的選擇需要進行一定的評價。
本研究多尺度分割在易康軟件中完成,由于光譜在植被信息提取中較為重要,而對緊致度和平滑度不敏感,因此確定形狀顏色權重參數分別為0.1、0.9,緊致度和平滑度均為0.5。分割尺度以10為步長,在[20, 200]范圍內進行多次分割,最終采用平均全局評分指數法(Johnsonetal., 2011)進行最優(yōu)尺度選擇,確定為170。
將獲得的樣本數據集輸入到FCN模型中進行訓練,本研究網絡學習率(learning rate)設為1e-4,模型學習完成后對影像進行預測。上述操作使用Tensorflow框架實現。
FCN是一種基于像元的機器學習方法,結果中有出現椒鹽現象的可能。對原始影像以170尺度分割后將結果導出,在Arcmap10.2軟件中根據導出結果對FCN學習得到的影像進行對象邊界約束,劃分出具有空間鄰近性的同質區(qū)域,消除結果中的混雜像元。
FCN訓練損失曲線如圖4所示,當訓練到30 000步左右時,損失曲線趨于平穩(wěn),表明模型已經收斂,此時訓練可以結束。
分類結果如圖5所示。圖6為選取2種方案部分結果進行比較,從二者對比中可看出,經FCN學習得到的影像存在椒鹽現象,而結合面向對象方法后該現象被消除。
圖4 FCN訓練損失曲線
圖5 試驗結果
圖6 2種方案部分結果對比
本研究基于混淆矩陣和Kappa系數檢驗結果,如表1、2所示。采用選取隨機點目視檢驗方式驗證分類精度,避開有云區(qū)域,每種地類至少創(chuàng)建30個隨機點,該步驟在Arcmap中完成。
結合表1、2數據,2種方案分類效果均很好。由表1可知,僅使用FCN方法的分類結果中,624個真實像元里,分類正確的有589個,分類錯誤的有35個,總體精度為94.39%,Kappa系數為0.939 2。由表2可知,結合面向對象分割后的分類結果中,615個真實像元里,分類正確的有600個,分類錯誤的僅為15個,總體精度為97.56%,Kappa系數為0.973 6,較方案一分別提高了3.17%和0.034 4,說明2種方法結合應用后的總體分類效果有所改善。
由表1中用戶精度可知,蘆葦的錯分誤差較大。單一查看蘆葦數據,48個真實參考像元里,41個分類正確,有3個錯分為樹木,2個錯分為南方堿蓬和1個錯分為海三棱藨草。錯分的主要原因是沿海地區(qū)蘆葦零零散散,且與其他濕地植被交錯分布,存在植被混雜生長現象,不同植被之間邊界特征不明顯,從而影響FCN精確提取蘆葦邊界。分析蘆葦與樹木的錯分現象,二者在4、3、2波段組合上均顯示為紅色,而不同植物的表型存在特征差異,蘆葦紋理細膩平滑,樹木則大多數呈現出顆粒狀特征,但是部分區(qū)域樹的分布密集,樹冠影像紋理也較為平滑,從而在模型訓練中與蘆葦產生混淆。圖6d、e、f為蘆葦的部分結果比較,在圖6d中可以清晰看出蘆葦紋理細膩平滑的特點,而圖6e中體現不同地物的交界處即混合像元,由于沒有清晰的紋理特征導致分類情況較為復雜,但與圖6d比較,圖6f中結合面向對象分割后的邊界情況明顯得到優(yōu)化,蘆葦分類邊界更加清晰明確。
互花米草的用戶精度為90%,主要錯分為海三棱藨草。由于互花米草與海三棱藨草的分布區(qū)域交接重合,從而導致2類植被之間存在混合像元產生錯分。
南方堿蓬的用戶精度很高,只有極少部分錯分為蘆葦和海三棱藨草。南方堿蓬主要生長在沿海沙地、鹽田和田埂等,明顯區(qū)別于睡蓮和樹木,因此南方堿蓬與睡蓮和樹木之間不存在錯分。此現象也可從圖6g、h、i的對比中體現,觀察圖6h,單一使用FCN處理后的影像比較粗糙,存在椒鹽現象,而經過面向對象分割處理后的圖6i則顯得十分平滑,南方堿蓬的分類結果邊界清晰,結合原圖比較,可以看出經面向對象分割處理后的分類結果更好。
海三棱藨草分布較廣且成片,其影像信息特征呈暗紅色,其他植被類型的影像信息特征明顯區(qū)別于暗紅色,所以極少有錯分,但是某些生長茂盛區(qū)域的影像特征與蘆葦相似,且在靠近陸地的海岸帶與蘆葦交錯分布生長,邊界信息較為模糊,而FCN是一種基于像元的分類方法,像元之間相互獨立,因此相鄰像元的分類結果可能不一致,導致部分海三棱藨草仍錯分為蘆葦。結合面向對象處理后,能有效克服同物異譜或同譜異物帶來的影響,彌補基于像元分類的缺陷,消除椒鹽現象,提高分類精度。
表1 方案一混淆矩陣①
表2 方案二混淆矩陣
睡蓮的用戶精度為100%,這是因為睡蓮在影像上呈現獨特的亮粉紅色,且其分布區(qū)域大多為溝渠、河塘,紋理特征和邊界信息都很突顯,圖6m、n和o的對比說明該點。
從表1 的制圖精度分析可得,原圖上各實際典型濕地植被類型漏分較少,表明FCN對于本研究影像的分類具有很好的效果。
結合表1、2與分類結果影像分析得出,僅使用FCN的分類錯誤大多出現在地物邊界的混合像元區(qū)域,而結合面向對象分割后,通過各對象邊界對像元進行邊界約束,將基于像元分類轉變?yōu)榛趯ο蠓诸?,可?yōu)化分類效果。
本研究采用的FCN基于VGGNet19結構,卷積層數量多,網絡層次深,能夠提取較精細的紋理,如地物的邊、角、輪廓特征,有利于濱海濕地植被的精細分類;但該網絡也存在一定缺陷,即得到單個像元分類結果的同時會產生椒鹽現象。結合面向對象分割后,將原本基于像元轉變?yōu)榛趯ο?,對同類地物進行邊界約束,加入了地物的空間分布相關性,可彌補FCN基于像元分類的缺陷,減少混雜像元的數量,從而降低細小特征的干擾,有效提高分類精度。
FCN結合面向對象方法對于邊界清晰且光譜和紋理與其他類差別較大的地物提取精度較高,如本研究中的睡蓮。結合面向對象方法后對于植被類型間,即使光譜和紋理特征存在相似性,分布區(qū)域邊界模糊,提取精度也較高。但由于環(huán)境、區(qū)域因素的限制,實地采樣方面有所欠缺,無法保證獲取百分百正確的地面真實樣本數據,從而產生一些誤差。另外,本研究所用模型參數固定,若要進一步提高該方法的分類精度,下一步可考慮對模型參數進行適當調整,以得到更加合適的網絡模型。
本研究基于FCN與面向對象相結合的方法從高分辨率遙感影像中提取濱海濕地植被,結果表明,僅使用FCN的分類效果不錯,可在復雜的濱海濕地環(huán)境下精細提取植被,典型濱海濕地植被分類精度達85%以上; 但作為一種基于像元的分類方法,其結果中存在少量椒鹽現象。結合面向對象分割后,能夠有效消除椒鹽現象,優(yōu)化基于像元的分類效果,總體精度得到提升,典型濱海濕地植被提取精度均達90%以上。基于FCN與面向對象相結合的方法不僅適用于濱海濕地植被的精細分類,同時也可為環(huán)境復雜條件下的植被精細分類提供經驗,值得在植被高分辨率遙感影像精細分類方面推廣和運用。