高 峰,楚博策,帥 通,王士成,陳金勇
(中國電子科技集團(tuán)公司 航天信息應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室,河北 石家莊 050081)
耕地是農(nóng)業(yè)的基礎(chǔ),伴隨著信息化時(shí)代的到來,應(yīng)用空間信息化技術(shù)進(jìn)行耕地信息的快速獲取與檢測己成為時(shí)代發(fā)展的必然。尤其是近年來,隨著我國改革開放的深入,準(zhǔn)確地掌握區(qū)域范圍內(nèi)耕地分布和變化情況,不僅是技術(shù)發(fā)展的需要,更是開展農(nóng)業(yè)發(fā)展宏觀管理的必需。
石家莊是華北平原地帶經(jīng)濟(jì)發(fā)達(dá)地區(qū)的城市,現(xiàn)代農(nóng)業(yè)發(fā)達(dá),是華北地區(qū)主要農(nóng)產(chǎn)品供應(yīng)基地。耕地是農(nóng)業(yè)生產(chǎn)發(fā)展的基礎(chǔ),是社會(huì)穩(wěn)定的前提條件。但由于石家莊耕地區(qū)域覆蓋面大、分布廣,針對該區(qū)域的耕地資源調(diào)查較為耗時(shí)耗力,除此之外,針對國家出臺(tái)的“退耕還林”“嚴(yán)厲查處違法占地”等政策的落實(shí)情況也急需實(shí)現(xiàn)核查驗(yàn)證。因此,在耕地形勢日益嚴(yán)峻的大形勢下,有效利用遙感檢測技術(shù)明確現(xiàn)有可利用耕地面積與變化情況[1-2]顯得尤為重要。
遙感影像耕地提取目前在各監(jiān)管部門主要采用人工目視解譯的方法[3-4],隨著衛(wèi)星載荷與數(shù)據(jù)量的逐步增加,特別是面對高頻率、大范圍耕地區(qū)域?qū)Ρ?,傳統(tǒng)人工標(biāo)定的方法難以支撐爆發(fā)式增長的任務(wù)與需求,因此,研究如何采用人工智能的方法實(shí)現(xiàn)遙感影像智能化處理是一項(xiàng)具有深遠(yuǎn)意義的工作。
隨著人工智能的不斷發(fā)展,深度學(xué)習(xí)[5]已經(jīng)在語音識(shí)別、圖像識(shí)別和信息檢索等領(lǐng)域取得了成功,這些應(yīng)用也證明了深度學(xué)習(xí)是一種行之有效的自動(dòng)化分類識(shí)別工具。這一類模擬大腦學(xué)習(xí)過程的方法相比傳統(tǒng)人工設(shè)定特征內(nèi)容的方法具有更好的特征抽象性和魯棒性。然而,目前將深度學(xué)習(xí)應(yīng)用于遙感地物變化檢測的研究工作相對較少。本文采用一種基于深度學(xué)習(xí)語義分割的遙感影像耕地提取方法,將應(yīng)用于語義分割任務(wù)的深度學(xué)習(xí)模型——全卷積深度網(wǎng)絡(luò),進(jìn)行遙感影像的耕地提取,實(shí)現(xiàn)了分割與分類過程的一體化,通過對比多時(shí)相影像分類結(jié)果實(shí)現(xiàn)耕地資源的變換檢測。實(shí)驗(yàn)表明,設(shè)計(jì)的深度學(xué)習(xí)方法在耕地變化檢測中具有較好的應(yīng)用效果。
本文設(shè)計(jì)的基于深度學(xué)習(xí)的耕地變化檢測流程如圖 1所示。
圖1 耕地變化檢測流程
采用深度學(xué)習(xí)的方法首先要對遙感影像進(jìn)行地物標(biāo)注,隨后采用全卷積網(wǎng)絡(luò)對影像進(jìn)行網(wǎng)絡(luò)訓(xùn)練,其中包括卷積特征提取和反卷積映射,通過從下到上的上采樣計(jì)算得出原始圖像中每個(gè)像素所屬類別的概率,最后通過標(biāo)注影像和網(wǎng)絡(luò)輸出影像對比計(jì)算損失函數(shù)實(shí)現(xiàn)網(wǎng)絡(luò)模型訓(xùn)練。在進(jìn)行變化檢測時(shí),首先需要對同一區(qū)域多時(shí)間點(diǎn)的2幅影像進(jìn)行切塊,對切塊影像采用之前訓(xùn)練得到的模型進(jìn)行耕地區(qū)域分類[6],通過影像配準(zhǔn)[7-8]實(shí)現(xiàn)分類結(jié)果精確對準(zhǔn),隨后采用差值法[9]直接得到耕地變化結(jié)果。由于全卷積網(wǎng)絡(luò)為像素級(jí)分割網(wǎng)絡(luò),因此變化對比結(jié)果會(huì)出現(xiàn)較多像素碎片,本文采用腐蝕、膨脹等形態(tài)方法[10]進(jìn)行后處理得到最終變化檢測結(jié)果。
傳統(tǒng)的耕地提取方法[11]大多采用分割+分類的2階段模式,分類結(jié)果不單取決于分類模型的精度,還受制于分割結(jié)果的準(zhǔn)確性。全卷積神經(jīng)網(wǎng)絡(luò)(FCN)[12]可以做到對圖像進(jìn)行像素級(jí)的分類,實(shí)現(xiàn)端到端的原始影像至分類結(jié)果的直接生成,解決了語義級(jí)別的圖像分割(Semantic Segmentation)問題,因此較為適合應(yīng)用于耕地提取任務(wù)當(dāng)中。
傳統(tǒng)CNN分類網(wǎng)絡(luò)通常會(huì)在最后連接幾層全連接層,它將原來二維的矩陣(圖片)壓扁成一維的,丟失了空間信息,最后訓(xùn)練輸出一個(gè)標(biāo)量(也就是分類標(biāo)簽)。而耕地提取任務(wù)不但要知道圖像中包含的地物類別,還需要分割出不同地物所處的位置。本文采用的FCN,相比于其他CNN,不同的是去掉了原始CNN最后的全連接層,采用反卷積層對最后一個(gè)卷積層的特征映射進(jìn)行上采樣,使它恢復(fù)到輸入圖像相同的尺寸,最后逐個(gè)像素計(jì)算softmax分類的損失,相當(dāng)于每一個(gè)像素對應(yīng)一個(gè)訓(xùn)練樣本。因此可以對每個(gè)像素都產(chǎn)生一個(gè)預(yù)測,保留了原始輸入圖像中的空間信息。具體網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
將全卷積后的結(jié)果直接上采樣,得到的結(jié)果是很粗糙的。由于高分辨率遙感圖像具有非常細(xì)節(jié)的信息,底層低分辨率語義特征直接進(jìn)行圖像分類,將會(huì)產(chǎn)生明顯的誤差,所以FCN將不同池化層的結(jié)果進(jìn)行上采樣后,與下采樣后的結(jié)合形成優(yōu)化輸出后,進(jìn)行上采樣得到最終分類結(jié)果[13]。
圖2 FCN網(wǎng)絡(luò)結(jié)構(gòu)
本文采用SITF-RANSAC[14]方法實(shí)現(xiàn)不同時(shí)間拍攝的同區(qū)域影像精配準(zhǔn),由于耕地分類結(jié)果為二值圖形式,可以直接對2幅分類結(jié)果圖進(jìn)行求差操作,得到耕地變化初始結(jié)果,通過對其進(jìn)行形態(tài)變換后處理得到最終變化檢測結(jié)果[15]。圖3(a)和圖3(b)中為輸入的2幅不同時(shí)間的影像,分別進(jìn)行耕地提取得到圖3(c)和圖3(d)兩幅二值影像,對其求差得到粗糙的變換檢測結(jié)果,隨后通過形態(tài)學(xué)后處理得到圖3(f),可以看出后處理能有效地減少神經(jīng)網(wǎng)絡(luò)帶來的像素級(jí)斑點(diǎn)誤差。
圖3 耕地變化檢測效果
本文中涉及的訓(xùn)練和測試數(shù)據(jù)為實(shí)際地區(qū)的RGB可見光影像,影像獲取主要從Google Earth等軟件中進(jìn)行截取,將該區(qū)域的寬幅影像裁切為512×512的標(biāo)準(zhǔn)影像塊并自行標(biāo)注,總共包括500余幅影像塊,其中訓(xùn)練集與測試集比為5∶2,影像空間分辨率為10 m。該區(qū)域地物類型主要包括耕地與城鎮(zhèn)區(qū)域。
本文實(shí)驗(yàn)中設(shè)置學(xué)習(xí)速率的初始值為0.000 1,隨著訓(xùn)練誤差的變化趨勢動(dòng)態(tài)調(diào)整學(xué)習(xí)速率。由于全卷積網(wǎng)絡(luò)內(nèi)存占用率較高,實(shí)驗(yàn)中將樣本集設(shè)置為小樣本集batch_size為10個(gè)樣本進(jìn)行分批訓(xùn)練。由于本次實(shí)驗(yàn)為二分類,隨著迭代次數(shù)增加準(zhǔn)確率逐漸上升同時(shí)容易產(chǎn)生過擬合,實(shí)際應(yīng)用中應(yīng)酌情控制迭代次數(shù),本次實(shí)驗(yàn)準(zhǔn)確率與迭代次數(shù)關(guān)系如圖4所示。
圖4 耕地提取準(zhǔn)確率與迭代次數(shù)關(guān)系
由圖4可以看出,在訓(xùn)練集中,隨著迭代次數(shù)增加,準(zhǔn)確率不斷升高,而測試集中,當(dāng)?shù)螖?shù)超過20 000次后準(zhǔn)確率下降,表明此時(shí)模型已過擬合,因此實(shí)驗(yàn)選取20 000次迭代得到最終模型。
實(shí)驗(yàn)中對100余幅512×512影像作為測試樣本進(jìn)行測試。實(shí)驗(yàn)結(jié)果如表 1所示,可以看出耕地提取結(jié)果可達(dá)到98%以上,相比傳統(tǒng)方法85%左右的精度來說提升10%。除此之外,據(jù)統(tǒng)計(jì),人工目視判讀的平均精度為95%,本文方法已經(jīng)在一定程度上優(yōu)于人工判讀結(jié)果。變化檢測結(jié)果約95%,已達(dá)到實(shí)際應(yīng)用的標(biāo)準(zhǔn)。
表1 不同網(wǎng)絡(luò)輸入分類效果對比表
類別準(zhǔn)確率/%耕地提取結(jié)果98.02變化檢測結(jié)果94.52
本文軟件的實(shí)現(xiàn)采用Tensorflow架構(gòu)和Python腳本語言,硬件配置GPU采用NVIDIA Quadro P5000,內(nèi)存為48 GB?;谠撚布渲帽疚乃惴ㄟ\(yùn)行速率可達(dá)到0.2 s/幅(512×512尺度影像),10 000×10 000影像的處理時(shí)間約為30 s左右,相比于傳統(tǒng)人工方法接近6 h/景的處理時(shí)長,本技術(shù)在時(shí)效性上具有較大提升。
本文將全卷積深度神經(jīng)網(wǎng)絡(luò)與耕地范圍提取任務(wù)相結(jié)合,實(shí)現(xiàn)目前機(jī)器學(xué)習(xí)方法中最優(yōu)提取結(jié)果,隨后通過配準(zhǔn)、取差和后處理等方法提取不同時(shí)段變化區(qū)域,實(shí)現(xiàn)耕地范圍的自動(dòng)化變化檢測。此方法無論在準(zhǔn)確率還是在計(jì)算速率方面均具有較大優(yōu)勢,由此可見采用全卷積深度學(xué)習(xí)的變換檢測方法逐步取代人工目視判讀將成為今后的發(fā)展趨勢。
深度學(xué)習(xí)在遙感影像變化檢測領(lǐng)域具有較大潛力,但是作為一種新興的技術(shù),仍有很多工作需要研究,下一步,將研究除了耕地之外不同地物特性與不同深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)之間的關(guān)系進(jìn)而實(shí)現(xiàn)更高精度更多類別的耕地提取。除此之外,本文變化對比所采用的差值方法較為粗糙,后續(xù)將根據(jù)不同業(yè)務(wù)對象研究不同的對比方式進(jìn)而提高變化檢測精度。