麻連偉,寧衛(wèi)遠(yuǎn),焦利偉,薛帥棟
(1.河南省地球物理空間信息研究院,河南 鄭州 450009; 2.河南省地質(zhì)物探工程技術(shù)研究中心,河南 鄭州 450009)
為響應(yīng)自然資源部關(guān)于建立對(duì)各類違規(guī)或突發(fā)問(wèn)題的實(shí)時(shí)發(fā)現(xiàn)機(jī)制,緊緊圍繞“實(shí)時(shí)發(fā)現(xiàn)”的總體建設(shè)目標(biāo),基于人工智能、大數(shù)據(jù)等先進(jìn)技術(shù),亟需開(kāi)展研究一種提高自然資源動(dòng)態(tài)監(jiān)測(cè)效率的方法?,F(xiàn)階段,隨著社會(huì)和經(jīng)濟(jì)的高速發(fā)展,不論是自然現(xiàn)象,還是人類活動(dòng),時(shí)時(shí)刻刻都對(duì)地球表面產(chǎn)生不斷的影響,動(dòng)態(tài)、高效、精確的提取地球表面的變化信息對(duì)于生態(tài)環(huán)境修復(fù)和保護(hù)、自然資源長(zhǎng)效監(jiān)管、社會(huì)經(jīng)濟(jì)蓬勃發(fā)展,以及各類數(shù)據(jù)的更新維護(hù),均有非凡的意義[1-2]。然而,在目前的自然資源監(jiān)管中,比較常規(guī)的方法仍是通過(guò)人工目視解譯,勾畫出變化圖斑,然后進(jìn)行后續(xù)工作。這些傳統(tǒng)方法不僅耗時(shí)、耗力,而且滿足不了各類違規(guī)行為的及時(shí)發(fā)現(xiàn),監(jiān)管總是滯后。因此,注重精度的同時(shí),研究提高變化檢測(cè)的效率已經(jīng)迫在眉睫[2]。如今,人工智能、大數(shù)據(jù)等先進(jìn)技術(shù)隨著海量數(shù)據(jù)的增長(zhǎng)、計(jì)算機(jī)硬件設(shè)備的提高,深度學(xué)習(xí)迅速成為了一種高效且精確的方法,基于深度學(xué)習(xí)方法進(jìn)行遙感影像的變化信息提取也成為目前研究的重點(diǎn)方向[3]。
目前遙感影像傳統(tǒng)的變化檢測(cè)技術(shù)體系中有兩大類比較常用,分別是基于影像直接比對(duì)的方法和先分類后對(duì)比的方法?;谟跋裰苯颖葘?duì)的方法是利用像素之間的差異性得到變化區(qū)域的范圍,是在像素這一層級(jí)上,不能獲得變化像素的屬性信息。而且,由于噪聲的干擾使得精準(zhǔn)范圍線的提取成為了難點(diǎn)。先分類后對(duì)比的方法是基于對(duì)象級(jí)的變化信息提取方法,由于這是在對(duì)象這一層級(jí)上。因此,不僅可以得到變化區(qū)域的范圍,而且還可以得到該變化區(qū)域的屬性信息。另外,該方法可以抵抗一定的影像噪聲[4]。Hinton等[5]于2006年提出深度學(xué)習(xí)方法后,沉寂多年的深度學(xué)習(xí)方法再次因?yàn)槠鋬?yōu)秀的性能為大眾所熟知,直至今天一直有學(xué)者進(jìn)行不斷的研究,拓展到了各行各業(yè)3[6]。隨著海量數(shù)據(jù)的增長(zhǎng)和計(jì)算機(jī)硬件設(shè)備的提高,神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)方法在遙感影像的像素級(jí)變化檢測(cè)中也有著不俗的表現(xiàn)。徐真等[7]利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對(duì)SAR圖像進(jìn)行變化檢測(cè),取得了不錯(cuò)的效果。張?chǎng)锡埖萚8-9]將神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)方法引入到了高分辨率遙感影像中,驗(yàn)證了該方法的有效性。李進(jìn)[10]更加深入的研究了各種深度學(xué)習(xí)網(wǎng)絡(luò)模型,如高斯金字塔等,提升了神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)方法的變化提取的精度。王慶[11]結(jié)合傳統(tǒng)方法和深度學(xué)習(xí)方法,綜合兩者各自的優(yōu)勢(shì),分別對(duì)面向像元、面向?qū)ο蠛兔嫦騾^(qū)域進(jìn)行了非常細(xì)致的研究。
總的來(lái)說(shuō),這些學(xué)者推進(jìn)先進(jìn)技術(shù)應(yīng)用到傳統(tǒng)領(lǐng)域邁出了堅(jiān)實(shí)的一步,但是大多數(shù)研究還停留在理論層面,本文主要是結(jié)合實(shí)際工程項(xiàng)目,基于深度學(xué)習(xí)方法,提出一種基于Pytorch深度學(xué)習(xí)平臺(tái)實(shí)現(xiàn)U-Net神經(jīng)網(wǎng)絡(luò)進(jìn)行遙感影像變化檢測(cè)的方法,探索深度學(xué)習(xí)在實(shí)際應(yīng)用中的可行性。本文選擇了一種典型的地物—水體進(jìn)行試驗(yàn),首先,制作水體樣本;其次,對(duì)樣本數(shù)據(jù)進(jìn)行清洗,并以最終清洗后的樣本訓(xùn)練出精度較好的水體提取模型;然后,利用該模型對(duì)試驗(yàn)區(qū)前后時(shí)相影像進(jìn)行水體提取,再通過(guò)分類后比較法得到前后時(shí)相分類后的遙感影像變化檢測(cè)結(jié)果;最后,通過(guò)對(duì)比基于支持向量機(jī)(SVM)的分類后比較法后發(fā)現(xiàn),相比傳統(tǒng)方法精度有所提升,說(shuō)明本文方法進(jìn)行變化檢測(cè)有一定的可用性。
Hinton等[5]于2006年發(fā)表了利用RBM編碼的深層神經(jīng)網(wǎng)絡(luò),在特征提取方面表現(xiàn)優(yōu)異,它可以通過(guò)大數(shù)據(jù)分析的方法,自動(dòng)提取影像的代表特征,而傳統(tǒng)的特征提取方法大多只能對(duì)特定的影像有比較好的提取效果和精度。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖 1所示。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)方法的一種,其權(quán)值共享的網(wǎng)絡(luò)結(jié)構(gòu)明顯降低了模型的復(fù)雜度,減少了權(quán)值數(shù)量,可以直接將圖片作為網(wǎng)絡(luò)的輸入,自動(dòng)提取特征,并且對(duì)圖片的變形具有高度不變形。神經(jīng)網(wǎng)絡(luò)的基本組成包括輸入層、隱藏層、輸出層,卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)在于隱藏層分為卷積層和池化層,卷積層通過(guò)一塊塊卷積核在原始圖像上平移來(lái)提取特征[12]。
圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure diagram of CNN
Ronneberger等[6]提出U-Net神經(jīng)網(wǎng)絡(luò)模型,從此成為深度學(xué)習(xí)中非常重要的語(yǔ)義分割模型。U-Net網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 U-Net網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure diagram of U-Net network
它是一個(gè)非常對(duì)稱的結(jié)構(gòu),類似U形。因此,命名為U-Net。其網(wǎng)絡(luò)結(jié)構(gòu)由2部分組成:左半部分為下采樣和右半部分為上采樣。下采樣對(duì)輸入的影像進(jìn)行卷積和池化操作,主要是用來(lái)得到更多的信息。上采樣則是為了對(duì)圖片中所需要分割出來(lái)的部分進(jìn)行精準(zhǔn)定位。對(duì)影像進(jìn)行反卷積和上采樣操作,最后得到與輸入影像尺寸相同的影像輸出[13-15]。
本文選擇泌陽(yáng)縣范圍內(nèi)一塊比較有代表性的區(qū)域作為試驗(yàn)區(qū),來(lái)研究水體變化檢測(cè)的可行性。其中,泌陽(yáng)縣位于河南省駐馬店市西南區(qū)域,縣域內(nèi)有平原、丘陵、山地等地貌類型,森林資源、水資源豐富,礦產(chǎn)資源種類多、儲(chǔ)量大,其區(qū)域情況能夠體現(xiàn)河南省整體特征[14]。本文試驗(yàn)采用的數(shù)據(jù)是2017—2019年的2期多源遙感影像,投影坐標(biāo)系為高斯—克呂格3度分帶,帶號(hào)為38,分辨率為1 m。試驗(yàn)區(qū)域大小均為2 000×3 000像素,如圖 3所示。
圖3 試驗(yàn)數(shù)據(jù)展示Fig.3 Image data of test
本文結(jié)合實(shí)際工程項(xiàng)目,基于深度學(xué)習(xí)方法,提出一種基于Pytorch深度學(xué)習(xí)平臺(tái)實(shí)現(xiàn)U-Net神經(jīng)網(wǎng)絡(luò)進(jìn)行遙感影像變化檢測(cè)的方法。該方法主要有以下6個(gè)步驟:配準(zhǔn)影像、制作樣本、網(wǎng)絡(luò)訓(xùn)練與試驗(yàn)、數(shù)據(jù)清洗、分類后變化檢測(cè)、精度評(píng)價(jià)。詳細(xì)的技術(shù)路線如圖 4所示。
圖4 技術(shù)路線Fig.4 Technical routes
以泌陽(yáng)縣除試驗(yàn)區(qū)以外的其他區(qū)域作為水體樣本的制作范圍,人工勾畫標(biāo)記出水體的位置。勾畫完成的標(biāo)記圖經(jīng)矢量柵格化處理后,標(biāo)記圖中水體的像素值為1,其他值為0,就形成了標(biāo)記柵格圖。為便于質(zhì)量檢查,將水體內(nèi)像素值為1的映射為藍(lán)色,其他值為0的映射為黑色,檢查合格后方可進(jìn)行小樣本的制作。最后,將影像數(shù)據(jù)與標(biāo)記圖同時(shí)分塊裁切為512×512像素大小的小樣本,方便用于深度學(xué)習(xí)深度學(xué)習(xí)訓(xùn)練。
實(shí)驗(yàn)基于 Windows 10專業(yè)版操作系統(tǒng)配置Pytorch深度學(xué)習(xí)平臺(tái),利用2塊顯存為24 GB的英偉達(dá)顯卡并行處理。樣本的數(shù)據(jù)為4 000張小圖,寬和高均為512像素,試驗(yàn)過(guò)程中,樣本進(jìn)行了數(shù)據(jù)增強(qiáng)操作。訓(xùn)練過(guò)程中,采用2.5×10-4的學(xué)習(xí)率,每次迭代處理16張圖片,共迭代25 000次,以最佳結(jié)果保存模型。
深度學(xué)習(xí)模型較好的性能取決于樣本庫(kù)的質(zhì)量。樣本庫(kù)的質(zhì)量越好,神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練越快、精度越高。本文數(shù)據(jù)清洗主要針對(duì)樣本庫(kù),思路:①先利用初始未經(jīng)過(guò)清理的樣本,訓(xùn)練一個(gè)初始模型;②利用該初始模型,對(duì)所有的初始未經(jīng)過(guò)清理的樣本進(jìn)行評(píng)價(jià);③對(duì)評(píng)分較低的單個(gè)樣本,處理方法是直接剔除和修正錯(cuò)誤標(biāo)記;④按照前3步,再重新處理2次,或者繼續(xù)循環(huán)得到理想的結(jié)果為止。
為客觀公正的評(píng)價(jià)本文方法的效果,本文采用2種精度評(píng)價(jià)的指標(biāo),分別為總體精度(OA)和卡帕系數(shù)(Kappa)??傮w精度(OA)是神經(jīng)網(wǎng)絡(luò)模型在所有測(cè)試集上預(yù)測(cè)正確的個(gè)數(shù)與總體數(shù)量之間的比值,數(shù)學(xué)公式如下:
(1)
式中,xii為分類正確的樣本數(shù);N為所有樣本數(shù)。
卡帕系數(shù)(Kappa)是評(píng)價(jià)模型預(yù)測(cè)結(jié)果多大程度上符合真實(shí)參考值,數(shù)學(xué)公式如下:
(2)
式中,N為像元總數(shù);xii為混淆矩陣對(duì)角線元素;xi+和x+i分別為混淆矩陣各行、各列的和。
利用數(shù)據(jù)清洗后的最終樣本對(duì)U-Net神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到最優(yōu)的模型情況如下:樣本訓(xùn)練損失值為0.014、精度為93.7%;同時(shí)驗(yàn)證集的損失值為0.017、精度為94.7%。這些數(shù)據(jù)表明,通過(guò)數(shù)據(jù)清洗后的樣本庫(kù)的質(zhì)量較好,數(shù)據(jù)一致性較好;模型的訓(xùn)練也比較充分,基本達(dá)到了最優(yōu)解。
分別利用支持向量機(jī)(SVM)先分類后變化檢測(cè)方法、本文方法對(duì)泌陽(yáng)縣試驗(yàn)區(qū)進(jìn)行變化提取后的結(jié)果(圖5)可以看出,基于SVM的先分類后比較法的提取結(jié)果中,雖然主體的變化信息已經(jīng)提取出來(lái),但是還有一些地方,比如左上部分存在錯(cuò)提,右下部分存在漏提,而且整體上有比較大的噪聲點(diǎn)。通過(guò)分析發(fā)現(xiàn),基于SVM的先分類后比較法容易將深色的耕地、林地、陰影等與水體光譜特征相似的區(qū)域誤提為水體導(dǎo)致誤檢,而采用深度學(xué)習(xí)的方法則能夠有效避免耕地、林地和其他陰影造成的影響,提取到的水體變化信息范圍更精準(zhǔn)且沒(méi)有噪聲點(diǎn)。
圖5 不同水體變化檢測(cè)方法結(jié)果Fig.5 Result of different methods of water body change detection
為便于精度計(jì)算,首先利用預(yù)測(cè)圖像和真實(shí)值圖像計(jì)算出混淆矩陣;然后通過(guò)混淆矩陣,計(jì)算出總體精度和卡帕系數(shù)。SVM先分類后變化檢測(cè)方法,與本文方法精度評(píng)定結(jié)果見(jiàn)表1。前者總體精度為96.47%,卡帕系數(shù)為0.85;本文方法總體精度為97.06%,卡帕系數(shù)為0.88。相比傳統(tǒng)方法精度有所提升,說(shuō)明本文方法進(jìn)行變化檢測(cè)具有一定的可用性。
表1 2種方法的精度評(píng)定結(jié)果Tab.1 Result of precision of two methods
結(jié)合實(shí)際工作業(yè)務(wù),基于大數(shù)據(jù)分析與挖掘和人工智能等時(shí)下先進(jìn)的技術(shù),提出了一種基于深度學(xué)習(xí)的遙感影像變化檢測(cè)技術(shù),探討了先進(jìn)技術(shù)在實(shí)際應(yīng)用中的可行性。通過(guò)試驗(yàn)結(jié)果分析,本文方法相比傳統(tǒng)方法精度有所提升,驗(yàn)證了本文方法的有效性。但是,本文方法也存在一些不足之處:①本文方法的試驗(yàn)還不夠充分,還需要大量不同季節(jié)、不同地形數(shù)據(jù)的分析驗(yàn)證;②本文方法還有待提高,還有很多優(yōu)秀的神經(jīng)網(wǎng)絡(luò)模型,如Deeplab、PSPNet、SegNet等模型都可以進(jìn)行試驗(yàn),這些都可以作為以后的研究方向。