吳家杰 黃霞 劉錕銘
(江西省煤田地質(zhì)局測(cè)繪大隊(duì) 江西南昌 330001)
為認(rèn)真貫徹落實(shí)習(xí)近平總書(shū)記關(guān)于農(nóng)村亂占耕地建房問(wèn)題的重要批示精神,牢牢守住耕地保護(hù)紅線,扎實(shí)做好農(nóng)村宅基地管理各項(xiàng)工作,落實(shí)國(guó)務(wù)院農(nóng)村亂占耕地建房問(wèn)題專項(xiàng)整治工作電視電話會(huì)議要求,各級(jí)政府積極響應(yīng)中央要求,組織大量人力物力全面查清農(nóng)村亂占耕地建房底數(shù)。
目前,查清亂占耕地建房底數(shù),主要從影像中提取疑似違法圖斑,將第三次國(guó)土調(diào)查初始調(diào)查成果和2009 年第二次土地調(diào)查成果進(jìn)行疊加,提取農(nóng)村建房占用耕地的地塊范圍,將地塊范圍疊加影像去實(shí)地調(diào)查,從而獲取亂占耕地建房底數(shù)及相關(guān)信息。主要做法是通過(guò)高分辨率遙感影像判讀,以宗為單位,人工提取疑似占用耕地的農(nóng)村建房宗地圖斑,并編制外業(yè)調(diào)查地圖。
面對(duì)海量數(shù)據(jù),人工判讀存在效率低、漏提取等問(wèn)題。為了快速準(zhǔn)確地提取疑似違法圖斑,本文采用遷移學(xué)習(xí)法快速自動(dòng)提取疑似違法圖斑,具體流程如圖1 所示,影像通過(guò)幾何校正、影像配準(zhǔn)、畸變差校正、勻光勻色和影像拼接處理后,通過(guò)特征學(xué)習(xí),訓(xùn)練影像,制作建筑物樣本庫(kù),通過(guò)ImageNet 樣本庫(kù),利用遷移學(xué)習(xí)法構(gòu)建建筑物解譯模型,最后進(jìn)行建筑物檢測(cè)、標(biāo)記位置信息,輸出疑似違法圖斑。
圖1 農(nóng)村亂占耕地建房疑似違法圖斑自動(dòng)提取流程
遷移學(xué)習(xí)(Transfer Learning)指的是將一個(gè)場(chǎng)景學(xué)到的內(nèi)容應(yīng)用到另外一個(gè)場(chǎng)景中。在遷移學(xué)習(xí)中,學(xué)習(xí)器必須執(zhí)行兩個(gè)或兩個(gè)以上不同任務(wù)。遷移學(xué)習(xí)模型具有較強(qiáng)的表達(dá)能力,是深度學(xué)習(xí)的一種,它可以采用遷移已有知識(shí)來(lái)解決目標(biāo)領(lǐng)域中僅有少量甚至沒(méi)有標(biāo)簽樣本數(shù)據(jù)的問(wèn)題,隨著深度學(xué)習(xí)的發(fā)展,遷移學(xué)習(xí)也逐漸受到了關(guān)注[1]。
傳統(tǒng)機(jī)器學(xué)習(xí)需要足夠多的樣本數(shù)據(jù)進(jìn)行訓(xùn)練,學(xué)習(xí)結(jié)果會(huì)更優(yōu),且在新的領(lǐng)域,樣本數(shù)據(jù)的學(xué)習(xí)也十分昂貴。例如在圖像識(shí)別中,如果要對(duì)圖像進(jìn)行分類識(shí)別,就需要標(biāo)注與訓(xùn)練大量的圖像數(shù)據(jù),并將標(biāo)注與訓(xùn)練結(jié)果輸入機(jī)器學(xué)習(xí)算法中實(shí)現(xiàn)圖像分類,期間耗費(fèi)大量的人力物力。如果樣本不足,訓(xùn)練的特征子集或分類器就很難實(shí)現(xiàn)準(zhǔn)確分類。遷移學(xué)習(xí)的目標(biāo)是將一個(gè)現(xiàn)有環(huán)境中學(xué)到的知識(shí)幫助未知新環(huán)境中的任務(wù)學(xué)習(xí),該方式不需要訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)具有嚴(yán)格假設(shè)的同分布[2-3]。通過(guò)在已有分類數(shù)據(jù)集中預(yù)訓(xùn)練模型,通過(guò)移除預(yù)訓(xùn)練模型頂層神經(jīng)網(wǎng)絡(luò),再用目標(biāo)任務(wù)數(shù)據(jù)集重新訓(xùn)練一個(gè)輸出層,獲得新類別的權(quán)重,就可以獲得一個(gè)適用于目標(biāo)任務(wù)的分類模型,該方法可以縮短模型訓(xùn)練時(shí)間,提高工作效率[4]。
目前圖像識(shí)別領(lǐng)域最大的標(biāo)注圖像庫(kù)是由斯坦福大學(xué)制作完成的ImageNet 庫(kù),包含了1500 多萬(wàn)張帶標(biāo)簽的高分辨率圖像和百萬(wàn)級(jí)別的標(biāo)注圖像,劃分了兩萬(wàn)多個(gè)類別,是目前使用頻率最高的標(biāo)注圖像庫(kù)之一。本文的遷移學(xué)習(xí)法就是在ImageNet 庫(kù)上學(xué)習(xí)圖像特征提取方法,通過(guò)遷移學(xué)習(xí)機(jī)制,生成建筑物訓(xùn)練模型。
遷移學(xué)習(xí)支持下的農(nóng)村亂占耕地建房疑似違法圖斑提取方法需要構(gòu)建建筑物解譯模型框架,如圖2 所示。其中源任務(wù)是傳統(tǒng)的深度學(xué)習(xí)場(chǎng)景分類,通過(guò)源任務(wù)的網(wǎng)絡(luò)參數(shù)轉(zhuǎn)移到目標(biāo)任務(wù)中,從而實(shí)現(xiàn)建筑物分類模型的構(gòu)建。
圖2 遷移學(xué)習(xí)建筑物信息提取框架
在特征學(xué)習(xí)階段,采用的是加州大學(xué)伯克利分校計(jì)算機(jī)視覺(jué)研究小組預(yù)訓(xùn)練好的ImageNet 分類模型[5],包含了五層卷積層(卷積層和下采樣層)和三層全連接層。在特征遷移階段,利用建筑物特征樣本庫(kù)對(duì)特征學(xué)習(xí)階段的五層卷積層(卷積層和下采樣層)和三層全連接層的參數(shù)進(jìn)行調(diào)優(yōu)處理,通過(guò)網(wǎng)絡(luò)參數(shù)轉(zhuǎn)移,輸出代表建筑物特征的FC6 層,最后將調(diào)優(yōu)得到的特征作為機(jī)器學(xué)習(xí)的訓(xùn)練輸入,構(gòu)建建筑物解譯模型。
這里對(duì)建筑物解譯模型FC6 層輸出進(jìn)行了可視化,采用t-SNE (t-Distributed Stochastic Neighbor Embedding)數(shù)據(jù)降維方法[6]將高維數(shù)據(jù)在二維空間上進(jìn)行了展示。如圖3 所示為t-SNE 可視化結(jié)果。
圖3 t-SNE 可視化
以江西省某縣為例,采用0.2 米最新遙感影像,將影像套合本縣耕地范圍后,選取30 平方公里大小區(qū)域作為試驗(yàn)區(qū),利用本文方法提取農(nóng)村亂占耕地建房疑似違法圖斑。圖4 是提取出的疑似違法圖斑,試驗(yàn)區(qū)域共提取132 個(gè)圖斑。
圖4 圖斑提取結(jié)果
將疑似圖斑以行政村為單位進(jìn)行外業(yè)測(cè)量調(diào)查,將疑似圖斑矢量圖導(dǎo)入作業(yè)平板,使用平板設(shè)備對(duì)內(nèi)業(yè)提取的疑似農(nóng)村占用耕地建房宗地,進(jìn)行逐宗地外業(yè)核實(shí),根據(jù)房屋類型,填寫(xiě)農(nóng)村亂占耕地建房問(wèn)題摸排信息采集表,調(diào)查每宗地的使用人、戶籍情況、實(shí)際用途、占地面積、占用耕地面積、建房時(shí)間、建筑層數(shù)、不動(dòng)產(chǎn)登記發(fā)證情況、用地審批情況、符合規(guī)劃情況、“一戶一宅”情況、“一戶多宅”等信息,同時(shí)使用調(diào)查軟件拍攝帶位置坐標(biāo)的實(shí)地照片。在外業(yè)核實(shí)情況的基礎(chǔ)上,對(duì)農(nóng)村占用耕地建房的情況進(jìn)行分門別類,形成“一宗一臺(tái)賬”的臺(tái)賬記錄,并建立集圖形、屬性、電子檔案為一體的亂占耕地調(diào)查數(shù)據(jù)庫(kù)和管理系統(tǒng),為落實(shí)耕地保護(hù)責(zé)任目標(biāo),下一步做好農(nóng)村宅基地管理工作奠定基礎(chǔ)。
為了評(píng)定本文方法的準(zhǔn)確性,將提取結(jié)果與人工提取結(jié)果進(jìn)行對(duì)比,從表1 可以看出,遷移學(xué)習(xí)法自動(dòng)提取圖斑準(zhǔn)確率達(dá)到94.69%,可以較準(zhǔn)確地提取出疑似違法圖斑,提取出的非建筑物主要是水工建筑、曬谷場(chǎng)、破損房屋等。在精度可以保證的情況下,遷移學(xué)習(xí)法能夠快速自動(dòng)地提取出疑似圖斑,節(jié)省了大量人力物力,具有較高的推廣性。
表1 遷移學(xué)習(xí)法與人工提取法對(duì)比分析
通過(guò)實(shí)驗(yàn)證明,遷移學(xué)習(xí)支持下的農(nóng)村亂占耕地建房疑似違法圖斑提取方法具有快速、準(zhǔn)確等優(yōu)點(diǎn),可節(jié)省大量的人力物力,能實(shí)現(xiàn)較大范圍的房屋自動(dòng)化提取,快速準(zhǔn)確地提取出疑似違法圖斑,為政府決策提供依據(jù)。同時(shí),該方法具有較強(qiáng)的可移植性,可應(yīng)用于汽車違章違法統(tǒng)計(jì)、水土流失自然災(zāi)害動(dòng)態(tài)監(jiān)測(cè)和礦區(qū)生態(tài)恢復(fù)監(jiān)測(cè)等。