勞春華,林燕慧
(廣東工業(yè)大學 管理學院,廣州 510520)
隨著中國經(jīng)濟的高速發(fā)展以及政府在政策和資金上的支持,農(nóng)村住房的需求量和建設(shè)量開始不斷增大。2000—2020 年,廣東省農(nóng)村建設(shè)量增長迅速,平均每年增長16.569 萬戶,其中2019 和2020年的增長速度較快,高于平均水平的75.38%和65.25% (《廣東農(nóng)村統(tǒng)計年鑒》編輯委員會,2021)。當前,由于中國的農(nóng)村村莊規(guī)劃指導(dǎo)性較弱,大部分農(nóng)村住房仍處于一種無規(guī)劃的自發(fā)性建設(shè)狀態(tài),建設(shè)隨意性較大(王晶 等,2016;胡典雄,2018)。農(nóng)民盲目占用耕地資源新建住房,導(dǎo)致大量耕地面積被占用,耕地總量明顯下降,農(nóng)村住房建設(shè)的無序擴張與耕地占用是對耕地資源的嚴重浪費(趙其國 等,2006)。作為人均耕地面積不足世界平均水平40%的人口第一大國,當前迫切需要進行農(nóng)村住房監(jiān)測以減少耕地占用現(xiàn)象,并促進農(nóng)村住房集約利用,這對中國耕地資源的可持續(xù)性發(fā)展和糧食安全具有重要意義。
中國當前農(nóng)村住房監(jiān)測的主要手段是全國土地調(diào)查,傳統(tǒng)的數(shù)據(jù)獲取方法以人工實地測繪及地方上報等方式為主,這種方式因為工作量大而耗費大量的人力與時間,導(dǎo)致巡查效率較低、難以滿足即時性需求(武東海 等,2018)。并且由于專業(yè)素養(yǎng)和主觀認知的差異,所獲取的建筑物數(shù)據(jù)質(zhì)量不一,還容易漏檢,其信息真?zhèn)涡院蛯嵭缘貌坏奖U?。如果在調(diào)查過程中遇到疫情、惡劣天氣、交通狀況、當?shù)貙嶋H情況等不可抗拒力因素的影響,巡查的可靠性也難以得到保障。
近年來,深度學習技術(shù)迅猛發(fā)展,在多個領(lǐng)域均取得良好的應(yīng)用效果,如人臉識別、語音識別、目標識別、自動駕駛、機器翻譯、圖像識別及分類等(張?zhí)栧?等,2018;林倩 等,2019;鄭遠攀 等,2019;劉娟宏 等,2020;賀豐收 等,2020;朱向雷 等,2021;余璀璨 等,2021),為農(nóng)村住房識別提供新的思路。農(nóng)村住房識別的本質(zhì)是圖像分類問題,可以通過學習大量的樣本數(shù)據(jù)對圖形進行特征提取,從而智能化地得到農(nóng)村住房識別結(jié)果。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)是一種典型的深度學習圖像分類算法,一般由一個或多個卷積層、池化層以及全連接層組成,其提取的效果更勝于傳統(tǒng)人工特征與傳統(tǒng)淺層分類器,是遙感地類目標檢測、圖像分類與識別、圖像分割等領(lǐng)域的研究熱點(張慧 等,2017)。
卷積神經(jīng)網(wǎng)絡(luò)在圖像識別中常用的模型有AlexNet (Abdel-rahman et al., 2011)、 VGGNet(Karen et al., 2014)、GoogleNet (Szegedy et al.,2015)、 ResNet (He et al., 2016)、 MobileNet(Howard et al., 2017)等。其中,AlexNet網(wǎng)絡(luò)最早用于數(shù)字識別,其優(yōu)點是使用ReLU 作為激活函數(shù)從而加快收斂速度,使用dropout 避免過擬合,使用data augmentation擴增數(shù)據(jù)集,缺點是參數(shù)過多,計算量較大;VGGNet網(wǎng)絡(luò)的優(yōu)點是結(jié)構(gòu)非常簡潔,通過不斷加深網(wǎng)絡(luò)結(jié)構(gòu)提升其自身性能,缺點是需要耗費較多計算資源,并且比較占內(nèi)存;GoogleNet網(wǎng)絡(luò)的優(yōu)點是模型既準又輕,用GAP 代替全連接層,在便于遷移學習的同時提高準確率,缺點是網(wǎng)絡(luò)不夠深、遷移能力不足;ResNet是2015年ImageNet競賽的冠軍,優(yōu)點是可有效解決深度學習神經(jīng)網(wǎng)絡(luò)難以訓練的問題,缺點是ResNet前后層之間的短接沒有很好的復(fù)用各層之間的特征圖,因此導(dǎo)致模型隨著層數(shù)的增加,參數(shù)量也快速增加;MobileNet 是典型的輕量化網(wǎng)絡(luò),被廣泛應(yīng)用于工業(yè)界。2017 年推出的MobileNetV1(Howard et al.,2017)卷積神經(jīng)網(wǎng)絡(luò),以深度可分離卷積替換標準卷積的方式降低網(wǎng)絡(luò)結(jié)構(gòu)的大小及計算復(fù)雜度,并在略微降低精度的情況下大幅度減小模型的運算量,降低對用戶硬件環(huán)境的要求,從而提升用戶體驗、提高訪問的靈活性。其不足是在訓練過程中深度可分離卷積的參數(shù)值為0,導(dǎo)致訓練結(jié)果不理想。而MobileNetV2(Sandler et al., 2018)網(wǎng)絡(luò)在MobileNetV1的基礎(chǔ)上進行改進,新增層之間的線性瓶頸、瓶頸之間的連接捷徑功能,具有體積小、計算量少、速度高及準確率高等特點。一些學者采用MobileNetV2 對遙感影像的建筑物進行提取,如王華俊等(2022)提出使用輕量級網(wǎng)絡(luò)MobileNetV2替換DeepLabv3+的主干網(wǎng)絡(luò)Xception 的方法,該方法不僅減少參數(shù)量和訓練時間,而且有效提高建筑物的提取精度。許博鳴等(2019)通過Keras 框架獲取MobileNet 瓶頸層并進行遷移學習從而實現(xiàn)建筑物識別,該模型具有較高識別率且降低模型權(quán)重空間的優(yōu)點。于坤等(2021)將MobileNet 和Unet耦合,解決了建筑物特征提取過程中低維信息丟失,邊緣提取效果不佳等問題,在視覺效果上表現(xiàn)優(yōu)異。綜上,MobileNetV2 是對目標檢測和分割的有效特征提取器,同時是一個高效的移動端模型。構(gòu)建基于MobileNetV2的農(nóng)村住房識別模型并開發(fā)基于該模型的桌面端和移動端應(yīng)用,能夠極大提升農(nóng)村住房監(jiān)測的內(nèi)業(yè)處理與外業(yè)巡查效率與智能化水平,具有重要的應(yīng)用價值,因此本文選用該模型從高分辨率遙感影像自動提取農(nóng)村住房。
美國地理學家W R Tobler在1970年提出地理學第一定律(Tobler, 1970),該定律指出“任何事物都相關(guān),只是相近的事物關(guān)聯(lián)更緊密”,即地理事物或?qū)傩栽诳臻g分布上互為相關(guān)(李小文 等,2007)。因此中國的農(nóng)村住房也具有空間相關(guān)性(李郇 等,2022),利用MobileNetV2模型識別農(nóng)村住房區(qū)域時,有可能會出現(xiàn)漏提現(xiàn)象,導(dǎo)致提取結(jié)果的形態(tài)相對破碎,因此需采用新的方法改善。數(shù)學形態(tài)學是一門建立在格論和拓撲學基礎(chǔ)上、以形態(tài)結(jié)構(gòu)元素為基礎(chǔ)對圖像進行分析的數(shù)學工具(陳晨 等,2019),數(shù)學形態(tài)學檢測中最基本的形態(tài)算符包括膨脹算符、腐蝕算符。膨脹和腐蝕(鄧仕超等,2017)是灰度圖像的初等形態(tài)運算,其作用是消除噪聲、分割出獨立的圖像元素或在圖像中連接相鄰的元素,尋找圖像的明顯極大值區(qū)域或極小值區(qū)域、求出圖像的梯度等。因此,可將數(shù)學形態(tài)學上的膨脹腐蝕方法作為補充,根據(jù)中國農(nóng)村住房的空間相關(guān)性,將農(nóng)村住房識別結(jié)果進行像素分割或像素連接,彌補部分深度學習識別錯誤的情況。
因此,本文基于高分辨率遙感影像數(shù)據(jù),耦合MobileNetV2 和數(shù)學形態(tài)學方法,以茂名市為例,采集茂名市高分辨率遙感衛(wèi)星影像樣本庫進行訓練,得到一個基于深度學習的經(jīng)濟欠發(fā)達地區(qū)農(nóng)村住房智能識別模型(MobileNet-MM)。以期為中國農(nóng)村住房監(jiān)測提供技術(shù)支持。
為了最大程度降低模型訓練成本,使其適用于移動端等輕量工業(yè)化業(yè)務(wù)應(yīng)用場景,谷歌團隊開發(fā)了MobileNet 網(wǎng) 絡(luò) 模 型。2018 年,Mark Sandler 對MobileNetV1 進行改進并提出MobileNetV2 模型,MobileNetV2 引入具有線性瓶頸的倒置殘差模塊(Sandler et al., 2018),借 鑒 了MobileNetV1 和ResNet的優(yōu)點,依然保持良好的計算速度和較小的存儲需求,不僅在MobileNetV1深度可分離卷積的基礎(chǔ)上加入多個逐點卷積,并且借鑒ResNet網(wǎng)絡(luò)結(jié)構(gòu),提升網(wǎng)絡(luò)結(jié)構(gòu)性能并降低計算復(fù)雜度。但存在兩點不足:一是參數(shù)調(diào)節(jié)問題,二是依賴于優(yōu)化策略。其網(wǎng)絡(luò)結(jié)構(gòu)如表1所示。
表1 MobileNet V2網(wǎng)絡(luò)結(jié)構(gòu)Table 1 MobileNet V2 network structure
MobileNetV2神經(jīng)網(wǎng)絡(luò)是深度可分離卷積網(wǎng)絡(luò),首先用1×1 卷積過ReLU 提升通道數(shù),再用Depthwise的3×3空間卷積過ReLU進行卷積,最后用1×1卷積過ReLU 恢復(fù)通道,并和輸入相加(圖1)。MobileNetV2 具有參數(shù)數(shù)目較少、效率更優(yōu)、硬件要求更低的特點,適用于農(nóng)村住房識別研究。
圖1 MobileNet V2結(jié)構(gòu)單元示意Fig.1 Structural units of MobileNet V2
馬瑟榮(Ripley et al., 1975) 和賽拉(Serra,1986) 將數(shù)學形態(tài)學(mathematics morphology)引入圖像處理領(lǐng)域。數(shù)學形態(tài)學由膨脹、腐蝕、開運算和閉運算構(gòu)成。膨脹(dilation)是使物體邊界擴張的過程,而腐蝕(erosion)的作用則與膨脹相反,其概念是縮小圖像,去除小溝壑細節(jié)的一種操作。在圖像處理過程中,兩者經(jīng)常被混合使用,形成開運算與閉運算。開運算指先腐蝕后膨脹,即先消除細點處的分離物體,繼而平滑較大的物體邊界。相反,閉運算則是先膨脹后腐蝕,即先將圖像的細小空洞進行填空,再抑制比結(jié)構(gòu)元小的暗細節(jié)。膨脹和腐蝕的目的是消除噪聲,在進行膨脹腐蝕操作前需先定義一個卷積核,將卷積核與待測圖像進行卷積計算從而得到膨脹和腐蝕后的結(jié)果(圖2)。
圖2 表示結(jié)構(gòu)A 被卷積核腐蝕,移動結(jié)構(gòu)卷積核,如果卷積核能與結(jié)構(gòu)A完全重疊,則保留該位置點,最終得到結(jié)構(gòu)A的腐蝕結(jié)果(結(jié)構(gòu)B);卷積核在結(jié)構(gòu)B上進行卷積操作,移動卷積核,如果卷積核與結(jié)構(gòu)B 存在重疊區(qū)域,則記錄該區(qū)域位置,最終得到結(jié)構(gòu)B的膨脹結(jié)果(結(jié)構(gòu)C)。結(jié)構(gòu)C與結(jié)構(gòu)A 相比,去除了部分小地物,填充了部分小空洞。
圖2 腐蝕膨脹示意Fig.2 Corrosion expansion diagram
首先,構(gòu)建高分辨率遙感影像農(nóng)村住房樣本庫;然后,構(gòu)建農(nóng)村住房智能識別模型;最后,將該模型應(yīng)用于經(jīng)濟欠發(fā)達地區(qū)農(nóng)村住房自動提取。利用PaddlePaddle 人工智能基礎(chǔ)平臺,搭建耦合MobileNetV2 神經(jīng)網(wǎng)絡(luò)與數(shù)學形態(tài)方法的農(nóng)村住房圖像分類模型,技術(shù)路線如圖3所示。
圖3 農(nóng)村住房識別模型技術(shù)路線Fig.3 Technical route of rural housing identification model
為了充分利用高分辨率影像豐富的地物信息,并且取得與原影像一致的分辨率識別結(jié)果,采用逐點切割方式進行農(nóng)村住房識別。首先,從高分辨率衛(wèi)星遙感影像中獲取遙感數(shù)據(jù)并進行圖片處理、分割從而得到樣本庫;其次,運用MobileNetV2神經(jīng)網(wǎng)絡(luò)對收集的樣本庫進行訓練,得到經(jīng)濟欠發(fā)達地區(qū)農(nóng)村住房識別模型;然后,用生成的模型對遙感影像進行逐點化測試,并得到測試結(jié)果圖,逐點化是指以待測試圖的某點為中心,向四周取一個64×64像素大小的正方形,用生成的模型對正方形進行測試,并將測試結(jié)果作為該點的識別結(jié)果。其中,將返回結(jié)果為“農(nóng)村住房”的正方形地塊標記為“1”,剩余的其他地形結(jié)果標記為相應(yīng)的標簽(“2、3、4、5、6、7”),最后合并為標簽“0”,以此類推,得到逐點化后的結(jié)果圖;最后,對識別結(jié)果進行數(shù)學形態(tài)學的膨脹腐蝕處理,從而得到最終的農(nóng)村住房結(jié)果圖。
茂名市位于廣東省西南部,全市行政區(qū)域土地總面積11 427.63 km2,屬于經(jīng)濟欠發(fā)達城市?;浳鞯貐^(qū)的村域面積較大,各自然村之間的距離較遠,農(nóng)村住房分布較為松散;且農(nóng)村住房的空間布局隨意性較大,村內(nèi)巷道蜿蜒曲折,植被摻雜,巷道脈絡(luò)不清晰(譚慶揚 等,2018)。僅用農(nóng)村住房標簽與背景信息構(gòu)建模型,信息過于復(fù)雜,對模型效果影響較大。因此,給模型提供更為豐富的地物類別標簽,可降低模型構(gòu)建的難度,提高模型的訓練精度。為更好地識別農(nóng)村住房,在數(shù)據(jù)獲取過程中采集農(nóng)村住房、耕地、裸地、水體、植被5 類地形,并根據(jù)耕地的紋理細分成3種不同類型的耕地,將這7類地類按照數(shù)字“1~7”依次做好標簽,即:農(nóng)村住房(“1”)、耕地a (“2”)、耕地b(“3”)、耕地c(“4”)、裸地(“5”)、水體(“6”)、植被(“7”)。數(shù)據(jù)集中圖像均為RGB格式,分辨率為18級,即0.55 m分辨率。由于影像數(shù)據(jù)本身的分辨率、云層覆蓋等干擾因素的客觀存在,需對采集到的大地塊影像圖進行初步篩查,對由于數(shù)據(jù)源缺失而產(chǎn)生的不同時態(tài)不同分辨率影像相互“拼接”的低質(zhì)量遙感影像進行剔除。
初步篩選出的遙感影像形狀和尺寸大小各異,如果直接應(yīng)用于模型訓練,必然效果很差。為了便于存儲和切片,保證訓練的高效性與模型的有效性,需通過圖像分割進行再次精選,將每類地形的遙感影像分割為大小統(tǒng)一的規(guī)則小地塊。利用python 將上述7 類地物切割為64×64 像素的正方形小切片。最終收集的數(shù)據(jù)為每個地類的各1 000 張圖片,控制每一類型的圖片數(shù)量相等以提高訓練精度,總計7 000 張圖片。將數(shù)據(jù)集分為兩類:訓練集和驗證集。對于構(gòu)建的大數(shù)據(jù)樣本,隨機選擇80%的數(shù)據(jù)用于訓練模型。另外,20%用于驗證模型的有效性,即每個模型有5 600張訓練集,1 400張測試集。將處理好的圖像進行清洗、整理、人工篩選出高質(zhì)量的樣本數(shù)據(jù),并對數(shù)據(jù)進行歸類處理,將原標簽“農(nóng)村住房”歸類為“農(nóng)村住房”,標簽為1,將“耕地a、耕地b、耕地c、裸地、水體、植被”歸類為“非農(nóng)村住房”,分別將標簽設(shè)為2、3、4、5、6、7,從而構(gòu)建滿足人工智能學習的“農(nóng)村住房提取”樣本數(shù)據(jù)(圖4),為后續(xù)的模型訓練提供數(shù)據(jù)支撐。
圖4 樣本庫構(gòu)建流程Fig.4 Construction process of image sample database
在訓練開始前,需調(diào)整最佳訓練參數(shù),其中,初始學習率是對整個訓練過程影響比較大的參數(shù),學習速率過大會導(dǎo)致模型收斂程度差,學習速率過小又會導(dǎo)致訓練過程中耗時過長,本模型將學習率設(shè) 定 為0.002。 并 將“continue_train” 設(shè) 置 為“False”,表示在訓練時不使用預(yù)訓練模型。在不斷的摸索中最后確定訓練次數(shù)“num_epochs”設(shè)置為20 次,“good_acc1”設(shè)置為0.95,即當訓練精度連續(xù)20 次達到0.95 時結(jié)束訓練。采用64 位windows7系統(tǒng)作為測試環(huán)境,內(nèi)存為8GB,利用百度飛漿(PaddlePaddle)框架搭建CPU(酷睿I7 7700)環(huán)境測試平臺,模型訓練平均歷時20 min。此外,圖像增強可以達到提升模型泛化能力以及魯棒性的效果,因此,啟用圖像顏色增強、增加隨機角度以及增加水平隨機翻轉(zhuǎn)等措施。
選用經(jīng)濟欠發(fā)達地區(qū)(農(nóng)村)的高分辨率遙感地塊影像,并在圖中直接獲取地類數(shù)據(jù)進行模型訓練得到模型MobileNet-MM 1,識別結(jié)果見圖5,圖6為圖5的局部放大。為了驗證模型的穩(wěn)定性與泛化性,另選用5 張遙感地塊影像(圖7-a2~6)進行對比實驗,依次得到模型MobileNet-MM 2~6,將6個模型的訓練精度與測試精度進行匯總。由表2可知,模型的平均訓練精度為98.9%,將20%的數(shù)據(jù)集用于測試,得到的平均測試精度為98.2%,效果較理想。由于本文選擇的樣本為純地物樣本,且用地類型相對簡單,各類用地的特征差異明顯,在卷積神經(jīng)網(wǎng)絡(luò)下容易區(qū)分,所以部分模型訓練與測試精度達到100%是有可能的。將訓練的模型應(yīng)用于整幅影像,影像切片的類型大部分不是純地物,因此整體識別精度會下降,具體見表3所示。
表2 模型訓練精度與測試精度Table 2 Models' training accuracy and test accuracy %
表3 模型識別精度對比Table 3 Comparison of models' identification accuracy %
根據(jù)上述得到的6個模型分別提取對應(yīng)遙感影像的農(nóng)村住房。以MobileNet-MM 1 為例,采用訓練好的MobileNet-MM 1 對1 號遙感影像(圖5-a)進行農(nóng)村識別,識別結(jié)果如圖5-b 所示,最終得到MobileNet-MM 1的識別精度為86.0%(見表3)。為驗證MobileNet-MM 模型對農(nóng)村住房的識別效果,利用ResNet34模型對同樣的樣本庫進行訓練。為使對比更具說服力,控制兩類模型的參數(shù)變量,在控制逐點切割步長(均設(shè)置為5)不變的情況下,將2個模型的訓練次數(shù)“num_epochs”設(shè)置為20 次,“good_acc1”設(shè)置為0.95。并將ResNet34模型批量大小“batch_size”的值設(shè)置為8。經(jīng)過訓練,得到ResNet34模型的農(nóng)村住房識別結(jié)果,將人工識別結(jié)果與ResNet34 模型識別結(jié)果疊加,計算得出ResNet34 模型的農(nóng)村住房識別精度為71.6%,兩類模型的精度對比結(jié)果如圖5所示。
為分析MobileNet-MM 1 模型與ResNet34 模型識別效果差異,將圖5-d、e 與f 的識別結(jié)果局部放大,如圖6所示。
圖6 中,圖6-b、c、d 分別是圖5-e、f、d 的局部放大圖。區(qū)域1~3中,ResNet34模型漏識的農(nóng)村住房區(qū)域面積較大,主要分布在區(qū)域的邊緣,而MobileNet-MM 1 模型正確識別的面積較多,漏識的面積較小,漏識區(qū)域分布較為分散。區(qū)域2 中,ResNet34模型將耕地、植被誤判為農(nóng)村住房,對于農(nóng)村住房的提取效果偏弱;而MobileNet-MM 1 模型對地類邊界的提取效果更精細,對農(nóng)村住房輪廓的識別效果更好。MobileNet-MM 1 的識別精度達到86%,而ResNet34模型僅為71.6%。從提取精度和空間分布看, MobileNet-MM 1 模型優(yōu)于ResNet34模型。
圖5 1號影像識別結(jié)果與精度對比Fig.5 Recognition results and accuracy of No.1 image
圖6 1號影像農(nóng)房識別結(jié)果局部放大Fig.6 Partial zoom-in of farm house recognition results from No.1 image
為驗證MobileNet-MM 模型的穩(wěn)定性,設(shè)計了2 種方案,第一種方案是在不同的農(nóng)村建立不同的模型,測試其精度的方差;第二種方案是把不同的農(nóng)村樣本合并建立一個模型,測試其在不同農(nóng)村精度的方差。方差越小,模型越穩(wěn)定。針對第一種方案,利用MobileNet-MM 2-6 模型識別并提取對應(yīng)遙感影像(圖7-a2~6)的農(nóng)村住房,并將識別結(jié)果與ResNet34模型進行對比(圖7)。
圖7 MobileNet-MM模型識別結(jié)果Fig.7 Recognition results of MobileNet-MM model
運用MobileNet-MM 模型測試得到1-6 幅圖的測試精度分別為86.0%、83.3%、82.5%、85.5%、86.2% 和83.3%,平均精度為84.5%,方差僅為0.02%(見表3),這表明,MobileNet-MM 模型精度具有穩(wěn)定性,其測試精度基本維持在83%~86%,可滿足農(nóng)村住房智能提取模型的精度要求。ResNet34模型所得到的1-6幅圖精度分別為71.6%、65.5%、74%、81.8%、72.0%和78.2%,平均精度為73.9%。經(jīng)過對比,本文提出的MobileNet-MM模型平均精度比ResNet34模型高10.6%,基本滿足經(jīng)濟欠發(fā)達地區(qū)的農(nóng)村住房提取精度要求。
針對第二種方案,將MobileNet-MM 1-6 的樣本庫進行匯總,訓練得到一個總模型,命名為MobileNet-MM A;將MobileNet-MM 1-3 的樣本庫進行匯總,訓練得到模型1-3 的總模型,命名為MobileNet-MM B。用MobileNet-MM A 和MobileNet-MM B 分別識別1-6 幅遙感影像地塊,得到的識別精度如表4 所示??芍?,利用MobileNet-MM A 模型識別1~6 號遙感影像,精度的方差僅為0.03%,平均識別精度為83.8%,比MobileNet-MM 1~6的平均精度低0.7%;利用MobileNet-MM B模型識別1~3號遙感影像,精度的方差僅為0.02%,平均識別精度為83.5%,比MobileNet-MM 1~3 的平均精度低0.4%。這說明將樣本合并訓練一個模型,并應(yīng)用于不同的農(nóng)村(影像),精度相差較小,表明模型具有穩(wěn)定性;與獨立樣本訓練的模型相比,精度降低較小,但合并樣本訓練一個模型可顯著降低模型構(gòu)建的速度,在農(nóng)村數(shù)量特別多的區(qū)域,效率更高。
表4 匯總模型精度對比Table 4 Summary model accuracy comparison %
經(jīng)濟欠發(fā)達地區(qū)的農(nóng)村住房影像特征具有一定的相似性,但不同農(nóng)村的影像特征也有差別。用一個農(nóng)村提取的樣本所生成的模型識別另一個農(nóng)村的住房,其精度需要驗證。為了驗證模型的泛化性,利用MobileNet-MM B 模型識別4~6 號遙感影像,得到的平均識別精度為83.7%,與MobileNet-MM4~6 的平均精度相比,前者與后者精度差異很小,僅比后者低1.3%。模型B并沒有用農(nóng)村4~6的樣本數(shù)據(jù),識別結(jié)果僅比采用樣本數(shù)據(jù)的模型精度降低1.3%,說明對于經(jīng)濟欠發(fā)達地區(qū)的農(nóng)村,本文模型有一定的泛化性。
綜上,對于某個城市經(jīng)濟欠發(fā)達農(nóng)村的住房識別,可隨機抽取部分農(nóng)村建立樣本庫,合并樣本庫訓練一個模型,再對整個城市經(jīng)濟欠發(fā)達的農(nóng)村住房進行識別。
本文采用高分辨率遙感影像數(shù)據(jù),構(gòu)建經(jīng)濟欠發(fā)達地區(qū)農(nóng)村住房樣本庫,搭建MobileNet-MM 網(wǎng)絡(luò)模型。結(jié)果顯示,MobileNet-MM 模型對農(nóng)村住房的平均提取精度達到84.5%,基本可滿足農(nóng)村住房智能識別精度要求。將MobileNe-MM 模型與ResNet34 模型進行精度對比,發(fā)現(xiàn)MobileNet-MM模型的識別精度高于ResNet34 模型。分別將MobileNet-MM 1~6 與MobileNet-MM 1~3 的樣本庫進行匯總并訓練得到MobileNet-MM A 與MobileNet-MM B,利用生成的新模型識別遙感影像地塊,發(fā)現(xiàn)新模型精度與原模型精度差異較小,精度比較穩(wěn)定,說明MobileNet-MM模型具有一定的泛化性。
本文創(chuàng)新性地引入數(shù)學形態(tài)學的膨脹腐蝕方法,與MobileNetV2進行松散耦合,構(gòu)建基于MoibileNetV2和數(shù)學形態(tài)學方法的經(jīng)濟欠發(fā)達地區(qū)農(nóng)村住房識別模型(MobileNet-MM),該模型精度較高且具有一定的泛化性。并且,本文生成一套高分辨率經(jīng)濟欠發(fā)達地區(qū)農(nóng)村住房樣本庫,可為后期模型的構(gòu)建提供數(shù)據(jù)支撐。
利用深度學習技術(shù)進行農(nóng)村住房監(jiān)測是可行的,但目前的技術(shù)框架還存在不足。首先,人工智能技術(shù)需要有高質(zhì)量的樣本庫作為支撐,但目前在樣本收集過程中存在一些被云層遮擋的遙感影像數(shù)據(jù),還有一些由于遙感數(shù)據(jù)缺乏成像時間、衛(wèi)星參數(shù)和分辨率等關(guān)鍵信息而產(chǎn)生的不同時態(tài)不同衛(wèi)星拍攝影像進行拼接處理得到的低質(zhì)量遙感影像,這些影像為深度學習樣本庫的構(gòu)建過程增加困難。其次,隨著科技的發(fā)展,遙感數(shù)據(jù)處于不斷更新變化的過程,新的衛(wèi)星數(shù)據(jù)不斷涌現(xiàn),因此本文構(gòu)建的農(nóng)村住房樣本也存在局限性,需要在后續(xù)的應(yīng)用中不斷豐富和完善。最后,本文沒有對切片大小做敏感性分析,后續(xù)可做敏感性分析,得到最優(yōu)的切片大小。