徐世武,張?jiān)姡k,劉秀珍
(1.中國(guó)地質(zhì)大學(xué)(武漢),武漢 430078;2.中國(guó)國(guó)土勘測(cè)規(guī)劃院,北京 100035)
土地資源利用狀況直接關(guān)系到政府決策和經(jīng)濟(jì)民生[1]。為了摸清生產(chǎn)能力家底,國(guó)家組織了第三次全國(guó)國(guó)土調(diào)查[2],其原則是基層負(fù)責(zé)調(diào)查,上級(jí)負(fù)責(zé)核查,逐級(jí)匯總,核查工作量巨大。傳統(tǒng)的人工核查模式存在客觀性不足,效率較低的問(wèn)題。隨著技術(shù)的全面進(jìn)步,DCNN(deep convolutional neural networks)在遙感智能解譯方面取得豐碩成果,利用DCNN進(jìn)行高分辨率影像土地利用/土地覆蓋類(lèi)型核查是大勢(shì)所趨[3-6]。第三次全國(guó)國(guó)土調(diào)查工作分類(lèi)非常細(xì)致,農(nóng)村地區(qū)使用0.8 m衛(wèi)星影像,城鎮(zhèn)地區(qū)使用0.2 m航拍影像。目前各種已有的土地利用樣本集在支持的類(lèi)型和空間分辨率等方面與新一輪國(guó)土調(diào)查需求存在差距,土地利用圖斑形狀與矩形感受野不套合也是限制DCNN類(lèi)型判定精度提高的因素之一。本文提出一套基于高分辨率影像的DCNN土地利用圖斑類(lèi)型核查方法。一方面,使用掩膜降低感受野背景噪聲,提升DCNN的學(xué)習(xí)效率,增強(qiáng)語(yǔ)義的準(zhǔn)確獲取能力;另一方面,通過(guò)圖斑土地利用類(lèi)型與對(duì)應(yīng)高分辨率影像語(yǔ)義的符合性檢查,實(shí)現(xiàn)圖斑的有效核查。
遙感解譯廣泛采用DCNN技術(shù)提高識(shí)別精度和效率,合適的樣本集是確保精度的關(guān)鍵。目前高分辨率影像分類(lèi)廣泛使用的數(shù)據(jù)集有:UCM[7]、WHU-RS19[8]、AID[9]、RSD46-WHU[10]以及以國(guó)產(chǎn)影像為數(shù)據(jù)源的GID[11]。UCM遙感影像數(shù)據(jù)集的場(chǎng)景分為農(nóng)業(yè)區(qū)、森林、房屋、河流和立交橋等21種類(lèi)別,每類(lèi)包含100張圖片,空間分辨率為0.3 m。整體結(jié)構(gòu)簡(jiǎn)潔清晰,廣泛應(yīng)用在土地利用/土地覆蓋研究領(lǐng)域,但很少運(yùn)用于我國(guó)的相關(guān)生產(chǎn)實(shí)踐。究其原因,其數(shù)據(jù)來(lái)源于美國(guó)地理調(diào)查局(United States Geological Survey,USGS)數(shù)據(jù),與第三次國(guó)土調(diào)查廣泛使用的高分二號(hào)(GF-2)0.8 m影像特征有較大差異,分類(lèi)體系不匹配。WHU-RS19數(shù)據(jù)集可用于場(chǎng)景分類(lèi)和檢索,場(chǎng)景類(lèi)型分為農(nóng)田、森林、草地、住宅區(qū)和工業(yè)區(qū)等19個(gè)類(lèi)別,每類(lèi)50張。RSD46-WHU樣本類(lèi)型數(shù)量擴(kuò)充到46類(lèi),每類(lèi)樣本500~3 000張,空間分辨率為0.5~2 m,樣本集按照區(qū)片場(chǎng)景進(jìn)行類(lèi)型設(shè)計(jì),農(nóng)村地區(qū)基本滿足第三次國(guó)土調(diào)查土地利用分類(lèi)要求,如:農(nóng)田、森林和草地等,城鎮(zhèn)地區(qū)存在差距,新一輪國(guó)土調(diào)查要求按建筑用途細(xì)分場(chǎng)景。UCM與WHU系列的樣本形狀采用與神經(jīng)網(wǎng)絡(luò)矩形感受野一致的方式,便于訓(xùn)練模型充分學(xué)習(xí)樣本的顏色和紋理特征,未顧及場(chǎng)景邊界形狀特征。GID(Gaofen image dataset)采用掩膜裁切構(gòu)建樣本集,樣本具有場(chǎng)景類(lèi)型的形狀特征,數(shù)據(jù)來(lái)自中國(guó)60多個(gè)城市的150幅高質(zhì)量GF-2影像,覆蓋的地理區(qū)域超過(guò)5×104km2,是一個(gè)用于土地利用/土地覆蓋分類(lèi)的大型數(shù)據(jù)集,場(chǎng)景分為農(nóng)田、森林、草地、建筑、水域和其他六種類(lèi)別,空間分辨率1~4 m。GID樣本采用掩膜標(biāo)簽,能夠支持多種尺度的模型訓(xùn)練,但是樣本類(lèi)型較少,與國(guó)土調(diào)查分類(lèi)需求差距較大。目前的土地利用分類(lèi)數(shù)據(jù)集存在兩方面問(wèn)題:一方面,樣本集類(lèi)型架構(gòu)過(guò)于簡(jiǎn)單,普遍采用“類(lèi)型-圖像”兩層“端到端”結(jié)構(gòu),缺乏可擴(kuò)展的多層類(lèi)型語(yǔ)義設(shè)計(jì),導(dǎo)致分類(lèi)體系與樣本集類(lèi)型架構(gòu)存在兼容性問(wèn)題,不利于土地利用類(lèi)型發(fā)展的調(diào)整和擴(kuò)充,以及對(duì)其他資源型調(diào)查(如:林業(yè)資源、水資源、生態(tài)環(huán)境資源等)的支持;另一方面,樣本集設(shè)計(jì)未充分考慮形狀特征對(duì)土地利用場(chǎng)景描述的支撐作用。
高分辨率影像土地利用圖斑的特征復(fù)雜性涉及兩方面:一是圖斑土地利用場(chǎng)景類(lèi)型結(jié)構(gòu)復(fù)雜,通常包含多種簡(jiǎn)單場(chǎng)景,例如科教文衛(wèi)用地(包括平整草地、人工林地和教學(xué)樓等);二是圖斑邊界復(fù)雜,隨著空間分辨率升高,土地利用場(chǎng)景細(xì)節(jié)豐富,邊界趨于復(fù)雜。近年來(lái)國(guó)內(nèi)外學(xué)者基于DCNN進(jìn)行高分辨率土地利用類(lèi)型圖斑分類(lèi)研究取得顯著成就。王國(guó)志等[12]提出一種基于路徑的數(shù)學(xué)形態(tài)學(xué)去噪方法,在保留道路原有特征的同時(shí),濾除絕大部分的干擾信息,降低高分辨率影像的噪聲,但所用的Gabor濾波在提取道路線段時(shí),受背景噪聲影響,精度降低。Zhang等[13-14]通過(guò)均勻分解方法將大型影像均勻地分割成固定大小的處理單元來(lái)進(jìn)行土地利用分類(lèi),該方法雖會(huì)生成具有塊狀特征的土地利用圖,但無(wú)法進(jìn)行自適應(yīng)分割。Huang等[15]提出一種半遷移深度卷積神經(jīng)網(wǎng)絡(luò)(semi-transfer deep convolutional neural network,STDCNN)方法處理多光譜數(shù)據(jù),利用DCNN支持高級(jí)語(yǔ)義解析的特點(diǎn)來(lái)提高土地利用類(lèi)型圖斑的判定精度。文中采用骨架線法,將一個(gè)高分辨率影像土地利用圖斑裁切為N(N≥1)個(gè)與樣本圖片等規(guī)格的處理單元,再進(jìn)行STDCNN識(shí)別,提高土地利用類(lèi)型圖斑的分類(lèi)精度。其碎片化的方法降低了圖斑邊界與DCNN矩形感受野不套合產(chǎn)生的背景噪聲,取得比常規(guī)土地利用分類(lèi)方法更優(yōu)的結(jié)果,但沿圖斑邊界的矩形處理單元依然夾雜著相鄰圖斑的影像特征(背景噪聲),且碎片化處理后,整體圖斑邊界的形狀特征無(wú)法參與圖斑土地利用類(lèi)型判定,影響分類(lèi)精度。
綜上所述,針對(duì)土地利用類(lèi)型結(jié)構(gòu)復(fù)雜問(wèn)題,本文構(gòu)建一套低噪聲高分辨率影像語(yǔ)義樣本集(low-noise high-resolution image semantic dataset,LNSD),增強(qiáng)DCNN的語(yǔ)義獲取能力,支持土地利用類(lèi)型的語(yǔ)義符合性檢查;針對(duì)圖斑邊界復(fù)雜問(wèn)題,通過(guò)動(dòng)態(tài)掩膜濾除背景噪聲,提高不規(guī)則形狀的高分辨率影像圖斑土地利用類(lèi)型核查精度。
高分辨率影像土地利用圖斑通??梢越馕鰹橐唤M簡(jiǎn)單場(chǎng)景(影像特征單元塊)構(gòu)成的復(fù)雜場(chǎng)景,直接使用土地利用類(lèi)型“端到端”模式標(biāo)記復(fù)雜場(chǎng)景圖斑作為樣本較為困難,地物場(chǎng)景組合非常龐雜,類(lèi)型樣本標(biāo)記量巨大,且類(lèi)型間影像特征差異會(huì)弱化,不利于后續(xù)DCNN訓(xùn)練與識(shí)別。本文在樣本集“端到端”架構(gòu)的基礎(chǔ)上,插入中間層-語(yǔ)義進(jìn)行“橋接”,影像端通過(guò)所見(jiàn)即所得的“語(yǔ)義”與簡(jiǎn)單場(chǎng)景一一對(duì)應(yīng),建立樣本集,具體如圖1(a)所示,類(lèi)型端通過(guò)語(yǔ)義邏輯組合表達(dá)樣本集土地利用類(lèi)型,方便拓展與符合性檢查。DCNN矩形感受野與土地利用圖斑復(fù)雜邊界形狀不套合產(chǎn)生背景噪聲,噪聲影響大小由套合程度決定,采用掩膜多級(jí)裁剪的方式得到場(chǎng)景影像塊,利用掩膜遮罩去除背景噪聲,然后DCNN逐個(gè)語(yǔ)義標(biāo)記簡(jiǎn)單場(chǎng)景,最后通過(guò)語(yǔ)義組合結(jié)合空間權(quán)重判定土地利用類(lèi)型,具體如圖1(b)所示。
圖1 高分辨率影像DCNN土地利用圖斑類(lèi)型核查流程圖
LNSD樣本集依據(jù)《第三次全國(guó)國(guó)土調(diào)查工作分類(lèi)》和所見(jiàn)即所得的語(yǔ)義準(zhǔn)則進(jìn)行構(gòu)建。首先,設(shè)計(jì)語(yǔ)義樣本集的架構(gòu)體系;然后,掩膜細(xì)化分割土地利用圖斑樣本,逐個(gè)標(biāo)記樣本語(yǔ)義;之后,預(yù)處理統(tǒng)一樣本尺寸和色調(diào)空間,采用多種方法豐富樣本特征;最后,形成三層架構(gòu)的LNSD樣本集。
選用第三次國(guó)土調(diào)查普遍使用的GF-2影像,空間分辨率0.8 m,與土地利用圖斑調(diào)查邊界套合,形成粗選樣本集。選取湖北省具有地形特色的潛江市、武漢市江夏區(qū)、宜昌市夷陵區(qū)、麻城市四個(gè)地區(qū)的三調(diào)數(shù)據(jù),覆蓋山地、高原、丘陵、平原和盆地五種地形地貌區(qū)域,讓樣本數(shù)據(jù)集具有普適性、易于推廣。
潛江市位于湖北省腹地,全市范圍皆為平原地形,境內(nèi)無(wú)山,多湖,多平原耕地。江夏區(qū)為武漢市南部片區(qū),屬于平原向丘陵過(guò)渡地形,境內(nèi)多山、多湖,山體的海拔大部分在100 m以下,最高峰不到300 m。夷陵區(qū)位于宜昌市北部,屬于典型的山地和丘陵地形,地勢(shì)西北高,東南低,東南一面緊靠江漢平原,地面高程差超過(guò)1 000 m,主要地貌為山脈。麻城市地處江漢平原東部,兼具山地、丘陵和平原地形。
語(yǔ)義規(guī)劃的目的是設(shè)計(jì)一套“類(lèi)型/語(yǔ)義/影像”土地利用類(lèi)型三層判定體系,確保語(yǔ)義樣本集內(nèi)部具有良好的可分性。類(lèi)型/語(yǔ)義層的邏輯組合支持土地利用類(lèi)型靈活可擴(kuò)展能力,語(yǔ)義/影像層的所見(jiàn)即所得特征歸集,增大語(yǔ)義間內(nèi)涵差異,縮小語(yǔ)義內(nèi)特征差異,提高語(yǔ)義識(shí)別精度,從而增強(qiáng)土地利用類(lèi)型判定的魯棒性,如圖2所示。
圖2 影像語(yǔ)義規(guī)劃
根據(jù)有無(wú)覆蓋物的分類(lèi)準(zhǔn)則將語(yǔ)義規(guī)劃劃分成兩個(gè)初級(jí)語(yǔ)義,在Ⅰ級(jí)語(yǔ)義中,“無(wú)覆蓋地表”用“裸土”進(jìn)行代指,“有覆蓋地表”則根據(jù)覆蓋物屬性劃分成三個(gè)語(yǔ)義;在Ⅱ級(jí)語(yǔ)義中,將Ⅰ級(jí)語(yǔ)義類(lèi)在0.8 m分辨率影像場(chǎng)景的尺度下進(jìn)行語(yǔ)義劃分;在Ⅲ級(jí)語(yǔ)義中,根據(jù)顏色、形狀、紋理等特征對(duì)Ⅱ級(jí)語(yǔ)義類(lèi)的具體場(chǎng)景進(jìn)一步劃分。經(jīng)過(guò)多次語(yǔ)義解析,本文構(gòu)建了一個(gè)三級(jí)影像語(yǔ)義體系。
細(xì)化調(diào)查是指根據(jù)影像和實(shí)地調(diào)查結(jié)果,對(duì)農(nóng)村、城市、建制鎮(zhèn)和村莊內(nèi)部等進(jìn)行土地利用現(xiàn)狀細(xì)化調(diào)查內(nèi)容整理,了解每塊圖斑的地類(lèi)、位置、范圍、面積等利用狀況。采用人工掩膜裁切場(chǎng)景的方法制作樣本圖片,利用三調(diào)土地利用現(xiàn)狀數(shù)據(jù)中的調(diào)查圖斑影像邊界外接矩形范圍,對(duì)預(yù)定邊界內(nèi)部的影像進(jìn)行細(xì)化調(diào)查,將復(fù)雜場(chǎng)景化簡(jiǎn)為一組簡(jiǎn)單場(chǎng)景,減少樣本噪聲以及場(chǎng)景歧義的影響,最后按照語(yǔ)義框架,標(biāo)記篩選細(xì)化調(diào)查后的影像塊,形成一套類(lèi)內(nèi)間距小,類(lèi)間間距大的語(yǔ)義圖斑集。
規(guī)范場(chǎng)景影像尺寸,提高模型訓(xùn)練精度和速度[16],對(duì)語(yǔ)義圖斑集采用各向同性縮放方法[17],并在樣本中采用取土地利用圖斑集中的像素值中位數(shù)的方法獲得尺寸的大小,將圖斑統(tǒng)一到512像素×512像素。之后,采用目前主流神經(jīng)網(wǎng)絡(luò)支持的三波段直方圖均衡化的方法[18]對(duì)遙感影像塊進(jìn)行非線性拉伸,將遙感影像像素值拉伸到[0,255],最終得到能夠被高效提取特征的精細(xì)樣本集。
樣本增強(qiáng)處理可以增加樣本量,提高模型的準(zhǔn)確率,減輕過(guò)擬合現(xiàn)象。遙感影像是天頂視角,為了不改變地物特征,同時(shí)保持空間結(jié)構(gòu),增加類(lèi)內(nèi)豐富度[19],采用旋轉(zhuǎn)和鏡像翻轉(zhuǎn)的方式進(jìn)行增強(qiáng)。為了獲取更加豐富的特征,采用重采樣的方法將樣本空間分辨率采樣到1.6 m。經(jīng)過(guò)樣本增強(qiáng)的每個(gè)影像都是一個(gè)新影像,可以給模型提供更有辨別力,更具泛化性的樣本特征。最終得到包含30個(gè)類(lèi)別,每類(lèi)樣本6 000張,共18萬(wàn)張的LNSD樣本集。圖3展示部分語(yǔ)義的樣本示例。
圖3 部分語(yǔ)義的樣本示例圖
土地利用圖斑影像通常屬于簡(jiǎn)單場(chǎng)景組合而成的復(fù)雜場(chǎng)景。首先,根據(jù)土地利用調(diào)查邊界對(duì)影像進(jìn)行裁剪;然后,將影像圖斑動(dòng)態(tài)掩膜精細(xì)分割形成特征單元塊(簡(jiǎn)單場(chǎng)景),逐個(gè)語(yǔ)義標(biāo)記形成核查影像圖斑的語(yǔ)義組,利用多語(yǔ)義聯(lián)合空間權(quán)重判定土地利用類(lèi)型;最后,與人工調(diào)查類(lèi)型比對(duì)給出核查結(jié)論。
使用土地利用圖斑調(diào)查邊界裁剪高分辨率影像,獲得圖斑人工調(diào)查類(lèi)型對(duì)應(yīng)的影像塊,濾除圖斑邊界外的背景噪聲。一方面,提高識(shí)別精度,屏蔽背景影像對(duì)圖斑判定的影響,尤其是“空洞形狀”的圖斑,內(nèi)部非圖斑影像濾除后能更加突出主體圖斑影像特征;另一方面,提高識(shí)別速度,有助于減小后續(xù)圖斑動(dòng)態(tài)掩膜精細(xì)分割的總體計(jì)算量。
土地利用影像圖斑包含多種簡(jiǎn)單場(chǎng)景的復(fù)雜場(chǎng)景。為了得到簡(jiǎn)單場(chǎng)景,本文采用導(dǎo)向?yàn)V波結(jié)合均值漂移[20]對(duì)圖斑影像進(jìn)行精細(xì)分割,得到若干特征單元塊,并進(jìn)行分組歸類(lèi)。導(dǎo)向?yàn)V波對(duì)邊緣保留和噪聲降低具有魯棒性,邊緣保留讓特征單元塊之間視覺(jué)差異明顯,且差異邊界曲線光滑,便于后續(xù)的漫水分割,降噪讓單元內(nèi)部特征更加均一,減少單元內(nèi)特征差距,使影像圖斑具有更好的可分性,特征單元塊的形成優(yōu)化了簡(jiǎn)單場(chǎng)景的外廓形狀和視覺(jué)特征,與樣本產(chǎn)生的環(huán)境更加接近,提高語(yǔ)義識(shí)別精度。
高分辨率影像圖斑土地利用類(lèi)型核查模型選用Inception-v4作為遷移學(xué)習(xí)模型,跳躍連接節(jié)點(diǎn),加快訓(xùn)練速度[21],采用卷積和池化并行的結(jié)構(gòu),減少參數(shù)數(shù)量和計(jì)算量,在進(jìn)行數(shù)據(jù)訓(xùn)練和特征提取時(shí),內(nèi)存占用和計(jì)算資源消耗上對(duì)普通硬件設(shè)備更加友好。利用本文構(gòu)建的LNSD樣本集對(duì)Inception-v4模型進(jìn)行訓(xùn)練,建立土地利用細(xì)化分類(lèi)核查知識(shí)庫(kù),為后續(xù)簡(jiǎn)單場(chǎng)景語(yǔ)義標(biāo)記打下堅(jiān)實(shí)基礎(chǔ)。
首先用Inception-v4模型計(jì)算特征單元塊在多語(yǔ)義空間中的概率,語(yǔ)義概率按降序排列,取前三大語(yǔ)義做概率線性規(guī)劃調(diào)整,使單元塊的語(yǔ)義聚集。假設(shè)特征單元塊概率最大的三個(gè)語(yǔ)義為A、B、C,對(duì)應(yīng)概率為PA、PB、PC,其語(yǔ)義概率調(diào)整如式(1)所示。
(1)
單元塊的標(biāo)記準(zhǔn)則是用最大概率值所對(duì)應(yīng)的語(yǔ)義標(biāo)記,且其概率值與次大語(yǔ)義概率之差≥閾值α(α缺省為0.2),否則語(yǔ)義標(biāo)記為UNKNOW,且設(shè)定概率值為0,調(diào)整閾值α,得到不同精度(P)與召回率(R),繪制PR曲線圖,根據(jù)不同的應(yīng)用目的取舍精度與召回率的平衡,選擇不同的α。然后,同一語(yǔ)義的所有特征單元塊,逐塊用本塊標(biāo)記語(yǔ)義概率與本塊面積相乘,并累加求和得到圖斑內(nèi)該語(yǔ)義含量。最后,按圖斑內(nèi)語(yǔ)義含量降序排列語(yǔ)義,取含量最多的三個(gè)語(yǔ)義標(biāo)記圖斑影像,描述圖斑影像特征。
土地利用圖斑影像依據(jù)語(yǔ)義標(biāo)記和語(yǔ)義含量,按照土地利用類(lèi)型語(yǔ)義映射表進(jìn)行判定,語(yǔ)義映射表中“and”表示土地利用類(lèi)型中必須出現(xiàn)的語(yǔ)義,“or”表示類(lèi)型中可能出現(xiàn)的語(yǔ)義,“not”表示類(lèi)型中禁止出現(xiàn)的語(yǔ)義。語(yǔ)義含量不同會(huì)影響類(lèi)別判定,判定過(guò)程按語(yǔ)義含量由高至低依次進(jìn)行,綜合判定土地利用類(lèi)型。最后,將判定結(jié)果與人工標(biāo)記的土地利用類(lèi)別信息進(jìn)行比較,如果類(lèi)別相同,則核查判定正確,結(jié)果通過(guò),如果不同,則進(jìn)行人工檢查,合格即為通過(guò),不合格則人工歸到應(yīng)屬類(lèi)別中。表1展示部分語(yǔ)義映射土地利用類(lèi)別的邏輯關(guān)系。
表1 部分語(yǔ)義映射土地利用類(lèi)別的邏輯關(guān)系
為了驗(yàn)證LNSD樣本集的有效性,樣本隨機(jī)組合檢測(cè)三層架構(gòu)對(duì)30種土地利用類(lèi)型的支持能力,獲得樣本集各種低噪聲語(yǔ)義樣本的解析精度。為了驗(yàn)證高分辨率影像圖斑土地利用類(lèi)型判定方法的分類(lèi)能力,在LNSD樣本集的支持下,利用高分辨率影像圖斑土地利用分類(lèi)方法實(shí)驗(yàn)獲取圖斑動(dòng)態(tài)細(xì)化及語(yǔ)義空間權(quán)重組合進(jìn)行土地利用類(lèi)型判定效果,以及獲取一些重要運(yùn)行參數(shù)。
實(shí)驗(yàn)的硬件條件是在兩個(gè)Intel Xeon Scalable Silver 4210 CPU,共20個(gè)計(jì)算物理核心,40個(gè)線程,2.2 GHz,最大睿頻頻率3.2 GHz和64 GB(4×16 GB)內(nèi)存的臺(tái)式機(jī)上進(jìn)行。神經(jīng)網(wǎng)絡(luò)在深度學(xué)習(xí)平臺(tái)選用Tensorflow-GPU1.15.0框架訓(xùn)練,實(shí)驗(yàn)分析基于Python 3.6.4完成。
在樣本隨機(jī)組合檢測(cè)實(shí)驗(yàn)中,流程如圖4所示。將每類(lèi)6 000張的LNSD樣本集作為實(shí)驗(yàn)數(shù)據(jù)以8∶2的比例分為兩部分,每類(lèi)隨機(jī)4 800張加入訓(xùn)練數(shù)據(jù)集,訓(xùn)練Inception-v4模型,每類(lèi)余下的1 200張加入測(cè)試數(shù)據(jù)集,利用訓(xùn)練后的Inception-v4模型對(duì)測(cè)試集進(jìn)行語(yǔ)義判定,得到樣本解析精度。在測(cè)試集中隨機(jī)挑選三張不同語(yǔ)義的樣本,隨機(jī)賦予語(yǔ)義次序,最后利用多語(yǔ)義土地利用類(lèi)型判定規(guī)則判定土地利用類(lèi)型。
圖4 樣本隨機(jī)組合檢測(cè)實(shí)驗(yàn)
在驗(yàn)證高分辨率影像圖斑土地利用類(lèi)型判定方法的實(shí)驗(yàn)中,將LNSD樣本集全部用于Inception-v4模型訓(xùn)練,對(duì)廣水市的核查圖斑影像進(jìn)行核查,自動(dòng)獲得機(jī)器判讀的土地利用類(lèi)型,將機(jī)器判讀結(jié)果與標(biāo)記結(jié)果比較,輸出實(shí)驗(yàn)結(jié)果。在實(shí)驗(yàn)中,不斷調(diào)整閾值α,改變土地利用分類(lèi)核查的總體精度和召回率,繪制PR曲線,通過(guò)分析PR曲線找到精度與召回率綜合最優(yōu)的實(shí)驗(yàn)數(shù)據(jù)點(diǎn),獲取圖斑語(yǔ)義解析組合的最佳閾值α。
本文使用混淆矩陣[22]評(píng)價(jià)樣本隨機(jī)組合檢測(cè)實(shí)驗(yàn)中的語(yǔ)義精度,用精度、召回率、方差評(píng)價(jià)樣本隨機(jī)組合檢測(cè)實(shí)驗(yàn)中的土地利用分類(lèi)精度,用PR曲線[23]、F1值、精度和召回率[24]評(píng)價(jià)高分辨率影像圖斑影像土地利用類(lèi)型判定方法。其中F1取值范圍從0到1,數(shù)值越大表明結(jié)果越理想。
圖5是使用訓(xùn)練后的Inception-v4模型判定語(yǔ)義得到的混淆矩陣圖。對(duì)于單個(gè)語(yǔ)義來(lái)說(shuō),每種語(yǔ)義的精度和召回率都達(dá)到90%以上,說(shuō)明本文提出使用土地利用圖斑調(diào)查邊界裁剪的方法可以有效地濾除背景噪聲,使主體更加突出,低噪聲特性魯棒的支持語(yǔ)義樣本的高精度解析。其中具有特征單一的語(yǔ)義可分性較高,例如普通道路、山體、豐水坑塘等具有較高的識(shí)別精度;但還有一些語(yǔ)義本身會(huì)因?yàn)榫哂邢嗨萍y理特征引起語(yǔ)義的混淆,如陡坡耕地與梯狀園地、大棚與光伏用地,導(dǎo)致識(shí)別精度下降,可以進(jìn)一步增加樣本,或者細(xì)分語(yǔ)義提高精度。
圖5 混淆矩陣
表2顯示在樣本隨機(jī)組合實(shí)驗(yàn)中獲得的樣本解析精度分析??傮w精度和召回率為94.6%和94.68%,最大精度和召回率為97%和100%,最小精度和召回率為90%和87.04%,精度方差為0.013 3,召回率方差為0.032 1,獲得高精度、高召回率和低方差的實(shí)驗(yàn)結(jié)果,表明LNSD樣本集訓(xùn)練出來(lái)的Inception-v4模型有較強(qiáng)的穩(wěn)定性。
表2 樣本解析精度分析
圖6顯示利用多語(yǔ)義土地利用判定規(guī)則隨機(jī)抽取三種不同語(yǔ)義及隨機(jī)賦予語(yǔ)義次序的土地利用分類(lèi)結(jié)果,總體的精度為94.27%和94.12%,略低于語(yǔ)義的總體精度和召回率。實(shí)驗(yàn)結(jié)果表明,樣本集三層架構(gòu)能夠有效判定土地利用類(lèi)型,通過(guò)邏輯組合端到端結(jié)合多語(yǔ)義組合判定可以支持多種語(yǔ)義組合成的未知土地利用類(lèi)型,有良好的類(lèi)型擴(kuò)展和遷移能力。
圖6 樣本隨機(jī)組合的土地利用分類(lèi)結(jié)果
圖7顯示在廣水市的核查圖斑影像上,通過(guò)調(diào)整閾值α,繪制相同樣本條件下語(yǔ)義判定的PR曲線圖。通過(guò)比較PR曲線的平緩程度,在準(zhǔn)確率和召回率93.65%和93.96%的時(shí)候,獲得精度與召回率綜合最優(yōu),此時(shí)閾值α是0.2,F(xiàn)1值為0.94。因此選擇0.2為圖斑語(yǔ)義解析組合的最佳閾值。
圖7 不同閾值下的PR曲線圖
圖8顯示在閾值α為0.2的情況下廣水市圖斑核查結(jié)果。為了方便數(shù)據(jù)比較,本文將這些土地利用類(lèi)型歸結(jié)為耕地、園地、林地、建筑、交通、水域六大類(lèi)土地利用類(lèi)型。綜合來(lái)看,總體判定精確率為93.57%,召回率為93.54%,每種地類(lèi)都在90%以上,語(yǔ)義空間權(quán)重組合能夠高精度地判定土地利用類(lèi)型,證明提出語(yǔ)義組合判定的有效性,具有很高的泛化能力。其中園地的實(shí)驗(yàn)結(jié)果出現(xiàn)異常,經(jīng)過(guò)數(shù)據(jù)比對(duì)和影像分析,發(fā)現(xiàn)原因是部分園地為耕地種植園木的情況,即該類(lèi)圖斑在影像上的整體表現(xiàn)與耕地相似,但是紋理上又具有不明顯的細(xì)條紋特征,因此自動(dòng)判定過(guò)程將該類(lèi)圖斑較多地誤判成耕地,導(dǎo)致耕地精度和園地召回率下降,說(shuō)明樣本集中此類(lèi)別的樣本還不夠豐富。
圖8 土地利用現(xiàn)狀數(shù)據(jù)核查結(jié)果
本文提出一套基于高分辨率影像的DCNN土地利用圖斑類(lèi)型核查方法,構(gòu)建了一套三層架構(gòu)(類(lèi)型/語(yǔ)義/影像)的土地利用類(lèi)型語(yǔ)義樣本集。首先,通過(guò)掩膜降低感受野背景噪聲,高精度獲取圖斑的影像語(yǔ)義;然后,根據(jù)類(lèi)型與語(yǔ)義之間的邏輯一致性進(jìn)行圖斑土地利用類(lèi)型與圖斑影像語(yǔ)義的符合性檢查,克服高分辨率影像“類(lèi)內(nèi)差別大,類(lèi)間差別小”帶來(lái)的土地利用分類(lèi)瓶頸,解決了直接依據(jù)影像的分類(lèi)結(jié)果來(lái)進(jìn)行核查引起誤差較大的問(wèn)題;最終,實(shí)現(xiàn)更準(zhǔn)確的土地利用類(lèi)型核查。實(shí)驗(yàn)表明:掩膜方法可以有效提高圖斑土地利用語(yǔ)義的識(shí)別精度,具有較好的魯棒性;LNSD樣本集類(lèi)別語(yǔ)義體系設(shè)計(jì)合理有效,場(chǎng)景特征豐富,且具有很強(qiáng)的擴(kuò)充能力,可支持包括土地利用類(lèi)型的多種深度學(xué)習(xí)遙感解譯,并且在國(guó)土調(diào)查自動(dòng)核查工作中得到成功應(yīng)用。
隨著各類(lèi)大型資源調(diào)查工作常態(tài)化開(kāi)展,將來(lái)的研究需要進(jìn)一步拓展完善語(yǔ)義體系,增強(qiáng)低噪聲樣本的多尺度特征,提高樣本集的適應(yīng)能力和可推廣性。同時(shí),高分辨率遙感影像土地利用圖斑類(lèi)型的分類(lèi)方法也需要從支持RGB三通道延展到支持高分辨率多光譜影像。