張繼賢,顧海燕,楊 懿,張 鶴,李海濤,韓文立,沈 晶
1. 國家測繪產(chǎn)品質(zhì)量檢驗測試中心,北京 100830; 2. 中國測繪科學(xué)研究院,北京 100830
自然資源要素指以物質(zhì)形式存在,看得見,摸得著,可以實施調(diào)查、監(jiān)測和控制的自然資源實體,涵蓋陸地和海洋、地上和地下,包括土地、礦產(chǎn)、森林、草原、水、濕地、海域海島等,具有自然、經(jīng)濟、社會、生態(tài)、空間立體等多重基本屬性特征[1]。開展自然資源統(tǒng)一調(diào)查監(jiān)測評價,準確掌握我國各類自然資源家底和變化情況,是科學(xué)編制國土空間規(guī)劃,逐步實現(xiàn)山水林田湖草沙冰的整體保護、系統(tǒng)修復(fù)和綜合治理,保障國家生態(tài)安全的基礎(chǔ)支撐[2]。自然資源要素解譯是調(diào)查監(jiān)測工作中最基礎(chǔ)、投入工作量最大、技術(shù)難度最高的工作。迄今為止,工程應(yīng)用主要是“人工目視解譯+實地調(diào)查”作業(yè)手段,勞動強度大、作業(yè)效率低、主觀因素多的矛盾十分突出。如何實現(xiàn)自然資源要素的快速提取與智能解譯已成為亟待突破的一項關(guān)鍵科學(xué)技術(shù)問題。
從遙感影像解譯發(fā)展歷程來看,遙感影像解譯技術(shù)經(jīng)歷了人工目視判讀、計算機分類與人機交互半自動解譯階段,隨著日新月異的遙感應(yīng)用需求、高分辨率遙感衛(wèi)星的發(fā)射、人工智能技術(shù)的發(fā)展、地理知識的積累,以及歷史積累數(shù)據(jù)的應(yīng)用,目前正在向自動化智能化方向發(fā)展。從影像解譯單元看,從像素級向?qū)ο蠹?、場景級發(fā)展;從分類方法看,從傳統(tǒng)監(jiān)督、非監(jiān)督分類器向集成學(xué)習(xí)、深度學(xué)習(xí)發(fā)展;從解譯認知看,從智能理解向智能認知發(fā)展[3]。
我國地形地貌多樣、氣象條件復(fù)雜、要素類型豐富、地表結(jié)構(gòu)細碎、場景復(fù)雜多變,現(xiàn)有智能解譯方法存在可解譯類別少、要素邊界不準不全、類別屬性可靠性不高等諸多挑戰(zhàn)。究其原因,現(xiàn)有方法沒有充分考慮真實世界中場景與要素、要素與要素之間的相互依存關(guān)系,存在如下3個問題:①類別表征不完備,缺乏“特征-模式-類別”的表征及更高層次的特征挖掘,導(dǎo)致難以實現(xiàn)地物分層解構(gòu)與精準認知;②知識應(yīng)用不充分,解譯過程缺乏業(yè)務(wù)化規(guī)則約束及知識推理,致使地類解譯不準及邊界無法滿足業(yè)務(wù)需求;③算法推理與自學(xué)習(xí)不足,解譯模型算法與應(yīng)用需求、應(yīng)用流程結(jié)合不緊密,導(dǎo)致模型算法可復(fù)用率低、遷移能力弱、場景適應(yīng)性差,難以支撐復(fù)雜自然場景高分遙感智能解譯。
本文從自然資源調(diào)查監(jiān)測應(yīng)用場景出發(fā),以基本理論、方法途徑、工具手段為研究視角,闡述了解譯范式、解譯方法、解譯手段3個方面的研究進展;探討了場景要素耦合解譯、知識驅(qū)動語義理解、人機協(xié)同智能解譯等6個重點研究方向及關(guān)鍵技術(shù),以期為自然資源要素智能解譯提供方法及思路,推動解決困擾遙感影像自動解譯成果在自然資源監(jiān)測業(yè)務(wù)應(yīng)用中的瓶頸問題。
自然場景是一定地域、一定時空范圍內(nèi),在各類自然要素(包括地質(zhì)、地貌、氣候、水文、土壤、生物等)綜合作用下,表現(xiàn)出一定的分異特征、時空格局和演化過程的自然地域綜合體[4]。當(dāng)前基于要素的解譯通過對特定要素在遙感數(shù)據(jù)中表現(xiàn)出的光譜、幾何等特征進行,沒有考慮真實世界中場景與要素、要素與要素之間的相互依存關(guān)系,存在類別表征不完備、知識應(yīng)用不充分、算法推理與自學(xué)習(xí)不足的固有局限,難以支撐自然資源調(diào)查監(jiān)測要素智能解譯[5-6]。
場景與要素相互依存,場景是由不同要素組成的,離開要素的場景將失去生命力,要素也離不開具體的場景,不僅要關(guān)注要素自身的位置、類型、數(shù)量等基本信息,更要從場景整體出發(fā)研究各個組成要素結(jié)構(gòu)、功能、關(guān)系、行為、過程、狀態(tài)、作用等相互關(guān)系,為高層次的認知與理解奠定基礎(chǔ)。場景要素耦合的解譯是以場景為基本解譯單元,在對場景中各要素的結(jié)構(gòu)、功能、關(guān)系等充分認知的前提下進行綜合解譯,能夠為自然資源要素智能解譯提供新途徑[7]。
場景根據(jù)特征層次可分為低層、中層、高層,低層為基于光譜和幾何等的數(shù)據(jù)特征表征層,中層為空間、語義、關(guān)系、過程、作用等構(gòu)成的內(nèi)容特征表征層,高層為聚合各類內(nèi)容特征的場景語義層[8-11]。以城市街區(qū)場景為例,低層特征為遙感影像的光譜、紋理、幾何等特征,中層特征表達了建筑與道路、道路與公園、街區(qū)與公園之間的語義關(guān)系,可以利用語義概念和主題模型來表達,高層特征為城市街區(qū)復(fù)雜場景與道路、公園、建筑等要素之間的復(fù)雜語義結(jié)構(gòu)關(guān)系,可以利用深度學(xué)習(xí)進行特征挖掘[12-14]。該方法以強大的層次化特征學(xué)習(xí)和良好的遷移性,在場景解譯中具有顯著優(yōu)勢[15-16]。
場景根據(jù)層級認知可以分為數(shù)據(jù)層、模型層、知識層。數(shù)據(jù)層面,構(gòu)建不同遙感數(shù)據(jù)的層次化表征模型,實現(xiàn)低層的光譜、幾何特征提取,中層的空間、語義、關(guān)系、過程、作用等內(nèi)容要素標(biāo)簽和高層的場景識別與聚合[17];模型層面,在繼承現(xiàn)有要素解譯模型的基礎(chǔ)上,擴充場景要素耦合的解譯模型,實現(xiàn)基于場景劃分的要素映射通道;知識層面,引入場景中各要素在分異特征、時空格局和演化過程中所表現(xiàn)出的規(guī)律性知識,利用現(xiàn)存的各類國土調(diào)查和專題解譯歷史成果數(shù)據(jù),構(gòu)建場景時空分布、演化過程和要素相互作用過程等的地學(xué)知識圖譜,并基于知識圖譜推理場景-要素間的因果關(guān)聯(lián)關(guān)系[18-19]。在場景層級認知中,數(shù)據(jù)是基礎(chǔ),模型是紐帶,知識是價值,數(shù)據(jù)及知識是模型的輸入,以彌補模型的不足,模型又能生成新的知識,通過知識反饋、迭代優(yōu)化,形成具有擴展性、能動性、通用性的模型。
在數(shù)據(jù)-模型-知識驅(qū)動和引導(dǎo)下,分析場景要素時空關(guān)聯(lián)耦合關(guān)系,建立場景要素耦合知識表達模型(圖1),實現(xiàn)場景要素關(guān)系的認知、表達和推理,以及更高級別的影像理解是當(dāng)前迫切需要解決的問題。
圖1 場景要素耦合智能解譯
解譯方法從傳統(tǒng)監(jiān)督、非監(jiān)督向集成學(xué)習(xí)、深度學(xué)習(xí)方向發(fā)展,都屬于數(shù)據(jù)驅(qū)動的方法。傳統(tǒng)的機器學(xué)習(xí)方法數(shù)學(xué)理論嚴密,但預(yù)測能力有限,深度學(xué)習(xí)方法學(xué)習(xí)能力強,但推理能力及可解釋性弱。因此,知識驅(qū)動的可解釋性方法得到了越來越多的關(guān)注,遷移學(xué)習(xí)、強化學(xué)習(xí)、知識圖譜為知識驅(qū)動的解譯方法提供了技術(shù)基礎(chǔ)。
遷移學(xué)習(xí)是對深度學(xué)習(xí)的重要補充,基本思想是將源領(lǐng)域的知識向目標(biāo)領(lǐng)域遷移,實現(xiàn)對已有知識的有效銜接與系統(tǒng)利用,使傳統(tǒng)從零開始的學(xué)習(xí)變成可積累的學(xué)習(xí)[20]。根據(jù)遷移學(xué)習(xí)內(nèi)容可分為實例遷移、特征遷移、參數(shù)遷移和關(guān)系知識遷移;根據(jù)遷移學(xué)習(xí)機制可分為不同時間的先驗遷移、不同屬性的特征遷移、不同空間的模型遷移。不同時間的先驗遷移是相同空間范圍上的先驗知識在不同時刻間的有效遷移。不同屬性的特征遷移是將多源異構(gòu)的不同屬性數(shù)據(jù)遷移到同一空間場景中,形成可統(tǒng)一量化計算的結(jié)構(gòu)化多維屬性;不同空間的模型遷移是將源領(lǐng)域的模型遷移到相似地理環(huán)境中,保證模型的正遷移[21]。遷移學(xué)習(xí)雖然具有知識遷移、空間認知等優(yōu)勢,但由于受地理環(huán)境、物候時相、太陽輻射、傳感器標(biāo)定等多種因素影響,源領(lǐng)域的知識與模型如何遷移到新目標(biāo),小區(qū)域模型如何外推到廣域范圍,都是亟待解決的問題,因此要根據(jù)具體任務(wù)要求設(shè)計具體的遷移方式,有效避免負遷移造成的不良影響,實現(xiàn)高效、準確的空間認知。
強化學(xué)習(xí)基本思想是結(jié)合人機交互過程,主動將專家經(jīng)驗、實地驗證等環(huán)境增量進行反饋,通過知識增強對智能體系統(tǒng)實施迭代式趨優(yōu),實現(xiàn)對場景認知能力的綜合提升,主要包括增量學(xué)習(xí)、集成學(xué)習(xí)、主動學(xué)習(xí)3類方式。增量學(xué)習(xí)能夠修正和加強以前的知識,使得更新后的知識能更好地適應(yīng)新數(shù)據(jù)及環(huán)境,而不必重新對全部樣本數(shù)據(jù)進行學(xué)習(xí),減少了后續(xù)訓(xùn)練時間[22];集成學(xué)習(xí)通過某種策略將多個模型組合,通過群體決策提高準確率,能夠彌補單一模型的缺陷[23];主動學(xué)習(xí)是在無標(biāo)簽數(shù)據(jù)或有標(biāo)簽數(shù)據(jù)少,讓算法主動提出要對哪些數(shù)據(jù)進行率先標(biāo)注,再由專家針對性地進行交互式標(biāo)注,從而加快對模型訓(xùn)練的優(yōu)化過程[24]。對環(huán)境、任務(wù)和策略的解釋存在強關(guān)聯(lián),是實現(xiàn)強化學(xué)習(xí)解釋必然面臨的問題,強化學(xué)習(xí)問題由環(huán)境、任務(wù)、智能體策略3個關(guān)鍵因素組成。
知識圖譜日益成為大數(shù)據(jù)、人工智能時代最為主要的知識表示方式,地學(xué)知識圖譜的引入使得遙感解譯方向從算法思維向地學(xué)思維轉(zhuǎn)變[25],遙感影像解譯知識圖譜能夠關(guān)聯(lián)語義信息,存儲了豐富的符號知識與數(shù)值知識,具有如下優(yōu)點:①可以深入了解數(shù)據(jù)來源、地理環(huán)境,查找語義信息,評估結(jié)果是否符合應(yīng)用目的;②形式化表達影像解譯任務(wù),集成異構(gòu)的解譯產(chǎn)品;③有助于解譯知識的管理,以及遙感領(lǐng)域與其他領(lǐng)域(生態(tài)、農(nóng)業(yè)、城市等)的知識共享與重用。
深度學(xué)習(xí)自學(xué)習(xí)能力強、適應(yīng)力強、可移植性好,遷移學(xué)習(xí)對數(shù)據(jù)及標(biāo)簽的依賴性小,強化學(xué)習(xí)具有自我改進、推理決策等能力,知識圖譜具有知識推理的高可信度、強解釋性等優(yōu)勢,這些人工智能技術(shù)是實現(xiàn)智能認知的核心驅(qū)動力,綜合利用各種方法的優(yōu)勢能夠為知識驅(qū)動的智能解譯提供技術(shù)基礎(chǔ)。因此,在深度學(xué)習(xí)、遷移學(xué)習(xí)、強化學(xué)習(xí)、知識圖譜等技術(shù)支撐下,從自然資源調(diào)查監(jiān)測場景認知出發(fā),構(gòu)建自學(xué)習(xí)、可解釋、可擴展、能推理的要素解譯智能認知框架與智能解譯系統(tǒng)(圖2),是推動遙感影像解譯智能化發(fā)展的核心驅(qū)動力。
圖2 知識驅(qū)動的解譯框架
目前,國土變更調(diào)查、耕地調(diào)查等自然資源調(diào)查監(jiān)測業(yè)務(wù)主要采用“人工目視解譯+外業(yè)調(diào)繪”的作業(yè)手段,勞動強度大、生產(chǎn)效率低、主觀因素多,已不能適應(yīng)新時代自然資源全要素、全流程、全覆蓋一體化調(diào)查監(jiān)測的新要求和自然資源自動化、智能化、精細化、實時化管理的需求[1]?;谏疃葘W(xué)習(xí)的影像解譯技術(shù)雖然取得了一些進展,但由于受樣本、模型、算力、場景等因素的影響,解譯能力仍然有限,難以落地應(yīng)用。
人機協(xié)同是人工智能發(fā)展的新階段,成為推動要素提取智能化發(fā)展的主要驅(qū)動力,內(nèi)涵是人與機器協(xié)同配合,通過自動化技術(shù)使大部分業(yè)務(wù)流程實現(xiàn)自動化,讓人類從重復(fù)枯燥的工作流程中解放出來,通過智能化技術(shù)補充和增強人的能力邊界,協(xié)助人類作出更精準、更清晰和更理性的判斷,通過人類視覺感知及認知決策技術(shù)進行綜合判斷與驗證,反饋給機器進行自主學(xué)習(xí),提升機器智能水平,形成閉環(huán)[2]?;舅悸肥峭ㄟ^人機協(xié)同技術(shù)把遙感數(shù)據(jù)處理與目視判讀、機器學(xué)習(xí)與專家知識、人腦與電腦的優(yōu)勢結(jié)合起來,電腦負責(zé)自動化處理,將處理結(jié)果推送給解譯人員,解譯人員根據(jù)經(jīng)驗和自動處理結(jié)果進行綜合判斷與確認,再將綜合決策結(jié)果反饋給電腦,使得系統(tǒng)被訓(xùn)練得更智能,解決問題的能力越來越強[26]。
人機協(xié)同智能解譯主要分為兩類。一是智能提取引導(dǎo)的人工解譯,主要思路為:首先,利用深度學(xué)習(xí)等方法進行自動解譯;其次,人工通過目視判斷,確認自動提取結(jié)果中完全符合要求的要素對象,刪除完全錯誤的要素對象,修正部分符合要求的對象,補測遺漏的對象;最后,將符合要求的解譯結(jié)果反饋給電腦。二是人機交互引導(dǎo)下的半自動式解譯,主要思路為:首先,通過人機交互設(shè)備給出對象在影像中的位置、形狀、范圍等初始信息;然后,計算機自動計算出該對象或者該類對象的精確位置和形狀;最后,將結(jié)果反饋給計算機。
綜合利用人機協(xié)同、深度學(xué)習(xí)、主動學(xué)習(xí)、信息可視化等技術(shù),與應(yīng)用需求、應(yīng)用流程、應(yīng)用模型緊耦合,構(gòu)建面向應(yīng)用場景的人機協(xié)同解譯環(huán)境與模式,突破基于規(guī)則的圖斑自動推送、多維可視化交互場景、時空樣本庫構(gòu)建、基于深度學(xué)習(xí)的自然資源要素自動提取、人機交互半自動解譯等核心技術(shù),構(gòu)建人機協(xié)同智能解譯綜合解決方案(圖3),將有望解決長期困擾遙感影像自動解譯成果在自然資源調(diào)查監(jiān)測業(yè)務(wù)中的瓶頸問題。
圖3 人機協(xié)同解譯
針對自然資源調(diào)查監(jiān)測要素智能解譯存在的問題及面臨的挑戰(zhàn),需要從場景-要素耦合解譯、知識驅(qū)動語義理解、人機協(xié)同智能解譯、內(nèi)外一體與三維環(huán)境解譯、關(guān)鍵參數(shù)精準計算與定量反演、高可信質(zhì)量控制與真實性驗證等方面進行攻關(guān),以期為自然資源調(diào)查監(jiān)測提供實用、穩(wěn)健、可靠的解譯技術(shù)。
針對自然資源場景要素認知、表達與理解需求,探索場景-要素認知與解構(gòu)原理、遙感數(shù)據(jù)-地學(xué)知識協(xié)同解譯機理、高分遙感智能解譯新范式,建立場景要素耦合認知新理論[27],攻克多尺度遙感數(shù)據(jù)融合、業(yè)務(wù)化知識圖譜構(gòu)建,地類邊界語義化處理、“數(shù)據(jù)-模型-知識”驅(qū)動的場景要素耦合智能解譯等核心技術(shù),構(gòu)建場景空間認知建模-場景-要素解構(gòu)-多模態(tài)數(shù)據(jù)融合/協(xié)同-知識圖譜構(gòu)建-要素智能提取智能解譯技術(shù)框架,實現(xiàn)自然資源要素精細解譯從單要素識別到高層次的場景認知與理解(圖4),為自然資源調(diào)查監(jiān)測要素智能解譯提供理論-方法-技術(shù)-應(yīng)用全鏈條場景要素耦合的遙感智能解譯技術(shù)支撐[28]。
圖4 場景要素耦合解譯思路
如何全面系統(tǒng)認知自然場景的時空分布、演化過程和要素相互作用特征,探究場景-要素映射與認知原理,厘清場景-要素關(guān)聯(lián)耦合關(guān)系,構(gòu)建場景-要素解構(gòu)模型是實現(xiàn)場景-要素耦合解譯的科學(xué)問題。
以地理學(xué)規(guī)律為基礎(chǔ),研究自然場景語義、位置、關(guān)系、幾何、過程、作用、屬性的7維度認知空間構(gòu)建方法,構(gòu)建自然場景分類體系和結(jié)構(gòu)化、形式化描述方法;從高分辨率遙感影像的視覺感知、探測機理出發(fā),構(gòu)建高分辨率遙感光譜、幾何、紋理等內(nèi)容特征描述方法和視覺表征模型,研究基于視覺表征的特征標(biāo)定和場景聚合方法,實現(xiàn)高分辨率遙感場景內(nèi)容感知;研究地理學(xué)規(guī)律和遙感探測機理作用下不同場景對象間關(guān)聯(lián)網(wǎng)絡(luò)構(gòu)建方法,設(shè)計定性和定量結(jié)合的場景對象層次映射關(guān)系求解策略,實現(xiàn)高分辨率遙感復(fù)雜自然場景的映射與認知。
場景-要素的耦合關(guān)系復(fù)雜,如在不同場景下,要素間的共現(xiàn)關(guān)系、空間分布模式、時間關(guān)聯(lián)性,以及在影像上呈現(xiàn)的紋理特征均存在差異,難以整體解決,因此從水平鄰接關(guān)系、層次分布構(gòu)成和時空變化規(guī)律等視角多粒度開展場景-要素時空關(guān)聯(lián)耦合分析研究;基于空間耦合分析模型(空間統(tǒng)計學(xué)模型、空間誤差模型等),根據(jù)自然場景特征,從水平分布、垂直疊掩、時序變化3個視角揭示自然場景不同類別要素分布模態(tài)的耦合機理,分析場景與要素主控因子之間的交互脅迫關(guān)系,構(gòu)建多尺度、多層次、多時序時空耦合模型(表1)。厘清“場景-要素”關(guān)聯(lián)耦合關(guān)系,創(chuàng)建“場景-要素”耦合解譯范式,可為解決我國地表要素類型多樣、層疊交錯分布、要素動態(tài)變化等復(fù)雜自然場景下高分辨率遙感智能處理技術(shù)瓶頸提供理論支撐。
表1 水平分布、垂直疊掩、時序變化自然場景
針對水平分布場景解譯難題,研究星空地多尺度數(shù)據(jù)融合技術(shù),建立水平分布要素的知識圖譜表達和混合破碎場景理解模型,構(gòu)建“數(shù)據(jù)-模型-知識”驅(qū)動的智能解譯技術(shù),破解水平分布邊界不清、可靠性不高難題。
針對垂直分布場景解譯難題,研究場景-要素的垂直維度表征模型與分層解構(gòu)模型,突破垂直維度表征模型與分層解構(gòu)、場景-要素圖譜構(gòu)建與推理、層疊隱蔽復(fù)雜場景智能解譯等核心技術(shù),解決垂直維度層疊分布和隱蔽遮擋要素解譯難題。
針對時序變化場景解譯難題,研究時序多模態(tài)數(shù)據(jù)時空融合與協(xié)同方法,發(fā)展顧及探測機理的場景時序知識圖譜庫構(gòu)建技術(shù),建立知識圖譜引導(dǎo)的動態(tài)變化要素解譯與遷移學(xué)習(xí)框架,解決動態(tài)變化類別要素偽變難分難題。
針對專業(yè)知識應(yīng)用不充分、解譯過程缺乏知識推理、解譯結(jié)果可解釋性不強等問題,在深度學(xué)習(xí)、遷移學(xué)習(xí)、強化學(xué)習(xí)、知識圖譜等技術(shù)支撐下,從自然資源調(diào)查監(jiān)測場景認知出發(fā),分析自然資源場景要素的特性,挖掘場景要素空間分布、空間關(guān)系、語義關(guān)聯(lián)等知識[29],攻克地理實體形式化表達、地理知識圖譜構(gòu)建、語義知識推理與推薦等技術(shù),構(gòu)建自學(xué)習(xí)、可解釋、可擴展、能推理的要素解譯智能認知框架與智能解譯系統(tǒng),使智能解譯具備語義理解能力,推動智能解譯由數(shù)據(jù)算法思維向語義理解思維轉(zhuǎn)變[30-31]。
從地理本體及自然資源場景認知視角,系統(tǒng)分析自然資源實體空間位置、分布、格局等地理知識;從遙感視角,分析傳感器光譜曲線、生物物理特性、遙感影像的光譜紋理形狀等特征;從專家視角,總結(jié)專家知識,從而建立自然資源要素遙感解譯知識體系,為智能解譯奠定知識基礎(chǔ)。
圖5 知識驅(qū)動語義理解思路
歷史解譯數(shù)據(jù)、遙感影像、文獻資源是遙感解譯知識的主要來源,從這些結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)中提取出計算機可理解和計算的數(shù)據(jù),需要解決實體抽取、關(guān)系抽取、屬性抽取等知識獲取問題。從多源異構(gòu)數(shù)據(jù)中抽取地理實體、屬性及其關(guān)系,采用知識圖譜三元組方式進行知識表示
G=(u,V,E)
式中,G為具有全局屬性的有向、帶屬性的圖;u為全局屬性;V={vi}i=1:N:為節(jié)點集合,vi表示節(jié)點屬性;E={(ek,rk,sk)}k=1:N:為邊集合,ek表示邊屬性,rk、sk分別表示邊的接收和發(fā)出節(jié)點。實體及其關(guān)系形成了特定自然資源環(huán)境下的遙感解譯知識圖譜。
在遙感解譯知識圖譜引導(dǎo)下,結(jié)合知識圖譜的推理優(yōu)勢和卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)優(yōu)勢,研究外部輔助、內(nèi)部嵌入、混合學(xué)習(xí)等耦合方法,以及遷移學(xué)習(xí)、強化學(xué)習(xí)等融合方式,構(gòu)建知識圖譜引導(dǎo)的深度學(xué)習(xí)網(wǎng)絡(luò),實現(xiàn)知識圖譜引導(dǎo)的遙感影像智能解譯。外部輔助是利用知識圖譜直接糾正深度語義分割網(wǎng)絡(luò)的分類錯誤,或者將知識圖譜作為深度語義分割網(wǎng)絡(luò)的輸入;內(nèi)部嵌入是在深度語義分割網(wǎng)絡(luò)的輸入端、學(xué)習(xí)端、損失函數(shù)中嵌入知識圖譜,從而引導(dǎo)網(wǎng)絡(luò)的訓(xùn)練,提高結(jié)果的可靠性與可解釋性,解決深度神經(jīng)網(wǎng)絡(luò)缺乏對地學(xué)知識利用的問題,為可解釋智能解譯提供思路與方法。
針對解譯模型算法與應(yīng)用需求結(jié)合不緊密、地類解譯不準及邊界無法滿足業(yè)務(wù)需求等問題,構(gòu)建面向應(yīng)用場景的人機協(xié)同解譯環(huán)境與模式,研究“智能計算后臺+智能引擎+人機交互前臺”的人機協(xié)同智能提取技術(shù)框架[2,32],如圖6所示。后臺運用深度學(xué)習(xí)等方法進行智能計算,將自動提取結(jié)果通過智能引擎推送到前臺;前臺利用半自動提取、人機交互采集編輯技術(shù)手段進行人機交互式綜合判斷與驗證。這一方法通過人類與智能機器共同協(xié)作,利用自動化技術(shù)使大部分業(yè)務(wù)流程實現(xiàn)自動化,利用人類視覺感知及認知決策技術(shù)進行綜合判斷與驗證,反饋給機器,提升機器智能水平,從而實現(xiàn)人的解譯知識的實時利用與機器智能提升,提升自然資源要素提取的自動化與智能化水平。
圖6 人機協(xié)同智能提取技術(shù)框架
智能計算、智能引擎、人機交互、迭代優(yōu)化等技術(shù)是人機協(xié)同智能提取的核心。依據(jù)結(jié)構(gòu)可靈活表示、內(nèi)部結(jié)構(gòu)可配置、模塊結(jié)構(gòu)可組合原則,研究適用于要素提取的多策略融合的語義分割網(wǎng)絡(luò)模型,實現(xiàn)自然資源要素的自動提取;定義推送單元及推送規(guī)則,引入規(guī)則引擎,根據(jù)推送規(guī)則將自動提取結(jié)果推送到前臺;借鑒游戲引擎可視化技術(shù),構(gòu)建多維可視化交互環(huán)境,使自然資源信息更加形象、逼真地展示出來,有利于解譯人員進行多視角解譯與分析;前臺選擇半自動化工具,利用人機交互方式對后臺自動化結(jié)果進行編輯,編輯后的結(jié)果可以作為進一步更新時空樣本數(shù)據(jù)集,對后臺智能計算模型進行迭代優(yōu)化,形成模型與樣本的優(yōu)化閉環(huán)。
以水體提取為例,后臺運用深度學(xué)習(xí)方法自動提取水體,但其結(jié)果存在毛邊現(xiàn)象,邊界吻合度與生產(chǎn)要求有差距,則前臺進行人機交互編輯修改,形成滿足生產(chǎn)要求的成果,水體提取示例如圖7所示。
圖7 水體提取示例
利用像素準確率(PA)、交并比(IoU)評價深度學(xué)習(xí)自動提取結(jié)果,計算公式為
式中,TP為分類準確的正類;TN為被錯分類為正類的負類;FP為分類準確的負類;FN為被錯分類為負類的正類。
水體提取像素準確率為97.99%,交并比為63.84%。
針對疑似圖斑判讀、質(zhì)量檢查與解譯成果核查等問題,采用“互聯(lián)網(wǎng)+”新技術(shù)、“云+多終端”服務(wù)架構(gòu)[33],構(gòu)建“互聯(lián)網(wǎng)+”內(nèi)外一體化在線解譯平臺,實現(xiàn)內(nèi)外無縫對接,確保數(shù)據(jù)真實準確(圖8)。利用無人機組網(wǎng)監(jiān)測、超分辨率相機視頻監(jiān)測、移動智能感知、衛(wèi)星動態(tài)導(dǎo)航定位等技術(shù),研究內(nèi)外一體在線解譯模式,攻克計算機自動比對、AI智能判讀、人機協(xié)同等技術(shù),根據(jù)影像、照片、視頻、數(shù)據(jù)庫進行屬性標(biāo)注、圖斑邊界檢查、地類一致性檢查等內(nèi)業(yè)核查工作,提高內(nèi)業(yè)解譯效率;外業(yè)共同拍照、實地測量圖斑邊界和認定地類,傳輸?shù)絻?nèi)業(yè)進行核查。通過內(nèi)外業(yè)務(wù)協(xié)同、互聯(lián)互通、在線視頻互聯(lián),實現(xiàn)自然資源要素解譯的線上聯(lián)動、全程監(jiān)控,提高解譯成果的質(zhì)量及整體效率。
圖8 內(nèi)外一體在線解譯思路
第三次全國國土調(diào)查以調(diào)查底圖、舉證資料和最新年度土地調(diào)查數(shù)據(jù)庫為依據(jù),采用智能判讀、互聯(lián)網(wǎng)在線舉證等技術(shù),實現(xiàn)了內(nèi)業(yè)圖斑判讀、外業(yè)舉證核查、內(nèi)業(yè)核查修改,確保了調(diào)查成果符合相關(guān)規(guī)范要求。
針對林草濕、地表基質(zhì)、水資源、海洋等專項調(diào)查監(jiān)測的實際需要,研發(fā)共性處理技術(shù),對樣地調(diào)查、外業(yè)調(diào)繪、圖斑舉證、屬性調(diào)查、定位觀測、移動終端、觀測臺站等數(shù)據(jù)進行處理,解決各類調(diào)查數(shù)據(jù)格式不一、數(shù)據(jù)交叉、指標(biāo)相矛盾等問題,實現(xiàn)海量、多類型、多層次地面調(diào)查數(shù)據(jù)一體化處理[34]。
自然資源要素是一個三維的時空分布,針對二維到三維的自然資源場景要素精細解譯需求,攻克機載LiDAR數(shù)據(jù)、傾斜攝影測量等多源數(shù)據(jù)高精度融合、三維立體場景建模、三維可視化、三維模型管理、空間量算、分層索引等技術(shù),研發(fā)數(shù)字孿生三維環(huán)境可視化系統(tǒng)和三維模型數(shù)據(jù)庫,構(gòu)建自然資源時空立方體,實現(xiàn)“地上下、室內(nèi)外、水上下”地理實體對象與三維環(huán)境的精準映射、可視化表達,使自然資源信息更加形象逼真地展示出來[35],如圖9所示。利用多維度多視角解譯與分析、智能化要素采集、立體協(xié)同解譯等技術(shù),準確提取自然資源要素的結(jié)構(gòu)、幾何等信息,可提高自然資源要素類別精細度與邊界準確度。
圖9 三維環(huán)境立體解譯思路
以建筑物實體采集為例(圖10),以實景三維模型數(shù)據(jù)和正射影像為源數(shù)據(jù),利用智能方法提取具有三維坐標(biāo)的建筑物實體,并人機交互進行檢查、修測、補測,生成結(jié)構(gòu)化的三維矢量,可以清晰準確獲得建筑物的長、寬、高等信息,建筑物結(jié)構(gòu)、窗戶等設(shè)施也能智能高效獲取及在線編輯,減少外業(yè)工作,提升作業(yè)效率。
圖10 建筑物實體采集示例
針對草原植被覆蓋度、森林生物量等參數(shù)調(diào)查需求,依據(jù)我國顯著的地表分異性規(guī)律和專項調(diào)查參數(shù)年際變化規(guī)律[36],構(gòu)建面向自然資源關(guān)鍵參數(shù)的各類樣本庫,以及輻射傳輸、生態(tài)過程[37]、尺度轉(zhuǎn)換、統(tǒng)計關(guān)系等模型庫,綜合利用長時間序列地面調(diào)查樣地數(shù)據(jù)、星載和機載光學(xué)、SAR、LiDAR、高光譜等多源數(shù)據(jù),通過大氣校正、模型構(gòu)建、參數(shù)反演、多維可視化交互等處理,實現(xiàn)不同草原區(qū)域、森林區(qū)域融合星天地數(shù)據(jù)的植被覆蓋度、森林生物量等參數(shù)高精度反演和產(chǎn)品生產(chǎn)[38],如圖11所示。
圖11 關(guān)鍵參數(shù)精準計算與定量反演
針對森林資源數(shù)量、質(zhì)量、生長量、消耗量、生物量等參數(shù)計算,以數(shù)理統(tǒng)計和抽樣理論為基礎(chǔ),依托國家森林資源連續(xù)清查的抽樣框架,利用高空間分辨率與高時間分辨率光學(xué)、激光雷達、SAR遙感數(shù)據(jù),結(jié)合調(diào)查樣地數(shù)據(jù)、數(shù)字高程模型數(shù)據(jù)等,突破星天地多源遙感數(shù)據(jù)融合、遙感影像自動提取、參數(shù)反演建模、衛(wèi)星精準定位、無人機快捷核實等技術(shù),實現(xiàn)森林面積、種類、數(shù)量、質(zhì)量、生長量、消耗量、生物量等參數(shù)的精準計算。
針對草原資源植被結(jié)構(gòu)、覆蓋度、產(chǎn)草量等精準計算,充分利用已有草原調(diào)查監(jiān)測及其他相關(guān)資源調(diào)查監(jiān)測資料,結(jié)合高空間分辨率與高時間分辨率遙感數(shù)據(jù)、調(diào)查實測樣地、樣方數(shù)據(jù)等,突破遙感影像自動提取、遙感建模、參數(shù)反演建模等技術(shù),實現(xiàn)草原植被結(jié)構(gòu)、覆蓋度、產(chǎn)草量等參數(shù)的精準計算。
為確保調(diào)查監(jiān)測的數(shù)據(jù)質(zhì)量,圍繞數(shù)據(jù)多樣性、流程復(fù)雜性及人為因素等質(zhì)量問題產(chǎn)生的根源,建立集自然資源時空信息、生態(tài)環(huán)境知識、人文地理知識等為一體的自然資源質(zhì)量知識圖譜,構(gòu)建集衛(wèi)星遙感、無人機遙感、眾源、互聯(lián)網(wǎng)大數(shù)據(jù)、監(jiān)測站點、樣地樣本、外業(yè)巡查等數(shù)據(jù)為一體的調(diào)查監(jiān)測真實性驗證支撐庫,突破海量時空信息與自然資源信息的一致性檢查、基于知識圖譜與支撐庫的多源信息交叉驗證、互聯(lián)網(wǎng)+眾籌的信息真實性舉證、空地結(jié)合的實地巡檢等多模式驗證技術(shù)[39-40],為各項調(diào)查監(jiān)測提供實時、動態(tài)、可靠的質(zhì)量信息與質(zhì)量預(yù)警服務(wù),如圖12所示。
圖12 高可信質(zhì)量控制與真實性驗證思路
融合地表基質(zhì)、海洋、耕地、林草濕等自然資源認知與管理知識、人文地理知識、質(zhì)量控制體系等知識,構(gòu)建自然資源調(diào)查監(jiān)測質(zhì)量的詞、實體、關(guān)系、事件、規(guī)則模型等,研究知識檢索、分析與推理關(guān)鍵技術(shù),支撐智能化質(zhì)量控制與驗證。
針對不同來源、不同時間、不同類型信息在語義表達、光譜信息等方面的差異性,以時空信息為基礎(chǔ),以自然資源要素、人文地理等的分布、關(guān)系、推演模型為依據(jù),基于知識圖譜與支撐庫,實現(xiàn)多源信息交叉驗證,驗證要素類型、質(zhì)量等一致性與可信度,確保驗證解譯的正確性、信息更新的及時性。
以樣地、樣點、樣方的地面觀測數(shù)據(jù)為基礎(chǔ),與無人機遙感影像、激光雷達點云等數(shù)據(jù)相結(jié)合,輔以衛(wèi)星遙感數(shù)據(jù),分析區(qū)域地理、地貌、地物、人文等特征,推演樣本的代表性,判斷解譯結(jié)果的準確性、調(diào)查監(jiān)測成果的正確性,實現(xiàn)質(zhì)量控制與真實性驗證。
在大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能等新一代信息技術(shù)支撐下,自然資源要素智能解譯取得了重要進展。從解譯范式看,從要素解譯向場景要素耦合解譯發(fā)展,有助于實現(xiàn)高層次場景理解下的精細解譯;從解譯方法看,從數(shù)據(jù)驅(qū)動向知識驅(qū)動發(fā)展,有助于推動智能解譯由數(shù)據(jù)算法思維向語義理解思維轉(zhuǎn)變;從解決手段看,從人工目視向人機協(xié)同發(fā)展,有助于解決解譯模型算法難以滿足業(yè)務(wù)需求的最后一公里問題。
自然資源要素智能解譯面臨著可解譯類別少、要素邊界不準不全、類別屬性可靠性不高等諸多挑戰(zhàn),本文探討了場景要素耦合解譯、知識驅(qū)動語義理解、人機協(xié)同智能解譯、內(nèi)外一體與三維環(huán)境解譯、關(guān)鍵參數(shù)精準計算與定理反演、高可信質(zhì)量控制與真實性檢驗等重點研究方向及其研究內(nèi)容,旨在拋磚引玉,期待更多的學(xué)者一起探討實用、穩(wěn)健、可靠的解譯技術(shù),深化對自然資源的認知[41]。
自然資源要素相互關(guān)聯(lián),過程相互耦合,是有機統(tǒng)一體,需要踐行山水林田湖草沙冰生命共同體理念,從“要素-結(jié)構(gòu)-功能”角度揭示自然資源由表及里的認知規(guī)律,通過遙感獲得要素的光譜、紋理、形狀等信息,通過關(guān)聯(lián)分析得到語義、關(guān)系、格局等結(jié)構(gòu)信息,通過推理決策得到作用、價值等功能信息。
聯(lián)合多源遙感、地理知識、人類認知等手段,分析自然資源場景或現(xiàn)象,利用機器學(xué)習(xí)、遙感定量反演、空間優(yōu)化、空間計算等方法,挖掘自然資源空間分布、過程與格局的模式[42-43],以可定制、可推送的服務(wù)方式為各級用戶提供知識產(chǎn)品與決策方案,實現(xiàn)自然資源“現(xiàn)象-過程-格局”深度認知。