徐 旭 (安徽省第一測繪院,安徽 合肥 230031)
水是重要的基礎(chǔ)地理信息之一,與人類的生產(chǎn)生活息息相關(guān)。快速、準(zhǔn)確地從衛(wèi)星遙感影像上獲取水體信息,對水資源調(diào)查及監(jiān)測、濕地保護(hù)、洪澇災(zāi)害評估等方面具有實(shí)用意義。隨著信息技術(shù)的發(fā)展,各行業(yè)對基礎(chǔ)地理信息更新的需求巨大,迫切需要發(fā)展高分辨率遙感作為大規(guī)模采集手段,如何從遙感影像中快速自動提取專題信息,是當(dāng)前關(guān)注的熱點(diǎn)[1]。
目前,影像解譯仍依賴于人工,效率低、工作量大。近幾十年來,該領(lǐng)域的研究主要有單波段閾值法、譜間關(guān)系法、基于知識的自動判別法等;Chaudhuri[2]使用多種子監(jiān)督分類技術(shù)來分離水體與非水體區(qū)域;劉建波[3]等利用密度分割法從TM影像中提取水體范圍;郁金康[4]等用決策樹分類方法有效提取山區(qū)水體。但以上方法很難適用于高分辨率遙感影像。
本文以計(jì)算機(jī)視覺、圖像處理等技術(shù)為基礎(chǔ),設(shè)計(jì)出一個自動提取水體的方案,目的是通過自動提取減少重復(fù)性工作,輔助人工修改檢查,減少錯提、漏提問題,提高工作效率。
本文以水體為研究對象,分析水體目標(biāo)的視覺特征,通過選擇適當(dāng)?shù)奶卣鲄?shù)建立模型,并驗(yàn)證提取結(jié)果,與人工識別對比分析。
水與其它地物不同,有其自身特點(diǎn):①形狀不確定性;②反射率不固定性;③局部與整體的關(guān)聯(lián)性。水在不同部分表現(xiàn)出的外觀趨于一致,即由局部水體特性可推斷出更大區(qū)域的特性。此外,水體的視覺識別還包括顏色、亮度、紋理等特征。
本文選取色調(diào)(H)、飽和度(S)、亮度(I)這些容易獲取的特征,新增紅色波段與亮度的比值(RrI)作為第4個參數(shù),構(gòu)建水體自動識別模型。R、G、B為一個像素紅、綠、藍(lán)的分量,對圖像進(jìn)行HIS變換,這里采用經(jīng)典幾何推導(dǎo)公式:
比值圖像的像素值定義式為:RrI=(R+1)/(I+1)2
構(gòu)建本模型的基本思路如下:用鼠標(biāo)在影像有代表性的水體位置劃線,獲取采樣窗口的中心坐標(biāo);通過9×9采樣窗口函數(shù)獲取采樣點(diǎn)四個特征的范圍;對每個樣本的特征進(jìn)行中值濾波作為輸出值,對每個參數(shù)的有效范圍二值化,處理后的像素值只有0或1,感知器神經(jīng)網(wǎng)絡(luò)的等權(quán)重均為1,通過感知器的像素值在數(shù)據(jù)集{0,1,2,3,4}中,值大于等于4的判斷為水體。在通過感知器神經(jīng)網(wǎng)絡(luò)模型之前,需要進(jìn)行帶通濾波器轉(zhuǎn)換。
計(jì)算濾波器的有效范圍是難點(diǎn)。本文提出基于最小距離的自動閾值計(jì)算方法,不依賴采樣操作,有效保留小樣本特征的分布特性。引入類別數(shù)C假設(shè)C=2,即濾波器可通過濾波值的分布范圍數(shù)為2;假定數(shù)集S0表示所有樣本某一特征的全部集合,按升序排序后得到S,用A和B表示其最大值和最小值,該算法判別規(guī)則是找到一對數(shù)值(xi,xi+1)∈S,使│xi-A│+│B-xi+1│的和最小,即求其對偶問題使(xi+1-xi)最大。計(jì)算Di=(xi+1-xi)后排序,提取最大值Dm及對應(yīng)的數(shù)值對[xi,xi+1],則[A,xi]和[xi+1,B]即為濾波器組的可通過范圍。
結(jié)合水體局部與整體可互證性的特點(diǎn),對提取算法優(yōu)化:如果某點(diǎn)識別為水、周圍n1個點(diǎn)(設(shè)為8后調(diào)整)不是水,那么該點(diǎn)很大概率不是水;如果某點(diǎn)識別不為水,周圍n2個點(diǎn)是水,則該點(diǎn)判斷為水。
算法運(yùn)行后得到提取水體的柵格數(shù)據(jù),水體為藍(lán)色,非水體仍為影像RGB初始值,需要用ArcGIS軟件處理轉(zhuǎn)換為矢量數(shù)據(jù)。先柵格轉(zhuǎn)面,添加面積字段,設(shè)置面積閾值,選取大面導(dǎo)出;再采用平滑工具,設(shè)置適當(dāng)?shù)钠屏?,使水面邊緣盡量平滑。
精度分析需要選取一個好的參照對象,目前仍是目視解譯提供可靠準(zhǔn)確的結(jié)果。本文選取一致度C來度量兩個對象之間的近似程度。定義式為:C=1-(DA+DV)/(TA+TV),其中,DA為模型識別為水體、人工拒絕識別為水體的像素總數(shù);DV為模型拒絕識別為水體、但被人工識別為水體的像素總數(shù);TA為模型識別為水體的像素總數(shù);TV為人工識別所有水體的像素總數(shù)。對不同方法提取結(jié)果在空間上的比較,采用擦除工具獲取。
本文所用數(shù)據(jù)為巢湖流域資源三號衛(wèi)星影像。從2016年巢湖流域DOM中選取數(shù)十幅影像用于測試效果。這里選取一幅代表性影像展示,大小為706×690像素,分辨率1m。
圖1(a)包含河流和池塘,紅線部分為人工采樣線,不同水體的顏色差異較大,水體3、4偏藍(lán),0、1、2偏綠,0比1亮度明顯偏低。使用模型提取并軟件處理,疊加原始影像后顯示;采用隨機(jī)樹分類方法提取水體,藍(lán)色為水體;人工提取水體結(jié)果為shp數(shù)據(jù),柵格化處理后,黑色為水體。
模型提取結(jié)果與實(shí)際水體之間的差別主要在水體邊界上,池塘2和5顏色均勻清晰,提取出完整水面。通過調(diào)整參數(shù)找出最優(yōu)解,計(jì)算模型提取與人工識別的一致度為98.06%,隨機(jī)樹方法提取與人工識別的一致度為96.26%;模型提取的時間消耗與采樣難易程度有關(guān),與影像復(fù)雜程度有關(guān),該影像模型提取配合軟件處理和人工修改共耗時20.4min,全部人工作業(yè)需耗時32.6min,生產(chǎn)效率提高了37.4%。結(jié)果表明,本模型提取結(jié)果與人工解譯很接近,具有較高的一致度,自動提取效果優(yōu)于軟件,總體效率優(yōu)于人工提取,能夠達(dá)到減少重復(fù)性工作、提高工作效率的目的。
造成邊界差異原因可能有幾個方面:①處于邊緣的水體性質(zhì)受外界因素影響,與其它部分明顯不同;②水面目標(biāo)如橋梁、船只,在衛(wèi)星成像上只能看到目標(biāo)物;③一些高大物體如建筑、植被陰影遮擋住水體局部,使得成像上無法表現(xiàn)出水體特征而影響判斷。
圖1 原始影像及三種方法提取結(jié)果
本文基于水體視覺特征及圖像處理技術(shù),提出了一種適合于彩色高分辨率遙感影像的水體自動提取方法,通過試驗(yàn)取得了良好的效果。文中參數(shù)設(shè)置是在大量試驗(yàn)基礎(chǔ)上人工設(shè)定的,如何自動獲取參數(shù)以及解決遮擋物的干擾,是后續(xù)研究的方向。