于基業(yè),張新利,李 珊
(1.長(zhǎng)安大學(xué)地質(zhì)工程與測(cè)繪學(xué)院,陜西西安710054;2.國(guó)家測(cè)繪地理信息局第一航測(cè)遙感院,陜西西安710054)
遙感對(duì)地觀測(cè)具有快速、覆蓋范圍廣、周期性等特點(diǎn),成為最重要的地理國(guó)情監(jiān)測(cè)數(shù)據(jù)獲取手段[1]。監(jiān)督分類(lèi)是遙感分類(lèi)的重要方法,是模式識(shí)別技術(shù)在遙感技術(shù)領(lǐng)域的具體應(yīng)用[2-3],過(guò)程主要包括影像預(yù)處理、分類(lèi)判別和分類(lèi)后處理三大步驟[4-5],其核心在于模式(樣本)的選取,樣本的選擇受作業(yè)人員對(duì)待分類(lèi)目標(biāo)的認(rèn)知程度、目視判讀傾向性和影像上像素值及像素分布等多重因素影響。對(duì)于大范圍地表數(shù)據(jù)的提取,其分類(lèi)結(jié)果受當(dāng)?shù)氐牡匦巍夂虻葪l件的影響,精度不高[6],一般采用裁切影像、單景影像分類(lèi)的方法。在具體工程中,為實(shí)現(xiàn)多景影像接邊,一般是在影像重疊區(qū)選擇若干成對(duì)樣本點(diǎn)。但該方法具有以下局限性:當(dāng)多景影像在重疊位置的像素差距較大時(shí),難以為相鄰景影像選擇成對(duì)的樣本點(diǎn);當(dāng)影像裁剪不規(guī)則,需要與周?chē)嗑坝跋襁M(jìn)行接邊時(shí),重疊區(qū)樣本位置的確定具有盲目性;工作流程繁瑣,不利于管理,為保證接邊一致性可能導(dǎo)致多次樣本選取及重分類(lèi)工作;在重疊區(qū)域選取的樣本只能被單幅影像使用,利用率不高。
本文基于“多景影像重疊區(qū)域的像素代表的必是同一類(lèi)地物”的思想對(duì)傳統(tǒng)方法進(jìn)行擴(kuò)展,使影像公用邊的樣本只采集一次,利用接邊樣本數(shù)據(jù)庫(kù)的管理手段,使這些公共的樣本點(diǎn)為多幅相鄰影像共用,其優(yōu)點(diǎn)是:對(duì)于重疊部分像素差異大的多景影像,只在其中一景影像處找到典型的、可以明確判斷地物類(lèi)型的區(qū)域,建立樣本,其他與之相接的影像只需拷貝這些樣本即可,這樣不僅降低了樣本選取的難度,并且提高了樣本選擇的精度;對(duì)于幾何邊界復(fù)雜,與多景影像接邊的情況,這種樣本的建立方式提高了樣本的重用性,降低了樣本采集的工作量;利用采樣樣本數(shù)據(jù)庫(kù),有利于重疊區(qū)域的樣本管理,滿足數(shù)據(jù)工程的管理要求。
影像樣本重用的依據(jù)是:多景影像重疊區(qū)域所表示的地物對(duì)于每一景影像是一致的,具有相同的波譜特征;在統(tǒng)一的坐標(biāo)參考下,若某些樣本的坐標(biāo)包含在若干景影像的坐標(biāo)范圍內(nèi),則這些樣本是這些影像的公共樣本。如式(1)所示,其中p代表樣本點(diǎn),A、B、C 代表影像。
如圖1所示,圖中的灰色區(qū)域是影像A與影像C的重疊區(qū)域,該區(qū)域中所有的像素表示的地物在影像A與C中是一致的;對(duì)于樣本p,有p∈A,p∈B,因此,p點(diǎn)是影像A和B的共用樣本;對(duì)于樣本q,有 q∈A,q∈B,q∈C,因此,q 點(diǎn)是影像 A、B 和C的共用樣本。
基于此,可以擴(kuò)展傳統(tǒng)的接邊采樣辦法,即在多景影像的公共坐標(biāo)位置,為每一景影像建立一類(lèi)地物的樣本。
圖1 樣本重用原理示意圖
本文以ENVI軟件為工具進(jìn)行研究,在ENVI中,傳統(tǒng)監(jiān)督分類(lèi)作業(yè)流程是:根據(jù)影像的像素判斷地物類(lèi)型,建立樣本文件(region of interest,ROI),為了促進(jìn)多景影像接邊,需要打開(kāi)一景或多景相鄰影像(接邊規(guī)則通常是沿著一個(gè)方向的,例如,接邊方向是西北接?xùn)|南,只需打開(kāi)東南方向的相鄰影像即可),建立地理關(guān)聯(lián)(geographic link),在影像重疊的位置,結(jié)合相鄰影像的影像情況或已分類(lèi)的結(jié)果情況,為待分類(lèi)影像建立樣本文件,最后執(zhí)行監(jiān)督分類(lèi)。
多景影像樣本重用分類(lèi)方法的流程如圖2所示。
圖2 多景影像樣本重用分類(lèi)流程圖
首先將待分類(lèi)的影像圖號(hào)信息輸入影像信息庫(kù),獲得該影像的外輪廓SHP文件,遍歷樣本數(shù)據(jù)庫(kù)中的所有樣本點(diǎn),判斷這些點(diǎn)是否在待分類(lèi)影像范圍內(nèi),將存在于該范圍的樣本點(diǎn)作為結(jié)果,輸出成ENVI指定的 ASCII格式,利用 ENVI的“Input Points from ASCll”功能導(dǎo)入樣本點(diǎn),以此為基礎(chǔ),在影像的其他區(qū)域進(jìn)行采樣。最后將最終的采樣結(jié)果導(dǎo)出ASCII文件,再次存入到樣本數(shù)據(jù)庫(kù)。
核心技術(shù)主要包括接邊ROI的獲取、接邊樣本數(shù)據(jù)庫(kù)的建立、影像信息庫(kù)的建立等。
在ENVI中,ROI可以在ROI Tool中導(dǎo)出ASCII碼,用TXT文檔打開(kāi)這個(gè)文件,其文件結(jié)果如圖3所示。
圖3 ENVI中ROI的ASCII文件格式
圖3中,以“;”起始的信息是說(shuō)明信息,分別標(biāo)識(shí)了ENVI產(chǎn)品版本、分類(lèi)總數(shù)、文件像素的范圍;空一行依次是ROI分類(lèi)的名稱(chēng)、RGB值、該分類(lèi)中選取的樣本總像素個(gè)數(shù),同樣以空行區(qū)分每一個(gè)分類(lèi)的信息;以“;ID”為起始的數(shù)據(jù)部分就是各個(gè)分類(lèi)中的具體像素信息,其中X、Y表示該像素的像素坐標(biāo),MapX、MapY代表經(jīng)過(guò)變換后的坐標(biāo),Lat、Lon代表經(jīng)緯度,B1—B6代表各個(gè)波段值,同樣,不同類(lèi)別的樣本通過(guò)空行的方法進(jìn)行區(qū)分。
根據(jù)樣本重用的原理,能被公用的樣本應(yīng)在各張影像上具有相同的坐標(biāo),唯一不同的是像素坐標(biāo)和波段值,這意味著如果影像A和影像B的范圍包含樣本點(diǎn)像素p的坐標(biāo),p是來(lái)自影像A的樣本,只需要將像素點(diǎn)p的像素坐標(biāo)進(jìn)行平移變換到B相應(yīng)的像素上即可,p導(dǎo)入到B中以后會(huì)自動(dòng)獲取B影像該像素位置的波段值,作為以后分類(lèi)的基礎(chǔ)。
建立公共接邊處的樣本數(shù)據(jù)庫(kù),一方面將這些可能會(huì)重用的ROI文件管理起來(lái);另一方面加快影像獲得所需ROI數(shù)據(jù)的速度,提高數(shù)據(jù)的使用效率,這一點(diǎn)與空間數(shù)據(jù)工程的要求是一致的[7]。接邊樣本數(shù)據(jù)庫(kù)設(shè)計(jì)見(jiàn)表1。
表1 接邊數(shù)據(jù)庫(kù)字段設(shè)計(jì)
在數(shù)據(jù)庫(kù)檢索過(guò)程中,輸入影像的范圍信息,查找包含在該影像范圍內(nèi)的點(diǎn),獲得屬于該影像的像素信息;再按照“Class”的類(lèi)型生成ENVI ROI文本的規(guī)定格式,即可作為該影像的分類(lèi)樣本并參與之后的分類(lèi)。
在對(duì)影像進(jìn)行裁剪等相關(guān)操作時(shí),一般使用ArcGIS制作影像的外輪廓SHP文件,這些SHP文件與影像的實(shí)際范圍是一致的,將這些影像SHP文件進(jìn)行統(tǒng)一存儲(chǔ),以影像景號(hào)作為SHP文件檢索的主碼,并作為判別公共樣本點(diǎn)的依據(jù)。
土地覆蓋變化研究是全球環(huán)境變化研究的重要組成部分[8-10],本試驗(yàn)是對(duì)某區(qū)域植被信息提取,采用監(jiān)督分類(lèi)。在分類(lèi)的樣本選擇過(guò)程中,應(yīng)用傳統(tǒng)方式和多景影像樣本重用方法進(jìn)行對(duì)比試驗(yàn),對(duì)其接邊情況進(jìn)行對(duì)比分析。
試驗(yàn)數(shù)據(jù)采用某區(qū)域的TM影像,空間分辨率為30 m。經(jīng)過(guò)大氣校正、幾何校正、裁剪等處理,相鄰影像之間具有幾十像素的重疊區(qū)域。
參考數(shù)據(jù):USGS 2001全球地表覆蓋成果,Google Earth影像。輔助數(shù)據(jù):SHP格式的掩膜文件,包括耕地、人造覆蓋、水體和冰川等。軟件環(huán)境:ENVI 4.7 ,ArcGIS 9.3。
1)數(shù)據(jù)準(zhǔn)備:對(duì)影像進(jìn)行批量像素值值域轉(zhuǎn)換,并進(jìn)行水系、人造覆蓋批量掩膜,得到待分類(lèi)的影像數(shù)據(jù)。
2)監(jiān)督分類(lèi):監(jiān)督分類(lèi)的樣本采集過(guò)程采用對(duì)比試驗(yàn)的方法。第一種是傳統(tǒng)的接邊樣本選取方法,即在影像的重疊區(qū)域選取成對(duì)的樣本點(diǎn),作為控制組;第二種方法采用多景影像樣本重用的方法進(jìn)行采樣。在非重疊區(qū)域,兩種方式的影像采樣點(diǎn)保持一致,每一類(lèi)3型樣本點(diǎn)數(shù)量為40左右。樣本選取完畢后,用SVM方法進(jìn)行分類(lèi)。
3)分類(lèi)后處理:濾波像元大小設(shè)定為5像素×5像素,處理后,對(duì)比兩種樣本選擇方式的處理結(jié)果。
以兩幅相鄰的像素值差異較大的影像為例,將原始影像(掩膜后)和分類(lèi)后的成果在ArcMap中打開(kāi),結(jié)果如圖4所示。
圖4 兩種采樣方式分類(lèi)結(jié)果對(duì)比
圖4中,(a)為兩張?jiān)加跋?,其接邊處像素顏色差異較大(如(b)所示),(c)為控制組采樣方法的分類(lèi)結(jié)果,(d)是采用多景影像樣本重用方法的分類(lèi)結(jié)果。從圖4中可以看出,采用樣本重用方法的接邊效果優(yōu)于傳統(tǒng)方法。導(dǎo)致這種結(jié)果的原因是對(duì)于顏色差異較大的影像,很難在顏色復(fù)雜的影像上找到確定的地物樣本;而樣本重用的方法可以將已知的確定的樣本復(fù)制到接邊影像,這有利于促進(jìn)影像接邊的一致性,同時(shí)減少了樣本的采集量。
本文針對(duì)傳統(tǒng)監(jiān)督分類(lèi)影像重疊區(qū)域接邊存在的問(wèn)題,優(yōu)化、改進(jìn)了重疊區(qū)域的樣本選取策略和作業(yè)流程,提出了“多景影像監(jiān)督分類(lèi)的樣本重用”方法,利用樣本庫(kù)對(duì)重用的樣本進(jìn)行管理。實(shí)際分類(lèi)結(jié)果證明這一方案可行,有利于保證多張影像的接邊一致性和正確性;同時(shí),對(duì)于大區(qū)域、多人參與的分類(lèi)工作,該方法提供的接邊樣本降低了采樣工作量,對(duì)于應(yīng)用監(jiān)督分類(lèi)進(jìn)行地理國(guó)情監(jiān)測(cè)、大區(qū)域地表覆蓋研究等大型項(xiàng)目的效率提高具有重要意義。
[1]李德仁,眭海剛,單杰.論地理國(guó)情監(jiān)測(cè)的技術(shù)支撐[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2012,37(5):505-512.
[2]王圓圓,李京.遙感影像土地利用/覆蓋分類(lèi)方法研究綜述[J].遙感信息,2004(1):53-59.
[3]劉仁釗,廖文峰.遙感圖像分類(lèi)應(yīng)用研究綜述[J].地理空間信息,2005,3(5):11-13.
[4]張銀輝,趙庚星.土地利用/土地覆蓋遙感分類(lèi)方法的研究綜述[J].中國(guó)農(nóng)業(yè)資源與區(qū)劃,2002,23(3):21-25.
[5]蔣艷凰.遙感圖像高精度并行監(jiān)督分類(lèi)技術(shù)研究[D].長(zhǎng)沙:國(guó)防科技大學(xué),2004.
[6]郭艷芬,劉志紅,謝明元.基于知識(shí)與監(jiān)督分類(lèi)的青南高原植被信息提?。跜]∥中國(guó)氣象學(xué)會(huì).北京:[s.n.],2008:277-282.
[7]劉瑜,張毅,鄔倫.空間數(shù)據(jù)工程理論框架研究[J].地理與地理信息科學(xué),2003,19(1):12-15.
[8]王素敏,翟輝琴.遙感技術(shù)在我國(guó)土地利用/覆蓋變化中的應(yīng)用[J].地理空間信息,2004,2(2):31-32.
[9]楊立君,馬明棟,唐立軍.基于TM影像的崇明東灘濕地植被分類(lèi)研究[J].水土保持研究,2013,20(1):126-130.
[10]喬朝飛.國(guó)外地理國(guó)情監(jiān)測(cè)概況與啟示[J].測(cè)繪通報(bào),2011(11):81-83.