王 玉, 張萬昌, 李旺平, 陳 豪,3, 高會然,3, 黨星海
(1.蘭州理工大學(xué),蘭州 730050; 2.中國科學(xué)院空天信息創(chuàng)新研究院,北京 100094;3.中國科學(xué)院大學(xué),北京 100049)
水資源是人類社會生產(chǎn)發(fā)展的物質(zhì)基礎(chǔ),明確水資源分布是維持社會可持續(xù)發(fā)展、合理調(diào)控水資源和生態(tài)系統(tǒng)平衡等領(lǐng)域的重要研究內(nèi)容[1-2]. 傳統(tǒng)人工監(jiān)測水體方法耗時耗力,難以大范圍監(jiān)測[3]. 遙感技術(shù)的發(fā)展,使得低成本和大范圍的水體監(jiān)測成為可能. 目前為止,遙感技術(shù)已經(jīng)成功應(yīng)用于水體面積、水位、蓄水量和徑流量等水體監(jiān)測與研究之中[4-5]. 其中,Landsat衛(wèi)星影像由于具有長達40多年的免費中高空間分辨率影像,被廣泛應(yīng)用于水體監(jiān)測之中[6].
目前針對遙感影像的水體提取方法主要包括水體指數(shù)法、監(jiān)督分類法、水體特征法等[7-8]. 水體指數(shù)法是以1996年McFeeters提出的歸一化差異水體指數(shù)法(Normalized Difference Water Index,NDWI)和2005年徐涵秋提出的改進歸一化差異水體指數(shù)法(Modified Normalized Difference Water Index,MNDWI)為代表的一類水體提取方法[9-10]. 因其簡單易行,精度較高,已被廣泛應(yīng)用于各類水體提取研究中[11]. 但隨著更精細的多光譜影像波段劃分,水體指數(shù)法已經(jīng)不能完全滿足研究者的需求[12]. 因此許多研究者致力于研究高精度的水體提取方法,如Muller等使用180 000個分為26類的樣本點,運用基于機器學(xué)習(xí)的監(jiān)督分類法提取Landsat影像水體,取得了良好的精度[13]. Tulbure等利用水體指數(shù)法耦合監(jiān)督分類,提取半干旱地區(qū)30年次大陸尺度的水體. 此方法在水體提取時考慮了凸顯水體特征的水體指數(shù),減少了樣本需求,也獲得了高精度的水體提取結(jié)果[14].
凸顯水體特征可以提高水體提取精度,水體特征法被發(fā)展以期獲得高精度的水體提取結(jié)果. 如Jia等針對Landsat 8_OLI(Operational Land Imager,OLI)影像,利用基于光譜匹配的離散粒子群優(yōu)化方法(Spectral Matching Based Discrete Particle Swarm Optimization,SMDPSO)對全球典型區(qū)域水體進行提取. 該方法深度挖掘了OLI影像7個波段的水體特征信息,獲得可以描述水體特征的水體概率分布. 在此基礎(chǔ)上利用離散粒子群優(yōu)化方法(Discrete Particle Swarm Optimization,DPSO)進行水體提取和優(yōu)化,取得了較高的水體提取精度[15]. SMDPSO方法能提取小水坑和細小支流等水體,但也會將雪冰、機場、云及云陰影等地物錯判為水體. 該方法提取水體主要依賴于水體概率,而水體概率的計算依據(jù)與水體光譜曲線的相似程度較高,因此會將與水體具有相似光譜曲線的地物如雪冰、機場、云及云陰影等誤判為水體.
為了降低SMDPSO 方法對與水體光譜特征相似的非水體的誤判率,本文利用最大熵模型(Maximum Entropy Model,MaxEnt)耦合DPSO 方法,構(gòu)建耦合最大熵模型的離散粒子群方法(Maximum Entropy Model Based Discrete Particle Swarm Optimization,MEDPSO),提取了全球6個不同氣候和水體類型的Landsat 8_OLI影像水體. 探討MEDPSO方法的科學(xué)性和合理性,以期提高DPSO方法的水體提取精度以及該方法在遙感提取水體上的應(yīng)用水平.
MEDPSO 方法利用MaxEnt 模型替換SMDPSO 中的光譜匹配方法(Spectral Matching,SM)計算水體概率,提取OLI影像水體. 該方法主要分為兩步:①MaxEnt模型計算水體概率,參考AUC 指標(biāo)選擇熵最大水體概率分布圖. ②通過DPSO方法進行水體優(yōu)化和提取,得到最優(yōu)的水體分布. 其方法流程設(shè)計如圖1.
SM方法通過計算參考光譜o 和地物光譜w 之間的相似度,定量衡量地物與參考地物的相似程度[16]. 最小距離法和光譜角匹配法是光譜匹配中常用的方法,Jia等計算水體概率式(1)結(jié)合考慮了距離相似度(dist)和光譜角相似度(cos)[15].
圖1 MEDPSO方法水體提取流程圖Fig.1 MEDPSO method water extraction flow chart
最大熵可根據(jù)少量已知信息對未知信息的分布進行無偏推斷,認(rèn)為熵最大的事物最可能接近它的真實狀態(tài)[17]. 2004年P(guān)hillips等依據(jù)最大熵原理開發(fā)了MaxEnt模型,只需少量水體樣本點和環(huán)境變量,就能準(zhǔn)確評估環(huán)境變量中水體概率的高低[18].
本文采用3.4.1版Maxent模型,需要輸入以ASCII為格式的環(huán)境變量和以CSV為格式的樣本點經(jīng)緯度坐標(biāo). 環(huán)境變量包括:輻射定標(biāo)的1~7波段影像,NDWI、MNDWI、NDVI(Normalized Difference Vegetation Index,NDVI)、AWEI(Automated Water Extraction Index,AWEI)等水體指數(shù)計算的影像[19]. 通過目視解譯OLI水體影像,在該區(qū)域中隨機選取樣本點. MaxEnt模型參數(shù)設(shè)置,選擇受試者工作特征ROC曲線(Create Response Curves,ROC)評價MaxEnt 模型挖掘水體特征建立預(yù)測模型的準(zhǔn)確性[20-21]. 綜合參考建模與測試的AUC 評價指標(biāo),選取最優(yōu)的水體概率分布輸入DPSO方法.
DPSO方法已被廣泛地應(yīng)用于圖像匹配、圖像增強、數(shù)據(jù)挖掘、多目標(biāo)優(yōu)化等研究領(lǐng)域[22]. DPSO中的每一個D維粒子都代表適應(yīng)度評價函數(shù)T的一個可行解,可行解具有位置向量Xi=[Xi1,Xi2,…,XiD]和改變速率向量Vi=[Vi1,Vi2,…,ViD]兩個特征[23]. DPSO方法構(gòu)建由0,1組成的離散粒子群XID,其中每一個Xi都表示一個4×4柵格的水體分布. 適應(yīng)度評價函數(shù)結(jié)合了離散粒子群與最大熵概率分布,賦予粒子水體概率信息. 通過T值對攜帶水體概率信息的粒子群進行評價,尋找歷史最優(yōu)Pid和全局最優(yōu)Pgd. DPSO方法具體優(yōu)化步驟如:①初始化粒子群XID和VID;②計算適應(yīng)度評價函數(shù)T,尋找Pid和Pgd;③通過Vid學(xué)習(xí)Pid和Pgd,更新Xid;④比較Xid與Pid和Pgd,更新Pid和Pgd;⑤判斷是否滿足終止條件,是則結(jié)束,否則繼續(xù)③~④直至滿足條件為止.
本文通過目視解譯驗證區(qū)域制作水體驗證數(shù)據(jù)集,統(tǒng)計SMDPSO方法和MEDPSO方法水體提取中與水體驗證數(shù)據(jù)集分類一致(正確像元)、分類不一致(錯誤像元)及影像總像元(總像元)個數(shù)組成混淆矩陣[24]. 計算總體精度、Kappa系數(shù)、錯分誤差、漏分誤差,定量評估SMDPSO方法和MEDPSO方法提取水體的精確度.
為了驗證MEDPSO 水體提取方法的通用性,選取全球6個不同氣候條件和水體類型的研究區(qū)(表1)進行水體提取. 參照J(rèn)ia等(2018)SMDPSO方法的研究,選取A~D區(qū)域,其中SMDPSO方法在A~B區(qū)域具有較好的水體提取精度. 在此區(qū)域進行方法對比,可以驗證Maxent 模型耦合DPSO 方法水體提取的可行性.SMDPSO 方法在提取C~D 區(qū)域水體時,某些地物處具有較高的錯分誤差,因此可以檢驗MEDPSO 對水體提取精度提高的有效性. SMDPSO 方法將雪冰、云及云陰影等完全誤判為水體,因此選取E、F 區(qū)域驗證MEDPSO方法在相同條件下水體提取的適用性.
表1 MEDPSO與SMDPSO方法水體提取研究區(qū)Tab.1 MEDPSO and SMDPSO method water extraction research areas
在A~D 研究區(qū)中,選取與SMDPSO 方法相同的驗證區(qū)域a~d作為MEDPSO 方法的驗證區(qū)域. E~F 區(qū)域分別選擇具有云覆蓋、冰雪等e~f區(qū)域,作為研究雪冰、云與云陰影對MEDPSO方法提取水體精度的影響.
本文使用的OLI影像共有9個波段,除波段8是空間分辨率為15 m的全色波段外,其余波段的分辨率均為30 m. 該影像來源于從美國地質(zhì)調(diào)查局(https://earthexplor er.usgs.gov/),L1TP 影像通過地面控制點校正具有較高的精度.
利用IDL(Interactive Data Language,IDL)對OLI 影像1~7波段批量進行輻射定標(biāo)處理,裁剪歸一化處理后,研究區(qū)A~F 和驗證區(qū)a~f 區(qū)域,按波段6(red)、波段5(green)及波段3(blue)假彩色顯示(如圖2). 基于PyCharm 平臺編寫代碼調(diào)用ArcPy 模塊,將影像轉(zhuǎn)化成最大熵模型可讀的ASCII格式. 使用ArcGIS 10.2,隨機采取A~F水體區(qū)域樣本點,以m為單位提取CSV格式的樣本點經(jīng)緯度坐標(biāo)數(shù)據(jù).
圖2 研究區(qū)A~F與驗證區(qū)域a~f假彩色顯示Fig.2 Study area A-F and verification area a-f false color display
圖3展示了SMDPSO方法與MEDPSO方法在A~F區(qū)域提取水體的結(jié)果. 總體來說,在A~D區(qū)域SMDPSO方法將水陸混合、水植混合等地物判別為水體,過高地估計了水體范圍. 而MEDPSO 方法在該區(qū)域能精確地剔除混合像元,獲得高精度的水體提取結(jié)果. E區(qū)域SMDPSO方法過多地將概率高的云及云陰影誤判為水體,而MEDPSO方法抑制云及云陰影像元的水體概率,水體提取顯示出相對更好的結(jié)果. F區(qū)域SMDPSO方法計算雪冰像元時,具有更高的概率值,導(dǎo)致很高的誤判. 而MEDPSO方法由于概率區(qū)分明顯,展示出較好的結(jié)果. 由此可見,水體概率對DPSO方法提取水體影響較大,而SM方法計算水體概率過度依賴地物光譜,導(dǎo)致SMDPSO方法存在較高的誤判率. MEDPSO方法綜合水體光譜以及水體紋理和結(jié)構(gòu)等信息,充分挖掘水體特征,相對于SMDPSO方法提取水體有明顯的改進.
圖3 SMDPSO方法與MEDPSO方法水體提取分布對比Fig.3 Comparison of water extraction distributions between SMDPSO method and MEDPSO method
在圖4中,a~b區(qū)域SMDPSO方法比MEDPSO方法總體精度低9%左右,錯分誤差高20%左右,漏分誤差低4%左右,Kappa系數(shù)低0.19. c~d區(qū)域SMDPSO方法與MEDPSO方法總體精度之間差值不高于3%,c區(qū)域SMDPSO 方法比MEDPSO 方法錯分誤差高38%左右,漏分誤差低4%左右,kappa 系數(shù)低0.18 左右. d 區(qū)域SMDPSO 方法比MEDPSO 方法錯分誤差高13%左右,漏分誤差低3%左右,kappa 系數(shù)低0.07 左右. e、f 區(qū)域SMDPSO 方法相比于MEDPSO 方法結(jié)果差別過大,SMDPSO 方法總體精度和Kappa 系數(shù)太低. 而MEDPSO方法相較于a~d區(qū)域沒有太大的差別,證明MEDPSO方法提取水體具有更高的穩(wěn)定性.
SMDPSO 方法過度地將水陸、水植混合像元誤判為水體(如圖5),導(dǎo)致較高的錯分誤差,而漏分誤差趨近于0. 該方法在細小支流處能夠完全提取水體支流,但也將其鄰近的其他地物誤判為水體. MEDPSO 方法不能夠完全提取細支流,但也能在一定程度上提取水體支流且有較低的錯分誤差. 因此Maxent模型耦合DPSO方法能在水陸混合、水植混合區(qū)域,高精度提取水陸、水植處的水體.
圖4 驗證區(qū)a-f 水體提取結(jié)果精度對比 Fig 4 Comparison of precision of a-f water extraction results in verification area
圖5 驗證區(qū)a~b水體提取結(jié)果Fig.5 Water extraction results in verification area a-b
c區(qū)域是干旱季平谷地區(qū)影像(如圖6),干涸河床在遙感影像上顯示為黑色,與水體具有相似的光譜曲線. 導(dǎo)致SM方法計算得到高的概率值,經(jīng)DPSO方法提取水體后錯分誤差較高. MaxEnt方法在計算干涸河床時得到趨于0的概率值,經(jīng)DPSO方法提取水體后錯分誤差和漏分誤差較低. 由此可知,DPSO方法將概率值高的地物判別為水體. d區(qū)域人工建筑較多,SMDPSO方法將建筑物尤其是黑色公路誤判為水體,具有較高的錯分誤差. MEDPSO方法提取含有人工建筑的水體區(qū)域時,完全不受建筑物的影響. 對比發(fā)現(xiàn),MEDPSO方法能夠更精準(zhǔn)有效地提取水體.
e區(qū)域含云量高(如圖7),SMDPSO方法極易將云及其陰影誤判為水體,導(dǎo)致高達61.6%的錯分誤差. 同樣在冰川、積雪覆蓋的F區(qū)域,SMDPSO方法在提取水體時,幾乎將全部地物錯分為水體,導(dǎo)致非常高的錯分誤差. MEDPSO方法明顯剔除雪、冰、云及其陰影對水體提取的干擾,僅有7%左右的漏分誤差,總體精度最低高達95.89%,Kappa系數(shù)最低高達0.9.
圖6 驗證區(qū)c~d水體提取結(jié)果Fig.6 Water extraction results in verification area c-d
圖7 驗證區(qū)e~f水體提取結(jié)果Fig.7 Water extraction results in verification area e-f
本文針對SMDPSO方法易將與水體具有相似光譜曲線的其他地物誤判為水體的缺點,提出了耦合最大熵模型和離散粒子群優(yōu)化方法(MEDPSO),并通過在全球選取6個研究區(qū)域進行水體提取,對SMDPSO方法和MEDPSO方法在典型區(qū)域進行了定量和定性的比較.
研究表明SMDPSO方法過高估計水體分布范圍,通常擁有很高錯分誤差和一定的漏分誤差. MEDPSO方法錯分誤差與漏分誤差一致較低,因此MESPDO提取水體穩(wěn)定性較高. 一般情況下,MEDPSO方法相比于SMDPSO方法,總體精度提高7%,Kappa系數(shù)提高7%~20%左右. 在雪冰、云及其陰影區(qū)域SMDPSO方法將此類地物完全誤判為水體,MEDPSO方法能剔除雪冰、云及其陰影,高精度提取水體. 綜上所述,MEDPSO方法通過綜合考慮水體特征,降低了SMDPSO方法提取水體時對光譜曲線的依賴,顯著提高了DPSO方法在水體提取精度.