張曉冉 黃玨 季民
摘要:我國(guó)是農(nóng)業(yè)大國(guó),快速、準(zhǔn)確獲取旱地信息可為農(nóng)業(yè)監(jiān)測(cè)、災(zāi)害識(shí)別、發(fā)展規(guī)劃等提供重要的基礎(chǔ)數(shù)據(jù)。為提高農(nóng)業(yè)信息提取效率,本研究基于自動(dòng)閾值,提出一種針對(duì)我國(guó)北方旱地光譜特征的旱地提取方法。該方法基于歸一化建筑指數(shù)(NDBI),通過(guò)直方圖雙峰法確定初步分割閾值;針對(duì)灰度直方圖中正態(tài)擬合后的旱地信息,使用波峰分離度指標(biāo)和適用條件以確定精確的分割閾值。該方法成功應(yīng)用于4個(gè)研究區(qū)的26景Landsat8 OLI影像,分類精度優(yōu)于常用的監(jiān)督分類法、非監(jiān)督分類法及面向?qū)ο蠓诸惙ǎ梢詫?shí)現(xiàn)自動(dòng)、準(zhǔn)確的旱地分布信息提取。
關(guān)鍵詞:旱地信息提取;自動(dòng)閾值選取;NDBI;直方圖雙峰法;全自動(dòng)
中圖分類號(hào): P237? 文獻(xiàn)標(biāo)志碼: A
耕地是人類生存的基本資源和條件,是人類生活的保障和基礎(chǔ)[1]。我國(guó)耕地資源常分為水田和旱地2種類型,其中旱地占耕地總面積的568%。遙感技術(shù)在提取旱地信息中因具有操作靈活、提取準(zhǔn)確等優(yōu)勢(shì),備受關(guān)注[2]。實(shí)時(shí)、高效獲取旱地信息以實(shí)現(xiàn)對(duì)旱地面積的監(jiān)測(cè)、分析與預(yù)測(cè)是我國(guó)目前農(nóng)業(yè)研究領(lǐng)域的熱點(diǎn)之一。目前,國(guó)內(nèi)外常用的監(jiān)督分類、非監(jiān)督分類與面向?qū)ο蠓诸惖群档胤诸惙椒?,均取得了較為理想的提取效果[3-8],如李丹等采用多時(shí)相遙感影像對(duì)黑龍江省鶴崗市進(jìn)行旱地信息提取,使用全球土地覆蓋(GLC)和支持向量機(jī)(SVM)的監(jiān)督分類方法,為研究區(qū)旱地利用保護(hù)提供基礎(chǔ)數(shù)據(jù)[9];曹倩倩等使用Landsat 8數(shù)據(jù)對(duì)安徽省泗縣進(jìn)行旱地信息提取,分別使用了非監(jiān)督分類的迭代自組織數(shù)據(jù)分析技術(shù)(ISODATA)和K-均值(K-means)算法,提取精度分別為80.48%、 81.02%[10];李敏等以江蘇省鹽城市作為研究區(qū)域,采用面向?qū)ο蟮姆椒?,利用eCognition軟件提取了該地旱地信息,最終提取精度為94.1%[11];鄧勁松等運(yùn)用簡(jiǎn)單決策樹(shù)模型區(qū)分旱地和水田,并去除了容易混淆的園地,相比常規(guī)的監(jiān)督分類方法有很大的提高[12]。
雖然上述方法在旱地提取中被廣泛應(yīng)用,但在分類過(guò)程中人工干預(yù)較多,具有一定的主觀性與傾向性。例如監(jiān)督分類方法雖然是通用方法,但是嚴(yán)重依賴解譯人員的經(jīng)驗(yàn);非監(jiān)督分類與面向?qū)ο蠓诸惗即嬖谶\(yùn)算量大、迭代實(shí)驗(yàn)的問(wèn)題,嚴(yán)重影響了提取效率;決策樹(shù)方法雖然分類精度較高,但是某一區(qū)域的分類條件難以適用于其他地區(qū),可移植性較差?;谕ㄓ媚P偷暮档匦畔⒆詣?dòng)提取仍然是一個(gè)挑戰(zhàn)。因此,本研究提出一種基于自動(dòng)閾值選取的旱地信息提取方法,并將該方法應(yīng)用于Landsat8 OLI影像數(shù)據(jù),同時(shí)利用高空間分辨率影像作為真值,對(duì)提取方法的性能進(jìn)行評(píng)價(jià)。
1 研究區(qū)與數(shù)據(jù)源
1.1 研究區(qū)
選取我國(guó)黑龍江省齊齊哈爾市富??h、河南省焦作市修武縣、山東省濟(jì)南市長(zhǎng)清區(qū)和安徽省蚌埠市懷遠(yuǎn)縣等作為研究區(qū)域。黑龍江省、河南省、山東省和安徽省均位于平原地區(qū),地形平坦,降水豐沛,水資源豐富,土壤肥沃,農(nóng)業(yè)發(fā)達(dá),在2018年全國(guó)31個(gè)省市糧食產(chǎn)量排行中居于前4名,并稱為“中國(guó)糧倉(cāng)”。根據(jù)調(diào)查和試驗(yàn)發(fā)現(xiàn),富??h、修武縣、長(zhǎng)清區(qū)及懷遠(yuǎn)縣農(nóng)田分布較廣且在歸一化建筑指數(shù)(NDBI)灰度圖中與其他地物分離明顯,因此選為研究區(qū)域。各區(qū)域的地理位置與直方圖雙峰信息如圖1所示。
1.2 數(shù)據(jù)源
研究數(shù)據(jù)來(lái)源于地理空間數(shù)據(jù)云(http://www.gscloud.cn/)30 m空間分辨率的Landsat8 OLI衛(wèi)星遙感影像數(shù)據(jù),自動(dòng)提取旱地信息;選擇來(lái)源于LocaSpace Viewer軟件中0268 m空間分辨率的谷歌衛(wèi)星影像為底圖,采用目視解譯法,得到各區(qū)域真實(shí)的旱地與非旱地信息。區(qū)域與遙感影像的總數(shù)分別為4、26。表1為數(shù)據(jù)源信息,主要為2013—2018年4—9月植被正常生長(zhǎng)、云層覆蓋較少、大氣狀況良好的數(shù)據(jù),每期數(shù)據(jù)均完全覆蓋研究區(qū)域。多景數(shù)據(jù)以判定初始閾值,加粗的日期為旱地精確提取的主影像時(shí)間。
2 自動(dòng)閾值選取模型
基于精確閾值分割方法,通過(guò)NDBI的計(jì)算、閾值統(tǒng)計(jì)與粗定閾值、擬合正態(tài)分布函數(shù)及確定精確閾值等步驟,構(gòu)建旱地信息的全自動(dòng)提取模型(圖2)。由于本研究選擇NDBI提取旱地信息,且所選影像的成像當(dāng)日天氣狀況良好,多發(fā)生瑞利散射,所以不考慮大氣對(duì)遙感影像的影響。
2.1 NDBI與旱地
結(jié)合NDBI計(jì)算公式與使用經(jīng)驗(yàn)可知,在NDBI圖像中,城鎮(zhèn)用地與裸地的值均大于0,非城鎮(zhèn)用地的值小于0。非城鎮(zhèn)用地分類一般包括水體、林地、耕地等。純凈的自然水體在近紅外和短波紅外波段的呈象近似于一個(gè)“黑體”,即水幾乎吸收了其全部的能量而不進(jìn)行反射,因此,在近紅外和短波紅外波段,較純凈的自然水體的反射率也很低,幾乎趨近于0。經(jīng)大量試驗(yàn)證實(shí),在NDBI小于0的范圍內(nèi),其灰度直方圖(圖3)中存在2個(gè)明顯的峰(P林地與P旱地),且其中1個(gè)峰為旱地信息。為了清晰辨別旱地,本研究提出自動(dòng)閾值選取模型,自動(dòng)選擇直方圖中2個(gè)峰之間的精確分割閾值。
2.2 直方圖雙峰法
直方圖雙峰法在遙感領(lǐng)域中,常用于陸地和水體圖像分割中的閾值選擇[13-15]。其應(yīng)用前提是使用灰度圖創(chuàng)建柱狀直方圖,當(dāng)其灰度級(jí)直方圖具有較為明顯的雙峰特性時(shí),將直方圖中2個(gè)峰值之間的谷值用作圖像分割的閾值。若背景地物的灰度值在整個(gè)圖像中可以合理地看作為恒定,而且所有目標(biāo)地物與背景地物都具有幾乎相同的對(duì)比度,則選擇一個(gè)正確的、固定的全局閾值會(huì)有較好的分割效果[16]。為了避免閾值的偶然性和不穩(wěn)定性,本研究通過(guò)計(jì)算多幅影像的直方圖、提取大量谷值形成閾值范圍Rt(圖3),將平均谷值定義為初始閾值Ti[17]?;谥狈綀D雙峰法,初步分離旱地與其他地物信息,為精確提取做準(zhǔn)備。
2.3 精確閾值
賈祎琳等在應(yīng)用直方圖雙峰法選取閾值時(shí),將2個(gè)峰之間的谷值,即最小值點(diǎn),作為分割閾值[18-19]。但經(jīng)試驗(yàn)表明,直接取最小值作為分割閾值在實(shí)際應(yīng)用中效果并不理想。為找尋更精確的閾值,本研究經(jīng)大量試驗(yàn)發(fā)現(xiàn)NDBI灰度直方圖中旱地的波形與正態(tài)分布函數(shù)基本吻合(圖4),可以
取灰度直方圖中的旱地信息,計(jì)算均值(μ)及標(biāo)準(zhǔn)差(σ),并將其擬合為正態(tài)分布函數(shù)。如圖4所示,正態(tài)分布函數(shù)的“經(jīng)驗(yàn)法則”為精確閾值選取的基礎(chǔ):約68%的數(shù)值分布在距離μ有±σ之內(nèi)的范圍,約95%的數(shù)值分布在距離μ有±2σ之內(nèi)的范圍,以及約99.7%的數(shù)值分布在距離μ有±3σ之內(nèi)的范圍。為了提高模型的適用性,本研究提出動(dòng)態(tài)閾值確定方法,根據(jù)不同區(qū)域的旱地面積及分布形態(tài)的特點(diǎn),分別從±σ、±2σ、±3σ這3種范圍中,動(dòng)態(tài)選取最為精確的閾值范圍,以確保旱地提取的有效性與靈活性。
為解決在3個(gè)閾值取值中選取最優(yōu)閾值的難題,本研究對(duì)多個(gè)區(qū)域進(jìn)行試驗(yàn),通過(guò)分析NDBI直方圖分布特征,發(fā)現(xiàn)閾值的選擇與波峰的分離程度息息相關(guān),因此建立波峰分離度指標(biāo)Si(公式1):若S3<0,則以±3σ為閾值,否則繼續(xù)計(jì)算S2;若S2<0,則以±2σ為閾值,否則以±σ為閾值。計(jì)算公式如下:
式中:i表示σ取3、2、1倍;Ti表示閾值取值;Pl表示旱地信息的波峰所對(duì)應(yīng)的灰度值;Po表示林地信息的波峰所對(duì)應(yīng)的灰度值。利用上述方法獲得圖像分割的專用閾值,并成功地實(shí)現(xiàn)了旱地的自動(dòng)提取。
2.4 精度評(píng)定
為探索模型的可用性,并對(duì)所提模型的實(shí)用性進(jìn)行更好的評(píng)價(jià),本研究將自動(dòng)閾值選取模型的提取結(jié)果與直方圖雙峰法初步提取結(jié)果作比較,用于判定自動(dòng)閾值選取模型的提取效果是否優(yōu)于最小值閾值提取模型。同時(shí),通過(guò)與其他常規(guī)方法(監(jiān)督分類、非監(jiān)督分類、面向?qū)ο蠓诸悾┍容^,對(duì)自動(dòng)閾值模型進(jìn)行定量精度分析。另以±4σ作為評(píng)定標(biāo)準(zhǔn),評(píng)價(jià)自動(dòng)閾值模型提取效果是否隨閾值范圍的擴(kuò)大而效果更優(yōu)。
為了定量評(píng)價(jià)不同旱地提取方法的精度,本研究采用遙感目視解譯法,在0.268 m空間分辨率的谷歌衛(wèi)星影像上明確旱地分布,并進(jìn)行二值化處理,作為真值。選擇總體分類精度(Rall)為主要評(píng)價(jià)因子,對(duì)整體分類情況做出評(píng)價(jià);選擇偽陽(yáng)性率(FPR)與真陽(yáng)性率(TPR)構(gòu)建接收器操作特征(ROC)空間[20],作為輔助評(píng)價(jià)因子,便于分析自動(dòng)閾值選取模型的提取精度。FPR與TPR計(jì)算公式如下:
式中:FP為自動(dòng)提取結(jié)果中旱地被漏判為非旱地像元的個(gè)數(shù);TN為自動(dòng)提取結(jié)果中非旱地被正確判識(shí)為非旱地像元的個(gè)數(shù);TP為自動(dòng)提取結(jié)果中旱地被正確判識(shí)為旱地像元的個(gè)數(shù);FN為自動(dòng)提取結(jié)果中非旱地被誤判為旱地像元的個(gè)數(shù)。
3 結(jié)果與分析
本研究以富??h、修武縣、長(zhǎng)清區(qū)和懷遠(yuǎn)縣為例,使用自動(dòng)閾值選取模型進(jìn)行旱地信息提取,從圖5可知,4個(gè)研究區(qū)域內(nèi)均有少量旱地信息的邊界未被正確識(shí)別,但總體而言提取精度較高。結(jié)合表2可知,富裕縣、修武縣、長(zhǎng)清區(qū)、懷遠(yuǎn)縣等研究區(qū)據(jù)初始閾值提取的精度分別為0.641 3、0.851 2、0858 2、0.747 0,相比之下,自動(dòng)閾值選取模型的精度分別達(dá)到0.814 1、0.891 5、0.923 5、 0.828 4,證實(shí)了自動(dòng)閾值選取模型的提取精度更高,改進(jìn)了單以2個(gè)谷值最低點(diǎn)為閾值的方法。此外,本模型精度明顯優(yōu)于常用的監(jiān)督分類法、非監(jiān)督分類法及面向?qū)ο蠓诸惙椒ǎC明了本模型的可用性與優(yōu)越性,既實(shí)現(xiàn)了全過(guò)程自動(dòng)化,也大大提高了分類方法的可移植性。與距標(biāo)準(zhǔn)差±4σ為閾值的提取結(jié)果相比,自動(dòng)閾值選取模型的提取結(jié)果與遙感目視解譯結(jié)果的一致性更高,解決了模型提取效果是否隨閾值范圍的擴(kuò)大而更優(yōu)的疑問(wèn)。
通過(guò)對(duì)比4個(gè)區(qū)域旱地面積占各區(qū)域總面積的百分比以及對(duì)應(yīng)的提取精度,發(fā)現(xiàn)旱地面積比大于40%的地區(qū)提取精度稍差。其原因可能是對(duì)于旱地面積比相對(duì)較小的地區(qū),其直方圖中旱地波形范圍較小,因此2個(gè)峰相距較遠(yuǎn)、分離明顯,導(dǎo)致提取精度較高。
圖6為4個(gè)研究區(qū)不同旱地提取算法的ROC空間構(gòu)建結(jié)果。ROC空間特征:離左上角(0,1)越近的點(diǎn)表示分類準(zhǔn)確率越高;離右下角(1,0)越近的點(diǎn),準(zhǔn)確率越低。從(0,0)到(1,1)的對(duì)角線將ROC空間劃分為左上、右下2個(gè)區(qū)域,結(jié)果顯示幾乎研究區(qū)的全部提取結(jié)果都集中在左上部分,分類結(jié)果較好。以(0,1)為圓心,以模型提取結(jié)果的ROC點(diǎn)到(0,1)點(diǎn)的距離為半徑畫1/4圓,發(fā)現(xiàn)除自動(dòng)閾值選取模型外,其他方法的ROC點(diǎn)均不位于圓內(nèi),進(jìn)一步證明本研究提出的自動(dòng)閾值選取模型的準(zhǔn)確率最高。
雖然本研究所提自動(dòng)閾值選取模型在Landsat8 OLI衛(wèi)星影像中取得了較高的精度,但該算法仍然存在一定的局限性:(1)由于本模型的提出是基于NDBI指數(shù),所以自動(dòng)計(jì)算閾值法更多地依賴于地物的波譜特征,更適用于提取農(nóng)作物成熟期的旱地,4—9月提取結(jié)果更加精確;(2)閾值的自動(dòng)選取是基于直方圖雙峰法,這就要求影像中有較為明顯的目標(biāo)地物和背景地物,因此對(duì)于貧瘠地區(qū),旱地提取效果并不十分明顯。
4 結(jié)論
考慮到當(dāng)前常規(guī)旱地分類方法的不足,本研究提出了一種針對(duì)我國(guó)北方旱地光譜特征、基于自動(dòng)閾值選取的旱地提取方法,利用2013—2018年多景遙感數(shù)據(jù),精確提取了富裕縣、修武縣、長(zhǎng)清區(qū)及懷遠(yuǎn)縣的旱地信息。通過(guò)與其他常規(guī)分類方法、不同閾值選取結(jié)果進(jìn)行比較發(fā)現(xiàn),自動(dòng)計(jì)算閾值模型簡(jiǎn)單、易操作,具有較高的通用性和靈活性,可以有效提高旱地信息提取的精度和效率。
參考文獻(xiàn):
[1]蓋 樂(lè). 盤山縣農(nóng)村居民點(diǎn)整治潛力評(píng)估及分區(qū)研究[D]. 北京:首都師范大學(xué),2013.
[2]王 丹,葛大兵,唐伊凡,等. 洞庭湖生態(tài)經(jīng)濟(jì)區(qū)農(nóng)田景觀格局變化及其驅(qū)動(dòng)力[J]. 江蘇農(nóng)業(yè)科學(xué),2018,46(8):245-250.
[3]Julien Y,Sobrino J A,Jiménez-Muoz J C. Land use classification from multitemporal Landsat imagery using the Yearly Land Cover Dynamics (YLCD) method[J]. International Journal of Applied Earth Observations and Geoinformation,2011,13(5):711-720.
[4]牛魯燕,張曉艷,鄭繼業(yè),等. 基于Landsat8 OLI數(shù)據(jù)的山東省耕地信息提取研究[J]. 中國(guó)農(nóng)學(xué)通報(bào),2014,30(34):264-269.
[5]Goodin D G,Anibas K L,Bezymennyi M. Mapping land cover and land use from object-based classification:an example from a complex agricultural landscape[J]. International Journal of Remote Sensing,2015,36(18):4702-4723.
[6]楊 栩,楊潤(rùn)書,朱大明,等. 基于遙感數(shù)據(jù)的耕地信息提取方法研究[J]. 軟件導(dǎo)刊,2018,17(9):166-170,174.
[7]Frohn R C,Reif M,Lane C,et al. Satellite remote sensing of isolated wetlands using object-oriented classification of Landsat-7 data[J]. Wetlands,2009,29(3):931-941.
[8]李 峰,王 昊,秦 泉,等. 基于HJ-1 CCD影像的玉米種植面積估算研究[J]. 山東農(nóng)業(yè)科學(xué),2016,48(2):138-142.
[9]李 丹,梁 欣,孫麗娜,等. 基于多時(shí)相遙感影像的耕地利用信息提取研究[J]. 現(xiàn)代測(cè)繪,2018,41(4):21-24.
[10]曹倩倩,黃袁升. 基于Landsat8 OLI影像的泗縣耕地信息提取[J]. 陰山學(xué)刊(自然科學(xué)版),2017,31(3):58-60.
[11]李 敏,崔世勇,李成名,等. 面向?qū)ο蟮母叻直媛蔬b感影像信息提取——以耕地提取為例[J]. 遙感信息,2008(6):63-66,89.
[12]鄧勁松,王 珂,沈掌泉,等. 基于特征波段的SPOT-5衛(wèi)星影像耕地信息自動(dòng)提取的方法研究[J]. 農(nóng)業(yè)工程學(xué)報(bào),2004,20(6):145-148.
[13]Prewitt J M S, Mendelsohn M L. The analysis of cell images[J].Annals of the New York Academy of Sciences,1966,128(3):1035-1053.
[14]Li J L,Sheng Y W,Luo J C. Automatic extraction of himalayan glacial lakes with remote sensing[J]. Journal of Remote Sensing,2011,15(1):29-43.
[15]Khandelwal A,Karpatne A,Marlier M E,et al. An approach for global monitoring of surface water extent variations in reservoirs using MODIS data[J].Remote Sensing of Environment,2017,202:113-128.
[16]楊修國(guó). 關(guān)于直方圖雙峰法的研究與改進(jìn)[J]. 電子設(shè)計(jì)工程,2012,20(12):176-179.
[17]Zhang F F,Li J S,Zhang B,et al. A simple automated dynamic threshold extraction method for the classification of large water bodies from landsat-8 OLI water index images[J]. International Journal of Remote Sensing,2018,39(11):3429-3451.
[18]賈祎琳,張 文,孟令奎. 面向GF-1影像的NDWI分割閾值選取方法研究[J]. 國(guó)土資源遙感,2019,31(1):95-100.
[19]李景福,趙進(jìn)輝. 基于閾值的彩色農(nóng)業(yè)圖像分割方法研究[J]. 安徽農(nóng)業(yè)科學(xué),2007,35(28):8869-8870.
[20]陳 亮. 基于頻域分析和結(jié)構(gòu)聚類的fMRI數(shù)據(jù)處理方法研究[D]. 大連:大連海事大學(xué),2017.
文章編號(hào):1002-1302(2020)14-0248-07
收稿日期:2019-07-29
基金項(xiàng)目:國(guó)家自然科學(xué)基金(編號(hào):41706194);山東科技大學(xué)人才引進(jìn)科研啟動(dòng)基金;山東省自然科學(xué)基金(編號(hào):ZR2016DB23)。
作者簡(jiǎn)介:張曉冉(1997—),女,山東濟(jì)南人,主要從事定量遙感研究。E-mail:sloth1601020536@163.com。
通信作者:黃 玨,博士,講師,主要從事定量遙感研究。E-mail:huangjue@sdust.edu.cn。