陳安旭,李月臣
(1. 重慶師范大學(xué)地理與旅游學(xué)院,重慶 401331;2. 西南大學(xué)地理科學(xué)學(xué)院 遙感大數(shù)據(jù)應(yīng)用重慶市工程研究中心,重慶 400715;3. GIS 應(yīng)用研究重慶市高校重點實驗室,重慶 401331;4. 重慶金佛山喀斯特生態(tài)系統(tǒng)教育部野外科學(xué)觀測研究站,重慶 400715)
水稻是中國乃至全球最重要的糧食作物之一。2018年,水稻種植面積約占中國糧食種植面積的1/4,稻谷產(chǎn)量約占中國糧食產(chǎn)量的1/3。水稻的有效監(jiān)測對保障國家糧食安全,水資源有效管理及溫室氣體排放至關(guān)重要[1-2]。近年來,遙感技術(shù)因其宏觀動態(tài)的優(yōu)點被廣泛運(yùn)用于水稻產(chǎn)量、面積、物候等信息的提取[3-5]。水稻遙感提取的方法可分為單時相提取與多時相提取。區(qū)別在于前者利用水稻特殊時期的地物特征,后者則融合水稻多個時期的地物特征進(jìn)行提取。鄔明權(quán)等[6]融合MODIS 時間分辨率和ETM+空間分辨率的影像提取了南京市江寧區(qū)水稻種植面積,提取精度為93%,Kappa系數(shù)為0.96。Xiao 等[7]基于多時相MODIS 數(shù)據(jù)對中國南方的水稻種植區(qū)進(jìn)行提取,達(dá)到較好的分類效果,并認(rèn)為所用的水稻制圖算法同樣適用于水稻占主導(dǎo)地位的其他亞洲國家,但其后續(xù)研究[8]發(fā)現(xiàn)該算法并不適用于識別小塊稻田。雖然多時相提取憑借更豐富的光譜信息能比較全面的反映水稻的地物特征,但所用數(shù)據(jù)源以中低空間分辨率的影像為主,適用于種植面積較大,云霧天氣較少的地區(qū)[9-10]。山區(qū)水稻種植區(qū)受地形、氣候等條件的限制,云霧天氣較多,稻田呈現(xiàn)規(guī)模小、破碎分散的特點,中低空間分辨率的影像顯然不適用,尋找質(zhì)量較好的數(shù)據(jù)源是開展研究前需要解決的問題。單時相提取涉及到水稻特殊時期的界定,Zhang 等[11]認(rèn)為移栽蓄水期的水稻生長在被淹沒的土壤中,稻田是開放水域和綠色水稻植物的混合物,具備更易識別的地物特征。但此觀點忽視了其他生長階段,缺乏對各生長階段分類精度的比較,水稻的其他生長階段是否更易區(qū)別于其他地類值得進(jìn)一步探討。此外,選擇分類特征時,多數(shù)研究側(cè)重選取歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)、地表水指數(shù)(Land Surface Water Index,LSWI)等傳統(tǒng)的植被指數(shù)與水體指數(shù)作為分類特征,忽視了水稻在不同生長階段下不同的形態(tài)特點,在選擇分類特征的豐富度與適應(yīng)性上也有待完善。
基于上述問題,本研究將結(jié)合多種分類特征對不同生長階段的水稻進(jìn)行提取,定量的評價各生長階段水稻的分類精度,并基于空間分辨率為10 m 的Sentinel-2 影像探究適用于山區(qū)水稻種植區(qū)的提取方法。
巴南區(qū)位于重慶市主城區(qū)南部(29°7"44"N ~29°45"43"N,106°26"2"E~106°59"53"E),地形以山地丘陵為主,平均海拔434.23 m,氣候為亞熱帶季風(fēng)氣候,年日均氣溫約為18 ℃,年均總降水量約為1 200 mm。區(qū)內(nèi)土地覆被以耕地與林地為主,建筑、工業(yè)、道路等用地集中分布在西部地區(qū),水域以長江干流和大型湖泊水庫為主。巴南區(qū)水稻種植歷史悠久,樵坪山、石灘鎮(zhèn)種植的大米品質(zhì)較好,是重慶市主城區(qū)重要的糧食產(chǎn)地,2017 年糧食產(chǎn)量達(dá)到30.26 萬t。由于受到地形影響,巴南區(qū)大部分水稻物候期相對較晚,經(jīng)過實地走訪調(diào)查,通常5—6 月犁田插秧,7—8 月水稻生長,8 月末—9 月中旬成熟收割。
圖1 研究區(qū)區(qū)位圖 Fig.1 Location of study area
本研究所用的數(shù)據(jù)包括Sentinel-2 影像數(shù)據(jù),ASTER GDEMV2 高程數(shù)據(jù),研究區(qū)邊界矢量數(shù)據(jù),實地考察數(shù)據(jù)。Sentinel-2 影像的波段信息如表1 所示。Sentinel-2提供 Level-1C 和 Level-2A 兩種處理級別的數(shù)據(jù),Level-1C 經(jīng)過輻射定標(biāo)、幾何校正(包括空間配準(zhǔn)和正射校正),Level-2A 是在Level-1C 的基礎(chǔ)上經(jīng)過大氣校正的產(chǎn)品。
依據(jù)水稻的生長特點,選取水多苗小的5—6 月作為發(fā)育期,水苗各半的7—8 月作為生長期,放水收割的8月底—9 月作為成熟期,發(fā)育期與生長期影像成像時間為2019 年,數(shù)據(jù)級別為L2A。成熟期由于2019 年和2018年的云量較多,所以選擇質(zhì)量較好的2017 年的影像(表 2)。對選取的影像應(yīng)用三次卷積法將低分辨率的波段重采樣為10 m。
ASTER GDEMV2 高程數(shù)據(jù)由日本METI 和美國NASA 共同研制,數(shù)據(jù)的空間分辨率精度和高程精度有所提高。該數(shù)據(jù)空間分辨率為30 m,利用三次卷積法將數(shù)據(jù)重采樣為10 m 分辨率。此外,涉及的研究區(qū)范圍、河流等矢量數(shù)據(jù)均來自全國地理信息資源目錄系統(tǒng)。
本研究結(jié)合研究區(qū)實際情況,將地物劃分為5 類:水稻、其他植被(旱地作物、草地、雜草荒地)、林地(各類木本植物用地)、水體、建設(shè)用地(包括建筑物、道路、裸地)。由于水田季節(jié)形態(tài)的多樣性,部分水田僅通過目視解譯難以與其他地物區(qū)分,需要實地考察選取訓(xùn)練樣本。實地考察于2019 年8 月在界石鎮(zhèn)、石灘鎮(zhèn)、木洞鎮(zhèn)、南泉鎮(zhèn)等12 個鄉(xiāng)鎮(zhèn)開展,采集到樣本點:水稻125 個、其他植被152 個、水體50 個,將其作為分類樣本。
表1 Sentinel-2 影像數(shù)據(jù)波段介紹 Table 1 Waveband parameters of Sentinel-2
表2 水稻各生長階段所選影像數(shù)據(jù) Table 2 Selected image data at each rice growth stage
圖2 實地采樣點與考察線路 Fig.2 Field sampling points and survey lines
在數(shù)據(jù)預(yù)處理的基礎(chǔ)上,通過 SNAP(Sentinal Application Platform)、ENVI5.3、ArcGIS10.2 分別計算影像的光譜特征、紋理特征和地形特征作為分類特征。在實地考察數(shù)據(jù)的基礎(chǔ)上,通過目視解譯補(bǔ)充分類樣本,再通過SEaTH(Separability and Thresholds)算法對備選特征進(jìn)行篩選,最后通過ENVI5.3 中的隨機(jī)森林分類模塊對其進(jìn)行分類,從分類結(jié)果中隨機(jī)選取若干點作為驗證點,構(gòu)建誤差矩陣,比較水稻各生長階段的分類結(jié)果差異。
圖3 技術(shù)流程圖 Fig.3 Technical flowchart
基于水稻的植物與水屬性,選取了CIgreen、DVI、EVI、EVI2、mNDVI、MSR、NDVI、OSAVI、PVI、RVI、WDRVI共11 個植被指數(shù),LSWI、MNDWI、MSI、NDBI、WL2015、AWEI、NDWI 共7 個水體指數(shù),并基于Sentinel-2 數(shù)據(jù)特有的3 個紅邊波段,選區(qū)CIred-edge、IRECI、MCARI、MCARI2、mNDVIre、MSRre、MTCI、NDre1、NDre2、NDVIre1、NDVIre2、NDVIre3、SRre共13 個紅邊指數(shù),分類特征如表3 所示。此外,有研究表明,紋理特征與地形特征可適當(dāng)提高分類精度[12-13]。本研究利用ENVI5.3 工具計算均值、方差、協(xié)同性、對比度、相異性、信息熵、二階矩和相關(guān)性8 個紋理特征,利用ArvGIS10.2 工具計算起伏度、山體陰影,利用ENVI5.3 工具計算坡度、坡向、剖面曲率、水平曲率,將DEM 高程數(shù)據(jù)作為海拔。與影像的12 個原始波段共同組成58 個分類特征。
表3 前期初選特征說明及計算方法 Table 3 Description of original feature and calculate method
前期選擇的分類特征共計58 個,如果全部用于圖像分類當(dāng)中,勢必會引起數(shù)據(jù)冗余和過度干擾,降低分類精度。本研究運(yùn)用SEaTH 算法篩選分類特征,該算法的基本思想是在分類特征服從正態(tài)分布的條件下,利用Jeffries-Matusita 距離(J-M 距離)來衡量類間可分性,即特征值的分離度J 可由式(1)和式(2)計算得出
式中1m 、2m 為樣本對應(yīng)的每個特征值的均值;1σ 、2σ 為本對應(yīng)的每個特征值的標(biāo)準(zhǔn)差;B 為巴氏距離;J 的取值區(qū)間為[0,2],其中0 代表2 個類別在某一特征上幾乎完全混淆,2 代表2 個類別在某一特征上能夠完全分離[35]。
通過實地考察與目視解譯,最終選取的分類樣本數(shù)量為:水稻682 個、其他植被557 個、水體335 個、林地458 個、建設(shè)用地514 個,通過計算各樣本所對應(yīng)各特征值的均值和方差來計算分離度。由于側(cè)重提取水稻,分離度中涉及水稻的,將選取J >1 的前4 種分類特征,未涉及水稻的,將選取J >1 的前2 種分類特征,并包括重復(fù)的分類特征。
圖像分類方法一直是遙感研究的熱點,不同的地區(qū)選擇不同的分類方法可以得出不同的分類結(jié)果?;诜诸悢?shù)據(jù)的多維度性與研究區(qū)地形的復(fù)雜程度[35-36],本研究選取隨機(jī)森林分類法。該方法被證明在分類精度與速度,處理高維遙感影像數(shù)據(jù)方面優(yōu)于傳統(tǒng)監(jiān)督分類方法。隨機(jī)森林可以解釋若干自變量(X1,X2,…,Xk)對因變量Y 的作用。如果因變量Y 有N 個觀測值,有k 個自變量與之相關(guān);在構(gòu)建分類樹的時候,隨機(jī)森林會隨機(jī)地在原數(shù)據(jù)中重新選擇N 個觀測值建立決策樹。同時,隨機(jī)森林隨機(jī)地從k 個自變量選擇M 個變量進(jìn)行決策樹節(jié)點的確定。每次構(gòu)建的決策樹都不完全一樣,最后選擇重復(fù)程度最高的樹作為最終結(jié)果[37]。隨機(jī)森林算法中N和M 兩個參數(shù)的設(shè)置對分類結(jié)果影響并不敏感,利用默認(rèn)值可以達(dá)到較優(yōu)分類效果,研究采用默認(rèn)設(shè)置,N 值為100,M 為分類特征個數(shù)的算術(shù)平方根。分類后,從結(jié)果中隨機(jī)選取樣本點,利用谷歌高精度遙感影像對驗證樣本通過構(gòu)建混淆矩陣,計算Kappa 系數(shù),用戶精度、制圖精度、總體精度等驗證指標(biāo)進(jìn)行精度檢驗,比較不同生長階段,水稻提取的分類精度差異。
水稻發(fā)育期篩選后的分類特征數(shù)量為16 個,其中B7、B12 等波段特征,對各地類均有較高的分離度。CIgreen、MSR 等植被指數(shù)主要用于水稻與林地及其他植被的分離,IRECI、MTCI 等紅邊指數(shù)對水稻與水體、建設(shè)用地的分離度較高;水稻生長期篩選后的分類特征數(shù)量為13 個,其中mNDVI、CIgreen等植被指數(shù)對水稻與水體、建設(shè)用地的分離度較高,NDWI、LSWI 等水體指數(shù)用于區(qū)分水稻與水體、建設(shè)用地;水稻成熟期篩選后的分類特征數(shù)量為12 個,其中水稻與其他植被的分離度較差,mNDVIre、MSRre等紅邊指數(shù)總體分離作用最大,WDRVI、NDVI 等植被指數(shù)主要區(qū)分水稻與林地。
表4 水稻各生長階段篩選后的分類特征 Table 4 Classified features after screening at each rice growth stage
本研究的分類方法性質(zhì)上屬于基于像元分類,分類結(jié)果中難免存在小斑塊,為減少小斑塊對分類精度的影響,本研究將通過卷積濾波的方法對分類結(jié)果進(jìn)行分類后處理,其原理是:將較大類別中的虛假像元?dú)w到該類中,目的是為了提高分類精度。最后的分類結(jié)果如圖 4所示,各生長階段所提取的水稻區(qū)域大致相同,受地形影響,水稻分布呈現(xiàn)分散破碎的特點。巴南區(qū)城鄉(xiāng)空間差異明顯,水稻主要分布于巴南區(qū)北部的木洞鎮(zhèn)、二圣鎮(zhèn)、惠民鎮(zhèn),南部的接龍鎮(zhèn)、石灘鎮(zhèn)、石龍鎮(zhèn)。
圖4 水稻各生長階段分類結(jié)果圖 Fig.4 Images of classified results at each rice growth stage
為防止構(gòu)建混淆矩陣時,因驗證樣本數(shù)量過少,導(dǎo)致精度驗證結(jié)果不準(zhǔn)確的問題,本研究選取的總體與水稻的驗證樣本數(shù)量分別為2 100 和500 個,驗證結(jié)果如圖 5 所示。其中,發(fā)育期、生長期、成熟期的用戶精度分別為0.93、0.88、0.85;制圖精度分別為0.93、0.96、0.93;總體分類精度分別為0.92、0.92、0.91;Kappa 系數(shù)分別為0.90、0.90、0.88。除用戶精度相差較大以外,其他指標(biāo)差距不大,發(fā)育期的用戶精度遠(yuǎn)高于生長期和成熟期,說明發(fā)育期是提取水稻最理想的生長階段;成熟期的用戶精度,制圖精度,總體分類精度,Kappa 系數(shù)均為3 個水稻生長期數(shù)據(jù)中最低,相較于發(fā)育期和生長期,成熟期數(shù)據(jù)不適宜用于進(jìn)行水稻地物的提取。
圖5 水稻各生長階段精度驗證比較圖 Fig.5 Comparison chart of accuracy verification at each rice growth stage
SEaTH 算法廣泛的運(yùn)用于分類特征的篩選。在付勇勇等[38]對雷州半島的水體與非水體進(jìn)行分類,江春梅[39]對福州市永泰縣水稻進(jìn)行提取的研究中,特征篩選結(jié)果均表明光譜特征的分離度最大,紋理、地形特征的利用率不高。圖6 為水稻各生長階段篩選后的分類特征數(shù)量對比圖。特征篩選后的分類特征表明,水稻各生長階段的分類特征以植被指數(shù)與波段特征為主。紅邊指數(shù)與水體指數(shù)的季節(jié)變化明顯,紅邊指數(shù)多用于水稻發(fā)育期,主要分離水稻與林地、其他植被。水體指數(shù)可以反映地表水的分布情況,多用于生長期。紋理、地形特征只用于發(fā)育期,未用于生長期與成熟期。雖然兩類特征在分類中能起到適當(dāng)提高精度的作用,但作用并不明顯。
圖6 水稻各生長階段篩選后的分類特征數(shù)量對比圖 Fig.6 Comparison of the number of classified features after screening at each rice growth stage
圖7 通過比較各生長階段中地物間的分離度(用平均值表示)與錯漏分像元數(shù)量的關(guān)系后發(fā)現(xiàn),各生長階段均呈現(xiàn)出分離度與錯漏分?jǐn)?shù)量成反比的趨勢,即分離度越大的地物,其錯漏分像元數(shù)量越少。此外,水稻在不同生長階段與不同的地類混淆,發(fā)育期各類地物間的分離情況較好,生長期易與林地、其他植被混淆,成熟期易與建設(shè)用地、其他植被混淆。在對分類結(jié)果進(jìn)行精度驗證后發(fā)現(xiàn):發(fā)育期是提取水稻最理想的生長階段,部分研究中也提到水稻發(fā)育期有易于識別稻田的關(guān)鍵特征[40-41];山區(qū)的水稻提取與平原地區(qū)相比,分類精度仍有差距,Zhang 等[11]基于MODIS 時間序列數(shù)據(jù)對東北平原的水稻進(jìn)行提取,用戶精度和總體精度分別達(dá)到96%和97%,Dong 等[42]基于Landsat-8 影像對中國東南部的水稻進(jìn)行提取,總體精度可以達(dá)到95%;由于本研究選取了過多的水稻驗證樣本點,造成其他地類的疏忽,總體分類精度與實際情況難免存在一定的誤差。
圖7 水稻各生長階段地物間分離度與錯漏分像元對比圖 Fig.7 Comparison chart of ground objects separation and error-leakage pixel at each rice growth stage
本研究通過對不同生長階段的水稻進(jìn)行提取得出以下結(jié)論,經(jīng)過SEaTH 算法對分類特征進(jìn)行篩選可去除分離度較低的分類特征,提高工作效率,避免數(shù)據(jù)冗余的情況;Sentinel-2 影像憑借其10 m 的空間分辨率與5 d 一景的重返周期經(jīng)試驗證明能一定程度上克服圖像獲取的困難,是山區(qū)理想的數(shù)據(jù)源;精度驗證結(jié)果表明水稻發(fā)育期的用戶精度最高,為0.93,說明水稻處于發(fā)育期時,更易與其他地物進(jìn)行區(qū)分,在影像質(zhì)量較好的情況下可作為山地水稻提取的首選。
此外,本研究方法僅適用于小范圍水稻提取,用于大范圍水稻提取勢必增加工作成本,降低效率,GEE(Google Earth Engine)作為遙感大數(shù)據(jù)云平臺,依托其強(qiáng)大的云計算能力為今后擴(kuò)大研究區(qū)范圍提供參考;水稻生長期得到的用戶精度為0.88,同樣達(dá)到較高的分類精度,在影像質(zhì)量允許的條件下,是否能通過影像融合的方法將發(fā)育期與生長期的數(shù)據(jù)結(jié)合,以得到更高的分類精度有待日后繼續(xù)研究;本研究所用分類方法實質(zhì)屬于基于像元的影像分類,難免出現(xiàn)虛假像元的情況,未來可采取影像分割,面向?qū)ο蟮姆诸惙椒ㄏ摷傧裨挠绊憽?/p>