李志鵬,李正國,劉珍環(huán),吳文斌,譚杰揚,楊 鵬※
(1.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所/農(nóng)業(yè)部農(nóng)業(yè)信息技術(shù)重點實驗室,北京 100081;2.中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院,廣州 510275)
水稻在我國糧食生產(chǎn)中占有重要的地位,是我國重要的糧食作物之一,占全國糧食總播種面積的27%,而其產(chǎn)量則達(dá)到糧食總產(chǎn)量的35%[1]。與此同時,水稻面積遙感動態(tài)監(jiān)測正成為農(nóng)作物空間監(jiān)測[2]和土地變化科學(xué)[3]的熱點問題。精確的水稻種植面積信息,可為農(nóng)業(yè)生產(chǎn)、水稻產(chǎn)量的預(yù)報和評估、糧食價格預(yù)測和國家糧食生產(chǎn)布局及規(guī)劃等提供科學(xué)依據(jù)[4]。
中分辨率遙感影像由于具備較高的空間分辨率,能夠滿足我國大面積水稻作物監(jiān)測,成為業(yè)務(wù)化運行的主要數(shù)據(jù)源。中空間分辨率影像包括Landsat TM/ETM+、SPOT、CBERS-1/2 CCD、HJ-1A/1B CCD等 (表1),其分辨率主要在100m以內(nèi),是當(dāng)前最常用的水稻遙感監(jiān)測數(shù)據(jù)源,其特征是衛(wèi)星類型多、覆蓋范圍廣、時間分辨率較高且時間序列較長,可實現(xiàn)大范圍、多時期水稻種植的長期監(jiān)測。Peng等[5]利用1986年和2002年兩期Landsat TM影像對麗江縣包括水稻在內(nèi)的土地利用變化進(jìn)行分析,實現(xiàn)了對過去16年間水稻種植變化特征分析;朱曉禧等[6]利用1988年和1998年Landsat TM影像,獲取了黑龍江省西部地區(qū)的水稻和玉米種植圖。中分辨率影像是當(dāng)前作物遙感監(jiān)測分類及變化監(jiān)測中常用的數(shù)據(jù)源,也是我國農(nóng)情業(yè)務(wù)運行遙感監(jiān)測系統(tǒng)中的主要數(shù)據(jù)源,但因其對應(yīng)的遙感自動分類方法存在缺陷,容易降低分類的精度。
針對以上的不足,該研究擬嘗試近些年常用的神經(jīng)網(wǎng)絡(luò)和面向?qū)ο笏惴ú⒔Y(jié)合多時相影像中分辨影像進(jìn)行分類對比研究。神經(jīng)網(wǎng)絡(luò) (Artificial Neural Network,簡稱ANN)是一種非線性的處理單元,具有知識的分布式存儲,信息處理的并行結(jié)構(gòu)方式,可以處理復(fù)雜的數(shù)據(jù)集,識別更精細(xì)的模式。它對于數(shù)據(jù)的類型和分布函數(shù)沒有特殊的要求,容忍度高、容錯性強,對于離散的、非正態(tài)分布多源數(shù)據(jù)的處理非常適合[7]。該方法與其它分類方法相比較,具有適應(yīng)性強,精度較高的優(yōu)勢[8]。與傳統(tǒng)的基于像元的分類方法相比,基于地物的光譜、植被指數(shù) (NDVI)、形狀、紋理及結(jié)構(gòu)等多源信息的面向?qū)ο蠓诸惒粌H充分考慮遙感影像的各種信息,而且突破了傳統(tǒng)方法以單個像素作為識別單元的局限,以多個同類像素的集合作為基本單元。該算法不僅適用于高分影像,對于中分辨率影像同樣適用[9]。中分辨率遙感影像分類提取水稻多基于單一時相進(jìn)行分類識別,但基于單一時相遙感影像進(jìn)行水稻面積提取面臨的共同問題在于時相的選擇,而最佳時相影像 (灌水移栽期)的選擇可以強化水稻信息,弱化其它因子的干擾[10]。因此,只有準(zhǔn)確的掌握研究區(qū)域的水稻生長發(fā)育期并選取該時段影像[11],才能夠提取出高精度的水稻空間分布信息。
該研究擬選取中分辨率TM影像為數(shù)據(jù)源,以我國水稻生產(chǎn)第一大縣——富錦市為研究區(qū)域,基于神經(jīng)網(wǎng)絡(luò)算法、面向?qū)ο蠓诸愃惴岸鄷r相遙感影像選擇對比分析開展研究。該文通過探討兩種分類算法在水稻提取過程中的差異及分類過程中最佳時相的選擇問題,以期找到解決提高基于中分辨率水稻遙感監(jiān)測分類精度的問題,為水稻遙感動態(tài)監(jiān)測、作物空間格局演變和農(nóng)業(yè)土地變化科學(xué)研究等提供科學(xué)支撐。
表1 中分辨率水稻遙感監(jiān)測常用數(shù)據(jù)源
該文選擇全國水稻第一縣 (市)的黑龍江省富錦市為研究區(qū),富錦位于黑龍江省東北部、松花江下游南岸,富錦是三江平原腹地的中心城市 (131°25'~133°26'E,46°51'~47°31'N),全境總面積8 227 km2,周邊與樺川縣、同江市等7個縣 (市)相鄰。富錦市氣候?qū)儆谥袦貛Т箨懶约撅L(fēng)氣候;年平均氣溫3.4℃,最冷月平均氣溫-19.0℃,最熱月平均氣溫22.2℃;年平均降水量510mm;地勢低平,平均海拔60m左右。主要糧食作物包括水稻、小麥、大豆和玉米。
該研究主要采用的數(shù)據(jù)為2景Landsat-5 TM影像,軌道號為114-027,數(shù)據(jù)接收時間為2010-06-06和08-25日,分別處于水稻的返青期、乳熟期,遙感影像覆蓋富錦市90%以上的地區(qū),并基于富錦市矢量文件對TM影像進(jìn)行裁剪,完成分類前期數(shù)據(jù)準(zhǔn)備。該數(shù)據(jù)從美國地質(zhì)勘探局 (USGS)網(wǎng)站(http://earthexplorer.usgs.gov)下載。數(shù)據(jù)為L1T數(shù)據(jù)產(chǎn)品,已經(jīng)過系統(tǒng)輻射校正和地面控制點幾何校正,并且通過DEM進(jìn)行了地形校正,基本滿足研究區(qū)域分類要求。
基于谷歌高分辨率影像對研究區(qū)內(nèi)進(jìn)行樣本采集,具體采樣過程是:首先,選取谷歌地球上2010年覆蓋富錦市地區(qū)的高分辨率遙感影像;其次,依據(jù)隨機采樣原則對整個富錦市的主要地物類型 (水稻、旱地、林地、建設(shè)用地及水體等)進(jìn)行采樣,共選取1 189個樣方 (2/3用作訓(xùn)練樣本,1/3用作驗證樣本)。此外,為驗證分類結(jié)果的面積精度,從黑龍江農(nóng)業(yè)信息網(wǎng) (www.hljagri.gov.cn)獲取2010年富錦市水稻和旱地的面積數(shù)量 (含3個國營農(nóng)場)分別為28.07萬、33.27萬hm2。
該研究主要采用神經(jīng)網(wǎng)絡(luò)分類及面向?qū)ο?(SVM)分類算法,分別對覆蓋黑龍江省富錦市的2010年兩個時相TM影像進(jìn)行分類提取,依據(jù)富錦市實際地物情況及研究目的,分類結(jié)果包括水稻、旱地、林地、建設(shè)用地及水體等5類地物類型,并對兩個時相4種分類結(jié)果進(jìn)行分類后聚類處理 (Majority分析法),以消除分類過程中細(xì)小地物“椒鹽”現(xiàn)象。文章通過兩種分類算法、兩個時相4種分類結(jié)果對比分析,以期找到基于中分辨率TM影像的水稻提取最佳分類算法。
BP(back propagation)神經(jīng)網(wǎng)絡(luò)算法是神經(jīng)網(wǎng)絡(luò)算法中最常用的一種方法,1986年由Rumelhart和McCelland為首的科學(xué)家小組提出[12],是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前最為廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。BP算法是一種有監(jiān)督式的學(xué)習(xí)算法,基本思想是:若利用已有權(quán)重和閾值正向傳播得不到期望的輸出,則反向傳播反復(fù)修改 (迭代)各節(jié)點的權(quán)重和閾值,逐步減小代價函數(shù),直到達(dá)到預(yù)先設(shè)定的要求。一般以代價函數(shù)小于某一相當(dāng)小的正數(shù)或迭代不再減小,則停止反復(fù)振蕩,此時完成BP網(wǎng)絡(luò)的訓(xùn)練及輸入與輸出之間映射關(guān)系的確定。BP神經(jīng)網(wǎng)絡(luò) (BPNN)能學(xué)習(xí)和存貯大量的輸入—輸出模式映射關(guān)系,而無需事前揭示描述這種映射關(guān)系的數(shù)學(xué)方程。Majority分析是為消除細(xì)小圖斑而進(jìn)行的分類后處理,主要采用類似于卷積濾波的方法將較大類別中的虛假像元歸到該類中,定義一個變換核尺寸,用變換核中占主要地位 (像元最多)的像元類別代替中心像元的類別。
該研究利用BP神經(jīng)網(wǎng)絡(luò)分類算法分別對富錦市的兩個時相 (2010-06-06和08-08)TM影像進(jìn)行分類提取、分類后Majority分析、精度評定3個過程。首先,經(jīng)多次嘗試對比分析,最佳輸入?yún)?shù)活化函數(shù)、貢獻(xiàn)閾值、權(quán)重調(diào)節(jié)速度、步幅長度、RMSE誤差值、隱藏層數(shù)、迭代次數(shù)分別為0.5、0.5、0.9、0、1、30,輸出初步分類結(jié)果;為減少分類過程中面積較小的圖斑,對BP神經(jīng)網(wǎng)絡(luò)初步分類結(jié)果進(jìn)行分類后歸并處理 (Majority分析),以消除“椒鹽現(xiàn)象”,提高分類精度,輸入?yún)?shù)變換核、中心像元權(quán)重值分別為3×3、1;利用混淆矩陣對神經(jīng)網(wǎng)絡(luò)分類結(jié)果進(jìn)行精度評定。整個分類過程在ENVI5.0軟件下完成。
與傳統(tǒng)基于像元分類方法相比,面向?qū)ο蠓诸惙椒ㄔ诟叻直媛蔬b感影像中的應(yīng)用有巨大優(yōu)勢[13]。該方法不僅可以充分考慮地物的光譜、植被指數(shù) (NDVI)、形狀、紋理及結(jié)構(gòu)等信息,使得分割后形成若干互不交疊的非空子區(qū)域,減少“椒鹽效應(yīng)”;同時由于對象內(nèi)部相對均一,因而在一定程度上解決了“同物異譜”和“同譜異物”現(xiàn)象[14]。
利用面形對象 (SVM)分類算法分別對富錦市的兩個時相 (2010-06-06和08-08)TM影像進(jìn)行分類提取、分類后Majority分析、精度評定3個過程,其中面向?qū)ο蠓诸愂腔贓NVI EX模塊下完成。首先,分別對兩個時相的TM影像進(jìn)行尺度分割,與基于像元分類方法最大不同,初期的分割尺度對于分類結(jié)果的精度有著十分重要的影響,經(jīng)多次嘗試獲取最佳分割尺度參數(shù)分割值、合并值分別為50、70;其次,輸入訓(xùn)練樣本、基于支持向量機 (SVM)算法最終實現(xiàn)面向?qū)ο蠓诸愡^程,輸入初步分類結(jié)果;同理進(jìn)行分類后處理及混淆矩陣精度檢驗。
圖1為基于神經(jīng)網(wǎng)絡(luò)和面向?qū)ο髢煞N常用的單時相分類方法對富錦市兩個時相 (2010-06-06和2010-08-25)TM影像分別進(jìn)行分類提取,并對提取結(jié)果進(jìn)行Majority濾波處理。提取類別主要包括水稻、旱地、林地、建設(shè)用地及水體等。下圖分別表示:(a)時相為2010-06-06,分類算法為神經(jīng)網(wǎng)絡(luò);(b)時相為2010-06-06,分類算法為面向?qū)ο?(SVM);(c)時相為2010-08-25,分類算法為神經(jīng)網(wǎng)絡(luò);(d)時相為2010-08-25,分類算法為面向?qū)ο?(SVM)。
圖1 2010年富錦市土地利用
基于研究區(qū)域的Google地球高分辨率影像隨機采樣,生成1 189個樣方,占總樣本數(shù)1/3作為驗證樣本,計397個 (水稻96個,旱地132個,林地67個,建設(shè)用地60個,水體42個)。最終基于混淆矩陣的分類精度評價結(jié)果如表2所示:4種分類總體精度均在90%以上,Kappa系數(shù)在0.85以上。其中面向?qū)ο?(2010-06-06)分類結(jié)果精度最佳,總體精度、Kappa系數(shù)、水稻用戶精度及生產(chǎn)者精度分別為99.23%、0.9873、99.12%、99.93%;神經(jīng)網(wǎng)絡(luò) (2010-08-25)分類精度相對最低,總體精度、Kappa系數(shù)、水稻用戶精度及生產(chǎn)者精度分別為90.35%、0.8468、97.44%、96.05%。
基于2010年富錦市 (包括3個國營農(nóng)場)統(tǒng)計數(shù)據(jù) (水稻和旱地)進(jìn)一步對4種分類結(jié)果進(jìn)行面積一致性評定,評定結(jié)果見表3:神經(jīng)網(wǎng)絡(luò) (2010-06-06)、面向?qū)ο?(2010-06-06)、神經(jīng)網(wǎng)絡(luò) (2010-08-25)、面向?qū)ο?(2010-08-25)4種分類的水稻面積一致性分別為:2.2%、3.3%、-7.6%、-1.7%;旱地一致性分別為-0.2%、1.5%、-7.0%、7.7%。該驗證結(jié)果表明:水稻提取結(jié)果在2010年6月較統(tǒng)計數(shù)據(jù)普遍偏高,在2010年8月普遍偏低;旱地分類面積結(jié)果為神經(jīng)網(wǎng)絡(luò)兩個時相的分類結(jié)果均較統(tǒng)計面積低,面向?qū)ο筇崛『档孛娣e較統(tǒng)計面積偏高。整體表明,基于面向?qū)ο蠓诸愃惴ㄌ崛〉乃?、旱地面積值較基于像元的神經(jīng)網(wǎng)絡(luò)分類高。主要原因是面向?qū)ο蠓诸愃惴ㄔ诜诸愡^程中容易出現(xiàn)過分割而將田間的部分道路、水利設(shè)施等包含到水稻和旱地中[14]。
為對比兩種分類算法的分類效果,分別對6月和8月兩個時相分類結(jié)果進(jìn)行對比分析。對表4中2010年6月6日兩種分類算法初始分類結(jié)果進(jìn)行對比分析,面向?qū)ο?初始的總體精度、Kappa系數(shù)、水稻用戶精度及生產(chǎn)者精度較神經(jīng)網(wǎng)絡(luò)/初始的4種分類精度分別高1.28%、0.0212、0.55%、1.37%;對表4中2010年8月25日兩種分類算法初始分類結(jié)果進(jìn)行對比分析,面向?qū)ο?初始的總體精度、Kappa系數(shù)、水稻用戶精度及生產(chǎn)者精度較神經(jīng)網(wǎng)絡(luò)/初始的4種分類精度高6.09%、0.089 8、0.62%、2.34%。該結(jié)果表明,在高緯度單季稻生長區(qū),面向?qū)ο蠓诸愃惴ǖ木蕊@著高于神經(jīng)網(wǎng)絡(luò)的分類精度,水稻用戶精度和生產(chǎn)者精度在6月份分別高0.55%、1.37%,在8月份分別高0.62%、2.34%。主要原因是面向?qū)ο蟛粌H考慮了TM影像豐富的光譜、植被指數(shù) (NDVI)、形狀、紋理及結(jié)構(gòu)等多源信息,而且突破了傳統(tǒng)方法以單個像素作為識別單元的局限,以大面積分割后的地塊為基本單元,避免了“異物同譜和同譜異物”、“椒鹽”現(xiàn)象。
表2 2010年富錦分類結(jié)果混淆矩陣精度評價
表3 富錦市遙感提取與統(tǒng)計數(shù)據(jù)面積一致性評定
分類后濾波處理 (Majority分析)在分類過程中起著關(guān)鍵的作用,在一定程度上能夠改善分類結(jié)果的精度,其中基于像元的神經(jīng)網(wǎng)絡(luò)分類結(jié)果精度提高程度尤為顯著 (如表4)。2010-06-06,神經(jīng)網(wǎng)絡(luò)經(jīng)分類后濾波處理后的總體精度、Kappa系數(shù)、水稻用戶精度及生產(chǎn)者精度分別提高0.7%、0.0115、0.14%、0.5%;2010-08-25,神經(jīng)網(wǎng)絡(luò)經(jīng)分類后濾波處理后的總體精度、Kappa系數(shù)、水稻用戶精度及生產(chǎn)者精度分別提高2.87%、0.043、1.56%、1.43%。結(jié)果表明,對神經(jīng)網(wǎng)絡(luò)分類的結(jié)果進(jìn)行Majority濾波處理,可以弱化“噪聲”的干擾,在一定程度上可以改善水稻分類的精度,水稻用戶精度和生產(chǎn)者精度在6月份分別高0.14%、0.5%,在8月份分別高1.56%、1.43%。
表4 總體分類及水稻分類結(jié)果
在基于單時相中分辨率影像進(jìn)行水稻提取過程中,不僅方法的選擇對于分類結(jié)果精度十分重要,最佳時相的選擇具有同等重要意義。表4表明,神經(jīng)網(wǎng)絡(luò)/初始在06-06(返青期)與08-25(乳熟期)的結(jié)果對比表明,返青期的總體精度、Kappa系數(shù)、水稻用戶精度及生產(chǎn)者精度較乳熟期分別高10.42%、0.1614、2.67%、3.45%;面向?qū)ο?初始在06-06(返青期)與08-25(乳熟期)的結(jié)果對比表明,返青期的總體精度、Kappa系數(shù)、水稻用戶精度及生產(chǎn)者精度較乳熟期分別高5.61%、0.0928、2.6%、2.48%。上述結(jié)果表明,選取關(guān)鍵水稻物候期的遙感影像獲取水稻種植面積的精度更高,返青期水稻提取精度要高于乳熟期,其中神經(jīng)網(wǎng)絡(luò)算法的水稻用戶精度及生產(chǎn)者精度分別提高2.67%、3.45%;面向?qū)ο笏惴ǖ乃居脩艟燃吧a(chǎn)者精度分別提高2.6%、2.48%。因此,建議在基于單時相中分辨率影像提取水稻面積時盡量考慮選擇關(guān)鍵物候期的影像。
基于中分辨率遙感影像進(jìn)行水稻監(jiān)測是農(nóng)業(yè)遙感監(jiān)測中最常用的方法之一,是水稻面積提取及估產(chǎn)研究的重要基礎(chǔ)。該研究利用神經(jīng)網(wǎng)絡(luò)和面向?qū)ο髢煞N分類算法對富錦市兩個時相 (2010-06-06返青期和2010-08-25乳熟期)TM影像分別進(jìn)行水稻提取,并得出以下主要結(jié)論:
(1)在高緯度單季稻生長區(qū),面向?qū)ο蠓诸愃惴ǖ木蕊@著高于神經(jīng)網(wǎng)絡(luò)的分類精度。水稻用戶精度和生產(chǎn)者精度在6月份分別高0.55%、1.37%,在8月份分別高0.62%、2.34%。主要原因是面向?qū)ο蟛粌H考慮了TM影像豐富的光譜、植被指數(shù) (NDVI)、形狀、紋理及結(jié)構(gòu)等多源信息,而且突破了傳統(tǒng)方法以單個像素作為識別單元的局限,以大面積分割后的地塊為基本單元,避免了“異物同譜和同譜異物”、“椒鹽”現(xiàn)象。
(2)對神經(jīng)網(wǎng)絡(luò)分類的結(jié)果進(jìn)行Majority濾波處理,在一定程度上可以改善水稻分類的精度。水稻用戶精度和生產(chǎn)者精度在6月份分別提高0.14%、0.5%,在8月份分別提高1.56%、1.43%。該方法主要是通過弱化水田塊中的細(xì)小圖斑“噪聲”干擾,將細(xì)小圖斑重新分類為水稻,減少水稻漏分,提高水稻生產(chǎn)者精度;通過濾除將其它地物類型中錯分為水稻的細(xì)小圖斑,減少錯分,提高水稻用戶精度。
(3)選取關(guān)鍵水稻物候期的遙感影像獲取水稻種植面積的精度更高,返青期水稻提取精度要高于乳熟期。其中神經(jīng)網(wǎng)絡(luò)算法的水稻用戶精度及生產(chǎn)者精度分別提高2.67%、3.45%;面向?qū)ο笏惴ǖ乃居脩艟燃吧a(chǎn)者精度分別提高2.6%、2.48%。因此,建議在基于單時相中分辨率影像提取水稻面積時盡量考慮選擇關(guān)鍵物候期的影像。
未來需要建立全國水稻物候歷信息,為最佳時相的中分辨率遙感影像選擇提供重要參考依據(jù),以提高水稻提取精度;最佳尺度分割是面向?qū)ο蠓诸愃惴P(guān)鍵步驟,需要建立自動化最優(yōu)尺度分割算法來提高分類的精度。
[1]陳曉華,張玉香,張合成.中國農(nóng)業(yè)統(tǒng)計資料2011.北京:中國農(nóng)業(yè)出版社,2012
[2]Kuenzer C,Knauer K.Remote sensing of rice crop areas.International Journal of Remote Sensing.2013,34(6):2101 ~2139
[3]Aspinall R.Editorial.Journal of Land Use Science.2006,1(1):1 ~4
[4]覃志豪,唐華俊,李文娟,等.氣候變化對農(nóng)業(yè)和糧食生產(chǎn)影響的研究進(jìn)展與發(fā)展方向.中國農(nóng)業(yè)資源與區(qū)劃,2013,34(5):1~7
[5]Peng J,Wu J,Yin H,et al.Rural land use change during 1986—2002 in Lijiang,China,based on remote sensing and GIS data.Sensors,2008,8(12):8201~8223
[6]朱曉禧,方修琦,王媛.基于遙感的黑龍江省西部水稻、玉米種植范圍對溫度變化的響應(yīng).地理科學(xué),2008,28(1):66~71
[7]李小濤,李紀(jì)人,黃詩峰,等.變差函數(shù)和神經(jīng)網(wǎng)絡(luò)結(jié)合的遙感影像分類方法研究.國土資源遙感,2006,(1):18~21
[8]陳啟浩,高偉,劉修國.輔以紋理特征的高分辨率遙感影像分類.測繪科學(xué),2008,33(1):88~90
[9]翁中銀,何政偉,范娟,等.基于TM影像的面向?qū)ο蟮乇砀脖恍畔⑻崛。乩砜臻g信息,2013,11(1):37~39
[10]黃敬峰,楊忠恩,等.基于GIS的浙江省水稻遙感估產(chǎn)最佳時相選擇.應(yīng)用生態(tài)學(xué)報,2002,13(3):290~294
[11]李正國,唐華俊,楊鵬,等.植被物候特征的遙感提取與農(nóng)業(yè)應(yīng)用綜述.中國農(nóng)業(yè)資源與區(qū)劃,2012,33(5):20~28
[12]李朝峰,曾生根,許磊.遙感圖像智能處理.北京:電子工業(yè)出版社,2007
[13]張俊,于慶國,侯家槐.面向?qū)ο蟮母叻直媛视跋穹诸惻c信息提?。b感技術(shù)與應(yīng)用.2010,(1):112~117
[14]湯傳勇,盧遠(yuǎn).利用面向?qū)ο蟮姆诸惙椒ㄌ崛∷痉N植面積.遙感信息.2010,(1):53~56