摘 要:從天山北坡經(jīng)濟帶主要農(nóng)作物綜合多特征的分類策略中提取棉花種植空間分布信息。利用谷歌地球引擎、遙感數(shù)據(jù)源為Landsat-8衛(wèi)星影像資源,利用中國土地覆蓋數(shù)據(jù)集對研究區(qū)進行耕地覆膜,提取出研究區(qū)的耕地,構(gòu)建包含NDVI時序和棉花最佳識別月份的反射率特征多特征的影像;利用支持向量機分類器識別棉花種植面積空間分布信息。研究表明,基于Landsat-8數(shù)據(jù)的多特征的分類策略的棉花制圖精度0.95、用戶精度0.94,為天山北坡主要作物的識別和提取研究提供了參考。
關(guān)鍵詞:Lansat-8衛(wèi)星數(shù)據(jù);多特征;支持向量機;棉花種植
中圖分類號:S562 文獻標志碼:B 文章編號:2095–3305(2024)08–00-03
棉花種植歷史悠久,是我國重要的農(nóng)業(yè)經(jīng)濟作物。棉花與人們?nèi)粘I钕⑾⑾嚓P(guān),并且在國家經(jīng)濟發(fā)展中占據(jù)至關(guān)重要的地位,尤其是對于新疆維吾爾自治區(qū)而言。2020年新疆棉花種植面積達到250.190萬hm2,農(nóng)作物種植面積628.261萬hm2,棉花種植面積接近新疆維吾爾自治區(qū)全部種植物播種面積的1/2。種植面積和產(chǎn)量估算屬于農(nóng)情監(jiān)測信息,有效地整合和利用作物的農(nóng)情信息對提高農(nóng)業(yè)生產(chǎn)效率和管理水平至關(guān)重要。
新疆地區(qū)不少學者開展了相關(guān)遙感研究,曹衛(wèi)彬[1]
細致地研究了新疆維吾爾自治區(qū)的棉花監(jiān)測現(xiàn)狀,并就新疆維吾爾自治區(qū)棉花種植面積監(jiān)測提出了系統(tǒng)性的措施和方法。郝鵬宇等[2]利用長時間周期的MODIS數(shù)據(jù),提取新疆維吾爾自治區(qū)博樂市的棉花種植信息。
國內(nèi)外許多學者針對棉花種植信息的提取,嘗試了很多方法。龍翔[3]等研究了棉花處于不同生長時期的各波段上的反射率特征,研究其時間序列上的反射光譜變化趨勢并結(jié)合實地調(diào)查作物監(jiān)測長勢,總結(jié)棉花整個生長期的光譜規(guī)律,為后續(xù)進行作物光譜研究奠定了基礎(chǔ)。陽旭[4]的研究對象為棉花,應(yīng)用LiDAR技術(shù)獲取棉花生長周期內(nèi)的多個時間段的點云數(shù)據(jù),利用算法提取棉花主干的幾何信息;在此基礎(chǔ)上,完成對植株體積、葉面積指數(shù)、葉寬等性狀參數(shù)的估計。王霄煜[5]等利用測量工具實際測量真實地物的光譜信息,利用GF-1衛(wèi)星數(shù)據(jù)資源,設(shè)置合適的植被指數(shù),將棉花與其他作物分開,也驗證了監(jiān)督分類策略和非監(jiān)督分類策略對識別棉花面積的有效性。
在新疆維吾爾自治區(qū)的天山北坡經(jīng)濟帶,利用多時相的Landsat-8衛(wèi)星數(shù)據(jù),采用綜合NDVI時間序列和棉花最佳識別月份的反射率多特征進行棉花識別,在GEE平臺實現(xiàn)天山北坡經(jīng)濟帶的棉花識別和面積提取,最后查閱新疆維吾爾自治區(qū)2020年的棉花種植面積統(tǒng)計年鑒數(shù)據(jù),對識別的棉花種植結(jié)果進行統(tǒng)計驗證,從而為應(yīng)用衛(wèi)星快速統(tǒng)計農(nóng)作物面積提供技術(shù)支撐。
1 研究區(qū)概況與數(shù)據(jù)預(yù)處理
1.1 研究區(qū)概況
天山北坡經(jīng)濟帶位于新疆維吾爾自治區(qū)北面,南面是天山山脈,北面是阿勒泰地區(qū),是北疆重要的經(jīng)濟地區(qū),地處79°~98°E、42°~48°N,面積占新疆維吾爾自治區(qū)總面積5.7%(圖1)。據(jù)李瑞雪[6]研究,天山北坡屬于典型的中溫帶大陸性干旱氣候,冬季寒冷干燥,夏季炎熱少雨,春秋季時間短。天山北坡經(jīng)濟帶河流眾多,為當?shù)貛碡S富的水資源,許多農(nóng)業(yè)生產(chǎn)基地都是建在河流水源附近。
表1歸納了天山北坡經(jīng)濟帶主要農(nóng)作物的物候信息,農(nóng)作物生長狀態(tài)隨時間變化而變化。
1.2 數(shù)據(jù)源
1.2.1 Landsat-8影像數(shù)據(jù)
選用的Landsat-8遙感衛(wèi)星數(shù)據(jù)來源于GEE上的數(shù)據(jù)集Landsat/LC08/C01/T1_SR,選取了研究區(qū)新疆維吾爾自治區(qū)天山北坡經(jīng)濟帶內(nèi)棉花生長期內(nèi)4—10月逐月的Landsat-8影像,采用中值合成方式,得到1個月1幅影像,共7幅影像。全部數(shù)據(jù)源覆蓋了棉花的整個生長時期,從棉花種植期到棉花拔稈期。
1.2.2 CLCD 30 m土地覆蓋類型數(shù)據(jù)
武漢大學遙感院黃昕教授、李佳藝教授團隊基于Google Earth Engine上335,709景Landsat數(shù)據(jù),制作了全國年度土地覆蓋類型數(shù)據(jù)集(CLCD),數(shù)據(jù)時間跨度為1985—2020年。CLCD的總體準確率達79.31%,CLCD的總體準確性高于同類產(chǎn)品中的MCD12Q1、ESACCI_LC、FROM_GLC和GlobaLand30。
1.2.3 樣本點選擇
查閱2020年《新疆統(tǒng)計年鑒》,新疆維吾爾自治區(qū)主要種植棉花、玉米、小麥和其他類的農(nóng)作物,采取其他方法選取樣本點。選取樣本點時借助Google Earth(谷歌地球)高分辨率的影像,目視解譯方式在研究區(qū)選取了棉花樣本點572個,小麥樣本點496個,玉米樣本點582個,其他農(nóng)作物樣本點284個。
1.3 遙感數(shù)據(jù)預(yù)處理
調(diào)用GEE平臺上的Landsat-8遙感數(shù)據(jù)集內(nèi)的數(shù)據(jù),拼接合成影像覆蓋整個研究區(qū),對影像進行輻射定標和大氣校正,減少輻射傳輸過程中傳感器和大氣層對成像的影響,得到地物真實的反射率。使用GEE官方自帶的去云函數(shù)對研究區(qū)進行去云處理,函數(shù)能準確識別云和陰影,設(shè)置云量構(gòu)建掩膜圖層,以達到去除云和陰影的目的。利用中國年度土地覆蓋數(shù)據(jù)集中的2020年中國土地覆蓋類型數(shù)據(jù),數(shù)據(jù)的分辨率是30 m,對研究區(qū)域進行耕地覆膜,提取出Landsat-8影像上土地類型為耕地的區(qū)域,為進一步提取棉花種植信息作準備。剔除水體、裸地、林地等其他地物類型,為后續(xù)樣本點選取奠定基礎(chǔ),就可以在耕地圖層上選取后續(xù)選擇樣本點,減輕目視解譯負擔[7]。
2 棉花種植面積的遙感識別
2.1 利用Landsat-8數(shù)據(jù)和多特征的棉花種植面積識別
2.1.1 特征提取
NDVI植被指數(shù)反映地物在紅光波段與近紅外波段上的差異,該指數(shù)可有效提取出研究區(qū)內(nèi)植被。利用公式(1)分別計算得到4—10月逐月的NDVI數(shù)據(jù),構(gòu)建NDVI時間序列影像。
NDVI=(1)
式(1)中,為ρNIR近紅外(NIR)波段的反射率,ρRed為紅波段(Red)的反射率。除逐月的NDVII值外,還計算了NDVI最大值、最小值及均值,合成為3幅影像。
不同農(nóng)作物除NDVI時間序列存在差異外,不同地物在不同波段上的反射率也是存在差異的,這是依靠反射率特征識別地物類型的基礎(chǔ)。9月棉花處于吐絮期,屬生長旺盛期,植株繁茂,植被光譜特征明顯,植被“紅邊”特征明顯,在Landsat-8的B5波段反射率很高。9月初,開始收割玉米,在Landsat-8的B5上反射率特征不如棉花明顯;6月就已經(jīng)收割小麥,此時不具有植被特征,在Landsat-8的B5波段上的反射率特征也不如棉花明顯。因此,選擇提取出棉花最佳識別月份9月的各波段上反射率特征作為分類的特征向量,利用各波段反射率特征區(qū)分棉花與其他地物[8]。
綜上所述,共選取16個特征,NDVI時間序列特征,
4—10月每月的NDVI,以及NDVI最大值、最小值及均值、棉花最佳識別月份反射率特征Landsat-8的B2~B7共6個波段。
2.1.2 利用Landsat-8數(shù)據(jù)和多特征的棉花提取
采用監(jiān)督分類中支持向量機分類器,利用共16個特征進行分類。選取在耕地掩膜后的基礎(chǔ)上,選取棉花、小麥、玉米及其他農(nóng)作物,共4種訓(xùn)練樣本,約束條件為NDVI時間序列和棉花最佳識別月份的反射率特征(圖2),共計16個特征向量,對研究區(qū)主要農(nóng)作物進行分類。最終得到分類結(jié)果,總體精度為0.90,Kappa系數(shù)0.84,其中棉花制圖精度為0.95,用戶精度為0.94。
2.2 棉花面積提取驗證
對比統(tǒng)計年鑒,基于Landsa-8數(shù)據(jù)天山北坡經(jīng)濟帶的棉花面積信息,采用多特征的分類策略識別棉花面積誤差為0.077(表2)。參考各個縣,不同縣的提取面積誤差有所不同,其中誤差較大的地區(qū)包括托里縣誤差為0.15、霍爾果斯市誤差為0.14。其中,托里縣位于塔城地區(qū),當?shù)氐匚镱愋蛷?fù)雜是造成誤差過大的主要原因?;魻柟故形挥谝晾绻_克自治州,在選取樣本點時,伊犁哈薩克自治州樣本數(shù)量選取較少,樣本特征不夠明晰,這是造成誤差的主要原因[9-11]。
3 結(jié)論與展望
3.1 結(jié)論
利用2020年4—10月的Landsat-8遙感影像,結(jié)合CLCD中國土地覆蓋類型數(shù)據(jù)集掩膜數(shù)據(jù),對研究區(qū)耕地進行提取,選取NDVI時間序列特征和棉花最佳識別月份的反射率特征,利用監(jiān)督分類中的支持向量機分類器,對天山北坡研究區(qū)主要農(nóng)作物進行分類。最終結(jié)合統(tǒng)計年鑒數(shù)據(jù),采用多特征的Landsat-8對整個天山北坡經(jīng)濟帶棉花面積提取的誤差為0.077,面積提取精度較高。
3.2 展望
(1)特征選取時只考慮光譜特征,遙感影像除光譜特征外,還有其他特征,如樣本紋理特征,不同農(nóng)作物植株的幾何結(jié)構(gòu)特征不同,可以利用該差異。此外,可加入DEM數(shù)據(jù)地形特征,DEM數(shù)據(jù)開源,獲取方便,是很好的研究材料。后續(xù)研究進行作物分類時可考慮紋理特征和地形特征,有利于提高識別精度。
(2)選用的用于分類的特征數(shù)量為16個,在特征向量選取時未進行特征向量選取,依據(jù)訓(xùn)練樣本和約束條件,部分向量未能有效區(qū)分樣本,選擇出區(qū)分度大的特征,減少總特征數(shù)量,提高單個特征質(zhì)量。
參考文獻
[1] 曹衛(wèi)彬,楊邦杰,裴志遠,等.我國農(nóng)情信息需求調(diào)查與分析[J].農(nóng)業(yè)工程學報,2004(1):147-151.
[2] 郝鵬宇,牛錚,王力,等.基于時序MODISEVI匹配的棉花信息提取:以新疆博樂市為例[J].遙感技術(shù)與應(yīng)用,2013, 28(2):309-314.
[3] 龍翔,趙慶展,王學文,等.基于機載高光譜端元提取分析棉花生長期光譜變化[J].新疆農(nóng)業(yè)科學,2021,58(7):1207-1216.
[4] 陽旭,胡松濤,王應(yīng)華,等.利用多時序激光點云數(shù)據(jù)提取棉花表型參數(shù)方法[J].智慧農(nóng)業(yè)(中英文),2021,3(1):51-62.
[5] 王霄煜,雷鈞.基于高分一號衛(wèi)星數(shù)據(jù)的新疆棉花種植面積信息提取研究[J].新疆農(nóng)業(yè)科技,2021(1):23-26.
[6] 李瑞雪.中國天山山區(qū)氣候變化的時空分布特征[D].蘭州:西北師范大學,2010.
[7] 呂紹倫,趙陽,陳萬基,等.基于遙感云計算的阿拉爾市棉花種植面積提取[J].棉花科學,2022,44(4):19-25.
[8] 王匯涵,張澤,康孝巖,等.基于Sentinel-2A的棉花種植面積提取及產(chǎn)量預(yù)測[J].農(nóng)業(yè)工程學報,2022,38(9):205-214.
[9] 李路曼,郭鵬,張國順,等.基于無人機可見光遙感的棉花面積信息提取[J].新疆農(nóng)業(yè)科學,2018,55(3):548-555.
[10] 田野,張清,李希燦,等.基于多時相影像的棉花種植信息提取方法研究[J].干旱區(qū)研究,2017,34(2):423-430.
[11] 劉曉晨,買買提阿依甫.基于Landsat8遙感數(shù)據(jù)的新疆精河縣棉花種植空間分布信息提取研究[J].新疆農(nóng)業(yè)科技, 2015(5):5.