張旭輝, 玉素甫江·如素力,2, 仇忠麗亞夏爾·艾斯克爾, 阿卜杜熱合曼·吾斯曼
(1.新疆師范大學(xué)地理科學(xué)與旅游學(xué)院流域信息集成與生態(tài)安全實(shí)驗(yàn)室,新疆 烏魯木齊 830054;2.新疆干旱區(qū)湖泊環(huán)境與資源重點(diǎn)實(shí)驗(yàn)室,新疆 烏魯木齊 830054)
農(nóng)作物種植信息是進(jìn)行農(nóng)作物產(chǎn)業(yè)結(jié)構(gòu)調(diào)整和優(yōu)化的重要基礎(chǔ)和前提[1]。焉耆盆地是新疆重要的特色農(nóng)產(chǎn)品生產(chǎn)基地,為國家供應(yīng)大量糧食,但糧食生產(chǎn)受到荒漠化、土壤鹽堿化及干旱缺水等脅迫,作物種植結(jié)構(gòu)復(fù)雜、生態(tài)環(huán)境脆弱[2]。因此,及時(shí)準(zhǔn)確地掌握焉耆盆地農(nóng)作物種植信息對(duì)促進(jìn)干旱區(qū)農(nóng)業(yè)可持續(xù)發(fā)展和保障國家糧食安全具有重要意義[3-4]。
遙感技術(shù)因其覆蓋面大、探測(cè)速度快及成本低的特點(diǎn),為及時(shí)準(zhǔn)確地獲取大面積農(nóng)作物種植信息提供了新的技術(shù)手段[5-6]。目前,基于單一影像源提取農(nóng)作物種植結(jié)構(gòu)信息的方法操作簡(jiǎn)單,但不易捕捉作物種植“最佳識(shí)別期”影像[7];基于多時(shí)序影像源提取農(nóng)作物種植信息的方法充分利用了作物季相節(jié)律特征,成為當(dāng)下農(nóng)作物種植信息提取的主流方法[3];在提取農(nóng)作物信息時(shí),多特征參數(shù)法更適用于復(fù)雜的農(nóng)作物種植區(qū),基于多特征參數(shù)的統(tǒng)計(jì)模型法在一定程度上解決了混合像元問題[8];遙感影像與統(tǒng)計(jì)數(shù)據(jù)融合法可獲得大尺度農(nóng)作物結(jié)構(gòu)種植圖,但因較低的制圖分辨率使得產(chǎn)品區(qū)域適宜性較差[9-10]。在機(jī)器學(xué)習(xí)方法中支持向量機(jī)算法泛化能力強(qiáng),且有較好的魯棒性,在遙感信息提取上被廣泛應(yīng)用[11-12]。梁繼等[6]、賈銀江等[13]和梁習(xí)卉子等[14]使用SVM 算法及其改進(jìn)后的分類器對(duì)區(qū)域農(nóng)作物信息進(jìn)行獲取,取得較好的分類效果(分類精度均高于90%)。邊增淦等[15]、田鑫等[16]和郭其樂等[17]研究指出,使用機(jī)器學(xué)習(xí)方法進(jìn)行遙感信息提取時(shí)加入光譜特征、紋理特征及物候特征可以提高農(nóng)作物分類的精度。隨著遙感大數(shù)據(jù)時(shí)代的到來,遙感云平臺(tái)為快速處理和分析海量遙感數(shù)據(jù)提供了機(jī)遇[18]。劉通等[19]、潘力等[20]和姜伊蘭等[21]借助GEE平臺(tái)分別對(duì)遼寧盤錦市、淮河流域和開封市杞縣的農(nóng)作物種植信息進(jìn)行提取,研究結(jié)果為當(dāng)?shù)剞r(nóng)作物信息提取和監(jiān)測(cè)提供了參考依據(jù)??墒钱?dāng)下GEE平臺(tái)國內(nèi)用戶不便正常使用,且使用過程和處理結(jié)果的下載,受網(wǎng)絡(luò)條件的影響很大[22]。國產(chǎn)遙感云平臺(tái)PIE-Engine Studio 為共享數(shù)據(jù)、算法和計(jì)算資源構(gòu)建了一個(gè)開放的環(huán)境,以實(shí)現(xiàn)對(duì)遙感數(shù)據(jù)的按需訪問和海量數(shù)據(jù)的快速處理[22]。然而目前使用PIE-Engine Studio 云計(jì)算平臺(tái)結(jié)合機(jī)器學(xué)習(xí)方法應(yīng)用于干旱區(qū)農(nóng)作物識(shí)別的研究還相對(duì)較少,對(duì)于該平臺(tái)在干旱區(qū)農(nóng)作物識(shí)別的適用性還待進(jìn)一步研究,且基于該平臺(tái)的時(shí)間序列Sentinel-2農(nóng)作物識(shí)別的研究還鮮有涉及,Sentinel-2數(shù)據(jù)的高時(shí)間分辨率在農(nóng)作物分類識(shí)別中的優(yōu)勢(shì)還需進(jìn)一步明確。
文章以新疆焉耆盆地為研究區(qū),利用PIE-Engine Studio 平臺(tái),基于Sentinel-2時(shí)序數(shù)據(jù)和野外定位采樣數(shù)據(jù),使用支持向量機(jī)算法對(duì)2022年焉耆盆地的農(nóng)作物種植信息進(jìn)行提取和精度評(píng)估,以期獲取最佳的農(nóng)作物信息提取方案,為干旱區(qū)農(nóng)作物種植信息的快速、精確提取提供新的思路和參考依據(jù)。
焉耆盆地位于新疆巴音郭楞蒙古自治州境內(nèi)(85°45′25″~87°26′11″E,41°40′11″~42°25′46″N),塔里木盆地的東北側(cè),面積約為7500 km2,地勢(shì)西北高東南低,地理區(qū)域包含焉耆回族自治縣、和靜縣、和碩縣、博湖縣及新疆生產(chǎn)建設(shè)兵團(tuán)部分團(tuán)場(chǎng)(圖1)。該地區(qū)四季分明,光照時(shí)間充足,晝夜溫差大,水熱資源豐富,屬典型的干旱區(qū)綠洲氣候。農(nóng)作物類型有番茄、辣椒、玉米、小麥、甜菜和棉花等,種植結(jié)構(gòu)較為復(fù)雜,其中研究區(qū)盛產(chǎn)番茄和辣椒,是新疆重要的特色農(nóng)產(chǎn)品生產(chǎn)基地。
圖1 研究區(qū)地理位置及作物樣本點(diǎn)分布Fig.1 Geographical location of the study area and distribution of crop sample points
1.2.1 Sentinel-2 數(shù)據(jù)集本文使用的Level-2A 級(jí)Sentinel-2 多光譜影像數(shù)據(jù)集源自歐洲航天局?jǐn)?shù)據(jù)中心,該數(shù)據(jù)由Sentinel-2A 和Sentinel-2B 組成,具有空間分辨率高、重訪周期短、光譜波段通道數(shù)目多以及波段寬度窄等特點(diǎn)[23]。為方便研究不同農(nóng)作物生育期影像變化,研究在PIE 平臺(tái)中選擇2022年3—11 月的遙感影像,云量覆蓋百分比在10%以下,共9幅(表1)。
表1 研究區(qū)Sentinel-2影像數(shù)據(jù)Tab.1 Sentinel-2 image data for the study area
1.2.2 樣本數(shù)據(jù)研究團(tuán)隊(duì)于2022 年7 月26 日至2022年8月4日前往焉耆盆地對(duì)農(nóng)作物種植情況進(jìn)行調(diào)查,采用拍照和GPS 定位的方式,獲取1948 個(gè)典型地物樣點(diǎn),其中農(nóng)作物包括5 種經(jīng)濟(jì)作物(甘草、葵花、蘆葦、棉花和葡萄)、3 種糧食作物(水稻、小麥和玉米)、3種蔬菜(番茄、辣椒、甜菜)和果樹作物(果林)。在采樣過程中使用GPS 定位作物樣點(diǎn)的經(jīng)緯度和海拔,并且對(duì)地物的周邊生長環(huán)境及灌溉方式進(jìn)行記錄,方便觀察不同農(nóng)作物的分布特征和生長環(huán)境。在分類過程中將樣點(diǎn)隨機(jī)分割成訓(xùn)練樣本和檢驗(yàn)樣本,得到5種樣點(diǎn)分割方案,即5:5、6:4、7:3、8:2和9:1(表2)。
表2 研究區(qū)地物樣本統(tǒng)計(jì)表Tab.2 Statistics of feature samples in the study area
1.3.1 分類特征構(gòu)建
(1)Sentinel-2光譜波段
Sentinel-2數(shù)據(jù)共有13 個(gè)波段,研究選擇其中用于土地類型檢測(cè)、陸表檢測(cè)、植被監(jiān)測(cè)和環(huán)境檢測(cè)的波段,共10 個(gè),分別是B2、B3、B4、B5、B6、B7、B8、B8a、B11和B12[23]。
(2)植被指數(shù)構(gòu)建
植被指數(shù)因其經(jīng)過比值處理,可以部分消除因太陽高度角、衛(wèi)星觀測(cè)角、地形、大氣程輻射等所帶來的影響,被廣泛用于農(nóng)作物分類與識(shí)別、長勢(shì)監(jiān)測(cè)與產(chǎn)量估算等方面。研究利用Sentinel-2的波段構(gòu)建多種植被指數(shù)(表3)。
表3 植被指數(shù)計(jì)算公式Tab.3 Vegetation index calculation formula
1.3.2 特征參數(shù)優(yōu)選方法構(gòu)建較多的特征參數(shù)在一定程度上提高農(nóng)作物識(shí)別精度,但過多的特征參數(shù)往往會(huì)出現(xiàn)信息冗余現(xiàn)象,影響分類模型的效率和精度[17]。研究采用以下特征參數(shù)優(yōu)選方法:(1)See5.0 決策樹算法根據(jù)提供最大信息增益的字段對(duì)樣本數(shù)據(jù)進(jìn)行分割,并對(duì)決策樹的葉子進(jìn)行裁剪或合并以提高分類精度,最后確定每個(gè)葉子的最佳閾值,從而得到每個(gè)特征參數(shù)的重要性得分[24]。(2)隨機(jī)森林(Random forest,RF)方法通過對(duì)對(duì)象和變量進(jìn)行采樣來構(gòu)建預(yù)測(cè)模型,即生成多個(gè)決策樹并依次對(duì)對(duì)象進(jìn)行分類,最后將每個(gè)決策樹的分類結(jié)果匯總,所有預(yù)測(cè)類別的復(fù)數(shù)就是隨機(jī)森林預(yù)測(cè)的對(duì)象類別,分類精度得到提高,同時(shí)也計(jì)算了參與分類的不同特征的重要性[25]。(3)多元回歸(Multiple regression,MR)模型指含有多個(gè)解釋變量的線性回歸模型,用于解釋被解釋的變量與其他多個(gè)變量解釋變量之間的線性關(guān)系[26]。
1.3.3 分類方法與分類方案支持向量機(jī)(Support vector machines,SVM)算法是基于統(tǒng)計(jì)學(xué)習(xí)的機(jī)器學(xué)習(xí)方法,該算法利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,在確保誤差最小的情況下,通過降低模型泛化誤差的上限來提高分類模型的泛化能力[27],SVM算法的徑向基核函數(shù)可將訓(xùn)練樣本映射到高維空間,從而便于進(jìn)行多特征參數(shù)的農(nóng)作物分類。本文基于Sentinel-2 時(shí)序數(shù)據(jù)構(gòu)建特征參數(shù),借助R 語言優(yōu)選特征參數(shù),最后使用SVM 算法構(gòu)建5 種分類方案進(jìn)行農(nóng)作物信息提?。ū?)。
表4 農(nóng)作物分類方案Tab.4 Crop classification schemes
1.3.4 精度評(píng)價(jià)使用目視解譯和混淆矩陣對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià),采用以下評(píng)價(jià)指標(biāo)評(píng)估模型的精度,總體精度(Overall accuracy,OA)、Kappa系數(shù)、用戶精度(User’s accuracy,UA)、制圖精度(Producer’s accuracy,PA)、F1 分?jǐn)?shù)(F1 score)、錯(cuò)分誤差(Commission error,CE)和漏分誤差(Omission error,OE)。計(jì)算公式如下:
式中:n為類別數(shù)量;N為驗(yàn)證樣本總數(shù);Pii為每類中正確分類樣本的數(shù)量,是i行i列上的值;Pi+為分類器將驗(yàn)證樣本分為某一類別的總數(shù);P+i為某一類別驗(yàn)證樣本總數(shù)。
基于Sentinel-2 時(shí)序數(shù)據(jù)計(jì)算植被指數(shù),得到研究區(qū)農(nóng)作物植被指數(shù)時(shí)序變化曲線(圖2)。由圖2 可知,不同農(nóng)作物因各自生物學(xué)差異在各植被指數(shù)中呈現(xiàn)不同的曲線波動(dòng)趨勢(shì)。由圖2a可知,研究區(qū)農(nóng)作物NDVI 值總體呈先上升后下降的變化趨勢(shì),其中小麥和甜菜的NDVI 值與其他農(nóng)作物差異顯著,容易區(qū)分;引入紅邊波段后,各農(nóng)作物的NDVI值在7、8、9月差異較為明顯(圖2b~d),其中小麥的NDVI 值在5 月達(dá)到峰值,與其他農(nóng)作物差異明顯,容易區(qū)分;甜菜的NDVI 值在10 月達(dá)到峰值,與其他農(nóng)作物相差較大,容易區(qū)分;與NDVI 值相比,不同農(nóng)作物的NDVI705、NDVI740和NDVI783曲線分離較好,不同農(nóng)作物的物候特征更直觀、更清晰,這是因?yàn)榧t邊是綠色植被反射光譜在680~780 nm 之間的最大斜率點(diǎn),因此更能反映農(nóng)作物的微小變化。由圖2m 可知,水稻的EVI 曲線在8 月達(dá)到峰值,與其他農(nóng)作物相比差異明顯;由圖2n~o 可知,棉花的RNDVI 和SRI 曲線在7 月達(dá)到峰值,與其他農(nóng)作物相比差異明顯。除NDWI(圖2e)外,其他農(nóng)作物植被指數(shù)(圖2f~o)呈現(xiàn)先增加后減少趨勢(shì),由于植被指數(shù)與農(nóng)作物本身的特性有關(guān),不同農(nóng)作物的物候差異導(dǎo)致植被指數(shù)在增加、減少和峰值出現(xiàn)的時(shí)間等方面有差異。
圖2 植被指數(shù)時(shí)序曲線圖Fig.2 Time-serie graphs of vegetation index
研究利用See5.0、RF 和MR 方法得到特征參數(shù)的重要性評(píng)價(jià)結(jié)果(圖3)。由圖3可知,3種方法得到的特征參數(shù)重要性排序均不相同。See5.0 和RF方法的結(jié)果中Sentinel-2近紅外波段(B8)的重要性得分最高,說明近紅外波段對(duì)農(nóng)作物分類結(jié)果的貢獻(xiàn)最大,對(duì)分類精度影響頗深。對(duì)比3 種重要性結(jié)果發(fā)現(xiàn),排名前10 的特征參數(shù)中均有NDVI 或紅邊NDVI,說明NDVI 或者紅邊NDVI 可以很好地反映出不同農(nóng)作物的生長狀態(tài)和覆蓋度,對(duì)農(nóng)作物分類結(jié)果貢獻(xiàn)較大。因此根據(jù)特征參數(shù)重要性評(píng)價(jià)結(jié)果選取3個(gè)特征參數(shù)集:
圖3 特征參數(shù)重要性評(píng)價(jià)Fig.3 Importance evaluation of feature parameters
(1)See5.0 算法的特征重要性得分和累計(jì)百分比(圖3a),獲取重要性得分大于0的特征參數(shù),符合條件的有B8、EVI、B5、B6、TVI、B7、TCARI、NDVI705、GI、B3、B2、VIgreen、B4、NDVI740、NDWI、RNDVI、NDVI、NDVI783、MCARI、B11、B8a和SRI,共22個(gè)。
(2)RF的特征參數(shù)重要性評(píng)價(jià)(圖3b),選取累計(jì)百分比大于90%的特征參數(shù),符合條件的有B8、NDVI705、B3、B6、TVI、B11、B2、B4、EVI、B7、MCARI、RNDVI、B8a、VIgreen、GI、B5、NDVI740、TCARI、GNDVI和NDWI,共20個(gè)。
(3)MR模型的特征參數(shù)重要性評(píng)價(jià)(圖3c),選取回歸系數(shù)大于0的特征參數(shù),符合條件的有MCARI、NDVI、TCARI、SRI、TVI、VIgreen、NDVI783、MSR、B5、B4、B8a和EVI,共12個(gè)。
研究對(duì)25種分類結(jié)果進(jìn)行精度驗(yàn)證與對(duì)比,結(jié)果見圖4:(1)所有農(nóng)作物分類模型的OA 均大于92.20%,Kappa 系數(shù)均大于0.9037,說明在PIE 平臺(tái)中使用SVM 算法開展干旱區(qū)農(nóng)作物遙感分類研究是可行的。(2)對(duì)比SVM-無紅邊和SVM-有紅邊的結(jié)果發(fā)現(xiàn),加入紅邊波段后,農(nóng)作物的OA 和Kappa系數(shù)均有所上升,SVM-有紅邊分類模型的各樣方分割方案OA均大于93.00%,Kappa系數(shù)均大于0.9100,由此可見在農(nóng)作物遙感分類時(shí)加入紅邊波段可以提高分類精度。(3)相較于SVM-有紅邊,SVM-RF、SVM-MR和SVM-See5.0方法在加入植被指數(shù)后,OA均值提高了4.18%、3.82%和3.62%,Kappa系數(shù)提高了0.0519、0.0473 和0.0446。(4)對(duì)比不同分類模型的均值發(fā)現(xiàn),不同分類模型OA和Kappa的大小關(guān)系為:SVM-RF>SVM-MR>SVM-See5.0>SVM-有紅邊>SVM-無紅邊,說明SVM-RF分類模型的分類效果最好,相較于其他分類模型更適合在焉耆盆地開展農(nóng)作物分類研究。
圖4 不同分類模型總體精度和Kappa系數(shù)的熱圖Fig.4 Heat map of overall accuracy and Kappa coefficient for different classification models
選取每種分類模型與樣方分割方案的最佳組合進(jìn)行對(duì)比分析(圖5)。由圖5可知,5種最佳分類組合的OA關(guān)系為:SVM-RF(8:2)>SVM-See5.0(7:3)>SVM-MR(5:5)>SVM-有紅邊(5:5)>SVM-無紅邊(7:3),5 種最佳分類組合中分類效果最好的是SVM-RF 分類模型在樣方分割為8:2時(shí)取得的分類結(jié)果,其OA和Kappa 系數(shù)最高,分別是98.72%和0.9866,表明SVM-RF(8:2)分類組合與地面實(shí)際情況具有較好的一致性;對(duì)比5 種最佳分類組合的PA 和UA 精度發(fā)現(xiàn),SVM-RF(8:2)的PA和UA最高,分別比SVM-MR(5:5)、SVM-See5.0(7:3)、SVM-有紅邊(5:5)和SVM-無紅邊(7:3)的PA和UA高出0.21%和0.68%、0.09%和0.76%、1.60%和7.21%、4.68%和9.88%,表明SVM-MR(5:5)分類圖中的結(jié)果與地面真實(shí)情況較為相符;F1 score 的關(guān)系為SVM-RF(8:2)>SVM-See5.0(7:3)>SVM-MR(5:5)>SVM-有紅邊(5:5)>SVM-無紅邊(7:3),說明SVM-RF(8:2)分類模型精確度較其他分類模型高。OE 和CE 的關(guān)系均為SVM-無紅邊(7:3)>SVM-有紅邊(5:5)>SVM-MR(5:5)>SVM-See5.0(7:3)>SVM-RF(8:2),表明SVM-無紅邊(7:3)的“錯(cuò)分”和“漏分”現(xiàn)象較多,SVM-RF(8:2)的“錯(cuò)分”和“漏分”現(xiàn)象較少。綜上,SVM-RF(8:2)分類模型的分類結(jié)果在OA、Kappa 系數(shù)、PA、UA、F1 score、CE和OE 等方面表現(xiàn)最好,其分類效果優(yōu)于其他分類模型。
圖5 5種最佳分類模型評(píng)價(jià)指標(biāo)的雷達(dá)圖Fig.5 Radar plot of evaluation indicators for the 5 best classification models
研究借助PIE 平臺(tái)對(duì)5種最佳分類模型的分類結(jié)果進(jìn)行制圖,研究區(qū)作物空間分布如圖6 所示。對(duì)比圖6c~e 可見,3 種分類模型的分類結(jié)果與當(dāng)?shù)貙?shí)際數(shù)據(jù)吻合度較高。焉耆盆地農(nóng)作物以辣椒、玉米、小麥和葡萄為主,種植面積分別約為1166.98 km2、430.32 km2、344.23 km2和205.79 km2,分別約占研究區(qū)耕地面積的43.58%、16.07%、12.85%和7.68%。整體上,焉耆盆地工業(yè)辣椒的種植面積最廣,主要分布在焉耆回族自治縣和博湖縣;玉米、小麥和葡萄主要種植在和碩縣;甜菜主要種植在和靜縣,水稻和果林主要種植在博湖縣;兵團(tuán)地區(qū)農(nóng)作物種植分布較為集中,主要種植經(jīng)濟(jì)作物(工業(yè)辣椒和工業(yè)番茄)。綜上,焉耆盆地主要農(nóng)作物集中分布在土壤肥沃且灌溉設(shè)施較為完善的地區(qū),種植面積較大且在研究區(qū)內(nèi)連續(xù)分布,其他農(nóng)作物種植較少且呈鑲嵌式分布在研究區(qū)。
圖6 5種分類模型的農(nóng)作物分類結(jié)果Fig.6 Crop classification results for the five classification models
本文借助PIE-Engine Studio 平臺(tái),使用支持向量機(jī)算法,調(diào)用Sentinel-2時(shí)序數(shù)據(jù),構(gòu)建農(nóng)作物時(shí)序植被指數(shù),分割訓(xùn)練樣本和檢驗(yàn)樣本,實(shí)現(xiàn)了對(duì)焉耆盆地農(nóng)作物種植信息的提取與評(píng)估。PIE平臺(tái)免費(fèi)向公眾開放,可以實(shí)時(shí)調(diào)用平臺(tái)中存儲(chǔ)的Sentinel-2 遙感影像,在強(qiáng)大的云計(jì)算服務(wù)支持下,降低了遙感數(shù)據(jù)獲取的門檻和計(jì)算成本,可滿足不同尺度的研究需求[22]。研究結(jié)果在一定程度上解決了因干旱區(qū)生態(tài)環(huán)境脆弱、種植結(jié)構(gòu)復(fù)雜且地塊破碎、農(nóng)作物生長周期相近及光譜差異小等原因產(chǎn)生的分類精度較低的問題,為利用國產(chǎn)云平臺(tái)實(shí)現(xiàn)干旱區(qū)農(nóng)作物種植信息的快速、精確提取提供了新的思路和參考依據(jù)。
從特征重要性結(jié)果可以看出,排名前十的特征參數(shù)中均有紅邊特征參數(shù),表明紅邊特征參數(shù)在農(nóng)作物分類識(shí)別領(lǐng)域具有明顯優(yōu)勢(shì),對(duì)于農(nóng)作物生長狀態(tài)和健康狀況的判斷具有重要的指導(dǎo)作用。研究中紅邊特征參數(shù)的引入使得SVM-有紅邊分類模型的OA和Kappa系數(shù)均值分別比SVM-無紅邊提高了0.96%和0.012。因此,在特征重要性分析中,排名前十的特征參數(shù)中出現(xiàn)紅邊特征參數(shù)是合理的,并且可以說明紅邊特征參數(shù)在農(nóng)作物分類識(shí)別中的重要性。黃雙燕等[28]和牛乾坤等[29]研究表明,在農(nóng)作物遙感分類中引入紅邊光譜和紅邊指數(shù),使機(jī)器學(xué)習(xí)分類器的OA得到提高,并使春、冬小麥的識(shí)別效果得到明顯提升,表明紅邊光譜特征對(duì)分類精度起著決定性作用,河套灌區(qū)平均OA 達(dá)到81%,Kappa 系數(shù)達(dá)到0.68。綜上,紅邊特征參數(shù)可以幫助分類器更靈敏地捕捉到不同農(nóng)作物特有的生長特征和物候?qū)W差異從而提高分類模型的精度。
研究中農(nóng)作物植被指數(shù)的引入使得SVMSee5.0、SVM-RF 和SVM-MR 分類模型的OA 均值比SVM-有紅邊分別提高了3.62%、4.18%和3.82%,Kappa系數(shù)均值分別提高了0.0446、0.0519和0.0473,說明植被指數(shù)在農(nóng)作物分類中具有有效性和重要性,能夠捕捉到農(nóng)作物的生長特征并幫助區(qū)分不同農(nóng)作物的類別。姜伊蘭等[21]研究指出利用NDVI時(shí)序差異指數(shù)提取的農(nóng)作物OA 和Kappa 系數(shù)比最大似然法和支持向量機(jī)法分別提高10.02%、0.21 和4.18%和0.09;谷祥輝等[30]研究表明時(shí)間序列組合植被指數(shù)用于農(nóng)作物分類是可行的,分類模型的精度和Kappa系數(shù)分別達(dá)到88.52%和0.8650;綜上,多種植被指數(shù)結(jié)合時(shí)間序列信息可以從生長時(shí)期和生長狀態(tài)上區(qū)分農(nóng)作物,從而提高農(nóng)作物識(shí)別的準(zhǔn)確性。
研究使用了3種特征優(yōu)選方法獲得特征參數(shù)的重要性排序,排名前十的特征參數(shù)均含有紅邊波段或紅邊指數(shù),表明紅邊波段和紅邊指數(shù)在農(nóng)作物分類中發(fā)揮著重要作用。因此,在后續(xù)研究中將考慮更多與紅邊波段有關(guān)的植被指數(shù),選取其中重要性較高的植被指數(shù),提高作物分類精度。研究也存有不足,作物分類結(jié)果中部分農(nóng)田存在“錯(cuò)分”和“漏分”現(xiàn)象,后續(xù)需通過人工干預(yù)和增加分類特征來減少“錯(cuò)分”和“漏分”現(xiàn)象的發(fā)生;另外,本次研究影像數(shù)據(jù)較為單一,后續(xù)考慮將Sentinel-2 影像與其他遙感影像進(jìn)行融合[31-32],充分挖掘地物的光譜特征、紋理特征和物候特征,進(jìn)一步提高農(nóng)作物識(shí)別精度。
(1)使用PIE 平臺(tái)可快速地訪問海量遙感圖像及其他數(shù)據(jù)資源,因其高性能的云計(jì)算能力可快速完成覆蓋焉耆盆地影像數(shù)據(jù)的去云、裁剪及植被指數(shù)構(gòu)建等處理?;诙鄷r(shí)間序列影像源與PIE相結(jié)合可方便快捷地進(jìn)行作物種植信息提取,較本地處理具有明顯優(yōu)勢(shì)。
(2)25 種分類模型的OA 和Kappa 系數(shù)均在92.20%和0.9037 以上,其中SVM-RF 方法在樣方分割為8:2 時(shí),OA 和Kappa 系數(shù)最高,分別為98.72%和0.9866,說明在PIE 中使用SVM 算法提取作物信息是可行的。
(3)5 種SVM 算法分類組合的OA 均值關(guān)系為SVM-RF(97.95%)>SVM-MR(97.59%)>SVM-See5.0(97.39%)>SVM-有紅邊(93.77%)>SVM-無紅邊(92.81%),Kappa系數(shù)均值關(guān)系為SVM-RF(0.9755)>SVM-MR(0.9709)>SVM-See5.0(0.9682)>SVM-有紅邊(0.9236)>SVM-無紅邊(0.9116),其中SVM-RF、SVM-See5.0 和SVM-MR 方法中加入了紅邊波段和植被指數(shù),提高了作物識(shí)別的精度。
(4)焉耆盆地農(nóng)作物以辣椒、玉米、小麥和葡萄為主,種植面積分別約為1166.98 km2、430.32 km2、344.23 km2和205.79 km2,分別約占研究區(qū)耕地面積的43.58%、16.07%、12.85%和7.68%,集中分布在土壤肥沃且灌溉設(shè)施較為完善的地區(qū),種植面積較大且在研究區(qū)內(nèi)連續(xù)分布,其他農(nóng)作物種植較少,呈現(xiàn)鑲嵌式分布。