王守會, 戴建國, 李栓明, 張國順, 崔美娜
(石河子大學信息科學與技術學院/兵團空間信息工程技術研究中心,新疆石河子 832000)
棉葉螨別稱棉紅蜘蛛,是世界性棉花害蟲,在國內(nèi)外各大棉區(qū)均有分布[1-3]。尤其在新疆,夏季高溫炎熱且干燥少雨,氣候條件適宜種植棉花的同時也給棉葉螨種群的生長和繁殖提供了優(yōu)越條件,使棉葉螨成為新疆地區(qū)危害棉花的主要害蟲之一,其中被危害嚴重的棉田可造成30%以上的減產(chǎn)[4],給新疆棉花生產(chǎn)帶來了較大損失。如果能夠運用科學有效的手段及時準確地對棉葉螨的發(fā)生發(fā)展趨勢進行預測,實現(xiàn)災前預防,對減少災害損失具有十分重要的意義。
病蟲害的發(fā)生發(fā)展主要受氣候條件(如溫濕度、降水量等)影響?;诖?,許多學者基于氣象數(shù)據(jù)建立模型在病蟲害預測方面做了很多的研究工作,并取得了較好的研究成果[5-7]。其中在棉葉螨發(fā)生預測研究中,劉婧然等基于徑向基函數(shù)神經(jīng)網(wǎng)絡(radical basis function,簡稱RBF)利用平均氣溫、最低氣溫、相對濕度和降水量建立了新疆石河子地區(qū)棉葉螨發(fā)生程度預測模型[8]。吳昊等對棉紅蜘蛛的發(fā)生成因進行了分析,并基于氣象因子分別建立了棉花苗期和伏秋期螨害等級預測模型,且預測結(jié)果均達到顯著水平[9]。因此,氣候條件是進行螨害預測時須要考慮的關鍵因素。
除氣象因素外,病蟲害的發(fā)生發(fā)展還與農(nóng)田生境、作物長勢等多種因素有關[10-11]。研究表明,當作物受到病蟲害脅迫時其葉綠素含量、水分含量、細胞組織結(jié)構(gòu)等生理狀態(tài)會發(fā)生變化,并由此引起光譜特征呈現(xiàn)一定的變化規(guī)律[12-13],成為遙感監(jiān)測的依據(jù)。尤其近年來,隨著衛(wèi)星遙感數(shù)據(jù)獲取及處理分析技術的不斷成熟,遙感逐漸成為大面積農(nóng)作物病蟲害監(jiān)測預測的有效手段,學者們對此開展了大量研究。
綜合分析,雖然氣象環(huán)境是導致螨害發(fā)生的主要因素,但作物的當前生長狀態(tài)和受害程度對螨害后續(xù)擴散發(fā)展也有很大影響。因此,棉葉螨的發(fā)生發(fā)展受氣候環(huán)境和棉花當前生理狀態(tài)2個方面的影響,將能夠反映作物生理指標的遙感植被指數(shù)與氣象數(shù)據(jù)相結(jié)合用于螨害預測研究較為科學合理,該研究方法也逐漸成為研究趨勢[14-15]。鑒于此,以新疆生產(chǎn)建設兵團第八師為研究區(qū)域,將棉花遙感生理監(jiān)測與氣象因子相結(jié)合用于預測研究大面積棉田螨害的發(fā)生發(fā)展趨勢,為新疆棉花生產(chǎn)過程中棉葉螨的合理預防提供理論依據(jù),并為類似的應用研究提供方法參考。
新疆生產(chǎn)建設兵團第八師(含石河子市)地處天山北麓中段,準噶爾盆地南緣,古爾班通古特大沙漠南緣(84°58′~86°24′E,43°26′~45°20′N,圖1),屬于典型的溫帶大陸性氣候,水資源較為豐富,冬季長而嚴寒,夏季短而炎熱,年平均氣溫為7.5~8.2 ℃,年日照時數(shù)為2 318~2 732 h,無霜期為147~191 d,年降水量為180~270 mm,年蒸發(fā)量為1 000~1 500 mm。棉花為全師的主要經(jīng)濟作物,其播種面積每年在19萬hm2左右。
1.2.1 遙感數(shù)據(jù)獲取及處理 所選用的遙感數(shù)據(jù)來源于美國國家航空航天局(national aeronautics and space administration,簡稱NASA)于2013年發(fā)射的Landsat 8衛(wèi)星,該衛(wèi)星攜帶有陸地成像儀(operational land imager,簡稱OLI)和熱紅外傳感器(thermal infrared sensor,簡稱TIRS)2個傳感器。
OLI設有9個波段,包括可見光、近紅外和短波紅外波段,其中多光譜波段的空間分辨率為30 m,全色波段的空間分辨率為15 m,成像寬幅為185 km×185 km。影像的獲取時間為2017年6月27日和2017年7月13日共2景影像,影像清晰且覆蓋整個研究區(qū),能夠滿足研究需要。
首先對影像進行輻射定標,將圖像的數(shù)字量化值(digital number,簡稱DN)轉(zhuǎn)化為輻射亮度值,然后進行大氣校正,以消除大氣和光照等因素對地物反射率的影響獲得真實地物反射率,最后對影像進行裁剪得到研究區(qū)的遙感影像。
1.2.2 棉花種植區(qū)域提取 利用2017年6月27日研究區(qū)遙感影像采用監(jiān)督分類法對棉花的種植面積進行提取。首先,以曹衛(wèi)彬等建立的農(nóng)作物及地塊類型解譯標志為參考,結(jié)合近紅外波段合成的假彩色圖像對研究區(qū)內(nèi)的7種地物類型(棉花、玉米、葡萄、居民地、山體、裸地、水體)建立感興趣區(qū)作為訓練樣本[16]。然后選擇監(jiān)督分類中的最大似然分類方法對研究區(qū)地物類型進行分類,實現(xiàn)對棉花種植面積的提取。最后利用混淆矩陣對分類結(jié)果進行精度評價,總體精度為 97.24%,Kappa系數(shù)為0.95,分類效果較好,可以滿足后續(xù)研究需要。研究區(qū)地物類型以棉花為主,其他地物類型相對于棉花屬于極少數(shù),存在分類樣本不平衡現(xiàn)象,因此可取得較高分類精度。
1.2.3 遙感特征因子提取 利用2017年6月27日(蕾期)、7月13日(花期)的2景遙感影像分別計算病蟲害監(jiān)測研究中常用的7種植被指數(shù)[17-19],共獲得14種植被指數(shù)作為初選遙感特征因子。相關植被指數(shù)及其計算公式如表1所示。
表1 相關植被指數(shù)及其計算公式
1.2.4 氣象數(shù)據(jù)獲取與處理 為全面考慮氣象因素對棉葉螨發(fā)生發(fā)展的影響,共收集全師范圍內(nèi)11個氣象站點的氣象數(shù)據(jù)(數(shù)據(jù)來源于新疆氣象網(wǎng)),氣象站點分布如圖1所示。由于氣象站點空間分布離散,所收集的氣象數(shù)據(jù)屬于點狀數(shù)據(jù),而本研究需要獲取面狀連續(xù)的氣象數(shù)據(jù),因此使用ArcGIS 10.4.1軟件對11個氣象站點的氣象數(shù)據(jù)采用克里金(Kriging)插值方法進行空間插值分析,從而得到空間連續(xù)的氣象信息。
1.2.5 氣象特征因子選取 根據(jù)氣象對棉葉螨的發(fā)生與作用規(guī)律,初選2016年11月、12月及2017年1月的平均溫度、最高溫度、最低溫度、平均相對濕度、地表溫度、5 cm地溫、2016年12至2017年1月累積降水量,2017年1月降水量及極度低溫,2月地表溫度、5 cm地溫,3—4月大于10 ℃積溫,3、4、5、6月平均溫度、平均相對濕度,4—6月累積降水量,5—6月累積降水量、溫濕系數(shù)、溫雨系數(shù),6月上旬、下旬降水量,5、6月的溫濕系數(shù)、溫雨系數(shù),7月平均溫度、最低溫度、降水量、溫濕系數(shù)、溫雨系數(shù)共47種數(shù)據(jù)作為氣象特征因子。
1.2.6 螨害實地調(diào)查數(shù)據(jù) 于2次衛(wèi)星過境時間段(2017年6月27日—7月13日)內(nèi)由人工進行實地調(diào)查??紤]到Landsat 8影像的空間分辨率為30 m,因此以30 m×30 m為1個調(diào)查單元。在調(diào)查單元內(nèi)采用“Z”字形采樣法,每個單元調(diào)查8~10點,每點調(diào)查10株棉花并記錄螨害的發(fā)生情況(發(fā)病、健康),最后根據(jù)紅葉株數(shù)和調(diào)查總株數(shù)計算紅葉株率,并按照紅葉株率進行分級[27]。當紅葉株率達到3級時,則認為達到防治要求,將該調(diào)查點標記為螨害發(fā)生點,否則標記為健康點,并使用全球定位系統(tǒng)(global positoning system,簡稱GPS)記錄該點坐標,共調(diào)查106個采樣點。
首先,采用Relief算法[28]和泊松相關系數(shù)法(poisson correlation)相結(jié)合的方法對氣象與遙感共61個(47個氣象因子,14個植被指數(shù))初選特征因子進行特征降維,獲取建模最佳特征;其次,分別使用3種方法(單一氣象因子、單一遙感植被指數(shù)、氣象因子與遙感植被指數(shù)相結(jié)合)建立預測模型;最后,對3種模型進行精度評價和對比分析,從而獲取最佳的建模方法和預測模型,并對整個研究區(qū)進行螨害預測,生成螨害發(fā)生空間分布圖。技術路線如圖2所示。
1.3.1 特征降維 首先利用Relief算法計算61種初選特征因子的特征權(quán)重(圖3)。特征權(quán)重越大,表示該特征用于分類模型時的分類能力越強,反之則表示該特征分類能力越弱。設置權(quán)重閾值為1 500,小于該閾值的特征將會被移除,最后剩余14種特征。其次,采用泊松相關系數(shù)法去除冗余特征,計算剩余兩兩特征之間的泊松相關系數(shù),并設置相關性閾值為0.85,超過該閾值則認為2個特征之間相關性過高,存在信息冗余,將其中特征權(quán)重較小者進行剔除。最終篩選得到6月27日GNDVI、MSR以及7月13日RVI、5—6月累積降水量、5月溫濕系數(shù)、4—6月累積降水量、6月上旬降水量共7種特征因子。
1.3.2 模型建立 螨害的發(fā)生與否屬于非線性二分類問題,Logistic回歸是解決二分類問題非常有效的方法之一,該算法能夠很好地解釋在一定條件下事件發(fā)生與否的概率[29]。因此,本研究采用Logistic回歸建立螨害預測模型。螨害發(fā)生與否的表示方法為發(fā)生記為1,未發(fā)生記為0。Logistic回歸模型為:
(1)
式中:β0為常數(shù)項;β1、β2、…、βp為Logistic模型回歸系數(shù);x1、x2、…、xp表示p個自變量;P表示在p個自變量的作用下發(fā)生螨害的條件概率,P≥0.5表示發(fā)生螨害,P<0.5表示健康。
對公式(1)作Logit變換,Logistic回歸模型可以變成線性形式:
(2)
1.3.3 精度評價 將準確率(Acc,公式3)、精確率(P,公式4)、召回率(R,公式5)和F1值(公式6)作為分類器的評價指標。各種指標的計算方法如下:
(3)
(4)
(5)
(6)
式中:TP表示將正類預測為正類數(shù);FN表示將正類預測為負類數(shù);FP表示將負類預測為正類數(shù);TN表示將負類預測為負類數(shù)。
分別使用單一氣象因子(2017年5—6月累積降水量、5月溫濕系數(shù)、4—6月累積降水量、6月上旬降水量,記為模型1)、單一遙感植被指數(shù)(6月27日GNDVI、MSR以及7月13日RVI,記為模型2)以及氣象因子與遙感植被指數(shù)相結(jié)合(全部7個特征,記為模型3)3種方法進行Logistic回歸建模。其中,2/3的數(shù)據(jù)樣本用來建模,1/3用來精度驗證。由表2可以看出,3種模型在測試集上的準確率相較于訓練集上的準確率均有所下降,表明該分類模型的泛化能力有待提高,但對模型的錯分漏分情況分析發(fā)現(xiàn),3種模型整體分類效果較好。通過計算測試集上的精確率、召回率、F1值并對比分析發(fā)現(xiàn),模型3分類效果最好,模型2次之,模型1效果最差。
表2 不同螨害預測模型分類結(jié)果對比
分別用3種預測模型對整個研究區(qū)的螨害情況進行預測并生成分布圖,結(jié)果如圖4、圖5、圖6所示。
由圖4可知,螨害發(fā)生嚴重地區(qū)主要分布在142團、144團、134團、133團和石總場,而在132團、135團、136團、122團、147團和143團部分發(fā)生且相對較輕,在150團、149團和148團均無螨害發(fā)生。
由圖5可知,整個研究區(qū)均有螨害發(fā)生但整體發(fā)生相對較輕,無大面積螨害暴發(fā)區(qū)域。其中,在136團、135團、132團、133團、134團和142團附近相較于148團、149團、150團和石總場附近螨害發(fā)生嚴重。
由圖6可知,螨害發(fā)生集中分布于142團附近,在150團、石總場、143團和136團螨害均有發(fā)生,但相對較輕,呈零星點狀分布。根據(jù)調(diào)查,2017年研究區(qū)棉葉螨發(fā)生情況整體呈“南重北輕”的趨勢,其中142團發(fā)生面積較大,石總場有一定面積發(fā)生,其他團場均有輕微點片發(fā)生。將模型預測結(jié)果與實際情況分析比較可以看出,模型1和模型3的整體預測趨勢與實際情況較為相符,說明氣象環(huán)境的確在整體上對棉葉螨的發(fā)生起著重要作用,因此基于氣象因子的模型在大尺度上的預測效果比較好,這與前人的研究結(jié)果一致。但氣象隨空間變化緩慢,相鄰點差異很小,相比而言,遙感植被指數(shù)能夠反映空間上更細小的變化,具有更好的洞察能力。因此,對于螨害點片發(fā)生的情況,遙感模型的預測效果更好。而氣象與遙感結(jié)合的模型綜合了2類數(shù)據(jù)的優(yōu)勢,既能反映空間上的變化趨勢,也能對小范圍點片發(fā)生情況進行較為準確地預測。
氣象環(huán)境和作物生理狀況均為棉葉螨的生存環(huán)境,決定了其發(fā)生發(fā)展的趨勢,因此,使用其中任何一種數(shù)據(jù)進行建模均可以對螨害發(fā)生發(fā)展進行預測。但結(jié)果表明,同時使用2種數(shù)據(jù)綜合考慮了影響螨害發(fā)生的2大因素,結(jié)合了二者的特點和優(yōu)勢,因而所建模型具有更高的精度和更好的預測效果。
對于大尺度區(qū)域,氣象站點分布離散且不均勻,無法獲取研究區(qū)連續(xù)的氣象數(shù)據(jù)。因此,基于研究區(qū)內(nèi)及周圍11個氣象站點通過空間插值方法獲取空間分布連續(xù)的氣象數(shù)據(jù)用于解決該問題。在實際應用時,所采用的空間插值方法和參數(shù)的選擇會直接影響插值精度,如果選擇不當,會使插值效果不理想,將影響預測模型的準確性。此外,越冬基數(shù)、棉花品種也是影響棉葉螨發(fā)生發(fā)展的關鍵因素,因此在后續(xù)的研究中應盡可能將該部分因素進行融合,以提高模型預測精度。
使用的遙感數(shù)據(jù)來源于Landsat 8衛(wèi)星。Landsat 8空間分辨率為30 m,即每個像元表示30 m×30 m范圍的棉田,由于范圍較大,使得完全健康區(qū)域和有輕微螨害發(fā)生區(qū)域之間的光譜差異大大降低。尤其在棉葉螨點片發(fā)生初期,健康采樣點和螨害點片發(fā)生采樣點之間的光譜差異更小,如果處理不當會對模型造成干擾,為防止發(fā)生這種情況,將紅葉株率達到3級以上的采樣點認為有螨害發(fā)生,這種處理方法勢必會對模型精度造成影響,導致螨害早期輕微發(fā)生的區(qū)域無法得到有效判別,因此,發(fā)病樣點的紅葉株率閾值該如何設定還須進一步研究。如果能夠使用無人機進行遙感監(jiān)測,則會在很大程度上克服這個問題。
基于氣象遙感數(shù)據(jù)建立模型并對新疆生產(chǎn)建設兵團第八師2017年7月棉葉螨進行預測,結(jié)果表明,將氣象數(shù)據(jù)和遙感數(shù)據(jù)相結(jié)合能夠?qū)γ奕~螨發(fā)生趨勢和分布情況進行較好地預測,該方法可以為新疆地區(qū)大尺度區(qū)域的棉葉螨預測預報和提前預防提供理論依據(jù),并為相關研究提供借鑒。