馬慧琴,黃文江,景元書
(1. 南京信息工程大學,應用氣象學院,氣象災害預報預警與評估協(xié)同創(chuàng)新中心,南京 210044;2. 中國科學院遙感與數(shù)字地球研究所,數(shù)字地球重點實驗室,北京 100094)
遙感與氣象數(shù)據(jù)結(jié)合預測小麥灌漿期白粉病
馬慧琴1,2,黃文江2※,景元書1
(1. 南京信息工程大學,應用氣象學院,氣象災害預報預警與評估協(xié)同創(chuàng)新中心,南京 210044;2. 中國科學院遙感與數(shù)字地球研究所,數(shù)字地球重點實驗室,北京 100094)
利用多源數(shù)據(jù)對區(qū)域尺度上小麥白粉病的發(fā)生狀況準確及時地預報能為農(nóng)業(yè)服務和農(nóng)業(yè)植保等部門提供重要信息,實現(xiàn)小麥白粉病的有效預防。研究利用一景2014年5月6日的landsat8遙感影像提取出植被指數(shù)、地表溫度(land surface temperature,LST)和影像中各波段反射率特征,同時用2014年3月-5月份的站點逐日地面氣象資料計算獲得各氣象特征,并經(jīng)過GIS空間插值分析得到相應的空間氣象特征。通過Relief算法和泊松相關(guān)系數(shù)相結(jié)合的方式進行遙感和氣象特征的篩選,最終得出改進的簡單比值指數(shù)(modified simple ratio index,MSR)、重歸一化植被指數(shù)(re-normalized difference vegetation index,RDVI)、3月21日-4月20日總?cè)照諘r數(shù)和4月11日-5月10日大于0.1 mm降雨日數(shù)。采用相關(guān)向量機(relevance vector machine,RVM)的方法分別用篩選出的遙感、氣象數(shù)據(jù)特征及2種數(shù)據(jù)特征相結(jié)合的方式構(gòu)建了河北省石家莊市藁城、晉州和趙縣3地區(qū)小麥灌漿期白粉病的發(fā)生預測模型,并對3種不同數(shù)據(jù)模型進行了驗證與評估。試驗結(jié)果表明,遙感氣象數(shù)據(jù)模型的總體精度達到84.2%,優(yōu)于遙感數(shù)據(jù)模型的80.0%和氣象數(shù)據(jù)模型的74.7%。進而得出,相比于單站點準確和空間不連續(xù)的氣象數(shù)據(jù)和類型單一的遙感數(shù)據(jù),遙感氣象數(shù)據(jù)更適合于區(qū)域尺度范圍內(nèi)的作物病蟲害發(fā)生發(fā)展狀況的預測研究。
遙感;氣象;預測;相關(guān)向量機;氣象數(shù)據(jù);小麥白粉病;
小麥白粉病是影響小麥生長發(fā)育的主要病害之一。近年來隨著氣候變化等因素的影響,中國小麥白粉病的發(fā)生發(fā)展和分布特征發(fā)生了變化,對其研究工作也越來越多,研究方法與內(nèi)容也在不斷改進、加深[1]。小麥白粉病常在小麥生育后期爆發(fā),受害后一般可減產(chǎn)5%~10%,重病田達20%以上。準確及時地預測小麥白粉病對病害的有效預防具有重要意義。
目前,關(guān)于小麥白粉病的預測研究主要集中在氣象因子對小麥白粉病影響的研究,多基于田間觀測,通過與氣象資料對比分析,建立小麥白粉病發(fā)生發(fā)展與各氣象因子及因子組合間的定量關(guān)系[2]。國內(nèi)外學者利用氣象數(shù)據(jù)進行了作物病蟲害預報研究。居為民等[3]根據(jù)小麥白粉病始病期、嚴重度和同期氣象資料,采用滑動相關(guān)普查法分析了氣象條件對白粉病發(fā)生的影響作用,并在此基礎上建立了白粉病的預報模式。錢拴等[4]采用影響我國小麥白粉病發(fā)病流行的關(guān)鍵環(huán)流特征因子距平作為預測因子,建立了白粉病長期氣象預測模式。姚樹然等[5]用氣象資料和白粉病觀測調(diào)查資料通過災變規(guī)律關(guān)鍵時方法建立了白粉病發(fā)生程度的預測指標模型。Stansbury等[6]利用濕熱指數(shù)模型和降雨模式2種氣象建模方法對西澳大利亞州地區(qū)小麥印度腥黑穗病的易感時期進行了預報,并分析了小麥易染該病的氣候原因。然而,利用氣象數(shù)據(jù)預測白粉病的方法具有一定的局限性。盡管氣象條件是小麥白粉病發(fā)生流行程度的決定因素[3],但其他因子如小麥長勢信息、農(nóng)田環(huán)境(土壤含水量,地表溫度)、作物品種和施肥措施等條件與小麥白粉病的發(fā)生也息息相關(guān)。另外,用于建立氣象數(shù)據(jù)預測模型的氣象站點數(shù)據(jù)具有單點準確客觀、因其數(shù)量有限而空間信息不連續(xù)的特點,從而使得模型雖能夠給出較大范圍的病害發(fā)生概率,但其在面上并不連續(xù),無法給出一定區(qū)域內(nèi)地塊級的空間病害發(fā)生概率。
相比于氣象數(shù)據(jù),遙感數(shù)據(jù)可以給出連續(xù)的空間信息,同時可實現(xiàn)對作物的生長和生境信息的實時反演。目前采用遙感數(shù)據(jù)預測病害以及將遙感和氣象信息結(jié)合用于病害預測的研究較少。沈文穎等[7]通過大田小區(qū)人工接種試驗,采用不同白粉病危害程度下的常規(guī)光譜特征參數(shù)、比值指數(shù)和歸一化指數(shù),利用因子分析(factor analysis,F(xiàn)A)與BP神經(jīng)網(wǎng)絡(back propagation neural network,BPNN)相結(jié)合的方法對小麥葉片白粉病嚴重度進行了模型模擬,結(jié)果表明反演模型對小麥白粉病的整個病癥期均具有很好的適用性。張競成等[8]采用環(huán)境星影像數(shù)據(jù)反演的各種植被指數(shù),地表溫度及作物干旱指數(shù),通過logistic回歸方法構(gòu)建了小麥白粉病的發(fā)生預測模型。張競成等[9]還利用氣象因子結(jié)合環(huán)境星數(shù)據(jù),通過logistic 回歸方法來構(gòu)建小麥白粉病發(fā)生概率預測模型。羅菊花等[10]利用TM(landsat5 TM)影像反演的修訂后的歸一化水分植被指數(shù)(modified normalized difference water index,MNDWI)和地表溫度(land surface temperature,LST)構(gòu)建了二維特征空間來預測小麥蚜蟲。Jonas Franke等[11]探討了多光譜遙感對作物疾病多時相分析的潛力,通過3景遙感影像分析病害的時空變化,并采用決策樹、混合調(diào)諧匹配濾波結(jié)果和歸一化植被指數(shù)來區(qū)分不同病害程度的小麥區(qū)域。羅菊花等[12]利用環(huán)境星數(shù)據(jù)反演的地表溫度、垂直干旱指數(shù)(perpendicular drought index,PDI)和歸一化植被指數(shù)(NDVI)結(jié)合溫度、降水、風速等氣象數(shù)據(jù),通過Logistic回歸方法建立了小麥蚜蟲發(fā)生預測模型。上述研究表明作物長勢信息和生境特征與病蟲害的發(fā)生發(fā)展狀況密切相關(guān)。
當前對作物病蟲害的預報方法以數(shù)理統(tǒng)計應用為主,同時還有專家評估及系統(tǒng)模擬的方法。這些方法依次具有普適性差、人為主觀性和構(gòu)建困難的缺陷。相關(guān)向量機(relevance vector machine,RVM)是一種機器學習和數(shù)據(jù)挖掘的常用方法。因其具有優(yōu)越的學習能力,常被用于商業(yè)決策的改善、疾病檢測及天氣預測等[13-17]。唐翠翠等[18]利用該方法對北京郊區(qū)的冬小麥蚜蟲的發(fā)生概率進行了預測,并取得了較高的預測精度。
基于上述分析,考慮影響小麥白粉病發(fā)生因子的多樣性,本文嘗試通過氣象數(shù)據(jù)和遙感數(shù)據(jù)以及2種數(shù)據(jù)相結(jié)合,利用相關(guān)向量機的方法對區(qū)域尺度的小麥白粉病的發(fā)病情況開展預測研究,并對3種數(shù)據(jù)所建立的預測模型的優(yōu)越性進行評價。
1.1 研究區(qū)概況
研究區(qū)位于河北省石家莊市的藁城(114°39′~114°59′E,37°51′~38°18′N)、晉州(114°58′~115°12′E,37°48′~38°10′N)和趙縣(114°37′~115°4′E,37°37′~37°53′N)(如圖1)。該區(qū)域在氣候分區(qū)中屬黃河流域白粉病易發(fā)氣候區(qū)[19]。統(tǒng)計資料顯示,該地區(qū)白粉病發(fā)生時間連續(xù)性強,爆發(fā)特征明顯,受災面積范圍大。
圖1 研究區(qū)概況Fig.1 General situation of study area
1.2 數(shù)據(jù)獲取
研究所用數(shù)據(jù)主要包括遙感數(shù)據(jù)、氣象數(shù)據(jù)和小麥白粉病地面調(diào)查數(shù)據(jù)。遙感數(shù)據(jù)為由Landsat8傳感器獲取的2014年5月6日、2014年5月22日和2014年6月5日3景影像,其基本參數(shù)見表1。氣象數(shù)據(jù)來源于河北省氣象局各站點氣象資料庫。區(qū)域范圍包括石家莊市的藁城、晉州、趙縣3地區(qū)及其周邊的高邑、欒城、深澤、石家莊市、無極、辛集、元氏、正定共11個市縣。重點獲取了2014年3月到5月的逐日平均氣溫、降雨量、日照時數(shù)和相對濕度等地面氣象數(shù)據(jù)。小麥白粉病病害地面調(diào)查數(shù)據(jù)于2014年5月下旬(小麥灌漿期)在藁城、晉州和趙縣調(diào)查獲得。獲取時根據(jù)Landsat8數(shù)據(jù)的空間分辨率,確定每個調(diào)查樣點為30 m×30 m的正方形區(qū)域,用手持式GPS定位儀記錄樣點區(qū)域的中心經(jīng)緯度信息。盡量選取范圍內(nèi)全為小麥,地勢平坦且遠離建筑物的地塊。每塊樣地中采用分布均勻的9點調(diào)查法調(diào)查,每點調(diào)查面積為1 m2。調(diào)查內(nèi)容包括小麥發(fā)病嚴重度、小麥長勢、株高等。最終獲得95個樣點數(shù)據(jù)。
表1 landsat8衛(wèi)星的基本參數(shù)Table 1 Basic parameters of landsat8 satellite
1.3 數(shù)據(jù)處理
1.3.1 遙感數(shù)據(jù)處理
獲取研究需要的數(shù)據(jù)后,首先需要對影像進行輻射定標和大氣校正及影像裁剪處理。輻射定標的公式如下
式中L為輻射亮度,其單位為W/(m2·Sr·μm),ML (RADIANCE_MULT_BAND_x)為衛(wèi)星傳感器的增益值,AL(RADIANCE_ADD_BAND_x)為衛(wèi)星傳感器補償值(偏置),Qcal為影像像元灰度值。其中ML和AL可直接在影像頭文件中獲取。熱紅外波段的輻射亮度公式如下
輻射定標完成后,采用ENVI5.1軟件中的FLAASH大氣校正模塊將影像的輻射亮度轉(zhuǎn)為反射率。
遙感數(shù)據(jù)預處理完成后,根據(jù)當?shù)氐淖魑镱愋图疤攸c,首先利用2014年5月22日的影像通過NDVI、數(shù)字高程模型(digital elevation model,DEM)的閾值設置初步剔除非植被地物和部分林地、再根據(jù)2014年5月6日和2014年6月5日2景影像的近紅外波段反射率的閾值設置剔除草地,最后用3景影像的近紅外波段合成的假彩色圖像結(jié)合監(jiān)督分類中最大似然分類的方法最終實現(xiàn)對研究區(qū)小麥種植面積的提取,總體精度達到94%。最終提取的小麥種植面積分布見圖1b。
之后,利用預處理后的2014年5月6日的遙感影像進行了遙感數(shù)據(jù)預測特征的提取。本文選取出landsat8各波段反射率和對小麥白粉病比較敏感的幾種植被指數(shù)[20]以及表征生境因子的地表溫度(LST)共15個特征作為白粉病預測模型的初選遙感特征因子。各植被指數(shù)的具體名稱及計算方法詳細見表2。采用常用的單通道算法利用熱紅外11波段對研究區(qū)的地表溫度進行反演[21-22]。
表2 寬波段植被指數(shù)計算公式Table 2 Vegetation index of wide band range
1.3.2 氣象數(shù)據(jù)處理
大量研究表明小麥白粉病的發(fā)生發(fā)展與氣候條件密切相關(guān)[2-5]。因此,氣象因子是病害發(fā)生發(fā)展的重要驅(qū)動因子,尤其是氣溫、濕度、降雨和風速。在溫濕度適宜的條件下,病菌的繁衍生育速度最快;降雨是通過影響大氣的相對濕度來間接影響病菌的產(chǎn)生和消失;寡照則有利于白粉病的流行。
考慮到研究區(qū)小麥白粉病的發(fā)病時間及特點,并結(jié)合文獻調(diào)研結(jié)果,將通過氣象站點的逐日地面氣象資料計算所得的3月和4月的月平均氣溫,月大于0.1mm降雨日數(shù),月總?cè)照諘r數(shù)、月平均相對濕度、月溫雨系數(shù)(溫雨系數(shù)=某時段降水總量/該時段平均氣溫)和月降雨系數(shù)(降雨系數(shù)=(降雨量×降雨日數(shù))1/2)[23];3月下旬至5月上旬的旬平均氣溫、旬大于0.1 mm降雨日數(shù)、旬總?cè)照諘r數(shù)、旬平均相對濕度、旬溫雨系數(shù)和旬降雨系數(shù);3月21日~4月20日平均氣溫、大于0.1 mm降雨日數(shù)、總?cè)照諘r數(shù)、平均相對濕度、溫雨系數(shù)和降雨系數(shù);以及4月11日~5月10日平均氣溫、大于0.1 mm降雨日數(shù)、總?cè)照諘r數(shù)、平均相對濕度、溫雨系數(shù)和降雨系數(shù)54個特征因子作為白粉病預測模型的初選氣象特征。
因有限的氣象站點無法滿足氣象因子的時空分布精度,雖然測量精度較高,但對樣本點的代表性差。為獲取調(diào)查樣點相對較為準確的各樣本點的氣象預測特征,利用GIS軟件對氣象特征進行空間插值分析。有學者研究發(fā)現(xiàn)對于同一種插值方法,參與插值的氣象站點數(shù)目不同,插值結(jié)果不同,只有選擇合適的站點數(shù)目時才會有很高的精度[24-25]?;诖耍诓逯捣治龅恼军c選擇時,不僅采用了藁城、晉州和趙縣這3個研究區(qū)站點的數(shù)據(jù),同時還結(jié)合了研究區(qū)周邊的市縣總共11個氣象站點的數(shù)據(jù),具體的氣象站點分布見圖2。研究通過arcGIS10.2軟件空間分析中的反距離加權(quán)法(inverse distance weighted,IDW)對研究區(qū)的各氣象特征進行空間插值分析。
圖2 氣象站點分布Fig.2 Distribution of meteorological stations
1.4 模型特征的選取及模型的構(gòu)建
1.4.1 模型特征的選取
特征選擇是統(tǒng)計學領(lǐng)域的經(jīng)典問題,也是機器學習領(lǐng)域的重要問題,對機器學習領(lǐng)域的所有問題都有重大意義。合適的特征選擇可以有效去除不相關(guān)和冗余特征,提高學習算法的效率[26]。很多學習算法受不相關(guān)或冗余特征的負面影響,而選擇好的特征既可以減小計算復雜度,提高分類準確度,又有助于尋找更精簡更易理解的算法模型;另外,不斷出現(xiàn)的數(shù)目龐大或特征維數(shù)高的大規(guī)模數(shù)據(jù)處理問題對特征選擇算法提出了嚴峻的挑戰(zhàn)[27]。
Relief算法最早由Kira[28]提出,是公認的性能較好的特征評估方法,主要是根據(jù)特征對近距離樣本的區(qū)分能力來評估特征。該算法核心思想為:好的特征應使同類樣本接近,而使不同類樣本遠離。Relief算法具有運行效率高,不限制數(shù)據(jù)類型及對特征間關(guān)系不敏感的優(yōu)點,能較好地去除無關(guān)特征,但不能去除冗余特征[29]。為利用Relief算法的優(yōu)點,同時解決其不能去除冗余的缺點,通過采用Relief與泊松相關(guān)系數(shù)(poisson correlation)相結(jié)合的方法來進行預測特征選取[29]。首先,通過Relief算法計算出共69個遙感及氣象特征在小麥健康與發(fā)生白粉病分類中的權(quán)重,圖3為計算所得的各特征的權(quán)重分布圖。之后,結(jié)合計算獲得的特征權(quán)重分布圖中各特征變量的權(quán)重分布情況,為使得篩選出的特征變量的數(shù)量不至于過多,將權(quán)重閾值設置為4000,篩選出權(quán)重值最大的11個特征變量。然后將篩選出的特征變量兩兩計算其泊松相關(guān)系數(shù),在冗余度大的2個特征中,保留分類權(quán)重較大的特征。最終,篩選出了MSR、RDVI、3月21日~4月20日總?cè)照諘r數(shù)和4月11日~5月10日大于0.1 mm降雨日數(shù)4個特征用于小麥白粉病發(fā)生預測模型的構(gòu)建。
1.4.2 模型的構(gòu)建
獲取的地面調(diào)查點中共有95個點與遙感影像同步。調(diào)查點的病害嚴重度分5個等級,0(無病害)、1(輕度),2(中度),3(重度),4(特重)。考慮到輕度病害與無病害小麥較難區(qū)分,研究將無病害與輕度2個等級合并為健康,用-1表示,而將其余中度、重度、特重3個等級合并為發(fā)病,用1表示。
圖3 Relief算法特征權(quán)重計算結(jié)果圖Fig.3 Calculation results chart of feature weight by Relief algorithm
相關(guān)向量機是一種新的基于貝葉斯統(tǒng)計學習理論的學習方法,與支持向量機(support vector machine, SVM)相比,具有概率型輸出、更稀疏和核函數(shù)選擇更自由等優(yōu)點[30]。目前相關(guān)向量機國內(nèi)外主要應用于醫(yī)學影像處理、數(shù)字圖像處理和高光譜圖像分類等領(lǐng)域[31,32]。本研究中小麥白粉病的發(fā)生預測實質(zhì)為二分類問題,而相關(guān)向量機用于二分類預測的模型形式為
式中λ為樣本的權(quán)重向量,n為樣本數(shù),σ為邏輯函數(shù),xi為訓練樣本向量,ti為訓練樣本標號,(xi, ti)(i=1,2,…,n)為訓練樣本集合,y為分類函數(shù)。若假設t等于1代表小麥發(fā)病,t等于?1表示病害未發(fā)生,則預測規(guī)則為:若P≤0.5,則白粉病不發(fā)生;若P>0.5,則發(fā)生白粉病。
研究采用由Relief算法結(jié)合泊松相關(guān)系數(shù)的方法篩選獲得4個特征變量,利用RVM方法,構(gòu)建僅以遙感數(shù)據(jù)MSR、RDVI為輸入變量,僅以氣象數(shù)據(jù)3月21日~4月20日總?cè)照諘r數(shù)和4月11日~5月10日大于0.1 mm降雨日數(shù)為輸入變量,以及以遙感氣象數(shù)據(jù)MSR、RDVI、3月21日~4月20日總?cè)照諘r數(shù)和4月11日~5月10日大于0.1 mm降雨日數(shù)為輸入變量的3個不同數(shù)據(jù)類型的小麥白粉病發(fā)生預測模型。
在95個地面調(diào)查樣本點中,均勻地選取出總樣本數(shù)的2/3即63個樣本數(shù)據(jù)作為訓練樣本用于模型構(gòu)建,而剩余的3/1即32個樣本數(shù)據(jù)用于模型的驗證。
2.1 研究區(qū)小麥白粉病發(fā)生預測
采用研究區(qū)2014年5月6日遙感影像數(shù)據(jù)以及2014年3~5月份氣象數(shù)據(jù)插值結(jié)果數(shù)據(jù),以單個像元為基本處理單元,用Relief算法與泊松相關(guān)系數(shù)相結(jié)合的方式篩選出4個特征量MSR、RDVI、3月21日~4月20日總?cè)照諘r數(shù)和4月11日~5月10日大于0.1 mm降雨日數(shù),利用RVM方法建立遙感數(shù)據(jù)、氣象數(shù)據(jù)和遙感氣象數(shù)據(jù)模型,得到了2014年5月下旬小麥灌漿期的白粉病發(fā)生空間分布圖(圖4)。從預測結(jié)果分布圖可以看出,2014年河北省石家莊市藁城、晉州、趙縣這3個地區(qū)白粉病發(fā)生嚴重。3種數(shù)據(jù)模型相對比發(fā)現(xiàn),不同數(shù)據(jù)模型預測的結(jié)果差異較大,氣象數(shù)據(jù)預測結(jié)果中趙縣麥區(qū)均發(fā)生白粉病,藁城和晉州也全面發(fā)生,健康小麥分布為極少部分;遙感數(shù)據(jù)預測結(jié)果中3地區(qū)均有健康麥區(qū)與病害發(fā)生麥區(qū),從圖中(圖4b)可以看出趙縣發(fā)生病害面積最大,藁城次之,晉州病害面積最少;遙感氣象數(shù)據(jù)預測結(jié)果介于二者之間。但3種數(shù)據(jù)預測的結(jié)果大體趨勢一致,均為趙縣白粉病發(fā)生最為嚴重,藁城次之,晉州發(fā)病最輕。另外,比較氣象數(shù)據(jù)和遙感數(shù)據(jù)模型發(fā)現(xiàn),遙感數(shù)據(jù)模型預測結(jié)果中,小麥健康地塊與病害地塊之間的分布較為均勻;而氣象數(shù)據(jù)模型預測結(jié)果則表現(xiàn)為整塊的病害區(qū)域,且健康麥區(qū)為極少的一部分,這一結(jié)果間接表明氣象數(shù)據(jù)模型的擬合優(yōu)度不高。
圖4 RVM模型預測小麥白粉病發(fā)生空間分布圖Fig.4 Predicted spatial distribution map of wheat powdery mildew by relevance vector machine
2.2 模型的評估與驗證
對3種數(shù)據(jù)建立的模型進行Spearman擬合優(yōu)度檢驗,并通過配對樣本檢驗和有序變量的相關(guān)性分析獲取統(tǒng)計量參數(shù)Somers’D、kendall’s Tau-c和Goodman-Kruskal Gama[33-35]。3種參數(shù)的取值范圍分別在[-1,+1]之間,值越大表明模型精度越高。從表3可以看出,3種數(shù)據(jù)模型的Spearman相關(guān)性值為氣象數(shù)據(jù)0.511,遙感數(shù)據(jù)0.609,遙感氣象數(shù)據(jù)0.693,且均達到極顯著相關(guān)。
表3 RVM模型的擬合優(yōu)度評價Table 3 Evaluation of goodness of fit of RVM models
3種模型的Somers’D、kendall’s Tau-c和Goodman-Kruskal Gama 值均表現(xiàn)為遙感氣象數(shù)據(jù)模型最大,遙感數(shù)據(jù)模型次之,氣象數(shù)據(jù)模型最小,說明3種數(shù)據(jù)模型中遙感氣象數(shù)據(jù)模型的擬合優(yōu)度最好。
獨立樣本數(shù)據(jù)對模型的穩(wěn)定性和可靠性進行驗證更能反映模型實際的預測精度[18]。采用2014年5月下旬小麥灌漿期的地面調(diào)查數(shù)據(jù)對模型的結(jié)果進行評價。表4列舉了小麥白粉病模型的預測樣本、訓練樣本及總樣本的漏分、錯分信息及模型的預測精度、訓練精度、總體精度及其Kappa系數(shù)。從3種數(shù)據(jù)模型的預測情況來看,在3種數(shù)據(jù)模型中氣象數(shù)據(jù)模型的預測精度最低,遙感數(shù)據(jù)對小麥白粉病發(fā)生的預測精度最高,遙感氣象數(shù)據(jù)模型則介于二者之間,且3種數(shù)據(jù)預測模型均可取得較為滿意的預測效果。從模型的訓練情況可以看出,遙感氣象數(shù)據(jù)模型的訓練精度最高,氣象數(shù)據(jù)模型最低,遙感數(shù)據(jù)模型則介于二者之間。對比3種數(shù)據(jù)模型的訓練情況和預測情況發(fā)現(xiàn),氣象數(shù)據(jù)模型和遙感數(shù)據(jù)模型均表現(xiàn)為訓練精度低于預測精度;而遙感氣象數(shù)據(jù)模型則表現(xiàn)為訓練精度高于預測精度,盡管其訓練精度高于遙感數(shù)據(jù)模型的訓練精度,但其預測精度卻低于遙感數(shù)據(jù)模型??紤]導致上述結(jié)果的原因可能是,遙感氣象數(shù)據(jù)模型相對于另2種模型變量較多,模型相對較復雜,同時遙感變量與氣象變量間存在一定的相關(guān)性,導致該模型在訓練過程中出現(xiàn)過擬合現(xiàn)象??紤]模型的總體情況發(fā)現(xiàn),遙感氣象數(shù)據(jù)模型的總體精度最高,為84.2%,且Kappa系數(shù)也最大,為0.686;遙感數(shù)據(jù)模型的總體精度(80.0%)和Kappa系數(shù)(0.602)次之,而氣象數(shù)據(jù)模型的總體精度(74.7%)和Kappa系數(shù)(0.500)均最小。從模型總的漏分及錯分情況來看,3種數(shù)據(jù)模型均表現(xiàn)為將病害地塊錯分為健康地塊的情況較為嚴重;遙感氣象數(shù)據(jù)模型無論是對健康地塊還是病害地塊,其漏分和錯分均為最小,且明顯低于氣象數(shù)據(jù)模型和遙感數(shù)據(jù)模型。以上結(jié)果表明,與單一類型數(shù)據(jù)源相比,多源數(shù)據(jù)更適合于區(qū)域空間尺度范圍內(nèi)小麥病害預測模型的構(gòu)建。
表4 RVM預測模型的總體驗證結(jié)果Table 4 Overall verification results of RVM model
本文利用landsat8遙感數(shù)據(jù)和氣象數(shù)據(jù)建立了小麥白粉病的發(fā)生預測模型,選取了表征小麥生長狀況的MSR和RDVI以及對白粉病的發(fā)生有決定作用的3月21日~4月20日的總?cè)照諘r數(shù)以及4月11日~5月10日大于0.1 mm降雨日數(shù),采用相關(guān)向量機方法對區(qū)域尺度的小麥白粉病發(fā)生概率進行預測,并對3種數(shù)據(jù)模型的結(jié)果進行了比較分析。結(jié)果表明:
1)在區(qū)域尺度范圍內(nèi)的小麥白粉病害發(fā)生情況預測中,遙感氣象數(shù)據(jù)模型與氣象數(shù)據(jù)模型和遙感數(shù)據(jù)模型相比,其對白粉病的預測總體精度分別提高了9.5和4.2百分點。說明遙感氣象數(shù)據(jù)模型的擬合效果更佳,更適合于空間區(qū)域尺度范圍內(nèi)小麥病害發(fā)生情況的預測。
2)采用遙感數(shù)據(jù)和氣象數(shù)據(jù)作為輸入變量的RVM模型所得的效果最好,精度達到了84.2%。與單一數(shù)據(jù)類型的模型相比,遙感氣象數(shù)據(jù)結(jié)合的多源數(shù)據(jù)更為全面地反映了病害信息,使模型在輸入?yún)?shù)中融合了更多信息,提高了小麥白粉病發(fā)生概率預測的精度。
訓練樣本的數(shù)量及質(zhì)量均會影響模型的精度,該研究開展時考慮到成本問題,采集樣本數(shù)量較少,僅為河北小部分地區(qū)一年的數(shù)據(jù),模型的通用性有待進一步驗證。在今后的研究中考慮用多年、多地區(qū)的數(shù)據(jù)來驗證模型的通用性??紤]到小麥白粉病的發(fā)生受多種因素的共同作用,模型構(gòu)建時選取了影響病害發(fā)生的重要氣象因子,對小麥白粉病比較敏感的植被指數(shù)和生境因子,但是仍然有一些重要因子因未能獲取到,沒有進入模型,如農(nóng)田管理信息等。在今后的研究中,盡可能周全地考慮影響氣象數(shù)據(jù)空間插值的各個因素,采用更好的獲取空間范圍內(nèi)氣象數(shù)據(jù)的方法,融合更多數(shù)據(jù)源,同時尋找更優(yōu)的特征篩選方法,并結(jié)合本文方法來構(gòu)建預測模型,以便更為準確地進行小麥白粉病的空間分布、發(fā)病嚴重度及發(fā)展趨勢的預測。
[1] 李彤霄. 我國小麥白粉病預報方法研究進展[J]. 氣象與環(huán)境科學,2013,36(3):44-48. Li Tongxiao. Research progress of wheat powdery mildew forecasting method[J]. Meteorological and Environmental Sciences, 2013, 36(3): 44-48. (in Chinese with English abstract)
[2] 鄭秋紅,楊霏云,朱玉潔. 小麥白粉病發(fā)生氣象條件和氣象預報研究進展[J]. 中國農(nóng)業(yè)氣象,2013,34(3):358-365. Zheng Qiuhong, Yang Feiyun, Zhu Yujie. Meteorological factors and its forecast on wheat powdery mildew occurrence in China[J]. Chinese Journal of Agrometeorology, 2013, 34(3): 358-365. (in Chinese with English abstract)
[3] 居為民,高蘋. 氣象條件對小麥白粉病發(fā)生影響的研究[J].氣象,2006,26(2):50-53. Ju Weimin, Gao Ping. The study of influence of meteorological condition on winter wheat powdery mildew[J]. Meteorological Monthly, 2006, 26(2): 50-53. (in Chinese with English abstract)
[4] 錢拴,霍治國,葉彩玲. 我國小麥白粉病發(fā)生流行的長期氣象預測研究[J]. 自然災害學報,2005,14(4):56-63. Qian Shuan, HuoZhiguo, Ye Cailing. Long-term meteorological prediction research on epidemic of wheat powdery mildew in China[J]. Journal of Natural Disasters, 2005, 14(4): 56-63. (in Chinese with English abstract)
[5] 姚樹然,李春強,霍治國,等. 河北小麥白粉病流行的氣象指標研究[J]. 自然災害學報,2008,17(4):38-43. Yao Shuran, Li Chunqiang, Huo Zhiguo, et al. A research on climatic indices for epidemic of wheat powdery mildew[J]. Journal of Natural Disasters, 2008, 17(4): 38-43. (in Chinese with English abstract)
[6] Stansbury C D, Mckirdy S J. Forecasting climate suitability for Karnal bunt of wheat: a comparison of two meteorological methods[J]. Australasian Plant Pathology, 2002, 31(1): 81-92.
[7] 沈文穎,李映雪,馮偉,等. 基于因子分析-BP神經(jīng)網(wǎng)絡的小麥葉片白粉病反演模型[J]. 農(nóng)業(yè)工程學報,2015,31(22):183-190. Shen Wenying, Li Yingxue, Feng Wei, et al. Inversion model for severity of powdery mildew in wheat leaves based on factor analysis-BP neural network[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(22): 183-190. (in Chinese with English abstract)
[8] Zhang Jingcheng, Yuan Lin, Nie Chenwei, et al. Forecasting of powdery mildew disease with multi-sources of remote sensing information[C]// International Conference on Agro-Geoinformatics. IEEE, 2014:1-5.
[9] Zhang Jingcheng, Pu Ruiliang, Yuan Lin, et al. Integrating remotely sensed and meteorological observations to forecast wheat powdery mildew at a regional scale[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2014, 7(11):4328-4339.
[10] Luo juhua, Zhao Chunjianag, Huang Wenjiang, et al. Discriminating wheat aphid damage degree using 2-dimensional feature sapce derived from landsat 5 TM[J]. Sensor Letters, 2012, 10(1/2): 608-614.
[11] Jonas Franke, Gunter Menz. Multi-temporal wheat disease detection by multi-spectral remote sensing[J]. Precision Agriculture, 2007, 8(3): 161-172.
[12] Luo Juhua, Huang Wenjiang, Zhao Jingling, et al. Predicting the probability of wheat aphid occurrence using satellite remote sensing and meteorological data[J]. Optik-International Journal for Light and Electron Optics, 2014, 125(19): 5660-5665.
[13] Hossain A, Nasser M. Recurrent support and relevance vector machines based model with application to forecasting volatility of financial returns[J]. Journal of Intelligent Learning Systems and Applications, 2011, 3(4): 230.
[14] Majumder S K, Nirmalya G, Gupta P K. Relevance vector machine for optical diagnosis of cancer[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2005, 36(4): 323-333.
[15] 祝志慧,劉婷,馬美湖. 基于高光譜信息融合和相關(guān)向量機的種蛋無損檢測[J]. 農(nóng)業(yè)工程學報,2015,31(15):285-292. Zhu Zhihui, Liu Ting, Ma Meihu. Hatching eggs nondestructive detection based on hyperspectral-imaging information and RVM[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(15): 285-292. (in Chinese with English abstract)
[16] Liu X, Hu Z Q, Yang G. Wind speed forecasting based on relevance vector machine and empirical mode decomposition[J]. Advances in Information Sciences and Service Sciences, 2013, 5(10): 279-287.
[17] 李慧杰,劉亞南,衛(wèi)志農(nóng),等. 基于相關(guān)向量機的短期風速預測模型[J]. 電力自動化設備,2013,33(10):28-32. Li Huijie, Liu Yanan, Wei Zhinong, et al. Short-term wind speed forecasting model based on relevance vector machine[J]. Electric Power Automation Equipment, 2013, 33(10): 28-32. (in Chinese with English abstract)
[18] 唐翠翠,黃文江,羅菊花,等. 基于相關(guān)向量機的冬小麥蚜蟲遙感預測[J]. 農(nóng)業(yè)工程學報,2015,31(6):201-207. Tang Cuicui, Huang Wenjiang, Luo Juhua, et al. Forecasting wheat aphid with remote sensing based on relevance vector machine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(6): 201-207. (in Chinese with English abstract)
[19] 霍治國,陳林,劉萬才,等. 中國小麥白粉病發(fā)生地域分布的氣候分區(qū)[J]. 生態(tài)學報,2002,22(11):1873-1880. Huo Zhiguo, Chen Lin, Liu Wancai, et al. Climatic zonation of wheat powdery mildew in China[J].Acta Ecologica Sinica,2002, 22(11): 1873-1880.(in Chinese with English abstract)
[20] 張競成. 多源遙感數(shù)據(jù)小麥病害信息提取方法研究[D].浙江大學,2012. Zhang Jingcheng. Methods for Information Extraction of Wheat Disease Based on Multi-source Remote Sensing Data[D]. Zhejiang University, 2012. (in Chinese with English abstract)
[21] Jiménez-Mu?oz J C, Sobrino J A. A generalized singlechannel method for retrieving land surface temperature from remote sensing data[J]. Journal of Geophysical Research: Atmospheres (1984-2012), 2003, 108(D22): 2015-2023.
[22] 徐涵秋. 新型Landsat8衛(wèi)星影像的反射率和地表溫度反演[J].地球物理學報,2015(3):741-747. Xu Hanqiu. Retrieval of the reflectance and land surface temperature of newly-launched Landsat 8 satellite[J]. Chinese Journal of Geophysics, 2015(3): 741-747. (in Chinese with English abstract)
[23] 余衛(wèi)東,朱曉東,楊君健,等. 商丘市小麥白粉病預測模式研究[J]. 氣象與環(huán)境科學,2008,31(1):20-23. Yu Weidong, Zhu Xiaodong, Yang Junjian, et al. Study on prediction model for wheat powdery mildew in Shangqiu city[J]. Meteorological and Environmental Sciences, 2008, 31(1): 20-23. (in Chinese with English abstract)
[24] 李軍龍,張劍,張叢,等. 氣象要素空間插值方法的比較分析[J]. 草業(yè)科學,2006,23(8):6-11. Li Junlong, Zhang Jian, Zhang Cong, et al. Analyze and compare the spatial interpolation methods for climate factor[J]. Pratacultural Science, 2006, 23(8): 6-11. (in Chinese with English abstract)
[25] 馬軒龍,李春娥,陳全功. 基于GIS的氣象要素空間插值方法研究[J]. 草業(yè)科學,2008,25(11):13-19. Ma Xuanlong, Li Chun’e, Chen Quangong. Study on the method of GIS based spatial interpolation of climate factors in China[J]. Pratacultural Science, 2008, 25(11): 13-19. (in Chinese with English abstract)
[26] Kohavi R, John G. Wrappers for feature subset selection[J]. Artificial Intelligence, 1997, 97(1/2): 273-324.
[27] 張麗新. 高維數(shù)據(jù)的特征選擇及基于特征選擇的集成學習研究[D]. 北京:清華大學,2004. Zhang Lixin. Study on Feature Selection and Ensemble Learning Based on Feature Selection for High-Dimensional Datasets[D]. Beijing: Tsinghua University, 2004. (in Chinese with English abstract)
[28] Kira K, Rendell L. The feature selection problem: Traditional methods and a new algorithm[C]//Proceedings of the Ninth National conference on Artificial Intelligence. New Orleans: AAAI Press, 1992: 129-134.
[29] 張麗新,王家廞,趙雁南,等. 基于Relief的組合式特征選擇[J]. 復旦學報:自然科學版,2004,43(5):893-898. Zhang Lixin, Wang Jiaxin, Zhao Yannan, et al. Combination feature selection based on Relief[J]. Journal of Fudan University: Natural Science, 2004, 43(5): 893-898. (in Chinese with English abstract)
[30] 楊樹仁,沈洪遠. 基于相關(guān)向量機的機器學習算法研究與應用[J]. 計算技術(shù)與自動化,2010,29(1):43-47. Yang Shuren, Shen Hongyuan. Research and application of machine learning algorithm based on relevance vector machine[J]. Computing Technology and Automation, 2010, 29(1): 43-47. (in Chinese with English abstract)
[31] 楊國鵬,余旭初,周欣,等. 基于相關(guān)向量機的高光譜影像分類研究[J]. 測繪學報,2010,39(6):572-578. Yang Guopeng, Yu Xuchu, Zhou Xin, et al. Research on relevance vector machine for hyperspectral imagery classification[J]. Acta Geodaetica et Cartographica Sinica, 2010, 39(6): 572-578. (in Chinese with English abstract)
[32] 趙春暉,張燚. 相關(guān)向量機分類方法的研究進展與分析[J].智能系統(tǒng)學報,2012(4):294-301. Zhao Chunhui, Zhang Yi. Research progress and analysis on methods for classification of RVM[J]. CAAI Transactions on Intelligent Systems, 2012(4): 294-301. (in Chinese with English abstract)
[33] Hastie T, Tibshirani R, Friedman J. The Elements of Statistical Learning[M]. New York: Springer, 2009.
[34] David H A, Edwards A W F. Annotated Readings in the History of Statistics[M]. New York:Springer Science & Business Media, 2001.
[35] Lemeshow S, Hosmer D W. A review of goodness of fit statistics for use in the development of logistic regression models[J]. American Journal of Epidemiology, 1982, 115(1): 92-106.
Wheat powdery mildew forecasting in filling stage based on remote sensing and meteorological data
Ma Huiqin1,2, Huang Wenjiang2※, Jing Yuanshu1
(1. Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters, School of Applied Meteorology, Nanjing University of Information Science & Technology, Nanjing 210044, China; 2. Key Laboratory of Digital Earth Science, Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100094, China)
Powdery mildew is one of the main serious diseases for winter wheat. An accurate and timely forecasting of the wheat powdery mildew occurrence at the regional scale by using multi-source data can provide important information for crop protection decision making, and achieving effective prevention of wheat powdery mildew. In this study, the Landsat8 remote sensing image was used to extract the land surface temperature (LST), the vegetation indices which included normalized difference vegetation index (NDVI), modified simple ratio index (MSR), re-normalized difference vegetation index (RDVI), triangular vegetation index (TVI), optimized soil adjusted vegetation index (OSAVI), green normalized difference vegetation index (GNDVI), and the band reflectance features. Then we obtained the parameters of wheat growth environment condition such as air temperature, number of rainy days with more than 0.1 mm rainfall, total sunshine hour, average relative humidity, temperature-rain coefficient (the ratio of total rainfall in a period of time to average temperature of the same period) and rainfall coefficient (the square root of the product of rainfall and number of rainy days) in different time steps (including month, 10 days and sensitive period) with the site daily meteorological data; and then we got the corresponding space meteorological features by using the inverse distance weighted (IDW) method in GIS (geographic information system) spatial interpolation analysis. Next, we implemented screening features with the combination of relief algorithm and Poisson’s correlation coefficient, and finally got the MSR, the RDVI, the total sunshine hour from March 21stto April 20th, and the number of rainy days with more than 0.1 mm rainfall from April 11thto May 10th, which were as optimal explanatory variables for developing the powdery mildew forecasting model. The relevance vector machine (RVM) model was used to improve business decisions, detect disease, and forecast weather. And then we used it to predict the probability of powdery mildew occurrence in filling stage of wheat in Gaocheng, Jinzhou and Zhaoxian County, Shijiazhuang City, Hebei Province through remote sensing and meteorological data. The model combining remote sensing and meteorological data produced a higher Spearman relevance value than the single remote sensing data or the meteorological data model, and moreover, the values of Somers’D, Goodman-Kruskal Gamma, and Kendal’s Tau-c of the remote sensing and meteorological data model were all higher than those of the other 2 models. They all indicated that the remote sensing and meteorological data model had a better performance than the other 2 models. The results showed that: the overall accuracy of the remote sensing and meteorological data model was the highest among the 3 methods, with lower omission and wrong judgement than the other 2 models. Furthermore, the overall accuracy and the kappa coefficient of the remote sensing and meteorological data model were 84.2% and 0.686 respectively, which showed better performance over the remote sensing data model (80.0% and 0.602) and the meteorological data model (74.7% and 0.500). These results reveal that compared with the single meteorological data or remote sensing data, the combination of remote sensing and meteorological data is more suitable for the prediction of crop disease occurrence situation in the regional scale.
remote sensing; meteorology; forecasting; relevance vector machine; meteorological data; wheat powdery mildew
10.11975/j.issn.1002-6819.2016.09.023
S4; TP79
A
1002-6819(2016)-09-0165-08
馬慧琴,黃文江,景元書. 遙感與氣象數(shù)據(jù)結(jié)合預測小麥灌漿期白粉病[J]. 農(nóng)業(yè)工程學報,2016,32(9):165-172.
10.11975/j.issn.1002-6819.2016.09.023 http://www.tcsae.org
Ma Huiqin, Huang Wenjiang, Jing Yuanshu. Wheat powdery mildew forecasting in filling stage based on remote sensing and meteorological data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(9): 165-172. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2016.09.023 http://www.tcsae.org
2015-12-29
2016-01-22
中國科學院國際合作局對外合作重點項目:主要作物主要病蟲害遙感監(jiān)測與預警研究(131211KYSB20150034);國家自然科學基金項目“多源數(shù)據(jù)小麥病害遙感識別與監(jiān)測方法研究”(41271412);江蘇省普通高校自然科學研究資助項目(15KJA170003)。
馬慧琴,女,甘肅人,現(xiàn)主要從事農(nóng)業(yè)氣象和植被定量遙感研究。南京 南京信息工程大學應用氣象學院,210044。Email:1033513161@qq.com
※通信作者:黃文江,博士,研究員,博士生導師。北京 中國科學院遙感與數(shù)字地球研究所數(shù)字地球重點實驗室,100094。Email:huangwj@radi.ac.cn