亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        光譜指數(shù)篩選方法與統(tǒng)計(jì)回歸算法結(jié)合的水稻估產(chǎn)模型對(duì)比

        2022-01-27 02:21:12王耀民陳皓銳陳俊英王慧蕓張智韜
        關(guān)鍵詞:估產(chǎn)排序建模

        王耀民,陳皓銳,陳俊英,2,王慧蕓,邢 正,張智韜,2

        光譜指數(shù)篩選方法與統(tǒng)計(jì)回歸算法結(jié)合的水稻估產(chǎn)模型對(duì)比

        王耀民1,陳皓銳3※,陳俊英1,2,王慧蕓1,邢 正1,張智韜1,2

        (1. 西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院,楊凌 712100; 2. 西北農(nóng)林科技大學(xué)旱區(qū)農(nóng)業(yè)水土工程教育部重點(diǎn)實(shí)驗(yàn)室,楊凌 712100; 3. 中國(guó)水利水電科學(xué)研究院流域水循環(huán)模擬與調(diào)控國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100048)

        為了探尋高效的水稻產(chǎn)量估算方法,在獲取2019年黑龍江省三江平原別拉洪河流域內(nèi)水稻產(chǎn)量數(shù)據(jù)和MOD09A1遙感數(shù)據(jù)基礎(chǔ)上,對(duì)比不同指數(shù)篩選方法和統(tǒng)計(jì)回歸算法結(jié)合的建模估產(chǎn)效果,以得到其中最佳的產(chǎn)量估算模型。通過(guò)相關(guān)系數(shù)(correlation coefficient,)分析法、變量投影重要性(Variable Importance in Projection,VIP)分析法和袋外數(shù)據(jù)重要性(Out-Of-Bag data importance,OOB)分析法分析水稻4個(gè)生育期(分蘗期、抽穗期、孕穗期和乳熟期)的不同波段和光譜指數(shù)對(duì)于水稻產(chǎn)量的敏感性,篩選出特征波段和指數(shù),再結(jié)合隨機(jī)森林(Random Forest,RF)、支持向量機(jī)(Support Vector Machine,SVM)和偏最小二乘(Partial Least Squares,PLS)3種統(tǒng)計(jì)回歸方法,構(gòu)建了9種水稻產(chǎn)量估算模型:-RF、-SVM、-PLS、VIP-RF、VIP-SVM、VIP-PLS、OOB-RF、OOB-SVM、OOB-PLS。結(jié)果表明:同一指數(shù)篩選方法對(duì)不同模型的契合程度不同,OOB與RF更為契合,VIP和與PLS更為契合,與SVM更為契合;在3種建模方法中偏最小二乘模型和支持向量機(jī)模型有較好的效果,隨機(jī)森林模型效果最好,其中OOB-RF模型最優(yōu),其模型驗(yàn)證決定系數(shù)為0.742,均方根誤差為206 kg/hm2。研究結(jié)果可為水稻產(chǎn)量估算模型研究提供參考,具有一定的理論意義。

        遙感;產(chǎn)量;模型;水稻;支持向量機(jī);指數(shù)篩選方法

        0 引 言

        區(qū)域農(nóng)作物產(chǎn)量的準(zhǔn)確估測(cè)能為農(nóng)業(yè)管理部門的農(nóng)業(yè)生產(chǎn)管理及國(guó)家的糧食政策提供有效依據(jù),而水稻作為中國(guó)主要的糧食產(chǎn)物之一,其產(chǎn)量信息的大范圍快速、準(zhǔn)確估測(cè)對(duì)糧食生產(chǎn)管理具有重大意義[1]。遙感具有覆蓋范圍大、重復(fù)周期短和較容易獲得的優(yōu)點(diǎn),在農(nóng)作物的長(zhǎng)勢(shì)監(jiān)測(cè)和產(chǎn)量估算中已廣泛使用[2-3]。

        現(xiàn)有的遙感估產(chǎn)方法大多是經(jīng)驗(yàn)統(tǒng)計(jì)模型,其原理是利用一個(gè)或者多個(gè)光譜參數(shù)與作物產(chǎn)量建立回歸關(guān)系進(jìn)行估產(chǎn)[4-5]。早期研究多采用線性回歸方法,程乾[6]用各生育期和復(fù)合生育期的水稻歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)和增強(qiáng)植被指數(shù)(Enhanced Vegetation Index,EVI)與水稻產(chǎn)量構(gòu)建了一元線性模型和多元線性模型,發(fā)現(xiàn)復(fù)合生育期的EVI指數(shù)與產(chǎn)量構(gòu)建的估產(chǎn)模型效果較好。Ren等[7]在分析研究區(qū)NDVI和冬小麥產(chǎn)量的線性回歸關(guān)系的基礎(chǔ)上,利用逐步回歸方法建立了冬小麥的估產(chǎn)模型,模型決定系數(shù)達(dá)到了0.87,并且在小麥孕穗期就能較好地預(yù)測(cè)冬小麥產(chǎn)量。

        但作物的生長(zhǎng)及生物量的積累并不是一個(gè)線性的過(guò)程,而且線性模型指標(biāo)單一并不能很好的反映作物的生長(zhǎng)狀況[8]。近年來(lái),學(xué)者們開始關(guān)注非線性的估產(chǎn)模型方法,如神經(jīng)網(wǎng)絡(luò)[9-11]、支持向量機(jī)[12-14]、隨機(jī)森林[15-18]等。黎銳等[13]利用支持向量機(jī)回歸模型結(jié)合Landsat多時(shí)相遙感數(shù)據(jù)構(gòu)建了冬小麥產(chǎn)量估算模型,并與多元回歸模型相比較,發(fā)現(xiàn)支持向量機(jī)回歸模型優(yōu)于多元回歸模型。譚昌偉等[19]對(duì)比了偏最小二乘回歸算法、線性回歸算法和主成分分析算法建立的小麥估產(chǎn)模型,發(fā)現(xiàn)偏最小二乘法模型精度分別比其他兩種高20%和18%。Zeng等[20]運(yùn)用偏最小二乘算法和人工神經(jīng)網(wǎng)絡(luò)算法結(jié)合變量投影重要性分析指數(shù)篩選方法估算了葵花籽產(chǎn)量,發(fā)現(xiàn)篩選后的模型精度高于未篩選的,且人工神經(jīng)網(wǎng)絡(luò)模型精度高于偏最小二乘模型。岳繼博等[15]利用3種指數(shù)篩選方法(相關(guān)系數(shù)分析法、袋外數(shù)據(jù)重要性、灰色關(guān)聯(lián)分析)對(duì)遙感指數(shù)進(jìn)行排序,再結(jié)合隨機(jī)森林算法構(gòu)建了3種冬小麥生物量估算模型,發(fā)現(xiàn)相關(guān)性分析法和袋外數(shù)據(jù)重要性指數(shù)篩選方法在使用少量參數(shù)時(shí)就能使模型達(dá)到較好的精度。楊北萍等[16]利用相關(guān)性分析、主成分分析和袋外數(shù)據(jù)變量重要性分析對(duì)特征變量進(jìn)行篩選,結(jié)合隨機(jī)森林模型建立水稻估產(chǎn)模型,分析發(fā)現(xiàn)特征變量篩選后的隨機(jī)森林模型水稻估產(chǎn)精度更高,明顯優(yōu)于多元逐步回歸模型。Shiu等[14]利用相關(guān)性分析篩選遙感變量,結(jié)合普通最小二乘、支持向量回歸和局部模型地理加權(quán)回歸構(gòu)建了水稻產(chǎn)量估計(jì)模型,分析發(fā)現(xiàn)通過(guò)特征選擇,局部模型地理加權(quán)回歸模型的估產(chǎn)性能比普通最小二乘模型和支持向量回歸模型相對(duì)穩(wěn)定。目前,研究學(xué)者利用機(jī)器學(xué)習(xí)算法估算作物產(chǎn)量、生物量等參數(shù)時(shí),大多是將遙感變量直接作為自變量輸入模型或者只是單純使用變量篩選方法與機(jī)器模型結(jié)合。遙感估算作物產(chǎn)量,主要的技術(shù)思路是利用合適的遙感指標(biāo)和統(tǒng)計(jì)回歸方法來(lái)建立模型,而不同的遙感指標(biāo)和回歸算法建立的模型之間的精度差別較大,在進(jìn)行建模估算作物產(chǎn)量的時(shí)候,需要先通過(guò)篩選合適的指標(biāo)和統(tǒng)計(jì)回歸算法及其組合來(lái)確定最合適的建模方法。因此對(duì)比不同指數(shù)篩選方法與統(tǒng)計(jì)回歸模型算法的耦合建模效果,有助于提高產(chǎn)量估算模型精度。

        本文基于MODIS多時(shí)相遙感數(shù)據(jù),將相關(guān)系數(shù)、變量投影重要性(Variable Importance in Projection,VIP)和袋外數(shù)據(jù)重要性(Out-Of-Bag data importance,OOB)3種指數(shù)篩選方法,與偏最小二乘(Partial Least Squares,PLS)、隨機(jī)森林(Random Forest,RF)和支持向量機(jī)(Support Vector Machine,SVM)3種建模算法進(jìn)行耦合,構(gòu)建9種水稻估產(chǎn)模型,分析對(duì)比不同指數(shù)篩選方法與機(jī)器學(xué)習(xí)算法的契合程度,篩選出其中最優(yōu)的水稻產(chǎn)量估算模型,以期為水稻及其他作物產(chǎn)量估算研究提供參考。

        1 材料與方法

        1.1 研究區(qū)概況

        研究區(qū)位于黑龍江省佳木斯市別拉洪河灌區(qū)(47.2°~47.6° N,132.6°~133.4° E),地處三江平原,地勢(shì)平坦,面積約為105hm2,屬于溫帶濕潤(rùn)、半濕潤(rùn)大陸性季風(fēng)氣候,雨熱同季,夏季溫暖,全年有2 400~2 500 h的日照時(shí)間,適合水稻等作物的種植生產(chǎn)(圖1)。

        圖1 研究區(qū)示意圖及采樣點(diǎn)分布

        1.2 數(shù)據(jù)來(lái)源

        1.2.1 遙感數(shù)據(jù)獲取

        研究使用的遙感數(shù)據(jù)為美國(guó)NASA提供的MODIS免費(fèi)數(shù)據(jù)中的MOD09A1產(chǎn)品,在NASA提供的Earthdata網(wǎng)站中下載(https://earthdata.nasa.gov/)。MOD09A1產(chǎn)品時(shí)間分辨率為8 d,空間分辨率為500 m,共包含7個(gè)波段的地表反射率。下載研究區(qū)(黑龍江三江平原別拉洪河灌區(qū))水稻4個(gè)關(guān)鍵生育期(分蘗期、孕穗期、抽穗期和乳熟期)的遙感數(shù)據(jù),圖像日序數(shù)分別為169、193、209、241。使用MRT(MODIS Reprojection Tool)軟件對(duì)圖像進(jìn)行圖像拼接、波段提取、坐標(biāo)系轉(zhuǎn)換和文件格式轉(zhuǎn)換,利用ENVI對(duì)圖像進(jìn)行裁剪和采樣點(diǎn)像元亮度值提取。

        本研究基于衛(wèi)星光譜數(shù)據(jù)提取紅、綠、藍(lán)以及近紅外波段的光譜反射率信息,并計(jì)算了EVI、NDVI、SAVI、OSAVI、RVI等光譜指數(shù)用于建立水稻估產(chǎn)模型,具體計(jì)算公式如表1所示。

        1.2.2 水稻產(chǎn)量測(cè)量

        在研究區(qū)選取83個(gè)采樣點(diǎn)作為水稻產(chǎn)量測(cè)點(diǎn),考慮到遙感影像的分辨率為500 m,精度偏低以及地面土地利用類型混雜,為提高采樣點(diǎn)的代表性,采樣點(diǎn)盡量在地面大面積純水稻分布處選取。采樣點(diǎn)通過(guò)手持式GPS定位儀獲得其經(jīng)緯度位置。水稻成熟收獲期,在研究區(qū)以采樣點(diǎn)為中心的1/15 hm2地為該采樣點(diǎn)的測(cè)量單位,在地塊東南西北中5個(gè)方位各收割1 m2水稻,對(duì)收割的水稻進(jìn)行脫粒、烘干、質(zhì)量稱量,取平均數(shù),得到該采樣點(diǎn)水稻單產(chǎn)數(shù)據(jù)。

        1.3 研究區(qū)水稻空間分布圖

        衛(wèi)星遙感監(jiān)測(cè)水稻產(chǎn)量信息,需要對(duì)水稻種植結(jié)構(gòu)進(jìn)行識(shí)別。以500 m空間分辨率的MODIS數(shù)據(jù)為數(shù)據(jù)源,構(gòu)建了陸地水分指數(shù)(Land Surface Water content Index,LSWI)、EVI、NDVI和RVI時(shí)間序列數(shù)據(jù)集并對(duì)其進(jìn)行降噪處理,建立了水稻種植面積決策樹提取模型,提取了研究區(qū)水稻種植面積,得到空間分辨率為500 m、總體分類精度(正確分類像元數(shù)/總像元數(shù))為86.4%的水稻空間分布圖。

        表1 遙感變量及其計(jì)算公式

        注:R、NIR、B、G為紅光、近紅外、藍(lán)光和綠光波段的光譜發(fā)射率值,下標(biāo)= t、b、h、m,分別代表水稻分蘗期、孕穗期、抽穗期和乳熟期4個(gè)生育期;表示植被密度變化的參數(shù),取值為0.5。

        Note: WhereR,NIR,B,Gare spectral emissivity of red, near infrared, blue and green light bands, subscript= t, b, h, m represent four growth stages of rice, respectively, tillering stage, booting stage, heading stage and milk ripening stage;represents the parameter of vegetation density change, and its value is 0.5.

        1.4 估產(chǎn)模型構(gòu)建方法

        將研究區(qū)83個(gè)采樣點(diǎn)隨機(jī)選取2/3(56個(gè))作為模型的建模集,另外1/3(27個(gè))作為模型的驗(yàn)證集。利用相關(guān)性分析法、變量投影重要性分析法和袋外數(shù)據(jù)重要性分析法篩選的指數(shù)作為自變量,以水稻實(shí)測(cè)產(chǎn)量作為因變量,再分別利用偏最小二乘、支持向量機(jī)和隨機(jī)森林3種回歸算法對(duì)其進(jìn)行建模分析,從而獲得最佳的估產(chǎn)模型。3種機(jī)器學(xué)習(xí)模型算法均在R 4.0.2軟件中進(jìn)行。

        為減少噪聲數(shù)據(jù)對(duì)模型精度的影響,利用相關(guān)性、VIP和OOB分析法篩選出敏感波段指數(shù),并對(duì)已篩選的波段指數(shù)從大到小排序。利用隨機(jī)森林、支持向量機(jī)和偏最小二乘模型分別與以上3種指數(shù)篩選方法的篩選排序結(jié)果建立水稻估產(chǎn)模型。第一次建模僅使用前兩組數(shù)據(jù),第二次建模使用前三組數(shù)據(jù),以此類推第次建模使用前+1組數(shù)據(jù)。

        1.4.1指數(shù)篩選方法

        1)相關(guān)系數(shù)分析

        相關(guān)系數(shù)分析是對(duì)兩個(gè)以上的變量進(jìn)行分析,衡量變量間的相關(guān)密切程度的方法[24]。元素之間必須要存在一定的聯(lián)系或者概率才能進(jìn)行相關(guān)性分析,本研究采用相關(guān)性分析來(lái)評(píng)價(jià)水稻產(chǎn)量和遙感參數(shù)之間的相關(guān)程度,以篩選合適的光譜指數(shù)。選用皮爾遜相關(guān)系數(shù)作為相關(guān)性大小的衡量標(biāo)準(zhǔn),的絕對(duì)值越接近1,證明兩個(gè)變量元素之間的相關(guān)性越大。相關(guān)性分析在IBM SPSS statistics 23軟件上完成。

        2)變量投影重要性分析

        VIP變量篩選法是一種基于偏最小二乘法的變量篩選方法[25]。VIP變量篩選法描述自變量對(duì)因變量的重要程度是通過(guò)主成分來(lái)傳遞的,其中自變量對(duì)其相關(guān)自變量所提取的主成分作用大,而主成分又對(duì)因變量有強(qiáng)的解釋能力,則可以認(rèn)為該自變量對(duì)因變量的解釋能力 強(qiáng)[26-27]。用于評(píng)價(jià)變量投影重要性的值是VIP值,若是所有自變量對(duì)因變量解釋能力相同,則它們的VIP值都等于1,如果自變量VIP值小于1,則認(rèn)為該自變量對(duì)因變量解釋能力不足[28]。本研究中VIP指數(shù)篩選分析在SIMCA-P 11.5上完成。

        3)袋外數(shù)據(jù)重要性分析

        OOB重要性分析是一種基于隨機(jī)森林算法的特征重要性評(píng)估方法[29]??梢杂么鈹?shù)據(jù)對(duì)輸入特征進(jìn)行重要性評(píng)估,其原理是隨機(jī)改變某參數(shù)輸入,并計(jì)算所造成的估算誤差,根據(jù)誤差來(lái)計(jì)算此參數(shù)的重要性,重要性值越大表示改參數(shù)越重要[30]。本文以均方根誤差增加(increase in Mean Squared Error,IncMSE)來(lái)評(píng)價(jià)特征重要性,通過(guò)對(duì)每一個(gè)預(yù)測(cè)變量隨機(jī)賦值,如果該預(yù)測(cè)變量更為重要,那么其值被隨機(jī)替換后模型預(yù)測(cè)的誤差會(huì)增大,因此,IncMSE越大表示該變量越重要。袋外數(shù)據(jù)重要性分析在R 4.0.2軟件中完成。

        1.4.2 統(tǒng)計(jì)回歸方法

        1)偏最小二乘模型

        偏最小二乘回歸模型是一種多元數(shù)據(jù)統(tǒng)計(jì)分析模型,與傳統(tǒng)多元最小二乘回歸模型相比,PLSR模型可較好地解決自變量之間存在的多重共線性問(wèn)題,實(shí)現(xiàn)數(shù)據(jù)的降維、信息綜合與篩選,有效提取對(duì)系統(tǒng)解釋能力最強(qiáng)的綜合變量,排除無(wú)解釋作用的噪聲[31],因此在多光譜遙感模型中得到了廣泛的應(yīng)用。本研究建模過(guò)程中采用留一驗(yàn)證法(Leave One Out,LOO)從光譜數(shù)據(jù)中提取最佳主成分個(gè)數(shù),獲得最優(yōu)的模型參數(shù)[32]。

        2)支持向量機(jī)模型

        支持向量機(jī)回歸模型是根據(jù)內(nèi)核統(tǒng)計(jì)學(xué)習(xí)理論,以結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則為基礎(chǔ)的一種新型機(jī)器學(xué)習(xí)方法,其特點(diǎn)是能夠解決小樣本、非線性和高維數(shù)據(jù)空間模式識(shí)別等問(wèn)題[33]。在SVM中,核函數(shù)類型、懲罰參數(shù)、核參量等3個(gè)參數(shù)對(duì)建模精度有很大的影響。本研究中,核函數(shù)使用徑向基核函數(shù)(radial),用訓(xùn)練集交叉驗(yàn)證和網(wǎng)格搜索法(Grid search)進(jìn)行參數(shù)尋優(yōu),按照均方差最小原則確定懲罰參數(shù)和核參量的值[34]。

        3)隨機(jī)森林模型

        隨機(jī)森林模型是一種基于多重決策樹理論的新型機(jī)器學(xué)習(xí)方法,主要針對(duì)系統(tǒng)分類、回歸等問(wèn)題。RF模型可以辨識(shí)獨(dú)立變量和響應(yīng)變量之間復(fù)雜的非線性關(guān)系,從而具有較高的準(zhǔn)確率,且RF模型具有很好的抗噪聲能力,很難產(chǎn)生過(guò)擬合現(xiàn)象。因此,RF模型已經(jīng)被證明是一種有效的回歸方法。本研究中,RF模型參數(shù)設(shè)置為:決策樹的數(shù)量(ntree)為500,變量子集(mtry)的大小和最小節(jié)點(diǎn)數(shù)(nodesize)都為5。

        1.5 模型精度評(píng)價(jià)

        本文通過(guò)決定系數(shù)2、均方根誤差(Root Mean Squared Error,RMSE)和歸一化均方根誤差(Normalized Root Mean Squared Error,nRMSE)來(lái)評(píng)價(jià)模型的優(yōu)劣,其中2越接近1,RMSE和nRMSE相對(duì)越小,說(shuō)明估算結(jié)果的誤差越小,模型的效果越好。

        2 結(jié)果與分析

        2.1 特征指數(shù)篩選排序

        將基于研究區(qū)水稻4個(gè)生育期(分蘗期、孕穗期、抽穗期和乳熟期)衛(wèi)星遙感圖像建立的共36個(gè)遙感指標(biāo)與水稻產(chǎn)量分別進(jìn)行相關(guān)性分析、變量投影重要性分析和袋外數(shù)據(jù)重要性分析,結(jié)果如圖2所示。

        注:IncMSE為均方根誤差增加。

        Note:IncMSE is increase in mean squared error.

        圖2 指數(shù)篩選排序圖

        Fig.2 Index filter sort diagram

        圖2a為水稻產(chǎn)量與各個(gè)遙感指數(shù)的相關(guān)系數(shù)絕對(duì)值排序圖。從圖中可以看出,抽穗期和乳熟期的遙感變量與產(chǎn)量相關(guān)性較高,分蘗期大多數(shù)遙感變量與產(chǎn)量的相關(guān)性都較低,其中SAVIh的相關(guān)性絕對(duì)值最高,達(dá)到了0.742,t的相關(guān)性絕對(duì)值最低,只有0.002。對(duì)變量的顯著性進(jìn)行檢驗(yàn),顯著性達(dá)到0.01的指數(shù)有14個(gè),排序從大到小依次為:SAVIh、EVIh、OSAVIh、NIRh、NDVIh、NIRm、SAVIm、EVIm、SAVIb、OSAVIb、EVIb、NIRb、RVIh、OSAVIm。VIP值的大小反應(yīng)了自變量對(duì)因變量解釋作用的大小,從圖2b中可以看出排在前面的指數(shù)抽穗期占據(jù)較多,其中EVIh最高,達(dá)到了2.17,而分蘗期的指數(shù)的VIP值都較低。本研究選取VIP數(shù)值大于1的變量為特征變量,共有9個(gè),將其從大到小排序,依次為:EVIh、SAVIh、OSAVIh、NIRh、NDVIh、NIRm、OSAVIb、SAVIb、SAVIm。圖2c是袋外數(shù)據(jù)重要性排序圖,從圖中可以看出,排序靠前的主要是抽穗期和乳熟期的遙感變量,排序靠后的大多為分蘗期和孕穗期的遙感變量,其中IncMSE值最大的是OSAVIh,最小的是SAVIt,本文篩選IncMSE值大于5的變量為OOB法篩選的敏感特征變量,共有9個(gè),從大到小排序依次為OSAVIh、SAVIh、EVIh、NIRh、NDVIh、m、Greenm、RVIh、NIRm。

        2.2 水稻產(chǎn)量估算模型

        利用不同的統(tǒng)計(jì)回歸算法,分別對(duì)相關(guān)性分析、變量投影重要性分析和袋外數(shù)據(jù)重要性分析后得到的光譜指數(shù)進(jìn)行估產(chǎn)回歸建模分析,結(jié)果見(jiàn)圖3。

        圖3a為PLS模型建模結(jié)果。其中相關(guān)性分析法耦合偏最小二乘回歸模型共建模13次,VIP和OOB法建模8次。從圖中可以看出,3種變量篩選排序結(jié)果下,PLS模型驗(yàn)證集的2和RMSE隨自變量個(gè)數(shù)增加的變化情況。其中-PLS模型,隨著相關(guān)性分析篩選排序的遙感變量增加,模型的估算精度先增加后減小再趨向穩(wěn)定,在使用前7個(gè)變量(SAVIh、EVIh、OSAVIh、NIRh、NDVIh、NIRm、SAVIm)的時(shí)候模型2(0.655)最大、RMSE(256kg/hm2)最小,模型預(yù)測(cè)效果最好。VIP-PLS模型,隨著VIP法篩選排序的遙感變量的增加,模型估算效果先增大后減小,在使用VIP排序前7個(gè)遙感變量(EVIh、SAVIh、OSAVIh、NIRh、NDVIh、NIRm、OSAVIb)時(shí)模型2(0.66)最大,RMSE(254 kg/hm2)最小,模型效果達(dá)到最佳。OOB-PLS模型,隨著OOB法篩選排序的遙感變量的增加,模型估算效果先增大后趨向穩(wěn)定,在使用OOB排序前8個(gè)遙感變量(OSAVIh、SAVIh、EVIh、NIRh、NDVIh、m、m、RVIh)時(shí)模型2(0.648)最大,RMSE(257 kg/hm2)最小,模型效果達(dá)到最佳。綜上所述,在3種特征變量篩選排序方法與偏最小二乘算法耦合建立回歸模型中,VIP方法與偏最小二乘算法的耦合效果最好。

        圖3b為SVM回歸建模結(jié)果??梢钥闯?種變量篩選排序結(jié)果下,SVM模型驗(yàn)證集的2和RMSE隨自變量個(gè)數(shù)增加的變化情況。-SVM模型,隨著相關(guān)性分析篩選排序的遙感變量增加,模型的估算效果先增加后減小,在使用前10個(gè)變量(SAVIh、EVIh、OSAVIh、NIRh、NDVIh、NIRm、SAVIm、EVIm、SAVIb、OSAVIb)時(shí),模型2(0.71)最大,RMSE(214 kg/hm2)最小,模型估算效果最好。VIP-SVM模型,隨著VIP法篩選排序的遙感變量的增加,模型估算效果先增大后趨向穩(wěn)定,在使用VIP排序前7個(gè)遙感變量(EVIh、SAVIh、OSAVIh、NIRh、NDVIh、NIRm、OSAVIb)時(shí)模型2(0.7)最大,RMSE(216 kg/hm2)最小,模型效果達(dá)到最佳。OOB-SVM模型,隨著OOB法篩選排序的遙感變量的增加,模型估算效果先增大后趨向穩(wěn)定,在使用OOB排序前7個(gè)遙感變量(OSAVIh、SAVIh、EVIh、NIRh、NDVIh、Redm、m)時(shí)模型2(0.69)最大,RMSE(220 kg/hm2)最小,模型效果達(dá)到最佳。綜上所述,3種特征變量篩選排序方法與支持向量機(jī)算法耦合建立回歸模型時(shí),估算精度十分接近,但是-VIP模型,在使用了6個(gè)遙感指數(shù)時(shí),模型的估算精度已經(jīng)高于OOB-SVM模型,因此VIP和相關(guān)系數(shù)分析法與支持向量機(jī)的耦合效果較好。

        圖3c為RF回歸算法建模結(jié)果??梢钥闯觯?種變量篩選排序結(jié)果下,RF模型驗(yàn)證集的2和RMSE隨自變量個(gè)數(shù)增加的變化情況。-RF模型,隨著相關(guān)性分析篩選排序的遙感變量增加,模型的估算效果先增加后趨向穩(wěn)定,在使用前10個(gè)變量(SAVIh、EVIh、OSAVIh、NIRh、NDVIh、NIRm、SAVIm、EVIm、SAVIb、OSAVIb)的時(shí)候模型2(0.731)最大,RMSE(211 kg/hm2)最小,模型估算效果最好。VIP-SVM模型,隨著VIP法篩選排序的遙感變量的增加,模型估算效果整體呈先增大后趨向穩(wěn)定,在使用VIP排序前7個(gè)遙感變量(EVIh、SAVIh、OSAVIh、NIRh、NDVIh、NIRm、OSAVIb)時(shí)模型2(0.73)最大,RMSE(210 kg/hm2)最小,模型效果達(dá)到最佳。OOB-SVM模型,隨著OOB法篩選排序的遙感變量的增加,模型估算效果先增大后減小再趨向穩(wěn)定,在使用OOB排序前6個(gè)遙感變量(OSAVIh、SAVIh、EVIh、NIRh、NDVIh、m)時(shí)模型2(0.742)最大,RMSE(206 kg/hm2)最小,模型效果達(dá)到最佳。如上所述,3種特征變量篩選排序方法與隨機(jī)森林算法耦合建立回歸模型時(shí),預(yù)測(cè)效果十分接近,決定系數(shù)都高于0.73,但是OOB-RF和VIP-RF只用了較少的遙感參數(shù)就達(dá)到了較好的預(yù)測(cè)效果,而OOB-RF的模型決定系數(shù)高于VIP-RF,因此OOB法與隨機(jī)森林的耦合效果最好。

        2.3 模型綜合評(píng)價(jià)

        在自變量不斷增加情況下,3種指數(shù)篩選方法與3種機(jī)器學(xué)習(xí)回歸算法耦合精度最高的模型如表2所示。

        表2 模型綜合評(píng)價(jià)

        注:nRMSE為歸一化均方根誤差。

        Note: nRMSE is normalized root mean square error.

        對(duì)比不同指數(shù)篩選模型與機(jī)器學(xué)習(xí)回歸算法耦合建模結(jié)果,可以看出隨機(jī)森林模型的估算效果最好,其次是支持向量機(jī)模型,最后是偏最小二乘模型。從表中可以看出,不同的指數(shù)篩選方法與模型的耦合效果不同。偏最小二乘回歸模型中,3種模型的產(chǎn)量估算效果相近。

        -PLS和VIP-PLS在使用了7個(gè)遙感參數(shù)的情況下的估產(chǎn)效果略好于OOB-PLS使用了8個(gè)遙感參數(shù)的估產(chǎn)效果,可見(jiàn)相關(guān)系數(shù)分析法和變量投影重要性分析法與偏最小二乘回歸算法耦合建模的效果比袋外數(shù)據(jù)重要性分析法與偏最小二乘回歸建模好;支持向量機(jī)模型中,-SVM和VIP-SVM模型均在使用7個(gè)遙感指數(shù)的時(shí)候模型估算效果幾乎達(dá)到最好,可見(jiàn)相關(guān)系數(shù)分析和VIP法耦合支持向量機(jī)回歸算法的建模效果較好;隨機(jī)森林回歸模型中,OOB-RF模型的2最高,RMSE最低,且所用參數(shù)遙感僅為6個(gè),可知袋外數(shù)據(jù)重要性分析法耦合隨機(jī)森林回歸算法建模較其他兩種篩選排序方法好。

        基于OOB-RF模型對(duì)研究區(qū)水稻產(chǎn)量進(jìn)行估算,結(jié)合研究區(qū)水稻空間分布圖繪制了水稻產(chǎn)量空間分布圖,如圖4所示。圖中研究區(qū)內(nèi)白色部分為非水稻種植處,從圖中可以看出水稻產(chǎn)量大多處于6 500~6 700 kg/hm2,與2019年當(dāng)?shù)卣w產(chǎn)量情況相符。其中水稻高產(chǎn)像元在研究區(qū)西部較為密集,研究區(qū)內(nèi)空間上水稻產(chǎn)量出現(xiàn)的變化,可能與農(nóng)戶的不同生產(chǎn)管理制度有關(guān)。

        圖4 基于OOB-RF模型的水稻產(chǎn)量空間分布圖

        3 討 論

        本文采用水稻4個(gè)關(guān)鍵生育期的遙感指數(shù)作為自變量,分別使用相關(guān)性分析、VIP和OOB方法對(duì)指數(shù)進(jìn)行篩選,結(jié)果表明對(duì)水稻產(chǎn)量敏感的指數(shù)主要分布在孕穗期、抽穗期和乳熟期,其中處于抽穗期的最多,主要是因?yàn)榉痔Y期處于生育前期,所得到的作物參數(shù),難以預(yù)測(cè)水稻生育后期的長(zhǎng)勢(shì)及生物量的積累,并且農(nóng)民后期的生產(chǎn)管理也會(huì)影響作物最終的產(chǎn)量。從兩種指數(shù)篩選排序的結(jié)果可以看出,其中排序靠前的為抽穗期的遙感指數(shù),排序靠后的為其他兩個(gè)生育期的指數(shù),根據(jù)本文建模結(jié)果可以看出隨著指數(shù)的增加,多生育期指數(shù)加入建模,模型的效果有所提高,這說(shuō)明多時(shí)相數(shù)據(jù)復(fù)合建模比單一時(shí)相的數(shù)據(jù)能更好的估算水稻產(chǎn)量,這與程乾[6]的研究一致。

        本文利用3種不同的指數(shù)篩選方法耦合3種不同的機(jī)器學(xué)習(xí)方法建立-PLS,VIP-PLS,OOB-PLS,-SVM,VIP-SVM,OOB-SVM,-RF,VIP-RF,OOB-RF九種模型對(duì)水稻產(chǎn)量進(jìn)行估算,發(fā)現(xiàn)不同的指數(shù)篩選方法與不同的統(tǒng)計(jì)回歸模型模型耦合建模效果不同,相關(guān)性分析指數(shù)篩選排序方法比VIP和OOB指數(shù)篩選排序方法與支持向量機(jī)模型更契合,VIP和相關(guān)性分析指數(shù)篩選排序方法比OOB指數(shù)篩選排序方法與偏最小二乘模型更契合,OOB指數(shù)篩選排序方法比相關(guān)性分析和VIP指數(shù)篩選排序方法更與隨機(jī)森林回歸模型更契合。這是因?yàn)椴煌闹笖?shù)篩選方法其中的算法和模型算法的契合度不一樣,VIP方法與偏最小二乘回歸模型更加契合,是因?yàn)閂IP法是一種基于偏最小二乘回歸的變量篩選方法,它通過(guò)相關(guān)自變量綜合的主成分來(lái)判斷自變量對(duì)應(yīng)變量的解釋能力[27-28],而偏最小二乘回歸模型是利用自變量的主成分來(lái)進(jìn)行回歸建模,VIP法篩選出的自變量的主成分對(duì)應(yīng)變量解釋能力較強(qiáng),有利于偏最小二乘回歸模型建模;OOB方法與隨機(jī)森林回歸模型契合,是因?yàn)镺OB方法中對(duì)變量重要性判斷依據(jù)是根據(jù)變量在隨機(jī)森林回歸模型中參與建模的貢獻(xiàn)度來(lái)判斷的[31],岳繼博等[15]研究也發(fā)現(xiàn)OOB法與隨機(jī)森林模型耦合建模效果較好;相關(guān)系數(shù)分析法,作為一種常用的較為基礎(chǔ)的變量篩選分析方法,其具有較好的普適性,在與3種模型的結(jié)合中模型的精度都達(dá)到了較好的效果。

        本研究使用的MODIS數(shù)據(jù),空間分辨率為500 m,單個(gè)像元的覆蓋面積很大,許多像元中必然覆蓋著其他植被或者裸土,這導(dǎo)致許多像元的光譜反射率不能完全的反映水稻的生長(zhǎng)狀態(tài),因此遙感植被指數(shù)和光譜發(fā)射率與水稻產(chǎn)量相關(guān)性會(huì)較低。水稻的生長(zhǎng)是個(gè)復(fù)雜的過(guò)程,其受生長(zhǎng)環(huán)境和氣候條件的影響,本文因數(shù)據(jù)有限并未考慮其中。以上原因都會(huì)降低了模型的水稻產(chǎn)量估算精度。精確的作物估產(chǎn)模型應(yīng)該考慮到作物本身的生長(zhǎng)環(huán)境及氣象等因素,今后研究將加入這些因素并選擇高分辨率衛(wèi)星數(shù)據(jù)以提高模型的估產(chǎn)效果。

        4 結(jié) 論

        本文基于MODIS光譜數(shù)據(jù)和水稻產(chǎn)量實(shí)測(cè)數(shù)據(jù),利用相關(guān)系數(shù)、變量投影重要性和袋外數(shù)據(jù)重要性分析3種指數(shù)分析篩選方法分別耦合偏最小二乘算法、隨機(jī)森林算法和支持向量機(jī)算法構(gòu)建了9種水稻估產(chǎn)模型,對(duì)比了不同指數(shù)篩選方法與統(tǒng)計(jì)回歸算法建模的耦合效果,得出了研究區(qū)水稻產(chǎn)量估算的最佳模型。本研究主要有以下結(jié)論:

        1)在相關(guān)性分析法和變量投影重要性分析法分別耦合隨機(jī)森林、支持向量機(jī)和偏最小二乘法建立水稻估產(chǎn)模型中,支持向量機(jī)和隨機(jī)森林回歸模型均取得了良好的建模驗(yàn)證精度,其中OOB-RF模型精度最高, 其模型驗(yàn)證決定系數(shù)為0.742,均方根誤差為206 kg/hm2,歸一化均方根誤差為3.10%。

        2)不同的指數(shù)分析篩選方法與回歸統(tǒng)計(jì)模型的契合程度不同。本研究中,對(duì)于支持向量機(jī)回歸算法而言,相關(guān)性分析法和變量投影重要性分析法比袋外數(shù)據(jù)重要性分析法更能提高模型的精度,其中-SVM和VIP-SVM的模型2達(dá)到0.7以上,而OOB-SVM的只有0.685,且-SVM和VIP-SVM的RMSE比OOB-SVM低;對(duì)于偏最小二乘回歸算法而言,變量投影重要性分析法和相關(guān)性分析法比袋外數(shù)據(jù)重要性分析法對(duì)模型精度提高作用大,其中-PLS和VIP-PLS在使用使用較少遙感參數(shù)的情況下模型2達(dá)到0.65以上,RMSE低于256 kg/hm2,而OOB-RF使用較多的遙感參數(shù)2僅為0.645,RMSE為265 kg/hm2;對(duì)于隨機(jī)森林回歸算法而言,袋外數(shù)據(jù)重要性分析比其他兩種指數(shù)篩選方法更加契合,OOB-RF在使用較少的遙感參數(shù)的情況下模型2達(dá)到0.742,RMSE為206 kg/hm2,而-RF和VIP-RF使用更多的遙感參數(shù)模型2分別為0.730和0.731,且RMSE都為211 kg/hm2,精度較OOB-RF低。

        [1] 江東,王乃斌,楊小喚. 我國(guó)糧食作物衛(wèi)星遙感估產(chǎn)的研究[J]. 自然雜志,1999(6):351-355.

        Jiang Dong, Wang Naibin, Yang Xiaohuan. Study on forecasting of crop yield using satellite remote sensing in China[J]. Chinese Journal of Nature, 1999(6): 351-355. (in Chinese with English abstract)

        [2] Wigneron J P, Combal B, Wegmuller U, et al. Estimation of microwave parameters of crops from radiometric measurements[J]. International Journal of Remote Sensing, 1996, 17(14): 2875-2880.

        [3] 錢永蘭,侯英雨,延昊,等. 基于遙感的國(guó)外作物長(zhǎng)勢(shì)監(jiān)測(cè)與產(chǎn)量趨勢(shì)估計(jì)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(13):166-171.

        Qian Yonglan, Hou Yingyu, Yan Hao, et al. Global crop growth condition monitoring and yield trend prediction with remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(13): 166-171. (in Chinese with English abstract)

        [4] 尚松浩,蔣磊,楊雨亭. 基于遙感的農(nóng)業(yè)用水效率評(píng)價(jià)方法研究進(jìn)展[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(10):81-92.

        Shang Songhao, Jiang Lei, Yang Yuting. Review of remote sensing-based assessment method for irrigation and crop water use efficiency[J]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(10): 81-92. (in Chinese with English abstract)

        [5] 徐新剛,吳炳方,蒙繼華,等. 農(nóng)作物單產(chǎn)遙感估算模型研究進(jìn)展[J]. 農(nóng)業(yè)工程學(xué)報(bào),2008, 24(2):290-298.

        Xu Xingang, Wu Bingfang, Meng Jihua, et al. Research advances in crop yield estimation models based on remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2008, 24(2): 290-298. (in Chinese with English abstract)

        [6] 程乾. 基于MOD13產(chǎn)品水稻遙感估產(chǎn)模型研究[J]. 農(nóng)業(yè)工程學(xué)報(bào),2006,22(3):79-83.

        Cheng Qian. Models for rice yield estimation using remote sensing data of MODl3[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2006, 22(3): 79-83. (in Chinese with English abstract)

        [7] Ren J, Chen Z, Zhou Q, et al. Regional yield estimation for winter wheat with MODIS-NDVI data in Shandong, China[J]. International Journal of Applied Earth Observation and Geoinformation, 2008, 10(4): 403-413.

        [8] 朱再春,陳聯(lián)裙,張錦水,等. 基于信息擴(kuò)散和關(guān)鍵期遙感數(shù)據(jù)的冬小麥估產(chǎn)模型[J]. 農(nóng)業(yè)工程學(xué)報(bào),2011,27(2):187-193.

        Zhu Zaichun, Chen Lianqun, Zhang Jinshui, et al. Winter wheat yield estimation model based on information diffusion and remote sensing data at major growth stages[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2011, 27(2): 187-193. (in Chinese with English abstract)

        [9] Schwalbert R A, Amado T, Corassa G, et al. Satellite-based soybean yield forecast: Integrating machine learning and weather data for improving crop yield prediction in southern Brazil[J]. Agricultural and Forest Meteorology, 2020, 284: 107886.

        [10] Ji B, Sun Y, Yang S, et al. Artificial neural networks for rice yield prediction in mountainous regions[J]. The Journal of Agricultural Science, 2007, 145(3): 249-261.

        [11] 周亮,慕號(hào)偉,馬海姣,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的中國(guó)北方冬小麥遙感估產(chǎn)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019, 35(15):119-128.

        Zhou Liang, Mu Haowei, Ma Haijiao, et al. Remote sensing estimation on yield of winter wheat in North China based on convolutional neural network[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(15): 119-128. (in Chinese with English abstract)

        [12] 曾妍,王迪,趙小娟. 基于支持向量回歸的關(guān)中平原冬小麥估產(chǎn)研究[J]. 中國(guó)農(nóng)業(yè)信息,2019,31(6):10-20.

        Ceng Yan, Wang Di, Zhao Xiaojuan. Study on yield prediction of winter wheat in Guanzhong Plain based on SVR[J]. China Agricultural Informatics, 2019, 31(6): 10-20. (in Chinese with English abstract)

        [13] 黎銳,李存軍,徐新剛, 等. 基于支持向量回歸(SVR)和多時(shí)相遙感數(shù)據(jù)的冬小麥估產(chǎn)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2009,25(7):114-117.

        Li Rui, Li Cunjun, Xu Xingang, et al. Winter wheat yield estimation based on support vector machine regression and multi-temporal remote sensing data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2009, 25(7): 114-117. (in Chinese with English abstract)

        [14] Shiu Y, Chuang Y. Yield estimation of paddy rice based on satellite imagery: Comparison of global and local regression models[J]. Remote Sensing, 2019, 11(2): 111.

        [15] 岳繼博,楊貴軍,馮海寬. 基于隨機(jī)森林算法的冬小麥生物量遙感估算模型對(duì)比[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(18)::175-182.

        Yue Jibo, Yang Guijun, Feng Haikuan. Comparative of remote sensing estimation models of winter wheat biomass based on random forest algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(18): 175-182. (in Chinese with English abstract)

        [16] 楊北萍,陳圣波,于海洋,等. 基于隨機(jī)森林回歸方法的水稻產(chǎn)量遙感估算[J]. 中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2020,25(6):26-34.

        Yang Beiping, Chen Shengbo , Yu Haiyang, et al. Remote sensing estimation of rice yield based on random forest regression methone[J]. Journal of China Agricultural University, 2020, 25(6): 26-34. (in Chinese with English abstract)

        [17] Hunt M L., Blackburn G A, Carrasco L, et al. High resolution wheat yield mapping using Sentinel-2[J]. Remote Sensing of Environment, 2019, 233: 111410.

        [18] Sakamoto T. Incorporating environmental variables into a MODIS-based crop yield estimation method for United States corn and soybeans through the use of a random forest regression algorithm[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 160: 208-228.

        [19] 譚昌偉,羅明,楊昕,等. 運(yùn)用PLS算法由HJ-1A/1B遙感影像估測(cè)區(qū)域小麥實(shí)際單產(chǎn)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(15):161-166.

        Tan Changwei, Luo Ming, Yang Xin, et al. Remote sensing estimation of wheat practical yield on regional scale using partial least squares regression algorithm based on HJ-1A/1B images[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(15): 161-166. (in Chinese with English abstract)

        [20] Zeng W, Xu C, Gang Z, et al. Estimation of sunflower seed yield using partial least squares regression and artificial neural network models[J]. Pedosphere, 2018, 28(5): 764-774.

        [21] Huete A R. A soil-adjusted vegetation index (SAVI)[J]. Remote Sensing of Environment, 1988, 25(3): 295-309.

        [22] Rondeaux G, Steven M, Baret F. Optimization of soil-adjusted vegetation indices[J]. Remote Sensing of Environment, 1996, 55(2): 95-107.

        [23] Priebe S, Huxley P, Knight S, et al. Application and results of the manchester short assessment of quality of life (Mansa)[J]. International Journal of Social Psychiatry, 1999, 45(1): 7-12.

        [24] 趙德銀,張菁,王爽,等. 基于相關(guān)系數(shù)指標(biāo)篩選法的油田集輸泵機(jī)組用能評(píng)價(jià)體系研究[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2021,51(2):137-144.

        Zhao Deyin, Zhang Jing, Wang Shuang, et al. Study on energy consumption evaluation system of oil field gathering pump unit based on correlation coefficient index screening method[J]. Mathematics in Practice and Theory, 2021, 51(2): 137-144. (in Chinese with English abstract)

        [25] de Almeida M R, Correa D N, Rocha W F C, et al. Discrimination between authentic and counterfeit banknotes using Raman spectroscopy and PLS-DA with uncertainty estimation[J]. Microchemical Journal, 2013, 109: 170-177.

        [26] Chavana-Bryant C, Malhi Y, Anastasiou A, et al. Leaf age effects on the spectral predictability of leaf traits in Amazonian canopy trees[J]. Science of the Total Environment, 2019, 666: 1301-1315.

        [27] 張政,馮國(guó)雙. 變量投影重要性分析在自變量篩選中的應(yīng)用[J]. 現(xiàn)代預(yù)防醫(yī)學(xué),2012,39(22):5813-5815.

        Zhang Zheng, Feng Guoshuang. Application of variable importance for projection in the variables selection[J], Modern Preventive Medicine, 2012, 39(22): 5813-5815. (in Chinese with English abstract)

        [28] Xing Z, Chen J, Zhao X, et al. Quantitative estimation of wastewater quality parameters by hyperspectral band screening using GC, VIP and SPA[J]. PeerJ, 2019, 7: e8255.

        [29] 方匡南,吳見(jiàn)彬,朱建平,等. 隨機(jī)森林方法研究綜述[J]. 統(tǒng)計(jì)與信息論壇,2011,26(3):32-38.

        Fang Kuangnan, Wu Jianbin, Zhu Jianping, et al. A review of technologies on random forests[J], Statistics & Information Forum, 2011, 26(3): 32-38.(in Chinese with English abstract)

        [30] 宋述芳,何入洋. 基于隨機(jī)森林的重要性測(cè)度指標(biāo)體系[J]. 國(guó)防科技大學(xué)學(xué)報(bào),2021,43(2):25-32.

        Song Shufang, He Ruyang. Importance measure index system based on random forest[J]. Journal of National University of Defense Technology, 2021, 43(2): 25-32. (in Chinese with English abstract)

        [31] Wold S, Sj?str?m M, Eriksson L. PLS-regression: A basic tool of chemometrics[J]. Chemometrics and Intelligent Laboratory Systems, 2001, 58(2): 109-130.

        [32] 于雷,洪永勝,耿雷, 等. 基于偏最小二乘回歸的土壤有機(jī)質(zhì)含量高光譜估算[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(14):103-109.

        Yu Lei, Hong Yongsheng, Geng Lei, et al. Hyperspectral estimation of soil organic matter content based on partial least squaresregression[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(14): 103-109. (in Chinese with English abstract)

        [33] 王海峰. 基于高光譜遙感的土壤水鹽監(jiān)測(cè)模型研究[D].楊凌:西北農(nóng)林科技大學(xué),2019.

        Wang Haifeng. Hyperspectral Remote Sensing Based Models for Soil Moisture and Salinity Prediction[D]. Yangling: Northwest A&F University, 2019. (in Chinese with English abstract)

        [34] Xiao Z, Li Y, Feng H. Modeling soil cation concentration and sodium adsorption ratio using observed diffuse reflectance spectra[J]. Canadian Journal of Soil Science, 2016, 96(4): 372-385.

        Comparation of rice yield estimation model combining spectral index screening method and statistical regression algorithm

        Wang Yaomin1, Chen Haorui3※, Chen Junying1,2, Wang Huiyun1, Xing Zheng1, Zhang Zhitao1,2

        (1.712100,; 2.712100; 3.100048)

        A crop yield is one of the most important parameters in agricultural production. An accurate estimation of regional crop yield can greatly contribute to agricultural production management and national food policy. However, only a few studies have been focused on the combined effects of different exponential screening and statistical regression at present, even though there are various models of crop yield estimation. In this study, a comparative investigation was performed on the three types of index screening and three regression models, in order to explore the coordinated effect of the estimation model for the rice yield. The influence mechanism was also proposed to achieve an optimal yield estimation model suitable for the local production conditions. An important rice-producing area, the Sanjiang Plain in the Heilongjiang Province of China was taken as the study area. The rice unit yield and MOD09A1 remote sensing data were collected in the Bielahong River basin of the study area in 2019. After preprocessing, a total of 36 remote sensing variables were obtained, where four original bands and five vegetation indices of rice at the four growth stages, including the tillering, booting, heading, and milk ripening stage. Subsequently, the remote sensing variables were screened for the high sensitivity to the rice yield using the correlation coefficient (), Variable Importance in Projection (VPI), and Out-Of-Bag (OOB) data importance analysis. After that, nine estimation models of rice yield were constructed to combine with the Random Forest (RF), Support Vector Machine (SVM), and Partial Least Squares (PLS) regression, such as the-RF,-SVM,-PLS, VIP-RF, VIP-SVM, VIP-PLS, OOB-RF, OOB-SVM, and OOB-PLS. Several experiments were carried out for each model. Thus, the best input data was achieved for the optimal model. The determination coefficient, Root Mean Square Error (RMSE), and normalized Root Mean Square Error (nRMSE) were also used to evaluate the model. The results showed that the same index screening was fitted the different models with different degrees, where the OOB was more suitable for RF, the VIP was more suitable forand PLS, and thewas more suitable for SVM. Specifically, the PLS and SVM model performed better in the three modelings, whereas, the RF model performed the best, among which the combined OOB-RF model was the best, with the model determination coefficient of 0.742, RMSE of 206 kg/hm2, and nRMSE of 3.10%. Therefore, the index screenings varied greatly with the regression, where the OOB-RF model presented the best yield estimation in the study area. This finding can provide a strong theoretical reference to integrate the exponential screening and regression for the rice yield estimation model.

        remote sensing; yield; models; rice; support vector machine; exponential screening method

        10.11975/j.issn.1002-6819.2021.21.024

        S25

        A

        1002-6819(2021)-21-0208-09

        王耀民,陳皓銳,陳俊英,等. 光譜指數(shù)篩選方法與統(tǒng)計(jì)回歸算法結(jié)合的水稻估產(chǎn)模型對(duì)比[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(21):208-216.doi:10.11975/j.issn.1002-6819.2021.21.024 http://www.tcsae.org

        Wang Yaomin, Chen Haorui, Chen Junying, et al. Comparation of rice yield estimation model combining spectral index screening method and statistical regression algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(21): 208-216. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.21.024 http://www.tcsae.org

        2021-06-22

        2021-10-22

        國(guó)家重點(diǎn)研發(fā)計(jì)劃課題(2019YFC0409203);國(guó)家自然科學(xué)基金(51779273);中國(guó)水利水電科學(xué)研究院技術(shù)創(chuàng)新團(tuán)隊(duì)項(xiàng)目(ID0145B022021)

        王耀民,研究方向?yàn)檗r(nóng)業(yè)遙感研究與應(yīng)用。Email:wangyaomin@nwafu.edu.cn

        陳皓銳,博士,正高級(jí)工程師,研究方向?yàn)楣鄥^(qū)水循環(huán)模擬與調(diào)控。Email:chenhr@iwhr.com

        猜你喜歡
        估產(chǎn)排序建模
        排序不等式
        基于無(wú)人機(jī)多光譜遙感數(shù)據(jù)的煙草植被指數(shù)估產(chǎn)模型研究
        聯(lián)想等效,拓展建模——以“帶電小球在等效場(chǎng)中做圓周運(yùn)動(dòng)”為例
        遙感技術(shù)在大豆種植情況監(jiān)測(cè)中的應(yīng)用
        恐怖排序
        節(jié)日排序
        基于PSS/E的風(fēng)電場(chǎng)建模與動(dòng)態(tài)分析
        電子制作(2018年17期)2018-09-28 01:56:44
        不對(duì)稱半橋變換器的建模與仿真
        刻舟求劍
        兒童繪本(2018年5期)2018-04-12 16:45:32
        基于地級(jí)市的區(qū)域水稻遙感估產(chǎn)與空間化研究
        98国产精品永久在线观看| 亚洲人成网网址在线看| 亚瑟国产精品久久| 国产女女做受ⅹxx高潮| 成人国产精品一区二区网站| 加勒比东京热综合久久| 国产精品久久婷婷免费观看| 小妖精又紧又湿高潮h视频69| 天天弄天天模| 久久精品国产99精品九九| 看全色黄大黄大色免费久久| 日本免费观看视频一区二区| 国产三级在线观看完整版| 国内揄拍国内精品人妻浪潮av| 无码久久流水呻吟| 国产精品久久国产精品久久| 久久伊人精品中文字幕有尤物| 日本又色又爽又黄的a片18禁| 亚洲av无码av日韩av网站| 国产精品美女AV免费观看| 国产精品黑丝美女av| 在线麻豆精东9制片厂av影现网| 免费观看激色视频网站| 日韩在线看片| 国产成人自拍视频在线观看网站| 国产乱码精品一区二区三区久久 | 国产亚洲精品美女久久久| 色先锋资源久久综合5566| 亚洲精品动漫免费二区| 亚洲av日韩综合一区尤物| 国产精品成熟老女人| 韩国精品一区二区三区无码视频 | 国产精品欧美久久久久久日本一道| 丰满岳乱妇久久久| 高h视频在线免费观看| 日韩AV无码一区二区三区不卡毛片| 久久精品中文字幕亚洲| 国产毛片av一区二区| 亚洲精品一区国产欧美| 国产精品视频久久久久| 视频一区视频二区亚洲|