亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學(xué)習(xí)的馬尾松毛蟲發(fā)生面積預(yù)測模型

        2019-06-12 07:27:20龐永華冀小菊
        江西農(nóng)業(yè)學(xué)報 2019年5期
        關(guān)鍵詞:毛蟲馬尾松線性

        龐永華,冀小菊

        (1.河南省上蔡縣森林病蟲害防治檢疫站,河南 上蔡 463800;2.河南省上蔡縣林業(yè)技術(shù)推廣站,河南 上蔡 463800)

        馬尾松毛蟲(Dendrolimuspunctatus)屬鱗翅目(Lepidoptera)、枯葉蛾科(Lasiocampidae),為我國南方18個省區(qū)的重要害蟲,主要危害馬尾松,是我國常發(fā)性森林害蟲[1]。該害以幼蟲取食松針,暴發(fā)成災(zāi)時,數(shù)日內(nèi)可將大面積連片的松林針葉吃光,遠看焦黃、發(fā)黑,如同火燒一樣,嚴重影響樹木生長,造成松樹枯死[2]。因此,加強馬尾松毛蟲發(fā)生趨勢預(yù)測預(yù)報研究,在其大發(fā)生之前進行控制,可以把對松林的危害損失降低到最小程度。

        馬尾松毛蟲的發(fā)生及其種群數(shù)量變化與氣象因子和林分結(jié)構(gòu)有關(guān)[2-4],若不考慮林分因素,馬尾松毛蟲的發(fā)生量和發(fā)生面積主要與氣象因子有關(guān)。為此,很多學(xué)者利用氣象因子,通過線性回歸[5]、判別分析[6]、馬爾科夫鏈[7]等方法對馬尾松毛蟲的發(fā)生量和發(fā)生面積進行了預(yù)測,這些方法多屬于線性預(yù)測方法,實際上害蟲的發(fā)生與氣象因子的關(guān)系為復(fù)雜的非線性關(guān)系[8,9],故探討預(yù)測精度更高的非線性預(yù)測方法非常重要。

        近年來,很多學(xué)者利用機器學(xué)習(xí)模型建立了害蟲發(fā)生量與氣候因子的非線性模型,預(yù)測精度比傳統(tǒng)的線性預(yù)測模型高[10-17]。對于馬尾松毛蟲發(fā)生面積的預(yù)測,很多學(xué)者運用人工神經(jīng)網(wǎng)絡(luò)模型進行預(yù)測,預(yù)測精度優(yōu)于線性回歸模型[14-18]。但是運用深度學(xué)習(xí)、隨機森林、支持向量機等機器學(xué)習(xí)模型對馬尾松毛蟲的發(fā)生面積的預(yù)測并選擇最優(yōu)模型相關(guān)報道較少。

        1 材料與方法

        1.1 數(shù)據(jù)來源

        本研究采用的20組馬尾松毛蟲發(fā)生面積數(shù)據(jù)和氣象數(shù)據(jù)來自陳繪畫等學(xué)者的研究[2],其中馬尾松毛蟲發(fā)生面積數(shù)據(jù)資料來自浙江省仙居縣森林病蟲防治站,氣象資料來自浙江省仙居縣氣象局。

        1.2 預(yù)報因子的選擇

        對馬尾松毛蟲發(fā)生面積的8個氣象預(yù)測因子:當(dāng)年2月下旬平均氣溫(x1)、當(dāng)年3月上旬平均氣溫(x2)、當(dāng)年2月中旬相對濕度(x3)、上年10月中旬降水量(x4)、上年9月中旬日照時數(shù)(x5)、上年6月上旬最低氣溫(x6)、上年8月中旬最低氣溫(x7)、上年12月中旬最低氣溫(x8)進行逐步線性回歸分析[2],最終選擇3個進入逐步回歸模型的氣象因子:x2、x5和x8作為線性模型、隨機森林、支持向量機和深度學(xué)習(xí)模型建模的自變量,預(yù)測馬尾松毛蟲的發(fā)生面積。用前18個年份的數(shù)據(jù)作為訓(xùn)練集,構(gòu)建模型,后兩年的數(shù)據(jù)作為測試集,驗證模型的精度。

        1.3 選用的模型預(yù)測方法

        1.3.1 多元線性回歸 多元線性回歸是利用氣象因子預(yù)測蟲害的常用方法[3,5]。采用R軟件中的lm函數(shù)建立當(dāng)年3月上旬平均氣溫(x2)、上年9月中旬日照時數(shù)(x5)和上年12月中旬最低氣溫(x8)3個氣象因子與馬尾松毛蟲發(fā)生面積(y)的多元回歸線性模型。

        1.3.2 隨機森林模型 隨機森林(random forest)模型是一種基于分類樹的機器學(xué)習(xí)算法[8-10],即在變量(列)的使用和數(shù)據(jù)(行)的使用上進行隨機化,生成很多分類樹,再總分分類樹的結(jié)果構(gòu)建模型。采用R軟件中的randomForest程序包構(gòu)建隨機森林模型,ntree=200。

        1.3.3 支持向量機模型 支持向量機(support vector machine,SVM)的基本思想是通過非線性映射將數(shù)據(jù)映射到高維空間特征空間,然后在該空間進行線性回歸,讓所有樣本點的總偏差達到最小,進而提高模型的預(yù)測能力[8-9,10,12],在諸多機器學(xué)習(xí)模型中因其準確高效而備受關(guān)注。采用R軟件中的e1071軟件包的SVM構(gòu)建支持向量機模型。

        1.3.4 深度學(xué)習(xí)模型 深度學(xué)習(xí)(deep learning)是在神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上建立的預(yù)測精度更高的機器學(xué)習(xí)模型之一,該模型可以逼近任意的非線性函數(shù),能夠處理系統(tǒng)內(nèi)難以解析的規(guī)律型,具有良好的泛化能力[19]。采用R軟件中的h2o程序包建立深度學(xué)習(xí)模型,設(shè)置隱含層數(shù)為3,各層的節(jié)點數(shù)分別為10、8和8,,訓(xùn)練次數(shù)為500次,訓(xùn)練誤差為1×10-6。

        1.4 模型評價方法

        1.4.1 均方根誤差 用均方根誤差(Root mean square error, RMSE)作為指標來衡量多元線性回歸、隨機森林、支持向量機和人工神經(jīng)網(wǎng)絡(luò)4個模型的性能[11]。RMSE的計算公式如下:

        (1)

        公式(1)中:Xa,i為實測值,Xb,i為模型預(yù)測值,n為預(yù)測樣本數(shù)。

        1.4.2 預(yù)測準確率 預(yù)測準確率(PA, %)[17,18]的計算公式如下,式中的參數(shù)含義如公式(1)所示。

        (2)

        2 結(jié)果與分析

        2.1 模型擬合

        選擇18組數(shù)據(jù),分別采用多元線性回歸、隨機森林、支持向量機和深度學(xué)習(xí)構(gòu)建模型,通過模型的決定系數(shù)、RMSE和殘差來比較所建的4個模型的性能。由圖1可知,4個模型的決定系數(shù)R2的大小順序為深度學(xué)習(xí)(0.9901)>支持向量機(0.9617)>隨機森林(0.9584)>多元線性回歸(0.8861);均方根誤差RSME的大小順序為多元線性回歸(0.5493)>隨機森林(0.4269)>支持向量機(0.3275)> 深度學(xué)習(xí)(0.00453)。說明多元線性回歸模型的擬合效果最差,3個機器學(xué)習(xí)模型的擬合效果均優(yōu)于多元線性模型,其中深度學(xué)習(xí)模型的擬合效果最好,其次為支持向量機模型。

        圖2為4個模型預(yù)測值與實際值相比較的誤差,與3個機器學(xué)習(xí)模型相比,多元線性回歸模型的預(yù)測值誤差異常點較多;其次為隨機森林模型;支持向量機模型預(yù)測值誤差異常點較少,精度較高;深度學(xué)習(xí)模型預(yù)測值與實測值差異很小,誤差點幾乎均位于零值線上,說明深度學(xué)習(xí)模型的擬合精度最高。

        圖1 預(yù)測馬尾松毛蟲發(fā)生面積

        圖2 4種模型預(yù)測馬尾松毛蟲發(fā)生面積誤差比較

        2.2 模型預(yù)測與驗證評估

        把預(yù)留的2001和2002年數(shù)據(jù)代入4個模型中,對4個模型的預(yù)測精度進行驗證比較(表1)。由表1可知,多元線性回歸模型對2001和2002年馬尾松毛蟲發(fā)生面積的預(yù)測值誤差均較大,兩年的平均預(yù)測準確率最低,僅為45.61%;深度學(xué)習(xí)模型預(yù)測值誤差最小,兩年馬尾松毛蟲發(fā)生面積平均預(yù)測準確率最高,為99.27%;其次為支持向量機模型,平均預(yù)測準確率為92.13%。

        表1 4種機器學(xué)習(xí)模型對馬尾松毛蟲發(fā)生面積的預(yù)測效果比較

        3 結(jié)論與討論

        本研究表明,傳統(tǒng)的多元線性模型對馬尾松毛蟲發(fā)生面積的預(yù)測擬合度和預(yù)測誤差較大,3種機器學(xué)習(xí)模型對馬尾松毛蟲發(fā)生面積的預(yù)測效果均優(yōu)于傳統(tǒng)的多元線性模型,這與很多學(xué)者的研究結(jié)果一致[2, 11, 14-17]。由此可見,雖然所選擇的預(yù)報因子一樣, 但由于氣象因子與森林害蟲的關(guān)系并非單純的線性關(guān)系[2, 11, 17],深度學(xué)習(xí)、支持向量機和隨機森林模型利用了各氣象因子相互之間及其與害蟲發(fā)生面積之間的相互關(guān)系,進行深度學(xué)習(xí)訓(xùn)練[11, 17],無論擬合精度和預(yù)測效果均比傳統(tǒng)的線性回歸模型好。

        在3種機器學(xué)習(xí)模型中,深度學(xué)習(xí)對馬尾松毛蟲發(fā)生面積的預(yù)測最為穩(wěn)健,擬合決定系數(shù)和預(yù)測準確率最高(R2=0.9901,PA=99.27%),RSME最低,僅為0.1711。證明深度學(xué)習(xí)模型用于馬尾松毛蟲發(fā)生面積預(yù)測更為科學(xué)可靠,原因是深度學(xué)習(xí)具有較強的自適應(yīng)、抗干擾和容錯性等能力,個別學(xué)習(xí)樣本的分量偏差對網(wǎng)絡(luò)的學(xué)習(xí)效果影響較小,因此模型的穩(wěn)定性較好[19]。很多學(xué)者利用神經(jīng)網(wǎng)絡(luò)模型進行馬尾松毛蟲發(fā)生量和發(fā)生面積預(yù)測,也取得了滿意的預(yù)測效果[14-16]。其次,支持向量機模型預(yù)測效果也較好(R2=0.9617,RSME=0.3275,PA=92.13%),隨機森林模型相對較差。支持向量機與隨機森林相比,支持向量機更適合處理小樣本問題[8, 9, 17-18]。本研究的樣本量較小,可能是造成隨機森林模型預(yù)測誤差較大的原因。建議在今后的研究中,加強對馬尾松毛蟲長時間序列發(fā)生面積、發(fā)生量及其氣象因子的觀測,增大樣本量,深入開展機器學(xué)習(xí)模型在馬尾松毛蟲發(fā)生面積和發(fā)生量預(yù)測預(yù)報中應(yīng)用的研究,提高馬尾松毛蟲的預(yù)測預(yù)報準確率。

        猜你喜歡
        毛蟲馬尾松線性
        小毛蟲的夢想
        The great monarch migrations
        漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
        線性回歸方程的求解與應(yīng)用
        馬尾松栽培技術(shù)及撫育管理
        綠色科技(2019年5期)2019-11-29 13:17:37
        二階線性微分方程的解法
        馬尾松果糖-1,6-二磷酸酶基因克隆及表達模式分析
        馬尾松初級種子園復(fù)壯技術(shù)
        24年生馬尾松種子園自由授粉子代測定及家系選擇
        毛蟲和蛾子
        国产免费三级av在线| 中文字幕日产人妻久久| 亚洲一区二区av偷偷| 中文字幕一区二区三区四区| 麻豆av一区二区三区| 亚洲色大成网站www尤物| 精品高清国产乱子伦| 国产精品女同一区二区软件| 人成午夜免费视频无码| 正在播放国产对白孕妇作爱| 成人无码激情视频在线观看 | 日本高清视频永久网站www | 国产在线不卡免费播放| 成年男女免费视频网站点播| 狠狠躁日日躁夜夜躁2022麻豆| 国产精选污视频在线观看| 欧美日韩国产成人综合在线影院| 亚洲av推荐网站在线观看| 免费a级毛片无码a∨蜜芽试看 | 欧美一区波多野结衣第一页| 国产激情视频在线观看你懂的| 日韩人妻中文字幕高清在线| 久久久国产精品免费a片3d| 亚洲熟女网站| 亚洲综合有码中文字幕| 久久亚洲中文字幕精品一区| 亚洲av永久无码天堂网手机版| 国产大片中文字幕| 国产69精品麻豆久久| 久久婷婷人人澡人人爽人人爱| 欧美激情五月| 国产亚洲精品一区二区在线播放| www夜插内射视频网站| 国产精品成人一区二区三区| 亚欧同人精品天堂| 久久久麻豆精亚洲av麻花| 一本色道无码道在线观看| 亚洲精品综合第一国产综合| 免费黄网站一区二区三区| 永久亚洲成a人片777777| 熟妇与小伙子matur老熟妇e|