亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        WELM-Adaboost 算法及在小麥赤霉病流行強度預測中的應用

        2021-03-11 07:56:18付強關海鷗
        關鍵詞:隱層赤霉病分類器

        付強,關海鷗

        (黑龍江八一農(nóng)墾大學電氣與信息學院,大慶163319)

        在我國,小麥生產(chǎn)比重高、產(chǎn)量大,是國民最主要的糧食作物。小麥的生長過程中,常常會遭受很多自然災害的侵襲,比如真菌、暴風、寒流等,這些病害、凍害等的產(chǎn)生會嚴重影響小麥產(chǎn)量甚至造成絕收。而小麥赤霉病就是其中嚴重影響小麥產(chǎn)量和品質的作物流行病之一。自有統(tǒng)計以來,黑龍江省也曾多次遭受到小麥赤霉病的侵襲,其中,在1959 年全省小麥因赤霉病而減產(chǎn)20%~50%。而在1981 年全省國營農(nóng)場又因小麥赤霉病即損失糧食近3.5 億kg[1]。因此,準確地對小麥赤霉病的流行強度做出預測,對黑龍江省小麥的生產(chǎn)活動具有重要意義。

        隨著互聯(lián)網(wǎng)技術以及通信技術的不斷發(fā)展與進步,“人工智能”時代已經(jīng)來臨,越來越多的傳統(tǒng)行業(yè)依托“機器學習”等現(xiàn)代計算機技術,不斷的更新甚至被顛覆,人工智能在農(nóng)業(yè)領域也已經(jīng)得到了廣泛的應用,對農(nóng)作物病蟲害預測等問題提供了一定的參考和借鑒作用。

        目前利用人工智能技術對農(nóng)作物病蟲害預測的研究有很多,時雨[2]以安徽省太和縣近年小麥赤霉病的發(fā)生流行情況作為研究對象,提取病原、寄主和氣候等3 方面數(shù)據(jù),利用統(tǒng)計分析的方法,總結出了長期氣象指標和短期氣象指標分別對小麥赤霉病發(fā)生情況的影響,提出了基于氣候因素的小麥赤霉病預測預報方法;2017 年,吳亞琴[3]通過分析中國中部地區(qū)近十年來小麥赤霉病發(fā)生情況以及氣候數(shù)據(jù),分別建立了含有氣象因子交叉項的逐步回歸模型以及含有氣象因子的多元線性逐步回歸模型;2019 年,馬曉丹[4]根據(jù)農(nóng)作物在發(fā)生病蟲害時,其冠層圖像特征難以提取的問題,將數(shù)字圖像處理技術與多維特征選取機制相結合,并融入到了大田農(nóng)作物生長過程中病蟲害預測與預報問題中來,為農(nóng)作物全面系統(tǒng)地開展生長過程監(jiān)測及病害防治提供重要理論支持;2017 年,張友華等[5]利用神經(jīng)網(wǎng)絡中激活函數(shù)所具有的映射能力,采用Fletcher-Reeves 算法的變梯度反向傳播算法,建立了小麥赤霉病的氣象預報模型,實驗表明該算法對小麥赤霉病的預防工作具有一定的參考價值。

        以上研究主要集中對大量數(shù)據(jù)進行統(tǒng)計分析,建立回歸方程的方法對小麥赤霉病的流行強度進行預測,但是回歸分析法需要對大量樣本數(shù)據(jù)進行分析才能得到較準確的規(guī)律,同時容易出現(xiàn)過擬合的狀況,當數(shù)據(jù)量不是很充足的情況下,該方法難以得到準確的預測結果。利用極限學習機算法的小樣本尋優(yōu)和良好的泛化能力,對小麥赤霉病的流行強度預測展開研究,同時,基于小麥赤霉病的流行強度樣本分布不均衡的特點,構建了Weighted-ELM 算法與Adaboost 算法融合的模型,驗證了該算法對小麥赤霉病流行強度預測的可行性。

        1 實驗數(shù)據(jù)集及評價指標

        對所采用的數(shù)據(jù)集以及研究所采用的評價指標即AUC 值分別作簡要介紹。

        1.1 數(shù)據(jù)集介紹

        根據(jù)前人的研究,小麥赤霉病屬氣候型流行性病害,即其發(fā)生的速度和強度均受到氣候因素的影響[6]。在農(nóng)學專家研究的基礎上,利用黑龍江省八五四農(nóng)場所累積的23 年的田間赤霉病情與氣象資料作為基礎數(shù)據(jù),包含平均相對濕度、降雨量、降雨日數(shù)、日照時數(shù)4 個氣候因素,同時,這里將病害分為了兩個等級,分別用“強”、“弱”表示小麥赤霉病的流行程度,其中“強”代表病穗率高于20%的情況,對輸入數(shù)據(jù)進行標準化處理并添加流行強度后[7],樣本數(shù)據(jù)如表1 所示。

        表1 實驗數(shù)據(jù)統(tǒng)計信息Table 1 Experimental data statistics

        從表中可以發(fā)現(xiàn),實驗數(shù)據(jù)中,流行程度強與弱的比例約為1∶7,樣本的分布并不均衡,這就為模型建立帶來了巨大的挑戰(zhàn)。

        1.2 評價指標

        通過上述分析,小麥赤霉病流行強度預測可以看作是一個二分類問題,并且正負樣本比例并不均衡,在數(shù)據(jù)中,小麥赤霉病流行程度的強弱比為1∶7左右,準確度(Accuracy)這樣的評價指標不能很好的反應分類器的性能[8]。

        為了解決上述問題,人們從醫(yī)療分析領域引入ROC 曲線(Receiver Operating Characteristic)作為分類不均衡問題的判別指標,繼而應用到數(shù)據(jù)挖掘、機器學習和模式識別等領域[9]。ROC 曲線是一種二維平面曲線,其橫縱坐標分別是FPR(False Positive Rate)和 TPR(True Positive Rate),二者可以根據(jù)公式 1、2計算得到。

        對于二分類問題,TP、FP、TN、FN 分別稱為真正例、假正例、真反例以及假反例[10],四個參數(shù)的具體含義如表2 所示。

        表2 分類結果的混淆矩陣Table 2 Confusion matrix of classification results

        對于某個分類器而言,其分類結果可以映射為ROC 曲線平面上的某個點,不斷調整分類器的分類閾值,便可以得到一條經(jīng)過點(1,1)和點(0,0)的曲線。在小麥赤霉病流行程度預測問題中,將流行程度為強的樣本作為正類,流行強度為弱的樣本作為負類,對小麥赤霉病流行強度的預測結果進行排序,根據(jù)閾值選擇的不同,可以生成 ROC 曲線,很明顯,算法的預測精度越高,ROC 曲線下的面積越大,即AUC(Area Under Curve)越大。

        2 ELM 算法介紹

        極限學習機(Extreme Learning Machine)算法是一種新型的神經(jīng)網(wǎng)絡模型,與傳統(tǒng)的BP 神經(jīng)網(wǎng)絡相比,該算法的隱層節(jié)點內權值和偏置值都是隨機選取的,不需要進行迭代來調節(jié)網(wǎng)絡參數(shù),因此訓練速度得到大幅提升,同時還能獲得全局最優(yōu)解,對于數(shù)據(jù)集的泛化能力很強。隨著ELM 算法的不斷發(fā)展,基于樣本分部不均衡的特點,帶有權重的極限學習機(Weighted Extreme Learning Machine)模型又被提出。

        2.1 ELM 算法

        近年來,隨著對神經(jīng)網(wǎng)絡學習算法的研究不斷深入,Huang G.B 等[11]學者于2004 年提出了一種快速的單隱層神經(jīng)網(wǎng)絡算法即極限學習機(ELM)算法。ELM 算法的具體網(wǎng)絡結構如圖1 所示[12]。

        圖1 ELM 神經(jīng)網(wǎng)絡結構Fig.1 ELM neural network structure

        傳統(tǒng)神經(jīng)網(wǎng)絡模型隱層節(jié)點的權值和偏置均是通過誤差的反向傳播算法不斷迭代而確定的,而ELM 算法的值是隨機選取的,不需要一系列的迭代算法進行調節(jié)[13]。除此之外,ELM 算法中隱藏層到輸出層的權值是利用最小二乘法來求解的,不需要任何迭代步驟,所以該神經(jīng)網(wǎng)絡的參數(shù)確定過程是非常簡單的,縮短了該模型的訓練時間[14]。

        式中,G(aX+b)稱作神經(jīng)網(wǎng)絡中隱層節(jié)點的激勵函數(shù),通常為 sigmoid,sin,hardlim,tribas 等函數(shù),ai為第i 個隱層節(jié)點與輸入節(jié)點的連接權值,bi為第i 個隱層節(jié)點的偏置,βi為隱層節(jié)點與輸出節(jié)點之間的連接權值。

        在算法的實際應用中,希望網(wǎng)絡的輸出值與實際的輸出值相等或者是很接近,如在上述樣本集中,通過神經(jīng)網(wǎng)絡后以零誤差接近目標值T,則有‖Hβ-T‖=0,即ELM 算法的公式可以簡記為:

        式中,H 為神經(jīng)網(wǎng)絡隱層節(jié)點輸出矩陣;β 為隱層與網(wǎng)絡輸出層之間的外權矩陣。

        該算法求出外權矩陣β 的主要思想是使訓練誤差‖H β-T‖2和輸出外權矩陣的?!隆钚。词瓜率降闹禐樽钚?,

        也就是尋找最小二乘解β,可以得到:

        其中HΓ為H 的廣義逆矩陣,當HTH 是非奇異可逆矩陣時,HΓ=(HTH)-1HT;當 HHT是非奇異可逆矩陣時,HΓ=HT(HHT)-1。而當隱層節(jié)點輸出矩陣H 非列滿秩的情況,最優(yōu)外權β 向量可以利用奇異值分解(SVD)的方法得到[15]。

        經(jīng)過上述一系列的方法得到ELM 算法中的外權矩陣β,隱層節(jié)點輸出矩陣H 由隨機生成的節(jié)點參數(shù)確定,那么這個神經(jīng)網(wǎng)絡的模型結構就確定下來了,再運用測試樣本經(jīng)過該神經(jīng)網(wǎng)絡,就可以直接得到網(wǎng)絡的輸出值。

        2.2 Weighted-ELM 算法

        上節(jié)介紹的是基本的ELM 算法,然而現(xiàn)實生活中會遇到諸多分類樣本不平衡的情況,比如小麥赤霉病流行強度預測問題,再比如故障診斷等。為了解決分類樣本不平衡問題,黃廣斌等[16]在2013 年提出Weighted-ELM 算法。

        基本ELM 算法的優(yōu)化目標函數(shù)為:

        其中,滿足的條件是h(Xi)β=ti-ξi,i=1,2,…,N。公式(7)中的前半部分稱為結構風險,后半部分稱為經(jīng)驗風險。

        Weighted-ELM 算法的優(yōu)化目標函數(shù)為:

        其中,W 是N×N 的對角矩陣,矩陣W 的取值和每個訓練樣本相關,通常來說,如果Xi屬于一個少數(shù)并且又是二分類問題中相對重要的類別,那么相應的Wii應該賦予一個相對大的權重。W 的取值方法有兩種如下,其中k 是一個可調參數(shù)[17]。

        第一種W1:

        第二種W2:

        根據(jù)KKT 條件,訓練ELM 的過程等同于解決下式問題:

        與ELM 相似,β也分兩種方式求解:

        當,給定一個新的樣本X,通過上述確定β 的具體值后,Weighted-ELM 分類器的輸出便可簡化為:

        3 WELM-Adaboost 算法

        Weighted-ELM 算法通過調整正負類樣本的權重,可以在一定程度上提高預測的精度,但是該算法中,樣本的權重是通過各類樣本數(shù)目的分布而確定的,其大小是固定不變的,對錯分樣本沒有進行進一步的區(qū)分,因此,采用可以調整數(shù)據(jù)分布權值的WELM-Adaboost 算法構建小麥赤霉病流行程度預測模型。

        3.1 Adaboost 算法介紹

        Boosting 算法是一種集成式的機器學習方法,其思想就是將多個預測能力較弱的分類器通過一定的投票算法而集成為強分類器,Adaboost 算法就是Boosting 思想的典型應用之一[18]。Adaboost 算法選取樣本中少量但是比較重要的特征構造多個弱分類器,再將這些弱分類器通過加權的投票機制組合成為強分類器,其優(yōu)點在于該算法會根據(jù)樣本的分布以及各個弱分類器的分類效果而調整每個分類器的權重,從而提高算法的預測精度[19]。

        3.2 基于WELM-Adaboost 的預測模型

        將Weighted-ELM 作為弱預測器,使用Adaboost算法思想不斷調整每個樣本權重分布,得到多個Weighted-ELM 分類器,將這些分類器組合成一個強分類器[20]。

        基于Adaboost 算法和Weighted-ELM 算法的小麥赤霉病流行強度預測流程如圖2 所示。

        圖2 基于WELM-Adaboost 算法小麥赤霉病預測框圖Fig.2 Block Diagram of Wheat Scab Prediction Based on WELM-Adaboost Algorithm

        算法詳細步驟如下:

        (1)從樣本數(shù)據(jù)中隨機選取N 條作為訓練數(shù)據(jù),根據(jù)其中正負樣本的分布比例,初始化不同類別的權值。

        (2)對于每次迭代m=1:M,其中M 是所有弱分類器的個數(shù),該算法會重復以下(a)-(e)的步驟:

        a)利用訓練樣本的樣本的分布權值,得到第m個弱分類器ELMm;

        b)根據(jù)由ELMm錯分樣本的權值計算出權重預測誤差和,權重預測誤差和的計算公式如(15)所示:

        c)依據(jù)權重預測和計算出序列權重αm,其公式如(16)所示:

        d)根據(jù)計算出的序列權重αm調整新的訓練樣本的權重:

        e)重新調整權重分布,在權重比例不變的情況下使分布權值的和為1。

        (3)經(jīng)過M 次迭代后,得到M 組弱預測器,將這些弱預測器融合成最后的強預測器C(x):

        其中k 是樣本的類別數(shù)。

        4 實驗設計與結果分析

        所采用的實驗數(shù)據(jù)集是黑龍江省八五四農(nóng)場所累積的23 年的田間赤霉病情與氣象資料作為基礎數(shù)據(jù),樣本個數(shù)不是很充足,因此,為了衡量算法的準確性,采用交叉驗證的方式,每次實驗隨機選取16個樣本作為訓練集,其余7 個樣本作為預測集,且保證每次實驗的訓練集和測試集中均包含正樣本。那么,根據(jù)實驗數(shù)據(jù)的特點,共可以生成六種訓練集與測試集的組合。

        4.1 模型參數(shù)選擇

        ELM 算法提供了五種激活函數(shù),分別是sigmoid、sin、hardlim、tribas、radbas,經(jīng)過大量實驗表明,不同激活函數(shù)對算法預測速度和精度的影響不是很明顯。因此,綜合考慮訓練時間和設備開銷,選定ELM 算法、BP 神經(jīng)網(wǎng)絡算法和 WELM-Adaboost 算法的網(wǎng)絡的隱層節(jié)點個數(shù)均為8,激活函數(shù)設定為sin 函數(shù)。

        4.2 算法比較

        最后選取了傳統(tǒng)的BP 神經(jīng)網(wǎng)絡算法與普通的Weighted-ELM 算法作為對比方法,進行多次實驗后,得出三種算法的AUC 結果的對比如表3 所示:

        表3 三種算法預測結果比較Table 3 Comparison of prediction results of three algorithms

        根據(jù)表中數(shù)據(jù)可得,對于6 組數(shù)據(jù)集的預測結果,WELM-Adaboost 算法的平均 AUC 值為 0.865,高于 BP 神經(jīng)網(wǎng)絡算法的 0.705 以及 ELM 算法的0.717,WELM-AdaBoost 算法的預測準確性明顯優(yōu)于另外兩種算法,這說明所采用的WELM-Adaboost 算法預測小麥赤霉病的流行強度是合理的。

        5 總結與展望

        對小麥赤霉病流行強度進行準確預測,能夠針對性的采取防止措施,對小麥赤霉病的預防具有重大意義。主要貢獻有:

        提出了基于WELM-Adaboost 算法的小麥赤霉病流行強度預測的方法。以平均相對濕度、降雨量、降雨日數(shù)、日照時數(shù)4 個氣候因素作為預測模型的輸入,并與標準的BP 神經(jīng)網(wǎng)絡算法以及ELM 算法作比較,使用AUC 值作為衡量標準,實驗結果表明,在不同的數(shù)據(jù)集下,所采用的WELM-Adaboost 算法的AUC 值明顯高于另外兩種算法。

        盡管對小麥赤霉病的預測取得了一定成果,但是仍有許多問題需要改進與完善。

        實驗中,數(shù)據(jù)樣本數(shù)不夠多,尤其缺少流行強度較高的樣本,使得WELM-AdaBoost 算法的訓練精度不夠。同時,所采用的對照算法比較少,至于哪種算法在精度和速度上更占優(yōu)勢有待進一步研究。

        猜你喜歡
        隱層赤霉病分類器
        小麥赤霉病研究進展
        芮城縣:科學預防小麥赤霉病
        防治小麥赤霉病的殺菌劑應用情況分析
        基于RDPSO結構優(yōu)化的三隱層BP神經(jīng)網(wǎng)絡水質預測模型及應用
        人民珠江(2019年4期)2019-04-20 02:32:00
        BP-GA光照分類器在車道線識別中的應用
        電子測試(2018年1期)2018-04-18 11:52:35
        加權空-譜與最近鄰分類器相結合的高光譜圖像分類
        結合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
        小麥赤霉病的控制處理方法探析
        食品界(2016年4期)2016-02-27 07:36:41
        基于近似結構風險的ELM隱層節(jié)點數(shù)優(yōu)化
        計算機工程(2014年9期)2014-06-06 10:46:47
        最優(yōu)隱層BP神經(jīng)網(wǎng)絡的滾動軸承故障診斷
        久久夜色精品国产噜噜噜亚洲av | 精品福利一区二区三区免费视频| 中文字幕在线亚洲日韩6页| 国产美女精品aⅴ在线| 日韩狼人精品在线观看| 国产在线91精品观看| 99久久精品免费观看国产| 亚洲av国产av综合av| 免费国人成人自拍视频| 亚洲精品中文字幕导航| 少妇愉情理伦片高潮日本| 亚洲网站地址一地址二| 国产av大片在线观看| 亚洲国产天堂久久综合网| 成年女人粗暴毛片免费观看| 99精品久久这里只有精品| 久久精品国产亚洲av高清蜜臀| 亚洲一区二区国产激情| 激情航班h版在线观看| 麻豆五月婷婷| 亚洲香蕉久久一区二区| 亚洲av午夜精品无码专区| 国产性一交一乱一伦一色一情 | 自拍偷拍一区二区三区四区| 精品人妻av区乱码色片| 日本道精品一区二区三区| 亚洲另类激情专区小说婷婷久 | 人妻少妇av无码一区二区| 亚洲AV无码日韩综合欧亚 | 无码a级毛片免费视频内谢| 亚洲婷婷久久播66性av| 人人摸人人搞人人透| 欧美另类在线视频| 中文字幕人妻少妇精品| 激情内射人妻1区2区3区| 成人无码一区二区三区网站| 国产人妖xxxx做受视频| 亚洲av成熟国产一区二区| 香蕉人人超人人超碰超国产 | 国产3p一区二区三区精品| 欧美xxxx做受欧美|