亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于極限學習機的蚜蟲刺吸電位波形的分類識別?

        2019-11-06 03:58:02吳莉莉邢玉清林愛英鄭寶周潘建斌閆鳳鳴
        傳感技術學報 2019年10期
        關鍵詞:分類

        吳莉莉,邢玉清,林愛英,鄭寶周,潘建斌,閆鳳鳴

        (1.河南農業(yè)大學理學院,鄭州450002;2.河南農業(yè)大學植物保護學院,鄭州450002)

        蚜蟲是一類體型很小的植食性刺吸式昆蟲, 大多數(shù)是重要的農林害蟲,如棉蚜、桃蚜、大豆蚜、禾谷縊管蚜等,是世界上最具破壞性的害蟲類別之一;蚜蟲還是植物病毒最主要的傳毒介體類別之一。昆蟲刺吸電位儀(Electrical Penetration Graph,EPG)作為進行昆蟲取食行為、昆蟲傳毒機制、作物抗蟲機制等方面研究的有力工具[1-2],可以為包括蚜蟲在內的刺吸式昆蟲的防控方法研究及其所傳播植物病毒的機理研究提供技術支撐,目前已成功應用于蚜蟲、粉虱、飛虱、葉蟬、薊馬、蝽等50多種昆蟲的相關研究。但EPG波形的識別和分析一直是靠人工進行,費時費力,很大程度上限制了EPG技術的應用和作用的發(fā)揮,因此迫切需要EPG波形的自動識別。

        EPG技術最早應用于蚜蟲取食行為的研究,現(xiàn)階段國內外對蚜蟲的EPG波形研究也最深入和廣泛。蚜蟲EPG波形典型且穩(wěn)定,不同蚜蟲種類的EPG波形差異很小,是進行其他類別昆蟲EPG波形識別的重要參考。結合透射電鏡、同位素示蹤、口針切割等技術,已明確了蚜蟲的7種基本波形及其生物學意義,見表1。這7種波形分別為np波(非刺探波,此時蚜蟲口針未刺入植物表皮內,波形幾近直線)、C波(路徑波,包含A波和B波,在判讀中一般將一些不能明確區(qū)分的波也歸入C波)、pd波(口針穿刺波)、E1波(韌皮部分泌唾液波)、E2波(韌皮部取食波)、G波(木質部取食波)和F波(機械障礙波)[2]。

        表1 蚜蟲EPG波形的生物學意義

        目前國內外對蚜蟲EPG波形分類識別研究的報道僅有兩例。2015年Adasme-Carreo等[3]研發(fā)了一個EPG波形分析系統(tǒng),即A2EPG(Assisted Analysis of Electrical Penetration Graph),該系統(tǒng)能識別np、C、pd、G和 E1波并統(tǒng)計各波段的持續(xù)時間。然而A2EPG對EPG波形的識別率并不高,對np波和pd波的識別效果很好,對E2波完全不能識別,對其他波形(如G波、E1波)會經常錯判為C波,因此在使用該系統(tǒng)時需要用戶重新審查結果。

        A2EPG識別率不高的主要原因在于特征提取和識別算法過于簡單,僅提取了時域波形中的極值和斜率等特征,對于時頻和非線性特征均未考慮;這種特征提取方法雖然能在一定程度上減少運算量,也能部分代表波形的主要特征,但是波形中的很多細節(jié)特征都被忽略了。另外在波形識別算法上面,A2EPG使用的是二元分類法,該方法相對于機器學習中的人工神經網絡等分類器算法在自學習、非線性數(shù)據(jù)處理等方面能力較弱。

        2018年吳莉莉等[4]以桃蚜的EPG波形為研究對象,對 np、C、pd、E1、E2、G 和 F 波的特征提取和分類識別進行了研究,提出了融合分形維數(shù)和希爾伯特-黃變換(hilbert-huang transform,HHT)的特征提取方法,構建了基于決策樹的分類器,通過對4組不同樣本進行測試,得到了91.43%的平均識別率。與人工相比,機器識別的耗時僅為人工識別的1/46,極大地提高了工作效率。

        筆者的前期研究僅對非線性特征提取和決策樹分類器進行了初步探討,其他特征如時頻特征等均未考慮,機器學習中的其他分類算法對EPG波形分類是否會得到更高的識別率也未進行探討,因此本文擬采用不同的特征提取方法和分類器進行EPG波形分類識別的進一步研究,期望找到最佳的特征向量和分類器組合來提高識別性能。

        1 極限學習機

        極限學習機(Extreme Learning Machine,ELM)是由Huang等[5]針對傳統(tǒng)神經網絡訓練速度慢、易陷入局部極小值等問題提出的一種單隱含層前饋神經網絡(Single-Hidden Layer Feedforward Neural Network,SLFN),該算法中輸入層與隱含層間的連接權值以及隱含層神經元閾值都是隨機產生的,網絡在訓練過程中只需設置隱含層神經元的個數(shù)即可獲得唯一的最優(yōu)解,與傳統(tǒng)的SLFN相比具有學習速度快、泛化性能好等優(yōu)點,因此廣泛應用于回歸擬合和分類識別中[6-10]。

        ELM的網絡結構如圖1所示,由輸入層、隱含層和輸出層組成,輸入層與隱含層、隱含層與輸出層間的神經元采用全連接。

        設輸入層有n個神經元,對應n個輸入變量;隱含層有l(wèi)個神經元;輸出層有m個神經元,對應m個輸出變量。輸入層與隱含層間的連接權值矩陣為w,隱含層與輸出層的連接權值矩陣為λ,隱含層神經元的閾值矩陣為b,則

        設隱含層神經元的激活函數(shù)為g(x),則網絡的輸出Y為

        式中:H為隱含層輸出矩陣,N為輸出樣本個數(shù)。

        根據(jù)Huang提出的兩個定理可知:①若隱含層神經元個數(shù)與訓練樣本個數(shù)相同,對于任意的w和b,ELM都可以零誤差地逼近訓練樣本;②當訓練樣本個數(shù)較大時,為了減小計算量,隱含層神經元個數(shù)通常取得小于訓練樣本個數(shù),ELM的訓練誤差可以逼近任意一個ε>0。

        圖1 ELM的網絡結構圖

        因此當激活函數(shù)g(x)無限可微時,ELM無需調整全部參數(shù),w和b在訓練前可以隨機選擇,且在訓練過程中保持不變。而隱含層與輸出層的連接權值λ可以通過式(6)的最小二乘解獲得。

        式中:H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。

        在ELM中一些常用的激活函數(shù)[7]有如下幾種:

        ①高斯函數(shù)

        ④多元二次函數(shù)

        ELM算法的實現(xiàn)主要有以下三個步驟:①隨機設定輸入層與隱含層的連接權值w以及隱含層神經元閾值b,確定隱含層神經元個數(shù);②選取隱含層激活函數(shù),計算隱含層輸出矩陣H;③計算隱含層與輸出層的連接權值^λ:^λ=H+Y。

        2 EPG波形分類實驗

        EPG波形主要由EPG儀器采集獲得,經過預處理之后進行特征提取和分類識別。EPG波形的采集和預處理方法詳見文獻[4,11],這里不再贅述。

        2.1 小波能量特征的提取

        EPG信號是一種幅度和頻率隨時間變化的非平穩(wěn)信號。小波變換作為一種非平穩(wěn)信號分析方法,可以將信號分解成各種不同頻率成分或不同尺度成分,通過伸縮、平移聚焦到信號的任一細節(jié)加以分析,具有優(yōu)良的時頻特性[12-13]。小波系數(shù)可以表達信號在時頻兩域的能量分布,因此實驗中擬提取小波系數(shù)能量作為EPG波形的時頻特征。

        EPG波形的小波能量特征提取方法如下:

        ①對EPG信號進行j層小波分解,得到各層的小波分解系數(shù) Cj,k;

        ②計算各分解層的平均能量分布:將某層的分解系數(shù)先平方再求和,即:

        式中:為 j為分解層數(shù),Nj為第 j層小波系數(shù)的長度;

        ③篩選得到的各層平均能量,組建特征向量。

        由于EPG信號的采樣頻率為100 Hz,EPG各種波形的頻率主要集中在2 Hz~20 Hz,因此實驗中對EPG信號進行6層sym4小波分解,提取2~5層的高頻、低頻系數(shù)的平均能量,如圖2所示。圖2中給出了每種波形各100個樣本的小波能量平均值,A2~A5代表第2~5層小波分解的低頻系數(shù),D2~D5代表第2~5層小波分解的高頻系數(shù),顯然EPG各種波形在在低頻能量部分差異較明顯,高頻能量部分不易區(qū)分,因此選用低頻能量融合其他特征組建特征向量。

        圖3所示為EPG的7種波形各100個樣本第2~5層低頻小波系數(shù)平均能量的特征值分布。從圖中可以看出,G波的第2~4層特征值比較集中,數(shù)值穩(wěn)定,與其他特征值交叉較少,易于區(qū)分;E1波第2~5層的特征值比較分散,且數(shù)值差異較大,這對于后續(xù)的分類是不利的,說明小波系數(shù)的平均能量不能很好的表征E1波,還需要融合其他特征。

        圖2 第2~5層小波系數(shù)的平均能量對比圖

        圖3 EPG波形的小波系數(shù)平均能量特征值分布

        2.2 特征向量的組建

        文獻4中采用的是分形維數(shù)和HHT的特征組成特征向量,在利用決策樹進行分類時發(fā)現(xiàn),第2層的加權頻率特征幾乎沒有用到,所以實驗中將其替換成小波能量特征。由于不知道哪幾種特征組合對分類更有利,只有根據(jù)分類的實驗結果進行選擇[14]。

        實驗中將采用5種不同的特征向量組合來進行對比選擇。第1組特征向量 S1由分形盒維數(shù)、Hurst指數(shù)、第2~5層的低頻小波能量組成,共6個特征;第2組特征向量S2由HHT前2層譜質心、第2~5層的低頻小波能量組成,共6個特征;第3組特征向量S3由分形盒維數(shù)、Hurst指數(shù)、HHT前2層譜質心、第2~5層的低頻小波能量組成,共8個特征;第4組特征向量S4由分形盒維數(shù)、Hurst指數(shù)、HHT前2層譜質心、第2~3層的低頻小波能量組成,共6個特征;第5組特征向量S5由分形盒維數(shù)、Hurst指數(shù)、HHT前2層譜質心、第4~5層的低頻小波能量組成,共6個特征。

        為了與前期實驗結果方便對比,采用與文獻4完全相同的訓練樣本、測試樣本和分類器,各種不同特征組合的識別結果如表1所示。從表1中可以看出,采用S4特征向量組合得到的平均識別率最高,為91.61%,S5特征向量組合得到的平均識別率與文獻4相同,為91.43%,因此本文采用S4作為特征向量,進入ELM分類識別。

        表1 不同特征向量的分類識別率對比

        2.3 基于ELM的分類識別

        實驗中將對EPG信號中的C波、E1波、E2波、F波、G波、np波和pd波共7種波形進行分類識別,S4作為特征向量進入ELM分類器,共進行4組測試(與文獻4中的4組樣本完全相同)。ELM作分類器時,初始連接權值和隱含層閾值隨機設置,為了確保每次分類結果穩(wěn)定,將其固定,每次運算都使用這個隨機值。隱含層經元個數(shù)不同,對分類效果影響很大,圖4給出了當神經元個數(shù)取值從20~400時,4組測試樣本的分類識別率,可以看出神經元個數(shù)并非越多越好,而且隨著神經元個數(shù)的增加,識別率呈下降趨勢。

        圖4 隱含層神經元個數(shù)對ELM分類性能的影響

        ELM的隱含層神經元個數(shù)究竟取多少可以獲得最好的分類性能,目前尚缺乏理論指導,為了獲得最佳的識別率,實驗中對ELM算法進行了改進,采用增量型算法自適應地選擇隱含層神經元個數(shù)[15-16]。通過逐個增加隱含層神經元個數(shù)來確定最佳的網絡結構,在每次迭代過程中添加新的神經元后,更新已有隱含層神經元的輸出權值和期望余差,直至余差接近期望值,便可求得符合要求的最小隱含層神經元個數(shù)及各隱含層神經元參數(shù)。

        2.4 實驗結果及分析

        實驗中將相同的樣本分別進入決策樹和概率神經網絡(Probabilistic Neural Network,PNN)分類器中,從識別率和耗時兩方面進行對比,實驗結果如表2所示。從表2中的4組數(shù)據(jù)的平均分類結果來看,采用PNN的分類識別率最低,為90.72%,ELM的識別率最高,平均識別率為93.57%;決策樹分類器的耗時最長,ELM的耗時最短,平均耗時14.95s;綜合識別率和耗時兩方面來看,采用ELM分類器獲得了較好的分類性能。從單組測試數(shù)據(jù)來看,第1組和2組采用決策樹的識別率較高,第3組和第4組采用ELM的識別率較高。

        表2 決策樹、ELM和PNN的分類性能對比

        造成分類結果差異較大的原因主要有以下幾個方面:①EPG信號屬于生物電信號,受外界干擾和受試昆蟲的影響較大,即使是同種波形其幅值、頻率間也會有差異,尤其是對于較復雜的C波,前1 h與后1 h的波形走向都會不同,這就導致了提取的特征值分散,識別時容易誤判;②實驗中采用的分類器算法都屬于有導師學習,如果訓練樣本的選取不夠全面,當訓練樣本與測試樣本差異較大時,就會出現(xiàn)識別率較低的情況。

        3 結束語

        在利用EPG技術進行昆蟲與植物相關研究時,一直以來都是靠人工識別波形,機器識別在EPG波形方面的應用研究相對于心電、腦電等生物電信號要緩慢得多。

        本文對蚜蟲EPG波形的特征提取和分類識別方法進行了研究,組建了融合小波能量、分形維數(shù)和HHT的特征向量,構建了基于ELM的分類器,得到了93.57%的平均識別率。為了說明本文的特征提取和分類識別方法更有效,實驗中對比了不同特征向量和不同分類器的識別性能。實驗結果說明在決策樹分類器下采用分形盒維數(shù)、Hurst指數(shù)、HHT前2層譜質心、第2~3層的低頻小波能量組成的6維特征向量識別效果最好,平均識別率可達91.61%,相比于前期研究(文獻4的平均識別率為91.43%)提高了0.18%;當采用ELM分類器時,四組樣本的平均識別率提高了2.14%;與決策樹和概率神經網絡相比,ELM分類器不僅識別率高且耗時短,具有較好的分類性能。本文的研究將為開發(fā)EPG波形自動識別分析系統(tǒng)奠定理論基礎,促進機器學習在EPG領域的應用。

        猜你喜歡
        分類
        2021年本刊分類總目錄
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        星星的分類
        我給資源分分類
        垃圾分類,你準備好了嗎
        學生天地(2019年32期)2019-08-25 08:55:22
        分類討論求坐標
        數(shù)據(jù)分析中的分類討論
        按需分類
        教你一招:數(shù)的分類
        国产精品一卡二卡三卡| 日本办公室三级在线看| 免费一区二区三区女优视频| 又紧又大又爽精品一区二区| 美丽的熟妇中文字幕| 精品熟女少妇免费久久| 国产精品第一区亚洲精品| 无码人妻久久久一区二区三区| 成人毛片一区二区| 亚洲av日韩aⅴ无码电影| 蜜桃av福利精品小视频| 五月开心婷婷六月综合| 日本50岁丰满熟妇xxxx| 无码精品一区二区三区超碰| 久久人妻精品中文字幕一区二区 | 日韩精品首页在线观看| 丝袜美腿丝袜美腿丝袜美腿丝袜| 国产午夜手机精彩视频| 无码丰满少妇2在线观看| 久久久精品人妻一区二区三区日本| 亚洲激情综合中文字幕| 色综合久久88色综合天天| 国产成人精选在线不卡| 日韩精品高清不卡一区二区三区| 极品尤物人妻堕落沉沦| 国模欢欢炮交啪啪150| 午夜精品一区二区三区无码不卡| 日本一道本加勒比东京热| 噜噜综合亚洲av中文无码| 装睡被陌生人摸出水好爽| 麻豆久久久国内精品| 日韩一区二区三区久久精品| 天堂а√在线最新版中文在线| 国产又黄又爽视频| 国产三级一区二区三区在线观看| av天堂午夜精品一区| 成熟丰满熟妇高潮xxxxx| 国产一级做a爱视频在线| 一区二区国产av网站| 久久久久久国产精品无码超碰动画 | 亚洲永久免费中文字幕|