王威松 周慧玲 秦 戈 成思揚(yáng) 汪中明 崔 淼
(北京郵電大學(xué)自動(dòng)化學(xué)院1,北京 100876) (國(guó)家糧食和物資儲(chǔ)備局科學(xué)研究院2,北京 100037)
在長(zhǎng)時(shí)間、大容量的原糧存儲(chǔ)過(guò)程中,及時(shí)準(zhǔn)確地監(jiān)測(cè)糧倉(cāng)內(nèi)早期害蟲(chóng)的發(fā)生情況,是對(duì)儲(chǔ)糧蟲(chóng)害進(jìn)行綜合治理、控制其發(fā)生和發(fā)展的主要依據(jù)。在糧倉(cāng)內(nèi),蛀蝕性害蟲(chóng)主要有象甲科(米象、玉米象)和長(zhǎng)蠹科(谷蠹),粉食性害蟲(chóng)主要有扁谷盜科(長(zhǎng)角扁谷盜、土耳其扁谷盜、銹赤扁谷盜)、擬步甲科(赤擬谷盜、雜擬谷盜)和鋸谷盜科(鋸谷盜)。這兩大類(lèi)害蟲(chóng)一般在糧堆中同時(shí)存在,它們數(shù)量的快速增長(zhǎng)對(duì)糧食的數(shù)量和質(zhì)量會(huì)造成很大的危害。
近年來(lái),對(duì)糧堆內(nèi)部害蟲(chóng)發(fā)生的監(jiān)測(cè)已經(jīng)逐漸引入了電子化的手段,例如利用介質(zhì)電導(dǎo)率、氣味、聲音和紅外光信號(hào)等信息作為判別害蟲(chóng)的測(cè)量手段。其中電子探管,是基于探管式誘捕器[3]和紅外光電傳感器設(shè)計(jì)的一種監(jiān)測(cè)裝置,因其價(jià)格經(jīng)濟(jì),既能夠監(jiān)測(cè)糧堆內(nèi)部不同深度的害蟲(chóng)發(fā)生情況,又能夠估計(jì)害蟲(chóng)密度[1, 2],具有廣泛的應(yīng)用前景。最先提出且具有代表性意義的電子探管是Litzkow等[4]的電子糧食探管害蟲(chóng)計(jì)數(shù)器 (Electronic Grain Probe Insect Counter, EGPIC),它通過(guò)一對(duì)紅外光電發(fā)射和接受二極管監(jiān)測(cè)通過(guò)其中的害蟲(chóng)。當(dāng)害蟲(chóng)穿過(guò)時(shí)會(huì)對(duì)光束產(chǎn)生遮擋,電路將遮擋程度轉(zhuǎn)換成對(duì)應(yīng)的電信號(hào),以遮擋程度是否超過(guò)預(yù)設(shè)閾值為特征來(lái)實(shí)現(xiàn)對(duì)害蟲(chóng)的計(jì)數(shù)。Shuman等[5]對(duì)EGPIC進(jìn)行了改進(jìn),用同一層面相互垂直的兩對(duì)二極管最大遮擋程度的和方根為特征,一定程度上降低了害蟲(chóng)下落姿態(tài)對(duì)計(jì)數(shù)準(zhǔn)確率的影響,并實(shí)現(xiàn)了對(duì)米象和銹赤扁谷盜做二分類(lèi)的功能[6],加拿大OPI Systems公司于2003年將其注冊(cè)為了商業(yè)化產(chǎn)品Insector[7],但目前未在我國(guó)看到有銷(xiāo)售和應(yīng)用。Toews等[8]將探管式誘捕器對(duì)銹赤扁谷盜的捕獲進(jìn)行了詳細(xì)的對(duì)比實(shí)驗(yàn),驗(yàn)證了探管直徑在26~60 mm范圍內(nèi)不影響害蟲(chóng)的捕獲效果,15 cm長(zhǎng)的捕蟲(chóng)段內(nèi)的孔密度在40~120個(gè)范圍內(nèi)對(duì)害蟲(chóng)的捕獲效果是一樣的。國(guó)內(nèi)熊鶴鳴等[9]將探管式陷阱誘捕法同扦插取樣法進(jìn)行了對(duì)比,發(fā)現(xiàn)探管式誘捕器比取樣器更能準(zhǔn)確地監(jiān)測(cè)害蟲(chóng)種群的數(shù)量變化。上述研究為本研究裝置的設(shè)計(jì)和實(shí)現(xiàn)提供了可靠的經(jīng)驗(yàn)。但是對(duì)Insector相關(guān)的公開(kāi)文獻(xiàn)[10]進(jìn)行分析,電子探管雖然對(duì)捕獲的害蟲(chóng)實(shí)現(xiàn)了較高準(zhǔn)確率的計(jì)數(shù),但對(duì)害蟲(chóng)的分類(lèi)識(shí)別僅關(guān)注了對(duì)害蟲(chóng)體長(zhǎng)信息的粗糙提取[11],并沒(méi)有充分利用害蟲(chóng)下落時(shí)整個(gè)遮擋過(guò)程對(duì)應(yīng)的電信號(hào),即整個(gè)紅外光電序列,且對(duì)電子探管獲得的紅外光電序列數(shù)據(jù)的分布穩(wěn)定性沒(méi)有公開(kāi)的論述。我們認(rèn)為只有在確定了數(shù)據(jù)分布的穩(wěn)定性后,后續(xù)的分類(lèi)算法工作才有意義。
圖1 儲(chǔ)糧害蟲(chóng)誘捕在線監(jiān)測(cè)裝置
本研究基于探管式誘捕器,結(jié)合紅外光電傳感技術(shù),主要做了以下工作:
a)研發(fā)了儲(chǔ)糧害蟲(chóng)誘捕在線監(jiān)測(cè)裝置(下文簡(jiǎn)稱(chēng)裝置),可采集完整的紅外光電序列,并基于該裝置建立了蛀蝕性害蟲(chóng)(米象、玉米象、谷蠹)和粉食性害蟲(chóng)(長(zhǎng)角扁谷盜、土耳其扁谷盜、銹赤扁谷盜、赤擬谷盜、雜擬谷盜、鋸谷盜)的紅外光電序列數(shù)據(jù)集;
b)基于數(shù)據(jù)統(tǒng)計(jì)和數(shù)據(jù)可視化的方法驗(yàn)證了害蟲(chóng)進(jìn)入誘捕段的位置(下文簡(jiǎn)稱(chēng)初始高度)不影響紅外光電序列數(shù)據(jù)分布的穩(wěn)定性,不同害蟲(chóng)樣本之間的多樣性也不會(huì)破壞紅外光電序列數(shù)據(jù)分布的穩(wěn)定性;
c)利用整個(gè)紅外光電序列,基于高斯核支持向量機(jī)模型,給出了蛀蝕性害蟲(chóng)和粉食性害蟲(chóng)的二分類(lèi)結(jié)果,以及這兩大類(lèi)害蟲(chóng)中不同種害蟲(chóng)的細(xì)分結(jié)果。
本研究設(shè)計(jì)的裝置原型及其示意圖如圖1a和圖1b所示。它主要由5部分組成:誘捕模塊、收集漏斗、監(jiān)測(cè)及釋放模塊、數(shù)據(jù)采集電路板和數(shù)據(jù)傳輸電路板。監(jiān)測(cè)電路的關(guān)鍵部件參數(shù)如表1所示。
1)誘捕模塊:基于探管式誘捕器設(shè)計(jì),用于對(duì)儲(chǔ)糧害蟲(chóng)的誘捕。探管的高度可以通過(guò)增減該模塊的個(gè)數(shù)而改變。本研究用可改變高度的紙盒替代誘捕模塊,以模擬儲(chǔ)糧害蟲(chóng)從不同初始高度進(jìn)入裝置的情況。
2)收集漏斗:儲(chǔ)糧害蟲(chóng)從誘捕模塊進(jìn)入后往下掉落,收集漏斗約束掉落過(guò)程中害蟲(chóng)的運(yùn)動(dòng)軌跡,使得害蟲(chóng)能夠進(jìn)入紅外光電傳感器的監(jiān)測(cè)范圍。
3)監(jiān)測(cè)及釋放模塊:由紅外光電傳感器和害蟲(chóng)釋放出口組成。紅外光電傳感器采用對(duì)射型紅外光電二極管。釋放孔用于將采集完數(shù)據(jù)的害蟲(chóng)釋放,在一定程度上保證了糧堆內(nèi)部害蟲(chóng)的分布不被破壞。
4)數(shù)據(jù)采集板:用于對(duì)紅外光電傳感器數(shù)據(jù)的采集控制,主要由運(yùn)算放大器、微控制器片上定時(shí)器和片上模數(shù)轉(zhuǎn)換器完成。
5)數(shù)據(jù)傳輸板:用于將數(shù)據(jù)采集板采集到的數(shù)據(jù)通過(guò)串口傳輸至PC端并保存,以進(jìn)行數(shù)據(jù)分析和建模。
一個(gè)完整的數(shù)據(jù)采集過(guò)程描述如下:儲(chǔ)糧害蟲(chóng)從誘捕模塊進(jìn)入裝置,跌落至收集漏斗后沿收集漏斗往下滑落,在下落至監(jiān)測(cè)及釋放模塊處開(kāi)始遮擋傳感器的光束,傳感器在不同面積的遮擋下將產(chǎn)生不同的光電流信號(hào),數(shù)據(jù)采集板將光電流信號(hào)轉(zhuǎn)化為離散的電壓信號(hào)并放大,最后數(shù)據(jù)傳輸板將數(shù)據(jù)采集期間的所有電壓信號(hào)上傳至PC端,儲(chǔ)糧害蟲(chóng)從釋放孔逃走。
表1 監(jiān)測(cè)電路的關(guān)鍵部件參數(shù)
2.1.1 紅外光電序列
為模擬害蟲(chóng)進(jìn)入誘捕段的自然掉落,將儲(chǔ)糧害蟲(chóng)無(wú)初始速度地釋放進(jìn)裝置中。將裝置做遮光處理,以模擬糧堆內(nèi)部的黑暗環(huán)境,完成數(shù)據(jù)采集過(guò)程,數(shù)據(jù)采集示意圖如圖2所示。當(dāng)沒(méi)有害蟲(chóng)掉落時(shí),電路采集到的電壓值在基準(zhǔn)電壓0.94 V上下波動(dòng),且不超過(guò)閾值1.03 V。原型裝置采用了互相垂直的兩組傳感器,如圖2a中的傳感器1和傳感器2,當(dāng)有害蟲(chóng)掉落時(shí),電壓值將發(fā)生突變,產(chǎn)生一個(gè)凸起的波形,所以一個(gè)害蟲(chóng)樣本對(duì)應(yīng)兩個(gè)波形,分別對(duì)應(yīng)圖2b中的藍(lán)色波形和紅色波形。將一個(gè)害蟲(chóng)樣本對(duì)應(yīng)的兩個(gè)波形記為一個(gè)紅外光電序列,將任意一組傳感器的波形記為該紅外光電序列的一個(gè)通道,即裝置采集到的紅外光電序列有兩個(gè)通道。
圖2 數(shù)據(jù)采集示意圖
為深入理解紅外光電序列,將一個(gè)害蟲(chóng)樣本的數(shù)據(jù)采集過(guò)程分為兩步進(jìn)行描述:第一步從害蟲(chóng)剛進(jìn)入紅外光電傳感器的光束范圍開(kāi)始到害蟲(chóng)在光束內(nèi)的遮擋程度最大為止,對(duì)應(yīng)波形的上升部分,即t0到t1時(shí)刻,如圖2c所示;第二步從害蟲(chóng)在光束內(nèi)的遮擋程度最大開(kāi)始到害蟲(chóng)完全離開(kāi)光束范圍為止,對(duì)應(yīng)波形的下降部分,即t1到t2時(shí)刻。記t2-t0為該害蟲(chóng)樣本的采樣時(shí)長(zhǎng),若裝置的采樣頻率為fsample,則該害蟲(chóng)樣本的紅外光電序列數(shù)據(jù)的長(zhǎng)度(采樣點(diǎn)數(shù))為(t2-t0)×fsample。其中t0時(shí)刻為紅外光電序列任一通道最先超過(guò)閾值1.03 V的時(shí)刻,t2時(shí)刻為紅外光電序列任一通道最晚低于該閾值的時(shí)刻。
2.1.2 數(shù)據(jù)集的建立
本研究的試蟲(chóng)來(lái)源于國(guó)家糧食和物資儲(chǔ)備局科學(xué)研究院儲(chǔ)藏所,均為成蟲(chóng)活蟲(chóng),在實(shí)驗(yàn)期間養(yǎng)于實(shí)驗(yàn)室室溫條件(溫度22~25 ℃、相對(duì)濕度40%~50%),培養(yǎng)飼料均為小麥。設(shè)置10 kHz的采樣頻率,對(duì)9種害蟲(chóng)在不同初始高度下進(jìn)行紅外光電序列數(shù)據(jù)的采集。建立的儲(chǔ)糧害蟲(chóng)的訓(xùn)練集和測(cè)試集的紅外光電序列數(shù)量如表2所示。為避免分類(lèi)器過(guò)擬合,均分不同種別的數(shù)據(jù)數(shù)量以保證不同小類(lèi)的數(shù)據(jù)數(shù)量相同。其中:*3是指在三種不同的初始高度(50、100、150 mm)下進(jìn)行的數(shù)據(jù)采集,被乘因子108為在各初始高度下采集的樣本數(shù)量,訓(xùn)練集與測(cè)試集為三種初始高度下數(shù)據(jù)的均勻混合。
表2 訓(xùn)練集和測(cè)試集的紅外光電序列數(shù)量
注:圖a檢測(cè)到兩條數(shù)據(jù)90次(未發(fā)生抱團(tuán));圖b檢測(cè)到一條數(shù)據(jù)10次(發(fā)生抱團(tuán))。圖3 兩頭長(zhǎng)角扁谷盜害蟲(chóng)在同一高度同時(shí)進(jìn)入裝置的實(shí)驗(yàn)測(cè)試結(jié)果圖
本研究提出的方法是用于對(duì)害蟲(chóng)的早期發(fā)生進(jìn)行監(jiān)測(cè),蟲(chóng)口密度較低。但我們對(duì)兩頭害蟲(chóng)同時(shí)進(jìn)入裝置的低概率情況也做了模擬測(cè)試。將兩頭長(zhǎng)角扁谷盜在同一高度無(wú)初始速度地同時(shí)釋放進(jìn)裝置,在100次實(shí)驗(yàn)中,兩頭害蟲(chóng)抱團(tuán)進(jìn)入傳感器監(jiān)測(cè)范圍而得到一條數(shù)據(jù)的情況只出現(xiàn)了10次,圖3展示了模擬測(cè)試結(jié)果。所以本研究只對(duì)單頭害蟲(chóng)逐一進(jìn)入裝置的情況進(jìn)行了研究。
只有在確定了紅外光電序列數(shù)據(jù)對(duì)初始高度的魯棒性,以及對(duì)樣本多樣性的魯棒性,才能進(jìn)行后續(xù)的分類(lèi)工作。
害蟲(chóng)種別是害蟲(chóng)采樣時(shí)長(zhǎng)的影響因子,體積越小采樣時(shí)長(zhǎng)越短。若不同的初始高度能導(dǎo)致害蟲(chóng)樣本的采樣時(shí)長(zhǎng)具有很大的差異,即害蟲(chóng)樣本的采樣時(shí)長(zhǎng)是初始高度的函數(shù)(如初始高度越高采樣時(shí)長(zhǎng)越短),那么低初始高度的小體積害蟲(chóng)和高初始高度的大體積害蟲(chóng)將可能具有相同的采樣時(shí)長(zhǎng),而在不同初始高度的同體積害蟲(chóng)卻可能具有不同的采樣時(shí)長(zhǎng),這將會(huì)導(dǎo)致數(shù)據(jù)分布的不穩(wěn)定。另外,若紅外光電序列的分布不受初始高度影響,但受同種害蟲(chóng)不同樣本多樣性(下落姿態(tài)、個(gè)體差異等)的影響,那么數(shù)據(jù)分布依然會(huì)是不穩(wěn)定的。
2.2.1 對(duì)初始高度的魯棒性分析
害蟲(chóng)的下落過(guò)程大致包括自由落體、與收集漏斗的碰撞、在收集漏斗上的滑落和在監(jiān)測(cè)及釋放模塊中的自由落體,整個(gè)運(yùn)動(dòng)過(guò)程十分復(fù)雜,所以本研究通過(guò)數(shù)據(jù)統(tǒng)計(jì)的方法進(jìn)行了分析,而不對(duì)整個(gè)運(yùn)動(dòng)過(guò)程進(jìn)行建模??紤]到任意一種害蟲(chóng)在紅外光電序列數(shù)據(jù)對(duì)初始高度的魯棒性的問(wèn)題上均具有代表性,本研究以谷蠹為例進(jìn)行了分析。基于谷蠹的紅外光電序列數(shù)據(jù),通過(guò)數(shù)據(jù)統(tǒng)計(jì)的方法得到谷蠹在不同初始高度下的采樣時(shí)長(zhǎng)的箱線圖,如圖4所示。通過(guò)分析發(fā)現(xiàn),谷蠹在50、100、150、200 mm的初始高度下,箱線圖的中心和散布均沒(méi)有明顯差異。將不同初始高度谷蠹的紅外光電序列數(shù)據(jù)數(shù)量、采樣時(shí)長(zhǎng)與初始高度的方差分析結(jié)果列于表3,計(jì)算方法如式(1)~式(5)所示。不同初始高度下各樣本采樣時(shí)長(zhǎng)的均值為
(1)
式中:i代表不同初始高度,j代表不同樣本,xij為不同初始高度下不同樣本的采樣時(shí)長(zhǎng),Mi為各初始高度下的樣本數(shù)量,式(2)、式(3)中符號(hào)含義均同式(1)。所有初始高度下各樣本采樣時(shí)長(zhǎng)的均值為
(2)
式中:n為全部樣本數(shù)量,k為初始高度種類(lèi),式(3)、式(4)中符號(hào)含義均同式(2)。處理均方為
(3)
誤差均方為
(4)
F檢驗(yàn)統(tǒng)計(jì)量為
(5)
查F檢驗(yàn)臨界值表,N1=k-1=3,N2=n-k=428時(shí),F(xiàn)0.05=2.626,F(xiàn)0.01=3.828,而谷蠹在4種不同初始高度之間F值為1.204 9,F(xiàn) 圖4 谷蠹在不同初始高度下的采樣時(shí)長(zhǎng)的箱線圖 表3 谷蠹的紅外光電序列數(shù)據(jù)數(shù)量、及采樣時(shí)長(zhǎng)與初始高度的方差分析結(jié)果 2.2.2 對(duì)樣本多樣性的魯棒性分析 基于紅外光電序列訓(xùn)練和測(cè)試數(shù)據(jù)集,對(duì)每一種別害蟲(chóng)均隨機(jī)采樣108個(gè)樣本,將紅外光電序列不同通道的離散數(shù)據(jù)的和方根連接成線條,進(jìn)行數(shù)據(jù)可視化,如圖5所示。線條重疊次數(shù)越多的地方顏色越深,而只有一根線條的地方顏色最淺,我們通過(guò)顏色的深淺分布來(lái)判斷紅外光電序列數(shù)據(jù)分布的穩(wěn)定性。每種害蟲(chóng)都有且只有一個(gè)顏色最深的區(qū)域帶,即同一種害蟲(chóng)的樣本數(shù)據(jù)均集中在同一個(gè)分布內(nèi),說(shuō)明紅外光電序列數(shù)據(jù)的分布對(duì)樣本多樣性具有魯棒性。 圖5 紅外光電序列數(shù)據(jù)集可視化 害蟲(chóng)進(jìn)入裝置的初始高度和樣本多樣性均不影響裝置采集到的數(shù)據(jù)的分布,即紅外光電序列數(shù)據(jù)的分布具有一定的穩(wěn)定性,可以利用整個(gè)紅外光電序列做分類(lèi)研究。 本研究采用將各通道同一時(shí)刻的電壓值做和方根的方式進(jìn)行數(shù)據(jù)預(yù)處理,采用高斯核的支持向量機(jī)[12]對(duì)經(jīng)過(guò)預(yù)處理后的紅外光電序列訓(xùn)練數(shù)據(jù)集進(jìn)行建模,通過(guò)基于10折交叉驗(yàn)證的網(wǎng)格搜索的方式進(jìn)行參數(shù)尋優(yōu),待求解到最優(yōu)參數(shù)后,用該參數(shù)和訓(xùn)練數(shù)據(jù)集全體重新求解得到最優(yōu)分類(lèi)器,最后用該分類(lèi)器在測(cè)試數(shù)據(jù)集上進(jìn)行性能評(píng)估,其中準(zhǔn)確率、召回率、F1值及其加權(quán)平均分別為 (6) (7) (8) (9) 式中:wi為類(lèi)別i的樣本數(shù)在測(cè)試集中占的比例。蛀蝕性害蟲(chóng)與粉食性害蟲(chóng)的分類(lèi)結(jié)果如表4所示,兩類(lèi)的平均準(zhǔn)確率達(dá)87.7%。召回率、F1值與準(zhǔn)確率相近,說(shuō)明該分類(lèi)結(jié)果沒(méi)有受到樣本均衡問(wèn)題的影響。 表4 蛀蝕性害蟲(chóng)與粉食性害蟲(chóng)分類(lèi)結(jié)果 本研究還進(jìn)一步對(duì)蛀蝕性害蟲(chóng)和粉食性害蟲(chóng)內(nèi)的小類(lèi)進(jìn)行了細(xì)分識(shí)別,其結(jié)果如表5和表6所示。對(duì)于蛀蝕性害蟲(chóng),因?yàn)殚L(zhǎng)蠹科(谷蠹)和象甲科(米象、玉米象)的體長(zhǎng)、體積相近,同時(shí)紅外光電序列數(shù)據(jù)攜帶的形狀信息太過(guò)粗糙,無(wú)法精準(zhǔn)區(qū)分兩者的形狀差異。在粉食性害蟲(chóng)中,扁谷盜科(長(zhǎng)角扁谷盜、土耳其扁谷盜、銹赤扁谷盜)、擬步甲科(赤擬谷盜、雜擬谷盜)和鋸谷盜科(鋸谷盜)這三類(lèi)的紅外光電序列的形狀差異比較明顯,三類(lèi)的平均準(zhǔn)確率為87.7%,對(duì)于數(shù)據(jù)差異最為明顯的擬步甲科(赤擬谷盜、雜擬谷盜)的分類(lèi)準(zhǔn)確率可達(dá)95.3%,這與擬步甲科同另兩類(lèi)害蟲(chóng)的體長(zhǎng)、體積差異最大這一事實(shí)相符。 表5 蛀蝕性害蟲(chóng)細(xì)分結(jié)果 表6 粉食性害蟲(chóng)細(xì)分結(jié)果 本研究提出了一種用于糧堆內(nèi)部的儲(chǔ)糧害蟲(chóng)誘捕在線監(jiān)測(cè)裝置,通過(guò)建立紅外光電序列數(shù)據(jù)集和分析實(shí)驗(yàn)數(shù)據(jù),驗(yàn)證了該裝置具有在線監(jiān)測(cè)害蟲(chóng)的可靠性。同時(shí)提出了充分利用害蟲(chóng)在下落時(shí)對(duì)紅外光電傳感器遮擋的整個(gè)過(guò)程的光電信號(hào)的方法,并基于高斯核支持向量機(jī)模型在測(cè)試集上達(dá)到了87.7%的加權(quán)平均分類(lèi)準(zhǔn)確率。此外,本研究還探索了更精細(xì)化分類(lèi)的可能性,對(duì)于開(kāi)發(fā)實(shí)際可應(yīng)用的探管式儲(chǔ)糧害蟲(chóng)發(fā)生監(jiān)測(cè)設(shè)備具有指導(dǎo)意義。3 實(shí)驗(yàn)
4 結(jié)論