許德剛, 王 露, 李 凡, 郭奕欣, 邢奎杰
(河南工業(yè)大學(xué)糧食信息處理與控制教育部重點(diǎn)實(shí)驗(yàn)室1,鄭州 450001)(河南工業(yè)大學(xué)信息科學(xué)與工程學(xué)院2,鄭州 450001)
長期以來,糧食作為人類社會(huì)生存的基本需求,對(duì)維持社會(huì)穩(wěn)定、保障民生和社會(huì)發(fā)展都具有重要作用。我國每年由于糧蟲侵虐造成的損失達(dá)數(shù)百萬t,給國家造成了巨大的損失[1]。儲(chǔ)糧害蟲不僅會(huì)造成糧食品質(zhì)和數(shù)量下降,而且蟲害的排泄物和尸體還會(huì)造成疾病傳播[2]。因此,糧蟲檢測與識(shí)別是儲(chǔ)糧安全的重要一部分,在糧食儲(chǔ)糧過程中定期檢測糧食谷物是否有儲(chǔ)糧害蟲存在至關(guān)重要。隨著技術(shù)的進(jìn)步,糧蟲檢測方法從傳統(tǒng)的直觀檢測法、取樣法、誘捕法、逐步發(fā)展到聲測法[3]、圖像識(shí)別法、近紅外光譜法[4]、X-ray射線法[5]、生物光子法和深度學(xué)習(xí)目標(biāo)檢測法等。傳統(tǒng)的圖像識(shí)別法通過提取糧蟲的邊緣、形狀、紋理等圖像特征,再將這些特征拼接為特征向量,最后利用機(jī)器學(xué)習(xí)算法對(duì)特征向量進(jìn)行分類,識(shí)別糧蟲種類?;谏疃葘W(xué)習(xí)的目標(biāo)檢測方法避免了手工設(shè)計(jì)糧蟲特征的煩瑣步驟,可以自動(dòng)學(xué)習(xí)和泛化大量圖像數(shù)據(jù)的特征,對(duì)糧蟲的特征向量進(jìn)行分類,快速識(shí)別不同糧蟲種類。
近年來,目標(biāo)檢測技術(shù)在科學(xué)研究和計(jì)算機(jī)視覺領(lǐng)域都受到了廣泛的關(guān)注。經(jīng)典的目標(biāo)檢測算法有基于候選區(qū)域的雙階段算法和基于回歸的單階段算法。具體來說,雙階段算法在第一階段主要生成區(qū)域建議;第二階段主要用于分類和回歸區(qū)域建議以獲得更準(zhǔn)確的目標(biāo)位置,以Faster-RCNN[6]和R-FCN[7]為代表,特點(diǎn)是識(shí)別精度高、速度較慢、訓(xùn)練過程困難。單階段算法將目標(biāo)檢測視為一個(gè)回歸或分類問題,采用統(tǒng)一的框架直接實(shí)現(xiàn)分類和定位,以SSD[8](Single Shot Multibox Detector)和YOLO(You Only Look Once)[9]為代表,特點(diǎn)是檢測速度快,但精度相對(duì)較差。本研究將糧蟲檢測作為目標(biāo)檢測的背景,要準(zhǔn)確識(shí)別糧蟲的種類,并對(duì)糧蟲進(jìn)行定位。
為了提升糧蟲檢測效果,基于經(jīng)典的雙階段Faster RCNN算法,針對(duì)糧倉內(nèi)赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5種最主要的甲蟲類儲(chǔ)糧害蟲分別制作了白板背景和實(shí)際儲(chǔ)糧背景兩個(gè)糧蟲數(shù)據(jù)集,在特征圖后引入一個(gè)金字塔池化模塊以融合全局特征信息,采用改進(jìn)的Focal Loss損失函數(shù)代替交叉熵?fù)p失函數(shù),以解決糧蟲分類過程中樣本不平衡問題,實(shí)現(xiàn)糧蟲檢測效果的有效提升。
Faster RCNN算法在2015年提出,在RCNN[10]和Fast RCNN[11]基礎(chǔ)上擴(kuò)展而來,引入了區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network,RPN)取代選擇性搜索算法,RPN將區(qū)域建議提取集成到深度卷積神經(jīng)網(wǎng)絡(luò),在每個(gè)位置同時(shí)預(yù)測目標(biāo)邊界框和類別置信度分?jǐn)?shù),加快了網(wǎng)絡(luò)的計(jì)算速度。Faster R-CNN采用VGG-16作為骨干網(wǎng)絡(luò),由卷積層、RPN網(wǎng)絡(luò)、RoI Pooling層[12]、分類和回歸層等4部分組成。
Faster RCNN方法的檢測流程分為兩個(gè)階段:生成候選區(qū)域,詳細(xì)地搜索圖像中所有可能是目標(biāo)的位置,并為可能是目標(biāo)的位置產(chǎn)生大量的邊界框,帶有邊界框的感興趣區(qū)域稱為區(qū)域建議;對(duì)候選區(qū)域進(jìn)行分類和回歸,得到區(qū)域建議后,通過一些技術(shù)來判斷它是屬于目標(biāo)類還是背景類。區(qū)域建議網(wǎng)絡(luò)用于選出并刪除目標(biāo)存在概率非常小的區(qū)域,從而加快了整個(gè)目標(biāo)檢測系統(tǒng)的速度。
根據(jù)Faster RCNN算法的原理,針對(duì)糧蟲目標(biāo)體積小、姿態(tài)多變、糧蟲與糧粒相互遮擋且容易混淆等特點(diǎn),通過引入金字塔池化模塊(Pyramid Pooling Module,PPM)[13]來融合全局信息,采用Focal Loss損失函數(shù)作為分類損失解決數(shù)據(jù)不平衡問題,以提升糧蟲目標(biāo)的檢測效果。
在目標(biāo)檢測領(lǐng)域,上下文信息起著重要作用。在檢測特征不足的目標(biāo)時(shí),上下文信息可以了解目標(biāo)及其周圍環(huán)境之間的關(guān)聯(lián),提高檢測器了解場景的能力,有效地幫助提高檢測性能。糧蟲目標(biāo)檢測中的上下文信息是糧蟲目標(biāo)的語義信息,主要分為局部上下文和全局上下文。全局上下文信息可以提供圖像級(jí)別或者場景級(jí)別的上下文信息,局部上下文信息可以提升目標(biāo)被檢測的可能性。
深度卷積神經(jīng)網(wǎng)絡(luò)為了獲得較大感受野的特征表達(dá),需要進(jìn)行多次下采樣,在最后一個(gè)卷積層的特征圖可以獲得目標(biāo)類別和豐富的語義信息。但是多次下采樣會(huì)導(dǎo)致信息丟失,本文提出采用PSPNet[14]的金字塔池化模塊(PPM)來解決此問題,該模塊通過將最終特征圖和4個(gè)不同金字塔比例尺的特征進(jìn)行級(jí)聯(lián)來獲得更加豐富的多尺度上下文信息。金字塔池化模塊如圖1所示,通過融合不同區(qū)域的上下文信息在不同尺度下保留全局信息,有效地獲取全局語境信息。
本研究采用在特征圖后增加一個(gè)金字塔池化模塊PPM來解決卷積神經(jīng)網(wǎng)絡(luò)在多次下采樣時(shí)造成得信息丟失,以有效融合全局上下文信息,以提升檢測性能。金字塔池化結(jié)構(gòu)如圖1中的c部分。PPM通過不同金字塔尺寸的自適應(yīng)平均池化(GAP)處理卷積神經(jīng)網(wǎng)絡(luò)得到特征圖,如圖1中b部分,PPM包含1個(gè)直接連接和4個(gè)分支,每個(gè)分支分別由1個(gè)池化層,1個(gè)卷積層和1個(gè)反卷積層組成。不同分支在池化層和卷積層中具有不同大小的內(nèi)核,同時(shí)生成不同大小的感受野。PPM融合了4種不同金字塔尺度下的特征,4個(gè)分支的內(nèi)核大小分別設(shè)置為1、2、4、6,POOL表示采用1×1、2×2、4×4和6×6 4種不同尺寸的池化操作得到多個(gè)尺寸的特征圖,其中較大內(nèi)核的分支可以獲得更多的全局特征,反之,內(nèi)核較小的分支獲取更多的局部特征,并對(duì)這些尺寸的特征圖再次進(jìn)行“1×1的Conv”來減少通道路。金字塔池化模塊的輸入和所有分支的輸入通過級(jí)聯(lián)輸入到下一層,使用雙線性插值[15]填充上采樣得到原來的尺寸,將不同級(jí)別的特征圖拼接得到最終的金字塔池化全局特征。因此,全局和局部特征的融合可以生成準(zhǔn)確的像素級(jí)預(yù)測。同時(shí),不同的內(nèi)核大小能夠提升模型檢測不同尺度目標(biāo)的能力。
圖1 金字塔池化模塊結(jié)構(gòu)圖
Faster RCNN算法的損失函數(shù)設(shè)計(jì)過程中沒有考慮到訓(xùn)練數(shù)據(jù)集樣本不均衡的問題,可能導(dǎo)致算法對(duì)不同類別糧蟲的檢測效果相差較大,為了提高算法的檢測準(zhǔn)確率,從樣本分布均衡的角度出發(fā),基于Focal loss損失函數(shù)的思想對(duì)算法進(jìn)行改進(jìn),以提升算法對(duì)困難樣本和類別較少的樣本的檢測準(zhǔn)確率。
本研究使用Focal Loss解決糧蟲檢測的數(shù)據(jù)不平衡問題。Focal Loss以通過重塑標(biāo)準(zhǔn)交叉熵?fù)p失來解決目標(biāo)檢測任務(wù)中的不平衡問題,其不僅實(shí)現(xiàn)降低簡單樣本的影響,更多地關(guān)注困難樣本,而且基于分類誤差考慮每個(gè)樣本對(duì)損失的影響。除了以上原因,前景和背景的極度不平衡也是影響目標(biāo)檢測算法的一個(gè)重要原因,F(xiàn)ocal Loss還考慮到前景和背景類之間1∶1 000比例的不平衡比例的高訓(xùn)練精度[16],在計(jì)算機(jī)視覺、目標(biāo)檢測領(lǐng)域都獲得了優(yōu)越性能。
2.2.1 Focal Loss損失函數(shù)
由于糧蟲形狀相似,一般情況下,RPN中屬于負(fù)樣本的區(qū)域建議較多。為了解決訓(xùn)練過程中前景和背景類別不平衡的問題(如:1∶1 000),并更好地進(jìn)行分類,用Focal Loss代替RPN中的標(biāo)準(zhǔn)交叉熵(Cross-entropy,Ce)分類損失。
傳統(tǒng)的分類交叉熵?fù)p失函數(shù)如公式所示:
(1)
式中:p是網(wǎng)絡(luò)模型預(yù)測該樣本為正樣本的概率值,p∈[0,1]。其中y∈{±1}是真值類,表示樣本標(biāo)簽,當(dāng)y=+1時(shí)表示正樣本,y=-1時(shí)表示負(fù)樣本。當(dāng)樣本標(biāo)簽為1時(shí),p越接近1,損失越小。
通過對(duì)交叉驗(yàn)證建立的可調(diào)參數(shù)改進(jìn),為便于表示,將p標(biāo)記為pt,目標(biāo)類的概率pt定義為:
(2)
此時(shí),二分類交叉熵?fù)p失函數(shù)Ce可以簡寫為:
Ce(p,y)=Ce(pt)=-log(pt)
(3)
此外為了解決樣本不平衡中的正負(fù)樣本不均衡問題,添加了一個(gè)加權(quán)項(xiàng)α來處理正類和負(fù)類(1-α)的類別不平衡,α的取值范圍為0~1,如下所示:
(4)
在α平衡形式中,調(diào)整后的二分類交叉熵?fù)p失函數(shù)Ce可以寫成:
Ce(pt)=-αtlog(pt)
(5)
這個(gè)公式被認(rèn)為是Ce的一個(gè)簡單擴(kuò)展,其中,α是類概率的倒數(shù),或作為交叉驗(yàn)證修復(fù)的超參數(shù),與正負(fù)樣本數(shù)量呈反比,以減少正負(fù)樣本不均衡對(duì)性能的影響。
由公式可以看出,所有樣本的權(quán)值在標(biāo)準(zhǔn)交叉熵中是一樣的。如果在訓(xùn)練過程中存在前景和背景的類別不平衡,大量的負(fù)樣本的將主導(dǎo)梯度,小量的困難樣本和正樣本將會(huì)被覆蓋,也就難以發(fā)揮作用,使準(zhǔn)確率降低。
用Focal Loss函數(shù)代替交叉熵來解決類不平衡問題,相當(dāng)于為Ce損失函數(shù)的擴(kuò)展。而對(duì)于難易樣本不均衡的問題,為了增加小目標(biāo)的權(quán)重,類似于權(quán)重因子α,通過增加高斯權(quán)重(Gaussian weight)來改進(jìn)Focal Loss。某一類中的樣本數(shù)越少,高斯權(quán)重就越大,模型就越會(huì)引起注意。 Focal Loss為帶有參數(shù)的交叉熵?fù)p失增加了一個(gè)調(diào)節(jié)因子(1-pt)y。其中y≥0,改進(jìn)的損失函數(shù)表示為:
Lfl(pt)=-αt(1-pt)ylog(pt)
(6)
式(6)既可以調(diào)整正負(fù)樣本不均衡,也可以調(diào)整困難樣本和簡單樣本的不均衡。其中,(1-pt)γ用來調(diào)整困難樣本和簡單樣本的權(quán)重,(1-pt)γ取值范圍為0~1,如果pt值越大,為簡單樣本,則(1-pt)γ值越小,故對(duì)損失函數(shù)的影響更??;如果pt值較小,則為困難樣本,則對(duì)應(yīng)的(1-pt)γ值更大,對(duì)損失函數(shù)影響較大。
(7)
其中αt權(quán)重為了改善正負(fù)樣本不平衡,αt是加權(quán)因子,α和γ是2個(gè)可調(diào)參數(shù),ct是每個(gè)類別的數(shù)量。當(dāng)γ=0時(shí),focalloss等于交叉熵,并且隨著γ增加,α不斷減小。在0~1的范圍內(nèi),α越小,負(fù)樣本(具有較大數(shù)量的類別)的權(quán)重越小。通過增加較少數(shù)量類的權(quán)重,通過高斯部分對(duì)αt進(jìn)行了改進(jìn)。
當(dāng)一個(gè)邊界框被錯(cuò)誤分類時(shí),pt很小,并且(1-pt)γ接近于1,對(duì)分類損失幾乎沒有影響。同樣,當(dāng)分類預(yù)測結(jié)果很好時(shí),即pt接近于1,(1-pt)γ接近于0,這相當(dāng)于減少了簡單樣本的損失。在Lin等[17]的研究中,當(dāng)γ=2和α=0.25時(shí),模型效果最好。在此研究基礎(chǔ)上,應(yīng)用相同的參數(shù)設(shè)置。參數(shù)β和σ控制著每個(gè)類別損失的權(quán)重,確保αt∈[0,1]。
2.2.2 Faster RCNN模型的損失函數(shù)設(shè)計(jì)
Faster RCNN的總損失函數(shù)由分類損失和回歸損失組成。該方法對(duì)一幅圖像的具體損失函數(shù)定義為如式(8)所示。
(8)
其中,回歸損失函數(shù)Lreg的具體表達(dá)式如式(9)所示。
(9)
式(9)中,平滑函數(shù)(smooth function)的定義如式(10)所示。
(10)
式中:x為邊界框的預(yù)測誤差,參數(shù)σ用來控制平滑區(qū)域。對(duì)于邊界框回歸采用式(11)中的4個(gè)參數(shù)坐標(biāo)表達(dá)。
tw=log(w/wa)th=log(h/ha)
(11)
式中:x、y、w和h為方框的中心坐標(biāo)及其寬、高。變量x為預(yù)測框、xa為錨框、x*為真值框,這可以看作從錨框到真值框的邊界框回歸。
2.2.3 改進(jìn)后Faster RCNN模型架構(gòu)
Faster RCNN檢測模型由4個(gè)部分組成:使用VGG-16提取糧蟲圖像特征,得到特征圖;將特征圖輸入RPN得到區(qū)域建議生成;將特征圖和Proposals輸入到RoI Pooling層得到綜合的Proposals特征;根據(jù)Proposals特征預(yù)測目標(biāo)的邊界框和位置,即分類和邊界框回歸。改進(jìn)后Faster RCNN模型架構(gòu)如圖2所示。
圖2 改進(jìn)的Faster RCNN網(wǎng)絡(luò)架構(gòu)圖
基于改進(jìn)的Faster RCNN儲(chǔ)糧害蟲目標(biāo)檢測模型流程包括特征提取、金字塔池化、區(qū)域建議網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)。
2.3.1 特征提取
該模塊利用VGG-16作為特征提取網(wǎng)絡(luò),提取原始圖像的特征圖并與Faster RCNN的RPN共享所有的卷積操作。
2.3.2 金字塔池化模塊PPM
特征圖經(jīng)過PPM模塊得到融合了整體信息的特征,然后,采用雙線性插值對(duì)低維特征圖上采樣,使其與原始特征圖尺度相同。最后,拼接不同層級(jí)的特征圖得到金字塔池化全局特征。
2.3.3 RPN網(wǎng)絡(luò)
RPN通過比較各個(gè)區(qū)域建議的置信度得分和執(zhí)行二值分類任務(wù),判斷每個(gè)建議屬于前景還是背景,并利用錨框回歸得到糧蟲的邊界框。
2.3.4 全連接網(wǎng)絡(luò)
通過RoI池化層獲得特征發(fā)送到全連接網(wǎng)絡(luò)進(jìn)行分類和邊界框回歸計(jì)算。在訓(xùn)練階段,需要計(jì)算預(yù)測值與真實(shí)值之間的所有損失,并進(jìn)行反向梯度傳播優(yōu)化。本文模型通過對(duì)給定圖像進(jìn)行輸入,網(wǎng)絡(luò)轉(zhuǎn)發(fā),得到圖像的分類和回歸預(yù)測框。
糧蟲數(shù)據(jù)集是目標(biāo)檢測研究的基礎(chǔ),在目標(biāo)檢測任務(wù)中扮演著十分重要的角色。在進(jìn)行糧蟲目標(biāo)檢測任務(wù)時(shí),需要適用性強(qiáng)的數(shù)據(jù)集來有效測試和評(píng)估本文算法的性能。由于該領(lǐng)域目前沒有公開的糧蟲數(shù)據(jù)集,所以本文采用人工采集的方法來制作數(shù)據(jù)集。
儲(chǔ)糧害蟲分為昆蟲和螨類兩類,昆蟲類又分為甲蟲類和蛾類兩種,其中甲蟲類對(duì)糧食谷物的破壞性最強(qiáng),所以本文以甲蟲類儲(chǔ)糧害蟲為研究對(duì)象,選取了赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5 種最主要的甲蟲類儲(chǔ)糧害蟲。拍攝白板背景下圖像時(shí),用鑷子將昆蟲夾出放置實(shí)驗(yàn)平臺(tái)的白紙上,將手機(jī)固定,垂直平臺(tái)進(jìn)行拍攝,選取了赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5 類害蟲,數(shù)據(jù)集名稱為WBGP,如圖3所示;拍攝實(shí)際儲(chǔ)糧背景的糧蟲圖像時(shí)以小麥和大米為背景鋪滿實(shí)驗(yàn)平臺(tái),固定手機(jī),垂直平臺(tái)進(jìn)行拍攝,選取了赤擬谷盜、米象和鋸谷盜3類害蟲,數(shù)據(jù)集名稱為RBGP,如圖4所示。每張圖像的糧蟲數(shù)量為4~10只,白板背景下原始圖像樣本共計(jì)2 601張,實(shí)際背景下原始圖像共計(jì)1317張,昆蟲圖像統(tǒng)一 resize 成了640×480大小。
圖3 白板背景數(shù)據(jù)集WBGP的糧蟲圖像
圖4 實(shí)際儲(chǔ)糧背景數(shù)據(jù)集RBGP的糧蟲圖像
在深度學(xué)習(xí)中,為了增強(qiáng)模型的穩(wěn)定性,提取圖像特征,防止模型過擬合,需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練以提高模型的魯棒性。本文對(duì)圖像進(jìn)行幾何變換、調(diào)節(jié)亮度、添加高斯噪聲等一系列增強(qiáng)操作來豐富糧蟲數(shù)據(jù),幾何變換包括圖像翻轉(zhuǎn)和旋轉(zhuǎn)兩種方法,采用了90°、180°和270°對(duì)圖像進(jìn)行旋轉(zhuǎn)。白板背景下原始圖像數(shù)據(jù)2 601張?jiān)鰪?qiáng)至3 734張,白板背景下數(shù)據(jù)增強(qiáng)前后糧蟲圖像數(shù)量如表1所示,儲(chǔ)糧背景下原始圖像數(shù)據(jù)1 317張?jiān)鰪?qiáng)至2 074張,儲(chǔ)糧背景數(shù)據(jù)增強(qiáng)前后糧蟲圖像數(shù)量如表2所示,平均每種糧蟲圖像700張,每幅圖像上糧蟲4~10只。最后,按照7∶1∶2的比例[18]構(gòu)建訓(xùn)練集、驗(yàn)證集和測試集。
表1 白板背景數(shù)據(jù)集WBGP的糧蟲圖像數(shù)量
表2 實(shí)際儲(chǔ)糧背景數(shù)據(jù)集RBGP的糧蟲圖像數(shù)量
本研究采用精確度(P)、召回率(R)、平均精確度(AP)和平均精確度均值(mAP)[19]和來評(píng)估目標(biāo)檢測模型的性能。目標(biāo)檢測模型的分類和定位能力是其最主要的性能體現(xiàn),而mAP值是其最直觀的表達(dá)方式,mAP值越大,表明該模型的精度越高。其中, mAP的計(jì)算公式為,Q代表目標(biāo)類別數(shù):
(12)
本實(shí)驗(yàn)根據(jù)PyTorch的運(yùn)行環(huán)境要求在計(jì)算機(jī)進(jìn)行環(huán)境的搭建,參數(shù)如表3所示。
表3 實(shí)驗(yàn)環(huán)境配置參數(shù)
選用的GPU最大分辨率為7 680×4 320,能夠處理大量圖像數(shù)據(jù),加快網(wǎng)絡(luò)模型的訓(xùn)練速度,從而提高圖像處理速度和模型訓(xùn)練效率。
算法實(shí)驗(yàn)過程中用糧蟲相對(duì)應(yīng)的拼音縮寫表示糧蟲的種類,其中“chini”表示赤擬谷盜,“mixing”表示米象,“jugudao”表示鋸谷盜,“yancojia”表示煙草甲,“xiuchi”表示銹赤扁谷盜。
Faster RCNN算法在白板背景數(shù)據(jù)集的檢測結(jié)果對(duì)比如圖5所示,圖5a是Faster RCNN算法的檢測效果,圖5b是Faster RCNN算法改進(jìn)后的檢測效果。
圖5 白板背景數(shù)據(jù)集Faster RCNN算法改進(jìn)前后檢測效果對(duì)比圖
圖6是實(shí)際儲(chǔ)糧背景數(shù)據(jù)集中Faster RCNN算法改進(jìn)前后對(duì)3種糧蟲的檢測結(jié)果對(duì)比,其中圖6a是Faster RCNN算法的檢測效果圖,圖6b是Faster RCNN算法改進(jìn)后的檢測效果圖。對(duì)比Faster RCNN算法改進(jìn)前后的檢測結(jié)果可以發(fā)現(xiàn),圖像中每只糧蟲被檢測的概率值都有了明顯的提升,改進(jìn)后Faster RCNN算法的精度有了一定提高,同時(shí)避免了一些漏檢。
圖6 儲(chǔ)糧背景數(shù)據(jù)集的Faster RCNN算法改進(jìn)前后檢測效果對(duì)比圖
SSD作為深度學(xué)習(xí)中的典型單階段目標(biāo)檢測算法,具有精度高、速度快的特點(diǎn)。本實(shí)驗(yàn)針對(duì)2.1和2.2中的優(yōu)化方案,對(duì)比SSD算法與改進(jìn)前后Faster RCNN算法在白板背景數(shù)據(jù)集的糧蟲檢測實(shí)驗(yàn)結(jié)果,如表4所示,在實(shí)際儲(chǔ)糧背景數(shù)據(jù)集的糧蟲檢測對(duì)比實(shí)驗(yàn)結(jié)果如表5所示。
白板背景數(shù)據(jù)集一共有五類糧蟲目標(biāo),分別是銹赤扁谷盜、米象、鋸谷盜、煙草甲、銹赤扁谷盜。從表4可以看出,不同種類糧蟲的檢測效果存在差異,在白板背景下SSD算法對(duì)糧蟲小目標(biāo)的檢測效果不佳,每類糧蟲的mAP值都低于改進(jìn)前后的Faster RCNN算法,使用改進(jìn)的Faster RCNN算法后整個(gè)數(shù)據(jù)集的mAP從88.52%提升到了89.42%,上升了0.90%,其中赤擬谷盜的mAP從87.46%提升到了89.73%,上升了2.27%,提升效果最好,該算法對(duì)糧蟲小目標(biāo)的檢測能力有一定的改善。通過對(duì)Faster RCNN模型進(jìn)行改進(jìn),每類糧蟲的mAP都有提升,檢測效果都比原始算法的更好,說明了該改進(jìn)算法對(duì)糧蟲小目標(biāo)具有提升效果。
實(shí)際儲(chǔ)糧背景數(shù)據(jù)集中一共有三類糧蟲,分別是赤擬谷盜、米象和鋸谷盜。從表5中可以看出,在儲(chǔ)糧背景下SSD算法對(duì)每類糧蟲的檢測mAP值都低于Faster RCNN算法,整個(gè)數(shù)據(jù)集的mAP值為76.60%,對(duì)比Faster RCNN算法的87.66%,低了11.06%,驗(yàn)證了本文選擇Faster RCNN算法的正確性;使用改進(jìn)Faster RCNN算法后,每種糧蟲的檢測精度都有提升,且各不相同,整個(gè)數(shù)據(jù)集的mAP從87.66%提升到了90.12%,上升了2.46%,其中赤擬谷盜的mAP從84.51%提升到了89.98%,上升了5.47%,也是提升效果最好的種類。說明了該改進(jìn)算法對(duì)實(shí)際儲(chǔ)糧背景下糧蟲數(shù)據(jù)集的檢測性能也有一定的改善,證明了本章改進(jìn)方法對(duì)糧蟲目標(biāo)檢測的有效性。
對(duì)比表4和表5,發(fā)現(xiàn)使用原始Faster RCNN算法時(shí),在儲(chǔ)糧背景下整個(gè)數(shù)據(jù)集的mAP比白板背景數(shù)據(jù)集糧蟲的mAP值低,但在改進(jìn)后的Faster RCNN算法中結(jié)果正好相反,改進(jìn)后的Faster RCNN算法在儲(chǔ)糧背景數(shù)據(jù)集的mAP比白板背景數(shù)據(jù)集的mAP高,說明本改進(jìn)方法在實(shí)際儲(chǔ)糧環(huán)境的糧蟲檢測提升效果更明顯,更具實(shí)用價(jià)值。另一方面,在2個(gè)數(shù)據(jù)集中,由于赤擬谷盜的體積的體積形態(tài)都是最大的,在糧蟲圖像中所占的像素更多,而且提升效果也是最明顯的,說明目標(biāo)的尺度越大,特征就越明顯,檢測效果也會(huì)更好。
表4 白板背景糧蟲數(shù)據(jù)集下改進(jìn)Faster RCNN算法的實(shí)驗(yàn)對(duì)比
表5 實(shí)際儲(chǔ)糧背景糧蟲數(shù)據(jù)集下改進(jìn)Faster RCNN算法的實(shí)驗(yàn)對(duì)比
儲(chǔ)糧安全關(guān)系社會(huì)穩(wěn)定發(fā)展,高效的糧蟲檢測方法有助于構(gòu)建綠色倉儲(chǔ)環(huán)境。本研究針對(duì)糧蟲目標(biāo)體積小、檢測難度大的問題以及原始Faster RCNN模型在檢測糧蟲目標(biāo)時(shí)精度和檢測效率兩方面的不足,提出了一種改進(jìn)的Faster RCNN糧蟲檢測模型。通過引用金字塔池化模塊融合全局上下信息,優(yōu)化分類損失來解決分類過程的樣本不平衡問題,解決了糧蟲相似度高,產(chǎn)生較多陰性樣本的問題。實(shí)驗(yàn)表明本文采用的改進(jìn)Faster RCNN算法對(duì)白板背景和實(shí)際儲(chǔ)糧背景糧蟲目標(biāo)檢測的有效性。后續(xù)工作將構(gòu)建種類更全的糧蟲數(shù)據(jù)集,增加算法對(duì)不同種類糧蟲的泛化性。