亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

改進(jìn)Faster RCNN在糧蟲目標(biāo)檢測中的應(yīng)用研究

2022-06-22 10:23:44許德剛郭奕欣邢奎杰

中國糧油學(xué)報(bào) 2022年4期

許德剛，王露，李凡，郭奕欣，邢奎杰

(河南工業(yè)大學(xué)糧食信息處理與控制教育部重點(diǎn)實(shí)驗(yàn)室1，鄭州 450001)(河南工業(yè)大學(xué)信息科學(xué)與工程學(xué)院2，鄭州 450001)

長期以來，糧食作為人類社會(huì)生存的基本需求，對(duì)維持社會(huì)穩(wěn)定、保障民生和社會(huì)發(fā)展都具有重要作用。我國每年由于糧蟲侵虐造成的損失達(dá)數(shù)百萬t，給國家造成了巨大的損失[1]。儲(chǔ)糧害蟲不僅會(huì)造成糧食品質(zhì)和數(shù)量下降，而且蟲害的排泄物和尸體還會(huì)造成疾病傳播[2]。因此，糧蟲檢測與識(shí)別是儲(chǔ)糧安全的重要一部分，在糧食儲(chǔ)糧過程中定期檢測糧食谷物是否有儲(chǔ)糧害蟲存在至關(guān)重要。隨著技術(shù)的進(jìn)步，糧蟲檢測方法從傳統(tǒng)的直觀檢測法、取樣法、誘捕法、逐步發(fā)展到聲測法[3]、圖像識(shí)別法、近紅外光譜法[4]、X-ray射線法[5]、生物光子法和深度學(xué)習(xí)目標(biāo)檢測法等。傳統(tǒng)的圖像識(shí)別法通過提取糧蟲的邊緣、形狀、紋理等圖像特征，再將這些特征拼接為特征向量，最后利用機(jī)器學(xué)習(xí)算法對(duì)特征向量進(jìn)行分類，識(shí)別糧蟲種類?；谏疃葘W(xué)習(xí)的目標(biāo)檢測方法避免了手工設(shè)計(jì)糧蟲特征的煩瑣步驟，可以自動(dòng)學(xué)習(xí)和泛化大量圖像數(shù)據(jù)的特征，對(duì)糧蟲的特征向量進(jìn)行分類，快速識(shí)別不同糧蟲種類。

近年來，目標(biāo)檢測技術(shù)在科學(xué)研究和計(jì)算機(jī)視覺領(lǐng)域都受到了廣泛的關(guān)注。經(jīng)典的目標(biāo)檢測算法有基于候選區(qū)域的雙階段算法和基于回歸的單階段算法。具體來說，雙階段算法在第一階段主要生成區(qū)域建議；第二階段主要用于分類和回歸區(qū)域建議以獲得更準(zhǔn)確的目標(biāo)位置，以Faster-RCNN[6]和R-FCN[7]為代表，特點(diǎn)是識(shí)別精度高、速度較慢、訓(xùn)練過程困難。單階段算法將目標(biāo)檢測視為一個(gè)回歸或分類問題，采用統(tǒng)一的框架直接實(shí)現(xiàn)分類和定位，以SSD[8](Single Shot Multibox Detector)和YOLO(You Only Look Once)[9]為代表，特點(diǎn)是檢測速度快，但精度相對(duì)較差。本研究將糧蟲檢測作為目標(biāo)檢測的背景，要準(zhǔn)確識(shí)別糧蟲的種類，并對(duì)糧蟲進(jìn)行定位。

為了提升糧蟲檢測效果，基于經(jīng)典的雙階段Faster RCNN算法，針對(duì)糧倉內(nèi)赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5種最主要的甲蟲類儲(chǔ)糧害蟲分別制作了白板背景和實(shí)際儲(chǔ)糧背景兩個(gè)糧蟲數(shù)據(jù)集，在特征圖后引入一個(gè)金字塔池化模塊以融合全局特征信息，采用改進(jìn)的Focal Loss損失函數(shù)代替交叉熵?fù)p失函數(shù)，以解決糧蟲分類過程中樣本不平衡問題，實(shí)現(xiàn)糧蟲檢測效果的有效提升。

1 經(jīng)典Faster RCNN算法

Faster RCNN算法在2015年提出，在RCNN[10]和Fast RCNN[11]基礎(chǔ)上擴(kuò)展而來，引入了區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network，RPN)取代選擇性搜索算法，RPN將區(qū)域建議提取集成到深度卷積神經(jīng)網(wǎng)絡(luò)，在每個(gè)位置同時(shí)預(yù)測目標(biāo)邊界框和類別置信度分?jǐn)?shù)，加快了網(wǎng)絡(luò)的計(jì)算速度。Faster R-CNN采用VGG-16作為骨干網(wǎng)絡(luò)，由卷積層、RPN網(wǎng)絡(luò)、RoI Pooling層[12]、分類和回歸層等4部分組成。

Faster RCNN方法的檢測流程分為兩個(gè)階段：生成候選區(qū)域，詳細(xì)地搜索圖像中所有可能是目標(biāo)的位置，并為可能是目標(biāo)的位置產(chǎn)生大量的邊界框，帶有邊界框的感興趣區(qū)域稱為區(qū)域建議；對(duì)候選區(qū)域進(jìn)行分類和回歸，得到區(qū)域建議后，通過一些技術(shù)來判斷它是屬于目標(biāo)類還是背景類。區(qū)域建議網(wǎng)絡(luò)用于選出并刪除目標(biāo)存在概率非常小的區(qū)域，從而加快了整個(gè)目標(biāo)檢測系統(tǒng)的速度。

2 算法優(yōu)化

根據(jù)Faster RCNN算法的原理，針對(duì)糧蟲目標(biāo)體積小、姿態(tài)多變、糧蟲與糧粒相互遮擋且容易混淆等特點(diǎn)，通過引入金字塔池化模塊(Pyramid Pooling Module，PPM)[13]來融合全局信息，采用Focal Loss損失函數(shù)作為分類損失解決數(shù)據(jù)不平衡問題，以提升糧蟲目標(biāo)的檢測效果。

2.1 增加上下文的金字塔池化模塊

在目標(biāo)檢測領(lǐng)域，上下文信息起著重要作用。在檢測特征不足的目標(biāo)時(shí)，上下文信息可以了解目標(biāo)及其周圍環(huán)境之間的關(guān)聯(lián)，提高檢測器了解場景的能力，有效地幫助提高檢測性能。糧蟲目標(biāo)檢測中的上下文信息是糧蟲目標(biāo)的語義信息，主要分為局部上下文和全局上下文。全局上下文信息可以提供圖像級(jí)別或者場景級(jí)別的上下文信息，局部上下文信息可以提升目標(biāo)被檢測的可能性。

深度卷積神經(jīng)網(wǎng)絡(luò)為了獲得較大感受野的特征表達(dá)，需要進(jìn)行多次下采樣，在最后一個(gè)卷積層的特征圖可以獲得目標(biāo)類別和豐富的語義信息。但是多次下采樣會(huì)導(dǎo)致信息丟失，本文提出采用PSPNet[14]的金字塔池化模塊(PPM)來解決此問題，該模塊通過將最終特征圖和4個(gè)不同金字塔比例尺的特征進(jìn)行級(jí)聯(lián)來獲得更加豐富的多尺度上下文信息。金字塔池化模塊如圖1所示，通過融合不同區(qū)域的上下文信息在不同尺度下保留全局信息，有效地獲取全局語境信息。

本研究采用在特征圖后增加一個(gè)金字塔池化模塊PPM來解決卷積神經(jīng)網(wǎng)絡(luò)在多次下采樣時(shí)造成得信息丟失，以有效融合全局上下文信息，以提升檢測性能。金字塔池化結(jié)構(gòu)如圖1中的c部分。PPM通過不同金字塔尺寸的自適應(yīng)平均池化(GAP)處理卷積神經(jīng)網(wǎng)絡(luò)得到特征圖，如圖1中b部分，PPM包含1個(gè)直接連接和4個(gè)分支，每個(gè)分支分別由1個(gè)池化層，1個(gè)卷積層和1個(gè)反卷積層組成。不同分支在池化層和卷積層中具有不同大小的內(nèi)核，同時(shí)生成不同大小的感受野。PPM融合了4種不同金字塔尺度下的特征，4個(gè)分支的內(nèi)核大小分別設(shè)置為1、2、4、6，POOL表示采用1×1、2×2、4×4和6×6 4種不同尺寸的池化操作得到多個(gè)尺寸的特征圖，其中較大內(nèi)核的分支可以獲得更多的全局特征，反之，內(nèi)核較小的分支獲取更多的局部特征，并對(duì)這些尺寸的特征圖再次進(jìn)行“1×1的Conv”來減少通道路。金字塔池化模塊的輸入和所有分支的輸入通過級(jí)聯(lián)輸入到下一層，使用雙線性插值[15]填充上采樣得到原來的尺寸，將不同級(jí)別的特征圖拼接得到最終的金字塔池化全局特征。因此，全局和局部特征的融合可以生成準(zhǔn)確的像素級(jí)預(yù)測。同時(shí)，不同的內(nèi)核大小能夠提升模型檢測不同尺度目標(biāo)的能力。

圖1 金字塔池化模塊結(jié)構(gòu)圖

2.2 損失函數(shù)優(yōu)化

Faster RCNN算法的損失函數(shù)設(shè)計(jì)過程中沒有考慮到訓(xùn)練數(shù)據(jù)集樣本不均衡的問題，可能導(dǎo)致算法對(duì)不同類別糧蟲的檢測效果相差較大，為了提高算法的檢測準(zhǔn)確率，從樣本分布均衡的角度出發(fā)，基于Focal loss損失函數(shù)的思想對(duì)算法進(jìn)行改進(jìn)，以提升算法對(duì)困難樣本和類別較少的樣本的檢測準(zhǔn)確率。

本研究使用Focal Loss解決糧蟲檢測的數(shù)據(jù)不平衡問題。Focal Loss以通過重塑標(biāo)準(zhǔn)交叉熵?fù)p失來解決目標(biāo)檢測任務(wù)中的不平衡問題，其不僅實(shí)現(xiàn)降低簡單樣本的影響，更多地關(guān)注困難樣本，而且基于分類誤差考慮每個(gè)樣本對(duì)損失的影響。除了以上原因，前景和背景的極度不平衡也是影響目標(biāo)檢測算法的一個(gè)重要原因，F(xiàn)ocal Loss還考慮到前景和背景類之間1∶1 000比例的不平衡比例的高訓(xùn)練精度[16]，在計(jì)算機(jī)視覺、目標(biāo)檢測領(lǐng)域都獲得了優(yōu)越性能。

2.2.1 Focal Loss損失函數(shù)

由于糧蟲形狀相似，一般情況下，RPN中屬于負(fù)樣本的區(qū)域建議較多。為了解決訓(xùn)練過程中前景和背景類別不平衡的問題(如:1∶1 000)，并更好地進(jìn)行分類，用Focal Loss代替RPN中的標(biāo)準(zhǔn)交叉熵(Cross-entropy，Ce)分類損失。

傳統(tǒng)的分類交叉熵?fù)p失函數(shù)如公式所示：

(1)

式中：p是網(wǎng)絡(luò)模型預(yù)測該樣本為正樣本的概率值，p∈[0，1]。其中y∈{±1}是真值類，表示樣本標(biāo)簽，當(dāng)y=+1時(shí)表示正樣本，y=-1時(shí)表示負(fù)樣本。當(dāng)樣本標(biāo)簽為1時(shí)，p越接近1，損失越小。

通過對(duì)交叉驗(yàn)證建立的可調(diào)參數(shù)改進(jìn)，為便于表示，將p標(biāo)記為pt，目標(biāo)類的概率pt定義為：

(2)

此時(shí)，二分類交叉熵?fù)p失函數(shù)Ce可以簡寫為:

Ce(p,y)=Ce(pt)=-log(pt)

(3)

此外為了解決樣本不平衡中的正負(fù)樣本不均衡問題，添加了一個(gè)加權(quán)項(xiàng)α來處理正類和負(fù)類(1-α)的類別不平衡，α的取值范圍為0～1，如下所示：

(4)

在α平衡形式中，調(diào)整后的二分類交叉熵?fù)p失函數(shù)Ce可以寫成：

Ce(pt)=-αtlog(pt)

(5)

這個(gè)公式被認(rèn)為是Ce的一個(gè)簡單擴(kuò)展，其中，α是類概率的倒數(shù)，或作為交叉驗(yàn)證修復(fù)的超參數(shù)，與正負(fù)樣本數(shù)量呈反比，以減少正負(fù)樣本不均衡對(duì)性能的影響。

由公式可以看出，所有樣本的權(quán)值在標(biāo)準(zhǔn)交叉熵中是一樣的。如果在訓(xùn)練過程中存在前景和背景的類別不平衡，大量的負(fù)樣本的將主導(dǎo)梯度，小量的困難樣本和正樣本將會(huì)被覆蓋，也就難以發(fā)揮作用，使準(zhǔn)確率降低。

用Focal Loss函數(shù)代替交叉熵來解決類不平衡問題，相當(dāng)于為Ce損失函數(shù)的擴(kuò)展。而對(duì)于難易樣本不均衡的問題，為了增加小目標(biāo)的權(quán)重，類似于權(quán)重因子α，通過增加高斯權(quán)重(Gaussian weight)來改進(jìn)Focal Loss。某一類中的樣本數(shù)越少，高斯權(quán)重就越大，模型就越會(huì)引起注意。 Focal Loss為帶有參數(shù)的交叉熵?fù)p失增加了一個(gè)調(diào)節(jié)因子(1-pt)y。其中y≥0，改進(jìn)的損失函數(shù)表示為：

Lfl(pt)=-αt(1-pt)ylog(pt)

(6)

式(6)既可以調(diào)整正負(fù)樣本不均衡，也可以調(diào)整困難樣本和簡單樣本的不均衡。其中，(1-pt)γ用來調(diào)整困難樣本和簡單樣本的權(quán)重，(1-pt)γ取值范圍為0～1，如果pt值越大，為簡單樣本，則(1-pt)γ值越小，故對(duì)損失函數(shù)的影響更??；如果pt值較小，則為困難樣本，則對(duì)應(yīng)的(1-pt)γ值更大，對(duì)損失函數(shù)影響較大。

(7)

其中αt權(quán)重為了改善正負(fù)樣本不平衡，αt是加權(quán)因子，α和γ是2個(gè)可調(diào)參數(shù)，ct是每個(gè)類別的數(shù)量。當(dāng)γ=0時(shí)，focalloss等于交叉熵，并且隨著γ增加，α不斷減小。在0～1的范圍內(nèi)，α越小，負(fù)樣本(具有較大數(shù)量的類別)的權(quán)重越小。通過增加較少數(shù)量類的權(quán)重，通過高斯部分對(duì)αt進(jìn)行了改進(jìn)。

當(dāng)一個(gè)邊界框被錯(cuò)誤分類時(shí)，pt很小，并且(1-pt)γ接近于1，對(duì)分類損失幾乎沒有影響。同樣，當(dāng)分類預(yù)測結(jié)果很好時(shí)，即pt接近于1，(1-pt)γ接近于0，這相當(dāng)于減少了簡單樣本的損失。在Lin等[17]的研究中，當(dāng)γ=2和α=0.25時(shí)，模型效果最好。在此研究基礎(chǔ)上，應(yīng)用相同的參數(shù)設(shè)置。參數(shù)β和σ控制著每個(gè)類別損失的權(quán)重，確保αt∈[0,1]。

2.2.2 Faster RCNN模型的損失函數(shù)設(shè)計(jì)

Faster RCNN的總損失函數(shù)由分類損失和回歸損失組成。該方法對(duì)一幅圖像的具體損失函數(shù)定義為如式(8)所示。

(8)

其中，回歸損失函數(shù)Lreg的具體表達(dá)式如式(9)所示。

(9)

式(9)中，平滑函數(shù)(smooth function)的定義如式(10)所示。

(10)

式中：x為邊界框的預(yù)測誤差，參數(shù)σ用來控制平滑區(qū)域。對(duì)于邊界框回歸采用式(11)中的4個(gè)參數(shù)坐標(biāo)表達(dá)。

tw=log(w/wa)th=log(h/ha)

(11)

式中：x、y、w和h為方框的中心坐標(biāo)及其寬、高。變量x為預(yù)測框、xa為錨框、x*為真值框，這可以看作從錨框到真值框的邊界框回歸。

2.2.3 改進(jìn)后Faster RCNN模型架構(gòu)

Faster RCNN檢測模型由4個(gè)部分組成：使用VGG-16提取糧蟲圖像特征，得到特征圖；將特征圖輸入RPN得到區(qū)域建議生成；將特征圖和Proposals輸入到RoI Pooling層得到綜合的Proposals特征；根據(jù)Proposals特征預(yù)測目標(biāo)的邊界框和位置，即分類和邊界框回歸。改進(jìn)后Faster RCNN模型架構(gòu)如圖2所示。

圖2 改進(jìn)的Faster RCNN網(wǎng)絡(luò)架構(gòu)圖

基于改進(jìn)的Faster RCNN儲(chǔ)糧害蟲目標(biāo)檢測模型流程包括特征提取、金字塔池化、區(qū)域建議網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)。

2.3 改進(jìn)后Faster RCNN模型架構(gòu)

2.3.1 特征提取

該模塊利用VGG-16作為特征提取網(wǎng)絡(luò)，提取原始圖像的特征圖并與Faster RCNN的RPN共享所有的卷積操作。

2.3.2 金字塔池化模塊PPM

特征圖經(jīng)過PPM模塊得到融合了整體信息的特征，然后，采用雙線性插值對(duì)低維特征圖上采樣，使其與原始特征圖尺度相同。最后，拼接不同層級(jí)的特征圖得到金字塔池化全局特征。

2.3.3 RPN網(wǎng)絡(luò)

RPN通過比較各個(gè)區(qū)域建議的置信度得分和執(zhí)行二值分類任務(wù)，判斷每個(gè)建議屬于前景還是背景，并利用錨框回歸得到糧蟲的邊界框。

2.3.4 全連接網(wǎng)絡(luò)

通過RoI池化層獲得特征發(fā)送到全連接網(wǎng)絡(luò)進(jìn)行分類和邊界框回歸計(jì)算。在訓(xùn)練階段，需要計(jì)算預(yù)測值與真實(shí)值之間的所有損失，并進(jìn)行反向梯度傳播優(yōu)化。本文模型通過對(duì)給定圖像進(jìn)行輸入，網(wǎng)絡(luò)轉(zhuǎn)發(fā)，得到圖像的分類和回歸預(yù)測框。

3 數(shù)據(jù)集與評(píng)價(jià)標(biāo)準(zhǔn)

糧蟲數(shù)據(jù)集是目標(biāo)檢測研究的基礎(chǔ)，在目標(biāo)檢測任務(wù)中扮演著十分重要的角色。在進(jìn)行糧蟲目標(biāo)檢測任務(wù)時(shí)，需要適用性強(qiáng)的數(shù)據(jù)集來有效測試和評(píng)估本文算法的性能。由于該領(lǐng)域目前沒有公開的糧蟲數(shù)據(jù)集，所以本文采用人工采集的方法來制作數(shù)據(jù)集。

3.1 數(shù)據(jù)集的制作

儲(chǔ)糧害蟲分為昆蟲和螨類兩類，昆蟲類又分為甲蟲類和蛾類兩種，其中甲蟲類對(duì)糧食谷物的破壞性最強(qiáng)，所以本文以甲蟲類儲(chǔ)糧害蟲為研究對(duì)象，選取了赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5 種最主要的甲蟲類儲(chǔ)糧害蟲。拍攝白板背景下圖像時(shí)，用鑷子將昆蟲夾出放置實(shí)驗(yàn)平臺(tái)的白紙上，將手機(jī)固定，垂直平臺(tái)進(jìn)行拍攝，選取了赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5 類害蟲，數(shù)據(jù)集名稱為WBGP，如圖3所示；拍攝實(shí)際儲(chǔ)糧背景的糧蟲圖像時(shí)以小麥和大米為背景鋪滿實(shí)驗(yàn)平臺(tái)，固定手機(jī)，垂直平臺(tái)進(jìn)行拍攝，選取了赤擬谷盜、米象和鋸谷盜3類害蟲，數(shù)據(jù)集名稱為RBGP，如圖4所示。每張圖像的糧蟲數(shù)量為4～10只，白板背景下原始圖像樣本共計(jì)2 601張，實(shí)際背景下原始圖像共計(jì)1317張，昆蟲圖像統(tǒng)一 resize 成了640×480大小。

圖3 白板背景數(shù)據(jù)集WBGP的糧蟲圖像

圖4 實(shí)際儲(chǔ)糧背景數(shù)據(jù)集RBGP的糧蟲圖像

3.2 數(shù)據(jù)增強(qiáng)

在深度學(xué)習(xí)中，為了增強(qiáng)模型的穩(wěn)定性，提取圖像特征，防止模型過擬合，需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練以提高模型的魯棒性。本文對(duì)圖像進(jìn)行幾何變換、調(diào)節(jié)亮度、添加高斯噪聲等一系列增強(qiáng)操作來豐富糧蟲數(shù)據(jù)，幾何變換包括圖像翻轉(zhuǎn)和旋轉(zhuǎn)兩種方法，采用了90°、180°和270°對(duì)圖像進(jìn)行旋轉(zhuǎn)。白板背景下原始圖像數(shù)據(jù)2 601張?jiān)鰪?qiáng)至3 734張，白板背景下數(shù)據(jù)增強(qiáng)前后糧蟲圖像數(shù)量如表1所示，儲(chǔ)糧背景下原始圖像數(shù)據(jù)1 317張?jiān)鰪?qiáng)至2 074張，儲(chǔ)糧背景數(shù)據(jù)增強(qiáng)前后糧蟲圖像數(shù)量如表2所示，平均每種糧蟲圖像700張，每幅圖像上糧蟲4～10只。最后，按照7∶1∶2的比例[18]構(gòu)建訓(xùn)練集、驗(yàn)證集和測試集。

表1 白板背景數(shù)據(jù)集WBGP的糧蟲圖像數(shù)量

表2 實(shí)際儲(chǔ)糧背景數(shù)據(jù)集RBGP的糧蟲圖像數(shù)量

3.3 性能評(píng)價(jià)指標(biāo)

本研究采用精確度(P)、召回率(R)、平均精確度(AP)和平均精確度均值(mAP)[19]和來評(píng)估目標(biāo)檢測模型的性能。目標(biāo)檢測模型的分類和定位能力是其最主要的性能體現(xiàn)，而mAP值是其最直觀的表達(dá)方式，mAP值越大，表明該模型的精度越高。其中， mAP的計(jì)算公式為，Q代表目標(biāo)類別數(shù)：

(12)

4 結(jié)果與分析

4.1 實(shí)驗(yàn)環(huán)境

本實(shí)驗(yàn)根據(jù)PyTorch的運(yùn)行環(huán)境要求在計(jì)算機(jī)進(jìn)行環(huán)境的搭建，參數(shù)如表3所示。

表3 實(shí)驗(yàn)環(huán)境配置參數(shù)

選用的GPU最大分辨率為7 680×4 320，能夠處理大量圖像數(shù)據(jù)，加快網(wǎng)絡(luò)模型的訓(xùn)練速度，從而提高圖像處理速度和模型訓(xùn)練效率。

4.2 定性分析

算法實(shí)驗(yàn)過程中用糧蟲相對(duì)應(yīng)的拼音縮寫表示糧蟲的種類，其中“chini”表示赤擬谷盜，“mixing”表示米象，“jugudao”表示鋸谷盜，“yancojia”表示煙草甲，“xiuchi”表示銹赤扁谷盜。

Faster RCNN算法在白板背景數(shù)據(jù)集的檢測結(jié)果對(duì)比如圖5所示，圖5a是Faster RCNN算法的檢測效果，圖5b是Faster RCNN算法改進(jìn)后的檢測效果。

圖5 白板背景數(shù)據(jù)集Faster RCNN算法改進(jìn)前后檢測效果對(duì)比圖

圖6是實(shí)際儲(chǔ)糧背景數(shù)據(jù)集中Faster RCNN算法改進(jìn)前后對(duì)3種糧蟲的檢測結(jié)果對(duì)比，其中圖6a是Faster RCNN算法的檢測效果圖，圖6b是Faster RCNN算法改進(jìn)后的檢測效果圖。對(duì)比Faster RCNN算法改進(jìn)前后的檢測結(jié)果可以發(fā)現(xiàn)，圖像中每只糧蟲被檢測的概率值都有了明顯的提升，改進(jìn)后Faster RCNN算法的精度有了一定提高，同時(shí)避免了一些漏檢。

圖6 儲(chǔ)糧背景數(shù)據(jù)集的Faster RCNN算法改進(jìn)前后檢測效果對(duì)比圖

4.3 定量分析

SSD作為深度學(xué)習(xí)中的典型單階段目標(biāo)檢測算法，具有精度高、速度快的特點(diǎn)。本實(shí)驗(yàn)針對(duì)2.1和2.2中的優(yōu)化方案，對(duì)比SSD算法與改進(jìn)前后Faster RCNN算法在白板背景數(shù)據(jù)集的糧蟲檢測實(shí)驗(yàn)結(jié)果，如表4所示，在實(shí)際儲(chǔ)糧背景數(shù)據(jù)集的糧蟲檢測對(duì)比實(shí)驗(yàn)結(jié)果如表5所示。

白板背景數(shù)據(jù)集一共有五類糧蟲目標(biāo)，分別是銹赤扁谷盜、米象、鋸谷盜、煙草甲、銹赤扁谷盜。從表4可以看出，不同種類糧蟲的檢測效果存在差異，在白板背景下SSD算法對(duì)糧蟲小目標(biāo)的檢測效果不佳，每類糧蟲的mAP值都低于改進(jìn)前后的Faster RCNN算法，使用改進(jìn)的Faster RCNN算法后整個(gè)數(shù)據(jù)集的mAP從88.52%提升到了89.42%，上升了0.90%，其中赤擬谷盜的mAP從87.46%提升到了89.73%，上升了2.27%，提升效果最好，該算法對(duì)糧蟲小目標(biāo)的檢測能力有一定的改善。通過對(duì)Faster RCNN模型進(jìn)行改進(jìn)，每類糧蟲的mAP都有提升，檢測效果都比原始算法的更好，說明了該改進(jìn)算法對(duì)糧蟲小目標(biāo)具有提升效果。

實(shí)際儲(chǔ)糧背景數(shù)據(jù)集中一共有三類糧蟲，分別是赤擬谷盜、米象和鋸谷盜。從表5中可以看出，在儲(chǔ)糧背景下SSD算法對(duì)每類糧蟲的檢測mAP值都低于Faster RCNN算法，整個(gè)數(shù)據(jù)集的mAP值為76.60%，對(duì)比Faster RCNN算法的87.66%，低了11.06%，驗(yàn)證了本文選擇Faster RCNN算法的正確性；使用改進(jìn)Faster RCNN算法后，每種糧蟲的檢測精度都有提升，且各不相同，整個(gè)數(shù)據(jù)集的mAP從87.66%提升到了90.12%，上升了2.46%，其中赤擬谷盜的mAP從84.51%提升到了89.98%，上升了5.47%，也是提升效果最好的種類。說明了該改進(jìn)算法對(duì)實(shí)際儲(chǔ)糧背景下糧蟲數(shù)據(jù)集的檢測性能也有一定的改善，證明了本章改進(jìn)方法對(duì)糧蟲目標(biāo)檢測的有效性。

對(duì)比表4和表5，發(fā)現(xiàn)使用原始Faster RCNN算法時(shí)，在儲(chǔ)糧背景下整個(gè)數(shù)據(jù)集的mAP比白板背景數(shù)據(jù)集糧蟲的mAP值低，但在改進(jìn)后的Faster RCNN算法中結(jié)果正好相反，改進(jìn)后的Faster RCNN算法在儲(chǔ)糧背景數(shù)據(jù)集的mAP比白板背景數(shù)據(jù)集的mAP高，說明本改進(jìn)方法在實(shí)際儲(chǔ)糧環(huán)境的糧蟲檢測提升效果更明顯，更具實(shí)用價(jià)值。另一方面，在2個(gè)數(shù)據(jù)集中，由于赤擬谷盜的體積的體積形態(tài)都是最大的，在糧蟲圖像中所占的像素更多，而且提升效果也是最明顯的，說明目標(biāo)的尺度越大，特征就越明顯，檢測效果也會(huì)更好。

表4 白板背景糧蟲數(shù)據(jù)集下改進(jìn)Faster RCNN算法的實(shí)驗(yàn)對(duì)比

表5 實(shí)際儲(chǔ)糧背景糧蟲數(shù)據(jù)集下改進(jìn)Faster RCNN算法的實(shí)驗(yàn)對(duì)比

5 結(jié)論

儲(chǔ)糧安全關(guān)系社會(huì)穩(wěn)定發(fā)展，高效的糧蟲檢測方法有助于構(gòu)建綠色倉儲(chǔ)環(huán)境。本研究針對(duì)糧蟲目標(biāo)體積小、檢測難度大的問題以及原始Faster RCNN模型在檢測糧蟲目標(biāo)時(shí)精度和檢測效率兩方面的不足，提出了一種改進(jìn)的Faster RCNN糧蟲檢測模型。通過引用金字塔池化模塊融合全局上下信息，優(yōu)化分類損失來解決分類過程的樣本不平衡問題，解決了糧蟲相似度高，產(chǎn)生較多陰性樣本的問題。實(shí)驗(yàn)表明本文采用的改進(jìn)Faster RCNN算法對(duì)白板背景和實(shí)際儲(chǔ)糧背景糧蟲目標(biāo)檢測的有效性。后續(xù)工作將構(gòu)建種類更全的糧蟲數(shù)據(jù)集，增加算法對(duì)不同種類糧蟲的泛化性。