亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進(jìn)Faster RCNN在糧蟲目標(biāo)檢測中的應(yīng)用研究

        2022-06-22 10:23:44許德剛郭奕欣邢奎杰
        中國糧油學(xué)報(bào) 2022年4期
        關(guān)鍵詞:背景特征檢測

        許德剛, 王 露, 李 凡, 郭奕欣, 邢奎杰

        (河南工業(yè)大學(xué)糧食信息處理與控制教育部重點(diǎn)實(shí)驗(yàn)室1,鄭州 450001)(河南工業(yè)大學(xué)信息科學(xué)與工程學(xué)院2,鄭州 450001)

        長期以來,糧食作為人類社會(huì)生存的基本需求,對(duì)維持社會(huì)穩(wěn)定、保障民生和社會(huì)發(fā)展都具有重要作用。我國每年由于糧蟲侵虐造成的損失達(dá)數(shù)百萬t,給國家造成了巨大的損失[1]。儲(chǔ)糧害蟲不僅會(huì)造成糧食品質(zhì)和數(shù)量下降,而且蟲害的排泄物和尸體還會(huì)造成疾病傳播[2]。因此,糧蟲檢測與識(shí)別是儲(chǔ)糧安全的重要一部分,在糧食儲(chǔ)糧過程中定期檢測糧食谷物是否有儲(chǔ)糧害蟲存在至關(guān)重要。隨著技術(shù)的進(jìn)步,糧蟲檢測方法從傳統(tǒng)的直觀檢測法、取樣法、誘捕法、逐步發(fā)展到聲測法[3]、圖像識(shí)別法、近紅外光譜法[4]、X-ray射線法[5]、生物光子法和深度學(xué)習(xí)目標(biāo)檢測法等。傳統(tǒng)的圖像識(shí)別法通過提取糧蟲的邊緣、形狀、紋理等圖像特征,再將這些特征拼接為特征向量,最后利用機(jī)器學(xué)習(xí)算法對(duì)特征向量進(jìn)行分類,識(shí)別糧蟲種類?;谏疃葘W(xué)習(xí)的目標(biāo)檢測方法避免了手工設(shè)計(jì)糧蟲特征的煩瑣步驟,可以自動(dòng)學(xué)習(xí)和泛化大量圖像數(shù)據(jù)的特征,對(duì)糧蟲的特征向量進(jìn)行分類,快速識(shí)別不同糧蟲種類。

        近年來,目標(biāo)檢測技術(shù)在科學(xué)研究和計(jì)算機(jī)視覺領(lǐng)域都受到了廣泛的關(guān)注。經(jīng)典的目標(biāo)檢測算法有基于候選區(qū)域的雙階段算法和基于回歸的單階段算法。具體來說,雙階段算法在第一階段主要生成區(qū)域建議;第二階段主要用于分類和回歸區(qū)域建議以獲得更準(zhǔn)確的目標(biāo)位置,以Faster-RCNN[6]和R-FCN[7]為代表,特點(diǎn)是識(shí)別精度高、速度較慢、訓(xùn)練過程困難。單階段算法將目標(biāo)檢測視為一個(gè)回歸或分類問題,采用統(tǒng)一的框架直接實(shí)現(xiàn)分類和定位,以SSD[8](Single Shot Multibox Detector)和YOLO(You Only Look Once)[9]為代表,特點(diǎn)是檢測速度快,但精度相對(duì)較差。本研究將糧蟲檢測作為目標(biāo)檢測的背景,要準(zhǔn)確識(shí)別糧蟲的種類,并對(duì)糧蟲進(jìn)行定位。

        為了提升糧蟲檢測效果,基于經(jīng)典的雙階段Faster RCNN算法,針對(duì)糧倉內(nèi)赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5種最主要的甲蟲類儲(chǔ)糧害蟲分別制作了白板背景和實(shí)際儲(chǔ)糧背景兩個(gè)糧蟲數(shù)據(jù)集,在特征圖后引入一個(gè)金字塔池化模塊以融合全局特征信息,采用改進(jìn)的Focal Loss損失函數(shù)代替交叉熵?fù)p失函數(shù),以解決糧蟲分類過程中樣本不平衡問題,實(shí)現(xiàn)糧蟲檢測效果的有效提升。

        1 經(jīng)典Faster RCNN算法

        Faster RCNN算法在2015年提出,在RCNN[10]和Fast RCNN[11]基礎(chǔ)上擴(kuò)展而來,引入了區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network,RPN)取代選擇性搜索算法,RPN將區(qū)域建議提取集成到深度卷積神經(jīng)網(wǎng)絡(luò),在每個(gè)位置同時(shí)預(yù)測目標(biāo)邊界框和類別置信度分?jǐn)?shù),加快了網(wǎng)絡(luò)的計(jì)算速度。Faster R-CNN采用VGG-16作為骨干網(wǎng)絡(luò),由卷積層、RPN網(wǎng)絡(luò)、RoI Pooling層[12]、分類和回歸層等4部分組成。

        Faster RCNN方法的檢測流程分為兩個(gè)階段:生成候選區(qū)域,詳細(xì)地搜索圖像中所有可能是目標(biāo)的位置,并為可能是目標(biāo)的位置產(chǎn)生大量的邊界框,帶有邊界框的感興趣區(qū)域稱為區(qū)域建議;對(duì)候選區(qū)域進(jìn)行分類和回歸,得到區(qū)域建議后,通過一些技術(shù)來判斷它是屬于目標(biāo)類還是背景類。區(qū)域建議網(wǎng)絡(luò)用于選出并刪除目標(biāo)存在概率非常小的區(qū)域,從而加快了整個(gè)目標(biāo)檢測系統(tǒng)的速度。

        2 算法優(yōu)化

        根據(jù)Faster RCNN算法的原理,針對(duì)糧蟲目標(biāo)體積小、姿態(tài)多變、糧蟲與糧粒相互遮擋且容易混淆等特點(diǎn),通過引入金字塔池化模塊(Pyramid Pooling Module,PPM)[13]來融合全局信息,采用Focal Loss損失函數(shù)作為分類損失解決數(shù)據(jù)不平衡問題,以提升糧蟲目標(biāo)的檢測效果。

        2.1 增加上下文的金字塔池化模塊

        在目標(biāo)檢測領(lǐng)域,上下文信息起著重要作用。在檢測特征不足的目標(biāo)時(shí),上下文信息可以了解目標(biāo)及其周圍環(huán)境之間的關(guān)聯(lián),提高檢測器了解場景的能力,有效地幫助提高檢測性能。糧蟲目標(biāo)檢測中的上下文信息是糧蟲目標(biāo)的語義信息,主要分為局部上下文和全局上下文。全局上下文信息可以提供圖像級(jí)別或者場景級(jí)別的上下文信息,局部上下文信息可以提升目標(biāo)被檢測的可能性。

        深度卷積神經(jīng)網(wǎng)絡(luò)為了獲得較大感受野的特征表達(dá),需要進(jìn)行多次下采樣,在最后一個(gè)卷積層的特征圖可以獲得目標(biāo)類別和豐富的語義信息。但是多次下采樣會(huì)導(dǎo)致信息丟失,本文提出采用PSPNet[14]的金字塔池化模塊(PPM)來解決此問題,該模塊通過將最終特征圖和4個(gè)不同金字塔比例尺的特征進(jìn)行級(jí)聯(lián)來獲得更加豐富的多尺度上下文信息。金字塔池化模塊如圖1所示,通過融合不同區(qū)域的上下文信息在不同尺度下保留全局信息,有效地獲取全局語境信息。

        本研究采用在特征圖后增加一個(gè)金字塔池化模塊PPM來解決卷積神經(jīng)網(wǎng)絡(luò)在多次下采樣時(shí)造成得信息丟失,以有效融合全局上下文信息,以提升檢測性能。金字塔池化結(jié)構(gòu)如圖1中的c部分。PPM通過不同金字塔尺寸的自適應(yīng)平均池化(GAP)處理卷積神經(jīng)網(wǎng)絡(luò)得到特征圖,如圖1中b部分,PPM包含1個(gè)直接連接和4個(gè)分支,每個(gè)分支分別由1個(gè)池化層,1個(gè)卷積層和1個(gè)反卷積層組成。不同分支在池化層和卷積層中具有不同大小的內(nèi)核,同時(shí)生成不同大小的感受野。PPM融合了4種不同金字塔尺度下的特征,4個(gè)分支的內(nèi)核大小分別設(shè)置為1、2、4、6,POOL表示采用1×1、2×2、4×4和6×6 4種不同尺寸的池化操作得到多個(gè)尺寸的特征圖,其中較大內(nèi)核的分支可以獲得更多的全局特征,反之,內(nèi)核較小的分支獲取更多的局部特征,并對(duì)這些尺寸的特征圖再次進(jìn)行“1×1的Conv”來減少通道路。金字塔池化模塊的輸入和所有分支的輸入通過級(jí)聯(lián)輸入到下一層,使用雙線性插值[15]填充上采樣得到原來的尺寸,將不同級(jí)別的特征圖拼接得到最終的金字塔池化全局特征。因此,全局和局部特征的融合可以生成準(zhǔn)確的像素級(jí)預(yù)測。同時(shí),不同的內(nèi)核大小能夠提升模型檢測不同尺度目標(biāo)的能力。

        圖1 金字塔池化模塊結(jié)構(gòu)圖

        2.2 損失函數(shù)優(yōu)化

        Faster RCNN算法的損失函數(shù)設(shè)計(jì)過程中沒有考慮到訓(xùn)練數(shù)據(jù)集樣本不均衡的問題,可能導(dǎo)致算法對(duì)不同類別糧蟲的檢測效果相差較大,為了提高算法的檢測準(zhǔn)確率,從樣本分布均衡的角度出發(fā),基于Focal loss損失函數(shù)的思想對(duì)算法進(jìn)行改進(jìn),以提升算法對(duì)困難樣本和類別較少的樣本的檢測準(zhǔn)確率。

        本研究使用Focal Loss解決糧蟲檢測的數(shù)據(jù)不平衡問題。Focal Loss以通過重塑標(biāo)準(zhǔn)交叉熵?fù)p失來解決目標(biāo)檢測任務(wù)中的不平衡問題,其不僅實(shí)現(xiàn)降低簡單樣本的影響,更多地關(guān)注困難樣本,而且基于分類誤差考慮每個(gè)樣本對(duì)損失的影響。除了以上原因,前景和背景的極度不平衡也是影響目標(biāo)檢測算法的一個(gè)重要原因,F(xiàn)ocal Loss還考慮到前景和背景類之間1∶1 000比例的不平衡比例的高訓(xùn)練精度[16],在計(jì)算機(jī)視覺、目標(biāo)檢測領(lǐng)域都獲得了優(yōu)越性能。

        2.2.1 Focal Loss損失函數(shù)

        由于糧蟲形狀相似,一般情況下,RPN中屬于負(fù)樣本的區(qū)域建議較多。為了解決訓(xùn)練過程中前景和背景類別不平衡的問題(如:1∶1 000),并更好地進(jìn)行分類,用Focal Loss代替RPN中的標(biāo)準(zhǔn)交叉熵(Cross-entropy,Ce)分類損失。

        傳統(tǒng)的分類交叉熵?fù)p失函數(shù)如公式所示:

        (1)

        式中:p是網(wǎng)絡(luò)模型預(yù)測該樣本為正樣本的概率值,p∈[0,1]。其中y∈{±1}是真值類,表示樣本標(biāo)簽,當(dāng)y=+1時(shí)表示正樣本,y=-1時(shí)表示負(fù)樣本。當(dāng)樣本標(biāo)簽為1時(shí),p越接近1,損失越小。

        通過對(duì)交叉驗(yàn)證建立的可調(diào)參數(shù)改進(jìn),為便于表示,將p標(biāo)記為pt,目標(biāo)類的概率pt定義為:

        (2)

        此時(shí),二分類交叉熵?fù)p失函數(shù)Ce可以簡寫為:

        Ce(p,y)=Ce(pt)=-log(pt)

        (3)

        此外為了解決樣本不平衡中的正負(fù)樣本不均衡問題,添加了一個(gè)加權(quán)項(xiàng)α來處理正類和負(fù)類(1-α)的類別不平衡,α的取值范圍為0~1,如下所示:

        (4)

        在α平衡形式中,調(diào)整后的二分類交叉熵?fù)p失函數(shù)Ce可以寫成:

        Ce(pt)=-αtlog(pt)

        (5)

        這個(gè)公式被認(rèn)為是Ce的一個(gè)簡單擴(kuò)展,其中,α是類概率的倒數(shù),或作為交叉驗(yàn)證修復(fù)的超參數(shù),與正負(fù)樣本數(shù)量呈反比,以減少正負(fù)樣本不均衡對(duì)性能的影響。

        由公式可以看出,所有樣本的權(quán)值在標(biāo)準(zhǔn)交叉熵中是一樣的。如果在訓(xùn)練過程中存在前景和背景的類別不平衡,大量的負(fù)樣本的將主導(dǎo)梯度,小量的困難樣本和正樣本將會(huì)被覆蓋,也就難以發(fā)揮作用,使準(zhǔn)確率降低。

        用Focal Loss函數(shù)代替交叉熵來解決類不平衡問題,相當(dāng)于為Ce損失函數(shù)的擴(kuò)展。而對(duì)于難易樣本不均衡的問題,為了增加小目標(biāo)的權(quán)重,類似于權(quán)重因子α,通過增加高斯權(quán)重(Gaussian weight)來改進(jìn)Focal Loss。某一類中的樣本數(shù)越少,高斯權(quán)重就越大,模型就越會(huì)引起注意。 Focal Loss為帶有參數(shù)的交叉熵?fù)p失增加了一個(gè)調(diào)節(jié)因子(1-pt)y。其中y≥0,改進(jìn)的損失函數(shù)表示為:

        Lfl(pt)=-αt(1-pt)ylog(pt)

        (6)

        式(6)既可以調(diào)整正負(fù)樣本不均衡,也可以調(diào)整困難樣本和簡單樣本的不均衡。其中,(1-pt)γ用來調(diào)整困難樣本和簡單樣本的權(quán)重,(1-pt)γ取值范圍為0~1,如果pt值越大,為簡單樣本,則(1-pt)γ值越小,故對(duì)損失函數(shù)的影響更??;如果pt值較小,則為困難樣本,則對(duì)應(yīng)的(1-pt)γ值更大,對(duì)損失函數(shù)影響較大。

        (7)

        其中αt權(quán)重為了改善正負(fù)樣本不平衡,αt是加權(quán)因子,α和γ是2個(gè)可調(diào)參數(shù),ct是每個(gè)類別的數(shù)量。當(dāng)γ=0時(shí),focalloss等于交叉熵,并且隨著γ增加,α不斷減小。在0~1的范圍內(nèi),α越小,負(fù)樣本(具有較大數(shù)量的類別)的權(quán)重越小。通過增加較少數(shù)量類的權(quán)重,通過高斯部分對(duì)αt進(jìn)行了改進(jìn)。

        當(dāng)一個(gè)邊界框被錯(cuò)誤分類時(shí),pt很小,并且(1-pt)γ接近于1,對(duì)分類損失幾乎沒有影響。同樣,當(dāng)分類預(yù)測結(jié)果很好時(shí),即pt接近于1,(1-pt)γ接近于0,這相當(dāng)于減少了簡單樣本的損失。在Lin等[17]的研究中,當(dāng)γ=2和α=0.25時(shí),模型效果最好。在此研究基礎(chǔ)上,應(yīng)用相同的參數(shù)設(shè)置。參數(shù)β和σ控制著每個(gè)類別損失的權(quán)重,確保αt∈[0,1]。

        2.2.2 Faster RCNN模型的損失函數(shù)設(shè)計(jì)

        Faster RCNN的總損失函數(shù)由分類損失和回歸損失組成。該方法對(duì)一幅圖像的具體損失函數(shù)定義為如式(8)所示。

        (8)

        其中,回歸損失函數(shù)Lreg的具體表達(dá)式如式(9)所示。

        (9)

        式(9)中,平滑函數(shù)(smooth function)的定義如式(10)所示。

        (10)

        式中:x為邊界框的預(yù)測誤差,參數(shù)σ用來控制平滑區(qū)域。對(duì)于邊界框回歸采用式(11)中的4個(gè)參數(shù)坐標(biāo)表達(dá)。

        tw=log(w/wa)th=log(h/ha)

        (11)

        式中:x、y、w和h為方框的中心坐標(biāo)及其寬、高。變量x為預(yù)測框、xa為錨框、x*為真值框,這可以看作從錨框到真值框的邊界框回歸。

        2.2.3 改進(jìn)后Faster RCNN模型架構(gòu)

        Faster RCNN檢測模型由4個(gè)部分組成:使用VGG-16提取糧蟲圖像特征,得到特征圖;將特征圖輸入RPN得到區(qū)域建議生成;將特征圖和Proposals輸入到RoI Pooling層得到綜合的Proposals特征;根據(jù)Proposals特征預(yù)測目標(biāo)的邊界框和位置,即分類和邊界框回歸。改進(jìn)后Faster RCNN模型架構(gòu)如圖2所示。

        圖2 改進(jìn)的Faster RCNN網(wǎng)絡(luò)架構(gòu)圖

        基于改進(jìn)的Faster RCNN儲(chǔ)糧害蟲目標(biāo)檢測模型流程包括特征提取、金字塔池化、區(qū)域建議網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)。

        2.3 改進(jìn)后Faster RCNN模型架構(gòu)

        2.3.1 特征提取

        該模塊利用VGG-16作為特征提取網(wǎng)絡(luò),提取原始圖像的特征圖并與Faster RCNN的RPN共享所有的卷積操作。

        2.3.2 金字塔池化模塊PPM

        特征圖經(jīng)過PPM模塊得到融合了整體信息的特征,然后,采用雙線性插值對(duì)低維特征圖上采樣,使其與原始特征圖尺度相同。最后,拼接不同層級(jí)的特征圖得到金字塔池化全局特征。

        2.3.3 RPN網(wǎng)絡(luò)

        RPN通過比較各個(gè)區(qū)域建議的置信度得分和執(zhí)行二值分類任務(wù),判斷每個(gè)建議屬于前景還是背景,并利用錨框回歸得到糧蟲的邊界框。

        2.3.4 全連接網(wǎng)絡(luò)

        通過RoI池化層獲得特征發(fā)送到全連接網(wǎng)絡(luò)進(jìn)行分類和邊界框回歸計(jì)算。在訓(xùn)練階段,需要計(jì)算預(yù)測值與真實(shí)值之間的所有損失,并進(jìn)行反向梯度傳播優(yōu)化。本文模型通過對(duì)給定圖像進(jìn)行輸入,網(wǎng)絡(luò)轉(zhuǎn)發(fā),得到圖像的分類和回歸預(yù)測框。

        3 數(shù)據(jù)集與評(píng)價(jià)標(biāo)準(zhǔn)

        糧蟲數(shù)據(jù)集是目標(biāo)檢測研究的基礎(chǔ),在目標(biāo)檢測任務(wù)中扮演著十分重要的角色。在進(jìn)行糧蟲目標(biāo)檢測任務(wù)時(shí),需要適用性強(qiáng)的數(shù)據(jù)集來有效測試和評(píng)估本文算法的性能。由于該領(lǐng)域目前沒有公開的糧蟲數(shù)據(jù)集,所以本文采用人工采集的方法來制作數(shù)據(jù)集。

        3.1 數(shù)據(jù)集的制作

        儲(chǔ)糧害蟲分為昆蟲和螨類兩類,昆蟲類又分為甲蟲類和蛾類兩種,其中甲蟲類對(duì)糧食谷物的破壞性最強(qiáng),所以本文以甲蟲類儲(chǔ)糧害蟲為研究對(duì)象,選取了赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5 種最主要的甲蟲類儲(chǔ)糧害蟲。拍攝白板背景下圖像時(shí),用鑷子將昆蟲夾出放置實(shí)驗(yàn)平臺(tái)的白紙上,將手機(jī)固定,垂直平臺(tái)進(jìn)行拍攝,選取了赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5 類害蟲,數(shù)據(jù)集名稱為WBGP,如圖3所示;拍攝實(shí)際儲(chǔ)糧背景的糧蟲圖像時(shí)以小麥和大米為背景鋪滿實(shí)驗(yàn)平臺(tái),固定手機(jī),垂直平臺(tái)進(jìn)行拍攝,選取了赤擬谷盜、米象和鋸谷盜3類害蟲,數(shù)據(jù)集名稱為RBGP,如圖4所示。每張圖像的糧蟲數(shù)量為4~10只,白板背景下原始圖像樣本共計(jì)2 601張,實(shí)際背景下原始圖像共計(jì)1317張,昆蟲圖像統(tǒng)一 resize 成了640×480大小。

        圖3 白板背景數(shù)據(jù)集WBGP的糧蟲圖像

        圖4 實(shí)際儲(chǔ)糧背景數(shù)據(jù)集RBGP的糧蟲圖像

        3.2 數(shù)據(jù)增強(qiáng)

        在深度學(xué)習(xí)中,為了增強(qiáng)模型的穩(wěn)定性,提取圖像特征,防止模型過擬合,需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練以提高模型的魯棒性。本文對(duì)圖像進(jìn)行幾何變換、調(diào)節(jié)亮度、添加高斯噪聲等一系列增強(qiáng)操作來豐富糧蟲數(shù)據(jù),幾何變換包括圖像翻轉(zhuǎn)和旋轉(zhuǎn)兩種方法,采用了90°、180°和270°對(duì)圖像進(jìn)行旋轉(zhuǎn)。白板背景下原始圖像數(shù)據(jù)2 601張?jiān)鰪?qiáng)至3 734張,白板背景下數(shù)據(jù)增強(qiáng)前后糧蟲圖像數(shù)量如表1所示,儲(chǔ)糧背景下原始圖像數(shù)據(jù)1 317張?jiān)鰪?qiáng)至2 074張,儲(chǔ)糧背景數(shù)據(jù)增強(qiáng)前后糧蟲圖像數(shù)量如表2所示,平均每種糧蟲圖像700張,每幅圖像上糧蟲4~10只。最后,按照7∶1∶2的比例[18]構(gòu)建訓(xùn)練集、驗(yàn)證集和測試集。

        表1 白板背景數(shù)據(jù)集WBGP的糧蟲圖像數(shù)量

        表2 實(shí)際儲(chǔ)糧背景數(shù)據(jù)集RBGP的糧蟲圖像數(shù)量

        3.3 性能評(píng)價(jià)指標(biāo)

        本研究采用精確度(P)、召回率(R)、平均精確度(AP)和平均精確度均值(mAP)[19]和來評(píng)估目標(biāo)檢測模型的性能。目標(biāo)檢測模型的分類和定位能力是其最主要的性能體現(xiàn),而mAP值是其最直觀的表達(dá)方式,mAP值越大,表明該模型的精度越高。其中, mAP的計(jì)算公式為,Q代表目標(biāo)類別數(shù):

        (12)

        4 結(jié)果與分析

        4.1 實(shí)驗(yàn)環(huán)境

        本實(shí)驗(yàn)根據(jù)PyTorch的運(yùn)行環(huán)境要求在計(jì)算機(jī)進(jìn)行環(huán)境的搭建,參數(shù)如表3所示。

        表3 實(shí)驗(yàn)環(huán)境配置參數(shù)

        選用的GPU最大分辨率為7 680×4 320,能夠處理大量圖像數(shù)據(jù),加快網(wǎng)絡(luò)模型的訓(xùn)練速度,從而提高圖像處理速度和模型訓(xùn)練效率。

        4.2 定性分析

        算法實(shí)驗(yàn)過程中用糧蟲相對(duì)應(yīng)的拼音縮寫表示糧蟲的種類,其中“chini”表示赤擬谷盜,“mixing”表示米象,“jugudao”表示鋸谷盜,“yancojia”表示煙草甲,“xiuchi”表示銹赤扁谷盜。

        Faster RCNN算法在白板背景數(shù)據(jù)集的檢測結(jié)果對(duì)比如圖5所示,圖5a是Faster RCNN算法的檢測效果,圖5b是Faster RCNN算法改進(jìn)后的檢測效果。

        圖5 白板背景數(shù)據(jù)集Faster RCNN算法改進(jìn)前后檢測效果對(duì)比圖

        圖6是實(shí)際儲(chǔ)糧背景數(shù)據(jù)集中Faster RCNN算法改進(jìn)前后對(duì)3種糧蟲的檢測結(jié)果對(duì)比,其中圖6a是Faster RCNN算法的檢測效果圖,圖6b是Faster RCNN算法改進(jìn)后的檢測效果圖。對(duì)比Faster RCNN算法改進(jìn)前后的檢測結(jié)果可以發(fā)現(xiàn),圖像中每只糧蟲被檢測的概率值都有了明顯的提升,改進(jìn)后Faster RCNN算法的精度有了一定提高,同時(shí)避免了一些漏檢。

        圖6 儲(chǔ)糧背景數(shù)據(jù)集的Faster RCNN算法改進(jìn)前后檢測效果對(duì)比圖

        4.3 定量分析

        SSD作為深度學(xué)習(xí)中的典型單階段目標(biāo)檢測算法,具有精度高、速度快的特點(diǎn)。本實(shí)驗(yàn)針對(duì)2.1和2.2中的優(yōu)化方案,對(duì)比SSD算法與改進(jìn)前后Faster RCNN算法在白板背景數(shù)據(jù)集的糧蟲檢測實(shí)驗(yàn)結(jié)果,如表4所示,在實(shí)際儲(chǔ)糧背景數(shù)據(jù)集的糧蟲檢測對(duì)比實(shí)驗(yàn)結(jié)果如表5所示。

        白板背景數(shù)據(jù)集一共有五類糧蟲目標(biāo),分別是銹赤扁谷盜、米象、鋸谷盜、煙草甲、銹赤扁谷盜。從表4可以看出,不同種類糧蟲的檢測效果存在差異,在白板背景下SSD算法對(duì)糧蟲小目標(biāo)的檢測效果不佳,每類糧蟲的mAP值都低于改進(jìn)前后的Faster RCNN算法,使用改進(jìn)的Faster RCNN算法后整個(gè)數(shù)據(jù)集的mAP從88.52%提升到了89.42%,上升了0.90%,其中赤擬谷盜的mAP從87.46%提升到了89.73%,上升了2.27%,提升效果最好,該算法對(duì)糧蟲小目標(biāo)的檢測能力有一定的改善。通過對(duì)Faster RCNN模型進(jìn)行改進(jìn),每類糧蟲的mAP都有提升,檢測效果都比原始算法的更好,說明了該改進(jìn)算法對(duì)糧蟲小目標(biāo)具有提升效果。

        實(shí)際儲(chǔ)糧背景數(shù)據(jù)集中一共有三類糧蟲,分別是赤擬谷盜、米象和鋸谷盜。從表5中可以看出,在儲(chǔ)糧背景下SSD算法對(duì)每類糧蟲的檢測mAP值都低于Faster RCNN算法,整個(gè)數(shù)據(jù)集的mAP值為76.60%,對(duì)比Faster RCNN算法的87.66%,低了11.06%,驗(yàn)證了本文選擇Faster RCNN算法的正確性;使用改進(jìn)Faster RCNN算法后,每種糧蟲的檢測精度都有提升,且各不相同,整個(gè)數(shù)據(jù)集的mAP從87.66%提升到了90.12%,上升了2.46%,其中赤擬谷盜的mAP從84.51%提升到了89.98%,上升了5.47%,也是提升效果最好的種類。說明了該改進(jìn)算法對(duì)實(shí)際儲(chǔ)糧背景下糧蟲數(shù)據(jù)集的檢測性能也有一定的改善,證明了本章改進(jìn)方法對(duì)糧蟲目標(biāo)檢測的有效性。

        對(duì)比表4和表5,發(fā)現(xiàn)使用原始Faster RCNN算法時(shí),在儲(chǔ)糧背景下整個(gè)數(shù)據(jù)集的mAP比白板背景數(shù)據(jù)集糧蟲的mAP值低,但在改進(jìn)后的Faster RCNN算法中結(jié)果正好相反,改進(jìn)后的Faster RCNN算法在儲(chǔ)糧背景數(shù)據(jù)集的mAP比白板背景數(shù)據(jù)集的mAP高,說明本改進(jìn)方法在實(shí)際儲(chǔ)糧環(huán)境的糧蟲檢測提升效果更明顯,更具實(shí)用價(jià)值。另一方面,在2個(gè)數(shù)據(jù)集中,由于赤擬谷盜的體積的體積形態(tài)都是最大的,在糧蟲圖像中所占的像素更多,而且提升效果也是最明顯的,說明目標(biāo)的尺度越大,特征就越明顯,檢測效果也會(huì)更好。

        表4 白板背景糧蟲數(shù)據(jù)集下改進(jìn)Faster RCNN算法的實(shí)驗(yàn)對(duì)比

        表5 實(shí)際儲(chǔ)糧背景糧蟲數(shù)據(jù)集下改進(jìn)Faster RCNN算法的實(shí)驗(yàn)對(duì)比

        5 結(jié)論

        儲(chǔ)糧安全關(guān)系社會(huì)穩(wěn)定發(fā)展,高效的糧蟲檢測方法有助于構(gòu)建綠色倉儲(chǔ)環(huán)境。本研究針對(duì)糧蟲目標(biāo)體積小、檢測難度大的問題以及原始Faster RCNN模型在檢測糧蟲目標(biāo)時(shí)精度和檢測效率兩方面的不足,提出了一種改進(jìn)的Faster RCNN糧蟲檢測模型。通過引用金字塔池化模塊融合全局上下信息,優(yōu)化分類損失來解決分類過程的樣本不平衡問題,解決了糧蟲相似度高,產(chǎn)生較多陰性樣本的問題。實(shí)驗(yàn)表明本文采用的改進(jìn)Faster RCNN算法對(duì)白板背景和實(shí)際儲(chǔ)糧背景糧蟲目標(biāo)檢測的有效性。后續(xù)工作將構(gòu)建種類更全的糧蟲數(shù)據(jù)集,增加算法對(duì)不同種類糧蟲的泛化性。

        猜你喜歡
        背景特征檢測
        “新四化”背景下汽車NVH的發(fā)展趨勢
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        《論持久戰(zhàn)》的寫作背景
        如何表達(dá)“特征”
        不忠誠的四個(gè)特征
        抓住特征巧觀察
        晚清外語翻譯人才培養(yǎng)的背景
        小波變換在PCB缺陷檢測中的應(yīng)用
        精品一区二区三区牛牛| 亚洲性无码av在线| 亚洲AV无码精品一区二区三区l| 激情一区二区三区视频| 国产激情自拍在线视频| 好吊妞无缓冲视频观看| av无码久久久久久不卡网站 | 日本人与黑人做爰视频网站| 婷婷九月丁香| 国产日韩乱码精品一区二区| 手机看片自拍偷拍福利| 国产精品无码午夜福利| 亚洲午夜无码AV不卡| 91久久精品一二三区色| 插上翅膀插上科学的翅膀飞| 日韩av精品国产av精品| 久久精品亚洲中文无东京热| 手机在线国产福利av| 亚洲精品久久激情国产片| 亚洲国产成人久久一区www| 国产成人亚洲精品2020| 亚洲av乱码一区二区三区人人 | 日本不卡一区二区三区在线视频| 国产精品无码无在线观看| 日韩另类在线| 美女被插到高潮嗷嗷叫| 午夜天堂一区人妻| www国产无套内射com| 99久久综合国产精品免费| 日韩有码在线一区二区三区合集| 精品成在人线av无码免费看| 人妻在卧室被老板疯狂进入国产| 激情五月天俺也去综合网| 国语对白福利在线观看| 狠狠色噜噜狠狠狠888米奇视频 | 免费无码av片在线观看| 亚洲高清一区二区三区在线观看| 三区中文字幕在线观看| 无码福利写真片视频在线播放| 一本一本久久久久a久久综合激情| 亚洲国产精品久久性色av|