亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)YOLOv5的叉車能效優(yōu)化方法研究

        2021-08-19 08:23:58李青青李陳斌李鎮(zhèn)宇陸可
        現(xiàn)代計(jì)算機(jī) 2021年21期
        關(guān)鍵詞:特征檢測(cè)模型

        李青青,李陳斌,李鎮(zhèn)宇,陸可

        (1.安徽工業(yè)大學(xué)管理科學(xué)與工程學(xué)院,馬鞍山243000;2.哈爾濱工業(yè)大學(xué)計(jì)算學(xué)部,哈爾濱150013;3.上海應(yīng)用技術(shù)大學(xué)經(jīng)濟(jì)與管理學(xué)院,上海200235)

        0 引言

        機(jī)器視覺(jué)被越來(lái)越廣泛的應(yīng)用于無(wú)人工廠、智能控制等場(chǎng)景中。在工業(yè)物流系統(tǒng)中,叉車在搬運(yùn)和存儲(chǔ)環(huán)節(jié)中扮演著重要角色。然而,大部分工廠內(nèi)部叉車數(shù)量大、運(yùn)送路線復(fù)雜,并且對(duì)搬運(yùn)的貨物采用人工統(tǒng)計(jì)、紙質(zhì)保存等傳統(tǒng)方式進(jìn)行管理,難以對(duì)叉車的工作效率進(jìn)行有效評(píng)估。因此,本文提出一種基于機(jī)器視覺(jué)統(tǒng)計(jì)裝卸貨物次數(shù)的方法,對(duì)叉車工作效率進(jìn)行分析和記錄。

        近年來(lái),許多學(xué)者在不同領(lǐng)域?qū)C(jī)器視覺(jué)進(jìn)行深入研究。物體檢測(cè)是機(jī)器視覺(jué)領(lǐng)域的基礎(chǔ)性研究,對(duì)后續(xù)能效管理、自動(dòng)識(shí)別等任務(wù)起著至關(guān)重要的作用。傳統(tǒng)的檢測(cè)是通過(guò)傳感器判斷托盤貨物的狀態(tài)。文獻(xiàn)[1]使用傳感器與激光雷達(dá)結(jié)合,通過(guò)聯(lián)合標(biāo)定和配準(zhǔn)來(lái)實(shí)現(xiàn)對(duì)叉車托盤的檢測(cè),但是價(jià)格昂貴,無(wú)法普及使用。文獻(xiàn)[2-3]基于顏色和幾何要素生成特征信息,應(yīng)用具有針對(duì)性,但是易受光照與噪聲的影響。隨著深度學(xué)習(xí)的發(fā)展以及硬件水平的提高,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù),取得了劃時(shí)代的發(fā)展。從最初的R-CNN[4]、OverFeat[5]、到后來(lái)的Fast R-CNN[6]、進(jìn)階版的Faster R-CNN[7]、SSD[8]以及YOLO系列,網(wǎng)絡(luò)架構(gòu)實(shí)現(xiàn)從雙階段到單階段的革新。從面向PC端R-CNN到手機(jī)端MobileNet[10],目標(biāo)檢測(cè)技術(shù)在不同終端上展現(xiàn)了出色的檢測(cè)效果和性能。文獻(xiàn)[11]利用托盤孔位置的焦點(diǎn)特征進(jìn)行托盤識(shí)別,要求存在托盤孔,限制因素較高。文獻(xiàn)[12]利用改進(jìn)的DenseNet算法對(duì)實(shí)際場(chǎng)景下的托盤進(jìn)行檢測(cè),實(shí)驗(yàn)場(chǎng)景環(huán)境單一,檢測(cè)效果一般。所以將機(jī)器視覺(jué)應(yīng)用于實(shí)際場(chǎng)景中,存在網(wǎng)絡(luò)模型較大、參數(shù)多、嵌入性差的問(wèn)題,導(dǎo)致計(jì)算量大、硬件要求高的問(wèn)題。

        為了解決上述問(wèn)題,適應(yīng)作業(yè)環(huán)境的復(fù)雜多樣性,首先在通用數(shù)據(jù)集的基礎(chǔ)上增加了符合實(shí)地應(yīng)用場(chǎng)景的數(shù)據(jù)。其次,對(duì)于現(xiàn)場(chǎng)硬件的限制性,難以嵌入大規(guī)模的應(yīng)用程序,改進(jìn)了YOLOv5的主干網(wǎng)絡(luò)結(jié)構(gòu),使用更輕量級(jí)的特征提取網(wǎng)絡(luò)減少網(wǎng)絡(luò)的冗余特征。為保證減少網(wǎng)絡(luò)運(yùn)算量的前提下,不降低網(wǎng)絡(luò)檢測(cè)的準(zhǔn)確度,故增加了注意力機(jī)制,更具針對(duì)性地提取圖像的目標(biāo)特征信息,提高網(wǎng)絡(luò)的準(zhǔn)確度。實(shí)驗(yàn)結(jié)果表明,在不同復(fù)雜度場(chǎng)景下,與原始的YOLOv5算法比較,改進(jìn)后的網(wǎng)絡(luò)在魯棒性和準(zhǔn)確度顯著提高。

        1 檢測(cè)場(chǎng)景流程

        1.1 網(wǎng)絡(luò)結(jié)構(gòu)框架

        首先,本文將單目2D相機(jī)部署在叉車駕駛室的頂端,檢測(cè)到叉車前向托盤立面局部貨物。在獲取實(shí)際場(chǎng)景下視頻流的基礎(chǔ)上,對(duì)視頻進(jìn)行分幀操作,截取間隔若干幀的不同時(shí)段的圖片。然后對(duì)圖像進(jìn)行聚類分析,建立所有圖像之間的相似度函數(shù)。利用相似度函數(shù)分析截取到的圖片之間的相似程度,設(shè)定一定閾值對(duì)相似程度高的圖片進(jìn)行重復(fù)篩選,避免人工挑選的時(shí)間成本和主觀判斷的差異。最終圖片作為自建數(shù)據(jù)集的源文件,通過(guò)標(biāo)注后得到不同場(chǎng)景下的類別數(shù)據(jù)。選取YOLOv5算法作為機(jī)器視覺(jué)的檢測(cè)算法,實(shí)現(xiàn)對(duì)叉車運(yùn)輸狀態(tài)的實(shí)時(shí)準(zhǔn)確獲取。對(duì)現(xiàn)實(shí)場(chǎng)景進(jìn)行目標(biāo)檢測(cè)的流程設(shè)計(jì)如圖1所示。

        圖1 檢測(cè)場(chǎng)景系統(tǒng)框架

        1.2 實(shí)驗(yàn)數(shù)據(jù)集

        本文圍繞VOC數(shù)據(jù)集和自建數(shù)據(jù)集進(jìn)行算法效果的對(duì)比實(shí)驗(yàn)。VOC數(shù)據(jù)集是擁有多項(xiàng)功能的數(shù)據(jù)集,包含20類目標(biāo),數(shù)量超過(guò)5萬(wàn)張,以XML數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)。VOC數(shù)據(jù)集雖然包含著大量標(biāo)注數(shù)據(jù),但是適用于實(shí)際工業(yè)應(yīng)用場(chǎng)景比較少。

        本文仿照VOC數(shù)據(jù)集制作了一個(gè)專門用于檢測(cè)叉車貨物的數(shù)據(jù)集,用于提高網(wǎng)絡(luò)性能。該數(shù)據(jù)集從實(shí)地車間駕駛員行車過(guò)程中跟拍獲取視頻,采集到不同天氣、不同時(shí)間段(夜景也在內(nèi))、不同地點(diǎn)的復(fù)雜樣本數(shù)據(jù)。通過(guò)后續(xù)對(duì)視頻的分幀、聚類,挑選出叉車托盤貨物中含有滿盤、半盤、空載、上下料過(guò)程的四種不同復(fù)雜場(chǎng)景。最后使用labelImg軟件對(duì)采集圖片進(jìn)行矩形框標(biāo)定,生成對(duì)應(yīng)的XML文件,用于訓(xùn)練和測(cè)試。自建叉車貨物數(shù)據(jù)集更貼合工廠場(chǎng)景,同時(shí)復(fù)雜多變,對(duì)于目標(biāo)檢測(cè)網(wǎng)絡(luò)的性能具有更大的挑戰(zhàn)性。

        1.3 數(shù)據(jù)聚類分析

        本文應(yīng)用的場(chǎng)景中,數(shù)據(jù)以視頻的形式存儲(chǔ),而實(shí)際使用的數(shù)據(jù)集是以圖像的格式作為輸入,所以要對(duì)原始的數(shù)據(jù)進(jìn)行預(yù)處理操作。數(shù)據(jù)預(yù)處理流程如圖2所示。首先對(duì)視頻數(shù)據(jù)處理,對(duì)輸入的視頻進(jìn)行采集和編號(hào),并將編號(hào)后的視頻輸入存儲(chǔ)模塊。然后對(duì)視頻進(jìn)行預(yù)處理操作,在利用高斯濾波濾除編號(hào)視頻噪聲的基礎(chǔ)上,再進(jìn)行分幀處理。在預(yù)設(shè)時(shí)間間隔下保證幀長(zhǎng)有效性,得到若干獨(dú)立的預(yù)處理圖像。視頻通過(guò)預(yù)處理模塊首先對(duì)視頻間隔為60幀頻率取一張圖片,并進(jìn)行存儲(chǔ)操作。在保證圖像清晰的前提下,每個(gè)視頻約提取5000張圖片,所有視頻數(shù)據(jù)共計(jì)生成90739張圖片。

        圖2 數(shù)據(jù)分幀聚類處理

        由于分幀后處理的數(shù)據(jù)量較大,圖片與圖片之間的差異性較小,通過(guò)聚類過(guò)后易于對(duì)圖片進(jìn)行刪減。我們首先將原始圖像看作是一個(gè)高維向量,將數(shù)據(jù)由高維向低維投影,進(jìn)行坐標(biāo)的線性轉(zhuǎn)換。常見(jiàn)的數(shù)據(jù)降維方法包括主成分分析,奇異值分解等。我們采用PCA(Principal Component Analysis)算法進(jìn)行降維,便于有效信息的提取和剔除無(wú)用信息。降維公式如下:

        進(jìn)行降維后,提取圖片本身具有的特征,從而判斷兩兩圖片之間的相似程度。通過(guò)計(jì)算相鄰圖片特征的相似性,設(shè)定合理閾值解決自建數(shù)據(jù)集冗余的問(wèn)題。

        v1是圖像1降維后的向量形式,v2是圖像2的向量形式,也可以理解為概率論上的樣本點(diǎn)。conv(v1,v2)為v1與v2的協(xié)方差,var(v1)為v1的方差,var(v2)為v2的方差。

        針對(duì)相似度高無(wú)法識(shí)別的圖片,提取圖片更深層的語(yǔ)義信息,利用圖片多層次特征預(yù)防刪除過(guò)度情況。為了平衡聚類效果以及運(yùn)算時(shí)間成本,將本實(shí)驗(yàn)聚類數(shù)目設(shè)置為9,通過(guò)每個(gè)類簇的協(xié)方差來(lái)決定簇類分布的形狀。經(jīng)反復(fù)迭代訓(xùn)練后,處理速度可達(dá)28bit/s,最終獲得貼合數(shù)據(jù)集的模型。聚類效果如圖3所示,不同散點(diǎn)群組間距離越遠(yuǎn),相似度越低。

        圖3 聚類效果

        2 基于機(jī)器視覺(jué)的叉車能效檢測(cè)

        YOLOv5網(wǎng)絡(luò)框架主要由三個(gè)模塊組成,框架如圖4所示。首先是提取特征的主干網(wǎng)絡(luò)CSPNet[13],在不同圖片上提取細(xì)粒度級(jí)特征,提取豐富的語(yǔ)義信息和位置信息。模型的head模塊包括PANet[14]和head檢測(cè)部分,路徑聯(lián)合網(wǎng)絡(luò)PANet網(wǎng)絡(luò)可以對(duì)主干提取的特征進(jìn)行特征融合。對(duì)于不同尺度目標(biāo)的檢測(cè),特征金字塔結(jié)構(gòu)會(huì)強(qiáng)化訓(xùn)練好的模型,有利于對(duì)不同大小的同一目標(biāo)識(shí)別問(wèn)題。Head檢測(cè)層將預(yù)測(cè)出的目標(biāo)框映射到對(duì)應(yīng)的特征圖上,最終輸出包含目標(biāo)所屬類別概率、對(duì)象得分和包圍框的坐標(biāo)的向量。

        圖4 YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)

        在實(shí)際工業(yè)場(chǎng)景中,一方面現(xiàn)有數(shù)據(jù)集類似于PASCAL VOC(以下簡(jiǎn)稱VOC)、COCO等公共數(shù)據(jù)集與實(shí)際場(chǎng)景的耦合性較差,模型適配性較低。另一方面,原始算法對(duì)現(xiàn)場(chǎng)設(shè)備性能要求過(guò)高,難以嵌入。對(duì)于以上問(wèn)題,首先,自建了符合現(xiàn)實(shí)場(chǎng)景的數(shù)據(jù)集,在公共數(shù)據(jù)集的基礎(chǔ)上滿足實(shí)地檢測(cè)要求。其次,對(duì)YO?LOv5網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了改進(jìn),通過(guò)GhostBottleneck(以下簡(jiǎn)稱GB層)層代替BottleneckCSP網(wǎng)絡(luò)層,縮減網(wǎng)絡(luò)參數(shù)。同時(shí)新增了Squeeze-and-Excitation注意力機(jī)制模塊(以下簡(jiǎn)稱SE模塊),對(duì)主干網(wǎng)絡(luò)的提取特征重新組合,更好擬合網(wǎng)路通道之間復(fù)雜的相關(guān)性,提取更具針對(duì)性的特征。

        2.1 GhostBottleneck模塊

        在實(shí)際場(chǎng)景下,由于現(xiàn)場(chǎng)設(shè)備空間布局的設(shè)計(jì),硬件算力有限,限制了深度學(xué)習(xí)的應(yīng)用。針對(duì)此問(wèn)題,我們采用為移動(dòng)設(shè)備設(shè)計(jì)的GhostNet[15]網(wǎng)絡(luò)結(jié)構(gòu),其核心是利用線性操作來(lái)生成豐富的特征圖。原始的Bottle?neck網(wǎng)絡(luò)中,在提取特征的過(guò)程中生成過(guò)多冗余特征圖,占用硬件內(nèi)存時(shí)還影響網(wǎng)絡(luò)的運(yùn)行速度。本文使用GB網(wǎng)絡(luò)結(jié)構(gòu)代替YOLO中的BottleneckCSP結(jié)構(gòu)。我們將網(wǎng)絡(luò)拆分成shortcut和conv堆疊兩個(gè)部分,使用一部分普通卷積獲取特征圖,其他特征圖使用5×5的線性卷積操作,從而在減少一半計(jì)算量的同時(shí),依舊能獲取相同數(shù)量的特征圖。框架繪制如圖5所示。

        圖5 GhostBottleNeck框架

        特征圖經(jīng)過(guò)一個(gè)Ghostconv卷積過(guò)后,判斷傳入的stride參數(shù)是否為1。當(dāng)判斷stride不等于1時(shí),則執(zhí)行DWconv層,實(shí)現(xiàn)對(duì)輸入特征層的下采樣,減少網(wǎng)絡(luò)的運(yùn)算參數(shù),特征圖會(huì)縮小為原來(lái)的一半,網(wǎng)絡(luò)層的深度加深。當(dāng)stride等于1時(shí),網(wǎng)絡(luò)會(huì)經(jīng)過(guò)Ghostconv層進(jìn)行特征提取,實(shí)現(xiàn)通道數(shù)的擴(kuò)展。最終對(duì)前幾層的輸出進(jìn)行整合操作。這樣我們?cè)O(shè)置網(wǎng)絡(luò)步長(zhǎng)大小的同時(shí),使得網(wǎng)絡(luò)結(jié)構(gòu)更富有靈活性和選擇性。

        與此同時(shí),由于梯度發(fā)散,單純?cè)黾泳W(wǎng)絡(luò)深度難以簡(jiǎn)單地提高網(wǎng)絡(luò)的效果,反而可能損害模型的效果。本文使用shortcut模塊,對(duì)上一層的網(wǎng)絡(luò)進(jìn)行DWconv層的操作,與Conv堆疊塊相似,選擇傳入的stride參數(shù)來(lái)進(jìn)行控制是否進(jìn)行卷積操作。增加的shortcut模塊就是為了保證加深網(wǎng)絡(luò)深度的同時(shí),自適應(yīng)地調(diào)節(jié)網(wǎng)絡(luò)的輸出通道數(shù),便于維持模型的效果。

        為了實(shí)現(xiàn)網(wǎng)絡(luò)的輕量化,因此本文采用了Ghost?Conv卷積模塊,繪制如圖6所示。首先使用1×1大小的普通卷積層CV1實(shí)現(xiàn)更深層的特征提取。并且為了保證特征圖細(xì)節(jié)信息的獲取,分離出多尺度的局部特征信息。對(duì)前層輸出數(shù)據(jù)分組成組特征,每個(gè)特征使用5×5大小的卷積核經(jīng)過(guò)線性變換,提取更深層次的特征。最終將網(wǎng)絡(luò)每一個(gè)模塊可執(zhí)行一組轉(zhuǎn)換,在一個(gè)低維嵌入上執(zhí)行每組轉(zhuǎn)換,通過(guò)求和合并輸出。網(wǎng)絡(luò)通過(guò)分組卷積的方式來(lái)達(dá)到分組效果和卷積數(shù)量?jī)蓚€(gè)方式的平衡,最終可以在減少網(wǎng)絡(luò)參數(shù)的同時(shí)還降低模型的復(fù)雜度。

        圖6 GhostConv網(wǎng)絡(luò)

        使用了GhostConv過(guò)后,本文又結(jié)合了DWconv對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化。DWconv層使用1×1的卷積神經(jīng)網(wǎng)絡(luò),設(shè)置網(wǎng)絡(luò)輸入輸出的最大公約數(shù)作為劃分群的個(gè)數(shù),采用分組數(shù)量等于輸入通道數(shù)量,即每個(gè)通道作為一個(gè)小組分別進(jìn)行卷積,最終將每組結(jié)果聯(lián)結(jié)作為輸出。

        2.2 SE(Squeeze-and-Excitation)模塊

        考慮到本文的檢測(cè)目標(biāo)物體面積較大,小目標(biāo)物體較少,而在卷積池化的過(guò)程中,不同通道特征所占的重要性相同,造成信息損失問(wèn)題。SE模塊[16]是HU等人提出來(lái)的通過(guò)關(guān)注通道之間的關(guān)系,解決不同通道特征信息影響因子不同的問(wèn)題。

        SE模塊包括Squeeze(壓縮)和Excitation(激發(fā))兩個(gè)操作。在改進(jìn)后GB層不斷進(jìn)行通道堆疊過(guò)后,會(huì)產(chǎn)生參數(shù)量大,模型容易過(guò)擬合的問(wèn)題。我們首先利用Squeeze通過(guò)在Feature Map層上執(zhí)行Global Average Pooling,輸出1×1×channel的特征圖對(duì)整個(gè)網(wǎng)路做正則化以防止過(guò)擬合。其公式如下:

        H表示輸入特征圖的高度,W表示輸入特征圖的寬度。Excitation操作通過(guò)兩層全連接結(jié)構(gòu)獲取通道間聯(lián)系。然后接一個(gè)sigmoid激活函數(shù)層來(lái)保證輸出的權(quán)重在[0,1]區(qū)間內(nèi)。此時(shí)sigmoid函數(shù)的門機(jī)制,選擇更加重要的特征交互傳遞到更深層。公式如下:

        其中r為升降維比率,為降維層參數(shù),為升維層參數(shù),ReLU是其激活函數(shù)。最后一步是Scale層,將學(xué)習(xí)sigmoid層各通道歸一化權(quán)重加權(quán)到原始特征上。

        我們自建數(shù)據(jù)集中的圖片,在特征表現(xiàn)上有很強(qiáng)的指向性,特征較少的位置信息對(duì)整體網(wǎng)絡(luò)檢測(cè)和識(shí)別的影響有限。我們使用SE模塊控制scale的大小,對(duì)不同層的特征圖提取的特征指向性更強(qiáng)。雖然增加SE模塊層會(huì)相應(yīng)增加網(wǎng)絡(luò)模型的參數(shù)和計(jì)算量,對(duì)于模型參數(shù)增加量為:

        其中r為降維系數(shù),S為stage數(shù)量,Cs表示第s個(gè)stage的通道數(shù),Ns是第s個(gè)stage的block重復(fù)次數(shù)。SE模塊不可避免地增加了一些參數(shù)和計(jì)算量,但是在改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)中表現(xiàn)出更好的性能效果。

        2.3 改進(jìn)后的YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)

        改進(jìn)后的YOLOv5算法主干網(wǎng)絡(luò)如圖7所示,通過(guò)使用GB層對(duì)輸入進(jìn)行特征提取,不影響網(wǎng)絡(luò)特征提取效果的基礎(chǔ)上,使用步長(zhǎng)為1的GB層代替原有的提取特征層。步長(zhǎng)為2的GB層代替普通卷積層。再增加SE模塊動(dòng)態(tài)自適應(yīng)完成在GB層通道維度上對(duì)原始特征進(jìn)行雙重驗(yàn)證,關(guān)注了模型通道層面的依賴關(guān)系。一方面,我們使用GB層的線性變換降低模型的大小,減少模型的運(yùn)算成本。另一方面,結(jié)合使用SE模塊針對(duì)性提取不同重要性的特征,使得網(wǎng)絡(luò)剪枝的效果更加明顯,對(duì)GB層提取的特征更具有魯棒性和精確度。

        圖7 改進(jìn)的YOLOv5主干網(wǎng)絡(luò)結(jié)構(gòu)

        增加的SE模塊中,經(jīng)過(guò)前面一系列的卷積操作和注意力機(jī)制層,會(huì)輸出豐富的全局語(yǔ)義信息,但對(duì)局部的特征信息較少。我們?cè)诰W(wǎng)絡(luò)的后端增加空間金字塔池化層(Spatial Pyramid Pooling,SPP),對(duì)網(wǎng)絡(luò)的前向卷積進(jìn)行特征融合,從而獲取更加豐富的局部特征信息。

        3 實(shí)驗(yàn)設(shè)計(jì)

        3.1 網(wǎng)絡(luò)訓(xùn)練

        本次實(shí)驗(yàn)所用到的軟硬件配置如表1所示,實(shí)驗(yàn)框架基于PyTorch開(kāi)發(fā)。

        表1 實(shí)驗(yàn)配置

        經(jīng)過(guò)網(wǎng)絡(luò)中的Neck模塊過(guò)后得到挑選的候選框,訓(xùn)練過(guò)程中會(huì)得到每一個(gè)框的屬性。其中一個(gè)指標(biāo)是準(zhǔn)確率(Precision,P),即遍歷過(guò)的預(yù)測(cè)框中,屬于正確預(yù)測(cè)邊框的比值。其中若正確地檢測(cè)出來(lái)托盤貨物則為真正類(True Positive),若對(duì)于未裝載貨物的托盤檢測(cè)為有貨物則為假正類(False Positive)。檢測(cè)準(zhǔn)確率為:

        3.2 檢測(cè)的準(zhǔn)確度

        將實(shí)驗(yàn)的1172張樣本集分成10份,將其中的9份作為訓(xùn)練集,剩下的1份作為交叉驗(yàn)證集,最終取所有類別平均誤差,得到以下評(píng)估模型性能數(shù)據(jù)。本實(shí)驗(yàn)從mAP準(zhǔn)確度的指標(biāo)來(lái)衡量,對(duì)原始的YOLOv5算法和改進(jìn)后的進(jìn)行比較分析。

        為了驗(yàn)證算法的魯棒性對(duì)兩種算法兩個(gè)尺度各進(jìn)行測(cè)試分析。結(jié)果如圖8所示,原始的YOLOv5用細(xì)線條表示,改進(jìn)后的網(wǎng)絡(luò)用粗線條表示。從圖中可看出,改進(jìn)后的YOLOv5網(wǎng)絡(luò)在保持較高準(zhǔn)確度的基礎(chǔ)上,波動(dòng)水平較低,說(shuō)明模型更加魯棒。

        圖8 不同網(wǎng)絡(luò)下的準(zhǔn)確率測(cè)試

        為了驗(yàn)證本文算法的有效性,將算法與更輕量級(jí)YOLO-fastest的性能進(jìn)行比較。由表2結(jié)果表明,在自建的倉(cāng)儲(chǔ)托盤數(shù)據(jù)集上改進(jìn)后的YOLOv5 mAP達(dá)到了99.1%,相對(duì)于原始網(wǎng)絡(luò)mAP可提高0.9%,相對(duì)于更加輕量級(jí)的YOLO-fastest提高了2.31%。保證原有檢測(cè)效果下,模型大小僅有5.4MB,模型的大小降低了67%。因此,本文算法在保證托盤貨物叉車預(yù)測(cè)精準(zhǔn)度下,模型占用內(nèi)存小,更適用于樹(shù)莓派、嵌入式電子設(shè)備等低端設(shè)備。

        表2 不同網(wǎng)絡(luò)的準(zhǔn)確率測(cè)試值

        經(jīng)實(shí)驗(yàn)可發(fā)現(xiàn),改進(jìn)后的YOLOv5-SE與其他算法評(píng)估其網(wǎng)絡(luò)性能,在相同數(shù)據(jù)集下表現(xiàn)效果如表3所示,在增加網(wǎng)絡(luò)層數(shù)的同時(shí),模型參數(shù)雖然有所增加,處理圖像的速度比改進(jìn)前的慢0.005s,但是依舊能滿足現(xiàn)實(shí)場(chǎng)景實(shí)時(shí)檢測(cè)的需求。

        表3 不同網(wǎng)絡(luò)的參數(shù)比較

        3.3 實(shí)際檢測(cè)結(jié)果

        算法從實(shí)際工廠情景下出發(fā),將訓(xùn)練好的模型應(yīng)用于實(shí)地工業(yè)場(chǎng)景,算法能夠完備地嵌入到工業(yè)應(yīng)用現(xiàn)場(chǎng)。在叉車運(yùn)行過(guò)程中,實(shí)現(xiàn)了實(shí)時(shí)檢測(cè)的基礎(chǔ)上,準(zhǔn)確度維持較高水平。實(shí)驗(yàn)評(píng)估測(cè)試的結(jié)果如圖9所示,表明在很大程度遮掩、工廠背景嘈雜、不同姿態(tài)的托盤情況下,網(wǎng)絡(luò)模型依然取得了很好的檢測(cè)精度。

        圖9 改進(jìn)后的YOLOv5叉車托盤預(yù)測(cè)圖

        4 結(jié)語(yǔ)

        本文提出了一種改進(jìn)的YOLOv5算法用于統(tǒng)計(jì)叉車不同狀態(tài)下裝卸貨物的次數(shù),自建了基于實(shí)際工廠倉(cāng)儲(chǔ)叉車運(yùn)輸?shù)臄?shù)據(jù)集用于訓(xùn)練,修改了主干網(wǎng)絡(luò)以降低算法的運(yùn)算量,并引入注意力機(jī)制提取有效特征信息。改進(jìn)后的YOLOv5模型小、更輕量級(jí),易于進(jìn)行嵌入式的開(kāi)發(fā)。在叉車運(yùn)行時(shí)面對(duì)復(fù)雜的場(chǎng)景魯棒性強(qiáng),能保持較好的檢測(cè)性能。但在測(cè)試的過(guò)程中也發(fā)現(xiàn)存在預(yù)測(cè)框的邊沿并不理想的情況,與檢測(cè)托盤當(dāng)前所屬狀態(tài)存在偏差,接下來(lái)我們將會(huì)這項(xiàng)工作進(jìn)行重點(diǎn)改進(jìn),設(shè)計(jì)更好性能的YOLOv5模型。

        猜你喜歡
        特征檢測(cè)模型
        一半模型
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        3D打印中的模型分割與打包
        大学生高潮无套内谢视频| 免费啪啪av人妻一区二区| 亚洲av色香蕉一区二区三区潮| 亚洲色偷偷综合亚洲avyp| 国产最新进精品视频| 久久精品国产热| 91成人自拍视频网站| 日韩精品久久中文字幕| 人人爽人人澡人人人妻| 狠狠躁狠狠躁东京热无码专区| 男女啦啦啦视频在线观看| 久久久精品人妻一区二区三区四区| 国产精品福利自产拍在线观看| 免费人成在线观看播放国产| 日本一本二本三本道久久久| 欧美激情视频一区二区三区免费 | 亚洲自偷自拍另类第一页| 精品人妻码一区二区三区剧情| 中国老熟妇自拍hd发布| 亚洲日韩欧美一区二区三区| 精品奇米国产一区二区三区| 日韩经典午夜福利发布| 日本欧美视频在线观看| 日韩免费高清视频网站| 日韩女优视频网站一区二区三区| 午夜性色一区二区三区不卡视频| 国产精品一区二区久久| 中文字幕日韩人妻在线| 国产91清纯白嫩初高中在线观看| 人妻丰满熟妇av无码片| 亚洲av日韩av一卡二卡| 日韩精品极视频在线观看免费 | 中出高潮了中文字幕| 中文字幕有码在线人妻| 国产xxx69麻豆国语对白| 国产在线丝袜精品一区免费| 又爽又猛又大又湿的视频| 国精产品一区一区二区三区mba | 高潮抽搐潮喷毛片在线播放| 欧美国产日产一区二区| 亚洲av一二三又爽又爽又色|