侯岳青,徐貴力,朱仕鵬
(南京航空航天大學(xué) 自動(dòng)化學(xué)院,南京 211106)
在貨運(yùn)物流產(chǎn)業(yè)鏈中,在地面上放置大的稱臺(tái)能夠?qū)ㄜ嚨妮d重進(jìn)行準(zhǔn)確計(jì)量,這種類型的地磅被稱為汽車衡[1],車輛衡是倉(cāng)儲(chǔ)和物流活動(dòng)中極其重要的一環(huán),配有大型稱重設(shè)備電子地磅的各廠商、企業(yè)不斷加大人力、物力的投入,加強(qiáng)對(duì)計(jì)量稱重的管理。車輛衡可以有效防止車輛的超限超載運(yùn)輸行為對(duì)交通安全、路橋基礎(chǔ)設(shè)施以及車輛自身造成的安全隱患,交通部等七部委于2019年發(fā)布了超限超載運(yùn)輸認(rèn)定標(biāo)準(zhǔn),對(duì)不同軸型的貨運(yùn)車輛的載重量做了新要求。
目前,車輛軸型檢測(cè)主要是通過(guò)地感線圈[2]、摩擦電檢測(cè)器[3]。地感線圈利用了電磁感應(yīng)原理,其傳感器是一個(gè)布置在路面下且通有特定交變電流的環(huán)形線圈,通過(guò)對(duì)耦合電路所產(chǎn)生的振蕩頻率進(jìn)行分析從而識(shí)別車輛存在,并且能夠計(jì)算出車輛的數(shù)量、行駛速度等參數(shù)信息。線圈檢測(cè)技術(shù)的發(fā)展非常成熟,檢測(cè)精度很高,天氣變化對(duì)其影響可以忽略,具有很強(qiáng)的抗干擾能力,但是,線圈需要直接埋入車道,維護(hù)成本較高需挖開(kāi)路面,會(huì)對(duì)交通造成阻礙。 摩擦電檢測(cè)器在使用過(guò)程中,為了避免對(duì)探頭的干擾,往往使用屏蔽電纜對(duì)探頭進(jìn)行包裹,然后封上人造橡膠被固定在路面上的切槽當(dāng)中。該檢測(cè)器具有響應(yīng)快、精度高、恢復(fù)時(shí)間短、可全天候工作等優(yōu)點(diǎn),因此可用于檢測(cè)車軸距,和地感線圈配合使用可以實(shí)現(xiàn)對(duì)車型、車速等參數(shù)測(cè)量。但缺點(diǎn)是安裝維護(hù)需要破壞路面,安裝維護(hù)難度大,成本高。
本文針對(duì)現(xiàn)有車輛軸型檢測(cè)系統(tǒng)的主要缺陷,使用基于視覺(jué)的目標(biāo)檢測(cè)和測(cè)距算法,設(shè)計(jì)了一種基于視覺(jué)的車輛軸型檢測(cè)新方法,并設(shè)計(jì)了相關(guān)實(shí)驗(yàn)對(duì)本文提出算法的有效性和準(zhǔn)確性進(jìn)行驗(yàn)證。
目標(biāo)檢測(cè)[4]是眾多復(fù)雜視覺(jué)檢測(cè)系統(tǒng)的執(zhí)行前提,其任務(wù)是找出圖像中所有感興趣的目標(biāo),確定它們的位置和類別。在進(jìn)行輪胎檢測(cè),待檢測(cè)目標(biāo)是車輛輪胎,可以在車輛衡側(cè)邊放置相機(jī),在相機(jī)視野中框定ROI,提取ROI圖像中的圖像特征,由此判別在車輛上磅的過(guò)程中ROI中是否存在輪胎。
梯度方向直方圖(Histograms of Oriented Gradients,HOG)特征[5]由法國(guó)科學(xué)家Dalal等人提出,它利用光強(qiáng)梯度或邊緣方向梯度描述來(lái)檢測(cè)物體局部形狀。對(duì)于擴(kuò)展目標(biāo)來(lái)說(shuō),HOG特征對(duì)目標(biāo)具有很強(qiáng)的邊緣提取能力,所以在實(shí)際的應(yīng)用中HOG特征能夠在一定程度上抑制由于光線變化和拍攝角度等因素對(duì)待檢測(cè)目標(biāo)特征描述的影響。
圖1是HOG特征提取流程,主要分為5個(gè)步驟:1)對(duì)待檢測(cè)樣本進(jìn)行顏色空間標(biāo)準(zhǔn)化;2)對(duì)圖像梯度的計(jì)算;3)對(duì)細(xì)胞單元內(nèi)的梯度方向直方圖進(jìn)行統(tǒng)計(jì);4)將多個(gè)細(xì)胞單元匯聚成區(qū)塊單元,然后將細(xì)胞單元的梯度方向直方圖串聯(lián)起來(lái),對(duì)它們做歸一化處理;5)HOG特征向量的生成。
圖1 原始輪胎圖像和輪胎的梯度直方圖的可視化效果圖
局部二值模式(Local Binary Pattern,LBP)特征[6]定義了一種對(duì)像素點(diǎn)紋理特征進(jìn)行編碼的方法,其主要思路是定義一個(gè)小范圍區(qū)域,以其中心位置的像素值作為閾值,通過(guò)衡量像素點(diǎn)和它周圍像素點(diǎn)的關(guān)系,獲得一系列二進(jìn)制數(shù),構(gòu)成二進(jìn)制編碼,以二進(jìn)制編碼表達(dá)該像素點(diǎn)的紋理特征。Liao等人[7]改進(jìn)了LBP特征提出MB-LBP(Multiscale Block LBP,MB-LBP)特征,把LBP算子作等比例放大,計(jì)算得到區(qū)塊間的差值,將圖像劃分為一個(gè)個(gè)的窗口Block,再將每一個(gè)Block劃分為更小的區(qū)域,通過(guò)計(jì)算區(qū)域內(nèi)的灰度平均值,并與其他區(qū)域內(nèi)的灰度值進(jìn)行對(duì)比,獲取LBP特征,即為MB-LBP特征。圖2為MB-LBP提取紋理示意圖。
圖2 輪胎原始圖像和經(jīng)過(guò)MB-LBP提取紋理結(jié)果
通過(guò)HOG特征和MB-LBP特征對(duì)輪胎特征描述的研究發(fā)現(xiàn),單個(gè)特征難以對(duì)復(fù)雜光照情況下的輪胎圖像進(jìn)行準(zhǔn)確描述,而通過(guò)特征融合方法對(duì)兩種特征描述子進(jìn)行融合,可以發(fā)揮兩種特征算子的各自特點(diǎn),從而實(shí)現(xiàn)對(duì)復(fù)雜環(huán)境下輪胎特征的準(zhǔn)確描述。
HOG特征作為邊緣捕捉和局部形狀的描述特征之一,一方面是因?yàn)樗ㄟ^(guò)密集網(wǎng)格對(duì)圖像的梯度方向和幅值進(jìn)行描述,即使在未獲得待檢測(cè)目標(biāo)位置先驗(yàn)信息的情況下,仍然可以對(duì)目標(biāo)的邊緣進(jìn)行較好地描述,另一方面則是因?yàn)樗苋菀着c其它特征進(jìn)行融合。然而在背景噪聲很大的情況下,提取HOG特征的描述效果不佳。而MB-LBP特征可以捕獲更多的圖像塊信息,通過(guò)局部和全局一對(duì)不同的描述符更好地描述了圖像紋理,并且針對(duì)光照不同的條件或噪聲干擾較為嚴(yán)重的情況下HOG特征表現(xiàn)較差時(shí),MB-LBP特征依然具有很好的魯棒性。
特征融合[8]首先將多個(gè)特征合并為一個(gè)新的融合特征集,然后以這個(gè)特征集作為目標(biāo)的特征描述。本文提出了一種HOG與MB-LBP特征融合的圖像描述方法,將邊緣/局部形狀信息和紋理信息結(jié)合起來(lái),更好地描述了ROI中的輪胎,并在測(cè)試集和現(xiàn)場(chǎng)應(yīng)用中得到了證明。特征融合主要有如下兩個(gè)優(yōu)點(diǎn):1)相比單特征,融合后的特征集含由更多的圖像信息,因此更具判別性;2)特征融合可以通過(guò)獲得有效且特征冗余較少的低維數(shù)特征,從而加快了分類計(jì)算速度。
本文選擇串行組合策略的特征融合方式,對(duì)產(chǎn)生的維度增加導(dǎo)致的檢測(cè)效率問(wèn)題使用對(duì)融合后向量進(jìn)行主成分分析(Principal components analysis,PCA)[9]降維的方法進(jìn)行降維,從而降低檢測(cè)時(shí)間,提高檢測(cè)的實(shí)時(shí)性。
基于特征融合的軸距檢測(cè)算法的流程圖如圖3所示。
圖3 軸距檢測(cè)流程圖
本文中,訓(xùn)練樣本的分辨率為64*64像素。設(shè)置HOG算子的block大小為16*16,cell尺寸位8*8,搜索步長(zhǎng)位8個(gè)像素,方向bin數(shù)位18,在這種參數(shù)設(shè)置情況下,一張圖象的HOG特征的維度為3 528維;設(shè)置MB-LBP算子的block大小為9*9,cell尺寸位3*3,所以MB-LBP的特征維度為2 891維。通過(guò)重構(gòu)設(shè)置PCA的閾值為0.9,將降維后的向量送入SVM分類其中進(jìn)行訓(xùn)練,然后使用訓(xùn)練好的模型進(jìn)行檢測(cè)。
通過(guò)在稱臺(tái)尾部加裝第二臺(tái)相機(jī),對(duì)這臺(tái)相機(jī)視野中的稱臺(tái)進(jìn)行標(biāo)定與車輛檢測(cè)的方法進(jìn)行測(cè)距,對(duì)輪胎識(shí)別相機(jī)識(shí)別到輪胎的不同時(shí)刻的車輛位置進(jìn)行判斷,通過(guò)計(jì)算兩者差值的方法得到車輛軸距。
本文應(yīng)用場(chǎng)景中的測(cè)距算法,需要通過(guò)行駛中的車輛進(jìn)行實(shí)時(shí)檢測(cè)并框選出車輛在圖像中的位置,而YOLO(You Only Look Once)目標(biāo)檢測(cè)算法[10]作為一種具有代表性基于回歸網(wǎng)絡(luò)實(shí)現(xiàn)目標(biāo)檢測(cè)分類的算法,兼顧了目標(biāo)檢測(cè)的速度和精度。
YOLO目標(biāo)檢測(cè)算法是在R-CNN網(wǎng)絡(luò)框架的基礎(chǔ)上實(shí)現(xiàn)的,它基于端到端的思想,構(gòu)建可以識(shí)別物體類別的網(wǎng)絡(luò)模型,將目標(biāo)框選出來(lái)并進(jìn)行標(biāo)注,為了降低分類的誤差,引入了線性修正單元對(duì)框選的位置坐標(biāo)進(jìn)行優(yōu)化調(diào)整,有效解決了R-CNN由于提取物體框的提取算法和很多后續(xù)步驟、流程分離造成的大量時(shí)間損失問(wèn)題。因此YOLO算法的最大優(yōu)勢(shì)就是在檢測(cè)準(zhǔn)確率變化不大情況下,極大加快了目標(biāo)檢測(cè)的速度。
根據(jù)YOLO 目標(biāo)檢測(cè)算法特點(diǎn),以及本文應(yīng)用場(chǎng)景的實(shí)際需求,選用YOLO目標(biāo)檢測(cè)算法,框選出車輛目標(biāo)的外接矩形框,使用外接矩形框的下邊沿中點(diǎn)作為車輛前邊沿的參考位置。
圖4是不同車輛在地磅的不同位置出的檢測(cè)結(jié)果,矩形框是檢測(cè)到車輛的最小外接矩形框。
圖4 車輛(a)、(b)、(c)在地磅不同位置處的檢測(cè)效果圖
相機(jī)采集圖像的過(guò)程是通過(guò)光學(xué)投影的方法將現(xiàn)實(shí)場(chǎng)景中的三維景象轉(zhuǎn)化為圖像中的二維圖像,由于經(jīng)歷了三維到二維的變換過(guò)程,三維場(chǎng)景中的景物和二維圖像中的像素通過(guò)投影變換[11]一一對(duì)應(yīng),由于經(jīng)過(guò)投影變換,圖像中原本平行的兩條直線在圖像中往往會(huì)存在一定夾角,由于存在尺度變換,不能簡(jiǎn)單的按照像素距離推斷實(shí)際場(chǎng)景中的實(shí)際距離。
在透視投影領(lǐng)域,十分具有代表意義的特性之一就是無(wú)限遠(yuǎn)處的物體會(huì)出現(xiàn)在有限的像素范圍內(nèi),例如一條無(wú)窮遠(yuǎn)的直線在圖像中成為終止在某個(gè)點(diǎn)處的一條線段,這個(gè)終止點(diǎn)被稱為消影點(diǎn)。實(shí)際場(chǎng)景中的平行直線例如平直道路的兩邊在圖像中的匯聚點(diǎn)交點(diǎn)就是一個(gè)消影點(diǎn)。在確定場(chǎng)景中,可以根據(jù)消影點(diǎn)測(cè)量場(chǎng)景中的直線的長(zhǎng)度。本文的地磅場(chǎng)景可以抽象為一個(gè)四邊形區(qū)域,如圖5所示,原本兩兩平行的地磅前后邊線和左右邊線,在影像中是不平行的。已知地磅四周在實(shí)際場(chǎng)景中的真實(shí)位置,可以借助消影點(diǎn)和圖像標(biāo)定的方法計(jì)算出左右邊界上任意一點(diǎn)到地磅前邊線的距離。
圖5 地磅在圖像中的形狀
圖6 地磅場(chǎng)景抽象維3D測(cè)距場(chǎng)景
(1)
如圖7所示,當(dāng)車輛檢測(cè)器檢測(cè)出目標(biāo)時(shí),以車輛的外接矩形框下邊中點(diǎn)a為車倆縱向位置參考點(diǎn),連接a點(diǎn)和消影點(diǎn),這條直線和左右邊界的交點(diǎn)分別別為b點(diǎn)和c點(diǎn),通過(guò)計(jì)算b點(diǎn)到稱臺(tái)左下角的距離可以計(jì)算出a點(diǎn)到前邊界的距離,從而推斷出車輛距離前邊線的距離長(zhǎng)度。
圖7 使用車輛外接矩形框進(jìn)行測(cè)距
本文提出的基于標(biāo)定的和縱向測(cè)距的軸距檢測(cè)流程如圖8所示。
圖8 軸距檢測(cè)流程圖
在軸距檢測(cè)相機(jī)檢測(cè)到輪胎的不同時(shí)刻,使用YOLO目標(biāo)檢測(cè)算法檢測(cè)出車輛,并框選出車輛的最小外接矩形,通過(guò)車輛最小外接矩形的下邊中點(diǎn)確定此時(shí)車輛的位置,不同時(shí)刻的車輛位置的差值就是車輛軸距。
車輛是否存在連軸的判斷是基于車輛軸距的,連軸的非連軸的軸距差距較大,通常來(lái)說(shuō)連軸的兩軸距離為1.35~1.6 m,而非連軸的兩軸距離為2.4 m以上。
所以對(duì)于絕大部分軸距數(shù)據(jù)而言,相對(duì)誤差可以控制在10%之內(nèi),在判斷車輛軸型是軸距在15%以內(nèi)的誤差不會(huì)影響對(duì)軸型的判斷。
本文中的輪胎沒(méi)有成規(guī)模的數(shù)據(jù)集,所以采用現(xiàn)場(chǎng)采集視頻然后截取的方式自己構(gòu)建訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集,其中訓(xùn)練數(shù)據(jù)集中正樣本和負(fù)樣本各3 300張,訓(xùn)練樣本的樣張如圖9所示,訓(xùn)練數(shù)據(jù)集中的正樣本是截圖出來(lái)的不同光照、不同天氣情況中的輪胎,負(fù)樣本主要是車身上的某一部分或者在實(shí)際場(chǎng)景中行人等非輪胎圖像。測(cè)試數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)集類似,都是通過(guò)實(shí)際場(chǎng)景錄制的視頻中截圖得到,其中包括輪胎圖像1 000張,非輪胎圖像1 000張組成。
圖9 訓(xùn)練數(shù)據(jù)集樣張
在本次實(shí)驗(yàn)中,分別以HOG特征、MB-LBP特征和HOG-MB-LBP特征進(jìn)行對(duì)訓(xùn)練集中的樣本進(jìn)行提取的并使用提取到的特征向量使用SVM進(jìn)行訓(xùn)練,使用準(zhǔn)確率和檢測(cè)時(shí)間來(lái)描述檢測(cè)結(jié)果。在測(cè)試集上的表現(xiàn)如表1所示。
表1 不同輪胎檢測(cè)算法性能對(duì)比
正如表1所展示的結(jié)果,HOG-MB-LBP特征提取對(duì)輪胎特征的描述最好,在SVM分類器中的分類準(zhǔn)確率最高,達(dá)到了99.2%的準(zhǔn)確率,由于使用了降維算法,單幅圖像的檢測(cè)時(shí)間小于20 ms,可以匹配主流相機(jī)甚至高幀率相機(jī)的幀速率。
本文通過(guò)多種車型多筆數(shù)據(jù)的方法對(duì)軸距檢測(cè)的可行性進(jìn)行驗(yàn)證,例如圖10的3種車型。
圖10 3種不同軸型的貨車
表2是對(duì)圖10中不同貨車的軸距測(cè)量結(jié)果。
表2 對(duì)3種不同車型的軸距測(cè)試
從表2就可以看出,對(duì)于3種不同的車型,軸距的最大相對(duì)誤差為12.59%,相對(duì)誤差可以控制在15%之內(nèi),在判斷車輛軸型是軸距在15%的誤差不會(huì)影響對(duì)軸型的判斷。
對(duì)誤差做進(jìn)一步分析可以得知,誤差主要是由于車輛在地磅上行駛時(shí),由于車輛具有一定的離地間隙,并非貼在稱臺(tái)表面行駛,并且車輛檢測(cè)算法無(wú)法精確地框選出車輛的位置,一般來(lái)說(shuō)用來(lái)框選車輛的外接矩形框會(huì)大于車輛在圖像中的范圍。相對(duì)誤差的最大值出現(xiàn)在連軸的軸距處,因?yàn)檫B軸的兩軸軸距較短,而較小的距離偏差就會(huì)較大程度的反映在相對(duì)誤差指標(biāo)上。
相比于傳統(tǒng)的通過(guò)在地面安裝布置多個(gè)摩擦電檢測(cè)器來(lái)估計(jì)車輛速度進(jìn)而估計(jì)軸距的方法,本算法解決了車輛非勻速行駛時(shí)對(duì)軸距檢測(cè)影響的問(wèn)題。
軸型檢測(cè)主要由軸距檢測(cè)和軸距檢測(cè)兩部分構(gòu)成,為了驗(yàn)證軸型檢測(cè)算法的可靠性,做了驗(yàn)證實(shí)驗(yàn)。
軸距檢測(cè)相機(jī)和軸距檢測(cè)相機(jī)的視野如圖11所示,在實(shí)際場(chǎng)景中,對(duì)軸型檢測(cè)進(jìn)行了511組實(shí)驗(yàn),其中軸型檢測(cè)正確的共499組,檢測(cè)有誤的11組,檢測(cè)成功率達(dá)到97.65%。
圖11 使用車輛外接矩形框進(jìn)行測(cè)距
本文對(duì)現(xiàn)有車輛軸型檢測(cè)方法中存在設(shè)備使用需破壞路面,安裝和維護(hù)難度較大,對(duì)變速行駛車輛進(jìn)行軸距測(cè)量準(zhǔn)確度低等問(wèn)題,對(duì)車輛軸型檢測(cè)裝置進(jìn)行了深入研究,設(shè)計(jì)了基于視覺(jué)的軸型檢測(cè)新方法。此方法將圖像中的先驗(yàn)信息和目標(biāo)檢測(cè)技術(shù)相結(jié)合,輪胎檢測(cè)正確率達(dá)到99.2%,軸距測(cè)量誤差在12.59%以內(nèi),檢測(cè)實(shí)時(shí)性高,在復(fù)雜場(chǎng)景中有較好的魯棒性。通過(guò)超過(guò)500筆數(shù)據(jù)驗(yàn)證了軸型檢測(cè)算法的有效性和準(zhǔn)確性,此算法可以滿足車輛衡應(yīng)用場(chǎng)景的軸型檢測(cè)使用需求。