萬(wàn)偉 劉子龍
摘 要:為解決激光傳感器等避障裝置難以解決爆炸性危險(xiǎn)環(huán)境下的防爆問(wèn)題,提出一種基于機(jī)器視覺(jué)的AGV小車(chē)避障解決方案。磁導(dǎo)航AGV小車(chē)在工作中路徑相對(duì)固定,主要針對(duì)來(lái)回走動(dòng)的工人進(jìn)行檢測(cè),進(jìn)而實(shí)現(xiàn)減速或制動(dòng)。為實(shí)現(xiàn)高精確度下實(shí)時(shí)檢測(cè),采用改進(jìn)HOG算法,結(jié)合線性支持向量機(jī)實(shí)現(xiàn)更快和更可靠的分類(lèi)。實(shí)驗(yàn)證明,該方法識(shí)別率達(dá)到92.84%,漏檢率4%,其準(zhǔn)確度和實(shí)時(shí)性基本滿(mǎn)足危險(xiǎn)環(huán)境下的行人檢測(cè)要求。
關(guān)鍵詞:AGV; 行人檢測(cè); HOG; 線性支持向量機(jī); 危險(xiǎn)環(huán)境
DOI:10. 11907/rjdk. 191617
中圖分類(lèi)號(hào):TP311.5?? 文獻(xiàn)標(biāo)識(shí)碼:A??????????????? 文章編號(hào):1672-7800(2020)003-0006-04
Research on AGV Vehicle Obstacle Avoidance Based on Improved HOG Algorithm
WAN Wei, LIU Zi-long
(School of Optical Electrical and Computer Engineering,University of Shanghai for Science and Technology, Shanghai 200093, China)
Abstract: In order to solve the problem of explosion-proof in the explosion-hazard environment, a machine vision-based AGV trolley obstacle avoidance solution is proposed. The magnetic navigation AGV trolley has a relatively fixed path during work, and is mainly used for detecting and moving around the working path to realize deceleration or braking. To ensure real-time detection with high accuracy, the improved directional gradient histogram (HOG) algorithm and linear support vector machine (LSVM) are used to achieve faster and more reliable classification. The experiment proves that the recognition rate of the method reaches 92.84%, and the missed detection rate is 4%. Its accuracy and real-time performance can basically meet the pedestrian detection in industrial hazardous environment.
Key Words: AGV; pedestrian detection; HOG; Linear support vector machine; dangerous environment
0 引言
AGV(Automated Guided Vehicle)是裝備有電磁或光學(xué)等自動(dòng)導(dǎo)引裝置,能夠沿規(guī)定的導(dǎo)引路徑行駛,具有安全保護(hù)和移載功能的運(yùn)輸車(chē)[1]。AGV小車(chē)由于其靈活性和大負(fù)載能力越來(lái)越多地應(yīng)用于工業(yè)場(chǎng)所。通用型AGV小車(chē)避障手段有超聲波傳感器、紅外傳感器和激光雷達(dá)等,這些傳感器多屬于光輻射和電磁波射頻源[2]。2017年5月,《自動(dòng)導(dǎo)引車(chē)(AGV)在危險(xiǎn)生產(chǎn)環(huán)境應(yīng)用的安全規(guī)范》標(biāo)準(zhǔn)啟動(dòng)會(huì)在中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所召開(kāi),意味著應(yīng)用于爆炸性危險(xiǎn)環(huán)境下的特種AGV將逐步實(shí)現(xiàn)標(biāo)準(zhǔn)化、規(guī)范化。
AGV小車(chē)主要由車(chē)載控制器、驅(qū)動(dòng)系統(tǒng)、導(dǎo)航系統(tǒng)和避障系統(tǒng)等幾大部分組成[3]。控制、驅(qū)動(dòng)等幾個(gè)部分可以通過(guò)隔爆型、增安型、本質(zhì)安全型等防爆方式解決防爆問(wèn)題。文獻(xiàn)[4-5]通過(guò)超聲波傳感器實(shí)現(xiàn)AGV小車(chē)的避障模塊設(shè)計(jì),Zoltan Rozsa等[6]采用的激光雷達(dá)避障系統(tǒng)是通用型AGV小車(chē)最常見(jiàn)的避障方式。此外還有采用紅外傳感器[7]實(shí)現(xiàn)的避障系統(tǒng)。本文采用深度學(xué)習(xí)算法,結(jié)合計(jì)算機(jī)視覺(jué)識(shí)別攝像頭采集的障礙物從而實(shí)現(xiàn)避障。AGV小車(chē)作為搬運(yùn)機(jī)器人,其工作路徑較為固定,工作場(chǎng)景單一,相對(duì)于無(wú)人駕駛所需的道路行人檢測(cè)而言其復(fù)雜性較低。但由于AGV的大負(fù)載特性導(dǎo)致剎車(chē)距離較長(zhǎng),需要避免緊急停車(chē)情況,因此在避障過(guò)程中速度識(shí)別尤為重要。
隨著深度學(xué)習(xí),特別是卷積神經(jīng)網(wǎng)絡(luò)(CNN)的發(fā)展,在計(jì)算機(jī)視覺(jué)應(yīng)用中,分類(lèi)和物體識(shí)別準(zhǔn)確性實(shí)現(xiàn)了質(zhì)的飛躍[8]。圖形處理單元(GPU)的發(fā)展顯著促進(jìn)了機(jī)器視覺(jué)的發(fā)展,通過(guò)并行計(jì)算克服了高運(yùn)算量實(shí)時(shí)處理問(wèn)題。此外,云計(jì)算的發(fā)展使諸如視頻流分析之類(lèi)的大運(yùn)算量處理可以上傳至云端服務(wù)器,這些有利于在實(shí)時(shí)視頻處理時(shí)使用更多的深度學(xué)習(xí)算法。
1 相關(guān)工作
行人檢測(cè)包含特征提取和分類(lèi)兩個(gè)基本步驟。首先需要對(duì)原始圖像進(jìn)行處理去除噪聲,并提取最符合人類(lèi)屬性的特征用于模型訓(xùn)練,然后在分類(lèi)器中進(jìn)行分類(lèi)。Dalal等[9]最先提出使用HOG算法和SVM分類(lèi)器方法,在當(dāng)時(shí)取得了巨大成功;Luca Maggiani等[10]使用具有L1歸一化和SVM分類(lèi)的HOG-DOT算法,將識(shí)別率提高到94.9%,但是誤檢率也隨之提高;文獻(xiàn)[11-12]采用了HOG-LBP方法提高準(zhǔn)確度,通過(guò)梯度直方圖和局部直方圖提取更精確的特征。事實(shí)上,HOG算法與其它算法結(jié)合,在提升準(zhǔn)確性的同時(shí)使算法的復(fù)雜度變得越來(lái)越高[13]。基于GPU加速的神經(jīng)網(wǎng)絡(luò)[14]在識(shí)別速度上得到巨大提升,但是傳統(tǒng)的計(jì)算機(jī)和嵌入式設(shè)備難以滿(mǎn)足硬件要求,在AGV小車(chē)上應(yīng)用十分困難。因此,需要在識(shí)別率和識(shí)別速度之間找到一個(gè)最優(yōu)解??紤]到高精度和高檢測(cè)速度要求,使用HOG算法可獲得行人的最佳特征,借助LSVM可輕松準(zhǔn)確地對(duì)行人的線性可分?jǐn)?shù)據(jù)集進(jìn)行分類(lèi)。
2 算法與實(shí)現(xiàn)
本文設(shè)計(jì)的檢測(cè)系統(tǒng)首先使用方向梯度直方圖(HOG)算法對(duì)經(jīng)過(guò)預(yù)處理的圖像進(jìn)行特征提取,再通過(guò)線性支持向量機(jī)(LSVM)對(duì)特征進(jìn)行分類(lèi)[15],圖1為系統(tǒng)流程。
本文使用INRIA數(shù)據(jù)集進(jìn)行分析,該數(shù)據(jù)集為128×64的數(shù)據(jù)格式。由于只考慮邊緣方向梯度大小,因此不需要RGB彩色圖像,通過(guò)預(yù)處理將RGB圖像轉(zhuǎn)換為灰度圖[16]。
2.1 方向梯度直方圖(HOG)
行人檢測(cè)系統(tǒng)的特征提取使用HOG算法[17]。HOG算法假設(shè)一個(gè)對(duì)象可以根據(jù)其邊緣方向和大小來(lái)表征,在圖像的小矩形區(qū)域處理圖像,使算法不受光度或幾何變換影響,只要人處于直立狀態(tài)就可避免運(yùn)動(dòng)造成的影響。因此,該算法適用于精確的行人檢測(cè)。
2.1.1 梯度計(jì)算
通過(guò)梯度計(jì)算對(duì)圖像進(jìn)行邊緣檢測(cè),計(jì)算圖像在[x]和[y]方向上的梯度。考慮到對(duì)精度和速度的要求,使用一維微分掩模。通過(guò)式(1)和式(2)分別計(jì)算[x]和[y]方向的梯度[Mx]、[My],與原始圖像[I]進(jìn)行卷積。
2.1.2 梯度幅值和角度
使用前面獲得的[Gx]和[Gy],通過(guò)式(3)和式(4)計(jì)算梯度幅度[G(x,y)]和角度[θ]。
2.1.3 直方圖計(jì)算
如圖2所示,輸入圖像分割為單元化的小矩形區(qū)域,其中每個(gè)單元由8×8個(gè)像素組成,然后計(jì)算每個(gè)單元的直方圖。直方圖通常定義為一個(gè)元素?cái)?shù)組,其中每個(gè)元素表示數(shù)據(jù)集中一系列值的出現(xiàn)頻率。對(duì)于每個(gè)像素,計(jì)算9個(gè)區(qū)間的直方圖。將0°-180°的角度均分為每個(gè)區(qū)間20°。在單元格中,與每個(gè)像素對(duì)應(yīng)的大小添加到其角度對(duì)應(yīng)的區(qū)間中。
為了獲得更高的精確度,使用雙線性插值而不是直接將幅度離散化至每個(gè)區(qū)間[18]。對(duì)單元格中的每個(gè)像素進(jìn)行雙線性插值到其對(duì)應(yīng)的區(qū)間和其最近的鄰域中。對(duì)單元格中的所有像素執(zhí)行此操作,就得到一個(gè)單元格的直方圖。再將圖像分成若干塊,每個(gè)塊由2×2個(gè)單元格組成,每個(gè)塊與前一個(gè)塊重疊50%[19]。通過(guò)連接每個(gè)單元的9個(gè)區(qū)間直方圖形成每個(gè)塊的直方圖。因此,每個(gè)塊具有36維特征向量。
2.1.4 歸一化
歸一化是影響檢測(cè)精度的關(guān)鍵步驟。通過(guò)對(duì)比度歸一化減少光照、陰影的影響,降低全局亮度的靈敏度。使用L2-norm歸一化提高可靠性和精度。如式(5)所示,用v表示歸一化特征向量,[vk]為第k個(gè)塊的特征向量,[ε]是一個(gè)常數(shù),用來(lái)避免出現(xiàn)分母為零的情況。
圖3為HOG算法提取的梯度特征。
2.2 線性支持向量機(jī)(LSVM)
Hilton Bristow等[20]證實(shí)了LSVM是最適合HOG算法的分類(lèi)器之一。如圖4所示,LSVM將圖像分為行人類(lèi)和非行人類(lèi)。為了方便表述,將行人作為正類(lèi),非行人作為負(fù)類(lèi),檢測(cè)行人的過(guò)程就簡(jiǎn)化為尋找這兩個(gè)類(lèi)之間的超平面,最接近超平面的數(shù)據(jù)點(diǎn)即為支持向量。
超平面由法向量定義,或者由權(quán)向量[w]和偏差[b]定義。當(dāng)支持向量確定,這些參數(shù)就可通過(guò)SVM算法確定。為簡(jiǎn)化運(yùn)算,行人和非行人圖像的類(lèi)標(biāo)簽分別取+1和-1。下面算法描述了3個(gè)支持向量,即假設(shè)s1為行人圖像,其余兩幅為非行人圖像,再由此推廣至n個(gè)支持向量[21]。
LSVM訓(xùn)練過(guò)程:
增廣支持向量:將每個(gè)訓(xùn)練圖像的支持向量或特征集增廣為1,作為偏置輸入;
通過(guò)式(6)確定[αi]:
對(duì)于LSVM,映射函數(shù)([φ])是恒等函數(shù),通過(guò)式(7)計(jì)算常數(shù)[αi]和[si]:
確定權(quán)向量[w]和偏差[b]:
超平面上所有點(diǎn)都滿(mǎn)足方程[wT*x+b=0]。因此,對(duì)于任意圖像的特征向量[x],如果[fx]為正,那么就判定為行人圖像,否則為非行人。
3 實(shí)驗(yàn)與分析
3.1 實(shí)驗(yàn)
在INRIA數(shù)據(jù)集上驗(yàn)證本文算法,數(shù)據(jù)集信息如表1所示。
訓(xùn)練階段,在訓(xùn)練集上實(shí)施HOG算法,然后實(shí)施LSVM學(xué)習(xí)算法,以確定權(quán)重向量[w]和偏差[b]。INRIA數(shù)據(jù)集中有3 327張圖像的訓(xùn)練集可用于訓(xùn)練LSVM。實(shí)驗(yàn)環(huán)境為Intel Core i7-8750H,python3.7,openCV3.3.1,通過(guò)線性?xún)?nèi)核(linear kernel)和SMO(Sequential Minimal Optimization)優(yōu)化算法確定支持向量。
通過(guò)線性分類(lèi)器對(duì)測(cè)試集中的數(shù)據(jù)進(jìn)行分類(lèi)。為了便于觀察實(shí)驗(yàn)結(jié)果,通過(guò)非極大值抑制[22](Non-maximum suppression,NMS)去除冗余的識(shí)別框。實(shí)驗(yàn)結(jié)果表明該方法識(shí)別準(zhǔn)確率達(dá)到92.84%,識(shí)別速度為0.56s,見(jiàn)表2。
3.2 漏檢情況分析
分析漏檢的測(cè)試圖片發(fā)現(xiàn),由于HOG算法特性,多數(shù)漏檢情況如圖5所示,圖片中行人軀干大部分被其它已檢測(cè)出的行人遮擋,或圖像前景已經(jīng)檢測(cè)到行人,背景中出現(xiàn)的行人被漏檢。根據(jù)實(shí)際應(yīng)用背景,當(dāng)前景中檢測(cè)到行人時(shí),AGV小車(chē)即會(huì)采取制動(dòng)措施減速或停車(chē)。圖5所示的情況不會(huì)對(duì)背景中的行人造成危險(xiǎn),滿(mǎn)足設(shè)計(jì)要求。
4 結(jié)語(yǔ)
本文在INRIA行人數(shù)據(jù)集上應(yīng)用改進(jìn)的HOG算法實(shí)現(xiàn)了較高精度和識(shí)別速度,實(shí)驗(yàn)結(jié)果表明算法基本滿(mǎn)足AGV小車(chē)對(duì)行人實(shí)時(shí)檢測(cè)需求。但本文使用的數(shù)據(jù)集均為站立的行人,下一步工作將針對(duì)實(shí)際應(yīng)用場(chǎng)景下不同姿態(tài)的人物以及可能出現(xiàn)的其它障礙物進(jìn)行數(shù)據(jù)采集并研究,測(cè)試該模型在嵌入式設(shè)備上的運(yùn)行性能,以進(jìn)一步提高檢測(cè)系統(tǒng)的可靠性。未來(lái)特種AGV小車(chē)將逐步標(biāo)準(zhǔn)化,本文研究具有一定的前瞻性,有較好的應(yīng)用前景。
參考文獻(xiàn):
[1]王雅蕾,黃莉. 物流設(shè)施與設(shè)備[M]. 重慶:重慶大學(xué)出版社,2012.
[2]劉俊暢,蘆利斌,譚力寧. 基于Arduino的自動(dòng)避障技術(shù)實(shí)現(xiàn)[J]. 信息技術(shù),2014(12):170-172.
[3]董玉德,陳光超,楊先龍,等. 基于姿態(tài)分析的自導(dǎo)引小車(chē)控制器的設(shè)計(jì)[J]. 汽車(chē)工程學(xué)報(bào),2016(3):168-175.
[4]楊芳沛,李偉光,鄭少華,等. 基于超聲波傳感器的AGV避障模塊設(shè)計(jì)與實(shí)現(xiàn)[J]. 電子設(shè)計(jì)工程,2015(22):56-60.
[5]張雷,孫禾,夏士旸,等. AGV避障系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 遼寧科技學(xué)院學(xué)報(bào),2018(6):26-31.
[6]ZOLTAN ROZSA, TAMAS SZIRANYI. Obstacle prediction for automated guided vehicles based on point clouds measured by a tilted lidar sensor[J]. IEEE Transactions on Intelligent Transportation Systems, 2018(6): 2708-2720.
[7]劉震,劉志君. AGV避障技術(shù)的改進(jìn)[J]. 遼寧科技學(xué)院學(xué)報(bào),2017(5):7-8.
[8]高琦煜,芮挺,沙衛(wèi)平,等. 基于邊緣信息增強(qiáng)的CNN行人檢測(cè)算法[J]. 江蘇科技信息,2017(25):30-32.
[9]DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]. 2005 International Conference Computer Vision and Pattern Recognition, 2005: 886-893.
[10]LUCA MAGGIANI,CEDRIC BOURRASSET. Bio-inspired heterogeneous architecture for real-time pedestrian detection applications[J]. Journal of Real-Time Image Processing,2016(4):210-218.
[11]ZHANG J G, HUANG K Q. Boosted local structured HOG-LBP for object localization[C]. Computer Vision and Pattern Recognition (CVPR), IEEE Conference 2011.
[12]CAMPMANY V, SILVA S, ESPINOSA? A, et al. GPU-based pedestrian detection for autonomous driving[J]. Procedia Computer Science, 2016(5):581-589.
[13]WU S, ROBERT LAGANIèRE, PIERRE PAYEUR. Improving pedestrian detection with selective gradient self-similarity feature[J]. Pattern Recognition, 2015, 48(8): 2364-2376.
[14]TAKUYA FUKAGAI,KYOSUKE MAEDA, SATOSHI TANABE, et al. Speed-up of object detection neural network with GPU[C]. IEEE International Conference on Image Processing, 2018.
[15]李勇澤,陳磊. 訓(xùn)練樣本數(shù)量對(duì)HOG-SVM目標(biāo)檢測(cè)算法的影響[J]. 現(xiàn)代計(jì)算機(jī),2018(19):24-27.
[16]龔聲蓉,劉純平,王強(qiáng). 數(shù)字圖像處理與分析 [M].第2版.北京:清華大學(xué)出版社,2006.
[17]HASIN REHANA. Bangla handwritten digit classification and recognition using SVM algorithm with HOG features[C]. International Conference on Electrical Information and Communication Technology (EICT), 2017.
[18]YAO Q,CHEN G T,WANG Z,et al. Automated detection and identification of white-backed planthoppers in paddy fields using image processing[J]. Journal of Integrative Agriculture,2017(7): 1547-1557.
[19]鮑振華. 基于草圖局部不變矩特征的圖像檢索[D]. 西安: 西北大學(xué),2017.
[20]HILTON BRISTOW,SIMON LUCEY. Why do linear SVMs trained on HOG features perform so well[J]. Computer Science,2014(6):123-129.
[21]王彩玲,詹松,荊曉遠(yuǎn). 基于圖像顯著特征的非重疊視域行人再識(shí)別[J]. 南京郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2016(3):106-111.
[22]陳金輝,葉西寧. 行人檢測(cè)中非極大值抑制算法的改進(jìn)[J]. 華東理工大學(xué)學(xué)報(bào):自然科學(xué)版,2015(3):371-378.
(責(zé)任編輯:杜能鋼)
收稿日期:2019-04-28
基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(61603255)
作者簡(jiǎn)介:萬(wàn)偉(1993-),男,上海理工大學(xué)光電信息與計(jì)算機(jī)工程學(xué)院碩士研究生,研究方向?yàn)榭刂瓶茖W(xué)與控制理論、機(jī)器學(xué)習(xí)、圖像處理;劉子龍(1972-),男,博士,上海理工大學(xué)光電信息與計(jì)算機(jī)工程學(xué)院副教授、碩士生導(dǎo)師,研究方向?yàn)榭刂瓶茖W(xué)與控制理論、嵌入式系統(tǒng)、機(jī)器人控制。