張 靜,楊大偉,毛 琳(大連民族大學(xué) 機(jī)電工程學(xué)院,遼寧 大連 116605)
隨著自動(dòng)駕駛、智能輔助駕駛等技術(shù)的快速發(fā)展,對(duì)行人檢測(cè)的需求也越來(lái)越大。在人車混行區(qū)域,除了行人運(yùn)動(dòng)目標(biāo)外,還包含復(fù)雜多變的環(huán)境背景。行人目標(biāo)姿態(tài)變化、雜亂背景等信息對(duì)行人目標(biāo)檢測(cè)算法造成不同程度的影響,導(dǎo)致出現(xiàn)偏離實(shí)際情況的行人目標(biāo)框,降低了行人檢測(cè)器的檢測(cè)效率。給后續(xù)輔助駕駛系統(tǒng)和視頻監(jiān)控等應(yīng)用造成混亂。降低檢測(cè)時(shí)的錯(cuò)檢率已經(jīng)逐漸成為熱點(diǎn)話題。
目前的行人檢測(cè)方法,可大致分為基于運(yùn)動(dòng)特性、基于模板匹配以及基于統(tǒng)計(jì)學(xué)習(xí)的行人檢測(cè)方法?;诮y(tǒng)計(jì)學(xué)習(xí)的行人檢測(cè)方法主要是以分析圖片的描述特征信息為主要入手點(diǎn),對(duì)特征信息分類,實(shí)現(xiàn)對(duì)圖像中有無(wú)行人目標(biāo)的判斷。其中具有代表性的行人特征有Haar特征[1]、LBP特征[2]、HOG(Histogram of Oriented Gradient)[3]、SIFT[4]特征等,其中,HOG特征是目前廣為使用的特征。對(duì)這些特征信息進(jìn)行分類主要采用支持向量機(jī)(Support Vector Machine,SVM)、級(jí)聯(lián)分類器以及極限學(xué)習(xí)機(jī)等分類算法。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)與傳統(tǒng)HOG+SVM算法相結(jié)合[5]、優(yōu)化核函數(shù)支持向量[6]以及改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)[7]等行人檢測(cè)方法,對(duì)算法進(jìn)行優(yōu)化,加強(qiáng)對(duì)待檢測(cè)圖片的分類識(shí)別功能。
為使行人檢測(cè)器的檢測(cè)效果更好,文獻(xiàn)[8]對(duì)HOG特征實(shí)施降維處理后與LBP進(jìn)行融合;文獻(xiàn)[9]提出兼容像素信息和梯度信息的GSRLBP紋理特征提取方法。上述兩種方法是對(duì)圖像特征進(jìn)行處理,提高特征本身的可辨識(shí)度。但對(duì)待檢測(cè)圖像特征的處理較為復(fù)雜,對(duì)算法種類的依賴性較高,通用性差。
本文提出一種基于圖像變換的遞歸式行人錯(cuò)檢校驗(yàn)算法(Recursive False Positive Check algorithm base on image transformation,RFPC)。在保持現(xiàn)有HOG特征行人檢測(cè)器原有結(jié)構(gòu)不變的基礎(chǔ)上,將行人檢測(cè)器的檢測(cè)結(jié)果經(jīng)圖像變換后,作為行人檢測(cè)器新的輸入圖像,將原有行人檢測(cè)器構(gòu)成一個(gè)遞歸式校驗(yàn)處理系統(tǒng)。為保證行人檢測(cè)器能夠重新處理前一次的檢測(cè)結(jié)果,采用尺寸歸一化、均衡和銳化三種圖像變換方式,用以確保行人檢測(cè)器能夠不斷遞歸校驗(yàn)新的輸入內(nèi)容。RFPC能夠有效分辨出錯(cuò)誤的檢測(cè)結(jié)果,降低錯(cuò)檢率。
本文提出的RFPC算法以行人檢測(cè)器作為遞歸式結(jié)構(gòu)的基礎(chǔ),將輸出結(jié)果經(jīng)圖像微小變換后,反饋至檢測(cè)器作為輸入,重復(fù)檢測(cè)過(guò)程以達(dá)到錯(cuò)檢校驗(yàn)的目的,使最終的輸出結(jié)果趨于穩(wěn)定合理。遞歸決策以同一個(gè)行人目標(biāo)鄰近兩次檢測(cè)結(jié)果的面積比例關(guān)系為依據(jù),判斷是否終止遞歸循環(huán)。算法邏輯圖如圖1。
圖1 RFPC算法邏輯圖
(1)
遞歸式行人錯(cuò)檢校驗(yàn)算法,充分利用“檢測(cè)”這一基本功能,通過(guò)多次遞歸賦予“檢測(cè)器”一個(gè)“校驗(yàn)者”的身份,對(duì)檢測(cè)結(jié)果進(jìn)行重新判斷,減少圖像中行人目標(biāo)錯(cuò)檢的發(fā)生。引入行人檢測(cè)框模糊判決終止條件作為整個(gè)遞歸的決策控制,限制遞歸校驗(yàn)次數(shù)的同時(shí),實(shí)現(xiàn)對(duì)檢測(cè)結(jié)果準(zhǔn)確校驗(yàn)。
圖2 n≥2時(shí)遞歸工作狀態(tài)
遞歸決策使用終止判決條件對(duì)整個(gè)遞歸錯(cuò)檢校驗(yàn)結(jié)構(gòu)進(jìn)行控制,避免遞歸層次過(guò)多,增加計(jì)算復(fù)雜度。設(shè)輸出目標(biāo)F(n)中任一矩形框的像素高度和寬度分別為HF(n)和WF(n),則矩形框的像素面積計(jì)算公式為
SF(n)=HF(n)·WF(n),i=1,2,…,n。
(2)
定義遞歸相鄰兩層次的矩形框面積比值
(3)
引入標(biāo)準(zhǔn)Mamdani模型的模糊邏輯系統(tǒng),將R作為輸入模糊語(yǔ)言值,C作為輸出模糊語(yǔ)言值,采用π型隸屬函數(shù):
(4)
式中:x為指定變量的論域范圍;[ac]用以指定π型函數(shù)形式,輸入輸出均以像素為單位。
為了精確控制模糊模型,使用“絕對(duì)不是(AN)”“應(yīng)該不是(SN)”“可能不是(MN)”“不確定(UN)”“可能是(MY)”“應(yīng)該是(SY)”“絕對(duì)是(AY)”來(lái)調(diào)整輸入和輸出模糊語(yǔ)言變量集。上述輸入和輸出集合的相應(yīng)模糊規(guī)則見表1。
表1 模糊控制規(guī)則
隸屬度函數(shù)的設(shè)定與輸入/輸出關(guān)系曲線如圖3。
遞歸模糊決策終止判決條件為:
(1)當(dāng)C=1時(shí),目標(biāo)框經(jīng)校驗(yàn)為行人,保留當(dāng)前目標(biāo)框。如圖2中(A)-(A′)、(B)-(B′),檢測(cè)器給出的檢測(cè)結(jié)果確定是行人,該行人目標(biāo)框應(yīng)該予以保留。
(2)當(dāng)C=-1時(shí),目標(biāo)框經(jīng)校驗(yàn)為非行人目標(biāo),刪除當(dāng)前目標(biāo)框。如圖2中(C)-(C′),檢測(cè)器的檢測(cè)結(jié)果不屬于完整行人,該行人目標(biāo)框應(yīng)該予以刪除。
(3)當(dāng)C∈(0,1)時(shí),目標(biāo)框內(nèi)容不確定,需保留當(dāng)前目標(biāo)框,進(jìn)入下一層次遞歸。
圖3 隸屬函數(shù)的設(shè)定與輸入/輸出曲線
圖像分辨率歸一化實(shí)際上是一種對(duì)原始圖像采用坐標(biāo)變換的處理手段,以此改變?cè)紙D像尺寸,進(jìn)而實(shí)現(xiàn)對(duì)行人檢測(cè)器輸入圖像分辨率的改變,在保證校驗(yàn)質(zhì)量的同時(shí),實(shí)現(xiàn)對(duì)行人目標(biāo)的驗(yàn)證;同時(shí),為了能夠更加有效地從圖像獲取所需信息,利用均衡處理對(duì)圖像進(jìn)行增強(qiáng)處理,增加數(shù)字圖像的動(dòng)態(tài)范圍,提高對(duì)比度。圖像較為明顯的邊緣或梯度信息是正確圈選行人目標(biāo)的一個(gè)重要影響因素,而圖像的銳化能夠增加圖像中像素信息的對(duì)比度,凸顯圖像中的邊緣信息,適當(dāng)?shù)匿J化可以濾除紋理等一些低頻的細(xì)節(jié)干擾信息,使圖像特征信息更加的清晰有效。
均衡銳化前后檢測(cè)結(jié)果的對(duì)比如圖4。
圖4(a)為一幅輸入圖像(分辨率為375×500)直接進(jìn)入檢測(cè)器的輸出結(jié)果,三個(gè)實(shí)線框?yàn)樾腥藱z測(cè)框,兩個(gè)虛線框?yàn)殄e(cuò)檢結(jié)果;圖4(b)為經(jīng)過(guò)尺寸歸一化(分辨率變?yōu)?6×128)處理后的檢測(cè)結(jié)果,兩個(gè)行人檢測(cè)框仍保留,其中一個(gè)錯(cuò)檢框被剔除,這說(shuō)明合理的尺寸變化能夠去除錯(cuò)檢結(jié)果;圖4(c)為輸入圖像經(jīng)過(guò)均衡、銳化處理后的結(jié)果,采用均衡處理,能夠增強(qiáng)圖像的動(dòng)態(tài)范圍,提高對(duì)比度,銳化處理則能提高圖像中的聚焦程度,豐富圖像細(xì)節(jié)信息,使圖片內(nèi)容突出化。微量改變輸入圖片的顏色、紋理等特征,有效地去除原圖像中的重框和錯(cuò)檢目標(biāo)框,增加校驗(yàn)機(jī)制的有效性。
(a) (b) (c)
仿真實(shí)驗(yàn)在Matlab R2014a和Windows 7操作系統(tǒng)下進(jìn)行測(cè)試。選用目前主流數(shù)據(jù)庫(kù)中的INRIA數(shù)據(jù)庫(kù)和實(shí)地拍攝圖像進(jìn)行測(cè)試。在進(jìn)行實(shí)際仿真時(shí),以實(shí)際檢測(cè)出的目標(biāo)檢測(cè)框數(shù)量為參照,對(duì)比實(shí)際檢測(cè)出的行人目標(biāo)個(gè)數(shù)和校驗(yàn)后的個(gè)數(shù),驗(yàn)證遞歸式行人錯(cuò)檢校驗(yàn)算法的有效性。選用INRIA數(shù)據(jù)庫(kù)進(jìn)行測(cè)試,測(cè)試結(jié)果如圖5。其中(a)、(b)、(c)為室外場(chǎng)景,(d)、(e)、(f)為室內(nèi)場(chǎng)景。
與行人檢測(cè)器本身的檢測(cè)結(jié)果相比,RFPC算法能夠有效去除冗余和錯(cuò)檢的目標(biāo)檢測(cè)框。選用INRIA數(shù)據(jù)庫(kù)中1 000張圖片對(duì)上述的兩種情況進(jìn)行測(cè)試,行人檢測(cè)算法檢測(cè)后產(chǎn)生1 793個(gè)檢測(cè)結(jié)果,其中包含了1 520個(gè)行人目標(biāo)及273個(gè)錯(cuò)檢目標(biāo)。檢測(cè)器本身的正確檢測(cè)率達(dá)到84.7%,經(jīng)RFPC算法后,正確檢測(cè)率達(dá)到92.3%,提高了7.6%。
為進(jìn)一步驗(yàn)證錯(cuò)檢的去除效果,拍攝不同場(chǎng)景的室內(nèi)外圖片進(jìn)行仿真,測(cè)試結(jié)果如圖6。說(shuō)明本文所提RFPC算法能夠有效降低檢測(cè)器的錯(cuò)檢。
(a) (b) (c) (d) (e) (f)
(a) (b) (c) (d) (e) (f)
本文針對(duì)室內(nèi)外復(fù)雜環(huán)境中,行人檢測(cè)器經(jīng)常出現(xiàn)錯(cuò)檢的問題,提出RFPC算法,將原有行人檢測(cè)器的檢測(cè)結(jié)果輸出作為新的輸入,反饋至行人檢測(cè)器進(jìn)行重新檢測(cè),形成一種新的具有校驗(yàn)功能的檢測(cè)機(jī)制。為確保此時(shí)待檢測(cè)的輸入圖片區(qū)別于原始圖片,新的輸入圖片在送入行人檢測(cè)器前,經(jīng)圖像變換模塊,增加圖片內(nèi)容的可識(shí)別性,實(shí)現(xiàn)錯(cuò)檢去除的功能。經(jīng)過(guò)INRIA數(shù)據(jù)庫(kù)的測(cè)試,該算法將原行人檢測(cè)算法的準(zhǔn)確率由84.7%提高到92.3%,有效去除了由于復(fù)雜背景環(huán)境干擾造成的錯(cuò)檢問題。該算法為移動(dòng)機(jī)器人軌跡規(guī)劃、行人目標(biāo)檢測(cè)等應(yīng)用提供必要的實(shí)驗(yàn)依據(jù)。
參考文獻(xiàn):
[1] PAPAGEORGIOU C, POGGIO T. A trainable system for object detection[J]. International Journal of Computer Vision. 2000, 38(1): 15-33.
[2] DOLLAR P, WOJEK C, SCHIELE B, et al. Perona P. Pedestrian detection: A benchmark[C]. 2009: 304-311.
[3] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]. Computer Vision and Pattern Recognition, 2005 CVPR IEEE Computer Society Conference, 2005,881: 886-893.
[4] LOWE D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision. 2004, 60(2): 91-110.
[5] 高琦煜, 方虎生. 多卷積特征融合的HOG行人檢測(cè)算法[J]. 計(jì)算機(jī)科學(xué),2017(b11): 199-201.
[6] 楊萌, 張葆, 宋玉龍.基于優(yōu)化核函數(shù)支持向量機(jī)在行人檢測(cè)中的應(yīng)用[J]. 激光與光電子學(xué)進(jìn)展, 2018:1-16.
[7] 謝林江, 季桂樹, 彭清, 等. 改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)在行人檢測(cè)中的應(yīng)用[J]. 計(jì)算機(jī)科學(xué)與探索,2017:1-10.
[8] 陳銳, 王敏, 陳肖. 基于PCA降維的HOG與LBP融合的行人檢測(cè)[J]. 信息技術(shù),2015(2): 101-105.
[9] 張陽(yáng). 結(jié)合紋理特征和深度學(xué)習(xí)的行人檢測(cè)算法[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào),2016(2): 206-210.
大連民族大學(xué)學(xué)報(bào)2018年3期