肖培 王強(qiáng)
摘要:計(jì)算機(jī)視覺(jué)技術(shù)在車輛目標(biāo)檢測(cè)領(lǐng)域已有重要的應(yīng)用。本文以計(jì)算機(jī)視覺(jué)技術(shù)為基礎(chǔ),深入研究和分析運(yùn)動(dòng)目標(biāo)識(shí)別與追蹤算法的性能。在此基礎(chǔ)上,提出車輛目標(biāo)檢測(cè)算法,并通過(guò)實(shí)驗(yàn)驗(yàn)證算法的實(shí)用性和可行性。實(shí)驗(yàn)結(jié)果表明,車輛目標(biāo)檢測(cè)算法能夠大幅提高檢測(cè)精度,減少誤報(bào)率和漏報(bào)率,同時(shí)具有良好的運(yùn)行效果。這項(xiàng)算法具有較強(qiáng)的實(shí)用性和應(yīng)用價(jià)值。
關(guān)鍵詞:計(jì)算機(jī)視覺(jué);車輛目標(biāo)檢測(cè);檢測(cè)算法
隨著計(jì)算機(jī)視覺(jué)技術(shù)的日益成熟和發(fā)展,車輛目標(biāo)檢測(cè)作為其在交通領(lǐng)域的重要應(yīng)用之一,開(kāi)始發(fā)揮著越來(lái)越重要的作用。車輛目標(biāo)檢測(cè)通過(guò)提取車輛的特征信息、識(shí)別與定位,使用計(jì)算機(jī)技術(shù)進(jìn)行處理與分析,能夠輔助相關(guān)人員更好地了解和分析交通行為,有效提高交通效率與安全性。
將車輛目標(biāo)檢測(cè)與計(jì)算機(jī)視覺(jué)技術(shù)有效結(jié)合,對(duì)于提高交通管理與安全水平具有重要意義。通過(guò)對(duì)交通場(chǎng)景中的車輛進(jìn)行目標(biāo)檢測(cè),可以實(shí)時(shí)監(jiān)測(cè)和分析交通流量,優(yōu)化交通信號(hào)燈并優(yōu)化交通路線,從而提高交通的流動(dòng)性,減少擁堵。此外,車輛目標(biāo)檢測(cè)還可以應(yīng)用于交通事故預(yù)警系統(tǒng)、智能停車管理等領(lǐng)域,為交通安全和便利提供有力支持。
一、計(jì)算機(jī)視覺(jué)技術(shù)
(一)計(jì)算機(jī)視覺(jué)技術(shù)
計(jì)算機(jī)視覺(jué)技術(shù)是指通過(guò)使用各種程序與算法來(lái)解釋與理解圖像與視頻數(shù)據(jù),使計(jì)算機(jī)能夠自動(dòng)化地識(shí)別、分析和處理這些信息。其目標(biāo)是讓計(jì)算機(jī)能夠像人一樣理解和感知現(xiàn)實(shí)世界。
如今,計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)被廣泛應(yīng)用于各個(gè)領(lǐng)域,如智能交通、監(jiān)控及醫(yī)療影像等。在醫(yī)療影像領(lǐng)域,它可以輔助醫(yī)生實(shí)現(xiàn)更準(zhǔn)確的疾病診斷和治療。通過(guò)分析和解釋醫(yī)學(xué)影像,計(jì)算機(jī)視覺(jué)技術(shù)可以幫助醫(yī)生發(fā)現(xiàn)疾病跡象,并提高診斷的準(zhǔn)確性和效率。在智能監(jiān)控領(lǐng)域,計(jì)算機(jī)視覺(jué)技術(shù)可以自動(dòng)識(shí)別和監(jiān)測(cè)異常行為,通過(guò)分析監(jiān)控視頻,它可以發(fā)現(xiàn)潛在的安全風(fēng)險(xiǎn),并及時(shí)向工作人員發(fā)送警報(bào),以保護(hù)公共安全和財(cái)產(chǎn)安全。在智能交通領(lǐng)域,計(jì)算機(jī)視覺(jué)技術(shù)可以用于識(shí)別和處理交通違規(guī)行為,提高交通的安全性和效率。例如,它可以檢測(cè)車輛和行人,并監(jiān)測(cè)交通流量,幫助交通管理部門實(shí)時(shí)監(jiān)控交通情況并采取相應(yīng)的措施,以減少交通擁堵和預(yù)防交通事故。
(二)計(jì)算機(jī)視覺(jué)核心技術(shù)
1.特征提取與描述
計(jì)算機(jī)視覺(jué)是一個(gè)包含特征提取與描述以及目標(biāo)檢測(cè)與跟蹤兩大核心技術(shù)的領(lǐng)域。特征提取與描述是其中一個(gè)非常關(guān)鍵的步驟,它能夠從圖像中抽取出具有區(qū)分性的有用特征,為后續(xù)的目標(biāo)檢測(cè)和識(shí)別等任務(wù)提供基礎(chǔ)。特征提取方法有多種,包括深度學(xué)習(xí)、全局特征提取和局部特征提取等。局部特征提取方法通過(guò)捕捉圖像中的關(guān)鍵點(diǎn),并計(jì)算與這些關(guān)鍵點(diǎn)對(duì)應(yīng)的描述符來(lái)實(shí)現(xiàn)識(shí)別和匹配。而全局特征提取方法則注重于總體特性,例如顏色直方圖和紋理特征等。深度學(xué)習(xí)作為一種先進(jìn)的方法,利用神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)原始圖像數(shù)據(jù)中的高階特征表示。它具有很強(qiáng)的表達(dá)能力和魯棒性,能夠在各種應(yīng)用場(chǎng)景中執(zhí)行準(zhǔn)確的計(jì)算機(jī)視覺(jué)任務(wù)[1]。
2.目標(biāo)檢測(cè)與跟蹤
計(jì)算機(jī)視覺(jué)的關(guān)鍵在于目標(biāo)檢測(cè)與跟蹤。目標(biāo)檢測(cè)通過(guò)分析圖像或視頻數(shù)據(jù)來(lái)自動(dòng)識(shí)別和定位目標(biāo)物體位置。傳統(tǒng)的算法包括HOG+SVM和Haar特征分類器,而利用深度學(xué)習(xí)的算法如SSD和YOLO能夠?qū)崿F(xiàn)更準(zhǔn)確、更快速的目標(biāo)檢測(cè),具有更強(qiáng)的魯棒性和表達(dá)能力。而目標(biāo)跟蹤則是識(shí)別并實(shí)時(shí)追蹤圖像幀中的運(yùn)動(dòng)目標(biāo)物體。常用方法包括基于濾波器的方法、基于深度學(xué)習(xí)的方法以及多尺度的跟蹤算法。這些算法能夠?qū)崿F(xiàn)對(duì)運(yùn)動(dòng)目標(biāo)的實(shí)時(shí)、精確跟蹤,為計(jì)算機(jī)視覺(jué)技術(shù)的進(jìn)步和應(yīng)用提供了重要支持。
二、車輛目標(biāo)檢測(cè)
(一)車輛目標(biāo)檢測(cè)關(guān)鍵任務(wù)
車輛目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域中的重要任務(wù)之一。其主要目標(biāo)是在大量的圖像中準(zhǔn)確識(shí)別出車輛目標(biāo),并進(jìn)一步判斷其位置和大小。然而,由于車輛的形狀、外觀和形態(tài)特征的多樣性,以及光照條件和遮擋等因素的影響,車輛目標(biāo)的檢測(cè)變得更加復(fù)雜和困難。因此,發(fā)展高效的運(yùn)動(dòng)目標(biāo)檢測(cè)算法是當(dāng)前亟待解決的問(wèn)題之一[2]。
車輛目標(biāo)檢測(cè)包括車輛識(shí)別、定位及分割等重要環(huán)節(jié)。首先,需要判斷圖像中是否存在車輛,若存在,需要進(jìn)一步確定車輛的空間位置與大小。其次,進(jìn)行實(shí)例與場(chǎng)景分割,以實(shí)現(xiàn)精確識(shí)別和定位車輛目標(biāo)。隨著深度學(xué)習(xí)等技術(shù)的發(fā)展和應(yīng)用,車輛目標(biāo)檢測(cè)技術(shù)經(jīng)歷了從低層次到高層次、從簡(jiǎn)單到復(fù)雜的演變和發(fā)展,并有望在更多領(lǐng)域發(fā)揮更大的作用。
(二)車輛目標(biāo)檢測(cè)難點(diǎn)
實(shí)際應(yīng)用中,車輛目標(biāo)檢測(cè)面臨著許多困難和挑戰(zhàn)。首先,由于路面陰影、光照和成像設(shè)備位置等因素的影響,車輛圖像可能存在語(yǔ)義信息丟失,這增加了車輛檢測(cè)的難度。其次,實(shí)際場(chǎng)景中的車輛類別比數(shù)據(jù)集中的更多且更豐富,這會(huì)導(dǎo)致車輛目標(biāo)檢測(cè)算法在面對(duì)未經(jīng)訓(xùn)練的車輛時(shí)準(zhǔn)確性不高。此外,隨著圖像數(shù)量的增加,目前的車輛目標(biāo)檢測(cè)系統(tǒng)難以做到真正的實(shí)時(shí)監(jiān)測(cè)。未來(lái),車輛目標(biāo)檢測(cè)需要解決分割圖像中所有對(duì)象類別的問(wèn)題,并可以有效預(yù)測(cè)圖像中即將出現(xiàn)的對(duì)象。為了滿足高準(zhǔn)確性和實(shí)時(shí)性的要求,車輛目標(biāo)檢測(cè)算法應(yīng)該綜合考慮硬件優(yōu)化、數(shù)據(jù)處理、算法設(shè)計(jì)等多個(gè)方面的因素,并在有限的計(jì)算能力下實(shí)現(xiàn)高幀速的穩(wěn)定運(yùn)行[3]。
(三)車輛目標(biāo)檢測(cè)算法原理
基于攝像機(jī)拍攝的圖像或高清視頻,首先需要對(duì)圖像進(jìn)行預(yù)處理,包括濾波和灰度化等操作。這些預(yù)處理操作有助于提取圖像的特征,為后續(xù)的車輛目標(biāo)識(shí)別提供基礎(chǔ)。接下來(lái),利用相關(guān)的算法對(duì)圖像的背景和前景進(jìn)行閾值輸出。這一步驟可以將車輛目標(biāo)從圖像中分割出來(lái)。同時(shí),算法需要具備較好的光照變化處理能力,以避免光照對(duì)檢測(cè)結(jié)果的干擾。然后,對(duì)圖像進(jìn)行二值化操作,以獲得清晰的車輛目標(biāo)輪廓[4]。這一系列的操作構(gòu)成了車輛目標(biāo)檢測(cè)的流程,具體如圖1所示。
如圖1所示,運(yùn)動(dòng)目標(biāo)檢測(cè)算法的流程主要包括采集圖像、圖像灰度化、相關(guān)算法處理、圖像二值化、輪廓提取以及運(yùn)動(dòng)目標(biāo)識(shí)別與標(biāo)記等操作步驟。首先,通過(guò)從保存或攝像機(jī)拍攝的高清視頻中提取連續(xù)幀圖像的方式,獲取輸入圖像。其次,對(duì)彩色圖像進(jìn)行灰度化處理,將其轉(zhuǎn)換為灰度圖像,這個(gè)過(guò)程可以通過(guò)對(duì)彩色圖像進(jìn)行處理、簡(jiǎn)化和抑制噪聲來(lái)實(shí)現(xiàn)。再次,采用相關(guān)算法處理灰度圖像,這些算法可以包括光流估計(jì)、差分圖像和背景建模等方法,以提取出圖像中的運(yùn)動(dòng)目標(biāo)。然后,對(duì)處理后的圖像進(jìn)行二值化操作,根據(jù)預(yù)設(shè)的閾值將圖像轉(zhuǎn)換成二值圖像。接下來(lái),利用邊緣檢測(cè)等技術(shù)來(lái)提取二值化圖像中的目標(biāo)輪廓,以獲取運(yùn)動(dòng)目標(biāo)的形狀信息。最后,結(jié)合目標(biāo)輪廓信息,進(jìn)行運(yùn)動(dòng)目標(biāo)的識(shí)別、標(biāo)記和跟蹤。通過(guò)這個(gè)流程,可以有效地檢測(cè)運(yùn)動(dòng)目標(biāo),并進(jìn)行進(jìn)一步的處理和分析。
(四)車輛目標(biāo)檢測(cè)算法實(shí)現(xiàn)
在本研究中,采用了Canny算子來(lái)進(jìn)行圖像邊緣檢測(cè)。Canny算子具有降噪、減少虛假邊緣和保留重要邊緣的優(yōu)勢(shì)。首先,通過(guò)高斯濾波消除圖像中的噪聲,以提高邊緣檢測(cè)的準(zhǔn)確性。高斯濾波器通過(guò)像素點(diǎn)周圍鄰域的加權(quán)平均來(lái)實(shí)現(xiàn)。其次,計(jì)算濾波后圖像中各像素點(diǎn)的梯度方向和邊緣強(qiáng)度。常見(jiàn)的梯度計(jì)算算子包含Prewitt和Sobel。接下來(lái),使用非極大值抑制方法來(lái)處理每個(gè)像素點(diǎn)。根據(jù)邊緣強(qiáng)度,將像素點(diǎn)劃分為強(qiáng)邊緣和弱邊緣,并設(shè)定高閾值和低閾值。高出高閾值的像素點(diǎn)即為強(qiáng)邊緣,低于低閾值的像素點(diǎn)被排除,介于兩者之間的像素點(diǎn)則視為弱邊緣。最后,通過(guò)霍夫變換或連通性分析,根據(jù)強(qiáng)邊緣像素點(diǎn)將相鄰的弱邊緣像素點(diǎn)連接起來(lái),將它們視為同一邊緣。通過(guò)這一過(guò)程,Canny算子可以準(zhǔn)確檢測(cè)圖像中的邊緣,并有效抑制虛假邊緣和噪聲。對(duì)于視頻幀的輪廓提取和邊緣檢測(cè)有助于明確運(yùn)動(dòng)目標(biāo)的輪廓和位置,為后續(xù)的車輛目標(biāo)跟蹤提供基礎(chǔ)。因此,該方法能夠精確地識(shí)別和定位動(dòng)態(tài)環(huán)境中的車輛目標(biāo),為自動(dòng)駕駛、交通監(jiān)控等實(shí)際應(yīng)用提供強(qiáng)有力的支持。
三、運(yùn)動(dòng)目標(biāo)識(shí)別與追蹤
(一)運(yùn)動(dòng)目標(biāo)分割算法性能分析
圖像分割在運(yùn)動(dòng)目標(biāo)跟蹤中起著至關(guān)重要的作用。過(guò)去,常使用Roberts邊緣檢測(cè)算子來(lái)提高運(yùn)動(dòng)目標(biāo)車輛的邊緣檢測(cè)精度,從而改善分割結(jié)果。此外,結(jié)合最大類間方差法,根據(jù)合適的閾值可將圖像分割為背景區(qū)域和目標(biāo)區(qū)域。Otsu方法的基本原理是將像素閾值劃成目標(biāo)與背景,從而完成圖像分割。并借助類間方差進(jìn)行判斷,以找出使類間方差最大的閾值,從而達(dá)到較好的閾值分割效果。具體操作步驟如下:首先,計(jì)算每個(gè)灰度級(jí)別出現(xiàn)的概率和對(duì)應(yīng)的均值;然后,根據(jù)公式計(jì)算總方差和類內(nèi)方差;最后,選擇使類間方差最大的閾值作為最佳閾值。這種車輛目標(biāo)分割算法具有多個(gè)性能優(yōu)勢(shì),包括高分割精度、強(qiáng)大的光照干擾抗性、高效率以及良好的分割效果。然而,該算法也存在一些問(wèn)題。首先,檢測(cè)算子對(duì)噪聲比較敏感,可能導(dǎo)致漏檢或誤檢,從而影響分割結(jié)果準(zhǔn)確性。其次,需要手動(dòng)選擇閾值進(jìn)行圖像分割,缺乏智能化和自動(dòng)化。此外,該算法只適用于二值分割場(chǎng)景,對(duì)于復(fù)雜場(chǎng)景或多個(gè)目標(biāo)的處理效果較差。對(duì)于重疊的車輛目標(biāo),該算法無(wú)法準(zhǔn)確區(qū)分,容易出現(xiàn)分割結(jié)果錯(cuò)誤的情況。
為改善圖像分割的效果,本文針對(duì)原有算法存在的不足,提出了一系列優(yōu)化和改進(jìn)方案,具體思路如下:①噪聲抑制:引入高斯濾波等圖像去噪技術(shù)來(lái)大幅降低圖像中的噪聲,以此提高分割結(jié)果的準(zhǔn)確性;②自適應(yīng)閾值選擇:使用Otsu方法來(lái)計(jì)算自適應(yīng)閾值,結(jié)合圖像局部特征,選用最佳閾值并完成分割操作;③多目標(biāo)分割:引入連通性分割算法等復(fù)雜分割策略,以確保實(shí)現(xiàn)多目標(biāo)的準(zhǔn)確、高效分割;④目標(biāo)重疊處理:引入深度學(xué)習(xí)模型,同時(shí)結(jié)合形態(tài)學(xué)操作,通過(guò)學(xué)習(xí)目標(biāo)的邊緣信息與目標(biāo)形狀,利用腐蝕、膨脹等操作將重疊目標(biāo)進(jìn)行有效分離,以此實(shí)現(xiàn)目標(biāo)重疊處理;⑤光照變化魯棒性:使用光照歸一化技術(shù)提高車輛目標(biāo)檢測(cè)算法對(duì)光照變化的魯棒性[5]。
(二)目標(biāo)跟蹤算法性能分析
目前,視覺(jué)追蹤算法可以分為基于特定模型和基于運(yùn)動(dòng)算法的兩大類。本文所設(shè)計(jì)的算法屬于基于特定模型的追蹤方法,它通過(guò)互相匹配來(lái)實(shí)現(xiàn)目標(biāo)跟蹤。其中,模板匹配方法有基于目標(biāo)區(qū)域和基于目標(biāo)匹配兩種形式。前者常常利用顏色和角度等特征進(jìn)行匹配,相較于邊緣匹配方法,在復(fù)雜環(huán)境下更適用于目標(biāo)匹配[6]。然而,在現(xiàn)實(shí)場(chǎng)景中,由于目標(biāo)自身的運(yùn)動(dòng),目標(biāo)模型不能長(zhǎng)期保持穩(wěn)定,需要不斷更新以適應(yīng)目標(biāo)的變化。如果某一幀中的目標(biāo)模型描述不準(zhǔn)確,將導(dǎo)致錯(cuò)誤的模型更新。為解決這一問(wèn)題,本文提出了一種基于多關(guān)聯(lián)模板的目標(biāo)匹配跟蹤算法,其工作流程如圖2所示。
在圖2所示的跟蹤算法流程中,首先根據(jù)輸入的視頻序列生成一個(gè)初始化模板。然后,對(duì)于每一幀圖像,生成相應(yīng)的模板,并進(jìn)行匹配。如果成功跟蹤到目標(biāo),則輸出匹配結(jié)果。如果沒(méi)有成功跟蹤到目標(biāo),則根據(jù)目標(biāo)的變化實(shí)時(shí)更新模板,并持續(xù)進(jìn)行目標(biāo)點(diǎn)的預(yù)測(cè)和匹配過(guò)程,直到成功匹配和追蹤到目標(biāo)為止,然后輸出匹配結(jié)果。此外,為了提高跟蹤效果,本文使用了歸一化算法來(lái)追蹤圖像的線性變化,并結(jié)合相似性度量來(lái)進(jìn)行匹配和確定目標(biāo)的跟蹤信息。這種方法大大提高了運(yùn)動(dòng)目標(biāo)的跟蹤效果,并且在復(fù)雜環(huán)境下能夠準(zhǔn)確追蹤目標(biāo)[7]。
四、實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
為驗(yàn)證算法的可行性和實(shí)用性,本文選用了KITTI 公開(kāi)數(shù)據(jù)集,并采用了SSD、YOLO以及本文設(shè)計(jì)的算法來(lái)進(jìn)行車輛檢測(cè)與跟蹤。文中使用了平均準(zhǔn)確度、精確率、誤報(bào)率以及漏報(bào)率等指標(biāo)來(lái)評(píng)估算法的性能。下表為不同算法的性能評(píng)估結(jié)果:
根據(jù)表1數(shù)據(jù)顯示,相較于SSD和YOLO算法,本文所設(shè)計(jì)的算法在車輛目標(biāo)檢測(cè)任務(wù)中表現(xiàn)出顯著的優(yōu)勢(shì)。算法的平均準(zhǔn)確度高達(dá)94.50%,誤報(bào)率和漏報(bào)率分別僅為4.20%和6.90%。由此可見(jiàn),本文所提出的車輛目標(biāo)檢測(cè)算法能夠大幅提高目標(biāo)檢測(cè)精度,并且有效減低誤報(bào)率和漏報(bào)率。這也表明算法在實(shí)際運(yùn)行中具有較好的效果,具備高度實(shí)用性和應(yīng)用價(jià)值。
五、結(jié)束語(yǔ)
綜上所述,本文設(shè)計(jì)的車輛目標(biāo)檢測(cè)算法在車輛目標(biāo)檢測(cè)任務(wù)中表現(xiàn)出優(yōu)秀的性能,具有高精確率,能夠顯著降低漏報(bào)率和誤報(bào)率,并且具備廣泛可應(yīng)用的實(shí)用性和應(yīng)用價(jià)值。
未來(lái)的研究方向可以包括實(shí)時(shí)性優(yōu)化和多模態(tài)信息融合等方向,以進(jìn)一步提升算法性能,并使其適應(yīng)更多種類車輛和更復(fù)雜的場(chǎng)景。另外,可以將優(yōu)化后的檢測(cè)算法應(yīng)用于智能交通系統(tǒng)中,為智能駕駛和交通管理等領(lǐng)域提供準(zhǔn)確、實(shí)時(shí)、全面的數(shù)據(jù)支持,從而為智能交通和交通安全做出更多的貢獻(xiàn)。
作者單位:肖培 王強(qiáng) 江蘇聯(lián)合職業(yè)技術(shù)學(xué)院蘇州工業(yè)園區(qū)分院
參考文獻(xiàn)
[1]蘇山杰,陳俊豪,張之云.基于深度學(xué)習(xí)的車輛目標(biāo)檢測(cè)算法綜述[J].汽車文摘,2022(08):14-23.
[2]趙家琪. 基于無(wú)人機(jī)探測(cè)視頻的車輛目標(biāo)檢測(cè)方法研究[D].湖南工業(yè)大學(xué),2022.
[3]董亞輝. 基于卷積神經(jīng)網(wǎng)絡(luò)的車輛目標(biāo)檢測(cè)及跟蹤方法研究[D].西安電子科技大學(xué),2022.
[4]郭乾宇. 基于雙目視覺(jué)的車輛目標(biāo)檢測(cè)與跟蹤算法研究[D].河北工業(yè)大學(xué),2022.
[5]曹景偉. 復(fù)雜場(chǎng)景下的智能汽車目標(biāo)檢測(cè)與跟蹤算法研究[D].吉林大學(xué),2022.
[6]李彥辰. 基于視覺(jué)與激光雷達(dá)信息融合的智能車輛目標(biāo)檢測(cè)研究[D].河北工業(yè)大學(xué),2022.
[7]賈敬森. 基于深度學(xué)習(xí)的路側(cè)車輛目標(biāo)視覺(jué)檢測(cè)算法研究[D].重慶郵電大學(xué),2021.
江蘇省教育科學(xué)“十四五”規(guī)劃課題“研學(xué)旅行:職業(yè)院校傳承非物質(zhì)文化遺產(chǎn)路徑創(chuàng)新研究”階段性成果,課題編號(hào):D/2021/03/35。
肖培(1983-),女,山東濟(jì)南,碩士研究生,高級(jí)講師,研究方向:高職教育教學(xué)、數(shù)字幾何建模、大數(shù)據(jù)建模與分析、云計(jì)算平臺(tái)和應(yīng)用研究;
王強(qiáng)(1988-),男,江蘇蘇州,碩士研究生,講師,研究方向:高職教育教學(xué)、虛擬現(xiàn)實(shí)技術(shù)及應(yīng)用。