朱辰光 史燕中 王春華 劉惟錦 高昊飛
摘要:由于視覺(jué)注意力機(jī)制模仿了人類視覺(jué)系統(tǒng)的視覺(jué)原理,因此引入計(jì)算機(jī)視覺(jué)注意力機(jī)制方法來(lái)測(cè)試車(chē)輛信息是一項(xiàng)被廣泛關(guān)注的任務(wù)。在基于視頻廣播確定交通信息時(shí),目標(biāo)標(biāo)識(shí)是一般交通信息的基礎(chǔ)。而從交通現(xiàn)場(chǎng)視頻中提取目標(biāo)對(duì)于后續(xù)的跟蹤、分類和數(shù)據(jù)分析等任務(wù)具有十分有效的幫助,從而可以降低算法的復(fù)雜性并提高其效率。該文主要著眼于識(shí)別道路上的車(chē)輛,基于視覺(jué)注意力模型,提出了一種基于注意力機(jī)制的車(chē)輛興趣區(qū)提取系統(tǒng)。通過(guò)實(shí)驗(yàn),將該算法與背景差分法的結(jié)果進(jìn)行了比較。
關(guān)鍵詞:視覺(jué)注意力;車(chē)輛檢測(cè);識(shí)別;背景差分法
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)13-0013-02
1引言
機(jī)動(dòng)車(chē)檢測(cè)模塊是智能交通系統(tǒng)中起到承上啟下作用的核心功能模塊,設(shè)計(jì)一個(gè)具備實(shí)時(shí)性、泛化能力強(qiáng)、識(shí)別準(zhǔn)確率高的檢測(cè)與屬性識(shí)別解決方案具有實(shí)際應(yīng)用價(jià)值。近幾年計(jì)算機(jī)視覺(jué)技術(shù)在深度學(xué)習(xí)理論的促進(jìn)下取得了巨大進(jìn)步,注意力(Attention)機(jī)制的研究則在深度神經(jīng)網(wǎng)絡(luò)中取得了很大的成功和廣泛的應(yīng)用,有不少研究證明,引入注意力機(jī)制能夠很好地改善現(xiàn)有神經(jīng)網(wǎng)絡(luò)模型的性能。本文擬對(duì)智能交通系統(tǒng)中的機(jī)動(dòng)車(chē)檢測(cè)問(wèn)題展開(kāi)研究,同時(shí)從數(shù)據(jù)收集與算法設(shè)計(jì)兩個(gè)方面人手,擬引入注意力機(jī)制模塊,提高檢測(cè)效率。
2基于視覺(jué)注意機(jī)制的車(chē)輛感興趣區(qū)域提取
本文提出了一種視覺(jué)注意模型,該方法具有較為顯著的有效性。靜態(tài)元素與低緯度特征提取組合出運(yùn)動(dòng)特征圖以捕捉運(yùn)動(dòng)中的車(chē)輛目標(biāo)。確切的算法如下:
1)從視覺(jué)焦點(diǎn)格式中提取輸入到視頻中的每個(gè)視頻幀的四個(gè)亮度、顏色和方向,并組合相同類型的特征圖和不同的比例的特征圖,獲取最后一個(gè)靜態(tài)元素的貼圖類型;
2)通過(guò)多幀歸一化方法提取和更新背景,從背景差方法中提取運(yùn)動(dòng)特征,得到二值映射圖M的運(yùn)動(dòng)特征;
3)靜態(tài)特征圖通過(guò)最大類方差法進(jìn)行雙峰化得到二值圖像,靜態(tài)特征圖與S特征圖集成在一起,以獲取感興趣的最新圖片;
4)對(duì)最后關(guān)注的對(duì)象執(zhí)行物理操作,以檢索車(chē)輛中的關(guān)注區(qū)域。
圖1顯示了基于注意力機(jī)制的行駛中車(chē)輛的關(guān)注區(qū)域的過(guò)程。
3動(dòng)態(tài)特征和靜態(tài)特征的提取與融合
3.1動(dòng)態(tài)背景的提取與更新
環(huán)境的變化通常會(huì)導(dǎo)致視頻圖像背景的變化。如果我們繼續(xù)提取運(yùn)動(dòng)特征而不更新背景,則將極大地影響提取運(yùn)動(dòng)對(duì)象的準(zhǔn)確性。因此,必須提取并更新動(dòng)態(tài)背景,否則會(huì)影響以后的發(fā)現(xiàn)。本文使用多元平均方法。
多幀平均是創(chuàng)建和更新背景的常用方法。該方法首先獲取視頻幀的平均幀,然后計(jì)算視頻幀的平均值,然后獲取平均背景圖像。此方法在公式(1)中給出:
Benson過(guò)程中對(duì)比度的選擇直接決定了微米發(fā)射的效果,所傳輸視頻幀的背景像素的灰度值不固定,并且圖像分割所需的調(diào)節(jié)方法是必需的。
本文使用最大變化方法。OTSU提出了最大的類間差異方法。該方法使用基于最大灰度圖像的灰度直方圖類間距離標(biāo)準(zhǔn)確定波段分類級(jí)別,檢測(cè)最大變化值,并將圖像分為背景和目標(biāo)。計(jì)算公式如下:
T閾值將圖像分為兩部分A和B,σ2代表兩個(gè)類之間的最大變化,B分別整個(gè)圖片的平均灰度。由此可知,采用兩種類型方差σ2σ2(T)最大值的T是最佳閾值。
3.4二值形態(tài)學(xué)處理
原圖的靜態(tài)二項(xiàng)式特征和二項(xiàng)式圖的運(yùn)動(dòng)特征的二值處理,獲得最終圖像,并提取感興趣區(qū)域,影響很大,所以我對(duì)它附帶的圖像處理非常感興趣。
其中B(x)是結(jié)構(gòu)元素,x是圖像空間E中的一個(gè)點(diǎn)。
靜態(tài)操作可能是兩個(gè)獨(dú)立的對(duì)象執(zhí)行,并且單獨(dú)圖像中的兩個(gè)載具很小。擴(kuò)展操作的復(fù)制品是加寬前景對(duì)象的邊界點(diǎn)并填充前景對(duì)象中的孔并填充感興趣的圖像。
3.5實(shí)驗(yàn)結(jié)果對(duì)比與分析
經(jīng)過(guò)大量測(cè)試,本文對(duì)視頻中的行駛中的車(chē)輛進(jìn)行了檢測(cè),檢測(cè)精度達(dá)到94.5%,具有良好的檢測(cè)效果。如表l所示,大多數(shù)商用視頻車(chē)輛檢測(cè)系統(tǒng)現(xiàn)在已廣泛應(yīng)用于生活中。該算法的檢測(cè)精度與商用視頻車(chē)輛檢測(cè)系統(tǒng)的檢測(cè)精度相當(dāng)。
4總結(jié)
本文分析了基于視覺(jué)注意機(jī)制的車(chē)輛檢測(cè)算法,提出了一種基于視覺(jué)注意機(jī)制的一種基于原始車(chē)輛檢測(cè)算法提取運(yùn)動(dòng)特征的區(qū)域提取方法。視覺(jué)焦點(diǎn)模型用于選擇要素、定向光色。通過(guò)結(jié)合靜態(tài)特征鹽度圖和動(dòng)態(tài)特征圖,通過(guò)原始車(chē)輛檢測(cè)算法獲得的目標(biāo)圖像具有更完整的前景目標(biāo),增強(qiáng)了空腔、裂縫和聲音現(xiàn)象,并在捕獲目標(biāo)圖像輪廓的同時(shí)捕獲了計(jì)算圖像。運(yùn)動(dòng)車(chē)輛的輪廓最終能夠在視頻圖像中檢測(cè)和識(shí)別運(yùn)動(dòng)車(chē)輛。