韓伶俐
(安徽三聯(lián)學院 交通工程學院,合肥 211100)
運動目標識別技術通常與視頻監(jiān)控技術聯(lián)合使用,在智能交通管理、工業(yè)目標檢測、區(qū)域安全防護等領域發(fā)揮積極作用[1].隨著科學技術的發(fā)展車輛合格考試技術持續(xù)更新?lián)Q代,摩托車駕考是車輛合格考試的重要內容之一,逐漸使用視頻監(jiān)控駕考取代人工考核,既可以提升駕考效率,又能提高考試標準與監(jiān)控的精準度.運動目標識別一般是通過采集駕考目標的運動幀圖像,基于圖像處理算法、輪廓檢測算法獲得目標對象的動態(tài)輪廓信息,實現(xiàn)駕考對象的動態(tài)追蹤.目前關于視頻目標識別的應用算法研究頗多,例如:侯暢、董蘭芳[2]提出一種基于深度編解碼網(wǎng)絡的運動目標檢測算法,以離線樣本數(shù)據(jù)為基礎訓練編解碼網(wǎng)絡,基于該網(wǎng)絡學習背景信息同視頻幀間的差異,利用背景建模和視頻幀作為深度編解碼網(wǎng)絡的輸入,輸出結果即為視頻中運動目標的識別結果;李大湘等[3]在目標識別研究中,首先構建運動軌跡能量優(yōu)化模型,其次基于量子行為粒子群優(yōu)化算法求解能量模型的最小解,重新組合運動軌跡后得到摘要視頻,精準完成視頻目標識別.本文綜合考慮多種目標識別算法的利弊,決定利用邊緣輪廓檢測算法完成運動中摩托車目標圖像特征檢測,同時對檢測技術進行多重優(yōu)化與改進,最終在測試環(huán)節(jié)取得了良好的識別效果.
摩托車駕考視頻監(jiān)控對象是運動中的人物,視頻中的圖像稱為“幀”,由于幀和幀之間產(chǎn)生變化導致畫面信息產(chǎn)生差異,形成“運動”現(xiàn)象.在摩托車駕考監(jiān)控視頻采集過程中,由于曝光時間、運動幅度等因素常常導致視頻圖像序列不穩(wěn)定[4],對后期識別監(jiān)控視頻中的目標造成較大難度與困擾.為此,在設計摩托車視頻監(jiān)控駕考方案時,增加了電子穩(wěn)像技術,具體過程如下.
首先,以監(jiān)控視頻采集的原始摩托車幀圖像為對象,基于改進ORB圖像特征匹配算法選擇其中具有不穩(wěn)定屬性的特征點,具體步驟如圖1所示,提取兩個長度一致字符串所在位置的差異性字符數(shù)量;在此過程中采用自適應角點檢測與誤匹配點剔除策略,獲得精確的不平穩(wěn)特征點生成特征點軌跡;緊接著完成初始特征軌跡的濾波處理,去除軌跡噪聲[5].
圖1 改進ORB圖像特征匹配算法步驟
其次,預測全局運動矢量軌跡,主要根據(jù)平滑點特征軌跡、初始特征點軌跡兩個參量進行計算.全局運動矢量預測以6個參數(shù)為基準構建仿射模型,利用三個特征點即可獲取放射變換的參數(shù)[6],該方式使算法運算的時間消耗少且精準度高.定義i為隨機點特征軌跡,q表示其中任意特征點,輸出濾波后的第q個特征點如式(1)所示.
然后,基于上述結果不平穩(wěn)的幀圖像以幀為單位進行運動矢量逆反補償,參考張學典等[7]人的研究,基于雙線性插值法完成亞像素部分的補償.雙線性插值法對于圖像亞像素部分的補償目的在于降低像素的塊狀與不平衡特征.將不平穩(wěn)的幀圖像劃分為多個子區(qū)域,定義子區(qū)域的坐標為(xi,yi),灰度值為gi(xi,yi);在進行插值處理之前基于公式(2)恢復成不平穩(wěn)幀圖像子區(qū)域:
然后基于圖2內容進行雙線性插值完成亞像素部分的補償.圖1中的插值原理解釋如下:在不平穩(wěn)幀圖像子區(qū)域內設置一個參考點,即區(qū)域的中心點;四個子區(qū)域的參考點分別表示為γ1、γ2、γ3、γ4,插值對象即為四個參考點內的像素點,圖中a點表示待插值的不平穩(wěn)像素點;然后參考點對相應區(qū)域進行映射,為區(qū)域內像素點生成新的像素值,完成亞像素部分的補償.
圖2 雙線性插值原理分析
最后,利用圖像信息熵統(tǒng)計增強圖像、基于自動配準算法進行圖像拼接再一次優(yōu)化不平穩(wěn)摩托車駕考視頻的質量,利用圖像信息熵統(tǒng)計增強圖像的具體過程如下:
首先,求取幀圖像子區(qū)域不同灰度級的信息熵,生成子區(qū)域信息熵統(tǒng)計直方圖,公式(3)為第b級灰度信息熵的計算方法:
其中,子區(qū)域內灰度級數(shù)量用N表示;第b級像素的出現(xiàn)概率用?(b)i表示.
然后,對不平穩(wěn)幀圖像的信息熵進行重新分割與分配,提高幀圖像的平穩(wěn)性.預估不同灰度級信息熵統(tǒng)計值,依照等級要求進行信息熵分配,分配信息熵的方法如式(4)所示:
式中,不同子區(qū)域分配到分割信息熵的灰度級數(shù)目用N1表示;E0表示原有信息熵值.當圖像滿足質量標準時輸出,完成穩(wěn)像處理.
對基于圖像穩(wěn)像技術處理后的摩托車駕考監(jiān)控幀圖像,進行像素分流擬合如式(5)所示:
其中,圖像像元值用V表示,鄰域中灰度像素集用W表示;(x,y)∈Ω.
接下來基于單幀視覺差分析原理提取運動中摩托車目標圖像特征,目標圖像成像的平面信息素可以在單位成像像素值區(qū)域中確定[8],采用S(x,y;t)表示.且有其中,運動中摩托車目標圖像動態(tài)特征點通過平移得到模型像素差值用Δv表示,灰度旋轉不變矩特征量用σ表示.定義摩托車目標圖像在梯度方向上的邊緣信息如式(6)和式(7)所示:
順著梯度方向劃分上述公式中圖像邊緣幅度信息,得到2個分量.(m,n)處像素點灰度值采用Xmn表示.同時定義Xmax-Xmin、Ymax-Ymin、Zmax-Zmin分別表示運動中摩托車目標圖像輪廓分布包圍盒的長寬高,由此預測目標跟蹤水平位移量,方法見公式(8):
其中,運動中摩托車目標圖像邊緣輪廓特征的單位方向矢量分別采用m、n表示.目標圖像(m,n)處灰階不變矩即通過Xmn表示,至此完成運動中摩托車目標圖像邊緣輪廓特征檢測,進而實現(xiàn)摩托車目標識別與檢測.
在上述過程中為了優(yōu)化圖像邊緣輪廓特征檢測精準度,對運動中的摩托車目標區(qū)域進行重構,具體通過極線約束模型實現(xiàn)對目標特征點的立體匹配與三維重構[9].圖3描述了基于雙目視覺的極線約束模型原理.f表示空間中的一點,r、r′分別表示攝像頭,攝像機對應的光心描述為g和g′.在模型中,攝像機對f點進行透視變換將其映射至兩個攝像頭,基線負責連接攝像機光心,此時存在一個外極面由光心與點f共同組成,兩側圖像與外極面于左極線l、右極線l′處相交.在上述布局中,空間中f點隨機運動時,以透視變換的方式映射至左側圖像中心點r在極線l,同理,點r′在極線l′也一定成立,這種情況稱為極線約束[10];并且極線約束原理中兩側的極點即為映射點同基線的相交點.
圖3 基于雙目視覺的極線約束模型
利用基于雙目視覺的極線約束模型完成摩托車目標特征點的立體匹配與三維重構,降低了摩托車目標圖像邊緣輪廓特征檢測的難度.
為了驗證本文提出的基于運動目標識別的摩托車視頻監(jiān)控駕考方案的有效性,在駕校現(xiàn)場搭建摩托車駕考測試實驗場所進行目標檢測仿真測試,利用本文方法對考試人員進行動態(tài)識別與檢測,提高摩托車駕考監(jiān)控的效率.實驗使用算法采用MATLAB進行開發(fā)設計,圖像處理主機操作系統(tǒng)為Windows 7,內存為8 GB,處理器為Intel Core i7,CPU主頻2.5 GHz.利用本文方法檢測摩托車駕考目標的效果如圖4所示,可以看出,本文方法能夠將背景信息與目標對象清晰分割,完整提取出駕考人員與摩托車的輪廓信息.為了進一步分析本文方法在駕考視頻監(jiān)控中的性能,引入基于高斯混合模型的駕考監(jiān)控識別方法、基于SIFT特征匹配的駕考監(jiān)控識別方法進一步展開對比測試.
圖4 本文方法目標輪廓檢測結果
現(xiàn)場采集5組摩托車駕考幀圖像,為各組圖像設置不同的信噪比水平,記錄了不同信噪比程度下各方法進行駕考目標識別的效果,如圖5所示.
圖5 各方法目標輪廓檢測率統(tǒng)計
圖5數(shù)據(jù)顯示,三種方法檢測率均隨著圖像信噪比的增加逐漸上升,說明圖像的原始質量對于目標輪廓檢測效果的影響較大,且圖像信噪比與目標輪廓檢測率成正比.可以清晰看出本文方法檢測摩托車駕考目標對象輪廓的準確率顯著高于另外兩種方法,當圖像信噪比位于[15 dB,25 dB]區(qū)間時,檢測率可達96%~97%.此外,檢測摩托車目標輪廓過程中,在圖像信噪比一致的前提下本文方法初始檢測率領先,檢測結果總體波動平穩(wěn)、波動較小,說明該方法受圖像信噪比的干擾相對較小,具有一定的抗噪性.
為突出摩托車視頻監(jiān)控駕考方案的性能優(yōu)勢,以均方根誤差、響應時間作為測試指標,評估三種方法進行駕考監(jiān)控識別的性能,結果如表1所示.
表1 三種方法實施摩托車駕考監(jiān)控識別的性能
表1中均方根誤差為歸一化值,數(shù)值越大表明其監(jiān)控誤差越大.本文方法的均方根誤差為0.0547,僅約為基于SIFT特征匹配的駕考監(jiān)控識別方法的十分之一,獲得了較優(yōu)的目標追蹤識別效果;基于高斯混合模型的駕考監(jiān)控識別方法高達0.2954,識別效果不理想.此外,本文方法的響應時間為2.11 s,實時性較好,可以滿足摩托車視頻監(jiān)控駕考識別的需求,相比之下,基于高斯混合模型的駕考監(jiān)控識別方法、基于SIFT特征匹配的駕考監(jiān)控識別方法響應的時間較長,實時性相對較弱.
本文以摩托車駕考視頻監(jiān)控問題作為研究對象,提出了基于運動目標識別的駕考目標檢測方案.在檢測摩托車駕考目標之前對圖像進行穩(wěn)像處理,提高圖像目標輪廓檢測的精準度;具體而言,本文方法在圖像采集原始階段對圖像進行了穩(wěn)像處理,基于改進ORB圖像特征匹配算法選擇圖像中不穩(wěn)定特征點,對不平穩(wěn)幀圖像進行運動矢量逆反補償,最后通過增強、配準等方法完成圖像拼接,輸出高質量的圖像作為目標檢測的基礎;同時基于雙目視覺極線約束模型對目標特征點進行立體匹配與三維重構,再次優(yōu)化摩托車目標檢測效果.以上兩種優(yōu)化策略均為提高摩托車視頻監(jiān)控駕考方案提供了可靠性保障.
根據(jù)實驗結果得知,本文方法檢測率可達96%~97%,雖取得了理想的檢測效果但仍然需要進一步優(yōu)化,以適應高標準的摩托車駕考需求.可考慮在雙目視覺的極線約束模型上進行改進,更加精準地完成摩托車目標特征點的立體匹配與三維重構,進而優(yōu)化視頻目標檢測率.