梁 宇
(廣西壯族自治區(qū)收費(fèi)公路聯(lián)網(wǎng)收費(fèi)清分結(jié)算中心,廣西 南寧 530022)
隨著全球城市化進(jìn)程的加速,交通擁堵和交通事故問題日益嚴(yán)重。為確保道路交通安全和暢通,對交通事件進(jìn)行有效的實(shí)時(shí)檢測成為當(dāng)務(wù)之急[1]。目前,交通事件檢測主要采用傳統(tǒng)圖像處理方法[2]、基于二維卷積神經(jīng)網(wǎng)絡(luò)方法[3]和其他機(jī)器學(xué)習(xí)方法[4]。
傳統(tǒng)圖像處理方法,如光流法、背景減除法等,雖在一定程度上能夠?qū)崿F(xiàn)交通事件檢測,但其對于復(fù)雜場景的適應(yīng)性較差,且易受光照、遮擋等因素影響?;诙S卷積神經(jīng)網(wǎng)絡(luò)[5]的方法在檢測準(zhǔn)確性上有顯著提升,然而其在處理時(shí)序信息方面的能力有限,難以捕捉事件的動(dòng)態(tài)變化。其他機(jī)器學(xué)習(xí)方法,如支持向量機(jī)等,雖然可以實(shí)現(xiàn)一定程度的事件檢測,但在處理大規(guī)模高維數(shù)據(jù)時(shí),計(jì)算復(fù)雜度較高,實(shí)時(shí)性受到限制。
針對現(xiàn)有方法的不足,本文提出了一種基于三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)的交通事件檢測系統(tǒng)[6]。3D CNN在空間和時(shí)間維度上進(jìn)行卷積操作,能夠有效地捕捉交通事件的時(shí)空信息。相較于傳統(tǒng)方法和二維卷積神經(jīng)網(wǎng)絡(luò),基于3D CNN的方法具有以下優(yōu)點(diǎn):(1)整合時(shí)間信息,能夠捕捉交通事件的動(dòng)態(tài)變化,提高檢測準(zhǔn)確性;(2)在處理大規(guī)模高維數(shù)據(jù)時(shí),計(jì)算復(fù)雜度較低,有利于實(shí)現(xiàn)實(shí)時(shí)性能。
三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)是一種在空間和時(shí)間維度上進(jìn)行卷積操作的深度學(xué)習(xí)模型,能夠有效地提取交通事件視頻數(shù)據(jù)中的時(shí)空特征(見圖1)。3D CNN包括卷積層、池化層和全連接層。卷積層負(fù)責(zé)提取交通事件視頻的局部時(shí)空特征,通過在輸入數(shù)據(jù)的寬、高和時(shí)序三個(gè)維度上執(zhí)行卷積操作??梢詫⒌趇個(gè)三維卷積層中第j個(gè)特征圖上位置(x,y,z)處的值γ的數(shù)學(xué)表達(dá)式寫為:
圖1 二維卷積與三維卷積示意圖
(1)
式中:f——激活函數(shù);
M(i-1)——第(i-1)層的特征圖數(shù)量;
Pi和Qi——三維卷積核的高和寬;
Ri——其在時(shí)間維度的長度;
ω和b——通過訓(xùn)練在數(shù)據(jù)集中學(xué)習(xí)得到。
池化層的作用是減小特征映射的空間大小,減小計(jì)算復(fù)雜度,同時(shí)保留關(guān)鍵信息。全連接層負(fù)責(zé)將前層的輸出與輸出層相連,實(shí)現(xiàn)特征整合以及對交通事件的最后分類。
為了提高模型在交通事件視頻數(shù)據(jù)上的泛化能力,數(shù)據(jù)預(yù)處理是必不可少的環(huán)節(jié)。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)擴(kuò)充和規(guī)范化處理。數(shù)據(jù)擴(kuò)充可以通過對原始交通事件視頻進(jìn)行隨機(jī)旋轉(zhuǎn)、翻轉(zhuǎn)、裁剪等操作,增加模型訓(xùn)練時(shí)的樣本多樣性,降低過擬合風(fēng)險(xiǎn)。標(biāo)準(zhǔn)化處理即歸一化,可將輸入交通事件視頻數(shù)據(jù)縮放到相同的范圍內(nèi),有助于提高模型收斂速度和穩(wěn)定性。
在模型訓(xùn)練階段,需確定損失函數(shù)、優(yōu)化策略以及評價(jià)指標(biāo)。損失函數(shù)衡量模型在交通事件視頻數(shù)據(jù)預(yù)測結(jié)果與實(shí)際標(biāo)簽間的差異,主要的損失函數(shù)有交叉熵?fù)p失、平均平方誤差損失等。本系統(tǒng)使用前者作為損失函數(shù),其表達(dá)式如下:
(2)
式中:N——樣本數(shù)量;
y——網(wǎng)絡(luò)的預(yù)測值;
優(yōu)化方法負(fù)責(zé)調(diào)節(jié)模型參數(shù)以降低損失函數(shù)的值,如隨機(jī)梯度下降(SGD)、Adam等。梯度下降法的表達(dá)式如下:
θ=θ-α*?L(θ)
(3)
式中:θ——模型參數(shù);
α——學(xué)習(xí)速率;
?L(θ) ——損失函數(shù)L關(guān)于模型參數(shù)θ的梯度。
評價(jià)指標(biāo)用于量化模型在交通事件視頻測試集上的表現(xiàn),典型指標(biāo)包括準(zhǔn)確率、召回率和F1分?jǐn)?shù)等。
2.1.1 實(shí)時(shí)交通事件監(jiān)測
實(shí)時(shí)交通事件監(jiān)測作為系統(tǒng)的關(guān)鍵功能之一,其目的是實(shí)時(shí)分析道路圖像數(shù)據(jù),自動(dòng)識別交通事件并即時(shí)報(bào)告。系統(tǒng)采用基于3D CNN的策略,高效地提取視頻序列中的時(shí)空特征。通過高效的計(jì)算和優(yōu)化技術(shù),系統(tǒng)可以在短時(shí)間內(nèi)處理大規(guī)模高維數(shù)據(jù),確保監(jiān)測結(jié)果的實(shí)時(shí)性。
2.1.2 交通事件分類與識別
除了實(shí)時(shí)監(jiān)測交通事件外,本系統(tǒng)還具有對交通事件進(jìn)行分類與識別的能力。通過對各類交通事件進(jìn)行標(biāo)注和學(xué)習(xí),系統(tǒng)能夠自動(dòng)識別多種交通事件,如車輛逆向行駛、停車異常、行人闖入等。這些分類數(shù)據(jù)能夠助力交通管理機(jī)構(gòu)制定有針對性的應(yīng)對措施,從而提升道路交通效率與安全性。
2.1.3 數(shù)據(jù)可視化與報(bào)警
為方便用戶和交通管理部門了解實(shí)時(shí)交通情況,本系統(tǒng)還提供數(shù)據(jù)可視化與報(bào)警功能。系統(tǒng)將檢測到的交通事件以直觀的方式展示在用戶界面上,并在發(fā)現(xiàn)緊急事件時(shí)發(fā)出警報(bào)。另外,系統(tǒng)還能產(chǎn)生歷史數(shù)據(jù)報(bào)告,有助于用戶分析交通情況的變遷趨勢,并為交通策劃與管理提供有力的決策依據(jù)。
圖2 基于三維卷積神經(jīng)網(wǎng)絡(luò)的交通事件檢測系統(tǒng)架構(gòu)圖
2.2.1 數(shù)據(jù)采集層
數(shù)據(jù)采集層負(fù)責(zé)實(shí)時(shí)獲取來自攝像頭或其他視頻數(shù)據(jù)源的視頻流。該層需要確保數(shù)據(jù)的高質(zhì)量和實(shí)時(shí)性,以便于后續(xù)處理。為了提高系統(tǒng)的可擴(kuò)展性,數(shù)據(jù)采集層支持多種數(shù)據(jù)格式和輸入源,包括IP攝像頭、文件存儲的視頻數(shù)據(jù)等。
2.2.2 數(shù)據(jù)預(yù)處理層
數(shù)據(jù)預(yù)處理層對收集到的初始視頻數(shù)據(jù)加以處理,以滿足后續(xù)三維卷積神經(jīng)網(wǎng)絡(luò)層輸入要求。主要處理過程包括視頻幀的抽取、縮放、歸一化和數(shù)據(jù)增強(qiáng)。通過這些處理階段,有助于降低數(shù)據(jù)噪聲、增強(qiáng)模型泛化性能,進(jìn)而提升交通事件識別的準(zhǔn)確度。
2.2.3 三維卷積神經(jīng)網(wǎng)絡(luò)層
三維卷積神經(jīng)網(wǎng)絡(luò)層作為本系統(tǒng)的關(guān)鍵部分,負(fù)責(zé)對經(jīng)過預(yù)處理的視頻數(shù)據(jù)進(jìn)行深度學(xué)習(xí)。通過卷積層、池化層和全連接層,該層自動(dòng)提取交通事件的時(shí)空特征,對不同類型的交通事件進(jìn)行識別和分類。模型訓(xùn)練和優(yōu)化在此層進(jìn)行,以保證系統(tǒng)在實(shí)際應(yīng)用中的高準(zhǔn)確性和實(shí)時(shí)性。
2.2.4 結(jié)果分析與展示層
結(jié)果分析與展示層將三維卷積神經(jīng)網(wǎng)絡(luò)層的輸出結(jié)果進(jìn)行解析和可視化。該層提供實(shí)時(shí)監(jiān)控畫面,將交通事件的識別信息疊加在原始視頻畫面上,使用戶能夠直觀地了解當(dāng)前交通狀況。此外,該層還支持自動(dòng)報(bào)警功能,當(dāng)檢測到重大交通事件時(shí),會向相關(guān)人員發(fā)送報(bào)警通知。
3.1.1 數(shù)據(jù)集描述
本試驗(yàn)采用了一個(gè)包含多種交通事件的視頻數(shù)據(jù)集進(jìn)行訓(xùn)練和測試。數(shù)據(jù)集涵蓋眾多城市道路及高速公路的交通監(jiān)控視頻片段,包含了如逆行行駛、非正常??俊⑿腥饲秩?、火警、異常拋撒物等典型交通事件。為了評估模型在不同場景下的泛化能力,數(shù)據(jù)集還包含了不同天氣、光照和拍攝角度下的視頻。數(shù)據(jù)集中的視頻已進(jìn)行標(biāo)注,包括事件類型、發(fā)生時(shí)間和位置信息,以便于模型訓(xùn)練和評估。
3.1.2 網(wǎng)絡(luò)參數(shù)與試驗(yàn)環(huán)境
采用一個(gè)經(jīng)過預(yù)訓(xùn)練的三維卷積神經(jīng)網(wǎng)絡(luò)模型作為基礎(chǔ)結(jié)構(gòu),并對其進(jìn)行適當(dāng)調(diào)整以適應(yīng)交通事件檢測任務(wù)。關(guān)鍵網(wǎng)絡(luò)參數(shù)涉及卷積層個(gè)數(shù)、卷積核尺寸、池化層配置等。在試驗(yàn)過程中,采用交叉驗(yàn)證技術(shù)對模型進(jìn)行了訓(xùn)練與驗(yàn)證,以確定最優(yōu)網(wǎng)絡(luò)參數(shù)。表1為試驗(yàn)使用的網(wǎng)絡(luò)參數(shù)。
表1 試驗(yàn)參數(shù)設(shè)置表
表2 各類交通事件檢測結(jié)果表
試驗(yàn)環(huán)境方面,本研究使用了具有i7-8700處理器、32G內(nèi)存以及RTX 2070顯卡的計(jì)算機(jī)進(jìn)行模型訓(xùn)練和測試。為了確保試驗(yàn)結(jié)果的可重復(fù)性,本文采用了TensorFlow深度學(xué)習(xí)框架,并統(tǒng)一了隨機(jī)數(shù)種子、初始權(quán)重等相關(guān)設(shè)置。
3.2.1 交通事件檢測準(zhǔn)確率
通過對測試集數(shù)據(jù)進(jìn)行評估,基于三維卷積神經(jīng)網(wǎng)絡(luò)的交通事件檢測系統(tǒng)表現(xiàn)出了較高的準(zhǔn)確率。試驗(yàn)顯示,該模型在處理車輛逆行、異常停車、行人闖入、火災(zāi)、異常拋撒物等交通事故檢測任務(wù)時(shí),整體識別準(zhǔn)確率高達(dá)92%,相較于傳統(tǒng)視頻分析方法有顯著提升。這說明所提出的基于三維卷積神經(jīng)網(wǎng)絡(luò)的方法具有較強(qiáng)的泛化能力,能夠在多種復(fù)雜場景下有效地識別交通事件。
3.2.2 交通事件分類與識別效果
試驗(yàn)結(jié)果還顯示,所提出的方法在各類交通事件的分類與識別上也具有優(yōu)良表現(xiàn)。具體來說,該方法在車輛逆行、異常停車、行人入侵、火災(zāi)、異常拋撒物等事件的識別準(zhǔn)確率分別為89.2%、93.3%、91.7%、95.3%、90.4%,這些結(jié)果均超過了傳統(tǒng)方法在相應(yīng)任務(wù)上的表現(xiàn)。表明該方法在處理不同類型交通事件時(shí),都能取得較好的分類與識別效果。
本文主要研究了基于三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)的交通事件檢測系統(tǒng)。該系統(tǒng)采用了數(shù)據(jù)采集層、數(shù)據(jù)預(yù)處理層、三維卷積神經(jīng)網(wǎng)絡(luò)層和結(jié)果分析與展示層四層架構(gòu)設(shè)計(jì),實(shí)現(xiàn)了實(shí)時(shí)交通事件檢測、交通事件分類與識別以及數(shù)據(jù)可視化與報(bào)警等功能。試驗(yàn)結(jié)果表明,該系統(tǒng)在多種交通事件類型上的識別準(zhǔn)確率均較高,具有較強(qiáng)的泛化能力和實(shí)用性。
未來工作還需關(guān)注以下方向:(1)持續(xù)對模型結(jié)構(gòu)和參數(shù)進(jìn)行優(yōu)化,旨在進(jìn)一步增強(qiáng)交通事故檢測的準(zhǔn)確性和實(shí)時(shí)響應(yīng)能力;(2)將嘗試引入多模態(tài)數(shù)據(jù),如融合車載傳感器數(shù)據(jù),以提高系統(tǒng)的魯棒性;(3)考慮將系統(tǒng)應(yīng)用于更廣泛的場景,如智能交通管理、無人駕駛等領(lǐng)域,為現(xiàn)代交通管理提供更多的技術(shù)支持。