黃尚安
(江門職業(yè)技術學院,廣東 江門529090)
當前智能交通正處于飛速發(fā)展的階段,特別在無人駕駛、輔助駕駛領域中對于交通標志檢測技術的要求越來越高,如何做到快速、準確的檢測交通標志,平衡目標檢測速度和精度之間的關系,一直是研究人員追求的目標。
Kun Ren 等人提出了一種基于深度可分DetNet 和Lite 融合特征金字塔網絡(LFFPN)的實時交通標志檢測系統(tǒng)。該模型采用深度可分的瓶頸塊、Lite 融合模塊和改進的SSD 檢測前端,實現了速度和精度的折衷,在GTSDB 數據集上的mAP 為81.35%[1];JA Khan 等人基于YOLO 模型建立了交通標志檢測器,采用網格優(yōu)化和錨箱優(yōu)化的方法對小型交通標志的檢測性能進行了優(yōu)化,也取得了不錯的成績,但是模型計算量卻有待進一步控制[2];F Liu 等人提出了一種基于信道關注與特征融合網絡(CAFFNet)的多目標交通標志檢測方法。該方法通過輕量級信道注意網絡有效地學習特征信道之間的相關性,在不降低維數的情況下實現局部交叉信道交互,提高了網絡的表示能力,mAP達到了0.88 的好成績[3];J Zhang, 等人提出了一種級聯的R-CNN 來獲取金字塔中的多尺度特征,除第一層外,級聯網絡的每一層都融合前一層的輸出邊界框,以進行聯合訓練,且在此基礎上,提出了一種基于點積和Softmax 的加權多尺度特征提取方法,并將其歸結為細化特征,突出交通標志特征,提高交通標志檢測的準確性,也取得了不錯的成績,但是模型參數量過大,有待優(yōu)化[4];PS Zaki 等人提出了一種利用快速遞歸卷積神經網絡(F-RCNN)和單鏡頭多盒檢測器(SSD)等多目標檢測系統(tǒng),結合MobileNet v1 和Inception v2 等多種特征提取器,解決交通標志檢測問題,mAP 達到了0.86[5]。
交通標志檢測相對于其它目標檢測問題,有相當多的特殊性:如雨雪天氣下、極端光照下或者遮擋污損下,如何保證在惡劣天氣狀況下準確檢測出交通標志;再比如當前眾多的算法模型對交通標志檢測會出現性能下降的情況,本文研究基于改進YOLO 模型的交通標志檢測方法,力求在檢測精度和速度之間達到平衡,做到又快又好。
YOLO 模型是華盛頓大學Joseph Redmon 最早構建提出的一種端到端的目標檢測模型,它的本質實際上是對回歸問題進行求解[6]。模型的入口就是原始待檢測圖像,而模型的出口就是目標檢測的結果位置以及相應類別,它與fast rcnn 等目標檢測算法的區(qū)別是:YOLO 模型的訓練迭代和目標檢測都是在一個獨立網絡中工作,相較于多種模塊混合工作的方式,YOLO 模型擁有更加優(yōu)秀的檢測速度,但是過于“單一模塊”的工作方式,又讓它的檢測精度受到限制,圖1 為YOLO 模型的整體架構。
圖1 YOLO 模型的整體架構
如圖1 所示,YOLO 模型的卷冊層共計24 個,全連接層共計2 個。YOLO 模型在訓練過程中的損失函數如下所示:
CNN 卷積神經網絡中感受野的值越小,卷積層對細節(jié)特征的提取能力就越強,反之則變弱[7]。而YOLO 模型中前部分網絡層的感受也較小,本文研究構建一種特征加深模塊,加強YOLO模型中前部分網絡層對細節(jié)、局部特征的提取能力,從而增強對交通標志的檢測能力。如圖2 所示,特征加深模塊包含前、中、后三個網絡層,每個網絡層都包含卷積核大小為1×1、3×3 的卷積層,且最終將加深的特征融合到批量標準化層(BN 層),以此完成細節(jié)特征加深的主要工作。
圖2 特征加深模塊
圖3 為改進的YOLO 模型,添加的特征加深模塊中,卷積核、特征圖大小及層數都已在圖中標明,值得注意的是,提出模塊使用Lanczos 插值算法[8],能夠進一步加深細節(jié)和局部信息提取能力,且能有效控制模型計算的參數量。
本文提出的改進模型和原YOLO 模型都在德國交通標志公共數據集GTSDB 上進行訓練和評估。初始學習率設置為0.001,動量設置為0.7,權重衰減設置為0.0003,批量大小設置為28,數據集圖像輸入像素大小統(tǒng)一調整為448×448。本文選擇的實驗數據集GTSDB 中有900 幅圖像,我們將其中的600 幅圖像用于訓練,300 幅圖像用于本文提出方法的評價。我們在具有Intel Core i7-11700K CPU,32 GB RAM,NVIDIA GeForce GTX1080 GPU 和Ubuntu 18.04 的計算機上做實驗。
將原YOLO 模型設為模型A,將添加特征加深模塊的YOLO 模型設為模型B,前期900 個迭代次數下,代價函數與迭代次數的關系,如圖4 所示。
圖4 模型代價函數與迭代次數的關系圖
無論是原YOLO 模型,還是改進的YOLO 模型,隨著迭代次數的增加,模型都可以很快將代價函數值降下來,模型擁有非常優(yōu)秀的訓練速度,較好控制了計算量。本文提出的改進YOLO模型和當前其他算法的mAP 對比,如表1 所示。
表1 與當前其它方法的結果比較
通過和當前較多方法實驗結果的對比,本文提出的改進YOLO 模型相較于原模型mAP 提升了13.3%,且優(yōu)于目前眾多算法模型。
本文提出了一種基于改進YOLO 模型的交通標志檢測方法,解決了原模型對交通標志檢測出現性能下降的情況,能夠在控制計算量大小基礎上,獲得優(yōu)秀的檢測性能。下一步還將研究特征加深模塊對其它目標檢測算法的幫助。