全江浩 王云成
摘要:如今人均車輛保有率逐年上升,如何快捷尋找停車場空位成為停車行業(yè)研究的新方向。隨著深度學習技術(shù)的發(fā)展,使用深度學習檢測停車場空位,為解決停車位檢測問題提供了新思路。文章提出了一種基于深度學習結(jié)合透視變換,Canny算子邊緣檢測和霍夫變換直線特征提取等方法的停車場空位檢測模型,其準確率達到94.44%,在檢測停車空位方面取得較好效果﹐為停車場空位圖像檢測方向提供了實現(xiàn)方法和技術(shù)支撐。
關(guān)鍵詞:霍夫變換;邊緣檢測;深度學習;車位檢測中圖法分類號:TP391文獻標識碼:A
Parking space detection model based on hough transform anddeep neural network
QUAN Jianghao,WANG Yuncheng
(College of Data Science and Application,Inner Mongolia University of Technology,Huhhot o10051,China)Abstract: Nowadays,the per capita vehicle occupancy rate is increasing year by year.How to quicklyfind parking spaces has become a new direction of parking industry research. With the development ofdeep learning,deep learning is used to detect parking spaces,which provides innovative ideas forsolving parking space detection problems. In this paper,a parking space detection model based ondeep learning combined with perspective transform,Canny operator edge detection and Houghtransform linear feature extraction is proposed. The accuracy rate reaches 94.44 %,and good resultsare achieved in the detection of parking spaces,which provides implementation methods andtechnicalsupport for parking space image detection.
Key words: houghtransform,edgedetection,deeplearning,parking detection
1? 引言
近年來,國內(nèi)車輛人均保有率持續(xù)上升,提高停車位利用率成為新的研究方向。在充分利用現(xiàn)有車位的前提下,協(xié)助駕駛員更快地找到空車位,可以提高停車場的空位利用率。目前,大多數(shù)停車場基于安全考慮已實現(xiàn)視頻監(jiān)控全覆蓋,在此基礎上可以構(gòu)建基于分析視頻圖像監(jiān)測停車場的車位情況系統(tǒng)。傳統(tǒng)圖像檢測是將圖像灰度尖峰區(qū)域作為特征檢測車位的方法[1] ,對車位的選定為人工輸入,無法根據(jù)環(huán)境情況進行更新,易受環(huán)境信息的干擾。人工智能技術(shù)發(fā)展迅速,深度學習是當今研究和應用的熱點技術(shù)?;诖?,本文主要應用深度學習網(wǎng)絡中的卷積神經(jīng)網(wǎng)絡(CNN)進行停車場空位檢測,基于 Canny 算子邊緣檢測、霍夫變換直線檢測、圖像透視變換等技術(shù),處理原始停車場圖像數(shù)據(jù),可有效提高檢測的準確率。
2? 原始數(shù)據(jù)預處理
2.1? 停車位透視變換
該模型使用逆透視變換的方法,可將車位圖像變換為俯視圖。假設停車場攝像機安裝的位置在世界坐標系中的坐標為(d,l,h),攝像機光軸 o 在 z =0 平面的投影與 y 軸的夾角為γ,光軸 o 與 z =0平面的夾角為θ,攝像機的視角為2α,攝像機在水平方向和垂直方向的分辨率分別為 Rx 和 Ry [2]。則根據(jù)坐標變換關(guān)系,可得從圖像坐標系 I 變換到世界坐標系 W 的逆透視變換模型如下:
2.2? 邊緣檢測
圖像邊緣檢測是圖像處理流程中較為重要的環(huán)節(jié)。目前,主流的邊緣檢測多樣,結(jié)合車位檢測任務對 log 算子、sobel算子、canny 算子等進行評估與選擇:log 算子常產(chǎn)生雙邊界,sobel算子易形成不閉合區(qū)域,無法滿足停車位檢測的需要。而 canny 算子是相較更優(yōu)的階梯型邊緣檢測算法[3]。1986年,John Canny 首次提出了 Canny 算子,Canny 邊緣檢測算法運用高斯函數(shù)對原始圖像進行卷積運算到達去噪效果,從而得到平滑圖像[4]。公式如下:
式中 G( x ,y)代表平滑因子,?代表卷積操作,I( x ,y) 代表濾波后的圖像,σ代表均方差。本文采用 canny 算子邊緣檢測技術(shù)實現(xiàn)停車場原始圖像數(shù)據(jù)的邊緣檢測,圖1 為停車場原始數(shù)據(jù)檢測邊沿效果。
2.3? 直線特征提取
前文介紹的車位圖像中,車位特征信息主要為直線邊緣特征,通過對停車位直線特征的檢測,可提取車位的有效位置信息。1962年,Paul Hough 根據(jù)數(shù)學對偶性原理提出了檢測圖像直線的方法,此后該方法被不斷地研究和發(fā)展,集中應用于模式識別領域中對二值圖像進行直線檢測[5]?;舴蜃儞Q通過圖像平面中的點計算得到參數(shù)平面中的線,通過參數(shù)平面中相應線的交會地址計算圖像平面中的目標直線。直線上的兩個點( x 1,y1) 和( x2,y2) 在參數(shù)平面分別對應一條曲線:
式中,θ代表直線通過原點的垂線段與 x 軸正方向夾角,ρ代表垂線段的長度。若將θ,ρ作為參數(shù),則直線在參數(shù)平面可表示為一點(θ,ρ)。兩曲線交點的坐標(θ′,ρ′)為該直線在xy平面內(nèi)的對應參數(shù)[6] 。將θρ平面離散化為累加單元 A ,并將其初始化為0 ,然后令θ等于每一個允許的細分值,對圖像中的每一個非背景點( x2,y2) 得到與之對應的ρ。本文應用
霍夫變換原理提取停車場車位的邊緣直線特征。圖2 為原始數(shù)據(jù)經(jīng)過霍夫直線檢測并處理得到目標車位預測。
3? 自建數(shù)據(jù)集
停車場車位數(shù)據(jù)屬于非公開數(shù)據(jù),所用數(shù)據(jù)大多來自網(wǎng)絡,包含空位、占位、雜物占位等多種車位情況,圖像數(shù)據(jù)分辨率為300×600像素,共選取的圖像數(shù)量為1355張,根據(jù)空位和占位的不同種類分別置于文件夾中,按照3 ∶1的比例,隨機抽取圖片分別劃分成訓練集和測試集,每個種類展示3 張圖片。
4? 模型分析
本文搭建的神經(jīng)網(wǎng)絡檢測模型是一種針對停車場空位檢測任務設計的輕量級卷積神經(jīng)網(wǎng)絡。在神經(jīng)網(wǎng)絡結(jié)構(gòu)中,卷積層的數(shù)量不同會對神經(jīng)網(wǎng)絡性能產(chǎn)生較大影響。因此,進行對比實驗時,探討較適合停車場空位檢測模型的卷積層數(shù)量,經(jīng)過多輪實驗得出結(jié)論:卷積層數(shù)量為3 的卷積神經(jīng)網(wǎng)絡在處理車位檢測任務時性能表現(xiàn)較為出色。sigmoid 是最接近生物神經(jīng)元的函數(shù),在處理二分類問題時表現(xiàn)出色,該函數(shù)圖像平滑,較易于求導,具體數(shù)學功能是將實數(shù)映射到[0 ,1] 區(qū)間[7] ,契合停車場空位檢測二分類任務,所以自建停車場空位檢測模型所用分類層由 sigmoid 函數(shù)實現(xiàn)。圖3 為該自建模型的可視化展示。
5? 訓練模型
5.1? 數(shù)據(jù)增強
停車空位作為一個場景分類任務,其標簽涉及光線、噪點以及場景環(huán)境等多種要素,僅從有限的數(shù)據(jù)集中訓練出能夠較準確識別停車場車位情況的模型是非常困難的,因此還需要通過數(shù)據(jù)增強方法對數(shù)據(jù)集的數(shù)量和質(zhì)量進行提升。本文采用動態(tài)的數(shù)據(jù)增強方法,在每輪訓練開始之前,通過透視變換理論重新隨機選擇訓練集中的車位圖像,進行左右翻轉(zhuǎn)或角度偏移以及在一定范圍內(nèi)隨機設置圖片亮度、對比度和飽和度,擴大數(shù)據(jù)集的規(guī)模,提高模型的魯棒性。
5.2? 自建模型訓練
使用訓練集的樣本圖像訓練自建模型,模型訓練只使用 GPU 運算,每一輪參與訓練的樣本總數(shù)為 1553。每輪訓練采用分批次的方法,一個批次訓練所用的樣本數(shù)( Batch Size )設為32,因此每輪的迭代數(shù)(Epoch)等于50。初始學習率( Learning Rate )初始設置為0.001,應用動態(tài)學習率策略實時優(yōu)化模型參數(shù)。圖 4表示準確率(Accuracy)和損失值(Loss )隨輪次的變化,隨著輪次數(shù)值接近40次時,訓練集損失值逐步收斂于0 ,準確率逐步趨于1 ,表明模型訓練成功。
6? 評估模型預測效果
使用驗證集樣本圖像測試已經(jīng)完成訓練的自建深度學習模型,驗證集數(shù)據(jù)獨立于訓練集外,總計 446張,經(jīng)過模型預測,總體準確率為94.44%,總體準確率的具體定義模型預測正確的數(shù)量與測試數(shù)據(jù)總量的百分比。圖5 為使用原始數(shù)據(jù)測試模型的結(jié)果樣圖,得出原始數(shù)據(jù)中車位總數(shù)和空位分布情況。
7? 結(jié)論
本文主要研究基于視覺分析的停車場空位檢測算法,結(jié)合 Canny 算子檢測方法、透視變換原理和霍夫變換直線檢測理論提取停車位特征數(shù)據(jù)并加以訓練,基于卷積神經(jīng)網(wǎng)絡設計出停車場空位檢測的二分類識別方法,利用自建數(shù)據(jù)集完成在多種停車情景中的停車位檢測任務。模型訓練開始時,首先根據(jù)原始數(shù)據(jù)固有特點對初始學習率、輪次、步長等參數(shù)進行合理設置,創(chuàng)新采用 Canny 算子檢測方法和透視變換原理結(jié)合的預處理流程,極大擴增了樣本訓練量,并在接下來的測試集預測中,總體準確率達到94.44%,對多種停車情景的識別效果較好,表明使用該算法對停車場空位進行檢測是切實可行的,同時也為實現(xiàn)停車場空位檢測的智能化提供了理論技術(shù)和實用方法。
參考文獻:
[1 ] 王建飛.停車場空位檢測系統(tǒng)研究[ D].貴州:貴州民族大
[2 ] 李海華,萬熱華,陳小玲,等.一種基于逆透視變換的車道線檢測方法[J].工業(yè)儀表與自動化裝置,2021( 2):97?100.
[3 ] 梅永,莊建軍.基于 Canny 邊緣檢測的圖像預處理優(yōu)化算法[J].信息化建設,2022,46(1 ):75?79.
[4 ]? Canny? J .A? Computational? Approach? to? Edge? Detection [ J ].IEEE? Transactions? on? Pattern? Analysis? and? Machine Intelligence ,1986,PAMI?8( 6):679?698.
[5 ] 唐佳林,王鎮(zhèn)波,張鑫鑫.基于霍夫變換的直線檢測技術(shù)[ J ].科技信息,2011 (14):33?35.
[6 ] 李慧鵬,朱偉偉,譚朦曦,等.基于改進 Hough 變換的直線檢測算法[J].半導體光電,2017,38(4 ):603?608.
[7 ] 王攀杰,郭紹忠,侯明,等.激活函數(shù)的對比測試與分析[J].信息工程大學學報,2021,22(5 ):551?557.
作者簡介:
全江浩(2001— ),本科,研究方向:計算機視覺。
王云成(1993—) ,碩士,助教,研究方向:深度學習、智能系統(tǒng)。