楊樹旺
(中鐵第一勘察設(shè)計(jì)院集團(tuán)有限公司,陜西西安 710043)
伴隨計(jì)算機(jī)及信息技術(shù)的發(fā)展,以全自動(dòng)駕駛車輛為代表的新技術(shù)為城市軌道交通注入新的活力。為提高全自動(dòng)駕駛車輛檢修作業(yè)的信息化水平,完善車輛檢修基地的信息化建設(shè),將全自動(dòng)駕駛車輛基地自動(dòng)駕駛區(qū)綜合管控系統(tǒng)所產(chǎn)生的監(jiān)測數(shù)據(jù)與對應(yīng)車輛進(jìn)行綁定,即可形成特定車輛的專屬“病例”檔案,便于檢修管理決策以及車輛性能改進(jìn)。而要實(shí)現(xiàn)上述目標(biāo),就必須完成車輛編號的自動(dòng)識別。
車輛編號自動(dòng)識別技術(shù)的實(shí)現(xiàn)主要經(jīng)歷了射頻技術(shù)與電子標(biāo)簽結(jié)合、圖像識別技術(shù)等階段,但由于涉及車輛結(jié)構(gòu)改造以及易受異物影響等原因,使用效果均不理想。隨著大數(shù)據(jù)技術(shù)的發(fā)展,深度學(xué)習(xí)技術(shù)逐漸在車號識別研究領(lǐng)域有所應(yīng)用。胡路路、張亮等采用目標(biāo)檢測算法、文字檢測網(wǎng)絡(luò)(Connectionist Text Proposal Network,CTPN)模型實(shí)現(xiàn)了車輛編號的識別,準(zhǔn)確率超過95%。但該種方法模型迭代次數(shù)極高,需要大量的樣本數(shù)據(jù)提高識別準(zhǔn)確率。
本文基于深度學(xué)習(xí)、目標(biāo)檢測、機(jī)器視覺和光學(xué)字符識別(Optical Character Recognition,OCR)等技術(shù),研發(fā)新型車號識別系統(tǒng)。該系統(tǒng)利用車輛標(biāo)志與編號相對位置固定的特點(diǎn),大幅減少模型訓(xùn)練所需的樣本數(shù)量。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的分支,是一種以人工神經(jīng)網(wǎng)絡(luò)為架構(gòu),對資料進(jìn)行表征學(xué)習(xí)的算法。本系統(tǒng)使用的深度學(xué)習(xí)技術(shù)框架為Darknet。Darknet深度學(xué)習(xí)框架支持中央處理器(Central Processing Unit,CPU)和圖形處理器(Graphics Processing Unit,GPU)計(jì)算,且支持開源計(jì)算機(jī)視覺庫(Open Source Computer Vision Library,OpenCV)和共享內(nèi)存并行編程(Open Multi-Processing,OpenMP),同時(shí)Darknet框架具有結(jié)構(gòu)清晰,源代碼查看、修改方便的優(yōu)點(diǎn)。
目標(biāo)檢測是計(jì)算機(jī)視覺及影像處理中的術(shù)語,指的是讓計(jì)算機(jī)去分析1張圖片或者1段視頻流中的物體,并標(biāo)記出來。本系統(tǒng)使用YOLO目標(biāo)檢測算法,其算法示意圖如圖1所示。YOLO算法將輸入圖像縮放成統(tǒng)一大小的尺寸,利用整張圖片作為輸入進(jìn)行特征的提取,將最后的特征圖劃分為S×S個(gè)網(wǎng)格,每個(gè)網(wǎng)格可以看成是1個(gè)候選框,每個(gè)候選框包含了4維位置坐標(biāo)信息和1維目標(biāo)類別置信度,然后分別對每個(gè)網(wǎng)格進(jìn)行目標(biāo)分類和邊框回歸,實(shí)現(xiàn)目標(biāo)搜索。
機(jī)器視覺是配備有感測視覺儀器(如自動(dòng)對焦相機(jī)或傳感器)的檢測機(jī)器,可用于檢測產(chǎn)品缺陷、判斷并選擇特定物體,或用于測量尺寸等,大量應(yīng)用于工廠自動(dòng)化檢測及機(jī)器人產(chǎn)業(yè)中。
OCR是指對文本資料的圖像文件進(jìn)行分析識別處理,獲取文字及版面信息的過程。本系統(tǒng)使用開源算法Tesseract。支持Tesseract 的Leptonica組件有著優(yōu)越的圖像分析性能,保證文字識別的精度。除此之外,Tesseract還具有多平臺的可移植性,擁有龐大的Unicode字符識別庫。OCR 檢測與文本識別主要包含圖像預(yù)處理、版面分析、圖像切分、特征提取與模型訓(xùn)練、識別后處理等,其流程如圖2所示。
基于上述技術(shù),本文研發(fā)的基于深度學(xué)習(xí)目標(biāo)檢測的車號識別系統(tǒng)主要由高速攝像頭、光電反射車感器、邊緣計(jì)算機(jī)及信息傳輸模塊組成,工作流程如圖3所示。
(1)在列檢庫司機(jī)登車平臺端部,采用可調(diào)節(jié)吊桿機(jī)構(gòu)吊裝車號識別攝像機(jī),使其能夠在車輛經(jīng)過時(shí)在同一畫面中拍攝到車輛的標(biāo)志(LOGO)和車號,車號識別攝像機(jī)安裝位置如圖4所示。在該股道車輛入庫位置部署1臺邊緣計(jì)算機(jī)和1個(gè)光電反射車感器,地鐵車輛經(jīng)過時(shí)觸發(fā)車感器,邊緣計(jì)算機(jī)通過車感器檢測到車輛到來,觸發(fā)攝像頭錄制短視頻。
(2)邊緣計(jì)算機(jī)內(nèi)置檢測程序,使用深度學(xué)習(xí)目標(biāo)檢測技術(shù)逐幀檢測視頻是否拍到車輛LOGO,如果沒有檢測到則判定為車感器誤觸發(fā);如果檢測到車輛LOGO,則通過檢測程序計(jì)算得到LOGO在圖像上的位置和像素尺寸大小。
(3)根據(jù)車頭正面LOGO與車號之間的相對位置和大小比例關(guān)系(預(yù)置在檢測程序中),基于機(jī)器視覺技術(shù)計(jì)算出車號在圖像上的位置和大小,找到車號位置,圖像裁減后使用OCR算法進(jìn)行文本識別,得到車號數(shù)據(jù)。由于攝像頭不可能安裝在車頭正前方,車號圖像會有變形,裁減車號位置的圖像后,可通過透視變換矯正圖像,以改善圖像變形對識別結(jié)果的影響。
(4)邊緣計(jì)算機(jī)按照通信協(xié)議要求將車號數(shù)據(jù)、車感器被觸發(fā)的時(shí)間以及邊緣計(jì)算機(jī)編號通過網(wǎng)絡(luò)發(fā)送給上級服務(wù)器。上級服務(wù)器據(jù)此形成特定車輛的位置記錄。
地鐵車輛的車頭部分標(biāo)識了車輛編號及車輛LOGO,如圖5所示。不同車輛的車號不同,但LOGO的位置及形狀固定不變。系統(tǒng)在策略上的與眾不同之處在于,不直接識別車號,而是先識別出LOGO,根據(jù)LOGO與車號之間的位置關(guān)系,找到車號所在區(qū)域,然后再識別車號。由于LOGO是固定不變的目標(biāo),相比車號的識別準(zhǔn)確度會更高,深度學(xué)習(xí)時(shí)所需要的樣本更少,訓(xùn)練速度更快。
依托南寧地鐵那洪車輛基地的建設(shè),實(shí)施全自動(dòng)駕駛車輛基地作業(yè)綜合管控系統(tǒng)。其中停車列檢庫的車號識別系統(tǒng)安裝完畢后,在現(xiàn)場進(jìn)行為期2個(gè)月的調(diào)試測試,數(shù)據(jù)統(tǒng)計(jì)結(jié)果如圖6所示。
由圖6可知,測試前期識別成功率曲線波動(dòng)較大,成功識別車號數(shù)量較少;隨著調(diào)試過程的推進(jìn),識別成功率逐漸上升,并趨于穩(wěn)定,但仍有個(gè)別數(shù)據(jù)波動(dòng)產(chǎn)生。通過故障分析顯示,個(gè)別股道未能成功識別車號的原因均為車感器未被觸發(fā)、攝像機(jī)未拍攝錄像等硬件設(shè)備原因,除此之外,在硬件設(shè)備正常運(yùn)轉(zhuǎn)、攝像機(jī)正常工作的其余股道,車號識別系統(tǒng)均正確識別出所在股道的車輛車號。在調(diào)試后期,系統(tǒng)的識別準(zhǔn)確率也趨于穩(wěn)定。
當(dāng)前國內(nèi)城市軌道交通發(fā)展迅速,本文從全自動(dòng)駕駛車輛基地自動(dòng)駕駛區(qū)綜合管控系統(tǒng)的實(shí)際需求出發(fā),綜合深度學(xué)習(xí)、目標(biāo)檢測、機(jī)器視覺以及光學(xué)字符識別技術(shù),利用地鐵車輛車號與車輛標(biāo)志相對位置不變的特點(diǎn),開發(fā)了地鐵車輛的車號識別系統(tǒng)。經(jīng)過現(xiàn)場安裝測試,證明其能夠成功識別車輛編號,準(zhǔn)確率及可靠性均達(dá)到使用要求,可為解決傳統(tǒng)地鐵車輛檢修基地車號識別問題提供有效的解決方法,為持續(xù)推進(jìn)車輛基地運(yùn)用檢修管理信息化提供有力保障。