李 輝,石 旭,李心怡,姚世嚴(yán),李天宇,鄭劍飛
(北京軌道交通路網(wǎng)管理有限公司,北京 100101)
路網(wǎng)客流運(yùn)營統(tǒng)計指標(biāo)作為網(wǎng)絡(luò)化運(yùn)營管理工作的數(shù)據(jù)基礎(chǔ),是運(yùn)力配置、行車組織、客流調(diào)控和評價運(yùn)營效果的核心依據(jù)。其中,列車滿載率指標(biāo)目前主要來自地鐵自動售檢票清分清算中心(AFC Clear Center,ACC)系統(tǒng)預(yù)測、車廂稱重和人工監(jiān)測,難以滿足智能化、自動化和精準(zhǔn)化的要求。近年來,智能視頻分析作為一種新的客流統(tǒng)計手段逐漸興起。然而,由于智能視頻分析算法場景適應(yīng)性較差,且普通相機(jī)受限于安裝高度、光線變化、人員遮擋等因素影響,數(shù)據(jù)精度難以滿足業(yè)務(wù)要求。
因此,本文提出了一種基于TOF(Time of Flight)技術(shù)的車廂乘客計數(shù)系統(tǒng)及其裝置的設(shè)計方法。該設(shè)備可以內(nèi)嵌式安裝在列車屏蔽門或車門門梁上,可實(shí)時統(tǒng)計列車上下車人數(shù),精準(zhǔn)計算列車實(shí)時載客人數(shù)及滿載率數(shù)據(jù)。經(jīng)實(shí)驗(yàn)室模擬測試,非高峰時段客流統(tǒng)計準(zhǔn)確率可達(dá)98%以上,高峰時段準(zhǔn)確率可達(dá)95%以上,可以較好地滿足實(shí)際業(yè)務(wù)需要。
TOF相機(jī)區(qū)別于傳統(tǒng)相機(jī)的最大特點(diǎn)是能夠區(qū)分前、后景,獲取圖像的深度信息,便于快速完成對目標(biāo)的識別與追蹤[1]。此外,TOF相機(jī)還具有抗強(qiáng)光干擾能力強(qiáng)、體積小等優(yōu)點(diǎn)[2]。TOF相機(jī)用于客流計數(shù)的原理是:在獲得3D深度照片后,首先,進(jìn)行目標(biāo)檢測,判斷被拍攝的目標(biāo)是否是行人;其次,利用傳感器內(nèi)部的算法設(shè)置一條線,當(dāng)人跨過這條線時會帶有運(yùn)動方向信息,以此追蹤人的行走軌跡;最后,計算得出上、下車人數(shù)[3],如圖1所示。因此,計數(shù)精度的核心在于目標(biāo)檢測和目標(biāo)追蹤算法的準(zhǔn)確性。
圖1 TOF計數(shù)原理
雖然TOF客流計數(shù)技術(shù)在國內(nèi)外公交、商超等領(lǐng)域得以應(yīng)用,但針對地鐵車廂空間低矮、超大客流、安裝條件受限等痛點(diǎn),必須進(jìn)行有針對性的樣本訓(xùn)練才能滿足地鐵應(yīng)用的要求[4]。此外,TOF相機(jī)的規(guī)格參數(shù)和尺寸也需要滿足地鐵車廂的安裝條件。
2.2.1 技術(shù)難點(diǎn)
在目標(biāo)檢測方面,開源的目標(biāo)檢測算法(如MTCNN、RCNN、EfficientNet等)[5]可以有效進(jìn)行人頭識別,但對算力需求高[6],訓(xùn)練數(shù)據(jù)多為側(cè)視視角下的圖片或視頻。地鐵場景中要求攝像頭畫面俯視向下,因此,開源算法需要針對俯視場景標(biāo)注樣本,利用深度學(xué)習(xí)方法訓(xùn)練模型,優(yōu)化算法參數(shù)。
在目標(biāo)跟蹤方面,地鐵場景是典型的多目標(biāo)跟蹤場景,需要適配多目標(biāo)跟蹤算法,設(shè)計多幀多目標(biāo)的跟蹤機(jī)制,建立從檢測到跟蹤的端到端系統(tǒng),保證每個目標(biāo)都有完整的軌跡線,并利用該軌跡線進(jìn)行后續(xù)的計數(shù)統(tǒng)計。
2.2.2 業(yè)務(wù)難點(diǎn)
自動化乘客計數(shù)技術(shù)在地鐵行業(yè)應(yīng)用面臨著很大的挑戰(zhàn),主要體現(xiàn)在以下方面。
(1)每名乘客上下車的形態(tài)、裝扮、動作、移動速度等的多樣性及地面反光等外界等因素都有可能影響到客流統(tǒng)計的準(zhǔn)確性[7]。
(2)高準(zhǔn)確性往往帶來計算復(fù)雜度的增加,進(jìn)而使得實(shí)時性降低。
(3)客流計數(shù)系統(tǒng)在不同環(huán)境、不同光照條件下都需要保持一定穩(wěn)定性[8]。
地鐵TOF客流計數(shù)系統(tǒng)主要由加載有算法模型的客流計數(shù)相機(jī)、包含車站級和中心級兩個模塊的客流計數(shù)軟件系統(tǒng)兩部分組成。本文依據(jù)列車車門對設(shè)備尺寸的要求,設(shè)計并定制了一款TOF相機(jī),如圖2所示,安裝位置如圖3所示。其中的嵌入式軟件主要包括目標(biāo)檢測模塊和目標(biāo)跟蹤模塊。
圖2 TOF相機(jī)實(shí)物圖
圖3 屏蔽門安裝示意圖
本文首先采用深度學(xué)習(xí)與3D深度成像相結(jié)合的方案,來解決乘客形態(tài)多樣性對目標(biāo)檢測準(zhǔn)確率的影響問題,從而實(shí)現(xiàn)高精度、高魯棒性的目標(biāo)檢測。其次,當(dāng)檢測到目標(biāo)初始位置后,利用目標(biāo)跟蹤模塊實(shí)現(xiàn)對畫面中的多目標(biāo)同時跟蹤。最后,計數(shù)邏輯采用檢測線法和閾值法相結(jié)合的方案,保證客流統(tǒng)計的高準(zhǔn)確率。
本文采用72層神經(jīng)網(wǎng)絡(luò)使得深度神經(jīng)網(wǎng)絡(luò)能夠提取到更深層次的高階特征,具備更強(qiáng)的正負(fù)樣本區(qū)分能力[9]。本文的訓(xùn)練數(shù)據(jù)來源于通用目標(biāo)檢測場景、模擬列車場景(按標(biāo)準(zhǔn)B型車三維結(jié)構(gòu)尺寸)及實(shí)際采集場景,共計2萬張數(shù)據(jù),每張圖片中的目標(biāo)數(shù)1~30不等,其中,人頭、頭肩、人體、部分人體均標(biāo)記為正樣本和所需標(biāo)出的目標(biāo)檢測區(qū)域,訓(xùn)練集與測試集比例為4:1。
由于目標(biāo)在畫面中的尺度占比大約為1/10~1/2之間,因此,初始卷積層卷積核大小選擇為5×5;考慮正負(fù)樣本之間差異性較大,初始學(xué)習(xí)率設(shè)置為0.01,隨后每10 000次循環(huán)下降20%;由于網(wǎng)絡(luò)層數(shù)較深,參數(shù)量較大,Dropout的參數(shù)設(shè)為0.3。最終,訓(xùn)練后的模型在測試集上的召回率與精度曲線如圖4所示。
圖4 召回率與精度曲線圖
乘客在上下車的過程中,人頭、人體、頭肩等會出現(xiàn)大小、形態(tài)、亮度變化情況。此外,理想狀態(tài)下,乘客會順次從車門進(jìn)出,但現(xiàn)實(shí)中乘客路線軌跡繁雜,如圖5所示。因此,高效、魯棒的跟蹤模型,完整準(zhǔn)確的軌跡線對計數(shù)結(jié)果有很大的影響[10]。
圖5 乘客上下車軌跡線
本文采用基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)提取前景目標(biāo),進(jìn)而通過局部最大值法獲取乘客的頭部信息,使用局部區(qū)域塊匹配法將獲取的乘客頭部信息與在下一幀圖像中檢測到的目標(biāo)區(qū)域進(jìn)行匹配[11],以此實(shí)現(xiàn)目標(biāo)跟蹤。
為全面、完整地評估本設(shè)備的技術(shù)能力,我們搭建了一個仿真車廂,在車門處安裝部署了內(nèi)嵌算法模型的TOF相機(jī),從乘客、環(huán)境兩個角度出發(fā)進(jìn)行測試,如圖6所示。
圖6 乘客上下車仿真測試
測試視頻條數(shù)如表1所示,由于擁擠狀態(tài)和多個方向是本研究方向的困難領(lǐng)域,因此在這兩種情況下增加了測試數(shù)據(jù)。這些視頻中,共有目標(biāo)總數(shù)4 543個,總軌跡線1 642條,其中,進(jìn)出人數(shù)分別為852次和790次。
表1 測試數(shù)據(jù)數(shù)量統(tǒng)計表
如表2所示,隨著閾值升高,誤檢下降,但召回率也會同步降低。因此,設(shè)置合理的閾值是目標(biāo)檢測的關(guān)鍵[12],由統(tǒng)計結(jié)果可知,選用0.7作為目標(biāo)檢測的閾值是最佳的選擇。
表2 檢測準(zhǔn)確率統(tǒng)計表
利用目標(biāo)跟蹤軌跡線進(jìn)行進(jìn)出人數(shù)統(tǒng)計,各場景準(zhǔn)確率如表3所示。可見,不同場景的實(shí)驗(yàn)室客流計數(shù)準(zhǔn)確率均達(dá)到95%以上。
表3 各場景準(zhǔn)確率統(tǒng)計表
本文針對地鐵客流計數(shù)業(yè)務(wù)需求,設(shè)計了一個在站臺屏蔽門或車門安裝TOF相機(jī)進(jìn)行上下車人數(shù)統(tǒng)計的方案,訓(xùn)練了一個目標(biāo)檢測算法和目標(biāo)跟蹤模型并嵌入相機(jī),通過仿真測試,最終準(zhǔn)確率均在95%以上。本文的主要研究工作及創(chuàng)新點(diǎn)如下。
(1)本文創(chuàng)新地使用TOF+視頻分析技術(shù),可以適配不同的光照條件和不同的乘客穿戴,增強(qiáng)了客流計數(shù)系統(tǒng)的魯棒性和穩(wěn)定性。
(2)使用3D計數(shù)與跨線融合的計數(shù)邏輯,綜合兩者的優(yōu)勢,提高了計數(shù)準(zhǔn)確率。
(3)基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù),針對地鐵客流統(tǒng)計業(yè)務(wù)需求,將人頭、頭肩、部分人體都作為正樣本,大大提高了目標(biāo)檢測的召回率,拓寬了硬件設(shè)備的覆蓋范圍,提高了設(shè)備的適用性。
后續(xù),將借助在北京地鐵11號線(冬奧支線)開展應(yīng)用的契機(jī),繼續(xù)完善該技術(shù)方案,為后續(xù)推廣奠定堅(jiān)實(shí)的技術(shù)基礎(chǔ),為“智慧地鐵”的建設(shè)提供有力支撐?!?/p>