田保書 彭月麗 羅婧 劉俊 韋光洋
摘要:隨著時(shí)代的發(fā)展,駕車出行是更多人的選擇方式,但是越來越多的交通事故嚴(yán)重影響了人們的安全,這些交通事故的背后大多數(shù)都是由于駕駛不規(guī)范而造成的。本項(xiàng)目組研究的基于深度學(xué)習(xí)的不規(guī)范駕駛行為智能識(shí)別系統(tǒng),可以智能的檢測(cè)到駕駛員的不規(guī)范行為,極大的提高了駕駛的安全性。
關(guān)鍵詞:深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò);不規(guī)范駕駛行為
1 引言
近幾年,隨著科技和技術(shù)的不斷發(fā)展,公交車和出租車以及私家車都不斷的增多,這不僅給我們的出行帶來了便利,而且還充分的體現(xiàn)出我國(guó)的經(jīng)濟(jì)發(fā)展的速度,但這也為人們的安全埋下了隱患。根據(jù)交通安全大數(shù)據(jù)所了解,在容易導(dǎo)致事故發(fā)生的十大不規(guī)范駕駛行為中,未按操作規(guī)范安全駕駛、文明駕駛的占49.6%。可以看出不規(guī)范駕駛行為所導(dǎo)致的交通事故接近占總比的一半。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個(gè)新領(lǐng)域,其目的在于訓(xùn)練計(jì)算機(jī)完成自主學(xué)習(xí)、判斷、決策等人類行為并建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)[1]。當(dāng)前,深度學(xué)習(xí)的研究逐漸從監(jiān)督學(xué)習(xí)轉(zhuǎn)移到強(qiáng)化學(xué)習(xí)、半監(jiān)督學(xué)習(xí)以及無監(jiān)督學(xué)習(xí)鄰域,視頻檢測(cè),因其可以利用海量無標(biāo)記的自然數(shù)據(jù)去學(xué)習(xí)視頻的內(nèi)在特征。
對(duì)此,基于之前的各種傳統(tǒng)的監(jiān)控系統(tǒng)在不同領(lǐng)域中,所暴露出來的局限性和狹義性。使新一代智能監(jiān)控系統(tǒng)的得以飛速發(fā)展,基于深度學(xué)習(xí)的不規(guī)范駕駛行為智能識(shí)別系統(tǒng)與傳統(tǒng)的行車記錄儀相比他的優(yōu)點(diǎn)在于能夠全面的解決司機(jī)的不規(guī)范駕駛行為,以避免造成不必要的交通事故發(fā)生。
2 系統(tǒng)設(shè)計(jì)
2.1 系統(tǒng)構(gòu)成
該系統(tǒng)使用普通攝像頭采集視頻信息,然后進(jìn)行處理,實(shí)時(shí)傳遞給視頻分析模塊。當(dāng)檢測(cè)到不規(guī)范行為時(shí),通過語音提示器提示駕駛員規(guī)范駕駛。通過這三個(gè)模塊的協(xié)同配合,最終實(shí)現(xiàn)全套的完整功能。系統(tǒng)功能模塊圖如圖2-1。
2.2 去運(yùn)動(dòng)模糊模型
由于車在行駛過程中,司機(jī)一直是運(yùn)動(dòng)狀態(tài),通過車內(nèi)攝像頭采集司機(jī)的圖像會(huì)產(chǎn)生運(yùn)動(dòng)模糊,所以需要處理模糊。這不禁讓人聯(lián)想起生成對(duì)抗網(wǎng)絡(luò)(GAN),因?yàn)樗軌虮4娓呒y理細(xì)節(jié),創(chuàng)建的圖案接近真實(shí)圖像,所以是圖像超分辨率和圖像修復(fù)中的主力軍[2]。
2.3 卷積神經(jīng)網(wǎng)絡(luò)模型
卷積神經(jīng)網(wǎng)絡(luò)是多層感知機(jī)(MLP)的變種。卷積神經(jīng)網(wǎng)絡(luò)是一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型,具有極強(qiáng)的適應(yīng)性,善于挖掘數(shù)據(jù)局部特征,提取全局訓(xùn)練特征和分類,它的權(quán)值共享結(jié)構(gòu)網(wǎng)絡(luò)使之更類似于生物神經(jīng)網(wǎng)絡(luò),在模式識(shí)別各個(gè)領(lǐng)域都取得了很好的成果[3]。利用卷積神經(jīng)網(wǎng)路模型對(duì)采集的司機(jī)圖像通過卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別和處理。
3 系統(tǒng)流程
前期準(zhǔn)備,通過模擬駕駛場(chǎng)景,針對(duì)4種典型的駕駛行為進(jìn)行識(shí)別,分別為:規(guī)范駕駛、疲勞駕駛、打電話、單手駕駛。對(duì)這些典型行為進(jìn)行識(shí)別,可為后續(xù)的行為分析提供數(shù)據(jù)支撐。本系統(tǒng)以10名駕駛員為研究對(duì)象。每個(gè)駕駛員單獨(dú)拍攝5-6分鐘視頻,在駕駛位分別做出疲勞駕駛、打電話、單手駕駛的動(dòng)作,每個(gè)動(dòng)作持續(xù)20秒左右。在每個(gè)行為模式下選取多張幀圖,組成6500張圖片,對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,然后組成訓(xùn)練集。同理可得到驗(yàn)證集和測(cè)試集。
系統(tǒng)基于TensorFlow深度學(xué)習(xí)框架完成模型建立,TensorFlow提供很多的函數(shù)模塊,在搭建模型過程中,用戶可以調(diào)用這些函數(shù)。且利用SSD算法獲取圖像中駕駛員的圖像信息,根據(jù)駕駛員圖像信息裁剪駕駛員圖像。然后根據(jù)前向傳播得到預(yù)測(cè)試,跟真實(shí)樣本比較,得到損失值,接著采用反向傳播算法,更新權(quán)值(參數(shù)),來回不斷地迭代,直到損失函數(shù)很小,然后在測(cè)試集或者驗(yàn)證集上對(duì)準(zhǔn)確率進(jìn)行評(píng)估。
模型訓(xùn)練完畢,使用真實(shí)數(shù)據(jù)進(jìn)行預(yù)測(cè),如表1所示是系統(tǒng)的測(cè)試結(jié)果,當(dāng)司機(jī)在開車中有不規(guī)范駕駛動(dòng)作行為時(shí),對(duì)司機(jī)進(jìn)行語音提示。
4 結(jié)語
本系統(tǒng)通過將攝像頭安裝在車內(nèi),并實(shí)時(shí)采集司機(jī)行為特征圖像,控制器與服務(wù)器遠(yuǎn)程連接,服務(wù)器通過網(wǎng)絡(luò)通信接收司機(jī)圖像,并通過深度學(xué)習(xí)技術(shù)對(duì)采集的司機(jī)行為圖像進(jìn)行識(shí)別并處理,再把處理的結(jié)果傳給控制器。有助于提高司機(jī)安全意識(shí),減少交通事故的發(fā)生。
參考文獻(xiàn):
[1]https://blog.csdn.net/weixin_37647148/article/details/105932009
[2]安祺, 姜麗芬, 孫華志,等. 基于生成對(duì)抗網(wǎng)絡(luò)去除車輛圖像運(yùn)動(dòng)模糊模型[J]. 天津師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2020, v.40(01):79-83.
[3]https://blog.csdn.net/sazass/article/details/87794071
基金項(xiàng)目:西北民族大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)資助本科生科研能力項(xiàng)目訓(xùn)練項(xiàng)目(項(xiàng)目編號(hào):XBMU21188)
第一作者:田保書(1998—),男,西北民族大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院本科生,研究方向:軟件工程