田師思
(中國(guó)人民公安大學(xué) 偵查與刑事科學(xué)技術(shù)學(xué)院,北京100038)
由于涉槍案件對(duì)社會(huì)安全和穩(wěn)定影響極大,對(duì)此類案件的預(yù)防和打擊一直是各國(guó)警方工作的重中之重。利用數(shù)量眾多的監(jiān)控?cái)z像頭發(fā)現(xiàn)非法的槍支使用,毫無疑問是嚴(yán)格槍支管理、打擊涉槍犯罪的一把利劍但我們?nèi)圆荒艿凸罎撛诘臉屩{。Darker 等人在Multi Environment Deployable Universal Software Application(多環(huán)境可部署通用軟件應(yīng)用)項(xiàng)目中通過一系列資料調(diào)查和比較試驗(yàn),得出了用人工的方式檢測(cè)監(jiān)控視頻中出現(xiàn)的槍支效率很低,并且容易遺漏真實(shí)信息的結(jié)論[1-3]。如果我們有一套高效準(zhǔn)確的槍支自動(dòng)檢測(cè)系統(tǒng)安裝在城市監(jiān)控系統(tǒng)中,就能為警方提供先期預(yù)警,特別是發(fā)現(xiàn)一些案發(fā)于隱蔽環(huán)境或者人煙稀少地區(qū),沒有目擊者報(bào)警的涉槍案件,在重大活動(dòng)和特殊場(chǎng)所的安全保衛(wèi)中也能發(fā)揮巨大作用。所以希望通過對(duì)該問題研究成果的整理,為國(guó)內(nèi)有志于這方面研究的研究者提供參考。
槍支自動(dòng)檢測(cè)是目標(biāo)檢測(cè)領(lǐng)域里的一個(gè)問題,目前目標(biāo)檢測(cè)的主流方法包括傳統(tǒng)的人工提取特征的檢測(cè)方法和基于深度學(xué)習(xí)的檢測(cè)方法,基于深度學(xué)習(xí)的檢測(cè)方法又包括基于Region Proposal 的檢測(cè)方法和基于回歸的目標(biāo)檢測(cè)方法[4]。
Darker 等利用尺度不變特征變換匹配算法(Scale Invariant Feature Transform,SIFT)來檢測(cè)槍支。首先利用運(yùn)動(dòng)分割算法將提取監(jiān)控視頻中運(yùn)動(dòng)的人,然后去除陰影,最后用一個(gè)最小的矩形來選取最終的感興趣區(qū)域。將SIFT 特征庫與感興趣區(qū)域的SIFT 特征進(jìn)行配對(duì),來檢測(cè)是否存在槍支[5]。Micha Grega 等利用基于MPEG-7 視覺描述符的分類器來檢測(cè)槍支。作者發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)輸出的結(jié)果特異性低,假陽性數(shù)量多,于是使用了下一個(gè)基于MPEG-7 視覺描述符的分類器,該分類器使用了區(qū)域形狀描述符。描述符計(jì)算候選區(qū)域中的形狀描述符與手槍的通用描述符之間的歐幾里得距離,兩者之間的距離低于閾值,則該區(qū)域檢測(cè)到槍支[6]。Gyanendra K.Verma 等對(duì)槍支自動(dòng)檢測(cè)的問題做了提出了三種解決方案,2015 年發(fā)表的兩篇文獻(xiàn)是基于是傳統(tǒng)的目標(biāo)檢測(cè)方法,分別使用了Harris 角點(diǎn)檢測(cè)+Freak 特征提取和加速穩(wěn)健特征(Speeded up robust features,SURF)兩種方法。兩篇文章都使用K-means 聚類進(jìn)行基于顏色的圖像分割,然后再提取特征[7,8]。第三種是基于深度學(xué)習(xí)的方法。Halima 等首先從圖像集合中提取SIFT 特征[9]。朱捷晨等對(duì)網(wǎng)絡(luò)圖像中涉及的槍支自動(dòng)檢測(cè)提出了Hu 不變矩和模糊聚類相結(jié)合的方法[10]。
GyanendraK.Verma 在2017 發(fā)表的文章提出使用深度神經(jīng)網(wǎng)絡(luò)VGG-16 來檢測(cè)槍支,并且比較了SVM、KNN 和Ensemble ree 三種分類器,最后得出VGG-16+Fine Gaussian 核支撐向量機(jī)能得到最佳的表現(xiàn)[11]。Justin Lai 等比較了VGG-16 和三種不同學(xué)習(xí)率和置信度下的Overfeat 網(wǎng)絡(luò),發(fā)現(xiàn)在30%置信度和0.0003 的學(xué)習(xí)率下的Overfeat 能夠到達(dá)最好的表現(xiàn)。他們對(duì)1.3s/張的處理速度并不滿意,并提出要在今后的工作中提高精度和速度[12]。Roberto Olmos 等比較了基于sliding window 和region proposals 兩種候選區(qū)域提取方法,兩者都使用VGG-16網(wǎng)絡(luò)作為分類器,其中基于region proposals 的實(shí)驗(yàn)采用Faster R-CNN 提取候選區(qū)域[13]。雷青等在安卓平臺(tái)上利用Faster R-CNN 網(wǎng)絡(luò)檢測(cè)網(wǎng)絡(luò)視頻中的槍支,提出在訓(xùn)練集中,對(duì)含有槍支的圖像依據(jù)遮擋部位和遮擋程度分別標(biāo)注為gun、gunHead、gunMid、gunEnd,檢測(cè)過程中分別對(duì)四種類型采用不同的閾值,同時(shí)增加每個(gè)類別的負(fù)樣本,標(biāo)注為nGun、nGunHead、nGunMid、nGunEnd,以提高檢測(cè)精度[14]。
吳晉等在FPGA 開發(fā)析DE5-Net 上運(yùn)行YOLOv2 網(wǎng)絡(luò)檢測(cè)刀槍棍等,并且通過卷積算法加速、池化算法加速、BN 算法加速來盡可能減少運(yùn)算時(shí)間。同時(shí)對(duì)比在CPU、GPU 上運(yùn)行YOLOv2網(wǎng)絡(luò)檢測(cè)目標(biāo),發(fā)現(xiàn)在FPGA 平臺(tái)上的計(jì)算時(shí)間和計(jì)算功率都遠(yuǎn)小于前兩者,特別是率減小到27.3w,僅僅是在CPU、GPU 上計(jì)算功率的1/5 和1/10[15]。
上述檢測(cè)方法,通過特征設(shè)計(jì)或者網(wǎng)絡(luò)的自我學(xué)習(xí)或多或少地解決了尺度、旋轉(zhuǎn)、方向、光照的變化、遮擋、槍支種類帶來的問題。
在基于深度學(xué)習(xí)的檢測(cè)方法中,研究人員都不約而同的采用了遷移學(xué)習(xí)的方法,對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練。這樣的做法,能夠減少訓(xùn)練速度,加快收斂。并且通過預(yù)訓(xùn)練獲得一般化的共性特征,再針對(duì)特定問題進(jìn)行訓(xùn)練,在共性特征的基礎(chǔ)上,獲得強(qiáng)有力的針對(duì)性特征,是提高網(wǎng)絡(luò)精度的好方法。
在我國(guó)嚴(yán)格的控槍環(huán)境下,一般犯罪使用制式槍支已然不多見,大量仿制槍、自制槍應(yīng)該是我們關(guān)注的主要對(duì)象。而這些非制式槍支,特別是自制槍,形態(tài)各異,有的甚至和一般槍支的形態(tài)相差甚遠(yuǎn),怎么讓神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)識(shí)別這些非制式槍支,是槍支自動(dòng)檢測(cè)在我國(guó)應(yīng)用必須解決的問題。
監(jiān)控視頻中槍支自動(dòng)檢測(cè)問題還是處于探索期,研究人員提出各自的解決方法,但離實(shí)際應(yīng)用還相差甚遠(yuǎn)。但是基于公安工作的特點(diǎn),我們期待這個(gè)問題的早日解決。同時(shí)可以展望的是,監(jiān)控視頻中的實(shí)時(shí)目標(biāo)檢測(cè)可以越來越多的應(yīng)用于行人、車輛、摩托車、等各種對(duì)象,為預(yù)防、發(fā)現(xiàn)、打擊犯罪提供預(yù)警,為偵查提供更多的關(guān)于客體種類、來源方面的線索,為攝像頭加上“大腦”,構(gòu)建起新一代的城市智能監(jiān)控體系,服務(wù)于未來的城市管理。