□ 文/李詩晴
平安城市是一個覆蓋整座城市的大型綜合系統(tǒng),包括治安、交通管理、消防、刑偵等多個領域,以及社會治安監(jiān)控系統(tǒng)、交通智能卡口系統(tǒng)、電子警察系統(tǒng)、社會重點防范單位監(jiān)控系統(tǒng)等多個子系統(tǒng),各系統(tǒng)之間既相互獨立又相互協(xié)作,與安防緊密相連。隨著公共安全信息化建設的深入開展,在將這些海量視頻數(shù)據(jù)運用到業(yè)務實踐中時,一些困難和問題開始凸顯。
已有的海量視頻數(shù)據(jù)直接占用大量存儲空間,從而造成數(shù)據(jù)管理上的高成本,隨之而來的備份難度加大也帶來數(shù)據(jù)管理的高風險。同時,大量高清視頻的頻繁傳輸,向傳輸帶寬提出更高要求,也給傳輸線路帶來巨大壓力。而如果簡單地對視頻數(shù)據(jù)進行壓縮,又可能造成圖像模糊、數(shù)據(jù)失真等問題。
目前的視頻數(shù)據(jù)處理多依賴于人工瀏覽和人工值守方式,受制于人的生理特點,長時間觀看視頻容易產(chǎn)生視覺疲勞,甚至遺漏重要線索,效率低下。面對視頻數(shù)據(jù)的高速增長,人工處理方式根本無法應對,急需自動化、無人值守式的視頻處理手段。
現(xiàn)有的視頻數(shù)據(jù)來源廣泛、類型多樣、標準不一,其結(jié)果是在業(yè)務實踐中無法采用信息化手段對視頻數(shù)據(jù)進行標準化處理和存儲,進而造成各個部門、各個行業(yè)之間信息共享困難,不同領域的信息數(shù)據(jù)彼此成為孤島,造成信息的極大浪費和系統(tǒng)的重復建設。
在安防領域,利用傳統(tǒng)的視頻數(shù)據(jù)所能解決的問題相當有限,缺乏深層次的應用,無法滿足現(xiàn)代安防數(shù)字化、信息化、智能化的要求。
針對存儲傳輸難、處理效率低、類型差異大、應用范圍窄等諸多難點,如何在大數(shù)據(jù)、人工智能時代讓視頻系統(tǒng)更好地為平安城市建設服務,需要新型的視頻數(shù)據(jù)處理技術(shù)。
隨著AI技術(shù)的興起,越來越多的開發(fā)者將精力投入到計算機視覺技術(shù)的研究,基于“以圖搜圖”技術(shù)的目標檢索這一熱點主題被再次重點研究,解決了以往一部分視頻偵查中由于類別差異、視點變化、復雜背景等造成的搜圖難題。
從視頻偵查的角度來說,能產(chǎn)生戰(zhàn)果的應用主要基于以下三種計算機視覺技術(shù):視頻結(jié)構(gòu)化技術(shù)、人臉識別技術(shù)、車輛識別技術(shù)。
Re-ID跨鏡追蹤是基于視頻結(jié)構(gòu)化進行的深度應用,通過把不同視頻內(nèi)的物體關(guān)聯(lián)起來,通過有效的方法把物體找出,保證整個監(jiān)控操作的完整性,掌握大局觀。
目前,人臉卡口在整個基礎監(jiān)控資源中占比不足10%,80%以上的攝像頭均由普通監(jiān)控探頭組成,擁有光線暗、角度偏、遮擋率大、夜間清晰低和區(qū)分度不高等普遍缺陷,因此拍到的人臉都不夠清晰,甚至連人臉都無法抓拍到。
與此同時,Re-ID在進行數(shù)據(jù)采集時難度很大:1、需要跨攝像頭采集;2、公開數(shù)據(jù)集的數(shù)據(jù)規(guī)模非常?。?、數(shù)據(jù)一般都是視頻的連續(xù)截圖;4、同一個人需要有不同角度的全身照片;5、監(jiān)控大規(guī)模搜集涉及用戶隱私。數(shù)據(jù)采集難度大,將會對算法提出更高要求。
考慮到行人非剛體的局面,目前有兩種基本算法:一是把人的身體劃分成不同部分,以不同的方法把這些部分檢測出來,并進行局部特征提取??墒牵瑹o論怎樣劃分,某些部分依然會有一定程度上的非剛體特性,會對算法造成干擾;二是考慮對齊,也就是把兩張要比對的圖片,以某種方法先對齊好,例如相同頭部位置和腳步位置,并在匹配時只考慮有用的部分。當然,做到這部分并不容易,因為這部分一般會內(nèi)嵌到神經(jīng)網(wǎng)絡。除此之外,業(yè)界一般會附加一些網(wǎng)絡設計技巧再提高特征提取的準確度。
行人Re-ID基于注意力架構(gòu)模型的深度神經(jīng)網(wǎng)絡方案來實現(xiàn),與傳統(tǒng)的全局表征或設定好的局部分割不同,主軀干網(wǎng)絡不要求軀干位置的標注,能夠從淺層視覺到高層語義的不同空間內(nèi)自動捕捉關(guān)鍵區(qū)域,挖掘多尺度的注意力特征,自動實現(xiàn)行人肢體(如面部,上身及下身)的特征融合,對于姿態(tài)改變以及空間變化有著很好的魯棒性,可有效完成行人搜索工作。
▲圖1 Re-ID原理圖
實際測試時,發(fā)現(xiàn)即使不使用re-ranking,對于Market-1501數(shù)據(jù)庫,top-1準確度也能達到90%,而不使用re-ranking也能達到這個水平,代表速度會快上很多,也同時減少計算資源的使用。原因是reranking(例如現(xiàn)今常用的k-recipical方法)即使再簡單,也需要消耗內(nèi)存把某范圍內(nèi)的數(shù)據(jù)暫存,并進行分析和對比。而現(xiàn)有不少算法是非常依賴reranking來達到高準確度,去除該依賴性,使得算法在實際產(chǎn)品內(nèi)產(chǎn)生優(yōu)勢。
Re-ID技術(shù)精準搜
在實戰(zhàn)運用中,對涉案視頻進行分析排查,通過“即看-即辨”、“即辨-即追”、“即追-即控”的作戰(zhàn)模式,鍛煉一支專業(yè)化的實戰(zhàn)隊伍、形成一套科學化的業(yè)務機制、固化一系列的綜合技戰(zhàn)法,實現(xiàn)案件的迅速偵破。
“即看-即辨”,指的是通過視頻分析,在觀看視頻的同時便可直接對視頻目標進行截圖標注、搜索、比對,迅速辨別嫌疑目標。
“即辨-即追”,指的是在發(fā)現(xiàn)嫌疑目標之后,結(jié)合圖上作戰(zhàn)、以圖搜圖,以跨鏡追蹤的方式,對嫌疑目標在范圍區(qū)域內(nèi)進行追查,迅速發(fā)現(xiàn)其活動軌跡及落腳點相關(guān)信息。
“即追-即控”,指的是在確認嫌疑人落腳地信息之后,再基于視頻結(jié)構(gòu)化、人臉識別、車輛識別等技術(shù),對重點區(qū)域重點場所進行重點實時布控。當布控目標出現(xiàn)時觸發(fā)報警,并及時對嫌疑目標進行控制。
▲圖2 以圖搜人
▲圖3 360°結(jié)構(gòu)化目標跨境追蹤
實時圖蹤基于Re-ID技術(shù),通過即時檢索和快速響應,對后臺海量監(jiān)控點進行不間斷的實時結(jié)構(gòu)化分析,將產(chǎn)生的快照進行存儲,一旦案件發(fā)生,能夠在已生成的視圖庫中快速定位目標的時空信息,形成軌跡。
▲圖4 實時圖蹤
人臉識別技術(shù)在安防領域已經(jīng)有較為成熟的應用,但在很多實際場景中,人臉識別技術(shù)作用并不突出,很多攝像頭根本無法準確抓拍到行人清晰的正面照。Re-ID作為人臉識別的補充,可以有效解決實際應用中跨設備、跨場景的問題。
受限于視頻監(jiān)控探頭的安裝高度及密度,實際情況中拍到更多的是行人的頭頂、后腦勺或者側(cè)臉。其次,即便拍到人臉,也可能模糊不清。于是,基于公安機關(guān)的實戰(zhàn)要求以及多年的實戰(zhàn)經(jīng)驗,提出一種卡視聯(lián)動技戰(zhàn)法,結(jié)合人臉識別和跨鏡追蹤(Re-ID)各自的特點及優(yōu)勢,以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進行覆蓋,實戰(zhàn)價值極強,對安防行業(yè)具有顛覆性意義。
圖5 卡視聯(lián)動結(jié)構(gòu)圖
▲圖5 案件一視頻截圖
轄區(qū)內(nèi)發(fā)生多起車內(nèi)財物被盜事件,經(jīng)偵查,都是兩個騎電動車的男子所為,且卡口抓拍到一張嫌疑人較為清晰的圖片,但依然看不清人臉。
案發(fā)后,民警使用人臉系統(tǒng)排查嫌疑人身份,可能由于前面的人戴了鴨舌帽遮擋臉部又或者光線不夠等原因,在此案件中,人臉系統(tǒng)并未發(fā)揮作用??紤]到人臉系統(tǒng)無法有效尋找到犯罪嫌疑人,辦案民警使用跨境追蹤技術(shù)開始疑犯追逃工作。
▲圖6 案件一視頻截圖
▲圖7 案件一視頻截圖
▲圖8 案件一視頻截圖
▲圖9 案件一視頻截圖
▲圖10 案件一視頻截圖
通過錄像結(jié)構(gòu)化,查找嫌疑人蹤跡:因為案發(fā)地點四通八達,在GIS地圖上框選通往各個方向的周邊36個點位,分析在案發(fā)時間半小時左右的錄像,使用Re-ID技術(shù)進行以圖搜圖,僅用20多分鐘,就找到了一張疑似嫌疑人圖片,然后,再在新出現(xiàn)的位置附近查找,又接連找到第2張、第3張……通過視頻接力追蹤的方式,追蹤目標軌跡,共找到6張嫌疑目標圖片,隨后在地圖自動刻畫其軌跡,進一步鎖定了嫌疑人的疑似活動方向。
2017年8月25日,受害人王某某報警稱:自己家門口的一輛電動三輪車被盜。經(jīng)了解,被盜三輪車為灰色“金彭”牌電動三輪車,現(xiàn)在價值2000余元錢,被盜時間為當日14時-17時許。雖然受害者家地處四通八達的居民區(qū),但民警、輔警仍通過大量視頻偵查工作,發(fā)現(xiàn)一名可疑男子。
▲圖11 案件二視頻截圖
中心民警通過大量視頻偵查工作,發(fā)現(xiàn)一名可疑男子。該嫌疑人作案前騎自行車到達該區(qū)域,并且作案后駕駛盜竊到的電動三輪車向北逃離。視頻在線結(jié)構(gòu)化,尋找嫌疑人蹤跡
通過現(xiàn)場周邊大量監(jiān)控查找,發(fā)現(xiàn)嫌疑人16:40-16:57的軌跡。通過視頻結(jié)構(gòu)化,將嫌疑人騎自行車圖片在庫中自動搜索,描繪出嫌疑人15:06-16:30(作案前)在縣城三處的活動軌跡。
通過視頻結(jié)構(gòu)化系統(tǒng)提取監(jiān)控畫面,倒查嫌疑人活動軌跡,掌握嫌疑人前一天晚上已到網(wǎng)吧。通過網(wǎng)監(jiān)部門研判嫌疑人為虛擬身份,并未獲取有效信息。
▲圖12 案件二視頻截圖
將嫌疑人頭像在本地人臉識別庫中檢索,也未獲取有效信息。但是,在通過對之前有線索的案件進行重復研判時,再次將嫌疑人頭像在本地動態(tài)人臉庫中檢索,發(fā)現(xiàn)嫌疑人正面頭像,在省人像比對庫中比對,鎖定嫌疑人為臥龍區(qū)候某。
▲圖13 案件二視頻截圖
隨著公安業(yè)務的迅速增長,公安部門迫切需要實戰(zhàn)效果顯著的視頻監(jiān)控技術(shù),以此適應復雜多變且精細具體的公安環(huán)境??珑R追蹤(Re-ID)技術(shù)滿足這一實戰(zhàn)需求,讓AI系統(tǒng)即使不看臉,也能通過衣物、發(fā)型、體態(tài)等信息,跨攝像頭、跨場景下實現(xiàn)目標的識別與檢索,在人臉被遮擋、距離過遠時依舊可以從不同攝像機鏡頭中追蹤行人,通過將技術(shù)轉(zhuǎn)化為產(chǎn)品,落地為應用,取得一些很好的實戰(zhàn)效果。隨著視頻監(jiān)控技術(shù)的快速發(fā)展以及不斷革新,其必將在公安工作中取得更加廣泛的應用,發(fā)揮更加顯著的效果。