摘 ?要:2016年以來(lái),人工智能得到長(zhǎng)足的發(fā)展,國(guó)家也開(kāi)始大力發(fā)展人工智能產(chǎn)業(yè)。人工智能算法日趨成熟并進(jìn)入商用階段,智能硬件具備更高的算力足以支撐千億人臉大庫(kù)。與此同時(shí),公安擁有海量的數(shù)據(jù)可供應(yīng)用開(kāi)發(fā)。面對(duì)日趨復(fù)雜的公共安全治安形勢(shì),對(duì)如何利用新興人工智能技術(shù)支撐實(shí)戰(zhàn)應(yīng)用提出了更高的要求,只有不斷對(duì)其探索和研究才能建立更主動(dòng)、更智慧的平安城市立體化安全防御體系。
關(guān)鍵詞:人工智能;視頻監(jiān)控;人臉識(shí)別;算法;計(jì)算機(jī)視覺(jué)
中圖分類號(hào):TP18;TN948.6 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)13-0091-03
Application Research of Artificial Intelligence in the Field of
Public Security Video Surveillance
YU Dayong
(PCI-Suntek Technology Co.,Ltd.,Guangzhou ?510653,China)
Abstract:Since 2016,artificial intelligence has been greatly developed,and the country has begun to vigorously develop the artificial intelligence industry. The algorithm is maturing and entering the commercial stage,and the hardware has a higher computing power to support the 100 billion face database. At the same time,the public security has a huge amount of data for application development. In the face of the increasingly complex public security situation,how to use the new artificial intelligence technology to support practical applications puts forward higher requirements,in order to establish a more active and smarter three-dimensional security defense system for safe cities.
Keywords:artificial intelligence;video surveillance;face recognition;algorithms;computer vision
0 ?引 ?言
根據(jù)中國(guó)安全防范產(chǎn)品行業(yè)協(xié)會(huì)統(tǒng)計(jì)的數(shù)據(jù),至2017年底,全國(guó)安裝視頻監(jiān)控的公共區(qū)域攝像機(jī)數(shù)量超過(guò)2800萬(wàn)臺(tái),覆蓋了城市的重點(diǎn)區(qū)域、重點(diǎn)場(chǎng)所、主干道路、重點(diǎn)建筑,也涉及公安、應(yīng)急、交通、城管多個(gè)行業(yè),構(gòu)筑了視頻監(jiān)控的“天網(wǎng)工程”。大量的視頻監(jiān)控?cái)z像機(jī)產(chǎn)生了海量的視頻錄像數(shù)據(jù),這些錄像數(shù)據(jù)就像“沉睡”的金礦,傳統(tǒng)方式下,單純依靠人工監(jiān)視和錄像回放已無(wú)法滿足公安業(yè)務(wù)的實(shí)戰(zhàn)要求,如何讓計(jì)算機(jī)能夠直接讀懂視頻監(jiān)控畫面中的信息,就依賴于計(jì)算機(jī)視覺(jué)識(shí)別技術(shù),依賴于人工智能技術(shù)的發(fā)展,人臉識(shí)別、車牌識(shí)別、特征識(shí)別、視頻結(jié)構(gòu)化、ReID、結(jié)構(gòu)光、TOF等技術(shù)成為有效化解制約瓶頸的有效途徑。AI技術(shù)與視頻監(jiān)控技術(shù)的結(jié)合,是視頻監(jiān)控系統(tǒng)智能化應(yīng)用研究的重要方向。
1 ?AI在公安視頻監(jiān)控領(lǐng)域的應(yīng)用
目前成熟應(yīng)用于公安視頻監(jiān)控領(lǐng)域的AI技術(shù)主要包括車輛識(shí)別、人臉識(shí)別和ReID三種技術(shù),結(jié)構(gòu)光、TOF(飛行時(shí)間測(cè)距法)也在研究當(dāng)中。
第一,車輛識(shí)別技術(shù)。車輛識(shí)別包括車牌識(shí)別和車輛特征二次識(shí)別兩大技術(shù)。車牌識(shí)別多應(yīng)用在卡口、電子警察和停車場(chǎng)的出入口。以車牌識(shí)別數(shù)據(jù)為基礎(chǔ),并通過(guò)與車輛信息庫(kù)關(guān)聯(lián),開(kāi)展相應(yīng)的業(yè)務(wù)應(yīng)用。車牌識(shí)別屬于OCR文字識(shí)別的范疇;車輛特征二次識(shí)別可以識(shí)別車牌之外的特征信息,包括:車輛類型、車輛品牌、車輛子品牌、車牌類型、車身顏色、安全帶、遮陽(yáng)板、打手機(jī)、車輛特征(包含年檢標(biāo)志、紙巾盒、遮陽(yáng)板、擺件、掛件、車身噴字)等特征信息數(shù)據(jù),對(duì)無(wú)牌照或遮擋牌照車輛也可進(jìn)行車型識(shí)別,還可識(shí)別部分拍攝殘缺照片(車頭缺失不超過(guò)1/2),可以說(shuō)大大挖掘了視頻和圖像的潛力,而且車標(biāo)、顏色、標(biāo)志物相對(duì)來(lái)說(shuō)屬于分類識(shí)別,也比較容易實(shí)現(xiàn),于是市場(chǎng)上出現(xiàn)了多種車輛大數(shù)據(jù)平臺(tái),也出現(xiàn)了各種車輛技戰(zhàn)法和應(yīng)用,這都是AI賦能的結(jié)果。
第二,人臉識(shí)別技術(shù)。人臉識(shí)別技術(shù)是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。在公安領(lǐng)域的實(shí)戰(zhàn)應(yīng)用更注重動(dòng)態(tài)人臉識(shí)別技術(shù),安裝人臉抓拍機(jī)(人臉抓拍攝像機(jī)適合安裝在寬度2.5-3.5米的單一通道),人臉識(shí)別算法和相應(yīng)技術(shù)多用于人員防控、人員管控和身份認(rèn)證。把視頻抓拍的照片送至人臉識(shí)別系統(tǒng)進(jìn)行比對(duì),記錄比對(duì)結(jié)果,對(duì)發(fā)現(xiàn)的高危人員和重點(diǎn)人員進(jìn)行標(biāo)注后,產(chǎn)生實(shí)時(shí)告警并聯(lián)動(dòng)相應(yīng)的業(yè)務(wù)流程。不同光照、角度下的人臉識(shí)別的效率和性能有所不同。
第三,ReID技術(shù)。ReID就是行人再識(shí)別(也叫跨鏡追蹤),全寫是Re-identification,從其字面意思可以理解出,就是對(duì)于監(jiān)控?cái)z像機(jī)下的物體進(jìn)行重新識(shí)別和辨認(rèn)。如對(duì)人物的識(shí)別,能夠辨認(rèn)出人的服裝穿著、體態(tài)和人體其他代表性特征。它可以通過(guò)跨攝像機(jī)鏡頭,來(lái)對(duì)行人進(jìn)行識(shí)別、追蹤和檢索。用來(lái)作為對(duì)人臉識(shí)別技術(shù)的重要補(bǔ)充,對(duì)于無(wú)法捕捉到清晰人臉的行人,可以采用跨鏡頭持續(xù)進(jìn)行跟蹤??珑R追蹤技術(shù)發(fā)揮空間大,有著很大的實(shí)用價(jià)值,在公安視頻監(jiān)控領(lǐng)域大有所為。
2 ?AI在近年來(lái)的突破
AI是2018年的熱點(diǎn)技術(shù),結(jié)合這一年以來(lái)AI的發(fā)展情況以及筆者對(duì)AI的理解,關(guān)于AI在公安領(lǐng)域的應(yīng)用研究如下。
2.1 ?自然語(yǔ)言處理(NLP)
自然語(yǔ)言處理(NLP)是指計(jì)算機(jī)擁有識(shí)別理解人類文本語(yǔ)言的能力,是計(jì)算機(jī)科學(xué)與人類語(yǔ)言學(xué)的交叉學(xué)科。自然語(yǔ)言是人與動(dòng)物之間的最大區(qū)別,人類的思維建立在語(yǔ)言之上,所以自然語(yǔ)言處理也就代表了人工智能的最終目標(biāo)。機(jī)器若想實(shí)現(xiàn)真正的智能自然語(yǔ)言處理是必不可少的一環(huán)。[1]NLP在公安的最佳應(yīng)用是語(yǔ)音識(shí)別,通過(guò)聲音可以判定人的身份(聲紋),通過(guò)NLP獲取語(yǔ)音中的文字信息,為公安技偵應(yīng)用提供技術(shù)支撐,未來(lái)有望形成大面積落地應(yīng)用。
2.2 ?計(jì)算機(jī)視覺(jué)(CV)
計(jì)算機(jī)視覺(jué)(Computer Version,CV)是從圖像或者視頻中提出符號(hào)或者數(shù)值信息,分析計(jì)算該信息以進(jìn)行目標(biāo)的識(shí)別、檢測(cè)和跟蹤等。更形象地說(shuō),計(jì)算機(jī)視覺(jué)就是讓計(jì)算機(jī)像人類一樣能看到圖像,并看懂理解圖像。到80、90年代,計(jì)算機(jī)視覺(jué)迅速發(fā)展,形成感知特征的新理論框架并逐漸應(yīng)用到工業(yè)環(huán)境中。到21世紀(jì),計(jì)算機(jī)視覺(jué)領(lǐng)域呈現(xiàn)許多新的趨勢(shì),計(jì)算機(jī)視覺(jué)與計(jì)算機(jī)圖形學(xué)深度結(jié)合,基于計(jì)算機(jī)視覺(jué)的應(yīng)用也呈爆炸性增長(zhǎng),除了在手機(jī)、電腦上的應(yīng)用,計(jì)算機(jī)視覺(jué)技術(shù)在交通、安防、醫(yī)療、機(jī)器人上有各種各樣形態(tài)的應(yīng)用[2]。計(jì)算機(jī)視覺(jué)的四大基本任務(wù)包括:分類、定位、語(yǔ)義分割和實(shí)例分割,近期又引入3D結(jié)構(gòu)光和TOF技術(shù)做深度計(jì)算,以3D識(shí)別代替2D識(shí)別。CV技術(shù)在公安行業(yè)的典型應(yīng)用包括:人臉識(shí)別、車輛識(shí)別、行為識(shí)別和特征屬性識(shí)別。
2.3 ?工具和框架
2.3.1 ?TensorFlow
TensorFlow是谷歌開(kāi)發(fā)的用于深度學(xué)習(xí)或人工神經(jīng)網(wǎng)絡(luò)的開(kāi)源軟件庫(kù)。它由Google AI團(tuán)隊(duì)內(nèi)的Google Brain團(tuán)隊(duì)開(kāi)發(fā),并于2015年11月9日在Apache 2.0開(kāi)源許可下發(fā)布。TensorFlow使用數(shù)據(jù)流圖進(jìn)行數(shù)值計(jì)算。它具有非常靈活的體系結(jié)構(gòu),可以輕松部署跨各種平臺(tái)(CPU,GPU,TPU)以及從臺(tái)式機(jī)到服務(wù)器群集到移動(dòng)和邊緣設(shè)備的計(jì)算。
2.3.2 ?PyTorch
PyTorch,是2017年Facebook在GitHub上開(kāi)源的深度學(xué)習(xí)框架,PyTorch發(fā)布的較晚,但是熱度強(qiáng)勁,PyTorch是一個(gè)設(shè)計(jì)極為先進(jìn)的框架,遵循“Python優(yōu)先”的原則。PyTorch不是簡(jiǎn)單的封裝Torch的接口,而是對(duì)Tensor之上的所有模塊進(jìn)行改造,新增了最先進(jìn)也是PyTorch最顯著的特點(diǎn)自動(dòng)求導(dǎo),成為目前最流行的深度學(xué)習(xí)框架。
2.3.3 ?CNTK
微軟認(rèn)知工具包(以前稱為CNTK)由微軟研究院開(kāi)發(fā)。CNTK具高度的可定制性,因?yàn)樗哂懈斓挠?xùn)練時(shí)間和易于使用的體系結(jié)構(gòu)。無(wú)論是在只有CPU,單個(gè)GPU,多個(gè)GPU或具有多個(gè)GPU的多個(gè)機(jī)器上運(yùn)行,它都擁有出色的性能。它允許你選擇自己的參數(shù)、算法和網(wǎng)絡(luò)。它是用Python和C++編寫的。雖然它在語(yǔ)音識(shí)別領(lǐng)域更受歡迎,但CNTK也可以用于文本、圖像和RNN訓(xùn)練(遞歸神經(jīng)網(wǎng)絡(luò):一種神經(jīng)網(wǎng)絡(luò))。
2.3.4 ?Theano
Theano是一個(gè)專為深度學(xué)習(xí)而設(shè)計(jì)的Python庫(kù)。它允許你定義、優(yōu)化和評(píng)估涉及高效率的多維數(shù)組的數(shù)學(xué)表達(dá)式。它可以使用GPU并執(zhí)行有效的符號(hào)區(qū)分。該工具具有與NumPy集成、動(dòng)態(tài)C代碼生成和符號(hào)區(qū)分等功能。該工具支持Linux,Mac OS X和Windows等平臺(tái)。
2.3.5 ?Keras
Keras是一個(gè)用Python編寫的開(kāi)放源碼庫(kù),這種高水平的神經(jīng)網(wǎng)絡(luò)API旨在使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行快速實(shí)驗(yàn)。它側(cè)重于用戶友好、模塊化和可擴(kuò)展性。該工具針對(duì)CPU和GPU進(jìn)行了優(yōu)化。
2.4 ?強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)是人工智能中策略學(xué)習(xí)的一種,是一種重要的機(jī)器學(xué)習(xí)方法,在智能控制機(jī)器人及分析預(yù)測(cè)等領(lǐng)域有許多應(yīng)用。又稱再勵(lì)學(xué)習(xí)、評(píng)價(jià)學(xué)習(xí),是從動(dòng)物學(xué)習(xí)、參數(shù)擾動(dòng)自適應(yīng)控制等理論發(fā)展而來(lái)的。常用的強(qiáng)化學(xué)習(xí)算法包括TD(Temporal Difference)算法、Q-learning算法、Sarsa算法等。
3 ?算法和硬件
3.1 ?AI算法
在機(jī)器學(xué)習(xí)領(lǐng)域,有幾種主要的學(xué)習(xí)方式,即監(jiān)督式學(xué)習(xí)、非監(jiān)督式學(xué)習(xí)、半監(jiān)督式學(xué)習(xí)。有了算法,有了被訓(xùn)練的數(shù)據(jù)(清洗過(guò)的數(shù)據(jù)),經(jīng)過(guò)多次訓(xùn)練(算力)后,經(jīng)過(guò)模型評(píng)估和算法人員調(diào)試后,會(huì)獲得訓(xùn)練模型。當(dāng)新的數(shù)據(jù)輸入后,那么訓(xùn)練模型就會(huì)給出結(jié)果。業(yè)務(wù)要求的最基礎(chǔ)的功能就算實(shí)現(xiàn)了。
3.2 ?AI芯片
目前,主流的AI芯片基本以GPU、FPGA、ASIC以及類腦芯片為主,它們各自發(fā)揮優(yōu)勢(shì),多種類型的芯片組合應(yīng)用,呈現(xiàn)多技術(shù)路徑并行發(fā)展態(tài)勢(shì)。深度學(xué)習(xí)引領(lǐng)了本輪AI發(fā)展熱潮。隨著深度學(xué)習(xí)模型算法對(duì)大規(guī)模并行計(jì)算能力的需求不斷激增,GPU、FPGA等通用芯片存在性能、功耗等方面的瓶頸,無(wú)法滿足AI巨大的算力需求。ASIC等專用芯片應(yīng)運(yùn)而生,滿足不同應(yīng)用、不同算法和不同終端的需求。但目前AI算法仍處于快速演進(jìn)階段,還不存在適應(yīng)所有應(yīng)用的通用AI算法,AI芯片也就沒(méi)有確定的架構(gòu)。這使得定制化的ASIC專用芯片開(kāi)發(fā)周期長(zhǎng),迭代進(jìn)化快,資金和技術(shù)風(fēng)險(xiǎn)都很高。因此,AI芯片技術(shù)還存在著巨大的探索空間和創(chuàng)新空間,尤其是在算法基礎(chǔ)理論研究和芯片設(shè)計(jì)架構(gòu)創(chuàng)新方面[3]。
4 ?結(jié) ?論
人工智能的應(yīng)用研究迎來(lái)了轉(zhuǎn)折點(diǎn),國(guó)家大力發(fā)展人工智能產(chǎn)業(yè),在人工智能領(lǐng)域我國(guó)擁有海量的可被計(jì)算、訓(xùn)練和挖掘的數(shù)據(jù),尤其是在更高的計(jì)算能力、深度學(xué)習(xí)模型的建立等因素的推動(dòng)下,使得人工智能算法應(yīng)用領(lǐng)域取得了重大突破。人工智能未來(lái)發(fā)展的前景廣闊,充分利用深度學(xué)習(xí)技術(shù)挖掘可用數(shù)據(jù)潛力、改善決策的過(guò)程,產(chǎn)生更高階的智能,從而獲得更便捷的服務(wù),全方面改善我們的生活,不斷提高我們對(duì)世界的認(rèn)知。
面對(duì)日趨復(fù)雜的公共安全形勢(shì),對(duì)于新興人工智能的實(shí)戰(zhàn)支撐能力提出了更高的要求,單單針對(duì)單一維度、單一類型的大數(shù)據(jù)挖掘分析無(wú)法滿足公共安全領(lǐng)域業(yè)務(wù)發(fā)展的需要。只有立足實(shí)戰(zhàn),多種資源關(guān)聯(lián)疊加,構(gòu)建了資源服務(wù)體系和應(yīng)用體系,實(shí)現(xiàn)多維感知數(shù)據(jù)的匯聚、解析和存儲(chǔ)之后,才能實(shí)現(xiàn)AI、視頻大數(shù)據(jù)、公安業(yè)務(wù)的融合和應(yīng)用。
參考文獻(xiàn):
[1] 崔雍浩,商聰,陳鍶奇,郝建業(yè).人工智能綜述:AI的發(fā)展 [J].無(wú)線電通信技術(shù),2019,45(3):225-231.
[2] 倪晨旭.計(jì)算機(jī)視覺(jué)研究綜述 [J].電子世界,2018(1):91+93.
[3] 李麗婷.人工智能芯片技術(shù)進(jìn)展及產(chǎn)業(yè)發(fā)展研究報(bào)告 [J].廈門科技,2019(1):1-9.
作者簡(jiǎn)介:于大勇(1982.12-),男,漢族,黑龍江肇東人,總經(jīng)理助理,本科,研究方向:AI算法在安防領(lǐng)域的賦能以及業(yè)務(wù)應(yīng)用支撐。