□ 文/本刊記者 何遙
人工智能的發(fā)展應(yīng)用
□ 文/本刊記者 何遙
回顧2016年的安防行業(yè),人工智能是無(wú)論如何都無(wú)法回避的話(huà)題。這一年可謂人工智能元年,阿爾法狗大戰(zhàn)李世石,全面引爆了人們對(duì)人工智能的關(guān)注。2017年初,在阿爾法狗基礎(chǔ)上改進(jìn)的Master戰(zhàn)勝了數(shù)十位世界級(jí)選手,已遠(yuǎn)超最強(qiáng)大的人類(lèi)棋手的認(rèn)知。這對(duì)安防行業(yè)的影響也是深遠(yuǎn)非凡。本期欄目邀請(qǐng)到幾位業(yè)界專(zhuān)業(yè)人士,共同探討人工智能技術(shù)與應(yīng)用的話(huà)題。
以深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)為主要特點(diǎn)的人工智能洶涌而來(lái),企業(yè)圍繞人工智能推出了各自的戰(zhàn)略。從底層技術(shù)、架構(gòu)以及應(yīng)用等角度看,不同的企業(yè)各有側(cè)重。
機(jī)器視覺(jué)
柳鋼:機(jī)器視覺(jué)做到識(shí)人知物,機(jī)器視覺(jué)在行業(yè)里存在的先決條件,是機(jī)器在某些特定領(lǐng)域里面超越了人的能力,這樣才能為人所用。關(guān)于垂直領(lǐng)域應(yīng)用,首先,我們以機(jī)器視覺(jué)為例,這個(gè)技術(shù)能夠在行業(yè)中快速應(yīng)用,正是說(shuō)明了某些領(lǐng)域里面機(jī)器做得比人好。商湯在機(jī)器視覺(jué)領(lǐng)域,團(tuán)隊(duì)成員第一次將機(jī)器識(shí)別準(zhǔn)確率超過(guò)了人眼,為技術(shù)高速發(fā)展的行業(yè)應(yīng)用奠定了基礎(chǔ)。
第二,當(dāng)我們有了技術(shù)的支撐點(diǎn)之后,在平安社區(qū),智慧城市,綜合布控等領(lǐng)域的解決方案中,根據(jù)實(shí)際應(yīng)用的需求進(jìn)行開(kāi)發(fā),這樣從技術(shù)上最高點(diǎn)到商業(yè)最高點(diǎn)差距就很小。
第三,商湯科技本身的優(yōu)越性主要體現(xiàn)在合作伙伴的培養(yǎng)和發(fā)展。商湯科技專(zhuān)注于產(chǎn)業(yè)鏈里垂直的部分,做最擅長(zhǎng)的部分,不是說(shuō)產(chǎn)業(yè)鏈里每一個(gè)項(xiàng)目每一個(gè)事情都是商湯來(lái)做。在技術(shù)領(lǐng)域,我們所做的方案是符合行業(yè)需要的,在終端用戶(hù)部署推廣的時(shí)候,注重客戶(hù)的培養(yǎng),所以具備了快速推廣的基礎(chǔ)。
吳堯:機(jī)器視覺(jué)實(shí)際上是做圖片處理的,而且是以黑白為主;它是自動(dòng)化的,可以做量測(cè)、檢測(cè)、識(shí)別、定位,這是機(jī)器視覺(jué)的四個(gè)標(biāo)準(zhǔn)應(yīng)用;而安防是視頻,這四個(gè)應(yīng)用都可以做,我們?cè)谶@四種應(yīng)用上都有自己的產(chǎn)品,并配合自己的算法和軟件。
柳鋼
機(jī)器視覺(jué)四種應(yīng)用,延伸到各個(gè)行業(yè)里會(huì)進(jìn)行各種細(xì)化。??档臋C(jī)器視覺(jué)產(chǎn)品涵蓋全系列工業(yè)相機(jī)、工業(yè)智能相機(jī)、視覺(jué)控制器、鏡頭以及算法軟件平臺(tái),通過(guò)為機(jī)器人、自動(dòng)化設(shè)備裝上視覺(jué)系統(tǒng),使之具備感知和自主判斷思考的能力,提高生產(chǎn)制造的柔性和自動(dòng)化程度,保證產(chǎn)品的品質(zhì),實(shí)現(xiàn)制造業(yè)向信息化和智能化轉(zhuǎn)型升級(jí)。機(jī)器視覺(jué)的相機(jī)其實(shí)是標(biāo)準(zhǔn)化的產(chǎn)品。比如雙目攝像機(jī)可以做立體測(cè)量,可以有很多應(yīng)用。
徐飆:在人臉識(shí)別領(lǐng)域,趨視只做真實(shí)環(huán)境可應(yīng)用的人臉識(shí)別?;谡掌娜四樧R(shí)別系統(tǒng)很難滿(mǎn)足基于實(shí)時(shí)視頻流的人臉識(shí)別需求。傳統(tǒng)的基于隨機(jī)抽幀方式的從實(shí)時(shí)視頻流中獲取人臉照片存在很多問(wèn)題。動(dòng)態(tài)人臉抓拍系統(tǒng)是一種動(dòng)態(tài)人臉歸一化的智能技術(shù),動(dòng)態(tài)鎖定運(yùn)動(dòng)中的每一個(gè)人,以唯一ID標(biāo)識(shí),這個(gè)人在運(yùn)動(dòng)過(guò)程中只會(huì)產(chǎn)生一張最佳人臉,系統(tǒng)能夠識(shí)別并獲取這張最佳人臉而丟棄其他的人臉圖片。趨勢(shì)的人臉識(shí)別技術(shù)已經(jīng)應(yīng)用于園區(qū)別墅、銀行AMT、海關(guān)機(jī)場(chǎng)、公安司法等領(lǐng)域。
徐飆
智能輔助駕駛和安防
柳鋼:安防和無(wú)人駕駛兩個(gè)領(lǐng)域有差異,也有共性。從目前來(lái)看,安防領(lǐng)域的關(guān)注點(diǎn)更多的是人,無(wú)人駕駛廣義來(lái)說(shuō)更多關(guān)注的是路、環(huán)境等等。
關(guān)于二者差異點(diǎn)的成長(zhǎng),以商湯的技術(shù)來(lái)說(shuō),已經(jīng)處于世界領(lǐng)先水平。不僅第一次機(jī)器戰(zhàn)勝人眼是我們創(chuàng)造的,另外,近年來(lái)我們通過(guò)與合作伙伴合作,積累了大量成熟的案例和基礎(chǔ),使我們?cè)谝延芯戎?,不斷提高,在業(yè)界處于很高的水平。
安防和無(wú)人駕駛這兩個(gè)領(lǐng)域共性的地方就是場(chǎng)景,路口有場(chǎng)景,街區(qū)有場(chǎng)景,在場(chǎng)景的識(shí)別里面,我們走到了行業(yè)的前列,比如視頻的結(jié)構(gòu)化,在安防里面,從單純的個(gè)體識(shí)別到一群人的識(shí)別,再到整個(gè)場(chǎng)景的分析,以及場(chǎng)景的實(shí)現(xiàn),可以看出,算法的領(lǐng)先性已經(jīng)向應(yīng)用層面的擴(kuò)張。在無(wú)人駕駛應(yīng)用領(lǐng)域,我們從常規(guī)的場(chǎng)景識(shí)別到逆光,雨天,雪天,大霧天,甚至是傍晚等等,各應(yīng)用場(chǎng)景都可以鋪開(kāi)。
吳堯
總的來(lái)說(shuō),人工智能里面的深度學(xué)習(xí)是用機(jī)器模仿人腦的思考的方式。對(duì)于人來(lái)說(shuō),能力的培養(yǎng)需要從多方面進(jìn)行,深度學(xué)習(xí)也是如此。機(jī)器在安防領(lǐng)域能夠輔助人,應(yīng)用能力的提升會(huì)促進(jìn)這種能力在各個(gè)領(lǐng)域提高,反之也一樣,相互輔佐、相互促進(jìn),也使在無(wú)人駕駛里面很好的應(yīng)用基礎(chǔ)。
徐飆:趨視科技在安防領(lǐng)域主要是2B應(yīng)用。而在智能駕駛領(lǐng)域,我們的商業(yè)應(yīng)用趨向于2C,因此在智能駕駛方面我們的算法技術(shù)主要圍繞一個(gè)核心目的:讓普通民眾也能享受智能視頻分析技術(shù)發(fā)展的成果。
首先,趨視的智能輔助駕駛系統(tǒng)是一個(gè)完全基于單個(gè)光學(xué)相機(jī)的智能系統(tǒng), 因此系統(tǒng)不存在多傳感器數(shù)據(jù)融合問(wèn)題,在硬件成本及系統(tǒng)集成可靠性上有先天優(yōu)勢(shì)。
第二,趨視開(kāi)發(fā)出了國(guó)際領(lǐng)先的基于移動(dòng)平臺(tái)的相機(jī)自動(dòng)標(biāo)定技術(shù)。不但避免了專(zhuān)業(yè)人員安裝和調(diào)試的要求,節(jié)省了相關(guān)的成本,還能自動(dòng)檢測(cè)相機(jī)的意外移動(dòng),并做出實(shí)時(shí)系統(tǒng)調(diào)整。現(xiàn)有智能輔助駕駛系統(tǒng)一般使用特定相機(jī),因此默認(rèn)已知相機(jī)焦距等內(nèi)部參數(shù),另外還要通過(guò)專(zhuān)業(yè)人員通過(guò)專(zhuān)門(mén)的流程來(lái)測(cè)量相機(jī)的諸如高度,仰角等外部定標(biāo)參數(shù),并確保相機(jī)在使用中位置角度不會(huì)變化。這些高標(biāo)準(zhǔn)的安裝要求不可避免地會(huì)大大增加使用成本。趨視的全自動(dòng)定標(biāo)技術(shù)通過(guò)不間斷的實(shí)時(shí)比對(duì)圖像中檢測(cè)到的目標(biāo)和他們的實(shí)際物理尺寸來(lái)反推相機(jī)的內(nèi)、外參數(shù),不但不需要使用特定相機(jī),還能對(duì)使用中相機(jī)的位置和角度的意外變動(dòng)進(jìn)行自動(dòng)檢測(cè),并在系統(tǒng)內(nèi)部進(jìn)行算法的自動(dòng)調(diào)整。這項(xiàng)技術(shù)使得智能輔助駕駛系統(tǒng)可以作為智能手機(jī)的一個(gè)移動(dòng)應(yīng)用,從而得到大大推廣。
第三,基于視頻的智能輔助駕駛系統(tǒng)運(yùn)算量往往非常巨大,現(xiàn)在國(guó)際主流廠(chǎng)商都需要采用專(zhuān)用芯片進(jìn)行相關(guān)數(shù)據(jù)處理。趨視科技致力于開(kāi)發(fā)高效算法來(lái)解決問(wèn)題,而不是依賴(lài)于硬件性能的提高。從這點(diǎn)出發(fā),趨視在智能分析模塊中大量使用樹(shù)結(jié)構(gòu)專(zhuān)家系統(tǒng)和深度學(xué)習(xí)相結(jié)合,利用專(zhuān)家系統(tǒng)來(lái)增加深度學(xué)習(xí)的針對(duì)性,利用圖像特征來(lái)降低深度學(xué)習(xí)的維數(shù),從而在得到深度學(xué)習(xí)的統(tǒng)計(jì)魯棒性同時(shí)保持系統(tǒng)的邏輯性和高效性。趨視已在通用X86芯片平臺(tái)上實(shí)現(xiàn)了基于1080P視頻的實(shí)時(shí)智能輔助駕駛系統(tǒng),現(xiàn)在正在進(jìn)一步移植到通用Android和IOS移動(dòng)平臺(tái)上。
最后,智能輔助駕駛系統(tǒng)最根本的一點(diǎn)還是系統(tǒng)可靠性。我們?cè)谥悄茌o助駕駛重現(xiàn)階段主要專(zhuān)注于防疲勞駕駛,以保護(hù)駕駛員和乘客。
人工智能還處于一個(gè)相對(duì)初級(jí)的階段,比如在開(kāi)發(fā)工具、技術(shù)體系、解決方案以及硬件架構(gòu)等領(lǐng)域都存在巨大的短板。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)作為人工智能的本質(zhì)特征,已經(jīng)與高性能計(jì)算結(jié)合得越來(lái)越緊密。2017年,隨著人工智能技術(shù)的優(yōu)化以及在各領(lǐng)域商業(yè)應(yīng)用的發(fā)展,人工智能產(chǎn)品將和我們有更多的直接聯(lián)系。
徐飆:人工智能技術(shù)目前主要在三個(gè)方向出現(xiàn)了商業(yè)應(yīng)用的前景:人臉識(shí)別技術(shù),行為分析技術(shù),汽車(chē)輔助駕駛/無(wú)人駕駛技術(shù)。
目前國(guó)內(nèi)外人工智能的企業(yè)都在這幾個(gè)方向上不斷投入研究及市場(chǎng)開(kāi)拓,包括這兩年資本市場(chǎng)對(duì)人工智能技術(shù)也特別青睞,時(shí)不時(shí)報(bào)出人工智能廠(chǎng)商的高估值和高融資額,把行業(yè)的熱度進(jìn)一步推高。
但是,面對(duì)當(dāng)前的技術(shù)及市場(chǎng),我們必須要保持清醒的認(rèn)識(shí),人工智能技術(shù)還遠(yuǎn)沒(méi)有達(dá)到人們想象的那種高度,也就是我們當(dāng)前還無(wú)法造出一個(gè)類(lèi)似人的機(jī)器人。單從人工智能里面的智能視頻分析來(lái)看,人工智能的智能化水平遠(yuǎn)遠(yuǎn)落后于人。目前為止,我們并沒(méi)有看到哪項(xiàng)人工智能技術(shù)已經(jīng)廣泛應(yīng)用了,比如人臉識(shí)別,不管是人臉支付還是公安行業(yè)的在逃人臉識(shí)別,我們并沒(méi)有看到人臉識(shí)別產(chǎn)品的廣泛應(yīng)用?,F(xiàn)階段更多的是人工智能產(chǎn)品在大量的行業(yè)應(yīng)用的試點(diǎn),而非廣泛應(yīng)用。
整體來(lái)看,人工智能行業(yè)還處于商業(yè)嘗試階段,但是一些子行業(yè)已經(jīng)出現(xiàn)了商業(yè)落地的景象了。上海趨視信息科技有限公司2013年推出的新一代算法的行為分析技術(shù)已經(jīng)在準(zhǔn)確率方向大幅提高了系統(tǒng)性能,經(jīng)歷兩年多的商業(yè)嘗試,在2016年進(jìn)入到了商業(yè)落地的階段。趨視科技獨(dú)創(chuàng)的2D場(chǎng)景轉(zhuǎn)3D場(chǎng)景技術(shù),將普通攝像機(jī)的2D場(chǎng)景首先還原成3D場(chǎng)景,使智能視頻更符合人的場(chǎng)景認(rèn)知,從而進(jìn)一步靠近人的思考模式,大幅提高了系統(tǒng)的準(zhǔn)確性。標(biāo)志著新一代算法的行為分析技術(shù)能夠?qū)崿F(xiàn)商業(yè)落地。
在汽車(chē)輔助駕駛方面,以色列的MOBILEYE公司成功將基于視覺(jué)的汽車(chē)輔助駕駛技術(shù)應(yīng)用在寶馬、沃爾沃等高端車(chē)型中,得到了這些車(chē)廠(chǎng)的認(rèn)同。MOBILEYE的智能輔助駕駛系統(tǒng)也進(jìn)入了商業(yè)落地的階段,也標(biāo)志著基于視覺(jué)的輔助駕駛技術(shù)能夠?qū)崿F(xiàn)商業(yè)落地。
至于其他的人工智能視覺(jué)技術(shù)及方向,仍然在努力嘗試中,廣泛意義的人臉識(shí)別技術(shù)目前可能很難進(jìn)入商業(yè)落地,但是,小范圍,局域化的人臉識(shí)別技術(shù)是有可能實(shí)現(xiàn)商業(yè)落地的,當(dāng)然,這還需要有核心技術(shù)實(shí)力的廠(chǎng)商不斷的努力和嘗試。
展望2017年,趨視科技美國(guó)研發(fā)中心會(huì)加大ADAS輔助汽車(chē)駕駛方面的投入,在美國(guó)邀請(qǐng)更多的算法專(zhuān)家加入,盡快完成各種道路狀況的路測(cè)評(píng)估和算法優(yōu)化演進(jìn)。同時(shí),趨視科技仍然會(huì)對(duì)行為分析算法進(jìn)行一輪大幅度升級(jí),大幅提高識(shí)別準(zhǔn)確率,滿(mǎn)足更多行業(yè)的應(yīng)用。人臉識(shí)別方面,趨視將拋棄傳統(tǒng)的靜態(tài)人臉照片比對(duì)模式,開(kāi)創(chuàng)全動(dòng)態(tài)人臉識(shí)別新思路和新算法,大幅提升動(dòng)態(tài)人臉識(shí)別的準(zhǔn)確率。
吳堯:一年來(lái),海康秉承“以視頻圖像處理為核心、以產(chǎn)品安全為基石、以智能應(yīng)用為導(dǎo)向、以滿(mǎn)足行業(yè)需求為目標(biāo)”的理念,由原來(lái)的單一產(chǎn)品逐步形成成熟的產(chǎn)品系列,產(chǎn)品的人性化設(shè)計(jì)、環(huán)境適應(yīng)性以及安全性等方面全面提升,智能化應(yīng)用更深入,行業(yè)應(yīng)用和解決方案更全面。
我們?cè)谌斯ぶ悄茴I(lǐng)域的產(chǎn)品和應(yīng)用是從視頻延伸過(guò)來(lái)的,比如我們做機(jī)器人,但沒(méi)有做機(jī)械手,因?yàn)槟鞘强刂祁I(lǐng)域的。我們根據(jù)自己的定位,以相機(jī),或者以視頻掃碼為核心的機(jī)器人,這些都由我們擅長(zhǎng)的核心技術(shù)延伸而來(lái)。憑借??刀嗄陙?lái)在成像采集、圖像處理和模式識(shí)別等領(lǐng)域的技術(shù)積淀與超前布局,2017年我們會(huì)繼續(xù)堅(jiān)持圍繞核心技術(shù)及硬件優(yōu)勢(shì),推進(jìn)人工智能在不同領(lǐng)域的應(yīng)用。
柳鋼:在人工智能、大數(shù)據(jù)、硬件計(jì)算單元的強(qiáng)大驅(qū)動(dòng)下,就像之前IP化帶來(lái)的革命一樣,未來(lái)5——10年安防行業(yè)可能將迎接新一輪更具顛覆性的革命。