姚堯
忽如一夜春風(fēng)來,視覺人工智能企業(yè)如千樹萬樹梨花開,并迅速成長為高估值企業(yè)。
近來,許多人到銀行開戶已不必再到柜臺辦理,只需在遠(yuǎn)程終端上利用“刷臉”功能就可以實(shí)現(xiàn)。不僅如此,各類門禁系統(tǒng)、手機(jī)“刷臉”等使用人臉識別技術(shù)的設(shè)備也在快速普及,而人臉識別其實(shí)就是視覺人工智能最重要的應(yīng)用場景之一。
整個行業(yè)的突飛猛進(jìn)源自2014年的一次技術(shù)進(jìn)步。商湯科技有關(guān)負(fù)責(zé)人告訴《中國經(jīng)濟(jì)信息》記者,那年,商湯科技創(chuàng)始團(tuán)隊宣布,其DeepID系列人臉識別算法首次超越人眼識別率。這意味著,人臉識別技術(shù)已具備場景落地的技術(shù)基礎(chǔ)。
隨后資本蜂擁而至,而企業(yè)們也開始挖掘該技術(shù)在安防、金融、醫(yī)療、自動駕駛、電商等場景落地的潛力。有業(yè)內(nèi)人士表示,對視覺人工智能行業(yè)而言,數(shù)據(jù)是基礎(chǔ),算法是技術(shù)關(guān)鍵,資本投入是動力,但最終變現(xiàn)則取決于技術(shù)能否順利落地。
機(jī)器識人更準(zhǔn)
視覺人工智能可以簡單理解為計算機(jī)視覺,而這一技術(shù)取得突破則源自于一場計算機(jī)競賽。2012年,多倫多大學(xué)教授Geoffrey Hinton和學(xué)生一同參加了ImageNet計算機(jī)視覺識別挑戰(zhàn)賽獲得了冠軍,并一舉將計算機(jī)視覺識別的準(zhǔn)確率從74%提高至84%。這也稱得上是近年來AI人工智能領(lǐng)域的重要事件。
此后,全球大批計算機(jī)視覺研究者開始組建創(chuàng)業(yè)團(tuán)隊。依圖科技創(chuàng)始人兼CEO朱瓏和聯(lián)合創(chuàng)始人林晨曦告訴《中國經(jīng)濟(jì)信息》記者,他們也是自那時起才真正進(jìn)入到視覺人工智能領(lǐng)域。林晨曦說:“選擇這一領(lǐng)域的原因之一是計算機(jī)視覺在人工智能里的難度系數(shù)中等,比語音識別要難,又比自然語言理解要簡單。它的結(jié)果相對比較直觀,更容易接受可見度的學(xué)習(xí)和訓(xùn)練?!?/p>
據(jù)林晨曦介紹,當(dāng)時公安系統(tǒng)有幾百萬人的數(shù)據(jù)庫,需要從中匹配出路上拍到的犯罪嫌疑人照片。那時供應(yīng)商提供的技術(shù)首位命中率僅為20%,這樣的準(zhǔn)確率面對百萬級別的大數(shù)據(jù)幾乎沒有可操作性。而依靠視覺人工智能技術(shù)卻能將準(zhǔn)確率提升到85%?!斑@意味著在路上碰到十個人,有八個半能對出來是誰,其他工作流程就可以據(jù)此展開。人臉識別便在2014年落地了警務(wù)應(yīng)用?!绷殖筷卣f。
而依圖的經(jīng)歷只是眾多這一領(lǐng)域企業(yè)經(jīng)歷的縮影。
2014年3月,現(xiàn)在的商湯科技創(chuàng)始人湯曉鷗還是香港中文大學(xué)教授,其團(tuán)隊發(fā)布的原創(chuàng)人臉識別算法,準(zhǔn)確率達(dá)到驚人的98.52%,首次超越97.53%的人眼識別能力。機(jī)器看人能夠超越人類肉眼,對于眾多需要人臉識別的場景而言,這是技術(shù)已然成熟可以邁向市場的標(biāo)志。
在算法領(lǐng)域,語音識別發(fā)展比計算機(jī)視覺更早,然而多位業(yè)內(nèi)人士指出,語音識別的應(yīng)用場景并沒有視覺人工智能豐富。2012年以來,人臉識別技術(shù)取得了長足進(jìn)步,為廣泛應(yīng)用打下了基礎(chǔ)。
創(chuàng)新工場創(chuàng)始人李開復(fù)也曾表示,圖像識別相比語音識別更能應(yīng)用于場景。對機(jī)器而言,語音識別和自然語言理解是兩個步驟。目前的技術(shù)水平往往停留于語音識別層面,以語音識別軟件為例,一旦遇到中英文混合時就容易出現(xiàn)混亂。即便如此,語音識別領(lǐng)域也產(chǎn)生了市值達(dá)到約800億元的企業(yè)。由此不難想見視覺人工智能的“錢”景。
引燃安防市場
安防是視覺人工智能真正大顯身手的首秀。縱觀目前市場上的相關(guān)企業(yè),拿到的第一張訂單基本都來自對安防有強(qiáng)烈需求的政府部門。
2017年,公安部公布了《公安科技創(chuàng)新“十三五”專項規(guī)劃》,指出要通過專項規(guī)劃的實(shí)施,開展知識創(chuàng)新、技術(shù)創(chuàng)新、應(yīng)用創(chuàng)新與管理創(chuàng)新等四類創(chuàng)新。同時,有關(guān)部門也已準(zhǔn)備將目前還分屬于政府各部門、社會機(jī)構(gòu)的攝像頭及其后臺數(shù)據(jù)進(jìn)行統(tǒng)一管理。這對視覺人工智能行業(yè)而言都是利好消息。
其實(shí),視覺人工智能僅從技術(shù)上看,精確度已經(jīng)相當(dāng)高。從事該行業(yè)的上海某企業(yè)曾在國內(nèi)的行業(yè)展覽中展出過一款產(chǎn)品,要鎖定對象現(xiàn)在的位置,只需要根據(jù)對象十幾歲時的照片就能實(shí)現(xiàn)。該企業(yè)有關(guān)負(fù)責(zé)人表示,這一系統(tǒng)對于公安部門維護(hù)社會治安具有十分重要的意義。
從中央到地方,公安系統(tǒng)在技術(shù)偵查方面的資金投入逐年增長。據(jù)悉,東部某沿海城市公安部門剛剛完成八億元的人臉識別項目招標(biāo),某直轄市公安部門在未來三年的相關(guān)預(yù)算高達(dá)數(shù)百億元。
深鑒科技創(chuàng)始人兼CEO姚頌一語道破視覺人工智能企業(yè)進(jìn)入安防市場的三個原因。一是市場很大,2017年的市場規(guī)模已達(dá)到約6500億元。第二是安防市場足夠穩(wěn)定,有利于企業(yè)增加收入。最后是安防市場非常分化,任何公司都有機(jī)會。
從技術(shù)層面看,目前視覺人工智能企業(yè)的能力與安防市場需求也相當(dāng)吻合。曠視科技CTO唐文斌指出,視覺人工智能難度最高的應(yīng)用在自動駕駛,因為這一場景關(guān)系人身安全,且高度依賴機(jī)器獨(dú)立完成。安防則不同,需要人機(jī)混合完成,而且機(jī)器所要解決的問題更為清晰。
他認(rèn)為,未來的安防市場規(guī)模還將持續(xù)擴(kuò)大,其中的原因主要是隨著政府部門的數(shù)據(jù)積累,加上視覺人工智能企業(yè)對算法和模型的研究更為深入,在安防市場必然還會有更多應(yīng)用場景得到激活。
全面落地檢驗
自2016年起,伴隨視覺人工智能技術(shù)的進(jìn)步和在安防市場的爆發(fā),該領(lǐng)域企業(yè)正繼續(xù)推動這一技術(shù)在其他應(yīng)用場景落地,而看到了商機(jī)的資本也不甘落后紛紛加入其中。
回憶起公司拿到的第一單,林晨曦依然記憶猶新。那是2013年,林晨曦獲得了向蘇州市某科技部門負(fù)責(zé)人介紹依圖科技的機(jī)會,而他最大的收獲卻是了解到交通系統(tǒng)對車輛識別的需求。
2013年前后,交通系統(tǒng)車輛識別的準(zhǔn)確率只有約30%,而有關(guān)部門希望達(dá)到最少70%。而依圖科技的識別率卻達(dá)到驚人的95%。此后,人臉識別的訂單也紛至沓來。與此同時,曠視科技也在尋找機(jī)會落地,而他們則將目光投向了游戲,并使得該游戲在應(yīng)用商店的下載排名名列前茅。
“這是雙向的尋找,視覺人工智能公司在尋找場景,而有技術(shù)訴求的場景也在尋找他們。”有業(yè)內(nèi)人士表示。其實(shí)早在2015年,同樣擁有海量數(shù)據(jù)的金融系統(tǒng)就提出了對人臉識別遠(yuǎn)程開戶的訴求,而現(xiàn)如今,大多數(shù)銀行已經(jīng)裝備了具備人臉識別功能的發(fā)卡設(shè)備,提高了銀行的運(yùn)行效率。
在安防和金融領(lǐng)域之后,醫(yī)療和物流也出現(xiàn)了視覺人工智能落地的需求。以依圖科技為例,其醫(yī)療用“胸部CT智能輔助診斷”產(chǎn)品已經(jīng)進(jìn)入浙江、上海、湖北等地的醫(yī)療機(jī)構(gòu),成為醫(yī)生日常使用的人工智能產(chǎn)品。
商湯科技則更為多元化,其視覺人工智能技術(shù)已進(jìn)入14個行業(yè)。業(yè)內(nèi)人士認(rèn)為,跨行業(yè)之間有很大的協(xié)同作用。而2020年之后商湯科技會更多滿足交互類應(yīng)用場景的需求,這就包括直播等。
向來敏銳的資本也嗅到了商機(jī)。2017年以來,視覺人工智能企業(yè)的融資規(guī)模出現(xiàn)“驟增”。依圖科技、商湯科技和曠視科技等都很受資本青睞。去年5月,依圖科技完成了3.8億元的C輪融資。7月,商湯科技則完成4.1億美元B輪融資,估值已經(jīng)達(dá)到15億美元。11月,曠視科技則完成了4.6億美元C輪融資。資本的迅速介入似乎也預(yù)示著行業(yè)的春天。
而企業(yè)們則為滿足更多場景需求而努力加速前進(jìn)。因為市場足夠大,只要各行各業(yè)還需要機(jī)器替代人工,視覺人工智能企業(yè)們就有得忙。endprint