張?chǎng)?/p>
我們公司的名字叫曠視科技,F(xiàn)ace++是曠視科技的第一條產(chǎn)品線。由于在開(kāi)發(fā)者的生態(tài)里面,大家對(duì)于Face++的了解程度更高,它逐步成為公司的代名詞。
今天既然我們的主題是講數(shù)據(jù),就一起看大數(shù)據(jù)和AI的一些案例。中國(guó)是一個(gè)人口大國(guó),長(zhǎng)得非常像的人也多,經(jīng)常會(huì)認(rèn)錯(cuò)。我們做過(guò)一個(gè)測(cè)試,專(zhuān)業(yè)間諜人員在看完100多人的圖像之后進(jìn)行比對(duì),比對(duì)精準(zhǔn)性就會(huì)直線下降,原因是通過(guò)人的認(rèn)知去判定都會(huì)產(chǎn)生一種腦補(bǔ)的情節(jié),但機(jī)器就可以解決這個(gè)問(wèn)題。我們通過(guò)化妝或者一些PS手段,可能會(huì)展現(xiàn)出一個(gè)不一樣的自己,再通過(guò)人臉識(shí)別去辨認(rèn),如何辨認(rèn)到位?如何分清楚到底是否為同一個(gè)人?還是很具有挑戰(zhàn)性的。機(jī)器通過(guò)學(xué)習(xí)以后可以有效辨別人的化妝變化,如何保證比對(duì)精準(zhǔn)度呢?機(jī)器在去做比對(duì)的時(shí)候,它的依據(jù)是人臉上的特征,不是通過(guò)人眼所認(rèn)知到的比較外在的一些理解方式。
從技術(shù)角度出發(fā),如果不能有效辨別數(shù)據(jù)的真假性,會(huì)對(duì)我們的認(rèn)證結(jié)果帶來(lái)非常大的擾動(dòng)。我們看到,人臉識(shí)別這件事說(shuō)到底是一個(gè)實(shí)驗(yàn)室產(chǎn)物,但還是可以應(yīng)用在實(shí)際的商業(yè)環(huán)境中。馬云在德國(guó)漢諾威通過(guò)刷臉支付送給德國(guó)總理默克爾一套郵票,這個(gè)事件可以作為一個(gè)里程碑事件,標(biāo)志著人臉識(shí)別技術(shù)已經(jīng)能夠滿足金融級(jí)的需求。恰恰是這樣的技術(shù)推動(dòng),使大家逐步了解到作為算法提供商,曠視科技一直致力于提供商業(yè)化的優(yōu)秀算法。
我們看一下中美在這十年間AI的發(fā)展情況,美國(guó)對(duì)于基礎(chǔ)研究的重視程度遠(yuǎn)遠(yuǎn)高于中國(guó),其實(shí)在競(jìng)爭(zhēng)過(guò)程中,我們的最大優(yōu)勢(shì)集中表現(xiàn)在,中國(guó)有非常好的數(shù)據(jù)資源和非常好的商業(yè)實(shí)踐環(huán)境,我們能夠把算法和場(chǎng)景有機(jī)地結(jié)合起來(lái),使AI能夠得到發(fā)展。這得益于幾個(gè)關(guān)鍵點(diǎn):第一個(gè)叫算法,第二個(gè)叫算力,還有一個(gè)是數(shù)據(jù),這是原來(lái)的三大元素。但是我們認(rèn)為還有一項(xiàng)非常重要,就是場(chǎng)景,脫離了場(chǎng)景,脫離了來(lái)源于生產(chǎn)的環(huán)境數(shù)據(jù),我們做的所有訓(xùn)練,只能是實(shí)驗(yàn)室的產(chǎn)物,無(wú)法解決現(xiàn)實(shí)問(wèn)題。
在發(fā)展過(guò)程中,曠視對(duì)于AI成長(zhǎng)有自己的觀察。從算法的不斷迭代到軟件的封裝,延伸到解決方案,這些應(yīng)用方案又能產(chǎn)生更多的數(shù)據(jù),這些數(shù)據(jù)能更好地解決行業(yè)問(wèn)題,這本身就是一個(gè)比較好的商業(yè)閉環(huán)。在這個(gè)過(guò)程中,我們可以解決技術(shù)從0到1、從1到N以及如何產(chǎn)業(yè)化的問(wèn)題。在技術(shù)環(huán)節(jié),我們非常關(guān)注在整個(gè)數(shù)據(jù)訓(xùn)練的這個(gè)閉環(huán)中如何提升效率。
從0到1,核心是要有一個(gè)完整的商業(yè)閉環(huán),完成整個(gè)商業(yè)閉環(huán),就意味著我們可以利用行業(yè)數(shù)據(jù)去提升算法的性能,在算法的性能提升之后,在應(yīng)用中會(huì)產(chǎn)生更多的數(shù)據(jù),這些數(shù)據(jù)就像滾雪球一樣發(fā)展,不斷地提升行業(yè)中AI應(yīng)用實(shí)現(xiàn)的可能性。從1到N,如何高效地將這樣一種商業(yè)模式推廣下去?我們來(lái)看一下在推廣過(guò)程中的幾個(gè)環(huán)節(jié),我們知道信息系統(tǒng)有一個(gè)生態(tài),包含基礎(chǔ)設(shè)施、商業(yè)核心以及行業(yè)加速?;A(chǔ)設(shè)施是通過(guò)物理層幫助我們?cè)谇岸巳ナ占瘮?shù)據(jù)或者產(chǎn)生數(shù)據(jù),拆開(kāi)來(lái)看,芯片、服務(wù)、傳感器這些都是我們獲取數(shù)據(jù)的方式。在商業(yè)核心這個(gè)環(huán)節(jié),曠視本身的業(yè)務(wù)更加關(guān)注算法、產(chǎn)品和數(shù)據(jù),核心問(wèn)題是我們要解決行業(yè)中存在的問(wèn)題,通過(guò)AI的方式去賦能,建立基礎(chǔ)信息庫(kù),并且不斷完善。行業(yè)加速需要資本的力量去推動(dòng),并不斷復(fù)制好的商業(yè)模式。在整個(gè)生態(tài)中,曠視對(duì)自己的定位是一個(gè)解決方案提供商,我們希望能夠在某些垂直領(lǐng)域解決一系列的問(wèn)題,這些問(wèn)題恰恰可以為行業(yè)用戶提升應(yīng)用價(jià)值。在曠視的發(fā)展過(guò)程中,我們非常關(guān)注與投資方的合作,不單看重資本的融資力量,我們更加關(guān)注的是如何將這種技術(shù)落地到不同的應(yīng)用場(chǎng)景中。所以,曠視在選擇投資方的時(shí)候非常注重,能否利用投資方的資源更好地實(shí)現(xiàn)從0到1的突破。
另外,如何去實(shí)現(xiàn)AI的平臺(tái)化?如果每一個(gè)行業(yè)我們都要建立一個(gè)閉環(huán)的話,從1到100的加速時(shí)間是一個(gè)公司無(wú)法做到的。在這個(gè)過(guò)程中,AI平臺(tái)化非常必要。要促進(jìn)產(chǎn)業(yè)升級(jí),使AI賦能產(chǎn)業(yè)化,離不開(kāi)三點(diǎn):在線化、數(shù)據(jù)化、智能化。在很多傳統(tǒng)行業(yè)里,獲取數(shù)據(jù)的成本非常高,有很多數(shù)據(jù)不宜獲取,數(shù)據(jù)價(jià)值決定了在線化是未來(lái)的方向。實(shí)現(xiàn)了在線化之后,我們可以提前定義哪些數(shù)據(jù)可以有效利用起來(lái),在線化發(fā)展是未來(lái)的一個(gè)必然趨勢(shì)。智能化所解決的問(wèn)題決定了數(shù)據(jù)化的維度,到底哪些數(shù)據(jù)是必要的,哪些數(shù)據(jù)是有用的,如果我們想清楚了這些問(wèn)題,數(shù)據(jù)化的維度自然也是可以被定義出來(lái)的。
我們認(rèn)為,剛需比較明確的行業(yè)像金融、安防、媒體等,都是我們目前覆蓋的行業(yè)。三年之內(nèi),我們認(rèn)為在零售、物流、手機(jī)、保險(xiǎn)、制造業(yè)等,通過(guò)數(shù)據(jù)積累和產(chǎn)品定義可以拓展行業(yè)爆發(fā)空間。五年左右的時(shí)間,我們認(rèn)為在醫(yī)療、AR、自動(dòng)駕駛、機(jī)器人等這些行業(yè)里,產(chǎn)品會(huì)達(dá)到一個(gè)真正的爆發(fā)期。所有有攝像頭的地方,小到手機(jī),大到城市安防監(jiān)控,有攝像頭的地方都是視覺(jué)解決方案和算法提供商所關(guān)注的價(jià)值點(diǎn)。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)