文/簡(jiǎn)成英 徐淑琴
圖普科技:
從“智能鑒黃”認(rèn)識(shí)“圖像識(shí)別”技術(shù)
文/簡(jiǎn)成英徐淑琴
“黑科技”之“人工智能”
2016年是網(wǎng)絡(luò)直播商業(yè)化應(yīng)用起步之年。歐萊雅在美拍上通過(guò)鞏俐等明星直播戛納電影節(jié),小米通過(guò)直播發(fā)布小米無(wú)人機(jī),觀看總?cè)藬?shù)累計(jì)達(dá)到1092萬(wàn)……據(jù)艾媒咨詢統(tǒng)計(jì),在中國(guó)有近200家在線直播平臺(tái),包括YY、騰訊、樂(lè)視、小米等大玩家,在游戲、財(cái)經(jīng)、體育等細(xì)分領(lǐng)域,也涌現(xiàn)一批垂直直播平臺(tái),以游戲?yàn)橹鞯挠卸肤~(yú)、虎牙、熊貓TV、龍珠直播等平臺(tái)。圖像、文字、語(yǔ)音這類開(kāi)放平臺(tái)的數(shù)量正在不斷增長(zhǎng)。
華創(chuàng)證券的研究報(bào)告認(rèn)為2015年直播行業(yè)具有120億的市場(chǎng)規(guī)模,艾媒咨詢的報(bào)告認(rèn)為該市場(chǎng)規(guī)模約為90億。隨著近幾年互聯(lián)網(wǎng)市場(chǎng)上交友軟件以及直播視頻軟件的流行,UGC模式大行其道,各類不法分子將違法視頻、圖片資源上傳至網(wǎng)絡(luò),內(nèi)容安全成了互聯(lián)網(wǎng)公司最基本的需求。5月份,映客、花椒、在直播、陌陌等平臺(tái)的40名主播因涉黃被永久封禁,“鑒黃”勢(shì)在必行,市場(chǎng)需求激增。
人工智能“鑒黃”一度被認(rèn)為是黑科技,廣州圖普科技正是這一技術(shù)和服務(wù)的提供者之一。據(jù)了解,圖普科技早在2012年開(kāi)始就著手研究“深度學(xué)習(xí)”技術(shù),并與國(guó)內(nèi)某知名實(shí)驗(yàn)室展開(kāi)合作,將“深度學(xué)習(xí)”人工智能技術(shù)應(yīng)用在圖像識(shí)別上,率先推出基于圖像識(shí)別技術(shù)的第三方內(nèi)容審核服務(wù),可識(shí)別色情、暴恐、小廣告等違規(guī)圖片和視頻。圖普科技利用“深度學(xué)習(xí)”技術(shù)實(shí)現(xiàn)了互聯(lián)網(wǎng)圖像過(guò)濾的整體解決方案,對(duì)外稱識(shí)別準(zhǔn)確率高達(dá)99.5%。
但圖普科技CEO李明強(qiáng)認(rèn)為,“鑒黃”技術(shù)或者圖像識(shí)別并不是真正意義上的“黑科技”,他所理解的“黑科技”應(yīng)該是沒(méi)有被預(yù)料而出現(xiàn)的,黑科技大多數(shù)不是立即可以應(yīng)用到人們身邊的。一般而言,科技需要被應(yīng)用,需要與一定的上下游產(chǎn)業(yè)相結(jié)合,所以當(dāng)很多“黑科技”最早出現(xiàn)的時(shí)候,一開(kāi)始只能說(shuō)是在技術(shù)上有了一定的突破,但是在實(shí)際應(yīng)用時(shí)還是需要有成熟的上下游產(chǎn)業(yè)相配應(yīng)。
隨著互聯(lián)網(wǎng)的發(fā)展,內(nèi)容安全成為互聯(lián)網(wǎng)不得不面臨的嚴(yán)峻挑戰(zhàn)。早在2013年有報(bào)道稱,全世界每天會(huì)上傳超過(guò)5億張圖片、20萬(wàn)小時(shí)長(zhǎng)的視頻到互聯(lián)網(wǎng)。單是人們每天在Instagram分享近6000萬(wàn)張照片,在Facebook分享近3億張——當(dāng)然,還沒(méi)算上Snapchat、Google 、 Twitter等大量產(chǎn)圖的應(yīng)用。在三年后的今天,這個(gè)數(shù)值必然遠(yuǎn)超乎我們的想象。
相比過(guò)去,互聯(lián)網(wǎng)的數(shù)據(jù)每年都在爆炸式增長(zhǎng)。IBM相關(guān)研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有 90%是過(guò)去兩年內(nèi)產(chǎn)生的,等到了 2020 年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的 44倍。截止2015年底,人們?cè)诨ヂ?lián)網(wǎng)上上傳的照片已經(jīng)超過(guò)9000億張,一天上傳到網(wǎng)上的照片數(shù)量就已經(jīng)超過(guò)了18億。
在互聯(lián)網(wǎng)高速發(fā)展的情況下,從文字到語(yǔ)音,從語(yǔ)音到影像,需要監(jiān)控的網(wǎng)站成千上萬(wàn),需要偵查的文字和圖像內(nèi)容隨著技術(shù)的發(fā)展越來(lái)越隱晦和“內(nèi)涵”。在互聯(lián)網(wǎng)1.0時(shí)代,抵制與防止“淫穢物品”的“鑒黃”工作并不顯性,同樣也不會(huì)應(yīng)用在商業(yè)領(lǐng)域,追溯“鑒黃”這個(gè)職業(yè),大概是出現(xiàn)在警察偵查和打擊“制作、復(fù)制、販賣、傳播淫穢物品”的場(chǎng)景中。尤其是互聯(lián)網(wǎng)2.0的到來(lái),互動(dòng)社區(qū)的崛起,網(wǎng)友的素質(zhì)參差不齊,因“涉黃”被勒令關(guān)閉的網(wǎng)站多如牛毛。前有百度、陌陌等因?yàn)樯閱?wèn)題而被處罰,后有優(yōu)衣庫(kù)事件、快播、斗魚(yú)直播、360云盤(pán)、115網(wǎng)盤(pán)、樂(lè)視網(wǎng)盤(pán)等事件,給互聯(lián)網(wǎng)公司造成了不小的麻煩。
“鑒黃”一般有兩種方法——人工“鑒黃”和技術(shù)“鑒黃”,水平較高的則是雙管齊下。技術(shù)“鑒黃”實(shí)際上是應(yīng)用了圖像識(shí)別功能,將不符合規(guī)定的內(nèi)容進(jìn)行識(shí)別然后刪除,廣州圖普科技就是專門(mén)利用這項(xiàng)技術(shù)給企業(yè)提供智能識(shí)別、鑒別服務(wù)。作為技術(shù)“鑒黃”服務(wù)的提供者之一,廣州圖普科技采取的方式是對(duì)問(wèn)題進(jìn)行分割,分為確定的和不確定的兩部分,確定的部分交給機(jī)器,不確定的部分交給人工。
智能“鑒黃”為什么會(huì)被外界一度認(rèn)為是黑科技?
首先,強(qiáng)大的數(shù)據(jù)庫(kù)存入與提取是人腦不能實(shí)現(xiàn)的。某互聯(lián)網(wǎng)企業(yè)某職員曾表示,“如果要說(shuō)‘鑒黃’那些事,我可以講三天三夜”。關(guān)于涉黃的規(guī)范文件,那是千百部“片子”才能解釋的。尤其是情景復(fù)雜多變、內(nèi)涵不一的各種暗示內(nèi)容,有著千萬(wàn)種不同的搭配,判斷涉黃與否絕非易事。“沒(méi)有大面積裸露是不是就不是黃圖?也未必,如果好好的一對(duì)絲襪偏要撕出好多破洞,那就算性暗示?!庇晨湍场拌b黃師”表示,這個(gè)場(chǎng)景換成文字或影像理解,人腦未必能夠深刻記住或者及時(shí)判斷,但如果換成算法來(lái)判斷,那就是“秒判”。
其次,這項(xiàng)技術(shù)號(hào)稱要頂替“鑒黃師”。外界認(rèn)為這是一項(xiàng)“足夠犀利”的新技術(shù),未來(lái)有望釋放“鑒黃師”的巨大壓力。雖然各個(gè)互聯(lián)網(wǎng)企業(yè)都有專門(mén)的人員來(lái)做內(nèi)容審核,但是無(wú)法跟上內(nèi)容發(fā)展的速度,人工審核容易出現(xiàn)審核不及時(shí)、高成本、主觀判斷影響結(jié)果、人性道德等問(wèn)題,并且高強(qiáng)度的“三班倒”工作下人工操作更容易導(dǎo)致審核效率低、誤判漏判多等問(wèn)題。
智能“鑒黃”的強(qiáng)大技術(shù)可解決不少麻煩。映客相關(guān)負(fù)責(zé)人曾表示,“為了對(duì)主播監(jiān)管,我們成立了800人的審核隊(duì)伍?!睂iT(mén)養(yǎng)800人去做審核的事情,似乎是令人難以想象的企業(yè)行為。實(shí)際上,當(dāng)直播高峰期成千上萬(wàn)的主播在線,可以說(shuō)“鑒黃”隊(duì)伍真是寡不敵眾。人工智能“鑒黃”的強(qiáng)大之處還體現(xiàn)在應(yīng)對(duì)突發(fā)狀況的能力。人工智能“鑒黃”技術(shù)應(yīng)用在直播上,可以監(jiān)測(cè)每時(shí)每刻的直播內(nèi)容。
“鑒黃黑科技”的背后,是一項(xiàng)圖像識(shí)別技術(shù)的應(yīng)用,這項(xiàng)技術(shù)依靠深度學(xué)習(xí)的人工智能實(shí)現(xiàn)。最新的圖像識(shí)別機(jī)器審核是依賴于人工智能領(lǐng)域最新的算法——深度學(xué)習(xí)算法,通過(guò)模擬人腦神經(jīng)網(wǎng)絡(luò),構(gòu)建具有高層次表現(xiàn)力的模型,能夠?qū)Ω邚?fù)雜度數(shù)據(jù)形成良好的解讀。
在圖普科技CEO李明強(qiáng)看來(lái),他并不覺(jué)得圖像識(shí)別是個(gè)“黑科技”,反而覺(jué)得這項(xiàng)“黑科技”已經(jīng)被廣泛使用,“圖像識(shí)別技術(shù)會(huì)被稱為‘黑科技’的一個(gè)原因可能是普通人對(duì)科技不是特別了解,事實(shí)上圖像識(shí)別在研究上已經(jīng)有一定的突破,所以他們看到實(shí)際應(yīng)用(“鑒黃”)的時(shí)候才會(huì)比較驚奇。”每一項(xiàng)技術(shù),都有從“黑科技”角色退下來(lái)的時(shí)候,真正實(shí)現(xiàn)它的實(shí)際應(yīng)用。
正如李明強(qiáng)所說(shuō),如今的機(jī)器學(xué)習(xí)、人工智能很多已經(jīng)不再是我們所理解的神秘“黑科技”。
與圖普科技依靠深度學(xué)習(xí)的人工智能圖像識(shí)別技術(shù)提供智能“鑒黃”服務(wù)類似,更多知名互聯(lián)網(wǎng)公司也利用圖像識(shí)別等人工智能服務(wù)開(kāi)啟人類“第三只眼”。
微軟亞太研發(fā)集團(tuán)中國(guó)創(chuàng)新工程院資深項(xiàng)目經(jīng)理李京梅曾表示,微軟希望把智能服務(wù)帶入到應(yīng)用里,讓想法變?yōu)楝F(xiàn)實(shí),將語(yǔ)言理解變?yōu)橹悄芊?wù),對(duì)應(yīng)搜索引擎后面的功能,包括普通網(wǎng)頁(yè)的搜索以及一些垂直方面比如新聞、視頻的搜索,其中包括提取圖像基本特征、識(shí)別名人、識(shí)別圖片里的文字、智能縮略、人臉識(shí)別、情緒識(shí)別等。
微軟推出人工智能服務(wù),阿里、騰訊、百度不甘示弱,相繼推出各種人工智能服務(wù)。李彥宏在2016百度聯(lián)盟峰會(huì)上談及人工智能最新進(jìn)展,“深度學(xué)習(xí)在語(yǔ)音上的應(yīng)用已經(jīng)非常精準(zhǔn),現(xiàn)在的百度語(yǔ)音識(shí)別準(zhǔn)確率也已經(jīng)達(dá)到了97%,每天語(yǔ)音識(shí)別請(qǐng)求的PV超過(guò)1億;此外,今天的百度圖像識(shí)別與過(guò)去一年也大不一樣?!?/p>
無(wú)論是微軟還是百度或是圖普科技,通過(guò)其擁有龐大的數(shù)據(jù)庫(kù)深度學(xué)習(xí)讓圖像識(shí)別更加精準(zhǔn)。“深度學(xué)習(xí)算法設(shè)計(jì)的智能程序能通過(guò)快速迭代擁有強(qiáng)大的學(xué)習(xí)能力,并與視頻直播、社交網(wǎng)絡(luò)、云計(jì)算等領(lǐng)域企業(yè)合作,積累大量圖片和視頻數(shù)據(jù),克服智能程序設(shè)計(jì)中的大數(shù)據(jù)壁壘,得到高精度的智能識(shí)別結(jié)果?!崩蠲鲝?qiáng)表示,圖像識(shí)別不僅可以用來(lái)過(guò)濾違規(guī)內(nèi)容,圖像搜索也是一種圖像識(shí)別的應(yīng)用,在線下領(lǐng)域,比如說(shuō)機(jī)器人、智能家居、智能工業(yè)制造等各個(gè)領(lǐng)域,都會(huì)需要圖像識(shí)別和理解,它們就像機(jī)器人的眼睛一樣收集外界的信息。
據(jù)介紹,計(jì)算機(jī)視覺(jué)的起源其實(shí)蠻好玩。它是源于1966年,明斯基(人工智能之父)給一個(gè)本科一年級(jí)學(xué)生布置的一個(gè)暑期項(xiàng)目——將電腦和相機(jī)連接起來(lái),然后讓機(jī)器描述它通過(guò)相機(jī)看到什么。計(jì)算機(jī)視覺(jué),就是讓計(jì)算機(jī)能理解它所處理的圖像內(nèi)容。之后計(jì)算機(jī)視覺(jué)逐漸受到重視——20世紀(jì)70年代,在解讀事先選定的圖片上取得一定進(jìn)展;20世紀(jì)80年代,人工神經(jīng)網(wǎng)絡(luò)的研究起起伏伏,轉(zhuǎn)向幾何和增加數(shù)學(xué)上的嚴(yán)密性;20世紀(jì)90年代,人臉識(shí)別、統(tǒng)計(jì)分析成為研究熱點(diǎn);進(jìn)入21世紀(jì),計(jì)算機(jī)視覺(jué)有了更廣泛的識(shí)別、大量可用的注釋數(shù)據(jù)集,并開(kāi)始處理視頻等。
數(shù)據(jù)、計(jì)算能力和算法三個(gè)方面達(dá)到一定的積累和疊加后,導(dǎo)致圖像識(shí)別需求與供應(yīng)爆發(fā),其中數(shù)據(jù)方面是得益于近十多年來(lái)互聯(lián)網(wǎng)的發(fā)展,積累了海量的數(shù)據(jù)?!八惴ㄉ系耐黄疲瑯?biāo)志性的事件是2012年的ImageNet大賽,這次大賽使得深度學(xué)習(xí)算法取得了業(yè)內(nèi)的空前關(guān)注?!睒I(yè)內(nèi)專家表示。
目前機(jī)器學(xué)習(xí)的核心技術(shù)是深度學(xué)習(xí)。李明強(qiáng)認(rèn)為,“可以把深度學(xué)習(xí)理解為一個(gè)空白的人腦,這些大量的數(shù)據(jù)就是灌輸進(jìn)來(lái)的經(jīng)驗(yàn)。深度學(xué)習(xí)是屬于機(jī)器學(xué)習(xí)的一個(gè)范疇,是最新的機(jī)器學(xué)習(xí)技術(shù),最主要體現(xiàn)在‘深度’這兩個(gè)字?!?/p>
深度學(xué)習(xí)可以理解為“深度機(jī)器學(xué)習(xí)”,相比普通或者傳統(tǒng)的機(jī)器學(xué)習(xí),深度學(xué)習(xí)在神經(jīng)網(wǎng)絡(luò)的復(fù)雜度和層數(shù)都加深了,因此才會(huì)叫做“深度學(xué)習(xí)”。
圖普科技早在幾年前就開(kāi)始著手深度學(xué)習(xí)方面的研究。“當(dāng)我們把大量的色情、性感以及正常樣本的屬性告訴深度學(xué)習(xí)的引擎,然后讓引擎不斷學(xué)習(xí),對(duì)他們正確的行為進(jìn)行獎(jiǎng)勵(lì),錯(cuò)誤的行為進(jìn)行懲罰,當(dāng)然這些獎(jiǎng)勵(lì)和懲罰都是數(shù)學(xué)上的,最后空白的腦袋就會(huì)學(xué)成了一種連接的模型,這種模型就是為了鑒別色情與非色情而生的?!崩蠲鲝?qiáng)介紹道。所以只要對(duì)機(jī)器“誤判、漏判”的內(nèi)容進(jìn)行懲罰,然后不斷重復(fù)的訓(xùn)練,機(jī)器就會(huì)慢慢改正,不再出現(xiàn)同樣的“誤判、漏判”,模型就是這樣被不斷地迭代優(yōu)化。
作為第三方技術(shù)服務(wù)機(jī)構(gòu)的圖普科技,在商業(yè)模式和盈利模式上都較為清晰,不同于騰訊優(yōu)圖、阿里綠網(wǎng)等為自己平臺(tái)的客戶提供審核服務(wù)的局限性,圖普科技更重視增強(qiáng)服務(wù)方面的優(yōu)勢(shì),服務(wù)細(xì)致程度和準(zhǔn)確度在業(yè)內(nèi)評(píng)價(jià)均較高。資料顯示,圖普科技國(guó)內(nèi)最早利用人工智能算法(深度學(xué)習(xí)等)做審核服務(wù),也是在工程經(jīng)驗(yàn)、服務(wù)專業(yè)度方面具有先發(fā)優(yōu)勢(shì)的第三方,“我們會(huì)根據(jù)不同的客戶、不同的細(xì)分領(lǐng)域,做單獨(dú)的模型調(diào)整以及算法細(xì)節(jié)的優(yōu)化,專人服務(wù)對(duì)專門(mén)的客戶做專業(yè)的運(yùn)營(yíng)。圖普科技也是國(guó)內(nèi)利用人工智能做智能審核的首倡者,很多定價(jià)的方法、歸類的方法、接口返回的定義都為后來(lái)的同行做出了一定標(biāo)準(zhǔn)和規(guī)范?!崩蠲鲝?qiáng)一再?gòu)?qiáng)調(diào),互聯(lián)網(wǎng)時(shí)代服務(wù)和產(chǎn)品是最重要的。
其次,圖普科技識(shí)別接口全面,除了提供審核之外,還有包括人臉、場(chǎng)景、物體、車、表情、人的年齡以及服裝風(fēng)格等幾十種識(shí)別接口,客戶一次接入后,可以自行增減各種服務(wù)接口,只要一次接入,就可以滿足各種需求。而使用便捷,才是真正的用戶體驗(yàn)?!翱蛻魺o(wú)需為了使用圖片識(shí)別服務(wù)而綁定任何云計(jì)算平臺(tái),可以通過(guò)圖普入駐的七牛、UCloud、AWS、融云等知名平臺(tái)直接調(diào)用。”李明強(qiáng)介紹道。
阿里綠網(wǎng)、騰訊優(yōu)圖的優(yōu)勢(shì)則體現(xiàn)在技術(shù)、品牌和業(yè)務(wù)的成熟上,企業(yè)知名度更高,在新產(chǎn)品的推廣、普及上更容易被接受,騰訊和阿里都有自己的業(yè)務(wù)線,在成熟產(chǎn)品銷售時(shí),可以將新產(chǎn)品附加給客戶使用。據(jù)李明強(qiáng)介紹,市場(chǎng)上不乏一些圖像識(shí)別技術(shù)領(lǐng)域的同行,如依圖、圖森、曠視科技、格靈深瞳、商湯科技等,大多數(shù)都同為創(chuàng)業(yè)企業(yè),但是產(chǎn)品線有所差異,主要是面向安防監(jiān)控、金融、廣告等領(lǐng)域。
圖普科技利用先發(fā)優(yōu)勢(shì),先從“鑒黃”切入人工智能商業(yè)化應(yīng)用,隨著互聯(lián)網(wǎng)內(nèi)容的發(fā)展以及市場(chǎng)的需求,又順勢(shì)展開(kāi)在暴恐識(shí)別、圖片增值、圖像搜索等方面的應(yīng)用,可以說(shuō)在發(fā)展上成功地卡位了深度學(xué)習(xí)技術(shù),當(dāng)需求爆發(fā)它就快速卡位。
在互聯(lián)網(wǎng)信息爆炸的當(dāng)下,圖像識(shí)別功能已經(jīng)快速應(yīng)用于各大網(wǎng)站及APP移動(dòng)手機(jī)終端。圖普科技于2014年8月獲北極光Pre-A輪融資數(shù)百萬(wàn)美元,產(chǎn)品在2015年4月上線后,僅1年已經(jīng)和包括國(guó)家旅游局、今日頭條、58同城、迅雷、酷狗、秒拍、小咖秀、唱吧、花椒直播、Bilibili、繁星網(wǎng)、秀色娛樂(lè)、CAMERA360、17APP、21CN、風(fēng)云直播、戰(zhàn)旗TV、糗事百科、花瓣網(wǎng)、微拍、媽媽網(wǎng)等數(shù)百家互聯(lián)網(wǎng)企業(yè)和政企機(jī)構(gòu)合作。此外,通過(guò)入駐七牛云、融云、UCloud、又拍云、AWS等云平臺(tái),間接服務(wù)了上萬(wàn)家客戶,業(yè)務(wù)規(guī)模在快速發(fā)展中。