□文/姜姝姝
人工智能創(chuàng)業(yè),向需求要效益
□文/姜姝姝
姜姝姝
本刊副總編輯
人工智能(AI)創(chuàng)業(yè)的外部條件比較有利,但是時(shí)機(jī)合適不合適還是要看自身。大公司解決人類(lèi)的大問(wèn)題,中小公司負(fù)責(zé)行業(yè)內(nèi)的縱深。用戶(hù)有需求的地方,就是AI落地的方向。
“它可能是歷史上最好的事情,也可能是歷史上最壞的事情?!眲虼髮W(xué)應(yīng)用數(shù)學(xué)及理論物理學(xué)系教授,當(dāng)代最重要的廣義相對(duì)論和宇宙論家史蒂芬·霍金在劍橋大學(xué)新萊弗爾梅未來(lái)智能中心里這樣評(píng)價(jià)AI。
這并非霍金第一次在AI問(wèn)題上表態(tài),但這一次霍金肯定了AI的積極影響。“人們可以通過(guò)創(chuàng)造智能來(lái)進(jìn)入一個(gè)有積極效應(yīng)同時(shí)未知的世界。我們或許可以通過(guò)新技術(shù)改革的工具來(lái)消弭工業(yè)化對(duì)自然世界的傷害。人類(lèi)最終需要達(dá)到的目的是消除疾病和貧窮?!?/p>
與科學(xué)家的審慎不一樣,產(chǎn)業(yè)界盛產(chǎn)的是“野心家”、“冒險(xiǎn)者”、技術(shù)派的初創(chuàng)團(tuán)隊(duì)迅速行動(dòng)。從全球創(chuàng)新中心的美國(guó)硅谷來(lái)看,自2011年以來(lái),開(kāi)發(fā)與AI相關(guān)的產(chǎn)品和技術(shù)并使之商業(yè)化的公司已獲得超過(guò)總計(jì)20億美元的風(fēng)險(xiǎn)投資,而科技巨頭更是投資數(shù)十億美元收購(gòu)那些AI初創(chuàng)公司。在有著一流人才的中國(guó),AI的創(chuàng)業(yè)大潮也大規(guī)模啟動(dòng)。
“公司的正式運(yùn)營(yíng)是從2014年8月開(kāi)始的,當(dāng)時(shí)投資人和創(chuàng)始人團(tuán)隊(duì)都認(rèn)可智能語(yǔ)音是下一個(gè)風(fēng)口?!睒O限元聯(lián)合創(chuàng)始人馬驥說(shuō),語(yǔ)音是極限元起步時(shí)做的第一個(gè)方向。一方面,深度學(xué)習(xí)技術(shù)的突破引發(fā)了語(yǔ)音技術(shù)的新變革,尤其是識(shí)別率和合成效果得到了大幅提升,行業(yè)中也出現(xiàn)了一些新增需求;另一方面,極限元的創(chuàng)始團(tuán)隊(duì)中也有來(lái)自中科院以及清華大學(xué)的語(yǔ)音技術(shù)人才。
人工智能領(lǐng)域,技術(shù)創(chuàng)業(yè)者如果只定位做技術(shù)提供商,而不直接面向用戶(hù)/客戶(hù)提供整體解決方案,未來(lái)價(jià)值會(huì)越來(lái)越小,不往上游走風(fēng)險(xiǎn)非常大,甚至是死路一條。這是前段時(shí)間,迅雷創(chuàng)始人程浩振聾發(fā)聵的總結(jié)。
和程浩持有相似觀點(diǎn),馬驥所在的這家公司創(chuàng)業(yè)之初就定位在以需求為導(dǎo)向,雖然在大AI領(lǐng)域并不高調(diào),但是三年來(lái)穩(wěn)打穩(wěn)扎,成為AI創(chuàng)業(yè)公司中明顯具備商業(yè)化能力的代表。
一開(kāi)始他們就確立了to B的方向,公司在確定語(yǔ)音前期的產(chǎn)品化和工程化工作大概用了半年時(shí)間,2015年下半年,極限元開(kāi)始交付一些語(yǔ)音技術(shù)項(xiàng)目,和語(yǔ)文出版社的合作是最具代表性的一例。
眾所周知,在語(yǔ)音智能的領(lǐng)域,前有科大訊飛等“老”公司,也有BAT、搜狗等的搶位,類(lèi)似極限元這類(lèi)還有機(jī)會(huì)嗎?“大公司解決人類(lèi)的大問(wèn)題?!瘪R驥說(shuō),AI的生意在于to B的領(lǐng)域,大公司面向to C的免費(fèi)模式,和AI領(lǐng)域的創(chuàng)業(yè)不一樣,雖然深入行業(yè)的量不大,但是足以承載這些小公司的業(yè)務(wù)。
這個(gè)觀點(diǎn)和創(chuàng)新工場(chǎng)創(chuàng)始人、CEO李開(kāi)復(fù)的說(shuō)法很像,“人工智能是to B的生意,AI時(shí)代工程師和to B的一個(gè)協(xié)作,不可能快速帶來(lái)千萬(wàn)的量,所以希望業(yè)內(nèi)不要將人工智能的估值炒得過(guò)高?!?/p>
以to B的需求為導(dǎo)向,是極限元對(duì)自身的定位。這樣的定位也決定了極限元能用兩年多時(shí)間,將語(yǔ)音和視覺(jué)等一系列技術(shù)應(yīng)用于教育、電信、電力、娛樂(lè)、視頻、駕駛等眾多領(lǐng)域。
AI并不是一個(gè)新的概念和領(lǐng)域,但是重新火起來(lái),是因?yàn)槌霈F(xiàn)了一系列復(fù)興AI研究進(jìn)程的要素,尤其是GPU、大數(shù)據(jù)、云計(jì)算和算法。
極限元聯(lián)合創(chuàng)始人馬驥
大數(shù)據(jù)是AI發(fā)展的助推劑,這是因?yàn)橛行〢I技術(shù)使用統(tǒng)計(jì)模型來(lái)進(jìn)行數(shù)據(jù)的概率推算,比如圖像、文本或者語(yǔ)音,通過(guò)把這些模型暴露在數(shù)據(jù)的海洋中,使它們得到不斷優(yōu)化,或者稱(chēng)之為“訓(xùn)練”。無(wú)論是吳恩達(dá)曾經(jīng)選擇加盟百度還是李飛飛進(jìn)入Google,一大原因都是要到“數(shù)據(jù)最大的地方去”。
而從技術(shù)發(fā)展的角度來(lái)看,隨著Google TensorFlow等生態(tài)系統(tǒng)的成熟,很多領(lǐng)域都會(huì)有訓(xùn)練好的模型可以用來(lái)參考,創(chuàng)業(yè)者只要有足夠的數(shù)據(jù)來(lái)訓(xùn)練參數(shù)就好了。所以數(shù)據(jù)的壁壘,似乎成了AI創(chuàng)業(yè)中難以邁過(guò)的檻。
數(shù)據(jù)壁壘有兩個(gè)方面,一個(gè)是量,一個(gè)是質(zhì)。馬驥說(shuō),在數(shù)據(jù)量上面,BAT大公司天然有一些行業(yè)優(yōu)勢(shì),對(duì)于創(chuàng)業(yè)團(tuán)隊(duì)來(lái)說(shuō),在量上面也是局限所在,而在質(zhì)上面需要有效性。極限元在這方面設(shè)立數(shù)據(jù)崗位,去獲取需要的數(shù)據(jù),另外與數(shù)據(jù)供應(yīng)商合作,互換有無(wú)。“最重要的一點(diǎn)是我們以toB垂直行業(yè)的用戶(hù)定制化需求為主,行業(yè)用戶(hù)本身會(huì)為我們提供大量數(shù)據(jù)?!?/p>
BAT的優(yōu)勢(shì)在于通用數(shù)據(jù),但是在深入的垂直行業(yè)中,數(shù)據(jù)的優(yōu)勢(shì)可以掌握在方案提供商手中。
方案提供商其實(shí)是有別于單一技術(shù)服務(wù)的,剛剛開(kāi)始創(chuàng)業(yè)時(shí)極限元也跟國(guó)內(nèi)其他一些智能語(yǔ)音公司類(lèi)似,把語(yǔ)音合成和語(yǔ)音識(shí)別技術(shù)以SaaS服務(wù)的方式部署在云平臺(tái)上,借此吸引一些移動(dòng)應(yīng)用、智能硬件的開(kāi)發(fā)者和創(chuàng)業(yè)團(tuán)隊(duì),從而發(fā)掘潛在的優(yōu)質(zhì)客戶(hù)。但實(shí)際情況并不如預(yù)期的順利,不僅無(wú)法獲得現(xiàn)金流支持,也不能真正接觸到優(yōu)質(zhì)客戶(hù)。
因?yàn)橛星袑?shí)需求的客戶(hù)要的是完整的解決方案,而單一技術(shù)只能滿(mǎn)足客戶(hù)局部的技術(shù)需求。理清思路后極限元迅速在直播領(lǐng)域找到了突破方向,通俗的說(shuō)就是“鑒黃”。這套互聯(lián)網(wǎng)音、視頻有害信息監(jiān)測(cè)系統(tǒng)是針對(duì)互聯(lián)網(wǎng)直播平臺(tái)的涉黃監(jiān)測(cè)技術(shù)方案,通過(guò)AI圖像識(shí)別技術(shù)發(fā)現(xiàn)視頻直播中的涉黃信息并給予平臺(tái)警告,監(jiān)測(cè)系統(tǒng)除圖像識(shí)別外還加入音頻監(jiān)測(cè)技術(shù)用以監(jiān)測(cè)語(yǔ)言類(lèi)直播內(nèi)容,音、視頻雙通道監(jiān)測(cè)方案已經(jīng)在國(guó)家網(wǎng)絡(luò)監(jiān)管部門(mén)成功應(yīng)用。在這樣的方案下,極限元也積累到了真正的行業(yè)大數(shù)據(jù)。
對(duì)于語(yǔ)音智能、圖像識(shí)別這樣的技術(shù)服務(wù)來(lái)說(shuō),基本能服務(wù)所有行業(yè),那么如何在其中選一個(gè)行業(yè),深入扎進(jìn)去做產(chǎn)業(yè)鏈的挖掘呢?極限元的想法是,會(huì)仔細(xì)分析客戶(hù)所在的行業(yè)是否存在同樣的技術(shù)需求,以及行業(yè)內(nèi)是否有一些普遍存在的行業(yè)性難題亟待解決,有針對(duì)性的為整個(gè)行業(yè)用戶(hù)提供技術(shù)解決方案,由點(diǎn)到面,從服務(wù)單一客戶(hù)過(guò)渡到服務(wù)于整個(gè)行業(yè)。
這就意味著不僅要完成一個(gè)客戶(hù)的需求,還要發(fā)掘行業(yè)中類(lèi)似需求的共性,把成熟方案復(fù)制到同行業(yè)的其他客戶(hù)需求上,把自己研發(fā)投入的回報(bào)率做到最大化。一旦找到了這樣的可復(fù)制方案的行業(yè),就不僅能在商業(yè)上吃透這個(gè)行業(yè),還能在技術(shù)上通過(guò)橫向合作不斷獲取行業(yè)數(shù)據(jù)來(lái)夯實(shí)技術(shù)。
行業(yè)解決方案一方面可以不斷提升服務(wù)品質(zhì),保障技術(shù)服務(wù)能力,另一方面不斷將產(chǎn)品線服務(wù)的對(duì)象延伸到產(chǎn)業(yè)上游。馬驥說(shuō),誰(shuí)越靠近上游的消費(fèi)者,誰(shuí)越接近終端消費(fèi)者,誰(shuí)的話語(yǔ)權(quán)就越高,“我從華為出來(lái),華為都是只領(lǐng)先半步,不領(lǐng)先一步,因?yàn)轭I(lǐng)先半步是先進(jìn),領(lǐng)先一步是先烈?!?/p>
深入行業(yè)的解決方案也意味著靠近這個(gè)行業(yè)的用戶(hù),從直播行業(yè)出發(fā),如何靠近用戶(hù)?極限元想到了“服務(wù)”主播,不僅提供了便于互動(dòng)的“音視頻互動(dòng)系統(tǒng)”,最大限度地還原人與人面對(duì)的場(chǎng)景;為了解決該問(wèn)題,極限元推出了集美顏、動(dòng)畫(huà)特效、水印、人臉道具等視覺(jué)特效增強(qiáng)功能。
真正的需求都是來(lái)自對(duì)行業(yè)的深入了解,極限元除了直播領(lǐng)域,還試水了疲勞駕駛檢測(cè)儀。這是針對(duì)交通行業(yè)的疲勞駕駛檢測(cè)智能硬件產(chǎn)品,它可以檢測(cè)用戶(hù)在開(kāi)車(chē)時(shí)是否存在危險(xiǎn)駕駛行為,并進(jìn)行語(yǔ)音提醒。
但疲勞駕駛檢測(cè)儀雖然是智能硬件產(chǎn)品,但并非面向C端,而是to B的產(chǎn)品。極限元將產(chǎn)品提供給一些客運(yùn)、貨運(yùn)、危險(xiǎn)品運(yùn)輸公司、保險(xiǎn)公司以及交通監(jiān)管部門(mén),在語(yǔ)音提醒司機(jī)正在危險(xiǎn)駕駛的同時(shí),還會(huì)將圖像、GPS、時(shí)間、車(chē)況、路況等信息傳輸給大數(shù)據(jù)平臺(tái),為用戶(hù)提供數(shù)據(jù)分析服務(wù)。
從行業(yè)到數(shù)據(jù)再到用戶(hù),這樣的閉環(huán),對(duì)于AI創(chuàng)業(yè)公司,是一個(gè)良性的模式。而這一切的出發(fā)點(diǎn),是對(duì)真實(shí)需求的挖掘?!艾F(xiàn)在人工智能面臨的問(wèn)題是閉門(mén)造車(chē),然后去市場(chǎng)上找對(duì)應(yīng)的客戶(hù),這樣是不對(duì)的?!弊鳛锳I領(lǐng)域的從業(yè)者、創(chuàng)業(yè)者,馬驥再次提醒著新入場(chǎng)者,“AI創(chuàng)業(yè)的外部條件比較有利,但是時(shí)機(jī)合適不合適還是看自身,有沒(méi)有針對(duì)行業(yè)的解決方案,能不能快速拿出可以真正落地的技術(shù)。”
手機(jī)掃碼閱讀