朱勝收藏了庫(kù)布里克執(zhí)導(dǎo)的全套電影。其中一部《2001:A Space Odssey》(中文譯名《2001太空漫游》),講述了探索太空奧秘的故事。太空飛船上的超級(jí)智能計(jì)算機(jī)“Hal”讓所有人印象深刻,它可以聽(tīng)懂人類(lèi)的語(yǔ)言,有自主行動(dòng)的能力,而且還有類(lèi)似于人類(lèi)的感情,會(huì)憤怒也會(huì)耍詭計(jì)。朱勝認(rèn)為,Hal象征著人類(lèi)對(duì)“人工智能”(Artificial Intelligence)最早的憧憬。
他創(chuàng)業(yè)七年,一直圍繞著人工智能轉(zhuǎn)。中國(guó)科技大學(xué)畢業(yè),又于1997年碩士畢業(yè)于斯坦福大學(xué)計(jì)算機(jī)系的朱勝,留在硅谷工作期間,就看到了美國(guó)人對(duì)人工智能的追求。2004年他回國(guó)創(chuàng)業(yè),上海智問(wèn)軟件技術(shù)有限公司(下簡(jiǎn)稱(chēng)“智問(wèn)”)是他的第二家公司,剛剛獲得了蘇創(chuàng)投等機(jī)構(gòu)的1000萬(wàn)元投資。
2011年底,蘋(píng)果iPhone 4S上的語(yǔ)音功能軟件Siri出現(xiàn),此時(shí)他正在埋頭攻克“語(yǔ)音識(shí)別”這一關(guān)。“人工智能世界研究了60年,一直沒(méi)有爆發(fā)行業(yè)。Siri喚起了人們的激情:朝著人工智能這個(gè)最終方向,還是有可行性的?!?/p>
Siri只是引路者
Siri是蘋(píng)果在iPhone 4S上加入的一項(xiàng)語(yǔ)音控制功能,可以提供對(duì)話(huà)式的應(yīng)答,通過(guò)手機(jī)讀短信、介紹餐廳、詢(xún)問(wèn)天氣,或調(diào)用系統(tǒng)自帶的天氣預(yù)報(bào)、日程安排等應(yīng)用。為此,朱勝仔細(xì)分析過(guò):Siri是第一個(gè)全球大范圍商業(yè)化實(shí)施的人工智能應(yīng)用,也是一個(gè)巧妙的切入點(diǎn)——它只做手機(jī)上的應(yīng)用控制,如打電話(huà)、發(fā)短信、找周邊餐館和旅店,本身并不復(fù)雜,很容易實(shí)現(xiàn)。
不過(guò),他并不想成為又一個(gè)Siri。2005年他第一次創(chuàng)業(yè),項(xiàng)目是企業(yè)智能管理,利用文字識(shí)別技術(shù)建立內(nèi)部知識(shí)庫(kù),軟件面向美國(guó)企業(yè);2008年金融危機(jī),他把市場(chǎng)轉(zhuǎn)向國(guó)內(nèi),開(kāi)始為國(guó)內(nèi)公司做語(yǔ)義分析服務(wù)。他的客戶(hù)是當(dāng)時(shí)正在茁壯成長(zhǎng)的一批中國(guó)公司:電商類(lèi)如淘寶、當(dāng)當(dāng),服務(wù)類(lèi)有如家、攜程、7天。智問(wèn)為它們提供客服機(jī)器人,例如淘寶的“淘小二”,當(dāng)當(dāng)?shù)摹靶‘?dāng)當(dāng)”,協(xié)助內(nèi)部客服與坐席人員處理客服問(wèn)題。
坐在后臺(tái),看著智問(wèn)出品的客服機(jī)器人一個(gè)個(gè)上線(xiàn),他得到了另一個(gè)啟發(fā):在中國(guó),很多人的生活都很空閑,“簡(jiǎn)直是花大量時(shí)間‘泡’淘小二”!
直到2011年,客戶(hù)建議,現(xiàn)在移動(dòng)互聯(lián)網(wǎng)這么火爆,能不能出一些手機(jī)版本?其中有人還提到了對(duì)語(yǔ)音的識(shí)別。
他馬上著手研發(fā)。Siri雖然有劃時(shí)代的意義,但是被罵得很兇,因?yàn)榛卮馃o(wú)法臻于完美,老百姓的胃口被吊起來(lái)了,期望值又出奇地高。沿著這個(gè)邏輯,朱勝找到了兩個(gè)出路:走“高精尖”路線(xiàn),把語(yǔ)義識(shí)別做到更好;另一條路,將“擬人化”與“個(gè)性化”結(jié)合,把它變成平臺(tái)或工具,開(kāi)放給所有人,給每個(gè)人定制一個(gè)Siri。
實(shí)際上,Siri會(huì)將一些知識(shí)性問(wèn)題推給語(yǔ)義搜索引擎Wolfram Alpha,它是朱勝心中語(yǔ)義識(shí)別技術(shù)的頂級(jí)高手,但都難以做到完美。所以他選擇了第二條路——讓每個(gè)人擁有適合自己的Siri。他在網(wǎng)站宣傳頁(yè)上寫(xiě)道:“定制太貴,編輯太難?!敝菃?wèn)已有的技術(shù)、系統(tǒng)以及知識(shí)庫(kù)可以支撐這種開(kāi)發(fā)。
新產(chǎn)品即將以移動(dòng)端App的形式上線(xiàn)。它首先會(huì)滿(mǎn)足蘋(píng)果帶起來(lái)的各種基礎(chǔ)功能,然后通過(guò)機(jī)主的配置以及日積月累的問(wèn)答行為來(lái)推斷機(jī)主的提問(wèn)方式、使用習(xí)慣,甚至識(shí)別音調(diào)并感知情緒。頁(yè)面打開(kāi),機(jī)主可以看到自己感興趣的10件事情,例如炒股的主人對(duì)手機(jī)喊聲“看股票”,就可以看到自己手里的那幾只股票。為了避免隱私問(wèn)題,智問(wèn)堅(jiān)持不抓取信息,只做被動(dòng)接收。
產(chǎn)品的很多特征脫離了人工智能最忠實(shí)的追隨者——美國(guó)人的風(fēng)格,而是完全中國(guó)化。外國(guó)人喜歡簡(jiǎn)潔頁(yè)面,提問(wèn)嚴(yán)肅,就事論事;中國(guó)人酷愛(ài)逗貧,喜歡鮮明對(duì)比的顏色。智問(wèn)的機(jī)器人取名“笨笨”,是個(gè)小孩的聲音,不是Siri的“成熟女性”。它除了幫忙還會(huì)為機(jī)主找流行歌,如果你無(wú)聊時(shí)和笨笨打趣“有沒(méi)有打醬油的歌”,它會(huì)直接回答你“慢走”。
一系列部署還沒(méi)有結(jié)束。智問(wèn)會(huì)與垂直內(nèi)容提供商,例如論壇版主等進(jìn)行合作,做成具有語(yǔ)音識(shí)別功能的推廣App。智問(wèn)的技術(shù)可以用于眾多領(lǐng)域,而這本身也在幫助智問(wèn)積累知識(shí)庫(kù)。
“我們離Siri越來(lái)越遠(yuǎn)了。我希望做全方位服務(wù),Siri來(lái)開(kāi)頭,我們來(lái)結(jié)尾?!?/p>
堅(jiān)持做“技術(shù)提供商”
目前智問(wèn)擁有三塊業(yè)務(wù):智能客服,手機(jī)助理和語(yǔ)義開(kāi)放平臺(tái)。智能客服是盈利重點(diǎn),客戶(hù)可以“領(lǐng)養(yǎng)”一個(gè)自己的機(jī)器人,其中嵌入一部分同行業(yè)積累的通用信息;下一步相當(dāng)于“二次開(kāi)發(fā)”,智問(wèn)將其稱(chēng)作“培訓(xùn)”,即讓客服人員不停地在上面自問(wèn)自答,或者提問(wèn)給系統(tǒng),有錯(cuò)誤再更正,組成一系列問(wèn)答形式的知識(shí)條。朱勝記得,當(dāng)當(dāng)網(wǎng)在兩周時(shí)間內(nèi)就把“小當(dāng)當(dāng)”快速培訓(xùn)完畢上線(xiàn),里面囊括了上萬(wàn)個(gè)問(wèn)題。
除智能客服之外,與一些定制產(chǎn)品合作方如電信的分成、平臺(tái)軟件服務(wù)方等都可以提供收入,面向大眾的App只要擁有流量,還可以通過(guò)廣告來(lái)變現(xiàn)。
不過(guò),此時(shí)Siri的追隨者已經(jīng)跟過(guò)來(lái)了。在2012年創(chuàng)新中國(guó)上海分賽上,共有三家語(yǔ)音識(shí)別類(lèi)企業(yè)同場(chǎng)角逐。
大家各自戰(zhàn)略不同,但現(xiàn)階段都在做技術(shù)儲(chǔ)備?!伴L(zhǎng)久來(lái)看,我們是個(gè)技術(shù)提供商,有自己的收入,短期內(nèi)利潤(rùn)不太高,”朱勝對(duì)自己在行業(yè)中的角色很重視,“如果只是做某個(gè)應(yīng)用,會(huì)發(fā)現(xiàn)騰訊懸在上面,一旦微信模仿Siri,大家的技術(shù)即使再超越Siri也無(wú)處可用;用戶(hù)體驗(yàn)看似是門(mén)檻,但這東西又是沒(méi)有壁壘的?!?/p>
蘋(píng)果的確給了大家最好的時(shí)機(jī)。“我不會(huì)花1億美元做推廣,而蘋(píng)果花了幾億?!敝靹倏催^(guò)一個(gè)美國(guó)脫口秀欄目,主持人手持蘋(píng)果手機(jī),問(wèn)Siri“今天天氣怎樣”,Siri回答“你這個(gè)蠢貨,看看窗外就知道了”。
“其實(shí)Siri不會(huì)這么回答,明顯是蘋(píng)果請(qǐng)節(jié)目來(lái)炒作的,你知道蘋(píng)果公司有多聰明了吧?我越發(fā)堅(jiān)信我們的運(yùn)氣不錯(cuò),方向找對(duì)了?!?/p>
在攻克文字與語(yǔ)音識(shí)別的同時(shí),他也完成了對(duì)“語(yǔ)義識(shí)別”的過(guò)渡。這不僅是抽取“關(guān)鍵詞”,而是判斷出對(duì)方的問(wèn)法,例如省略、倒裝等,舉一反三地解答、追問(wèn)或聯(lián)想。它就像各類(lèi)識(shí)別的地基:懂得語(yǔ)義后,所有服務(wù)將跨越一層臺(tái)階。
“它的原理很符合一個(gè)詞——知識(shí)?!荎nowing,知道答案;‘識(shí)’是Recognition,不知道答案,但知道你問(wèn)的是什么。這很重要。為了達(dá)到語(yǔ)義識(shí)別,我們需要用‘識(shí)’來(lái)把‘知’整理好?!彼J(rèn)為這個(gè)過(guò)程很難,需要反復(fù)去粗取精,“我把它稱(chēng)為‘雞尾酒技術(shù)’?!?/p>
“語(yǔ)義識(shí)別”技術(shù)繼續(xù)往前延伸將達(dá)到“語(yǔ)義搜索”,谷歌正在研發(fā)中。通過(guò)這項(xiàng)技術(shù),谷歌將向用戶(hù)提供“猜測(cè)的”搜索結(jié)果,如果搜索一個(gè)城市,會(huì)將城市形態(tài)、特征、發(fā)展歷史直接顯示出來(lái)?!澳菍⑿枰⒏蟮摹⒎墙Y(jié)構(gòu)化的庫(kù),打復(fù)雜的標(biāo)簽,花很多時(shí)間去整理,這就是所謂的Web3.0。有一天它會(huì)融入日常生活中。”朱勝說(shuō)。