“星際迷航開(kāi)始探險(xiǎn)!”隨著一聲指令,飛船迅速作出響應(yīng),相位炮開(kāi)火,儲(chǔ)能,靠近……在最新一部《星際迷航》上映之際,智能移動(dòng)語(yǔ)音搜索Mobvoi創(chuàng)始人、CEO李志飛將這個(gè)同名語(yǔ)音操控游戲加載到新產(chǎn)品“出門問(wèn)問(wèn)”中,以此向科技致敬——《星際迷航》作為經(jīng)久不衰的科幻系列作品曾吸引無(wú)數(shù)狂熱的科技愛(ài)好者投身其中。視人工智能為終極目標(biāo)的谷歌曾以電視劇版《星際迷航》的配音演員瑪吉·巴瑞特·羅登貝利( Majel Barrett Roddenberry)的名字命名Google Now的前身產(chǎn)品;而從美國(guó)谷歌研究院辭職創(chuàng)業(yè)的李志飛則立志將其產(chǎn)品做成中文版的Google Now。
人工智能大潮正在來(lái)襲。 Google Now之于谷歌正如Siri之于蘋果、ViaVoice 之于IBM。以語(yǔ)音識(shí)別、語(yǔ)義理解為代表的語(yǔ)言分析技術(shù)領(lǐng)域正成為巨頭們的新角斗場(chǎng)。
人工智能(Artificial Intelligence)概念由來(lái)已久。早在上世紀(jì)五十年代,美國(guó)科學(xué)家企圖憑借計(jì)算機(jī)技術(shù)生產(chǎn)出一種與人類智能相似的智能機(jī)器。這些技術(shù)以人的器官感知為基礎(chǔ),而衍生出“看得到”的計(jì)算機(jī)視覺(jué)、“聽(tīng)得到”的語(yǔ)音識(shí)別、以“理解”為基礎(chǔ)的自然語(yǔ)言等。
科學(xué)家曾樂(lè)觀估計(jì)在計(jì)算機(jī)誕生后數(shù)年,人工智能即可實(shí)現(xiàn),但現(xiàn)實(shí)卻殘酷得多。時(shí)至今日即使計(jì)算機(jī)擁有相當(dāng)于人腦上億倍的運(yùn)算和存儲(chǔ)能力,人工智能仍遙遙無(wú)期。其難點(diǎn)在于如何訓(xùn)練一臺(tái)機(jī)器使其擁有人類的思考方式、思維邏輯甚至情感。
眼下自然語(yǔ)言以及語(yǔ)音研究的發(fā)展令人工智能曙光初現(xiàn)。具體而言,首先在不需要理解句子的前提下,機(jī)器要能將語(yǔ)音自動(dòng)準(zhǔn)確地轉(zhuǎn)化為文字;第二步需輔以邏輯、自我學(xué)習(xí)能力,使其正確理解語(yǔ)義并作出反饋。在PC時(shí)代,實(shí)現(xiàn)上述兩點(diǎn)非常困難。原因在于語(yǔ)言樣本收集非常復(fù)雜,這一過(guò)程不僅需要麥克風(fēng)等外部傳感器,還需耗費(fèi)專門的人力物力。
而移動(dòng)端的興起則能改變這一切。首先是硬件支撐,以往數(shù)據(jù)的采集多基于實(shí)驗(yàn)室內(nèi)安靜環(huán)境,而移動(dòng)環(huán)境下數(shù)據(jù)則來(lái)自四面八方,隨時(shí)隨地均可收集;其次,移動(dòng)場(chǎng)景下輸入輸出相對(duì)麻煩,用戶由此對(duì)語(yǔ)音的需求大大增強(qiáng);再次,人工智能算法需強(qiáng)大的計(jì)算能力,手機(jī)計(jì)算能力正得到大幅提升;第四則是人工智能系統(tǒng)依賴數(shù)據(jù)而生,移動(dòng)端所提供的海量數(shù)據(jù)可令機(jī)器模擬學(xué)習(xí)。
在搜狗副總裁茹立云看來(lái),語(yǔ)音技術(shù)的發(fā)展使得機(jī)器更加友好,人機(jī)對(duì)話也將大大改善交互體驗(yàn),而基于互聯(lián)網(wǎng)大數(shù)據(jù)形成的巨型知識(shí)庫(kù)則支持機(jī)器具備更完整的人類知識(shí)體系和邏輯推理能力。 “如果從用戶的角度來(lái)看,人工智能好像真的實(shí)現(xiàn)了一點(diǎn)兒。” 李志飛對(duì)《環(huán)球企業(yè)家》說(shuō),“雖然這離嚴(yán)格意義上的人工智能還差十萬(wàn)八千里?!?/p>
爆發(fā)
2010年,尚在美國(guó)工作的李志飛曾有這樣的經(jīng)歷:下班后太太讓買東西回家,沿途雖有超市卻并非時(shí)時(shí)開(kāi)門,他希望通過(guò)手機(jī)上網(wǎng)查詢其營(yíng)業(yè)情況,卻因開(kāi)車駕駛導(dǎo)致操作極不便。李志飛由此萌生了開(kāi)發(fā)說(shuō)話就能讓手機(jī)直接告知答案的工具。
這正是李的本行。畢業(yè)于約翰霍普金斯大學(xué)語(yǔ)言語(yǔ)音處理實(shí)驗(yàn)室(CLSP)的李志飛,其博士研究方向正是人工智能分支之一的機(jī)器翻譯領(lǐng)域。他曾是當(dāng)今世界兩大主流機(jī)器翻譯開(kāi)源軟件之一的約書(shū)亞(Joshua)的發(fā)明者。在李看來(lái),如果機(jī)器翻譯系統(tǒng)可完全替代人工翻譯,最終就有可能實(shí)現(xiàn)人工智能。博士畢業(yè)后,李志飛進(jìn)入谷歌研究院開(kāi)發(fā)谷歌翻譯(Google Translate)產(chǎn)品,其中一個(gè)具體項(xiàng)目正好與移動(dòng)相關(guān),即在不聯(lián)網(wǎng)的情況下將整個(gè)翻譯系統(tǒng)移植至手機(jī),最終避免網(wǎng)絡(luò)漫游等困擾。這一項(xiàng)目對(duì)其啟發(fā)頗多——以往數(shù)千臺(tái)機(jī)器同時(shí)運(yùn)算的系統(tǒng)如今可通過(guò)技術(shù)手段平移至手機(jī),從算法到存儲(chǔ)空間均可優(yōu)化,這使得人工智能在移動(dòng)時(shí)代能被充分挖掘。
早在2000年,李曾在南京創(chuàng)建從事手機(jī)上網(wǎng)的移軟,后者被美國(guó)Palm公司收購(gòu)。這一經(jīng)歷使其對(duì)創(chuàng)業(yè)興致頗濃。 2012年10月,在谷歌研究院工作兩年半后,李離開(kāi)硅谷回到中國(guó),創(chuàng)建聚焦智能移動(dòng)語(yǔ)音搜索公司Mobvoi,并在半年后發(fā)布首款基于微信平臺(tái)的語(yǔ)音語(yǔ)義交互應(yīng)用“出門問(wèn)問(wèn)”。 現(xiàn)在,如果你打開(kāi)微信對(duì)其提出各種問(wèn)題,例如“下周二從魔都到帝都南航最后一趟航班是哪班”,它都能給你全面準(zhǔn)確的回答。這一應(yīng)用在復(fù)雜語(yǔ)句處理方面有時(shí)甚至超過(guò)Siri、百度語(yǔ)音助手等產(chǎn)品。
雖然“出門問(wèn)問(wèn)”面臨科大訊飛、百度、騰訊、搜狗等勁敵,但同行間的競(jìng)爭(zhēng)優(yōu)勢(shì)并不相同。科大訊飛優(yōu)勢(shì)在語(yǔ)音識(shí)別,即將帶有方言、噪音的語(yǔ)言轉(zhuǎn)化為文本,其準(zhǔn)確率可達(dá)85%甚至更高。百度、搜狗的優(yōu)勢(shì)則在于基于搜索所積累的大量數(shù)據(jù),以此幫助機(jī)器完成語(yǔ)義理解,進(jìn)而對(duì)用戶作出反饋,這正是自然語(yǔ)言理解的第二步。而將上述機(jī)器理解的關(guān)鍵詞放到具體的應(yīng)用里去搜索查詢用戶想要的內(nèi)容,將表格再轉(zhuǎn)化為內(nèi)容是第三步,在此過(guò)程中需要更多數(shù)據(jù)源支持,比如包含知識(shí)庫(kù)的維基百科、社交為內(nèi)容的facebook、海量購(gòu)物信息的淘寶、O2O領(lǐng)域的大眾點(diǎn)評(píng)網(wǎng)、去哪兒網(wǎng)等數(shù)據(jù)。以上述數(shù)據(jù)為依托,可產(chǎn)生滿足用戶需求的內(nèi)容和應(yīng) 用。
李志飛想做的正是以語(yǔ)義理解為核心優(yōu)勢(shì)、以O(shè)2O方向?yàn)橹鞯拇怪睉?yīng)用。在擁有強(qiáng)大算法的前提下,出門問(wèn)問(wèn)的訓(xùn)練數(shù)據(jù)可能比百度少很多,但五六百個(gè)數(shù)據(jù)庫(kù)就能將整個(gè)系統(tǒng)做得很好。出門問(wèn)問(wèn)以開(kāi)發(fā)和使用工具見(jiàn)長(zhǎng),并支持新應(yīng)用的語(yǔ)義分析,進(jìn)而提升準(zhǔn)確率。例如在應(yīng)用中接入新的查詢內(nèi)容“電影院”、“景點(diǎn)門票”或時(shí)令性的“星際迷航游戲”只需要耗費(fèi)一個(gè)工程師1-2天時(shí)間。 此外在數(shù)據(jù)分析和積累方面,出門問(wèn)問(wèn)亦可能顛覆以往的巨頭。以谷歌為例,其語(yǔ)音識(shí)別系統(tǒng)在短短兩年時(shí)間內(nèi)就超越最早提出算法的IBM,原因就在于谷歌的互聯(lián)網(wǎng)基因,在云計(jì)算方面優(yōu)勢(shì)顯著。出門問(wèn)問(wèn)在一開(kāi)始則鎖定移動(dòng)互聯(lián)網(wǎng),并以此為基因則使其更具有針對(duì)性和專項(xiàng)性。
為了在語(yǔ)音識(shí)別、語(yǔ)義理解的精準(zhǔn)度上比肩谷歌等超級(jí)巨頭,李志飛向《環(huán)球企業(yè)家》透露秘訣在于做窄,即不像Siri那樣大而全,不搞娛樂(lè)化,專門針對(duì)O2O領(lǐng)域;第二則是做深,即針對(duì)一個(gè)問(wèn)題力爭(zhēng)所有維度都能覆蓋,比如回答“附近人均50元以內(nèi)有wifi有停車場(chǎng)的川菜館”此類細(xì)致的問(wèn)題。
為了實(shí)現(xiàn)人工智能,以語(yǔ)義見(jiàn)長(zhǎng)的李志飛注意走捷徑。在基礎(chǔ)語(yǔ)音識(shí)別部分,出門問(wèn)問(wèn)的技術(shù)就來(lái)自于谷歌以及一家只有數(shù)十人的本土創(chuàng)業(yè)公司云知聲。后者在短短一年時(shí)間內(nèi), 就已在技術(shù)水平上能與科大迅飛并駕齊驅(qū),并受到諸多互聯(lián)網(wǎng)公司和個(gè)人開(kāi)發(fā)者的關(guān)注。
云知聲最早出現(xiàn)在公眾面前是在2012年11月,其獨(dú)家支持的搜狗語(yǔ)音助手發(fā)布備受矚目。今年3月,在錘子ROM手機(jī)發(fā)布會(huì)上,云知聲再次名列其中。此前錘子ROM在語(yǔ)音方面選擇的合作對(duì)象是科大訊飛,但在距發(fā)布會(huì)僅一周時(shí),雙方的合作仍未能推進(jìn)。情急之下,云知聲則為羅永浩提供了解決方案。雖然該方案在英文識(shí)別上略遜于科大訊飛,對(duì)于錘子ROM而言卻堪稱雪中送炭之舉。此后5月,在LeTV樂(lè)視超級(jí)電視發(fā)布會(huì)上,云知聲悄然現(xiàn)身,為其量身定制了一套面向智能電視的語(yǔ)音助手。藉此,樂(lè)視TV完全實(shí)現(xiàn)語(yǔ)音遙控。 云知聲的出現(xiàn)已改變了以往在語(yǔ)音領(lǐng)域,用戶只能唯科大訊飛馬首是瞻的局面,并再度激發(fā)同業(yè)間的競(jìng)爭(zhēng)。
與訊飛類似,梁家恩亦是“科大系”。 2001年梁畢業(yè)于中國(guó)科技大學(xué),進(jìn)入中科院自動(dòng)化所碩博連讀,專攻語(yǔ)音識(shí)別。而科大訊飛成立于1999年,當(dāng)時(shí)正讀本科的梁家恩見(jiàn)證了科大訊飛的迅猛發(fā)展。2008年前,科大迅飛和捷通華聲主要聚焦在語(yǔ)音合成領(lǐng)域,即“把文本用機(jī)器念出來(lái)”。而 2008年后,科大訊飛借助移動(dòng)互聯(lián)網(wǎng)開(kāi)始在語(yǔ)音識(shí)別領(lǐng)域一支獨(dú)秀。這給了梁很大啟發(fā)?;谠谡Z(yǔ)音領(lǐng)域的多年積累,他決定帶領(lǐng)團(tuán)隊(duì)創(chuàng)業(yè)。
2012年初,梁家恩帶著一批擁有十年以上從業(yè)經(jīng)驗(yàn)的同仁向語(yǔ)音識(shí)別領(lǐng)域挺進(jìn)。雖然前有科大訊飛、百度,后有騰訊、搜狗等競(jìng)爭(zhēng)者,但云知聲卻擁有最核心最稀缺的人才優(yōu)勢(shì)。僅數(shù)月后,云知聲語(yǔ)音云平臺(tái)就已完成。更令梁家恩得意的是目前最火熱的深度神經(jīng)網(wǎng)絡(luò)(DNN)技術(shù),微軟需要數(shù)百臺(tái)機(jī)器集群才能完成,其團(tuán)隊(duì)卻能在不到三個(gè)月內(nèi)就全部完成,而其所用的全部部件竟是團(tuán)隊(duì)淘寶DIY而成,總投入不到十萬(wàn)元。在DNN系統(tǒng)上線后僅四個(gè)月,云知聲就對(duì)系統(tǒng)進(jìn)行重大升級(jí),效率提升幅度達(dá)30%以上。
云知聲的優(yōu)勢(shì)還在于在識(shí)別能力業(yè)內(nèi)領(lǐng)先的情況下,其反應(yīng)速度可比競(jìng)爭(zhēng)者快二至三倍。例如一般機(jī)器處理一秒鐘語(yǔ)音需要0.6-0.8秒,云知聲可達(dá)0.2秒。如此可大大提升用戶體驗(yàn),并降低服務(wù)成本。梁家恩認(rèn)為如此并無(wú)捷徑,主要靠經(jīng)驗(yàn)?!八惴ê拖到y(tǒng)原理其實(shí)沒(méi)有差異,學(xué)術(shù)論文也可以找到,但是即便你知道這個(gè)原理,能做好是另外一回事。就像大家都知道手機(jī)怎么做,但有人做出的是蘋果、三星,有的是山寨機(jī)。” 梁家恩解釋說(shuō)。
隨著移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,梁家恩認(rèn)為在智能語(yǔ)音領(lǐng)域,云知聲還將擁抱諸多可能。第一是為開(kāi)發(fā)者提供基礎(chǔ)的語(yǔ)音云服務(wù),即完全開(kāi)放和永久免費(fèi)的語(yǔ)音平臺(tái);二是為手機(jī)、電視、可穿戴產(chǎn)品、玩具等智能設(shè)備提供解決方案;三是為口語(yǔ)學(xué)習(xí)、智能客服、醫(yī)療等傳統(tǒng)行業(yè)提供智能化解決方案,在國(guó)外客服系統(tǒng)智能化已超過(guò)30%,而國(guó)內(nèi)才剛剛起步。在英語(yǔ)學(xué)習(xí)領(lǐng)域,通過(guò)人工智能可提供機(jī)器對(duì)話、機(jī)器打分等新服務(wù)。
試圖在語(yǔ)音識(shí)別領(lǐng)域淘金的創(chuàng)業(yè)者不僅包括梁家恩,還包括靈聲信息科技有限公司創(chuàng)始人、CEO吳義堅(jiān)。雖然今年只有32歲,但吳已是中國(guó)智能語(yǔ)音領(lǐng)域的“前輩”。吳15歲考入中國(guó)科技大學(xué)少年班,25歲獲得博士學(xué)位。博士期間,他在創(chuàng)立科大訊飛的電子工程與信息科學(xué)系教授、博士生導(dǎo)師王仁華帶領(lǐng)下,進(jìn)行訊飛語(yǔ)音技術(shù)的研發(fā)工作,成為科大迅飛的早期骨干員工之一。之后,吳義堅(jiān)還進(jìn)入微軟亞洲研究院、日本名古屋工業(yè)大學(xué)等國(guó)內(nèi)外頂尖語(yǔ)音機(jī)構(gòu)就職和學(xué)習(xí)。在從事語(yǔ)音技術(shù)研發(fā)的近12年間,他獲得了多項(xiàng)語(yǔ)音產(chǎn)品的專利。
2012年7月,吳義堅(jiān)加入盛大創(chuàng)新院任語(yǔ)音創(chuàng)新院院長(zhǎng),幾個(gè)月后,其項(xiàng)目從盛大獨(dú)立出來(lái),他亦從大公司的領(lǐng)導(dǎo)者變成創(chuàng)業(yè)者。為了繼續(xù)在語(yǔ)音領(lǐng)域精耕細(xì)作,他一方面穩(wěn)住團(tuán)隊(duì),另一方面則開(kāi)始思考如何將人工智能真正落實(shí)到產(chǎn)品層面。
在谷歌公布的一組數(shù)據(jù)中顯示,2012年北美移動(dòng)端搜索量超過(guò)40%來(lái)自語(yǔ)音,這令吳看到語(yǔ)音技術(shù)應(yīng)用的商業(yè)價(jià)值。他決定做兩件事,一是依靠過(guò)去十余年積累的語(yǔ)音基數(shù)積累,打造語(yǔ)音平臺(tái),二是完成一系列B2B、B2C的應(yīng)用。
在吳義堅(jiān)看來(lái),從事語(yǔ)音領(lǐng)域的應(yīng)用開(kāi)發(fā),沒(méi)有獨(dú)立的語(yǔ)音系統(tǒng)將受制于語(yǔ)音提供商,后者提供的通用語(yǔ)音平臺(tái)的準(zhǔn)確率一般在90%左右。若通過(guò)定制細(xì)分領(lǐng)域的語(yǔ)音平臺(tái),其準(zhǔn)確率可達(dá)95%甚至更高,因此擁有自己的語(yǔ)音技術(shù)平臺(tái)十分重要。此外,研發(fā)必須深入B2C業(yè)務(wù),細(xì)分方向在于服務(wù)于老人的電話助手、針對(duì)幼兒教育的娛樂(lè)助手、游戲助手、醫(yī)療助手等。 而在B2B業(yè)務(wù)上,智能家電、呼叫中心、車載等領(lǐng)域的語(yǔ)音應(yīng)用將是大勢(shì)所趨,吳認(rèn)為這正是靈聲科技的營(yíng)收重點(diǎn)。
如今,百度、搜狗、騰訊、阿里巴巴、 聯(lián)想、華為等公司均在智能語(yǔ)音領(lǐng)域攻城略地,靈聲科技亦與上述公司合作?!袄щy在于這些公司不太可能真的深度合作,他們不希望語(yǔ)音卡在第三方手上?!眳橇x堅(jiān)對(duì)《環(huán)球企業(yè)家》說(shuō)。對(duì)于聯(lián)想、華為等新進(jìn)入者來(lái)說(shuō),困難在于若想從零開(kāi)始,通常需要在技術(shù)和數(shù)據(jù)的積累上至少兩年,技術(shù)研發(fā)的投入亦很昂貴。此外,最大的阻力還在于人才稀缺。創(chuàng)業(yè)公司經(jīng)常被迫面對(duì)大公司的挖角,還有經(jīng)常被侵害的知識(shí)產(chǎn)權(quán)。因此,想活下去必須“跑得 快”。
進(jìn)化
人工智能在近幾年出現(xiàn)革命性變化,除了移動(dòng)互聯(lián)網(wǎng)的崛起外,最重要的推動(dòng)力在于大數(shù)據(jù)的興起。以云知聲為例,它需要大量的語(yǔ)音語(yǔ)料來(lái)支持語(yǔ)音識(shí)別算法,這在以往很難做到。圖像、文本領(lǐng)域亦是如此,只有建立一個(gè)全面而深入的數(shù)據(jù)庫(kù),才能讓機(jī)器更加聰明成為可能。
數(shù)據(jù)堂科技有限公司共同創(chuàng)始人、總經(jīng)理齊紅威曾在NEC工作八年,他發(fā)現(xiàn)公司每年都要耗費(fèi)重金進(jìn)行數(shù)據(jù)分析處理。如果外包給散戶,往往不夠?qū)I(yè),而招大批實(shí)習(xí)生則成本高,管理復(fù)雜。如此,專業(yè)數(shù)據(jù)外包的需求應(yīng)運(yùn)而生。
齊紅威畢業(yè)于中科院自動(dòng)化所,博士論文正是人工智能機(jī)器學(xué)習(xí)。2011年8月底,在市場(chǎng)需求驅(qū)動(dòng)下,他決心和幾個(gè)伙伴創(chuàng)辦數(shù)據(jù)堂,在人工智能的范疇下提供不同數(shù)據(jù)層面的服務(wù)。這被其稱為“數(shù)據(jù)外包2.0”。其核心是在大數(shù)據(jù)背景下進(jìn)行不同領(lǐng)域的數(shù)據(jù)處理和數(shù)據(jù)挖掘。
以圖像數(shù)據(jù)采集加工為例,佳能希望通過(guò)相機(jī)對(duì)焦框讓人臉曝光更充分,為了滿足這個(gè)功能,數(shù)據(jù)堂就要為其處理數(shù)十萬(wàn)張圖片,包括采集不同場(chǎng)景、膚色、年齡段、以及不同表情的人臉圖片,繼而進(jìn)行全方位的圖像標(biāo)注。
聲音亦是如此,比如出門問(wèn)問(wèn)通過(guò)用戶獲取大量原始聲音素材(即生語(yǔ)料),但這些數(shù)據(jù)本身不能使用。數(shù)據(jù)堂就要為其進(jìn)行人工處理和標(biāo)注,例如有無(wú)噪音、口音、性別等,形成可自動(dòng)理解和訓(xùn)練的基礎(chǔ)數(shù)據(jù),并以這些語(yǔ)料去組建訓(xùn)練模型。
數(shù)據(jù)分析挖掘則是另一個(gè)領(lǐng)域。這項(xiàng)業(yè)務(wù)主要面向移動(dòng)、汽車、電子商務(wù)等廠商,這也是數(shù)據(jù)堂的核心業(yè)務(wù)。比如,汽車廠商想要調(diào)研用戶對(duì)不同車型的口碑,包括剎車、油耗、外觀、內(nèi)飾等方面,以往只能通過(guò)問(wèn)卷進(jìn)行,并且需要大量取樣。而數(shù)據(jù)堂則可以通過(guò)網(wǎng)絡(luò)“爬蟲(chóng)”潛入到各大汽車論壇、貼吧,抓取相關(guān)帖子,用程序分析用戶的語(yǔ)言。比如“XX車漆有點(diǎn)軟,一次倒車碰到樹(shù)就出了劃痕。”機(jī)器即可據(jù)此識(shí)別出用戶所提的汽車品牌、車型、配置、用戶情緒等。
針對(duì)數(shù)據(jù)處理,數(shù)據(jù)堂在南京、鎮(zhèn)江、蘇州建立三個(gè)數(shù)據(jù)基地,員工近500人。百度、NEC、英特爾、佳能、聯(lián)想、三星、IBM、騰訊等均是其合作伙伴。通過(guò)處理越多數(shù)據(jù),數(shù)據(jù)堂就能形成更大的數(shù)據(jù)庫(kù)?;诖耍讷@得用戶授權(quán)后,數(shù)據(jù)堂就能通過(guò)數(shù)據(jù)出售的方式,縮短客戶數(shù)據(jù)累積的時(shí)間。
完成這一過(guò)程并非一蹴而就,齊紅威就已耗費(fèi)了十年時(shí)間?!皵?shù)據(jù)是一種資源,與石油、煤炭一樣,在開(kāi)采之前產(chǎn)生不了價(jià)值。只有人把他開(kāi)采或凝練出來(lái),才能發(fā)揮價(jià)值。我做的就是這么個(gè)事情?!饼R紅威告訴《環(huán)球企業(yè)家》。
齊紅威在讀書(shū)期間曾經(jīng)歷人工智能的研究高潮,但這一領(lǐng)域曾在2004至2009年間陷入低迷——很多科研工作室做了不少產(chǎn)品,但都不能解決實(shí)際問(wèn)題。但如今世界正在發(fā)生變化,數(shù)以萬(wàn)計(jì)的語(yǔ)音積累令語(yǔ)音識(shí)別的精度產(chǎn)生了很大飛躍 ?!拔覀€(gè)人判斷未來(lái)五年,人工智能會(huì)有一個(gè)質(zhì)的變化。大數(shù)據(jù)將造就了新一代人工智能?!饼R紅威對(duì)《環(huán)球企業(yè)家》說(shuō)。
事實(shí)上,在個(gè)人創(chuàng)業(yè)之外,以語(yǔ)音語(yǔ)義為代表的人工智能已成為中國(guó)互聯(lián)網(wǎng)公司的標(biāo)準(zhǔn)配置。搜狗副總裁茹立云對(duì)《環(huán)球企業(yè)家》稱在語(yǔ)音方面,利用深度學(xué)習(xí)技術(shù)改進(jìn)的聲學(xué)模型和語(yǔ)言模型已使搜狗語(yǔ)音識(shí)別精度得到明顯改善。百度亦是深度學(xué)習(xí)技術(shù)的獲益者,百度語(yǔ)音識(shí)別的錯(cuò)誤率曾藉此降低了20%-30%。在語(yǔ)義方面,互聯(lián)網(wǎng)大數(shù)據(jù)的深入挖掘可使得知識(shí)庫(kù)不斷更新,而人工智能未來(lái)的發(fā)展方向在于在特定應(yīng)用領(lǐng)域?qū)φZ(yǔ)音語(yǔ)義識(shí)別進(jìn)行整合優(yōu)化。
語(yǔ)音功能的提升亦帶動(dòng)搜索市場(chǎng)的發(fā)展。2002年初,百度語(yǔ)音搜索占移動(dòng)搜索的流量?jī)H為1%,但到2012年底,這一數(shù)字已升至8%,預(yù)計(jì)今年會(huì)達(dá)到20%。此外,百度基于互聯(lián)網(wǎng)搜索上的優(yōu)勢(shì)也將得到發(fā)揮?!拔覀兊恼Z(yǔ)音團(tuán)隊(duì)在很短時(shí)間里能夠迅速地達(dá)到業(yè)界一流水平?;ヂ?lián)網(wǎng)公司的最大優(yōu)勢(shì)在于大數(shù)據(jù),特別是以技術(shù)主導(dǎo)、技術(shù)驅(qū)動(dòng)的搜索公司有‘基因優(yōu)勢(shì)’。”百度多媒體總監(jiān)余凱對(duì)《環(huán)球企業(yè)家》說(shuō)。
不過(guò),若想挑戰(zhàn)半個(gè)世紀(jì)前就涉足人工智能領(lǐng)域研究的美國(guó),中國(guó)仍有很長(zhǎng)的路要走。吳義堅(jiān)向《環(huán)球企業(yè)家》透露國(guó)內(nèi)真正了解語(yǔ)音技術(shù)、并能實(shí)際進(jìn)行技術(shù)研發(fā)的人才不足百人。此外,中文智能語(yǔ)音研究領(lǐng)域仍有諸多困難尚待克服?!皯?yīng)用領(lǐng)域上最大的技術(shù)壁壘是如何更好的整合語(yǔ)音識(shí)別與語(yǔ)義分析。此外,如何對(duì)不常見(jiàn)的‘長(zhǎng)尾表達(dá)’的語(yǔ)音和語(yǔ)義分析效果進(jìn)行提升,亦是尚存的難點(diǎn)?!比懔⒃茖?duì)《環(huán)球企業(yè)家》說(shuō)。