本文是科大訊飛副總裁江濤口述實(shí)錄??拼笥嶏w的創(chuàng)業(yè)經(jīng)歷,是個(gè)典型的中國(guó)技術(shù)創(chuàng)業(yè)故事。從技術(shù)到商業(yè),從實(shí)驗(yàn)室到市場(chǎng)……這個(gè)故事提供了一個(gè)路徑樣本,也是那 10 年本土技術(shù)商業(yè)史的一個(gè)側(cè)影。
訊飛前傳
訊飛的前傳離不開“人機(jī)語音通信實(shí)驗(yàn)室”,這是中科大六系(也就是電子工程系)的實(shí)驗(yàn)室,八幾年就成立了,導(dǎo)師叫王仁華,是中國(guó)語音界非常有名的泰斗級(jí)老教授。九十年代,國(guó)內(nèi)做語音都會(huì)首推“二王”,南邊是王仁華教授,北邊是清華大學(xué)的王作英教授。
我是1993年進(jìn)科大的,當(dāng)時(shí)科大的學(xué)生都管導(dǎo)師叫“老板”,因?yàn)樗麄兌几蠋熢谕膺吔踊钭鲰?xiàng)目(注:時(shí)代背景為知識(shí)分子到校外私企的打工經(jīng)商潮)。
王老師跟其他的“老板”差別在什么地方呢?這個(gè)實(shí)驗(yàn)室也在外面接活,也給大家發(fā)點(diǎn)小錢,但除了有一撥人接活掙點(diǎn)小錢之外,他還保留了一支相當(dāng)精銳的部隊(duì),做國(guó)內(nèi)最前沿的基礎(chǔ)研究,就是語音合成、語音識(shí)別編解碼相關(guān)的研究;第二個(gè)不同是,他不像大部分的老板——論文出來了自己的名字寫在第一個(gè),然后才是學(xué)生的。在王老師這里,這個(gè)模式如果是你先做的,就把你的名字寫在第一個(gè),把年輕人推出去。
慶峰1990年進(jìn)科大,到大五已經(jīng)是非常強(qiáng)的主力骨干了。王老師把他的學(xué)生分成兩撥,一撥是掙錢的,一撥是搞研究的,劉慶峰就是搞研究的頭——雖然只是五年級(jí)的本科生。
1998年,在國(guó)家863比賽中,慶峰牽頭拿了第一名,當(dāng)時(shí)主要聚焦在語音合成技術(shù)。863對(duì)語音合成技術(shù)的評(píng)測(cè)標(biāo)準(zhǔn)是:播音員的標(biāo)準(zhǔn)是5分,普通人發(fā)音是4分,3分是可以接受不反感。當(dāng)時(shí),在國(guó)家 863多少年的比賽中,第一次有了3.0分,就是科大的代表隊(duì)。當(dāng)時(shí)一起參賽的還有很多代表隊(duì),比如清華、北大等等。
這個(gè)獎(jiǎng)也給慶峰很大的鼓舞,覺得應(yīng)該做點(diǎn)什么,把這個(gè)研究成果進(jìn)一步產(chǎn)業(yè)化。當(dāng)時(shí)李開復(fù)在微軟中國(guó)擔(dān)任副總裁(注:1998年7月,李開復(fù)在中國(guó)創(chuàng)建并領(lǐng)導(dǎo)微軟中國(guó)研究院,現(xiàn)為微軟亞洲研究院),準(zhǔn)備把微軟獎(jiǎng)學(xué)金給慶峰,但這個(gè)獎(jiǎng)學(xué)金是有條件的,必須到微軟做一個(gè)月的研究。當(dāng)時(shí)慶峰已經(jīng)準(zhǔn)備創(chuàng)業(yè)了,就說沒法去一個(gè)月,后來微軟的條件一降再降,最后降到過來兩周也行,但他最后還是拒絕了。十幾年之后,一次訊飛語音云開發(fā)者大會(huì),李開復(fù)也到了現(xiàn)場(chǎng),我們邀請(qǐng)他的時(shí)候,他很感慨地說,慶鋒是這么多年來唯一拒絕過微軟獎(jiǎng)學(xué)金的人。
當(dāng)時(shí)還有一個(gè)背景,國(guó)外IT巨頭紛紛開始涉足中文,1998年,IBM發(fā)布了語音系統(tǒng),翌年被評(píng)為科技界十件大事之一。第一次在電腦上不用鍵盤就可以輸入,大家都覺得這是一個(gè)很革命性的事情。在IBM影響下,英特爾、摩托羅拉、東芝等國(guó)外IT巨頭都建立了語音研發(fā)中心,當(dāng)時(shí)科大聲學(xué)所、語言所、清華等等一些學(xué)校語音專業(yè)的學(xué)生,一畢業(yè)就被挖去,這些國(guó)外公司基本上把中國(guó)語音市場(chǎng)瓜分了。
還有一個(gè)背景必須提,就是大學(xué)生創(chuàng)業(yè)潮。九八、九九年團(tuán)中央呼吁大學(xué)生創(chuàng)業(yè),CCTV2還專門在1999年春節(jié)前后拍了一期節(jié)目,請(qǐng)了很多大學(xué)生創(chuàng)業(yè)者去講他們的故事。這是九八、九九年那一撥創(chuàng)業(yè)潮,但是后來我們上市的時(shí)候,一百多家企業(yè)就剩兩三個(gè)了。
這就是九八、九九年劉慶峰的狀態(tài)——技術(shù)上很牛,研究生剛畢業(yè),拒絕了微軟,在大的語音產(chǎn)業(yè)第一次浪潮和大學(xué)生創(chuàng)業(yè)潮,以及國(guó)家863獎(jiǎng)的激勵(lì)下開始創(chuàng)業(yè)。
“訊飛 Inside”
融到錢后,就可以大手筆干活了。我們開始追逐自己的夢(mèng)想,第一次做了ToC(面向消費(fèi)市場(chǎng))的產(chǎn)品——暢言軟件。這是一款針對(duì)PC的軟件,通過語音既可以有指令的操作,又可以有文本輸入,我們第一次把手寫輸入的隨意性和語音輸入的快速性無縫整合在一起。
這個(gè)軟件的“成功版”賣兩千塊錢一套,我們?cè)谌珖?guó)十幾個(gè)省打廣告,然后招商。把代理商請(qǐng)到合肥來,跟他們講這個(gè)軟件有多好多好,我賣你一套一千塊錢,你賣兩千塊錢。這個(gè)代理看著覺得挺神奇的,就各自囤了一些貨,但后來很快退回來了,一是不好賣,二是很多盜版。第一年賣了一千多萬,但大部分都積壓在代理商那里,搞得代理商叫苦不迭。
這是我們第一次ToC的努力。當(dāng)時(shí)可以做事情的時(shí)候,我們就想改變?nèi)耸褂糜?jì)算機(jī)的習(xí)慣,現(xiàn)在看來,這顯然是超越我們的能力了。一方面,PC已經(jīng)比較好地解決了人機(jī)交互的問題,對(duì)語音的需求沒那么迫切,而且換一臺(tái)電腦就得重新訓(xùn)練;其次,商業(yè)環(huán)境也不成熟,那時(shí)候沒有電子商務(wù),得靠一級(jí)一級(jí)的代理,最后一級(jí)一級(jí)加價(jià),價(jià)格就比較高;同時(shí),盜版又大面積出現(xiàn)。從技術(shù)、需求、商業(yè)環(huán)境上,都還不太成熟,所以叫它蹣跚的起步。訊飛的成長(zhǎng)中,我們犯了無數(shù)的錯(cuò)誤,這是其中之一。
訊飛商業(yè)模式第一次形成叫“iFLY Inside”,2000年,我們?cè)谏钲趨⒓痈呓粫?huì),華為的工作人員看到了我們的語音合成系統(tǒng),覺得比他們的好,就把我們帶到蛇口的那個(gè)樓里,十幾個(gè)研發(fā)人員圍著問了一個(gè)下午。后來,華為就決定跟我們簽約了。
簽約后,華為開始測(cè)試我們的語音合成系統(tǒng)。我們?cè)诩依餃y(cè)覺得挺好的,結(jié)果到華為一跑,只能撐幾分鐘。華為給了我們很大的壓力,在陳濤副總裁的帶隊(duì)下,我們最核心、最骨干的一些研發(fā)人員接近二十幾天吃睡都在華為,餓了就吃點(diǎn)東西,困了就在地上鋪個(gè)東西睡會(huì)兒。我們那個(gè)時(shí)候才知道電信級(jí)穩(wěn)定性的要求。
修改、優(yōu)化后提交還是不夠,華為在現(xiàn)場(chǎng)又發(fā)現(xiàn)了問題,需要反復(fù)的修改,這個(gè)過程算是“脫了一層皮”。從實(shí)驗(yàn)室狀態(tài)的產(chǎn)品,在穩(wěn)定性、工程化上面,如何滿足真正大規(guī)模商用的要求,也是我們第一次面對(duì)。
但是這一層皮脫掉了以后,以后再有誰測(cè)我們的系統(tǒng),我們從來就沒倒過。除了華為,當(dāng)時(shí)的中興、神州數(shù)碼等等國(guó)內(nèi)做智能網(wǎng)、呼叫中心、業(yè)務(wù)系統(tǒng)的,需要用到語音引擎都買訊飛。
我們把語音的核心能力提供給合作伙伴,他來做具體的應(yīng)用,這是“iFLY Inside”模式的確立。
彎曲的直線endprint
訊飛犯過無數(shù)的錯(cuò)誤,走過無數(shù)彎路,后來我們把它叫做“彎曲的直線”。
現(xiàn)在訊飛有兩個(gè)事業(yè)部,通信增值和移動(dòng)互聯(lián)。當(dāng)年有一個(gè)叫“有聲Email”的項(xiàng)目,我是總負(fù)責(zé)人,跟上海電信合作,在上海熱線的郵箱系統(tǒng)第一次實(shí)現(xiàn),當(dāng)時(shí)覺得自己還挺了不起的。
那個(gè)時(shí)候移動(dòng)互聯(lián)網(wǎng)還沒起來,電話用戶比互聯(lián)網(wǎng)用戶多得多,“有聲Email”就是用電話來訪問,讓用戶聽互聯(lián)網(wǎng)上的信息。這個(gè)還真賣了一套,但就是沒人用。在做這些產(chǎn)品的過程中,我們也慢慢的知道了該如何做產(chǎn)品,如何做工程,如何研究用戶需求。
還有個(gè)項(xiàng)目叫“老師家長(zhǎng)一線通”,希望通過智能的電話語音系統(tǒng),解決老師和家長(zhǎng)之間的溝通問題,現(xiàn)在有很多 App 也做這個(gè),包括校訊通,但當(dāng)時(shí)產(chǎn)品出來同樣沒市場(chǎng)。不過,這支團(tuán)隊(duì)后來進(jìn)一步延伸出了通信增值事業(yè)部。
2005年,彩鈴從韓國(guó)引入中國(guó),迅速火了起來。當(dāng)時(shí)運(yùn)營(yíng)商最困擾的是,電話熱線里面只能提供“1”到“9”的9首彩鈴讓用戶來選。他們就找我們問,能不能用語音選彩鈴。
我們就做了“聲動(dòng)彩鈴”這個(gè)系統(tǒng),在安徽一試點(diǎn)成果非常好。當(dāng)時(shí),安徽的運(yùn)營(yíng)商就給我們推薦了幾個(gè)單位,后來聯(lián)通總部看到這個(gè)系統(tǒng)的成果,就進(jìn)一步下文,說這個(gè)產(chǎn)品應(yīng)該怎么用。這樣,我們終于有了第一個(gè)能夠覆蓋全國(guó)的業(yè)務(wù)。
它逐漸在全國(guó)形成了規(guī)模效應(yīng),后來中國(guó)電信得到了C網(wǎng),開始做彩鈴的時(shí)候,也是全面用我們的系統(tǒng)。中國(guó)移動(dòng)也是。
基于音樂和彩鈴相關(guān)的語音業(yè)務(wù)平臺(tái),很多都是由訊飛來做?;谟嶏w的語音核心技術(shù)之外,我們把音樂方向的應(yīng)用真正做起來了。
這幾年,我們的通信增值事業(yè)部在原來音樂語音搜索上又進(jìn)一步做了很多東西,比如個(gè)性化彩鈴、基于特色的語音合成技術(shù),可以讓彩鈴隨時(shí)的更換。還有愛吼網(wǎng)(一個(gè)在線K歌的平臺(tái))。
移動(dòng)互聯(lián)方面,包括輸入法,我們的基礎(chǔ)團(tuán)隊(duì)也是從這邊延伸出來的。2002年到2005年,我們把它叫做“彎曲的直線”,走了無數(shù)的彎路。
“彎曲的直線”的另外一面是教育產(chǎn)品。我們教育產(chǎn)品線已經(jīng)很長(zhǎng)了,早期做的產(chǎn)品叫“會(huì)說話的書”,這是 2002 年開始做的重要項(xiàng)目,我們當(dāng)時(shí)對(duì)它抱了很大的期望。在書底下有一個(gè)存儲(chǔ)裝置,包含語音合成芯片,可以把書的內(nèi)容讀出來,適合小孩。
語音合成怎么用?當(dāng)時(shí)想的就是大家除了看書以外,還有聽的需求。這兩款產(chǎn)品費(fèi)了牛勁,因?yàn)槭俏覀兊谝淮巫鲇布a(chǎn)品?,F(xiàn)在看來,這兩款產(chǎn)品巨土,工業(yè)設(shè)計(jì)水平都比較低,包括用戶體驗(yàn)也都不太好。
但是,這次項(xiàng)目之后保留下來的教育產(chǎn)品條線,現(xiàn)在已經(jīng)有幾百號(hào)人、幾億的銷售額,可能到未來會(huì)有幾十億。要是當(dāng)時(shí)沒做現(xiàn)在看來很瘋狂的傻事,就沒有今天的發(fā)展。endprint