“要么率先燎原,要么最先熄滅?!边@個略顯悲壯的口號一直被掛在位于安徽合肥科大訊飛公司的辦公樓外。也定格了智能語音交互技術(shù)在近十余年內(nèi)的坎坷經(jīng)歷。
41歲的科大訊飛董事長劉慶峰已經(jīng)很久沒有抬頭看這行字,自今年初制定了由B2B戰(zhàn)略轉(zhuǎn)型B2B2C戰(zhàn)略之后,他更忙了。
十余年來,智能語音一直無法擺脫“玩具”的清冷形象,沒人否認這個技術(shù)的先進性,但如何利用這個技術(shù)賺錢,也沒有人能想清楚。
科大訊飛發(fā)軔于中國科技大學(xué),1999年創(chuàng)業(yè),一直到2004年才實現(xiàn)盈虧平衡。其創(chuàng)始人劉慶峰在創(chuàng)業(yè)之初認為很快就可以做到100億元,很快就能上市,事實上科大訊飛2008年上市時,才做到1億多元的年銷售收入。整個過程充滿艱辛。
以2009年中國正式商用3G為轉(zhuǎn)折點,科大訊飛從谷底爬升。時至今日,已經(jīng)在機器合成語音市場占到了70%以上的份額。2013年,訊飛營收為12.5億元,這個數(shù)字比2012年增長60%。
有研究機構(gòu)預(yù)測,智能語音的市場容量至少超過30億美元。和千億美元的市場相比,這只能算是一個小市場。但鑒于物聯(lián)網(wǎng)和可穿戴設(shè)備的廣闊前景,智能語音的入口級意義更為可觀。
這被劉慶峰視作一個好機會。與其繼續(xù)在后臺為其他公司作嫁衣裳,不如自己卷袖單干,直接做終端消費者的生意。
劉慶峰選擇以智能家居為突破口。他希望推動一場“從手控到聲控”的智能家居變革,通過發(fā)出語音指令來實現(xiàn)開燈、調(diào)光,開關(guān)電視、空調(diào)等智能家電的動作,進而實現(xiàn)整個家庭的智能交互。
劉慶峰畫了一個餅。這個餅?zāi)軒椭嶏w突破市場限制,做更大的生意,但風(fēng)險也是可估的。科大訊飛開始了二次創(chuàng)業(yè)。
在市場幾度變化沉浮之后,訊飛才最終找到一個適合自己的節(jié)奏。
智能語音技術(shù)原理復(fù)雜,技術(shù)開發(fā)周期長、投入大,進入壁壘很高。在全球范圍內(nèi),目前已形成寡頭壟斷競爭格局,僅有Nuance、IBM、微軟、Google、科大訊飛等少數(shù)廠商具備較強競爭力。
我國語音技術(shù)廠商基本分為三類:一是傳統(tǒng)語音技術(shù)廠商,包括科大訊飛、捷通華聲;第二類是互聯(lián)網(wǎng)廠商,包括百度、騰訊、搜狗等,普遍采用戰(zhàn)略合作或者收購等方式,掌握智能語音技術(shù),推廣語音服務(wù);第三類是創(chuàng)業(yè)企業(yè),像云知聲、思必馳等,它們專注于某些行業(yè)領(lǐng)域如汽車、家電,推廣自己的語音技術(shù)和產(chǎn)品。
科大訊飛幾乎是智能語音領(lǐng)域起步最早,目前也是唯一能夠與國際巨頭抗衡的公司。而在長達15年的時間里,這家公司曾經(jīng)一度找不到方向。
1999年底,融資3000萬元之后,科大訊飛成立,公司有兩個目標(biāo),一個是做全球最大的中文語音技術(shù)提供商,二是做全球最出色的多語種語音技術(shù)提供商。
劉慶峰覺得市場空間很大,馬上就能做到。但在接下來的幾年里,他備受煎熬,“這個東西很好,技術(shù)也在不斷提高,但不知道從哪把錢掙回來?!?/p>
當(dāng)時,IBM、微軟等國際大公司雖然都把智能語音業(yè)務(wù)當(dāng)作未來的潛力業(yè)務(wù),但他們都只是布局,并不抱掙錢的念頭。
而劉慶峰期望更大,第二年就推出面向消費市場的話王98和暢言2000等兩款產(chǎn)品,用以幫助一些特殊人群操作電腦。當(dāng)時,立下了創(chuàng)造100億元營收的目標(biāo)。但因技術(shù)障礙和高昂的終端維護成本,這兩個產(chǎn)品最終失敗。
這與當(dāng)時的產(chǎn)業(yè)發(fā)展環(huán)境有極大關(guān)系。當(dāng)時,中國無線網(wǎng)絡(luò)仍在2G時代,除了客服中心和視力殘疾的特殊人群,語音識別技術(shù)過于超前,應(yīng)用環(huán)境根本不存在,那些看上去很好的功能都是擺設(shè)。
虧損燒錢的狀態(tài)讓劉慶峰每晚失眠,核心技術(shù)人員怨聲載道,投資人聯(lián)想之星的財務(wù)總監(jiān)甚至當(dāng)場在業(yè)績會議上流下眼淚。
那次失敗讓劉慶峰意識到,一個十幾個人的創(chuàng)業(yè)團隊做消費者市場過于理想化,他轉(zhuǎn)而做B2B市場,帶著團隊找了聯(lián)想、華為,勸說他們把訊飛的技術(shù)推廣到聯(lián)想的筆記本和華為的呼叫中心上。
他回憶,那是一個不斷“推”和“磨”的過程,要說服這些大廠商去用,但最終還是用戶說好才管用,因此需要做出多種應(yīng)用去引導(dǎo)用戶。通過這種方式,訊飛的收入從一個月十幾二十幾萬元,生生到幾十萬、一兩百萬元。
直到2004年,訊飛實現(xiàn)盈虧平衡。此后,在技術(shù)和市場兩方面,訊飛都開始爬坡。2008年上市,訊飛的年銷售收入達近2億多元。后得益于移動互聯(lián)網(wǎng)的迅猛發(fā)展,訊飛長期的技術(shù)積累也得以發(fā)揮,最好的時候,中國十大IT電子公司中,有八家是采用訊飛的語音交互技術(shù)方案。
但這仍然無法與其他走在前列的巨頭相抗衡。蘋果的Siri已經(jīng)廣為人知,谷歌“OK Google”的語音控制命令也很搶眼,微軟則在實時翻譯領(lǐng)域占據(jù)主導(dǎo)地位。
經(jīng)過多年積累,語音交互技術(shù)最終成為了上述巨頭旗下的一個重要應(yīng)用分支,成為它們在生態(tài)系統(tǒng)布局上的一個得力工具。得益于平臺,這些語音交互技術(shù)可以產(chǎn)品的方式直面消費者。而訊飛則久久止步于B2B市場領(lǐng)域。
資深業(yè)內(nèi)人士陳志剛向《財經(jīng)》記者表示,智能語音服務(wù)只是一個依附性的產(chǎn)品,必須依靠別的產(chǎn)品而存在,就像豬和毛的關(guān)系。
今年9月,科大訊飛輪值CEO吳曉如告訴《財經(jīng)》記者,訊飛語音助手APP“靈犀”的用戶已經(jīng)超過了1.6億。其中,運營商商店下載和第三方應(yīng)用商店用戶量各占一半。
劉慶峰稱,靈犀輸入法的用戶遠遠超過百度和搜狗,甚至超過了后二者的總和。但這個很牛的APP至今無法為科大訊飛帶來營收和利潤。
目前,給訊飛帶來收入的業(yè)務(wù)有四大塊,分別是在線教育、企業(yè)智能客服、車聯(lián)網(wǎng)及運營商。其中,在線教育能帶來超過30%的收入,其他業(yè)務(wù)分別在20%上下。
在線教育,包括各種語言類在線考試,例如全國30省的全國普通話等級考試,唯一使用的操作系統(tǒng)就是科大訊飛。這一方面由于科大訊飛擁有業(yè)界較高水平的智能語音技術(shù),另一方面具備中國科大背景、國家863計劃攻堅組核心成員的身份也起了直接作用。
劉慶峰認為,盡快占據(jù)手機端入口和電視端入口是當(dāng)務(wù)之急,也是訊飛轉(zhuǎn)型的關(guān)鍵所在。今年8月,訊飛宣布進軍智能家居產(chǎn)業(yè),訊飛發(fā)布了面向智能家庭領(lǐng)域的系列語音產(chǎn)品,包括新版本語音助手靈犀3.0、以語音交互為特色的訊飛智能音箱、面向智能電視交互的“未來遙控”。
在規(guī)劃中,這是一場“從手控到聲控”的智能家居變革,通過發(fā)出語音指令實現(xiàn)開燈、調(diào)光,開關(guān)電視、空調(diào)等智能家電的動作,進而實現(xiàn)整個家庭的智能交互。
具體思路是,軟件和硬件雙管齊下,軟件方面,以電視機為切入口,首先與七家電視機廠商合作推出智能電視的“未來遙控”方案。硬件方面,則與中國移動聯(lián)合推出智能硬件產(chǎn)品——訊飛智能音箱,其賣點是實現(xiàn)語音、哼唱和原聲搜索“三合一”功能,背后依靠中國移動的無線音樂基地大量的正版音樂資源。
劉慶峰看上了移動互聯(lián)網(wǎng)入口帶來的大生意。為了用最快的速度占領(lǐng)智能語音市場,形成一個良性生態(tài)系統(tǒng),訊飛2010年發(fā)布語音云平臺,這個平臺的合作伙伴已超過4萬家,包括騰訊QQ、新浪微博、58同城、高德地圖等各類主流應(yīng)用,支撐用戶數(shù)百萬級以上應(yīng)用超過1000多個,終端用戶數(shù)量超5億。
國內(nèi)最早進入智能家居行業(yè)的集成服務(wù)商Broadlink創(chuàng)始人劉宗孺在接受專業(yè)媒體采訪時認為,國內(nèi)的智能家居目前大部分還只是噱頭,因為家電單品之間的智能標(biāo)準(zhǔn)尚未統(tǒng)一,無法互聯(lián)互通。
訊飛希望自己是這樣的一個連接者。也就是說,通過手機訊飛客戶端控制你家里的電視、空調(diào)和電燈。但在最近的一段時間里,你需要購買和訊飛合作的家電品牌的產(chǎn)品,且大多是幾個有限的型號。
劉慶峰對此并不悲觀,他預(yù)計,今年底語音聯(lián)盟的大會,就會有新的標(biāo)準(zhǔn)制定出來。
最終,訊飛不再是一個只為大公司提供語音解決方案為生的公司,而是一個以基于云計算的智能語音服務(wù)為切入口,成為一個語音平臺公司。
雖然人們普遍認可家庭娛樂中心將成為繼移動互聯(lián)網(wǎng)之后的又一個藍海產(chǎn)業(yè),但這個市場多年來始終沒有市場之王的候選人。從互聯(lián)網(wǎng)公司到IT公司再到傳統(tǒng)的家電廠商,涉足這個產(chǎn)業(yè)的公司既合縱連橫又分別競爭,一時顯得有些混亂。蘋果TV的遲遲不能問世,也在一定程度上說明了這個市場的不易和復(fù)雜性。
對于急于進入這個市場而又手握一定籌碼的科大訊飛來說,這是機會,也是風(fēng)險。
劉慶峰的決策團隊意識到了這一點,在進入新的消費市場的同時,他并未放棄在現(xiàn)金牛市場的努力。最近,劉慶峰接待了多批教育市場的客戶。
科大訊飛在車聯(lián)網(wǎng)市場的領(lǐng)先優(yōu)勢繼續(xù)擴大。在德國奔馳汽車去年8月組織的一場車內(nèi)智能語音比賽中,訊飛是唯一在時速100公里之上還可以使用的解決方案。這也直接促成了訊飛和奔馳的合作,并帶來了寶馬、沃爾沃、一汽、上汽、江淮和奇瑞的訂單。
劉慶峰承認,手機端的入口已經(jīng)被谷歌和蘋果、百度和騰訊這樣的平臺型公司所占領(lǐng),但他依然認為,還有三分之一的手機入口留給手機廠商和訊飛這樣擁有技術(shù)優(yōu)勢的公司。他想在這其中拿下最大一塊。
他的預(yù)期也比外界對智能語音的市場預(yù)期要樂觀很多。他說,15年前立下的年營收100億元目標(biāo),很有可能在未來幾年實現(xiàn),但一些公開分析機構(gòu)的預(yù)測是,這個市場在未來數(shù)年的總市場容量約為30億美元。
互聯(lián)網(wǎng)的成長速度十分迅速,9月底,中興通訊、Nuance、Audience、高德、百度、中國科學(xué)院自動化所等公司和機構(gòu)宣布成立“智慧語音聯(lián)盟”,并發(fā)布了第一個中國智能語音技術(shù)規(guī)范標(biāo)準(zhǔn)“5A標(biāo)準(zhǔn)”。
這意味著,隨著智能語音技術(shù)前景的不斷放大,技術(shù)的快速成熟,科大訊飛面臨的潛在競爭對手正越來越多,這些單個語音實力遠不如訊飛的中外公司,正在抱團取暖。以前科大訊飛是摸著石頭過河,現(xiàn)在則是叢林中行走。
訊飛還要面臨技術(shù)門檻帶來的用戶教育成本。包括靈犀在內(nèi),任何一款語音識別軟件都需要大量的訓(xùn)練以便識別用戶的語音特征,來提高準(zhǔn)確性。但又有多少人會天天對著一臺手機喃喃自語呢?
更大的挑戰(zhàn)來自內(nèi)部。吳曉如承認,訊飛從B2B走向B2C,不僅在產(chǎn)品研發(fā)管理、把握市場需求方面存在新挑戰(zhàn),業(yè)務(wù)模式也需要進行巨大變革。
在直面移動互聯(lián)網(wǎng)用戶之后,訊飛不僅需要加快產(chǎn)品迭代周期,用戶需求復(fù)雜度更是成幾何級增加,做到這兩點已經(jīng)十分不易,更何況訊飛是一家技術(shù)研發(fā)型公司,2500人的總員工數(shù)中,超過1800人是技術(shù)工程師,渠道布局和市場營銷并非其所擅長。
科大訊飛在人工智能上的科學(xué)探索已經(jīng)延伸到聲紋和人臉識別、語言翻譯等領(lǐng)域,其“超腦計劃”甚至試圖建立認知計算引擎,讓機器模擬人腦的知識表示和學(xué)習(xí)過程,從而實現(xiàn)機器從“能聽會說”到“能理解會思考”。
整個訊飛團隊都篤信其技術(shù)能力即將創(chuàng)造新一輪神奇,但它所面對的挑戰(zhàn)又是十分具象的。正如吳軍在《浪潮之巔》一書中寫道,所有成功的大公司都有好的商業(yè)模式,諸多案例表明,很多大公司的興起,不是靠技術(shù),而是靠商業(yè)模式的轉(zhuǎn)變。