“查找某某電話?!笨拼笥嶏w董秘徐景明對著一部手機發(fā)出指令,一張通訊名片迅疾跳了出來。按下短信圖標,再說一句:“今天上午有記者到公司來參觀,請做好準備。”不到一秒鐘,18個字符加2個標點符號準確無誤地顯示在屏幕上。
“我想聽劉德華的歌”、“查一下明天從合肥到北京的航班”、“明天上午10點提醒我參加一個重要會議”。徐景明不是在吩咐自己的員工,而是繼續(xù)對手機下達了一連串的命令。
當iPhone4S用戶還在對Siri中文版翹首以待,Android用戶羨慕嫉妒恨的時候,兼具語音輸入、對話和搜索的訊飛語點已在各大App應用商店上架兩個多月。但這家總部位于中部省份安徽省的中文語音公司格外低調(diào),用戶對于其新產(chǎn)品的認知遠不如股民對002230(股票代碼)的追捧。
002230第一季度財報顯示:公司實現(xiàn)營業(yè)總收入1.30億元,同比增長51.77%;歸屬股東凈利潤達1986萬元,同比增長36.77%。其成長勢頭可與美國Nuance媲美——蘋果 iPhone 4S的虛擬個人助手Siri所用的語音識別引擎正是由在納斯達克上市的Nuance開發(fā)。
13年前就堅信“語音將成為未來基本需求點”的劉慶峰,如今終于如愿以償。那一年,在讀博士劉慶峰,東奔西走借錢維持中國科大的語音實驗室;那一年,劉慶峰最后決定,放棄出國機會,開始創(chuàng)業(yè)。目前,科大訊飛的語音云開發(fā)合作伙伴已有4000多家,終端用戶數(shù)已達5000 萬,每天在線用戶數(shù)超 120 萬,總請求量超過700 萬次,訊飛語音輸入法更是占據(jù)了移動終端70%的市場。在每年的新員工培訓會上,身為科大訊飛董事長的劉慶峰都會告訴年輕人:“你所清晰預見的,熱烈渴望的,真誠追求的,最后都將自然而然的實現(xiàn)?!?/p>
語音生活必需品
2010年,上海世博會,除了志愿者外,出現(xiàn)了一群吉祥物海寶機器人,它們操著一口標準的外語與來賓交流世博會的情況,逗得外國人捧腹大笑;2011年,在廣州車展上,一款語音云駕駛ivoka產(chǎn)品引來與會者圍觀,無需手動,聲音便可實現(xiàn)導航、發(fā)短信、打電話;2012年年初,長虹推出首款語音智能電視,人可以通過語音直接操作電視。今年3月,科大訊飛又推出手機App“訊飛語點”。
“這些技術(shù)都是我們提供的。”科大訊飛移動互聯(lián)終端產(chǎn)品部總經(jīng)理葛勇告訴《環(huán)球企業(yè)家》。隨著蘋果Siri的發(fā)布,市場掀起一陣語音熱潮,而在語音領(lǐng)域已堅守13年的科大訊飛也逐漸聲名鵲起。
盡管剛剛推出的“訊飛語點”與Siri具有很多相似功能,但劉慶峰告訴《環(huán)球企業(yè)家》:“我們與Siri有根本的不同。Siri更多地強調(diào)趣味性,對于手機廠商來說,增加了產(chǎn)品銷量,但消費者不可能天天“調(diào)戲”一部手機,所以科大訊飛追求的是實用性,然后兼顧一些娛樂功能。
如果說喬布斯在做一件藝術(shù)品,那么劉慶峰則希望創(chuàng)造生活必需品。劉將這種理念也貫徹到對產(chǎn)品的開發(fā)上。
葛勇帶領(lǐng)團隊從2010年開始醞釀訊飛語點,期間近100人參與到產(chǎn)品的設(shè)計、研發(fā)和測試當中。劉慶峰也常常關(guān)注最新進展?!皠c峰對技術(shù)很挑剔,一點點瑕疵都逃不過他的眼睛和耳朵,為此爭吵甚至拍桌子是家常便飯?!备鸹貞浾f,當一個版本出來時,拿給劉慶峰測試,不用任何工具,僅憑耳朵,聽完之后,劉慶峰就質(zhì)問開發(fā)團隊,一段語音怎么會出現(xiàn)兩個人的聲音?“這種效果連我都聽不出來,更何況普通用戶。但是沒辦法,劉總是一個追求完美的人,我們不得不一遍又一遍的修改?!备鹩滦ΨQ,想糊弄劉慶峰,沒門兒。
“語點”此名,意為語音點亮生活。而對于生活的理解,劉慶峰不僅注重用戶的體驗,并且關(guān)注用戶的使用習慣。因此在多功能的訊飛語點推出之前,科大訊飛在2010年率先發(fā)布了訊飛語音輸入法。
當時,用戶還是通過鍵盤和觸摸屏輸入,但局限于手機屏幕小,傳統(tǒng)輸入非常麻煩。所以劉慶峰決定先解決這一問題,訊飛語音輸入法雖然沒有放棄鍵盤和手寫,但在手寫上做了改進,實現(xiàn)了疊寫和連寫,不用等待一個字生成文本后再輸入下一個字,大大提高了輸入效率。而語音輸入更是實現(xiàn)了在3G網(wǎng)絡(luò)下1秒鐘完成,2G網(wǎng)絡(luò)下2秒完成。
訊飛語音輸入法和訊飛語點正在改變著手機用戶的使用習慣,而科大訊飛則早已在各個領(lǐng)域百花齊放。2012年,國家語委將徹底取消普通話考試的人工評測,未來考試者面對的將是科大訊飛的一部部機器,而打分者也是它們;微博控們再也不用一個字一個字地敲,用嘴便可“說”出微博;打開大眾點評網(wǎng),只要說出自己的需求,頁面便會自動搜索;深圳的大型玩具廠商已經(jīng)開發(fā)出第一個聲控飛機、第一個能挺會說的玩具機器人、第一個能聽會說的兒童玩具手機。
從實驗室到市場
比爾·蓋茨在卸任微軟董事長后進行了一場巡回演講,當有人問 “您對未來IT最看好什么?”時,這位IT巨擘列舉的第一項技術(shù)就是語音。而在此之前,他已多次公開宣稱,未來鍵盤、觸摸、鼠標等外部電腦操作設(shè)備將徹底讓位于語音。
事實上,IT巨頭在上個世紀末已開始布局語音產(chǎn)業(yè),包括中文市場。IBM、Motorola、Intel等相繼在中國成立實驗室,但當時誰都難言語音產(chǎn)業(yè)化。
國內(nèi)的語音技術(shù)雖然也在社科院和幾大高校的實驗室里醞釀了十多年,但依然達不到商用標準。1999年,來自中國科技大學語音實驗室的幾位創(chuàng)業(yè)者成立了科大訊飛,劉慶峰被推上管理者的位置。幾個年輕人準備大干一場,要讓電腦“能聽會說”,要將語音技術(shù)產(chǎn)業(yè)化,而這也是劉慶峰創(chuàng)辦公司前給導師王仁華提的條件之一。在計算機還未普及的時代,這樣的想法似乎有點異想天開。
劉慶峰大學的專業(yè)是電子學,大二時被老師王仁華選拔到語音實驗室。劉逐漸展露出其在語音技術(shù)方面的天賦。實驗室曾經(jīng)使用一個日本的LMA語音分析工具,王仁華認為效率太低,就問劉慶峰能否提高二三倍。當時還是學生的劉慶峰花了一個月的時間,最終將效率提高了整整10倍。
但以技術(shù)見長的劉慶峰在創(chuàng)業(yè)初期卻遭受了“技術(shù)”的重創(chuàng)。在技術(shù)性攻勢的路線圖指導下,他們下了很大的功夫,開發(fā)出一款電腦桌面軟件,試圖把手寫輸入的隨意性、鍵盤輸入的準確性和語音輸入的高效性完美地結(jié)合起來,當時號稱“只要能說話就能使用電腦”。這款產(chǎn)品確實讓人眼前一亮,劉慶峰拿去參加很多展會都非常受追捧。但隨后的市場效果讓他們大跌眼鏡。劉慶峰回憶,顧客來看產(chǎn)品時滿意度100%,我們在場使用時滿意度70%,用戶自己操作時滿意度降至30%。
在產(chǎn)業(yè)化的道路上,劉慶峰栽了一個跟頭。當公司賬上只剩下20萬元時,他們決定放棄B2C。技術(shù)不是問題,科大訊飛的背后是中科大語音實驗室和863項目組,劉慶峰等幾個創(chuàng)業(yè)者也從來沒有懷疑過自己的專業(yè)能力。因此,慘遭失敗后的科大訊飛只是需要新的商業(yè)模式,這次他們轉(zhuǎn)向B2B,準備只做核心技術(shù)提供商,讓有渠道、有市場、有技術(shù)的大公司去直接面對消費者。劉慶峰找到了華為、中興,找到了聯(lián)想。
“當時我們準備像英特爾一樣,做iFly Inside?!眲c峰告訴《環(huán)球企業(yè)家》??拼笥嶏w只負責開發(fā)引擎、語音合成和語音識別芯片,而應用集成則由下游的開發(fā)商或客戶自己完成。這一模式也就意味著越來越多的市場主體進入語音的產(chǎn)業(yè)鏈當中。
科大訊飛的B2B成為中國語音技術(shù)產(chǎn)業(yè)化的真正起點。1999年底到2000年初,總工程師陳濤帶領(lǐng)同事在公司住了一個多月,沒日沒夜對系統(tǒng)修改測試再修改,最終成功通過了華為的測試。這次突圍被劉慶峰認為是科大訊飛發(fā)展的第一個重大節(jié)點。到2000年年底,科大訊飛擁有了50位穩(wěn)定的客戶,也憑此拿到了關(guān)鍵性的風險投資。
此后,科大訊飛進入了快車道。2001年迎來聯(lián)想投資;2004年公司開始盈利;2006年之后,其語音合成技術(shù)和語音識別技術(shù)陸續(xù)在多個國際專業(yè)大賽上獲得第一;2008年,科大訊飛登陸中小板。充裕的資金加上技術(shù)的突破,科大訊飛加足馬力在電信、銀行、國家安全等領(lǐng)域拓展疆土。如今其語音云開發(fā)伙伴已達4000多家,用戶量突破5000多萬。而產(chǎn)品在中文語音市場總份額已達到70%,在專業(yè)領(lǐng)域的應用更是達80%。2011年,公司實現(xiàn)凈利潤1.3億元。
做產(chǎn)業(yè)鏈主導者
語音是一門集合數(shù)字信號處理、人工智能、心理學、計算機軟硬件工程、概率統(tǒng)計學和自然語言處理的交叉學科,國際和國內(nèi)的研發(fā)者已經(jīng)苦戰(zhàn)近40年,至今依然沒有像觸摸屏一樣得到大范圍普及。高門檻讓很多創(chuàng)業(yè)者望而卻步,尤其漢語的復雜性,使得國際IT巨頭也只能望此興嘆。語音產(chǎn)業(yè)的高壁壘為科大訊飛留下了足夠的空間實現(xiàn)產(chǎn)業(yè)化,甚至主導整個產(chǎn)業(yè)格局的走向。
今年3月22日,科大訊飛新一代語音云的發(fā)布現(xiàn)場人山人海。徐景明稱,我們只邀請了500多為開發(fā)伙伴,預留了1000個座位,但沒想到最終來了2300多人,臨時借光了會議中心的椅子還是不夠用。
隨著Siri的出現(xiàn),市場掀起新一輪語音熱。草根創(chuàng)業(yè)者也躍躍欲試,劉慶峰要抓住這次機遇,拓展語音產(chǎn)業(yè)格局。而移動互聯(lián)網(wǎng)的普及和云計算的成熟也讓劉慶峰的設(shè)想成為可能。
“這相當于iFly Inside的移動互聯(lián)網(wǎng)版本?!眲c峰說。之前以芯片等技術(shù)做應用系統(tǒng)的模式成本很高,客戶設(shè)計、研發(fā)、測試、運行的平臺價格奇高,產(chǎn)品交給運營商后,運營商也無法預測用戶規(guī)模,以致造成服務器資源的浪費或超負荷。如此以來,把很多創(chuàng)業(yè)者擋在創(chuàng)新門檻之外。而科大訊飛推出的語音云平臺解決了這一問題,開發(fā)者既可以在開發(fā)階段免費使用語音云平臺進行研發(fā)和測試,也可以零成本地將自己的應用產(chǎn)品連接到語音云平臺。
這對于科大訊飛來說,無需自己開發(fā)應用產(chǎn)品即可擁有龐大用戶群;而對于開發(fā)者來說則大大降低了進入門檻。劉慶峰稱,之前將近十年開發(fā)商只有2000多家,語音云推出后,包括草根創(chuàng)業(yè)者增加了4000多個。
在產(chǎn)業(yè)格局上,語音云的推出意味著語音應用產(chǎn)品不再被華為、中興這樣的大型公司獨享,越來越多的草根創(chuàng)業(yè)者成為語音產(chǎn)業(yè)新軍。一位來自內(nèi)地中小城市的參會者經(jīng)營著一家類似大眾點評網(wǎng)的城市型生活網(wǎng)站,在看完科大訊飛的演示后告訴記者:“語音應用比想象的要好,準備找一家開發(fā)商來嘗試一下?!?/p>
“我們是產(chǎn)業(yè)鏈的主導者?!眲⒄f。在他的設(shè)想里,未來衣食住行各個領(lǐng)域都會出現(xiàn)科大訊飛的影子。劉慶峰把科大訊飛定位成一個基礎(chǔ)服務提供商,如今已主導搭建起家電、電信、銀行、手機、國家安全、交通、旅游、音樂、玩具等多條細分產(chǎn)業(yè)鏈。
當然,這種主動驅(qū)動產(chǎn)業(yè)格局的行為在目前面臨著挑戰(zhàn),需要產(chǎn)業(yè)鏈上的每個環(huán)節(jié)配合。如果采用語音技術(shù),首先終端產(chǎn)品開發(fā)者的系統(tǒng)就要做出改變。對于一項新技術(shù)的應用,下游客戶面臨著原有系統(tǒng)的更新?lián)Q代,這無疑增加了語音技術(shù)普及的時間成本。
穩(wěn)固了中文語音市場的劉慶峰開始計劃走向海外,“面對國際巨頭的競爭,我們必須采取以攻為守的策略?!眲c峰表示,“但我們不會選擇收購,而是采取結(jié)盟來占領(lǐng)市場,因為那么多企業(yè),收購并不是一個好辦法?!眲@然有著更大的夢想——要向世界輸出中國的語音技術(shù)。
鄒勝龍
職位:迅雷CEO
主要產(chǎn)品:迅雷看看
點評:視頻行業(yè)的拼殺“剩者為王”。以下載起家,獨占8成以上的下載市場,如今的迅雷轉(zhuǎn)型數(shù)字發(fā)型平臺,一頭栽進燒錢最為厲害,競爭也最為慘烈的視頻領(lǐng)域。2009年7月,迅雷在線與迅雷看看整合為如今的在線視頻網(wǎng)站迅雷看看,并推出播放器客戶端。人工、版權(quán)、帶寬成本比例分別為1∶1∶1,迅雷依靠技術(shù)優(yōu)勢使得帶寬支出低至同行的15%,但龐大的工程師隊伍使得人工成本較高,一年幾個億的版權(quán)支出,有游戲業(yè)務作為支撐的迅雷看看,在未來仍寄希望于視頻廣告上能有真正的作為。
梁康妮
職位:百度娛樂總經(jīng)理
主要產(chǎn)品:百度ting
點評:這是百度打造的一款全新社交化音樂媒體,與以前的百度MP3最本質(zhì)的區(qū)別是,它更強調(diào)海量聽歌和正版音樂,如環(huán)球音樂、華納唱片、索尼音樂等。同時還與百度娛樂頻道、百度新聞等相互整合,形成互動娛樂的大平臺。今年3月又推出了百度ting v1.4.0手機版,這也算是百度向移動領(lǐng)域伸出去的一只手。更有意思的是,負責百度ting業(yè)務的梁康妮,在來百度之前曾因正版與百度對簿公堂,2008年加入百度,想必李彥宏請她過來就是為了完成百度對正版娛樂資源的整合。梁康妮做得不錯。
張名舉
職位:CNTV技術(shù)中心視頻技術(shù)部執(zhí)行總監(jiān)
主要產(chǎn)品:直播中國
點評:這是一款由央視CNTV提供的iPad客戶端應用,它計劃整合全國電視節(jié)目的直播應用,提供央視、地方衛(wèi)視、地方等超過100路電視節(jié)目直播,目前首先提供40路電視節(jié)目直播。背靠豐富的中央電視臺內(nèi)容資源,該播出平臺有著先天的優(yōu)勢。而它最大的特點是,讓電視節(jié)目移動起來,這是任何硬件廠家還無法完成的事情。對于廣電運營商來講,無疑是多了一個視頻競爭手段。張明舉此前在通用視頻、酷6網(wǎng)任職,深諳視頻運營之道。不過,如何改變央視或地方臺內(nèi)容的泛善可陳,他還沒有辦法。
雷鈞
職位:多看副總裁
主要產(chǎn)品:多看電視(for Apple TV)
點評:雷鈞做這款應用的初衷,就是想把“互聯(lián)網(wǎng)的視頻搬到網(wǎng)上”,于是他先拿Apple TV(就是一個互聯(lián)網(wǎng)電視的機頂盒)當作實驗品。用戶在Apple TV上點擊多看圖標就可以直接進去點播視頻,目前內(nèi)容來自奇藝、搜狐高清、優(yōu)酷,未來會做擴展。雷鈞更大的設(shè)想是借機涉足機頂盒市場,能形成一個內(nèi)容資源平臺,切分電視市場。時下蘋果、谷歌、微軟、騰訊都在準備切入電視,雷鈞的這個小切入可能也會產(chǎn)生意想不到的效果。
王皓
職位:蝦米網(wǎng)CEO
主要產(chǎn)品:蝦米音樂
點評:互聯(lián)網(wǎng)上從來不乏音樂網(wǎng)站,但從來沒有一個網(wǎng)站像蝦米網(wǎng)這樣建立完備的音樂資料庫,蝦米音樂也有“音樂中的豆瓣”之稱。曾經(jīng)是阿里巴巴中文站一名系統(tǒng)分析師的王皓,出于對音樂的癡迷,2007年辭職離開阿里巴巴,創(chuàng)辦蝦米網(wǎng)。誰能真正離開音樂?只要有1%的網(wǎng)民為音樂買單,就是一個很大的數(shù)字。所以王皓不惜每年花1000萬購買音樂版權(quán),堵的也是未來。
姚鍵
職位:優(yōu)酷網(wǎng)CTO
主要產(chǎn)品:優(yōu)酷網(wǎng)
點評:“天下武功唯快不破”,互聯(lián)網(wǎng)產(chǎn)品的好處在于上線快,糾正也比較快。優(yōu)酷網(wǎng)通過各種方式以證明自己在視頻行業(yè)老大的地位,比如推出優(yōu)酷指數(shù),建立網(wǎng)民參與互動的影視產(chǎn)業(yè)評判標準;推出搜庫,解決視頻的海量搜索問題;合并土豆,取得在財務上的成本控制與營收增長。
龔宇
職位:愛奇藝CEO
主要產(chǎn)品:愛奇藝
點評:版權(quán)大戰(zhàn),個體間合縱連橫,視頻業(yè)有太多的不確定性,也有太多可能性。作為后來者的龔宇另辟蹊徑,堅持正版高清,帶著他的團隊高速超車。他專注細節(jié),不閉門造車,或想當然,具有絕對的執(zhí)行力,最重要的是,在最終決策時一定程度的“獨裁”,哪怕大部分反對。