□文/姜姝姝
姜姝姝本刊副總編輯
時光荏苒,距離科大訊飛董事長劉慶峰創(chuàng)建公司,已經(jīng)有了16年的歷程;距離科大訊飛上市,也有了7個年頭。劉慶峰在這一年年初的內(nèi)部年會上分享了他的最新體會:我們堅持自主創(chuàng)新,在人機智能交互源頭技術(shù)上不斷突破,核心技術(shù)全球領(lǐng)先;我們重建中文語音產(chǎn)業(yè)由國內(nèi)企業(yè)控制的格局;我們推動訊飛技術(shù)成果服務(wù)億萬用戶;我們推動中國語音產(chǎn)業(yè)整體發(fā)展。
這些,值得自豪和驕傲!但要知曉,任何創(chuàng)新都是一個痛苦的過程。真正的創(chuàng)新像花兒一樣,只有經(jīng)歷了種子在黑暗期的孕育,小草一樣的成長,才能開花結(jié)果。快餐式的急功近利,就像掐回來的花朵,很快就會枯萎。
劉慶峰有一個希望:所有訊飛人不要害怕過程中的痛苦,都能夠進行幸福的創(chuàng)新、快樂的創(chuàng)新!面向未來,要不忘初心,以激情、快樂、舍我其誰的精氣神做熱愛的事業(yè)!
時間拉回到1990年,成績優(yōu)異的劉慶峰在高考前被推薦到清華大學汽車工程專業(yè),但他卻放棄了別人眼中求之不得的機會,最終以高出清華錄取分數(shù)線40分之多的成績進入了中國科技大學電子工程系。即便如此,他還認為自己屬于發(fā)揮失常,沒成為狀元。當年,與劉慶峰一起進入中國科技大學的,有13個省市的高考狀元。然而,即使高手如云,劉慶峰從進校第一次摸底考試開始,就拿到眾多數(shù)理學科考試的第一,儼然學霸中的學霸,也由此贏得了同學和老師的賞識,這也為他后來聚攏一批學霸創(chuàng)立科大訊飛奠定了基礎(chǔ)。
按照學霸們的慣例,他本應(yīng)跟他的很多師兄們一樣,憑借優(yōu)異的成績考取全獎赴美留學,然后或從事研究或進入外企。但是,憑借出色的數(shù)理計算能力,劉慶峰被中科大從事語音技術(shù)研究的王仁華教授相中,命運的軌跡也就此改變。
時至今日,他仍然忘不了第一次走進語音實驗室所感受到的震驚——站成一排的計算機可以初步合成簡單的人聲。“以前我學數(shù)學是為了考第一,但不知道它到底怎么用。進入這個實驗室后才發(fā)現(xiàn),數(shù)學可以用于數(shù)字信號處理。這對我是一個很大的觸動?!眲c峰決定跟著王仁華教授留在語音實驗室。
“王老師跟很多教授不同,完全放手讓年輕人去做,還給予很多支持?!币淮?,王仁華認為實驗室里一個產(chǎn)自日本的語音分析工具效率太低,問劉慶峰能否用兩個月時間試著提高一倍。誰知劉慶峰竟然僅花了一個月時間,將效率提高了整整10倍。他甚至還向王仁華建議,可以將其用于優(yōu)化語音合成系統(tǒng)。王老師還打破慣例,讓劉慶峰牽頭做一個語音合成系統(tǒng)。結(jié)果,在當年的國家863計劃成果比賽中,劉慶峰開發(fā)的語音合成系統(tǒng),不但保證了音質(zhì),還具備了優(yōu)良的語音自然度,合成出來的語句近乎人聲,是當年比賽中最為轟動的科研成果。
對于當時的劉慶峰來說,最大的成就感并非技術(shù)成果本身,而是將技術(shù)成果轉(zhuǎn)化為實際應(yīng)用。1996年暑假,劉慶峰幫助華為優(yōu)化114電話咨詢平臺的語音,通過語音合成技術(shù),他讓計算機報電話號碼的語音,近乎于真人語音,這讓華為在原有4萬元研發(fā)經(jīng)費的基礎(chǔ)上追加了1萬元的獎勵,還請他飛赴深圳參加研討。
這次跟華為的合作打開了一扇廣闊的門——劉慶峰不但獲得了王仁華教授更大的支持,可以調(diào)配實驗室的更多資源,還看到了語音產(chǎn)業(yè)的市場前景。更為重要的是,他開始意識到,只有產(chǎn)業(yè)化才能真正推動語音技術(shù)的自主創(chuàng)新。
跟很多從事基礎(chǔ)研究的工作一樣,語音技術(shù)也主要依靠國家劃撥的科研經(jīng)費維持。當時一名研究人員的月薪僅僅500元,而進入外企工作年薪則可以拿到十幾萬元。巨大的收入落差,造成了科研人才的大量流失。
劉慶峰 科大訊飛股份有限公司董事長
“只有產(chǎn)業(yè)化才有錢留住人才。”劉慶峰有個大膽的想法,一邊攻讀博士,一邊辦公司創(chuàng)業(yè),其中最核心的訴求是,設(shè)立股權(quán)機制。這其實是一個打破常規(guī)的想法。在國內(nèi)科研界,老師與學生的關(guān)系,不但類似于老板跟員工,還更具有權(quán)威。但王仁華教授則不一樣,他立即爽快答應(yīng)了劉慶峰:“你不但該拿股份,而且還應(yīng)該拿的比我還多?!?/p>
從今天來看,這是一個改變了中國語音產(chǎn)業(yè)的決定。雖然早有科研機構(gòu)從事語音技術(shù)研究,但都是單兵作戰(zhàn)未見成果,語音技術(shù)產(chǎn)業(yè)化也遙不可及,但是IBM、微軟和摩托羅拉等國際巨頭也已在中國布局語音研究機構(gòu),覬覦著未來市場。這樣的時局下,王仁華教授的支持和劉慶峰的堅持,就如同將一顆生機勃勃的種子,撒入了最適合它的土壤。
劉慶峰的這個想法得到了實驗室?guī)熜謳煹軅兊狞c贊,并紛紛加盟,同時,他開始在校園內(nèi)尋找合作伙伴。當年中科大BBS 8個電子計算機相關(guān)的版主中的6位先后被“收編”,最終組成了18人的學霸創(chuàng)業(yè)團隊。1998年是長江遇洪流的一年,暴雨和暴曬交替,十八個年輕人蝸居在租來的民房中,夜以繼日地工作。“那時幾乎天天吃盒飯,有時候餓了就啃個黃瓜充饑,也舍不得買空調(diào)?!眲c峰提起創(chuàng)業(yè)時的艱辛仍十分感慨。
剛剛創(chuàng)業(yè)總是要走彎路的,那時的劉慶峰本認為只有研發(fā)才算是創(chuàng)新,才是他應(yīng)該考慮的工作,而諸如品牌、營銷甚至公司注冊等都是浪費時間。所以,他錯誤地將大量運營工作交給了一家外地企業(yè)。在這家外地企業(yè)的主導下,劉慶峰團隊辛辛苦苦開發(fā)了不少產(chǎn)品,在一些展覽會上也頗受好評,但在市場上卻舉步維艱。問題出在哪里?
從技術(shù)變成產(chǎn)品,再將產(chǎn)品推向市場,需要一個有計劃的孵化過程,而這家外地企業(yè)卻東一榔頭西一棒子。“今天恨不得做個語音PDA,明天又做語音聽寫軟件,后天又搞工商查詢系統(tǒng),沒有一個做深做透的,搞得團隊很累又看不到前景?!毙值軅冋业絼c峰說,“這樣干不行,要不你出來當CEO,要不我們就解散!”
解散?!兄弟們的請愿,確實把劉慶峰嚇了一大跳。組建團隊之初,王仁華教授曾對他說:“慶峰啊,我認為這事兒能成,這么多優(yōu)秀的年輕人能團結(jié)在一起,在科大還從來沒有過。”好不容易聚集了這么多學霸,如果解散那就太可惜了。于是,劉慶峰對著兄弟們說:“行!我試一試?!逼鋵?,他心想:如果做不好,半年就走人!這是1999年,26歲的劉慶峰正式創(chuàng)立科大訊飛。
科大訊飛成立當年,合肥市領(lǐng)導帶著三家投資機構(gòu)前來考察。聽完劉慶峰介紹產(chǎn)業(yè)前景與團隊實力后,市領(lǐng)導當場表態(tài):“這些小伙子必須留在合肥?!彪S后,三家投資機構(gòu)以“3060萬元占股51%”的條件投資科大訊飛,而劉慶峰的團隊仍然是最大的單個股東,這也是科大訊飛后來進行幾輪融資的原則。
沉甸甸的3000多萬元現(xiàn)金拿在手里,這是一種什么樣的感受?
其實,當時國內(nèi)語音技術(shù)的發(fā)展瓶頸在于機制。語音技術(shù)是一個典型的交叉學科,涉及數(shù)字信號處理、聲學研究和實驗語音學等諸多領(lǐng)域。而諸如中科大、清華、中科院和社科院等科研院校只是擅長于某一領(lǐng)域,互相之間不但從來沒有合作,甚至為了一些國家項目和經(jīng)費,爭得頭破血流。更為嚴峻的是,這些院校的大量人才被IBM和微軟等國際巨頭挖走,民族語音產(chǎn)業(yè)岌岌可危。
劉慶峰逐個拜訪了這些科研院校,“這些老師們都有很強的民族情節(jié),只是之前沒有合適的機制把他們聯(lián)合起來?!卑胃吡苏f,是民族危機感,實際一點,也有利益方面的考慮。在劉慶峰的輪番勸說下,中科院聲學所、社科院語言所和清華大學等科研院校,最終跟科大訊飛結(jié)成了緊密的合作關(guān)系,科大訊飛也由此完成了對于產(chǎn)業(yè)核心源頭技術(shù)的資源整合。
此時的劉慶峰以為,已能攀上語音技術(shù)的峭壁,科大訊飛的營收就能突破10億元甚至百億元。事實證明,Too young,too simple.
劉慶峰一開始認為,語音技術(shù)是面向普通用戶的,所以應(yīng)該開發(fā)消費級產(chǎn)品。于是一款名叫“暢言2000”的電腦軟件隨后問世。這是一款能把語音自動轉(zhuǎn)換成文字的軟件,甚至還可以讓用戶通過語音控制電腦。但當時軟件的知識版權(quán)保護是一大問題,大量盜版出現(xiàn),導致產(chǎn)品口碑很好,但賣不動。
一番試錯之后,劉慶峰做了一個艱難的決定轉(zhuǎn)攻企業(yè)級用戶。科大訊飛找到中國電信168電話信息平臺的新機會。這個平臺原本是人工錄音接聽,很難應(yīng)付海量和動態(tài)的信息,但科大訊飛的語音合成技術(shù)正好解決這一問題。但是,對方卻拒絕和科大訊飛合作,原因很簡單:中國電信這樣的大企業(yè),需要的并不是單點技術(shù),而是系統(tǒng)集成能力和企業(yè)綜合實力。這對于初創(chuàng)的科大訊飛來說,根本遙不可及。
為了科大訊飛能活下來,劉慶峰隨即飛赴深圳,通過多次拜訪,終于讓華為答應(yīng)在他們的系統(tǒng)平臺上試用科大訊飛的語音技術(shù)。然而,劉慶峰很快拿到了華為反饋的差評報告:系統(tǒng)兼容性不強、語音合成不自然、連續(xù)性差……十幾個年輕人集體沉默了,但都不能沉默太久,因為華為只留給科大訊飛一周的時間解決問題。
“在隨后的一個星期里,整個團隊沒有一個人離開過辦公室。所有人不分白天黑夜地加班加點,幾乎不眠不休,終于趕在華為給定的時間節(jié)點前解決了全部問題?!苯?jīng)此一役,科大訊飛不但獲得了華為的高度評價和長期訂單,更重要的是找到了一種適合自己的商業(yè)模式,即把技術(shù)嵌入合作方的系統(tǒng)平臺。至2000年底,劉慶峰拓展了包括華為、中興和聯(lián)想在內(nèi)的50多個合作伙伴,這其中跟聯(lián)想集團的合作,更為科大訊飛的第二輪融資甚至上市起到了關(guān)鍵作用。
任何產(chǎn)業(yè)的發(fā)展壯大,都需要天時地利與人和。在2000年初,科大訊飛又遇見了發(fā)展性的難題,大量資金投入研發(fā),但是沒有預(yù)想的那樣很快出創(chuàng)新成果。團隊中有人開始迷茫,語音產(chǎn)業(yè)到底能不能做大?還有人提議,一樣是做開發(fā),語音業(yè)務(wù)賺不了錢,不如做網(wǎng)絡(luò)游戲。“我們當時就像迷失在大海里,我作為船長,必須要指明一個方向?!眲c峰堅定地表示。
面對種種雜音,劉慶峰專門將團隊拉到合肥巢湖邊上開會,他拋出了一句話:“如果不看好語音,請走人!”從這時起,劉慶峰跟團隊也認識到:語音產(chǎn)業(yè)就是需要10年的時間,來進行技術(shù)積累。而枯燥的技術(shù)研究,如果不是發(fā)自內(nèi)心的熱愛,是很難堅持下去的。當語音產(chǎn)業(yè)開始爆發(fā)式增長時,競爭者們會發(fā)現(xiàn),很難在短時間內(nèi)達到科大訊飛的技術(shù)水平。
復星集團董事長郭廣昌和聯(lián)想控股董事長柳傳志紛紛表示對語音技術(shù)和劉慶峰的認可。復星和聯(lián)想在2001年前后相繼入股科大訊飛。其中,聯(lián)想柳傳志的這筆投資,堪稱是他的第一投。而在后來的多次交流中,劉慶峰從這位商界教父身上學到了諸多管理經(jīng)驗,比如著名的“建班子、定戰(zhàn)略、帶隊伍”。
一個例子是,此前技術(shù)出身的劉慶峰覺得,花30%的精力跟團隊溝通,已經(jīng)很多了,更多的精力應(yīng)該放在技術(shù)上。但柳傳志告訴他,自己會花60%的精力跟團隊溝通,這令他吃驚不小?!昂髞砦艺罩@樣做了,才知道前期溝通越充分,后期執(zhí)行越有效,而不是執(zhí)行不到位后再來溝通,反而花掉更多的精力。”
而劉慶峰的團隊也沒有辜負股東們的期望。在中國電信168和中國移動114呼叫中心的應(yīng)用基礎(chǔ)上,延伸進入旅游信息服務(wù)、工商稅務(wù)查詢等業(yè)務(wù),以智能語音替代人工服務(wù);開發(fā)智能語音芯片,植入家用電器、車載系統(tǒng)和兒童玩具等終端設(shè)備;以語音評測技術(shù)切入口語考試、語言教學等教育市場。
2004年,科大訊飛終于扭虧為盈;2005年至2007年,保持了凈利潤130%的復合增長率;2007年,科大訊飛營收達到2億元,凈利潤達到5300多萬元。2008年,科大訊飛成功登陸深交所,成為中國第一個由在校大學生創(chuàng)業(yè)的上市公司,也是中國語音產(chǎn)業(yè)唯一的上市公司。
風的確來了,還印證了劉慶峰當初在巢湖會議上的判斷,科大訊飛站在了業(yè)界同行難以企及的高度上。
從上市那天起,科大訊飛就有一個共識,上市并不是最終目的,只是產(chǎn)業(yè)發(fā)展中一個自然而然的階段。七年來,從“讓機器能聽會說”到“讓機器能理解會思考”,科大訊飛的夢想不斷升級。從智能語音到人工智能,核心技術(shù)不斷突破,產(chǎn)業(yè)不斷拓展,取得諸多值得所有訊飛人驕傲的成績。
“如果不在艱難的創(chuàng)新上投資,不管現(xiàn)在多掙錢,將來都會以失敗而告終”。這是劉慶峰始終堅持的觀點。2008年至2012年,科大訊飛連續(xù)五年在國際說話人、語種識別評測大賽中名列前茅。
2014年8月20日,科大訊飛正式對外發(fā)布了“訊飛超腦計劃”,核心就是讓機器從“能聽會說”到“能理解會思考”。目標就是要實現(xiàn)一個真正的中文的認知智能計算引擎,未來將真正引爆在教育、客服、人機交互、醫(yī)療等領(lǐng)域的智能應(yīng)用。
目前,“訊飛超腦計劃”已經(jīng)取得了階段性的成果。由于在深度神經(jīng)網(wǎng)絡(luò)上的突破,科大訊飛口語翻譯獲得了2014國際口語機器翻譯評測比賽英漢口語雙向翻譯第一名?,F(xiàn)在,機器翻譯功能已經(jīng)在靈犀語音助手中上線,一秒之內(nèi),就能實現(xiàn)中英和英中輕松互譯,拿著它,不會外語的人照樣出國自由行。
作為“訊飛超腦計劃”的重要組成部分,科大訊飛正在牽頭進行科技部863重大專項——類人答題機器人項目,未來要讓機器人參加高考,并且可以考上一類本科,甚至是清華大學、北京大學、中國科技大學。
科大訊飛的口語評測機器打分已超過了人工打分,目前在廣東、江蘇、重慶等地的中高考英語口語考試中得到成功應(yīng)用。甚至對于學生作文這種主觀性很強的文本,機器的判斷和評分也已經(jīng)比人工更準確。
目前,科大訊飛的技術(shù)成果已經(jīng)走進千家萬戶。2010年,科大訊飛發(fā)布了全球第一個面向移動互聯(lián)網(wǎng)提供智能語音交互能力的“訊飛語音云”平臺(現(xiàn)已更名為“訊飛開放平臺”)。
現(xiàn)在,訊飛開放平臺的終端用戶數(shù)超過6.8億,合作伙伴超過6萬家。
在教育領(lǐng)域,科大訊飛已經(jīng)構(gòu)建了教、學、考、評、管完整的產(chǎn)品體系,去年8個省級教育資源平臺項目科大訊飛100%中標。從考試到評價、到課堂教學進而牽引個性化學習,無論從核心技術(shù),還是市場渠道和產(chǎn)品體系,科大訊飛在業(yè)界都遠遠走在競爭對手前面,非常有機會成為在線教育產(chǎn)業(yè)的領(lǐng)導者。
在汽車互聯(lián)網(wǎng)服務(wù)入口,科大訊飛通過提供汽車語音助理,已經(jīng)和寶馬、奔馳、上汽、江淮、奇瑞等國內(nèi)外眾多汽車廠商進行了合作。未來從汽車語音助理向整機、汽車互聯(lián)網(wǎng)服務(wù)延展,形成“硬件+軟件+服務(wù)”組合,拓展可持續(xù)的贏利點。
在電視入口方面,科大訊飛已經(jīng)和TCL、海爾、海信、長虹、康佳、創(chuàng)維六大電視廠商,以及主流的電視盒子商邁樂、小米盒子等,和廣電系統(tǒng)的歌華有線、廣東廣電等進行了合作,迄今為止還是業(yè)界唯一能在家庭客廳噪聲環(huán)境下達到實用的產(chǎn)品。
此外,在面向消費者的產(chǎn)品領(lǐng)域,目前,訊飛輸入法的下載量超過2.2億,口碑是全行業(yè)第一。靈犀語音助手,在16個主流應(yīng)用商店的下載量也遠超過排名前五的另外四家的總和。
2012年8月,科大訊飛在工業(yè)和信息化部的支持和指導下,聯(lián)合中國移動、中國電信、中國聯(lián)通等三大電信運營商,與華為、聯(lián)想、上汽等行業(yè)龍頭企業(yè),牽頭成立了中國語音產(chǎn)業(yè)聯(lián)盟,并當選為理事長單位,共同構(gòu)建健康產(chǎn)業(yè)生態(tài)體系和應(yīng)用聯(lián)盟,推進我國語音產(chǎn)業(yè)快速發(fā)展。
2014年6月,中國(合肥)國際智能語音產(chǎn)業(yè)園在合肥高新區(qū)開建,產(chǎn)業(yè)園將依托科大訊飛先進的語音技術(shù)研發(fā)基礎(chǔ),逐漸形成政府主導、市場運作、社會參與的多元化投融資格局,完成產(chǎn)業(yè)化項目向語音產(chǎn)業(yè)園的聚集,完善語音產(chǎn)業(yè)鏈,形成產(chǎn)業(yè)化集中效應(yīng)。
很多業(yè)內(nèi)人士都說:“如果沒有科大訊飛,中國語音產(chǎn)業(yè)現(xiàn)在還繼續(xù)被控制在國外公司手中,也不可能有今天的蓬勃發(fā)展!”這是對訊飛的表揚,更是對訊飛帶領(lǐng)中國語音產(chǎn)業(yè)繼續(xù)前行的鞭策和動力。
在今年的全國兩會上,全國人大代表、科大訊飛董事長劉慶峰建議國家將人工智能列入“十三五”國家重大戰(zhàn)略專項。談到人工智能的發(fā)展,劉慶峰希望不要像前兩次工業(yè)革命一樣,中國技術(shù)再一次落后于國外,未來一定是以語音接入為主,以觸摸、鍵盤、手勢為輔助的時代。
此前百度CEO(首席執(zhí)行官)李彥宏曾提出“中國大腦”計劃,引爆人工智能熱點。劉慶峰和李彥宏算是老朋友,談到與BAT競爭時,劉慶峰透露,科大訊飛在2014年已提出“訊飛超腦計劃”,計劃開發(fā)人類第一個真正的認知智能計算引擎。
劉慶峰強調(diào)人工智能的核心主要有三:一是知識如何表達;二是知識的推理;三是知識的學習?,F(xiàn)在國內(nèi)外人工智能的發(fā)展,一般分為三個階段:第一階段是計算智能,就是機器的計算能力很強,比較著名的例子是當年IBM的深藍電腦,下象棋超過了象棋大師;第二個階段是感知智能,訊飛的語音合成、語音識別、觸摸、手勢等是感知智能的一部分;第三階段是認知智能,著名的例子還是IBM沃森機器人。在美國脫口秀節(jié)目《危機邊緣》里,它已經(jīng)超過了人類冠軍。它不再是簡單的計算,而是后臺的邏輯和知識的綜合呈現(xiàn)?,F(xiàn)在IBM把沃森往醫(yī)療方向延伸,在美國已經(jīng)初步達到入門級醫(yī)生的級別。
劉慶峰所堅持的創(chuàng)新,是大波浪的源頭創(chuàng)新。也正是因為源頭核心技術(shù)的創(chuàng)新,才在過去15年徹底改變了中文語音產(chǎn)業(yè)被國外巨頭控制的格局,讓語音技術(shù)產(chǎn)品為億萬人使用,實現(xiàn)了“讓機器能聽會說”的夢想??拼笥嶏w正在人工智能的學習上努力,現(xiàn)在主要精力在機器的“能聽會說”上,未來則是“能理解會預(yù)測”。