葉麗麗
通過在教育、智慧城市、消費者業(yè)務等三大板塊的漸次布局,低調潛行十數年的科大訊飛已逐步探索出政府補貼這一固有商業(yè)模式之外的更多變現路徑。
《財經天下》周刊=EW
胡郁=HY
EW:科大訊飛的業(yè)務布局情況現在是怎樣的?
HY:科大訊飛現在的業(yè)務布局主要是兩部分:第一是通過人工智能技術和平臺級業(yè)務,將語音識別、自然語言處理能力授權給第三方,或者與其他公司合作。目前科大訊飛重點關注的領域是移動互聯網、智能家居、電信運營商智能語音服務、智能車載系統和政府便民工程。我們與第三方合作是通過科大訊飛云平臺實現的,這是我們的語音能力向各個行業(yè)輸出的一種方式。通過這個方式,我們很容易發(fā)現平臺上面的各種應用的優(yōu)缺點,我們能夠獲得很多有價值的數據。第二,科大訊飛正在將自己的技術與產業(yè)結合,目前我們在教育行業(yè)做得還不錯。我們現在還有一個“訊飛超腦”的項目,這是科大訊飛面向人工智能領域開展的重大技術攻關項目,目標是幫助科大訊飛從機器“能聽會說”到“能理解會預測”。
EW:創(chuàng)業(yè)初期遇到過哪些突出的問題?
HY:我們是1999年底成立的,到2004年才實現盈虧平衡,在這期間確實遇到了很多問題。主要是兩個方面:首先,那時候技術并不成熟。在2000年的時候,國內有很多語音技術創(chuàng)業(yè)公司,科大訊飛是唯一一家生存下來并且發(fā)展壯大的,因為我們當時選擇的路徑還算成功,語音合成在當時是相對成熟點的技術,雖然讓機器說話也說不太好。那些選擇做語音識別的公司,很多沒有成功,就是因為當時這個技術太不成熟。
另外,在中國做生意,比較容易成功的商人,可能是比較懂人際關系的,有一定市場經驗的,但我們那時候都是一群學生出來創(chuàng)業(yè),包括董事長劉慶峰,1998年還在讀博士,1999年出來,對商業(yè)模式、公司管理等方面沒有什么概念,經歷了很長的一段摸索期。
在中國,做產品和市場的人,比做技術的人更容易成功,這是一個普遍規(guī)律。在中國做技術,很多都是在國家體制內,像研究院這樣的地方或者國營企業(yè);如果要民營的話,那么在中國的環(huán)境下尋找到合適的商業(yè)模式并且做大其實是很難的一件事情,所以中國民營的科技創(chuàng)新公司不多。
EW:發(fā)展到現在,經歷過哪些關鍵時刻?
HY:我覺得有這樣幾個關鍵時刻:第一個是在2000年的時候,我們第一次能夠把我們的語音合成技術賣給大客戶,就是華為。那時我們的軟件還很不穩(wěn)定,經常崩潰,華為的團隊說我們把他們當成測試員了。然后我們的創(chuàng)始人團隊,三天三夜沒睡覺,把軟件做穩(wěn)定了,就是為了能夠通過華為的測試。
第二個關鍵時刻是,我們在2004年實現了盈虧平衡。當時我們找到了一種可行的商業(yè)模式——為一些大的客戶提供服務,比如說呼叫中心、銀行、電信等,賺到了一些錢。而同時期的很多同樣的公司要么沒活下來,要么就發(fā)展得很小。
第三個關鍵時刻就是我們2008年上市,這標志著我們在資本市場上開始有一個很好的渠道,我們可以更快地發(fā)展。
還有一個關鍵時刻就是,在2009年的時候,我們注意到,移動互聯網來得很快,手機輸入這塊將會有需求,我們就做了一個訊飛語音輸入法,現在是國內第二大輸入法,第一是搜狗。另外,我們做了一個語音云開放平臺,現在已有16萬開發(fā)者連接到我們平臺上,連接的設備超過了8個億。這兩者讓我們在移動互聯網時代能夠占據一席之地,也讓我們在消費者業(yè)務層面有了很大的一個突破。
最后一個關鍵時刻就是,我們在2009年的時候,開始在教育業(yè)務上有了突破。我們做到了可以用機器評價學生發(fā)音的準確程度,還可以評價英語口語的表達水平。另外,我們可以讓機器識別出手寫的卷子,實現自動批改。我們現在要攻克的是提高機器的理解能力,讓機器人能夠參加高考。目前機器人參加高考勉強能及格,我們原來的計劃是10年內讓機器考上一本,現在改成3年內考上一本。人和機器其實是相反的:人0到6歲學常識,這對人是比較容易的,人培養(yǎng)理解能力很容易,但是學習知識很難;而機器能夠裝下很多知識,但是它不懂常識,所以有人說機器達到了6歲小孩的水平,那是用人的成長階段去衡量,其實是錯的。
EW:為什么科大訊飛會選擇教育這個領域?
HY:一方面,就是我們想為國家做點貢獻,我們的技術能夠幫助教育行業(yè)更先進;另一方面,就是我們覺得教育有比較廣闊的商業(yè)前景。我們有的是政府采購給學校,也有直接賣給家長和學生的產品。我們是希望能夠成為國內教育方面的人工智能的最大參與者。
我們進入教育行業(yè),首先是從普通話水平測試開始,然后是英語口語水平測試,后來我們進入英語教學的課堂,提供一些智能設備和軟件,然后我們又參與了考試,實現自動批改。學校里面會有很多智能化的系統,我們把這些東西綜合起來,提供一個整體的方案?,F在我們是國內教育領域用人工智能提供整體解決方案的最大廠商。
EW:這些年來,科大訊飛有哪些事情是具有開拓性意義的?
HY:第一個我覺得是把語音合成能夠做到實用化,這是公司成立的基石;第二就是把語音識別做到了可用化——我們不是最早做語音識別的,但我們是把技術做得最成熟的;第三個就是我們將語音測評帶進學校,開創(chuàng)了一個新局面,這是我們商業(yè)模式上的創(chuàng)新,我們現在還在努力尋找其他新的商業(yè)模式。
EW:相較時下眾多創(chuàng)業(yè)企業(yè),你認為科大訊飛最為顯著的特色是什么?它和別的互聯網技術公司有什么差別?
對于創(chuàng)業(yè)17年來公司營收仍主要依靠政府補貼這一頗受爭議的商業(yè)模式,科大訊飛輪值總裁胡郁直言,這與以技術為核心的中國初創(chuàng)企業(yè)的特殊性有關,如果早期沒有政府扶持,這類企業(yè)將難于生存。
HY:科大訊飛本質上是一個科技創(chuàng)新型公司,科技創(chuàng)新型公司的標準,不是看它賺了多少錢,而是看它的技術是不是世界上最先進的。我們最突出的特點是,我們一直在做核心技術創(chuàng)新和原始創(chuàng)新,不是在別的技術基礎上進行微創(chuàng)新,而是在做核心技術的突破性創(chuàng)新。
我覺得我們和別的互聯網技術公司最大的差別是,我們比較沉得住氣,方向很明確。很多公司什么方向熱就做什么,比較浮躁,我們相對來說比較執(zhí)著于自己原來確定的方向。
很多人對我們的評價是,做了十分才說七分。這是優(yōu)點也是缺點:優(yōu)點是大家對我們的印象是比較扎實的,缺點是影響力方面可能宣傳不夠。
EW:有人說你們在風格上更像一家硅谷公司。你認同這種觀點嗎?
HY:硅谷技術創(chuàng)新型公司的最大特點是,它不僅僅技術領先于全球,它的商業(yè)模式也是領先于全球的,而且美國公司有個很重要的特點,它們是全球化的公司。中國雖然現在有很多互聯網企業(yè),但在全球化方面還是不夠??拼笥嶏w現在在語音技術方面,無論是合成還是識別,都能夠在中文領域做到最先進,但我們也有需要突破的地方。很多人覺得我們低調,其實我覺得有一個原因是,我們的商業(yè)模式不能夠跟當前世界上最主流的商業(yè)模式吻合,所以這也是科大訊飛面臨的最大的挑戰(zhàn)。
EW:能否在商業(yè)模式上稍作展開?
HY:我們原來的商業(yè)模式是To B的,就是售賣技術,用技術跟別人合作?,F在我們的目標是,用技術引起一個產業(yè)的突破,從而建造新的產業(yè)生態(tài)系統。我們現在探索的新的商業(yè)模式是,更靠近消費者,就是要著重To C。這不一定得直接面對消費者,我們可以用更靠近消費者的業(yè)務來達到這個目標,比如我們和汽車廠商合作,汽車內的語音業(yè)務就是直接面對消費者的。
EW:國內語音市場這些年在你看來有哪些重要變化?
HY:2000年以前,語音并不被大家關注,那時還沒有什么大的語音公司,主要是國外一些大企業(yè)像摩托羅拉、IBM等在中國做研究。那么在2000年到2010年之間,以科大訊飛為代表的國內公司逐步把語音合成和語音識別市場搶了回來,現在來看,外國公司在中國的語音業(yè)務已經很少了。
近幾年有兩個新的變化:一個是以BAT為代表的互聯網公司已開始進入語音市場,并且投入了很大力量。但他們做語音是為自己的生態(tài)服務的,并不是想從這上面賺錢,實際上也賺不到什么錢。現在專業(yè)做語音的最大的公司應該是科大訊飛。另外一個就是,很多小的創(chuàng)業(yè)公司也開始進入這個市場,但做得都不是太好,技術很重要。
EW:巨頭的進入會給你們帶來壓力嗎?
HY:當然。壓力不是來自于技術,我們的技術是最先進的,壓力來自于商業(yè)模式。這個沒辦法去模仿哪家公司,都要靠自己慢慢去摸索。一個公司如果想要長期保持領先,不僅僅是技術能力,商業(yè)模式上一定要走出自己的道路并建立起自己的生態(tài)。
我們原來做的是To B ,現在To B 的公司很多,如果想要成為一個生態(tài)的話,只有這個肯定不夠。我們一定要讓生態(tài)里有C端用戶,這就會有很多變現方式,只要我們提供的服務是用戶需要的,并且是高質量的,我們就可以從用戶手里賺到錢。
現在我們還是免費的服務,我們通過這種方式收集用戶數據,根據這些數據來優(yōu)化產品,當產品體驗足夠好時,用戶會愿意付費。當然我們也可以有其他收費方式,提供給用戶的產品可以是全程免費的,在用戶和我們的機器交互時,機器會記住用戶的喜好和需求,這時智能終端可以給用戶推薦產品,我們可以向產品提供商收取費用,類似于廣告費。當然,交互是最重要的,將來在車上、電視上、音箱上甚至玩具上都能夠實現人機交互。我們現在的語音合成技術已經很成熟了,機器可以發(fā)出明星的聲音,我們要不斷增加語音交互中的用戶體驗。
EW:語音市場的競爭還不算太激烈吧?
HY:在發(fā)展的過程中,如果大家朝著一個方向的話,自然而然就會有競爭。但是現在的問題在于,我們并不知道將來的物聯網時代會發(fā)展成什么樣,誰也沒有一個準確的方向。在一個新的時代里,觀察過程會有三個階段:第一階段是混沌期,就是大家都不知道將來會發(fā)生什么;第二階段叫形成期,就是大家已經有方向、有規(guī)劃地發(fā)展了;第三階段叫決勝期,就是各家開始激烈競爭賽跑,像滴滴和快的當時一樣。語音市場現在處于混沌期到形成期的過渡階段,大家都不知道怎么干,還在互相觀望,互相挖點技術人才,摸索摸索方向。
EW:科大訊飛會是第一個找到方向的嗎?
HY:我們一定是,但是做出來怎么樣,還不知道,謀事在人,成事在天。我們現在的方向是,軟硬一體化、云端一體化、技術服務一體化,我們不能做一個純技術的公司,要把技術和內容和服務結合。比如說語音合成,我們就一定要和明星名人資源結合,我們現在可以達到讓羅振宇給你讀文章的水平。
語言是柄雙刃劍,在擋住外國產品進入中國的同時,自己的產品進入其他國家也很難。胡郁介紹稱,科大訊飛英語產品做得還不錯,但西班牙語、法語、德語等其他語言產品還不行。
EW:科大訊飛得到過一些負面評價嗎?
HY:訊飛的體量在去年的時候只有二十多億,今年也就四五十個億?,F在市盈率已達到150倍。我們的市盈率不太穩(wěn)定,因為大家看好一個東西,但這個東西一直沒出來,所以就會不穩(wěn)定。很多人說我們都在靠政府補貼,其實是這樣,一個以技術為核心的公司,在中國如果不依賴政府,肯定成長不起來,但過度依賴政府,將來的空間會少一點。我們一開始的確就是依賴政府補貼,否則一下子進入市場,是養(yǎng)活不了自己的,只有在跨過一定的技術門檻后,我們才能靠市場養(yǎng)活自己。我們現在已經在找更合適的商業(yè)模式,以減少對政府的依賴。我們現在看到很多人工智能公司,他們已經找到了賺錢的方法,但這對我們來說仍然是個挑戰(zhàn)。
EW:其實現在很多人在懷疑你們的盈利能力。
HY:這種懷疑是對的,我們雖然說在很多測評上面取得了不錯的成績,但是并沒有達到讓大家信服的程度。事情還沒成之前,你說你是英雄,誰信?武松打虎,得把老虎打死了,結果出來了,大家才把他看成英雄,現在我說我能打死老虎,誰信呢?我們現在就是在努力證明自己。
EW:相較北上廣深,合肥的商業(yè)環(huán)境是不是差了一點?為什么一直留在合肥?
HY:坦白講,合肥這個地方很適合做研究,但商業(yè)氛圍和商業(yè)創(chuàng)新環(huán)境確實和北上廣深杭相比是有巨大差距的。但我們還是一直留在合肥,如果我們不是在合肥,我們的人早已經被挖了七八遍了,在我們這邊拿50萬年薪的人,騰訊可以給150萬。我們?yōu)槭裁茨茉诤诵募夹g上持續(xù)深入,并且取得領先世界的水平,就是因為在合肥能夠真正靜下心來做研究。在北京給他100萬的薪水,馬上就會有人拿200萬來挖,工作一有變動,研究就會停滯下來。北上廣太浮躁了,這些地方房價那么高,讓人怎么安心做研究?我們現在在京津冀,上海廣州深圳杭州都有分部,但我覺得做研究的人,還是來合肥好,一線城市安不下心來。
EW:如果你們工資比其他公司低的話,用什么來吸引人才?
HY:追求。世界上還是有一批有追求的人,就是在中國用人工智能改變世界。
EW:資本對于你們是一個什么作用?
HY:我覺得一個公司一定要借助資本的力量,資本是最重要的。我們不能只靠追求來生活,我們要給這些做出巨大成績和貢獻的人體面的生活。有了資本,我才能真正吸引到優(yōu)秀的人,解決他們的后顧之憂,他們想要去旅游的時候就能夠去世界上任何一個國家去旅游,我們要給他們與能力匹配的薪資。
EW:除了受到資本的青睞外,你們自己也有投資。你們在投資上的構想是怎樣的?
HY:戰(zhàn)略投資是圍繞著我們的戰(zhàn)略布局來投。我們現在有三大戰(zhàn)略板塊,教育、智慧城市,還有消費者業(yè)務。
EW:科大訊飛的生態(tài)能描述一下嗎?
HY:我們現在首先要在教育這個方向做成一個核心技術支撐的開放平臺,大家有什么內容都可以放上來,可以對接到學校;在智慧城市方面,我們希望能夠通過大數據和人工智能,為交通、社會信息化管理、醫(yī)療等提供智能服務;最后在消費者業(yè)務上,我們要建立生態(tài)入口,讓用戶用語音的方式與機器進行交互,讓機器越來越了解用戶的需要。
EW:現在每年研發(fā)投入有多大?
HY:收入的25%。主要用于幾個方面,核心技術、云計算和各個領域應用的開發(fā)。我們現在還有很多需要突破的,像核心技術現在其實還沒有達到我們想要的水準,我們還要持續(xù)努力,因為技術爆炸是一個持續(xù)的過程,不是說一瞬間的,而是在一點點改進中獲得的。
EW:作為科大訊飛重點攻堅的領域,目前人工智能在你看來處于什么階段?
HY:現在業(yè)界談人工智能分成三個階段,計算智能、感知智能和認知智能。人工智能目前處于感知階段。人在計算智能上比機器人差,感知智能上好一點,認知智能上會更好,所以說,我們現在的切入點叫語音和語言為入口的認知革命。人類最早成為世界的統治者是因為人類發(fā)生了認知革命而不是農業(yè)革命。機器人也需要認知革命,機器人認知革命的第一歩就是先理解語言,我們現在的使命是要讓機器能聽會說,能理解會思考。接下來我們把這個技術跟很多行業(yè),如醫(yī)療、衛(wèi)生、法律等結合起來。
EW:人工智能為什么這兩年這么火?過幾年它還會這么熱嗎?
HY:人工智能能火起來,主要是因為核心算法、數據量和應用模式三個方面成熟了,因此它在技術上可以大規(guī)模應用于產業(yè)??拼笥嶏w在核心技術方面還比較有優(yōu)勢,在數據的收集上,現在的“訊飛語音云”用戶超過8億,開放云平臺的應用項目8萬多個,我們正在嘗試各個場景的應用。人工智能過幾年是不是還能這么火還很難說,現在大數據已經不那么熱了,就是大家接受了這個概念以后就沒人天天喊了。
EW:現在你們的挑戰(zhàn)主要來自哪些方面?
HY:一個就是核心技術還需要時間來突破;另一個就是我們要尋找到合適的商業(yè)模式;第三就是我們需要很多綜合性人才,不僅僅是技術人員,還需要會市場的、懂產品的、懂宣傳的、會做品牌傳播的人。坦白講,我們原來是一個To B的公司,在品牌宣傳方面沒什么經驗,現在需要更多這樣的人。
EW:在產品出口方面,有沒有遇到一些問題?
HY:問題很大。我們的產品在國際上還沒有產生什么效益。我們最大的問題是,語言是個雙刃劍,我們可以擋住外國產品進入中國,但是我們進入別的國家也很難。我們現在英語做得不錯,但在西班牙語、法語、德語等其他語言國家,我們就不行。
EW:科大訊飛的發(fā)展目標和愿景是什么?
HY:愿景就是三個階段吧:第一個階段,我們希望成為中國智能語音產業(yè)領導者和人工智能產業(yè)先行者,其實我們已經達到了,然后我們現在的目標是銷售達到100個億,市值達到1000億人民幣;第二個階段,我們希望能夠在10年內成為中國人工智能領導者,銷售額達到1000個億;第三個階段,我們的遠期目標是成為全球人工智能領導者和重要參與者。現在我們的盈利我是覺得不滿意的,我們其實離一個優(yōu)秀的公司還有差距。