陳孝良
2月16日,百度宣布全資收購渡鴉科技。百度集團(tuán)總裁和首席運(yùn)營官陸奇表示,憑借其語音與對話技術(shù)的優(yōu)勢,百度在引領(lǐng)新一代人機(jī)交互平臺上擁有巨大的機(jī)會。同一天,彭博社報道稱,華為正計劃開發(fā)自主語音助手服務(wù),瞄準(zhǔn)Siri、Alexa和谷歌助手,涉足語音助手市場。顯然,隨著亞馬遜、Google相繼在語音交互設(shè)備上發(fā)力,市場已經(jīng)看到了這一領(lǐng)域的無限潛力。
智能語音助手成火爆話題
說到語音交互,這其實并不是什么新東西。在中國手機(jī)市場上,若干年前就出現(xiàn)過一些簡單的語音操控工具比如用戶可以對著手機(jī)說話,進(jìn)行發(fā)送短信、撥打電話、點播歌曲等操作,但是這些產(chǎn)品并不屬于智能語音助手。真正的智能語音助手主要是基于人工智能、機(jī)器學(xué)習(xí)等技術(shù),它們能夠理解用戶的日程安排和興趣愛好能夠提供各種信息和服務(wù),甚至能夠智能分析兩人的聊天對話,從而給出快速答復(fù)的建議。
近年來,隨著人工智能技術(shù)的不斷發(fā)展,基于人工智能技術(shù)的智能語音助手也得到了人們的關(guān)注。從亞馬遜的Echo開始,這種外形簡潔美觀,看上去只是一個藍(lán)牙音箱,但卻因為具備智能語音助理能力而內(nèi)藏乾坤的小玩意兒就成為了熱點。除了前文說到的百度和華為,幾乎國內(nèi)外所有IT巨頭都相繼進(jìn)入了智能語音交互市場。
去年10月,英特爾與科大訊飛簽署合作備忘錄。根據(jù)英特爾內(nèi)部消息,英特爾將與科大訊飛合作共同研發(fā)AI芯片,該芯片將麥克風(fēng)陣列、遠(yuǎn)場語音識別等功能集成到SoC當(dāng)中,以形成完整的遠(yuǎn)場語音交互鏈條。此次合作也正式宣告英特爾將進(jìn)入智能語音交互市場。除了英特爾,三星同樣在語音助手領(lǐng)域的積極布局。三星于去年10月份收購了致力于打造開放式人工智能助理平臺的初創(chuàng)公司Viv Labs,同時以80億美元收購哈曼國際,隨后又聯(lián)合GPU巨頭英偉達(dá)投資SoundHound。SoundHound是一家致力于語音識別與搜索的初創(chuàng)科技公司,最初SoundHound的主要服務(wù)是提供和音樂有關(guān)的信息。
Facebook創(chuàng)始人扎克伯格也在2016年花費(fèi)100小時完成了AI管家Jarvis的開發(fā)。扎克伯格及家人可Z用語音向手機(jī)或計算機(jī)下達(dá)指令實現(xiàn)燈光、溫度、電器、音樂和安防設(shè)備的控制操作。Jarvis系統(tǒng)具備的學(xué)習(xí)功能可使其識別主人的偏好模式、學(xué)習(xí)新詞匯與相關(guān)概念。
更有甚者,微軟在Build 2016大會上幾乎完全放棄了實際的產(chǎn)品,而主講人工智能和它可以覆蓋到的那些服務(wù);Google CEO桑達(dá)爾-皮查伊在Google I/O 2016開發(fā)者大會上重復(fù)得最多的詞語也是自然語言處理、人工智能和機(jī)器學(xué)習(xí)。
隨著亞馬遜、谷歌、微軟相繼在語音交互設(shè)備上發(fā)力,市場已經(jīng)看到了這一領(lǐng)域的無限潛力。語音作為人類交流最自然的方式,比文字和圖像更具天然的優(yōu)勢。尤其是亞馬遜Echo的成功,把人們帶到了無屏?xí)r代的門前。智能語音助手也因此成為了非?;鸨脑掝},幾乎掀起了全行業(yè)研究亞馬遜Echo的熱潮。
為何智能語音交互市場如此火爆?
VoiceLabs近日發(fā)布了《2017年語音報告》(The 2017 Voice Report)。報告對亞馬遜Alexa和谷歌Google Home的開發(fā)者和消費(fèi)者進(jìn)行了調(diào)查,總結(jié)了目前的智能語音市場,并對2017年的趨勢做出預(yù)測。該報告預(yù)測,2017年語音產(chǎn)業(yè)結(jié)構(gòu)將按照硬件產(chǎn)品、AI軟件、語音應(yīng)用App、生態(tài)系統(tǒng)服務(wù)相結(jié)合的架構(gòu)繼續(xù)向前發(fā)展。預(yù)計2450萬臺以語音為主要交互方式的智能硬件產(chǎn)品發(fā)貨,市場總量將達(dá)到3300萬臺,市場規(guī)模超過200億美元。而對各種智能語音助手以及語音交互App而言,競爭將更加激烈。
亞馬遜于2014年底推出智能音箱Echo如今已成為美國使用最廣的智能家居產(chǎn)品,根據(jù)CIRP的報告,自2014年11月發(fā)布到2017年1月,亞馬遜Echo系列(包括Echo、EchoDot和Tap)用戶已達(dá)到820萬,同比增長2倍,較2016年11月時的數(shù)據(jù)增長60%。而亞馬遜公司2017年的銷量目標(biāo)是1000萬,銷量激增的背后是Echo正迅速從早期用戶的小眾圈子進(jìn)入大眾市場。
從產(chǎn)品銷量、技術(shù)進(jìn)展,到相關(guān)創(chuàng)業(yè)公司的興起以及資本市場的頻繁運(yùn)作,種種跡象表明,智能語音交互市場的趨勢已經(jīng)明朗,語音是AI領(lǐng)域中最先落地的應(yīng)用之_。這從電子技術(shù)發(fā)展歷程中也可參考類比,以語音為核心的電話是20世紀(jì)最偉大的發(fā)明之一,而其后相當(dāng)長的時間才出現(xiàn)以視頻為主的電視,移動電話同樣遵循了這個規(guī)律。從物理層面來看,語音信號無論是從數(shù)據(jù)量還是計算量方面都低于視頻信號,這在趨勢剛興起的時候,更容易適用于遠(yuǎn)未標(biāo)準(zhǔn)化的硬件體系,但是隨著技術(shù)的發(fā)展,多傳感的融合仍然是根本趨勢。
語音交互市場的全球競爭態(tài)勢初顯
VoiceLabs預(yù)測,亞馬遜或Google今年會通過類似手機(jī)上的推送通知來加強(qiáng)新應(yīng)用的分發(fā),并試圖解決用戶留存率低的問題,而2017年也將是語音應(yīng)用貨幣化的起步元年D當(dāng)智能語音助手充分了解“主人需求之后,應(yīng)有能力在合適的時間主動提示合適的應(yīng)用,既提高用戶的使用價值,又解決了語音應(yīng)用的分發(fā)留存問題。
從全球來看,亞馬遜Echo最有競爭力的對手當(dāng)屬GoogleHome。Google Home自2016年推出以來一直與Echo明爭暗斗,爭搶智能家居中樞的角色。通過亞馬遜和Google在美國“超級碗”投放的電視廣告就能體會到這種競爭的激烈,兩家不約而同地打出了溫馨家庭“懶生活”牌,突出產(chǎn)品智能管家的功能。
美國市場調(diào)查機(jī)構(gòu)Slice Intelligence近日發(fā)布的一份報告,對在線購買Echo消費(fèi)者的性別、年齡、購物習(xí)慣等特征進(jìn)行了統(tǒng)計。某種層面上,這意味著Echo在消費(fèi)者眼中不再是只有極客和技術(shù)控才感興趣的“玩意兒”,而是獲得廣泛認(rèn)同的大眾消費(fèi)品。當(dāng)電子消費(fèi)品獲得了女性用戶的認(rèn)可,并且呈現(xiàn)出女性消費(fèi)者占據(jù)市場購買主導(dǎo)優(yōu)勢后,產(chǎn)品將逐漸成為成熟品類,并迅速出現(xiàn)銷量攀升態(tài)勢。Google已經(jīng)意識到與亞馬遜的差距,正盡力通過收購等方式快速彌補(bǔ)這種差距。2017年1月初,Google宣布收購LimesAudio并表示將會把Limes Audio集成到自己的視頻會議解決方案中,為客戶提供低成本、高質(zhì)量的音頻體驗。此外,微軟、蘋果等公司也在不斷強(qiáng)化自家的智能語音助手。
反觀國內(nèi),類似Echo的產(chǎn)品始終沒有吸引到消費(fèi)者的眼球。一般來說,國內(nèi)相比國外市場有6-18個月的延后,但是以國內(nèi)的技術(shù)水平來看,可能需要的時間更長一些,國內(nèi)在語音助手方面的布局略顯不足。科大訊_飛雖然在技術(shù)鏈條上最為完善,也推出了類似Echo的叮咚產(chǎn)品,但是市場反響一直沒有達(dá)到預(yù)期。百度、阿里、騰訊、360也加大投入做了布局,但是技術(shù)鏈條仍不完善,產(chǎn)品和服務(wù)始終沒有很好的落地。即便在技術(shù)環(huán)節(jié),國內(nèi)活躍的創(chuàng)業(yè)公司相比國外也少了很多,語音識別領(lǐng)域主要還是云知聲和思必馳,NLP領(lǐng)域主要是三角獸、驀然、竹簡等,顯然技術(shù)也制約了國內(nèi)智能語音交互市場的發(fā)展。
可見,在智能語音交互的全球競爭之中,國內(nèi)的AI巨頭似乎才剛剛蘇醒。