到2013年,大量的應(yīng)用開發(fā)商、終端移動設(shè)備和用戶都將開始向語音和人機交互的生活領(lǐng)域遷徙。
在街頭如果想起了好友,你可以對著手機說“動態(tài)消息”,那么它會幫你打開所有動態(tài)新聞鏈接;如果說“附近的朋友”,那么它會告訴哪些好友在你的附近;如果你說“朋友的音樂”,那么它會為你播放你最近和好友分享的音樂,總之包括朗讀新的訂閱消息、短信息、日程安排、更新自己的狀態(tài)、查看在線好友、查看附近的人等等,你可以聽一切Facebook上的內(nèi)容——這是最近在都柏林網(wǎng)絡(luò)峰會上發(fā)布的一款應(yīng)用WonderVoice。盡管這款應(yīng)用仍然無法讓手機理解諸如“我的朋友現(xiàn)在在干什么?”之類的具體問句,但是面向社交網(wǎng)站的語音應(yīng)用卻讓人耳目一新,對于年輕人來說,用語言進行交流,聽到朋友的聲音比看簡單的文字更有趣。
自從2010年,Siri這個由蘋果與全球最大的語音識別廠商Nuance合作整合的語音助理推出之后,短短兩年時間里,Siri已經(jīng)成為最炙手可熱的技術(shù)產(chǎn)品,Siri代表的語音控制和人工智能就被科技界備加推崇。去年10月蘋果公司在iPhone 4S上推出Siri這款語音控制應(yīng)用之后,今年最新推出的IOS6.0中進一步升級了Siri,在其支持的15個國家和地區(qū)語音中,特別增加了中國普通話、粵語和閩南話。
科技巨頭們早已發(fā)現(xiàn)了語音助理背后的商機。Siri的價值遠(yuǎn)遠(yuǎn)超過一個語音識別軟件,作為用戶的私人生活助手,讓用戶通過手機讀短信、詢問天氣、語音設(shè)置鬧鐘等,還可以通過Siri搜索餐廳、電影院等生活信息,直接收看各種相關(guān)評論,并且進行預(yù)定,而且隨著Siri越來越智能,針對用戶詢問給出的回答,不斷學(xué)習(xí)心得聲音和語調(diào),Siri將會繞過搜索,掌握用戶的更多瀏覽行為數(shù)據(jù)以及與siri相關(guān)無限量應(yīng)用都顯示出未來將迎來爆炸性的增長。
事實上,語音已經(jīng)成為今年最熱的技術(shù)趨勢之一。《連線》雜志在評選siri為2011年5大具有深遠(yuǎn)影響科技事件之一,而其創(chuàng)始人凱文·凱利在公開演講中把語音和手勢這樣的互動在科技中的應(yīng)用看作是影響未來20年網(wǎng)絡(luò)世界的重要趨勢。
語音是人類社會最基本最自然的交流工具之一,也是創(chuàng)造人類的一個拐點,語音將我們的思想轉(zhuǎn)化為符號,并指導(dǎo)和控制我們的行為。當(dāng)電腦誕生之后的相當(dāng)一段時期里,人們都是運用手指敲入符號來與機器交流, Siri與iPhone 4S整合給業(yè)界帶來了很大的驚喜,電腦終于可以通過自然的語音與人類互動了,而今對于移動互聯(lián)網(wǎng)和智能手機而言,語音將是人類進行互動的效率更高更自然的工具,仿佛讓機器也具有了生命。
也許,對于很多技術(shù)人來講,語音產(chǎn)品仍然是美麗的陷阱,從上世紀(jì)90年代末IBM公司發(fā)布的ViaVoice 98 連續(xù)語音識別產(chǎn)品, 到2006年比爾.蓋茨預(yù)言未來將在操作系統(tǒng)中實現(xiàn)自然語音的人機交互,并支持微軟收購了TeLLME,掀起的語音熱潮,無數(shù)實驗室和技術(shù)人員前赴后繼地投入到語音控制與人工智能的幻象之中,語音控制一直沒有真正步入人們的互聯(lián)網(wǎng)生活。不過今天,日益成熟的移動互聯(lián)網(wǎng)環(huán)境、云計算和大規(guī)模數(shù)據(jù)的積累,以及大量智能終端的普及都讓語音的世界真正臨近爆發(fā)。不久前,IBM超級計算機“沃森”(Watson)在智力競答節(jié)目《危機邊緣》對海量數(shù)據(jù)信息迅速完成分析的能力,iOS系統(tǒng)的風(fēng)行,各種語音應(yīng)用的崛起都讓人不禁對語音和人工智能軟件嵌入到流行電子消費產(chǎn)品后的前景充滿期待——2013年大量的應(yīng)用開發(fā)商、終端移動設(shè)備和用戶都將開始向語音和人機交互的生活領(lǐng)域遷徙。
爭奪入口
Yelp的聯(lián)合創(chuàng)始人兼CEO杰瑞米·斯托普爾曼(Jeremy Stoppelman)是蘋果各種活動的??停谕饨缈磥?,消費者點評網(wǎng)站Yelp已經(jīng)成為蘋果對抗谷歌的重要武器。蘋果在Siri后端鏈接了知識引擎Wolfram Alpha并集成了餐館點評網(wǎng)站Yelp、電影點評網(wǎng)站Rotten Tomatoes和餐館預(yù)訂服務(wù)OpenTable等大型消費內(nèi)容網(wǎng)站,讓用戶可以使用Siri直接搜索所需要的餐館、酒店等生活信息,查詢附近的餐館時,幫助用戶做出最便捷的選擇。
而Yelp也同樣借助Siri成為美國,最有價值的消費內(nèi)容網(wǎng)站。從2010年開始,Yelp開始加速擴張,覆蓋位于美國本土的20多個地區(qū)和加拿大、歐洲等地區(qū),商家服務(wù)范疇也從餐飲、購物擴展到包括牙醫(yī)、機械師、水管工等家庭生活服務(wù)的各個領(lǐng)域。人們通過Siri隨意搜索,就能快速查找到這些日常信息,這也是繞過谷歌這些傳統(tǒng)搜索引擎,也分食谷歌的核心業(yè)務(wù)的廣告收入?!疤O果采取不同的策略,專注于搜索宇宙中的一個子集,與谷歌的競爭的不是關(guān)鍵字,而是爭奪細(xì)化執(zhí)行每天數(shù)以百萬計的搜索算法。”亞馬遜搜索部門前高管,風(fēng)險投資家David Tennenhouse說,“餐館,電影,體育,商家信息,地圖和位置 ——這些垂直行業(yè)的搜索最理想的方法是快速,易消化的結(jié)果,而不是谷歌?!?/p>
很快谷歌就意識到了Siri的威脅,谷歌執(zhí)行董事長埃里克施密特(Eric Schmidt)公開表示出蘋果的語音助理服務(wù)Siri有可能威脅谷歌的搜索業(yè)務(wù)。谷歌仍然是搜索引擎的霸主,谷歌每月的搜索量高達1000億次,但是不能夠清楚地理解你的意思并且能夠給出最想要的結(jié)果,用戶將會最終拋棄谷歌而選擇其他入口,這也是谷歌隨后推出Google now的動力。今年谷歌也面向移動領(lǐng)域推出了足夠令業(yè)界震撼的Google Now語音識別搜索服務(wù),這是谷歌繼Google Voice Search之后面向移動互聯(lián)網(wǎng)的又一戰(zhàn)略性產(chǎn)品。另外,谷歌在語音導(dǎo)航服務(wù)上也與蘋果決裂,蘋果不得不在iOS 6中放棄體驗更好的谷歌地圖而使用自家地圖服務(wù),此前,蘋果希望在iOS 6中提供免費的語音導(dǎo)航服務(wù),而谷歌則堅持,語音駕駛導(dǎo)航將是移動版地圖服務(wù)中一項少見的可以收費的項目,施密特要讓蘋果看到語音導(dǎo)航絕對是未來爭奪用戶一爭高下的“殺手锏”。
同樣,微軟也在Win8和最新的Surface平板電腦中整合了語音識別技術(shù)的全新系統(tǒng),希望借助Kinect軟件開發(fā)包作為微軟明年最重要的利潤增長點之一。不久前,微軟首席執(zhí)行官鮑爾默表示,微軟從來沒有放松對語音和人工智能的研究和巨資投入,微軟未來的重點是開發(fā)一種全新的觸摸、手勢和語音的自然操作方式,接下來Kinect系統(tǒng)將支持Win8系統(tǒng),PC和移動設(shè)備都將呈現(xiàn)幾乎與Siri類似的體驗,更不要說微軟正在全力支持的搜索“必應(yīng)”。就連三星、聯(lián)想等終端廠商也開始推出類似Siri的語音輔助軟件,顯然語音已經(jīng)是各大平臺公司集結(jié)的戰(zhàn)場。
如果說語音幫助蘋果繞開谷歌和傳統(tǒng)的關(guān)鍵字搜索,不如說語音作為一種輸入和控制的自然工具將是未來搜索的重要裝備,將掌控未來移動互聯(lián)網(wǎng)的入口?!斑@個入口可以是用戶開啟自己的手機終端的入口,也可以是遨游移動互聯(lián)網(wǎng)的統(tǒng)一入口?!卑俣裙矩?fù)責(zé)多媒體業(yè)務(wù)的余凱博士解釋說,比如就單機而言,用戶通過聲紋登錄自己的手機,用戶的聲音和設(shè)置的語言就是雙重密碼,用戶也可以直接通過語音直接調(diào)用手機中的聯(lián)系人信息,以及手機中的視頻文件等。
而在移動互聯(lián)網(wǎng)入口上,百度把語音看做是是跨領(lǐng)域資源整合的紐帶。比如,最近百度歌曲搜索已在公司內(nèi)部開始測試,這也被認(rèn)為是百度在語音識別搜索領(lǐng)域,首次進行嘗試和探索。在未來的語音搜索中,如果你聽到一首好聽的歌曲,卻不知道歌曲名稱,完全可以對著電腦哼唱一段歌曲就搜索到,或者系統(tǒng)會自動搜索含有相關(guān)歌曲曲調(diào)的文件提供給用戶;如果這個文件或者應(yīng)用時來自互聯(lián)網(wǎng)和其他公司的資源也可以進行調(diào)用,或者由語音直接導(dǎo)入相關(guān)第三方App,如同余博士所說,百度通過把語音加入到全面開放的云平臺,來聚集更多第三方開發(fā)者利用這些免費提供語音技術(shù)進行開發(fā),也就是圍繞語音建立了一個生態(tài)系統(tǒng),后臺整合足夠的本土資源,才能超越蘋果和谷歌。
“在百度即搜即用的概念下,所有服務(wù)都將有一個語音的外殼,等待語音的鑰匙開啟”。余凱博士說,語音是百度未來最重要的技術(shù)高地之一,在廣義的語音移動搜索、垂直搜索、語音輸入法等多個產(chǎn)品領(lǐng)域進行基礎(chǔ)應(yīng)用開發(fā)外,還將重點發(fā)展語音指令和框搜索。這將是百度實質(zhì)性掌握語音入口的關(guān)鍵。
終端誘惑
最近應(yīng)用開發(fā)商Viper對smartstart智能汽車控制應(yīng)用進行更新,加入了對Siri語音指令平臺的集成,用戶可以在搭載iOS 6的iPhone 4S或者iPhone 5手機上,直接通過Siri平臺來啟動SmartStart應(yīng)用程序。在啟動應(yīng)用之后,汽車也就會被啟動,同時還可以對車門進行鎖定或者解鎖操作。想象一下,如果他人尤其是家中的小孩,因為失誤或者調(diào)皮啟動了停在車庫中的汽車,那么用戶就可以利用SmartStart的遠(yuǎn)程控制功能,對汽車進行鎖定或者解鎖操作,天冷時,駕駛員完全可以在出門前5分鐘提前啟動汽車,如果遇到緊急情況需要提前離開,用戶完全可以將車停留在停車場,并且不需要把鑰匙寄存在第三方的手中,其他人只需要利用手機來控制汽車,就可以把車開走。作為駕駛員和汽車的信息交換平臺,smartstart給用戶增加了獨特的價值,用戶只要用智能手機和語音就可以輕松完成對愛車的遠(yuǎn)程控制。
語音對于汽車的誘惑更多來自于導(dǎo)航,有了語音導(dǎo)航,就相當(dāng)于給路癡們提供了一個道路向?qū)?,一個與汽車融合的語音系統(tǒng)可以比單獨電子導(dǎo)航儀更好地操控汽車。因此,大部分汽車企業(yè)都在自有語音導(dǎo)航領(lǐng)域投入了相當(dāng)大的開發(fā)費用,比如,寶馬的前期投入巨大,寶馬的“語音控制系統(tǒng)”最多可識別500個預(yù)設(shè)詞條,可操控電話、空調(diào)、導(dǎo)航和音響系統(tǒng)等功能。免提麥克風(fēng)既可收音,還可以過濾掉背景噪音,這項技術(shù)已經(jīng)成為寶馬少數(shù)幾款高端車的奢華配置;福特的語音導(dǎo)航系統(tǒng)也以服務(wù)免費,升級方便,可擴展性強等特性作為殺手锏,而榮威的InkarNet也借助科大訊飛的語音技術(shù)搭建了一套獨特的語音導(dǎo)航系統(tǒng)在汽車領(lǐng)域一枝獨秀。
事實上,移動互聯(lián)網(wǎng)時代需要通過按鍵或者觸屏的傳統(tǒng)方式完成的操作開始偏向于更為方便的語言控制化,類似于Siri這樣的語音助手功能已經(jīng)開始普及,越來越多的應(yīng)用程序也都開始加入語音平臺指令集,而未來的手機、汽車、電視每個終端都可以通過聲音進行各種個性化的操作,不少國內(nèi)終端廠商已經(jīng)把寶壓在了語音上。
此前,聯(lián)想集團CEO楊元慶在聯(lián)想移動互聯(lián)戰(zhàn)略發(fā)布會上表示,他非??春貌⒖粗卣Z音功能,聯(lián)想在中文語音交互領(lǐng)域,將不會落后于其他廠商。聯(lián)想集團幾年前就已經(jīng)開始語音技術(shù)的研發(fā),聯(lián)想最新推出的樂Phone系列智能手機已經(jīng)具備簡單的語音命令功能,未來會在各種核心應(yīng)用上完善語音控制。
而家電廠商方面,“內(nèi)置Ciri語音智能交互”的語音電視就是今年長虹公司的重頭戲。據(jù)介紹,語音智能電視不用遙控器,僅憑語音指令就能完成換臺、電視節(jié)目查詢、網(wǎng)絡(luò)瀏覽/搜索、文字輸入等各種操作。用戶只需告訴語音電視要做什么,電視就可以快速地為用戶切換到相應(yīng)的應(yīng)用界面,徹底解放用戶的手腳。長虹在科大訊飛的語音識別系統(tǒng)上面研發(fā)的語音交互系統(tǒng),讓語音電視還可以辨別男女不同的嗓音,根據(jù)聲音判斷用戶的年齡,與各年齡段的用戶“貼心”交談,還特別搭配了東北話、重慶話、湖南話、粵語等地方方言,讓電視更準(zhǔn)確地理解用戶的需求。
押寶在智能電視,而不再追尋日韓企業(yè)在屏幕畫質(zhì)上面做文章是需要魄力的。長虹就認(rèn)為,電視機的大屏幕,高畫質(zhì)是其他的終端無法替代的,要想提高電視作為終端的吸引力必須要實現(xiàn)人機交互,必須改變電視作為終端的封閉和單向,被動式傳播方式。因此,現(xiàn)在越來越多的彩電企業(yè)把關(guān)注點從屏幕轉(zhuǎn)移到應(yīng)用上,更多智能電視終端廠商投靠谷歌,而語音、智能、人機交互功能將為彩電行業(yè)將迎來用戶體驗時代。
顯而易見,在未來科技公司圍繞系統(tǒng)、硬件、服務(wù)器和云的平臺戰(zhàn)爭中,語音正是未來平臺競爭的重要一局。