本刊記者丨劉勝男 實(shí)習(xí)記者丨朱可也
現(xiàn)如今,語音導(dǎo)航、語音喚醒、語音撥號(hào)、語音轉(zhuǎn)文字等等功能已經(jīng)風(fēng)靡各種終端,智能語音操控已經(jīng)從最初用戶無聊時(shí)的調(diào)侃型應(yīng)用,發(fā)展到如今可真正幫助用戶解決實(shí)際問題的功能性應(yīng)用。智能語音應(yīng)用正走向成熟,終端產(chǎn)業(yè)正迎來一波以智能語音控制為特色的全新革命。
目前,在全球智能語音市場已經(jīng)呈現(xiàn)群雄并起之勢。蘋果、微軟、谷歌三巨頭積極布局,全面著手智能語音在智能終端應(yīng)用方面的研究。而國內(nèi)企業(yè)中,科大訊飛、百度、騰訊、盛大、中興通訊、云知聲等也推出了語音相關(guān)產(chǎn)品。當(dāng)然,發(fā)展的同時(shí),智能語音產(chǎn)業(yè)也面臨著諸如“非交互剛性需求”“只是其他智能產(chǎn)品中間件”“語音信息安全隱患”等等困惑與迷局。
去年11月發(fā)布的《2014中國智能語音產(chǎn)業(yè)發(fā)展白皮書》指出,智能語音技術(shù)在移動(dòng)互聯(lián)網(wǎng)、智能家居、汽車電子等領(lǐng)域的應(yīng)用逐步深入,帶動(dòng)智能語音產(chǎn)業(yè)規(guī)模持續(xù)快速增長。2013年,全球智能語音產(chǎn)業(yè)規(guī)模達(dá)到33.7億美元。其中,中國智能語音產(chǎn)業(yè)規(guī)模達(dá)到16.9億元,同比增長95.6%。2014年,中國智能語音產(chǎn)業(yè)規(guī)模預(yù)計(jì)達(dá)到30.6億元,占全球智能語音產(chǎn)業(yè)規(guī)模的比重將從2013年的8.4%增長到10.7%。智能語音產(chǎn)業(yè)不僅是做語音識(shí)別、做輸入法,還可以滲透出相當(dāng)多的細(xì)分領(lǐng)域,各個(gè)細(xì)分領(lǐng)域都可以有企業(yè)滲透。所以可以看出智能語音領(lǐng)域仍有較大的發(fā)展空間,對(duì)傳媒業(yè)來說同樣如此。
從2013年開始,我國智能語音市場即由寡頭壟斷走向壟斷競爭格局,科大訊飛以54.2%的市場份額繼續(xù)處于領(lǐng)先地位。技術(shù)免費(fèi)、增值服務(wù)收費(fèi)的模式成為重要商業(yè)模式,并不斷對(duì)消費(fèi)者的交互習(xí)慣產(chǎn)生影響,智能語音正在成為主流的交互方式之一。
不過,至少到目前來看,由智能語音引發(fā)的新“交互革命”并未大規(guī)模出現(xiàn),其中原因主要是用戶習(xí)慣尚未養(yǎng)成以及技術(shù)發(fā)展的掣肘。首先,國內(nèi)用戶并不愿意在大庭廣眾中通過語音下達(dá)指令,而且目前對(duì)于國內(nèi)大多數(shù)語音應(yīng)用來說,還局限于標(biāo)準(zhǔn)普通話指令,很少有專門的途徑為鄉(xiāng)音用戶提供便利,不過也有一些語音應(yīng)用已能支持粵語等方言。其次,目前尚處在2G向4G網(wǎng)絡(luò)的前期過渡階段,網(wǎng)絡(luò)不好也會(huì)造成語音交互體驗(yàn)不佳。雖然一些智能語音應(yīng)用已經(jīng)可以通過下載離線語音包的方式改善網(wǎng)絡(luò)不佳的尷尬,不過離線語音包會(huì)占用過多的儲(chǔ)存空間,尤其對(duì)于一些體積很小的可穿戴設(shè)備來說,儲(chǔ)存空間以及隨時(shí)鏈接互聯(lián)網(wǎng)就成為了難題。不過,據(jù)了解,現(xiàn)在智能語音企業(yè)已經(jīng)開始通過“軟硬結(jié)合”的方式來優(yōu)化在可穿戴設(shè)備上的語音交互體驗(yàn)難題,即開發(fā)專門的智能語音芯片。因此,語音技術(shù)和產(chǎn)品正由后裝不斷向前裝發(fā)展,并逐漸向芯片集成方向過渡。
其實(shí),國內(nèi)外的用戶習(xí)慣差異比較大,國外用戶對(duì)語音操控的接受程度較高,而國內(nèi)用戶更傾向于手寫操作。不過,隨著4G網(wǎng)絡(luò)發(fā)展,以及眾多強(qiáng)化語音操作的可穿戴設(shè)備等終端的興起和智能語音芯片的逐步完善,用戶習(xí)慣的培養(yǎng)只是時(shí)間的問題,《中國傳媒科技》認(rèn)為,智能語音必然是未來用戶交互的趨勢所在。
傳媒業(yè)對(duì)于時(shí)代及趨勢從來都有著敏銳的嗅覺,應(yīng)用并創(chuàng)造可以優(yōu)化用戶體驗(yàn)的新技術(shù)并將其變?yōu)槌休d信息的媒介,是媒體一直在做的實(shí)踐與探索。音頻早已被視為媒體發(fā)展的重要趨勢,由此而帶來的媒體與智能語音技術(shù)公司的跨界合作,以及媒體自身對(duì)智能語音的開發(fā)布局,早已悄然起步。
2015年7月,浙江衛(wèi)視《中國好聲音》第四季與國內(nèi)領(lǐng)先的數(shù)字地圖提供商高德達(dá)成合作,發(fā)起為“導(dǎo)航好聲音票選活動(dòng)”,最高人氣的四名好聲音學(xué)員將會(huì)為高德地圖用戶錄制導(dǎo)航專屬語音,打造高德地圖導(dǎo)航語音“追夢版”,讓用戶打開高德地圖,就能聽到好聲音。據(jù)了解,屆時(shí)高德還將在旗下超過三億用戶使用的高德地圖App內(nèi)向用戶推送及介紹《中國好聲音》。
早在2013年底,高德即與科大訊飛合作,采用訊飛全球領(lǐng)先的語音合成技術(shù)合成林志玲聲音的導(dǎo)航語音包。在導(dǎo)航應(yīng)用中,對(duì)如“向左轉(zhuǎn)彎”“前方攝像頭”等固定的語句可以采用原聲,而對(duì)于地名、距離、速度等文字就不可能讓志玲姐姐逐一錄制了。于是在開始合成之前,為林志玲錄了一些音頻,之后的事情就交給訊飛來完成。據(jù)訊飛工作人員介紹,在此過程中,除了設(shè)計(jì)均衡的發(fā)音組合、長短語句外,還專門為體現(xiàn)林志玲的“娃娃音”增添了語氣詞,并結(jié)合導(dǎo)航應(yīng)用做了偏向設(shè)計(jì)。所以能用最短的語料做出最好的效果。未來,不僅僅是明星,通過“個(gè)性化合成”技術(shù),身邊的一切聲音幾乎皆可合成。
2015年7月,湖北廣電與百度正式簽署為期1年的《戰(zhàn)略合作框架協(xié)議》,其中將就智能語音展開合作。湖北廣電充分利用自身在數(shù)字電視終端、移動(dòng)APP、寬帶增值業(yè)務(wù)方面的資源,百度充分利用自身在智能語音識(shí)別、語義分析、內(nèi)容資源等方面的優(yōu)勢,共同開展基于智能語音的數(shù)字電視業(yè)務(wù)交互模式創(chuàng)新,推動(dòng)湖北廣電的電視機(jī)頂盒、數(shù)字電視平臺(tái)、移動(dòng)App、寬帶等產(chǎn)品或業(yè)務(wù)與百度語音開發(fā)平臺(tái)的全方位對(duì)接,雙方共享所產(chǎn)生的應(yīng)用創(chuàng)新專利。
2013年12月,廣東省廣播電視網(wǎng)絡(luò)股份有限公司與科大訊飛達(dá)成戰(zhàn)略合作。雙方將充分依托各自行業(yè)領(lǐng)域的領(lǐng)先優(yōu)勢,共同致力于推動(dòng)智能語音技術(shù)在有線電視領(lǐng)域的應(yīng)用推廣,探索建立符合我國數(shù)字電視觀看模式的智能語音應(yīng)用系統(tǒng),提升智能終端在頻道切換、視頻點(diǎn)播、節(jié)目查詢、界面操作等全業(yè)務(wù)的智能性和易用性,讓廣大用戶通過自然語音即可實(shí)現(xiàn)廣電終端和服務(wù)的整體智能人機(jī)交互手段,真正實(shí)現(xiàn)讓用戶從“看電視”跨越到“用電視”乃至“玩電視”的新體驗(yàn)。
當(dāng)人們逐漸習(xí)慣使用智能語音助手打電話、發(fā)短信、查天氣、聽新聞、記筆記、玩電視之前,何不伴隨或超越這些先行者,把智能語音技術(shù)納入自家媒體轉(zhuǎn)型的方案中。未來的智能媒體需要有智能的“嘴巴”和“耳朵”,當(dāng)然智能語音技術(shù)將不僅是“能聽會(huì)說”的語音應(yīng)用,它會(huì)“能理解會(huì)思考”,變得更聰明。隨著智能化浪潮席卷各行各業(yè),“無語音,不智能”將不再僅是口號(hào)而已。