洪蕾
幾個月前,一條流行于網(wǎng)絡(luò)的山東司機(jī)大哥與其車載智能語音的爆笑對話視頻,將人們的關(guān)注點再度聚焦至人工智能領(lǐng)域。隨著Magic和Operator國外走紅,擁有一個萬能的人工智能助理,只需一條語音就能獲得相應(yīng)服務(wù),是人們夢寐以求的場景。依托人工智能技術(shù),“阿拉丁神燈”的故事已演變?yōu)楝F(xiàn)實。
互聯(lián)時代和懶人經(jīng)濟(jì)是推動人工智能發(fā)展的催化劑,而真實的用戶體驗可以是如山東司機(jī)的惱羞成怒,也可以是完美無縫的“上帝”感受,其背后核心是人工智能交互技術(shù)的儲備實力。正如靈聚科技創(chuàng)始人張勝所言:“深度語義識別是每個智能應(yīng)用必須具備的基礎(chǔ)功能,因技術(shù)不同而效果不同?!?/p>
做機(jī)器人的“大腦”
在人工智能領(lǐng)域,微軟Cortana、蘋果Siri、Google Now備受矚目,一部分源于其“東家”的光環(huán)。而拿技術(shù)說事的張勝帶領(lǐng)著靈聚科技,憑何與其抗衡?
張勝的法寶是“靈聚人工大腦”。這一智能引擎整合了幾十項國內(nèi)外最先進(jìn)的技術(shù)和學(xué)術(shù)研究成果,并貫通語言學(xué)、心理學(xué)、哲學(xué)等多學(xué)科知識,將算法、數(shù)據(jù)處理技術(shù)與中文語言學(xué)融合,支持自動造句,將機(jī)器人主動服務(wù)、與人會話的能力提升至新的高度。
在一個典型的應(yīng)用場景中,“你知道從廣州到北京的火車有哪些么?”“你知道杜海濤的年齡有多大么?”“你知道湖南有多大么?”針對第一條語音提問,在其中識別出關(guān)鍵詞、理解含義、搜索結(jié)果,必須依托智能語音交互技術(shù)。后兩條語音提問同樣問“多大”,一個是年齡,一個是面積,如果沒有較強的智能語音技術(shù)支撐,展現(xiàn)的搜索結(jié)果往往是前言不搭后語。
在上下文識別方面,張勝認(rèn)為靈聚也有獨到優(yōu)勢?!办`聚人工大腦”可以通過記憶上文出現(xiàn)的關(guān)鍵詞,來識別當(dāng)前討論的話題是否是同一話題,或當(dāng)前缺省的關(guān)鍵詞是否是上文關(guān)鍵詞。
此外,“靈聚人工大腦”還可以根據(jù)程序構(gòu)建的關(guān)系網(wǎng)來推導(dǎo)兩個元素的關(guān)系、進(jìn)行多個元素屬性的對比、對已有數(shù)據(jù)進(jìn)行關(guān)系的判斷等,通過技術(shù)可以拓展到日常更多的應(yīng)用場景,如可通過對話操控硬件設(shè)備,可通過對話完成購物訂票流程,可通過對話完成記錄分享等互聯(lián)網(wǎng)體驗等,完成機(jī)器與人之間更流暢的對話。
抓住移動終端入口
2014年,靈聚科技推出APP靈聚音樂,以此示范通用的靈聚智能引擎如何通過優(yōu)化支持特定應(yīng)用的?!八皇且粋€完整和完美的產(chǎn)品,只是一個演示作品?!睆垊購娬{(diào),“該版本僅針對點播音樂和點讀新聞做了功能優(yōu)化,還有很多應(yīng)用場景和功能需求有待發(fā)掘、完善?!蹦壳?,靈聚音樂這款A(yù)PP只在騰訊應(yīng)用寶中發(fā)布了體驗版。
在智能語音交互這個領(lǐng)域,市場一度魚龍混雜,一些企業(yè)或自我標(biāo)榜在做大數(shù)據(jù)、云計算、“互聯(lián)網(wǎng)+”等,但實際更多停留在概念炒作階段。只有耐得住寂寞,經(jīng)得起誘惑的公司才能成為大浪淘沙之后的金子。
同樣是做語音助手,張勝在分析現(xiàn)有市場及各家產(chǎn)品特點后,得出結(jié)論:“當(dāng)前基于搜索技術(shù)返回結(jié)果,這種方式已趨于成熟,接下來應(yīng)該要基于移動互聯(lián)網(wǎng)的特點去做產(chǎn)品?!?/p>
這也是靈聚科技未來研發(fā)的方向?;谝苿踊ヂ?lián)網(wǎng)時代特點,靈聚科技首先一定是做精準(zhǔn)搜索;其次,未來智能時代,人機(jī)交互未必要依賴屏幕,更多的應(yīng)該是解放人們的眼睛。因而靈聚科技會做無屏化智能交互?!拔覀冏畲蟮膬?yōu)勢就是為目前和可以預(yù)見的未來數(shù)年做實用性的技術(shù)研發(fā),那些無助于解決實際問題的思路或者學(xué)術(shù)研究,我們都只是膜拜,而不會去跟著走?!睆垊俦硎尽?/p>
人工智能的科幻未來
在一家光伏企業(yè)的廠房中,工人“悠閑”地操作數(shù)臺智能機(jī)床。機(jī)床上的機(jī)械手忙碌不停,重復(fù)著抓起電池板放到自動流水線上焊接的動作。解放人力,替代工人去做危險或重復(fù)性工作,是現(xiàn)階段人工智能應(yīng)用的典型場景之一。這樣人的智慧將得以解放,用于閱讀、發(fā)想、創(chuàng)新,去做更有創(chuàng)意的事。
鞋子可以成為終端接聽電話,牙齒嵌入芯片就能實現(xiàn)語音傳輸。這未必是007電影中才有的場景,而是未來人工智能發(fā)展的影子。
“大部分人認(rèn)為手機(jī)是未來各項應(yīng)用的入口。”張勝表示,“但這種格局有可能被打破。新的信息交互方式可依托全息影像技術(shù),可基于手表、眼鏡這些終端實現(xiàn),或者像科幻片中的太空飛船操控界面一樣?!?/p>
張勝介紹,靈聚智能助理將是他們即將發(fā)布的新品,是其布局靈聚家用機(jī)器人市場的“熱身戰(zhàn)”。
這款A(yù)PP新品能夠?qū)崿F(xiàn)這些功能:一句話提醒、一句話記賬、不依賴屏幕撥打電話等?!拔磥恚覀冞€會加入更多的主動服務(wù),不需要用戶開口命令才被動響應(yīng),而是依據(jù)用戶的狀態(tài)主動提供服務(wù)。目前,我們的產(chǎn)品內(nèi)置程序,可每天主動為用戶制作一期音樂專輯?!?/p>
“或許有人認(rèn)為人的作用逐步被機(jī)器替代,而實際上,在機(jī)器人時代,人的價值會越大,懶蟲除外……”張勝笑談。
創(chuàng)業(yè)語錄
凡走過的必留下痕跡。從媒體到投入游戲行業(yè),再轉(zhuǎn)身鉆研人工智能,張勝在這一過程不斷總結(jié)教訓(xùn)、收獲經(jīng)驗。
十幾年前那會兒,就有人說,在中關(guān)村,聽說過叫認(rèn)識,見過一面叫做熟悉,吃過一頓飯叫做鐵哥們。
在信息量過大和機(jī)會過多的時候,我們反過來要學(xué)會尋找到一個對自己來講真正是機(jī)會的方面,去抓住它聚焦它,然后沉下心去做去研究。
幾乎每天都會有炒股的朋友告訴我可以買這只可以買那只,其實我想,買哪只也許現(xiàn)在都可以,但也可能買哪只都不行,因為你去買什么,什么有可能就該跌了。
創(chuàng)業(yè)需要耐得住寂寞,只有做出成績了,這些別人嘴上的談資才會自動出現(xiàn)在你面前。資源和人脈只能在你做好基礎(chǔ)后,才會發(fā)芽、開花。
其實機(jī)器人時代,人的價值會越大,懶蟲除外……
北京創(chuàng)業(yè)氛圍非常熱烈,但是同時,我也覺得這種熱烈的氛圍對年輕人既是一種激勵,也可能會過猶不及。
很多時候我們可能需要得到一些思想,但更多的是要去落實。
相關(guān)鏈接
Siri背后的機(jī)遇和機(jī)會
說到智能聊天機(jī)器人,大家的第一反映是Siri。在她誕生的年代,背后還沒有太多可供在線連接的服務(wù)。而今天,你除了跟她閑聊,也終于可以對Siri說:“給我派個美甲師來。”
Siri的成功彰顯了喬布斯當(dāng)年的遠(yuǎn)見卓識。即便是現(xiàn)在的Magic和Operatory也未能跳脫喬布斯最初的布局。唯一的區(qū)別是,今天我們要的不僅僅是蘋果的Siri,而是每個APP都要有自己的Siri。并且,未來每個APP都可以輕松集成自己的Siri。
而對于那些緊隨Siri腳步的后來者,未來在三個領(lǐng)域會有機(jī)會。一是即時通訊管道,二是客服后臺軟件,三是智能聊天機(jī)器人。