劉楠
人工智能技術(shù)的突破是用來延伸人類能力的,而非替代人類。
以下是一個(gè)人和一臺(tái)機(jī)器的對(duì)話:
我明天要回家,幫我訂一張車票吧。
好的,您是要坐飛機(jī)還是坐火車呢?
飛機(jī)吧。
好的,已經(jīng)為您查詢到所有航班。
我要國(guó)航的。
好的,已經(jīng)為您找到所有國(guó)航航班。
我要最便宜的。
好的,已經(jīng)為您選中最便宜的車票。
嗯……還是不了,我想坐高鐵回去。
好的,請(qǐng)問您選一等座還是二等座?
一等座。
您確定預(yù)定最早的車次嗎?
確定。
好的,已經(jīng)為您預(yù)定2015年12月22日早7:35返回合肥的高鐵票。
什么什么?你以為時(shí)間線君在寫未來人工智能的小說?No,No,No,我賭十塊錢這不是小冰。你想調(diào)戲小冰唱歌,她只會(huì)打個(gè)岔說個(gè)話,小心給你講個(gè)鬼故事。
以上是在科大訊飛2015“A.I.復(fù)始 萬物更新”新品發(fā)布會(huì)上發(fā)生的一段人機(jī)交互演示,這個(gè)會(huì)說話的家伙叫做DingDong,是個(gè)智能音響。
乍一看,這個(gè)DingDong的功能與Siri、Google Now和微軟小娜十分類似,都是走人工智能助理的路線。其不同之處在于,DingDong在中文語音識(shí)別方面十分出色。這要?dú)w功于科大訊飛多年來一直專注于智能語音及其相關(guān)技術(shù)的研發(fā),并且在國(guó)內(nèi)行業(yè)里名列前茅。
能主動(dòng)提問、對(duì)結(jié)果反問、被搶話打斷還能立刻接話、持續(xù)聆聽、前后反應(yīng)不間斷、擁有長(zhǎng)時(shí)間記憶和強(qiáng)大的背景知識(shí),這是理想狀態(tài)下我們所能想到的關(guān)于人機(jī)智能交互的體驗(yàn)。沒錯(cuò),DingDong這個(gè)家伙的出現(xiàn)昭示著這個(gè)理想正在一步步實(shí)現(xiàn)。文章開篇就是ta跟美女倩倩在發(fā)布會(huì)上的對(duì)話。
機(jī)器能夠?qū)θ祟愓Z言進(jìn)行準(zhǔn)確的語義識(shí)別,就意味著我們離想象中無所不能的人工智能更近了一步??拼笥嶏w董事長(zhǎng)劉慶峰在發(fā)布會(huì)上表示,人工智能未來會(huì)像水和電一樣無所不在。計(jì)算智能、感知智能和認(rèn)知智能是人工智能的三個(gè)層次,以語音和語言為入口的認(rèn)知智能革命是當(dāng)前突破人工智能的重要切入點(diǎn)。
目前,認(rèn)知智能的三大核心支撐能力是人機(jī)交互、知識(shí)管理與推理學(xué)習(xí),這次發(fā)布的訊飛超腦2.0正是圍繞這三方面來持續(xù)展開的。
在科大訊飛承擔(dān)的科技部人工智能領(lǐng)域第一個(gè)示范性標(biāo)準(zhǔn)重大項(xiàng)目“類人答題機(jī)器人項(xiàng)目”中,訊飛超腦計(jì)劃的目標(biāo)就是,要讓機(jī)器從“能聽會(huì)說”到“能理解會(huì)思考”,而且在不久的將來可以參加高考并考上一本院校。
劉慶峰認(rèn)為,在萬物互聯(lián)的浪潮下,以語音為主,鍵盤、觸摸為輔的人際交互時(shí)代已經(jīng)到來,對(duì)人機(jī)交互也有更高的要求。但是,目前大多數(shù)設(shè)備沒有屏幕并且與用戶之間有一定的距離,而且多方交互的即時(shí)需求越發(fā)明顯。
為了滿足多方需求,科大訊飛發(fā)布了人機(jī)交互新產(chǎn)品AIUI,試圖定義“萬物互聯(lián)”時(shí)代的人機(jī)語音交互標(biāo)準(zhǔn)。在這個(gè)定義中,人機(jī)語音交互的基本能力應(yīng)該包括三方面:遠(yuǎn)程識(shí)別、全雙工、多輪交互。
其中,多輪交互實(shí)現(xiàn)了機(jī)器對(duì)上下文的連貫理解,使得人機(jī)交互不再是單調(diào)的一問一答,而是可以連續(xù)交流、間斷交流。對(duì)話糾錯(cuò)機(jī)制使人可以隨時(shí)糾正對(duì)話中雙方的錯(cuò)誤,不用多次重復(fù)輸入指令。這些技術(shù)都極大降低了環(huán)境、說法、方言、習(xí)慣等對(duì)人機(jī)交互的干擾,實(shí)現(xiàn)了高度自然的人機(jī)交互體驗(yàn)。
DingDong音響就是這樣一個(gè)應(yīng)用。作為一個(gè)載體,它不僅可以用來聽音樂、操控家居,還可以幫助完成各種助理的事務(wù)。目前,這款智能音箱已經(jīng)開始在市面上銷售。
時(shí)間線君邪惡的安利一下,如果你的老板難纏、女朋友難搞,來一盤燒腦什么都解決了,反正機(jī)器人不嫌煩。
除了DingDong之外,科大訊飛還有一個(gè)新產(chǎn)品令人眼前一亮。
發(fā)布會(huì)現(xiàn)場(chǎng)的兩塊大屏幕上,“嗒嗒嗒”出現(xiàn)的字讓時(shí)間線君很是驚奇,難道怕后面的觀眾聽不到所以實(shí)時(shí)更新速記?也太貼心了吧!
“這是‘訊飛聽見全球首次會(huì)議字音同步直播。”什么什么?竟然是即時(shí)語音轉(zhuǎn)寫,然而當(dāng)前演講人的普通話并不標(biāo)準(zhǔn)。
在大屏幕上,第一句識(shí)別出來的字先是紅色。等到演講人說下一句話的時(shí)候,這句話自動(dòng)斷句并檢測(cè),如果沒問題就變成白色,一條過。如果因?yàn)榘l(fā)音不標(biāo)準(zhǔn)或出現(xiàn)方言而使字音識(shí)別出現(xiàn)不確定的字詞,那么紅色字詞會(huì)閃兩下,通過上下文識(shí)別后自動(dòng)修正。
太神奇了有沒有!
果然??拼笥嶏w隨即發(fā)布了“智能+硬件+服務(wù)”于一體的語音科技產(chǎn)品“訊飛聽見”,包括手機(jī)App、PC端網(wǎng)站和智能硬件(錄音筆)。據(jù)介紹,這款產(chǎn)品集成了單麥克解混響技術(shù)、陣列解混響技術(shù)、口語化識(shí)別等技術(shù),總之速記員可以大面積失業(yè)了。
聽到這里,時(shí)間線君只想賤賤的笑一笑,以后整理采訪速記省出來的時(shí)間可以睡覺了。當(dāng)然,這不是最重要的。
在萬物互聯(lián)時(shí)代,人機(jī)交互將成為人類生活的新常態(tài)。人工智能技術(shù)的突破是用來延伸人類能力的,而非替代人類。“如果你問我未來20年最重要的技術(shù)是什么,毫無疑問,我會(huì)告訴你就是人工智能。”凱文·凱利在新作《必然》中如是說。