技術(shù)宅
現(xiàn)在Al技術(shù)在各個(gè)領(lǐng)域的應(yīng)用不斷擴(kuò)展,當(dāng)然這其中也出現(xiàn)了一些惡意應(yīng)用,比如央視2019年3·15晚會(huì)上曝光的Al騷擾電話(huà),就是典型的反例。在晚會(huì)的視頻展示中,其中一家提供外呼系統(tǒng)的科技公司經(jīng)理告訴記者,在過(guò)去的一年多時(shí)間里,他們撥打出去的電話(huà)多達(dá)40億個(gè)(圖1)。
這些騷擾電話(huà)的背后,竟然應(yīng)用了很多新的科技技術(shù),比如用戶(hù)號(hào)碼的獲取是通過(guò)“探針盒子”來(lái)完成。當(dāng)用戶(hù)手機(jī)的無(wú)線(xiàn)局域網(wǎng)處于打開(kāi)狀態(tài),這個(gè)信號(hào)被探針盒子發(fā)現(xiàn)后,就能迅速識(shí)別并采集到戶(hù)手機(jī)的WLANMAC(無(wú)線(xiàn)局域網(wǎng))地址,接下來(lái)將MAC地址轉(zhuǎn)換為IMEI號(hào),然后再將lM El號(hào)轉(zhuǎn)換成用戶(hù)的手機(jī)號(hào)碼。其中從用戶(hù)的WLANMAC到手機(jī)號(hào)碼識(shí)別,就使用了大數(shù)據(jù)識(shí)別技術(shù)(圖2)。
在獲取到用戶(hù)的號(hào)碼后,Al語(yǔ)音識(shí)別技術(shù)就派上用場(chǎng)了。通過(guò)人工對(duì)話(huà)學(xué)習(xí),這些Al騷擾電話(huà)溝通仿真能力相當(dāng)逼真,對(duì)話(huà)語(yǔ)言流暢自然,讓你根本想不到是在和冰冷的機(jī)器人對(duì)話(huà)。
如上所述,現(xiàn)在Al騷擾電話(huà)具有很高的智能性,幾乎讓我們無(wú)法識(shí)別。那么如何應(yīng)對(duì)這些智能騷擾呢?阿里Al實(shí)驗(yàn)室近日開(kāi)發(fā)的防騷擾電話(huà)技術(shù)給出了一個(gè)解決方案,通過(guò)Al來(lái)應(yīng)付騷擾電話(huà)。實(shí)際上這個(gè)技術(shù)是一種“智能聊天”概念,是Al語(yǔ)音技術(shù)在目前反騷擾領(lǐng)域中的一項(xiàng)應(yīng)用。智能聊天需要理解用戶(hù)的請(qǐng)求,用強(qiáng)大的知識(shí)圖譜生成知識(shí)點(diǎn),在對(duì)話(huà)中將知識(shí)點(diǎn)“輸出”給用戶(hù),同時(shí)用基于深度強(qiáng)化學(xué)習(xí)的對(duì)話(huà)策略引導(dǎo)對(duì)方的問(wèn)題,從而將聊天進(jìn)行下去(圖3)。
要讓一套語(yǔ)音輸出系統(tǒng)能夠和人類(lèi)(或者Al騷擾者)對(duì)話(huà),科學(xué)家們首先需要解決的是讓系統(tǒng)能夠理解用戶(hù)的請(qǐng)求,就像我們?nèi)粘:团笥汛螂娫?huà),在發(fā)出語(yǔ)音請(qǐng)求給對(duì)方后,要讓對(duì)方明白你要表達(dá)什么意思。為了能夠讓機(jī)器人理解語(yǔ)音對(duì)話(huà)的含義,—方面阿里Al實(shí)驗(yàn)室提出一個(gè)聊天機(jī)器人人機(jī)協(xié)作框架CoChat,通過(guò)這個(gè)框架,使得人機(jī)對(duì)話(huà)系統(tǒng)能夠從標(biāo)注過(guò)的對(duì)話(huà)日志、人類(lèi)工作者的反饋以及用戶(hù)的反饋中學(xué)習(xí),由此使對(duì)話(huà)質(zhì)量獲得持續(xù)改進(jìn)(圖4)。
另一方面,由于人類(lèi)的語(yǔ)言系統(tǒng)豐富多變,為了讓機(jī)器人迅速對(duì)人類(lèi)提出的新問(wèn)題(原來(lái)數(shù)據(jù)庫(kù)所沒(méi)有的)作出回應(yīng),阿里Al實(shí)驗(yàn)室開(kāi)發(fā)者引入了對(duì)話(huà)管理器模型MemHRNN。這套系統(tǒng)首先將對(duì)話(huà)歷史、語(yǔ)言理解結(jié)果和API調(diào)用結(jié)果等外部信息組合起來(lái)作為輸入,然后輸出所有動(dòng)作的概率分布以用于動(dòng)作選擇。這樣當(dāng)出現(xiàn)新動(dòng)作時(shí),該HRNN的架構(gòu)可以相應(yīng)地改變,而不會(huì)丟失在之前的學(xué)習(xí)過(guò)程中積累的知識(shí),從而讓這套人機(jī)系統(tǒng)自主學(xué)習(xí)很多新知識(shí),能夠?qū)崿F(xiàn)和人類(lèi)正常的溝通對(duì)話(huà)。
比如在實(shí)際測(cè)試中,這套對(duì)話(huà)系統(tǒng)和人類(lèi)推銷(xiāo)員通話(huà)時(shí),它不但會(huì)主動(dòng)向女銷(xiāo)售咨詢(xún)“北京能不能貸款?”“最多能貸多少錢(qián)?”等問(wèn)題,甚至還在對(duì)話(huà)中“調(diào)戲”對(duì)方:“你之前給我打過(guò)電話(huà)吧,聽(tīng)起來(lái)挺耳熟的?”這些對(duì)話(huà)就像是真的人在和推銷(xiāo)員對(duì)話(huà),對(duì)方根本沒(méi)有察覺(jué)到她實(shí)際上是和機(jī)器人“二哈”在深入聊天(圖5)。
隨著Al技術(shù)的發(fā)展,我們遇到的騷擾也將越來(lái)越多、越來(lái)越智能,類(lèi)似“二哈”的系統(tǒng)將給我們防止騷擾帶來(lái)更多的便利。
一方面,如果將這套系統(tǒng)和手機(jī)通話(huà)功能整合起來(lái),那么以后只要有類(lèi)似的騷擾電話(huà),就可以直接交給“二哈”們?nèi)ゴ蚶?,省去我們每天被無(wú)數(shù)騷擾電話(huà)打擾。另—方面,“二哈”系統(tǒng)實(shí)質(zhì)上是智能聊天應(yīng)用,這套系統(tǒng)可以理解我們的對(duì)話(huà),因此把它作為人機(jī)對(duì)話(huà)也是一個(gè)很好的應(yīng)用,比如可以用在心理疏導(dǎo)、景點(diǎn)服務(wù)介紹、Al導(dǎo)購(gòu)等領(lǐng)域,讓Al更好地為我們的生活服務(wù)。
其實(shí)智能聊天并不是什么全新的概念,它的本質(zhì)是Al語(yǔ)音識(shí)別技術(shù)。我們?cè)趇Phone上使用的Siri語(yǔ)音助理、微軟推出的Al小冰,這些都是語(yǔ)音智能聊天的代表。隨著Al技術(shù)的發(fā)展,期望更多的語(yǔ)音智能產(chǎn)品為我們服務(wù)(圖6)。