文/本刊記者 高茜
樹(shù)起移動(dòng)互聯(lián)網(wǎng)“最后一厘米”的安全門(mén)
文/本刊記者 高茜
業(yè)界普遍認(rèn)為,語(yǔ)音將成為繼鍵盤(pán)、鼠標(biāo)、觸摸屏等一切基于手的人機(jī)交互方式之后的下一代主流人機(jī)交互方式。
在上海雙創(chuàng)活動(dòng)周上的公司展位
2017年10月24日,GeekPwn(極棒)2017國(guó)際安全極客大賽之“AI仿聲驗(yàn)聲攻防賽”在上海開(kāi)場(chǎng),參賽的五支隊(duì)伍需要利用機(jī)器自主合成技術(shù),模仿評(píng)委提供的四段聲音,欺騙并通過(guò)市面上幾款常見(jiàn)手機(jī)和智能音箱的聲紋鎖驗(yàn)證。其中,某最新安卓手機(jī)、蘋(píng)果iPhone8、某品牌智能音箱等智能設(shè)備均有挑戰(zhàn)選手破解成功。
一時(shí)間,智能語(yǔ)音產(chǎn)品的安全性引起社會(huì)廣泛關(guān)注。
同時(shí)現(xiàn)場(chǎng)還集結(jié)了數(shù)十位業(yè)界頂級(jí)安全專家,組成了一批重量級(jí)評(píng)委陣容,其中北京得意音通技術(shù)有限責(zé)任公司董事長(zhǎng)鄭方就在其中,他同時(shí)又是清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心主任。
“這次的攻防挑戰(zhàn)賽中參賽隊(duì)伍攻擊的產(chǎn)品難度系數(shù)是分一定等級(jí)的,不能說(shuō)攻擊都成功?!编嵎街v道,“從攻擊的角度,現(xiàn)場(chǎng)參賽的五支隊(duì)伍用到的攻擊手段不外乎三種方法,一種是語(yǔ)音合成,通過(guò)合成流暢、自然的語(yǔ)音來(lái)試圖破解語(yǔ)音密碼,這個(gè)是‘像音’;第二種是語(yǔ)音轉(zhuǎn)換,模仿發(fā)音者的特點(diǎn),這個(gè)是‘像人’,并且已經(jīng)瞄準(zhǔn)了攻擊的目標(biāo);第三個(gè)方法是聲音拼接法,把使用者本人的話裁剪拼接成聲音密碼,這種方法更加接近實(shí)際的攻擊水平和目標(biāo)?!?/p>
上海雙創(chuàng)周上展示的聲紋技術(shù)應(yīng)用案例
“而從防守方來(lái)講,目前市面上的一些聲紋識(shí)別的相關(guān)產(chǎn)品,可以說(shuō)沒(méi)有防范攻擊的措施,當(dāng)黑客入侵時(shí),多數(shù)產(chǎn)品方并沒(méi)有檢測(cè)聲音真?zhèn)蔚氖侄?。所以就參賽情況而言,從攻和守兩方面綜合來(lái)看,目前行業(yè)普遍水平依然停留在基礎(chǔ)水平上?!编嵎秸f(shuō)。
其實(shí),在鄭方的帶領(lǐng)下,得意音通早在幾年前就針對(duì)上述三種攻破方法研制出了相應(yīng)的設(shè)防對(duì)策。我國(guó)人工智能界泰斗、中國(guó)科學(xué)院院士張鈸先生高度評(píng)價(jià)得意音通這家高新技術(shù)企業(yè):“肯花硬功夫去掌握關(guān)鍵技術(shù)?!?/p>
“聲紋識(shí)別”聽(tīng)上去有些陌生,其實(shí)這項(xiàng)技術(shù)最早誕生于上世紀(jì) 40 年代末的貝爾實(shí)驗(yàn)室。同已經(jīng)廣泛應(yīng)用的指紋識(shí)別技術(shù)一樣,它是通過(guò)對(duì)語(yǔ)音信號(hào)的特征分析達(dá)到“說(shuō)話人辨認(rèn)”和“說(shuō)話人確認(rèn)”的兩種目的,前者是判斷某段語(yǔ)音是哪一個(gè)人所說(shuō),后者則是用以確認(rèn)某段語(yǔ)音是否是指定的某個(gè)人所說(shuō)。
依托清華大學(xué)語(yǔ)音團(tuán)隊(duì)近40年的技術(shù)積累,15年前創(chuàng)立了北京得意音通技術(shù)有限責(zé)任公司,圍繞自動(dòng)語(yǔ)音識(shí)別、聲紋識(shí)別、自然語(yǔ)言處理三大核心技術(shù)開(kāi)展工程化研究和產(chǎn)品化開(kāi)發(fā),其中產(chǎn)品化方面做得最好、應(yīng)用最成熟的就是聲紋識(shí)別技術(shù),現(xiàn)已獲得十多項(xiàng)國(guó)內(nèi)發(fā)明專利和1項(xiàng)國(guó)際發(fā)明專利。
在2017全國(guó)雙創(chuàng)活動(dòng)周上海主會(huì)場(chǎng)上,得意音通重點(diǎn)展示了聲紋識(shí)別技術(shù)在社保生存認(rèn)證、移動(dòng)金融和門(mén)禁系統(tǒng)等中的應(yīng)用。7天的展期內(nèi),共引來(lái)近萬(wàn)人次觀眾前來(lái)參觀體驗(yàn)。
建設(shè)銀行使用聲紋交易次數(shù)破億
參觀者正在試驗(yàn)聲紋門(mén)鎖
鄭方董事長(zhǎng)擔(dān)任極棒國(guó)際安全極客大賽評(píng)委
據(jù)了解,“聲密?!狈桨甘峭ㄟ^(guò)對(duì)動(dòng)態(tài)密碼語(yǔ)音中的密碼內(nèi)容及支付申請(qǐng)人身份的雙重識(shí)別,實(shí)現(xiàn)對(duì)移動(dòng)支付合法性的雙重驗(yàn)證,具有安全、方便、快捷、防止錄音假冒等優(yōu)點(diǎn)。
最新數(shù)據(jù)顯示,截至2017年11月3日,中國(guó)建設(shè)銀行聲紋總交易次數(shù)已突破1.5億次。2016年6月18日,中國(guó)建設(shè)銀行手機(jī)銀行采用得意“聲密?!睂@夹g(shù)用于身份認(rèn)證的功能對(duì)普通用戶正式開(kāi)放,主要應(yīng)用在登陸、取款、轉(zhuǎn)賬、支付等場(chǎng)景。
還有最受年輕人歡迎的“聲紋門(mén)禁”,這個(gè)縮小版的真實(shí)防盜門(mén)自從7月31日在清華大學(xué)亮相后,就成了小“網(wǎng)紅”,受到不少媒體的追捧。聲紋門(mén)禁利用聲音來(lái)控制門(mén)的出入權(quán)限,每個(gè)人用自己的聲音做鑰匙,利用聲紋識(shí)別技術(shù)實(shí)現(xiàn)身份識(shí)別,進(jìn)而控制門(mén)或鎖的開(kāi)啟。
對(duì)聲紋識(shí)別技術(shù)而言,探尋語(yǔ)音背后“說(shuō)話人”的微妙態(tài)度和真實(shí)意圖,非常重要,否則“智能語(yǔ)音”的“智能”就只能打引號(hào)。這就需要用到說(shuō)話人情感狀態(tài)的識(shí)別技術(shù),當(dāng)然,情感識(shí)別技術(shù)很難掌握。
“難了不會(huì),會(huì)了不難。經(jīng)過(guò)我們多年研究、積累,在很多方面有了積累。比如說(shuō),喪禮中演奏的哀樂(lè),當(dāng)你把哀樂(lè)節(jié)奏加快,你會(huì)發(fā)現(xiàn)這首曲子其實(shí)是很歡快活潑的,當(dāng)節(jié)奏慢下來(lái),放在喪禮這些特定環(huán)境中,就會(huì)產(chǎn)生悲傷的氣氛。所以說(shuō)語(yǔ)音中是有情感信息的,只看內(nèi)容并不準(zhǔn)確。情感識(shí)別其實(shí)是綜合利用了說(shuō)話時(shí)長(zhǎng)、音高、聲調(diào)等很多因素的綜合體,需要在研究中逐一對(duì)這些因素進(jìn)行分析才有可能攻破這一難題?!编嵎街v道。
在2017年7月31日舉辦的“人工智能與信息安全”清華前沿論壇上,得意音通信息技術(shù)研究院正式揭牌成立,此前2015年,已成立清華-得意音通聲紋處理聯(lián)合實(shí)驗(yàn)室。作為清華大學(xué)知識(shí)產(chǎn)權(quán)入股的高科技企業(yè),得意音通已成為業(yè)界產(chǎn)學(xué)研結(jié)合的成功范例。
“產(chǎn)學(xué)研應(yīng)該是‘化合態(tài)’,而不是‘混合態(tài)’?!奔仁乔迦A大學(xué)教授又是得意音通公司董事長(zhǎng)的鄭方對(duì)產(chǎn)學(xué)研這條發(fā)展路徑有著獨(dú)到的見(jiàn)解?!爱a(chǎn)學(xué)研如何緊密結(jié)合是重要而必要的關(guān)鍵一環(huán)。目前有很多企業(yè)與高校合作,合作方式大體分兩種,一種是高校科研團(tuán)隊(duì)有相關(guān)的成型項(xiàng)目成果,企業(yè)有需要才會(huì)進(jìn)行合作;另一種是企業(yè)自身在發(fā)展的某個(gè)階段需要科研團(tuán)隊(duì)做支撐,從而進(jìn)行合作。這些都有一定短時(shí)性,沒(méi)有建立長(zhǎng)期合作的機(jī)制?!?/p>
得意音通與建設(shè)銀行合作之初,就面臨建設(shè)銀行提出的疑問(wèn)——如果使用錄音是否會(huì)將聲紋識(shí)別技術(shù)攻破?鄭方介紹說(shuō),當(dāng)時(shí)的確不能保證絕對(duì)的安全性,但當(dāng)市場(chǎng)提出要求時(shí),他們的科研團(tuán)隊(duì)選擇去學(xué)習(xí)相關(guān)原理、制定解決方案,然后進(jìn)行一次次的嘗試,最后在成功通過(guò)線上測(cè)試后給客戶交上了一份滿意的答案。
“時(shí)變”即聲音隨時(shí)間、年齡增長(zhǎng)而發(fā)生變化,這對(duì)行業(yè)來(lái)說(shuō)是需要解決的一個(gè)難題。由于前期需要搜集大量數(shù)據(jù)、建立數(shù)據(jù)庫(kù),并且是對(duì)同一對(duì)象、同一內(nèi)容進(jìn)行長(zhǎng)時(shí)間的語(yǔ)音數(shù)據(jù)收集,然后進(jìn)行實(shí)驗(yàn)對(duì)比,才能找到解決方法。很多人是不愿意去涉足的,因?yàn)闊o(wú)法看到最后能否達(dá)到預(yù)期。
當(dāng)時(shí)得意音通科研團(tuán)隊(duì)決定以清華大學(xué)的部分在校學(xué)生為對(duì)象進(jìn)行實(shí)驗(yàn)。每間隔一周或者一個(gè)月進(jìn)行聲紋采集,經(jīng)過(guò)幾年時(shí)間采集到一個(gè)聲紋時(shí)變數(shù)據(jù)庫(kù),然后在此基礎(chǔ)上研究人的聲紋中的變量與恒量,解決了聲音隨年齡變化的問(wèn)題。
“當(dāng)有明確的市場(chǎng)需求時(shí),我們有強(qiáng)大的研發(fā)團(tuán)隊(duì)做支撐;當(dāng)需求還不明顯或者短期內(nèi)看不到結(jié)果時(shí),我們就按照戰(zhàn)略定位在多個(gè)方向上開(kāi)展拓展探索和技術(shù)儲(chǔ)備,這對(duì)人才也是很好的鍛煉。這才是我們理解的產(chǎn)學(xué)研結(jié)合。”鄭方總結(jié)說(shuō)。
信息安全包括很多層面,包含存儲(chǔ)、傳輸和計(jì)算安全等多個(gè)方面,這些都已經(jīng)取得了不錯(cuò)的效果;但最關(guān)鍵的一步“訪問(wèn)控制安全”目前還不令人滿意。打個(gè)比方,用鋼筋水泥建造的一棟房子,墻壁雖然很堅(jiān)固,但是一旦房子的鑰匙落入他人之手,別人就可以輕易進(jìn)入,房子牢固又怎么樣?主人失去了進(jìn)入房子的唯一性,安全性也大打折扣。同樣在互聯(lián)網(wǎng)領(lǐng)域,很多場(chǎng)景下現(xiàn)在都要求有實(shí)名認(rèn)證,但是多數(shù)情況下,用戶信息受到多方面不安全因素的威脅,極不安全。
那要怎么確保是本人進(jìn)行訪問(wèn)并且擁有訪問(wèn)的唯一性呢?鄭方博士給出了他的答案:“要想做到訪問(wèn)控制安全,首先要保證‘鑰匙’的唯一性,獨(dú)個(gè)人所有;第二,這把‘鑰匙’要具有防攻擊性,抵御黑客入侵;最后重要的一點(diǎn)是要在自愿的前提下進(jìn)行訪問(wèn),要代表自己的主觀意志,這樣才能減少詐騙事件的發(fā)生。這在國(guó)家戰(zhàn)略信息安全方面具有十分重要的意義。”
在保護(hù)民族生物特征信息方面,指紋、人臉、虹膜等這些生理特征具有不可撤銷性,一旦丟失就可能被隨意非法使用。
前不久發(fā)布的iPhone 8以及iPhone 6及以上機(jī)型,都可以采用Apple Pay來(lái)操作手機(jī)支付功能,據(jù)了解,2016年2月,Apple Pay登陸中國(guó),通過(guò)Apple touch來(lái)實(shí)現(xiàn)指紋支付,已有至少19家銀行支持此項(xiàng)業(yè)務(wù)。
鄭方講到他的憂慮:“蘋(píng)果公司在中國(guó)推廣的Apple Pay具有一定的安全隱患,再加上馬上要推出的刷臉,所有金融相關(guān)的用戶信息極易被蘋(píng)果公司獲得,這從國(guó)家、民族的層面講,是很危險(xiǎn)的。國(guó)家一定要有高層戰(zhàn)略保護(hù)的意識(shí)保護(hù)用戶的隱私數(shù)據(jù)。聲紋屬于行為特征,聲音是可交互的、可隨意變換的,使用以聲紋為主、多生物特征融合的措施來(lái)應(yīng)對(duì)不法人員獲取用戶信息,可有效保護(hù)國(guó)家和個(gè)人的利益安全。”