早在70年代,美國國家安全局就已經(jīng)掌握了移動(dòng)電話聲音識(shí)別術(shù),如果當(dāng)時(shí)的蘇聯(lián)領(lǐng)導(dǎo)人勃列日涅夫乘車行駛在莫斯科的某條大街上,他用移動(dòng)電話跟其他人說話,國家安全局的聲音識(shí)別系統(tǒng)就會(huì)立即確認(rèn)出勃列日涅夫的身份,他的談話內(nèi)容就會(huì)立即被國家安全局工作人員記錄下來。五角大樓一位情報(bào)官曾表示:“這套系統(tǒng)甚至能夠分辨出是車內(nèi)的勃列日涅夫還是其他人打的嗝兒。
語音識(shí)別技術(shù)主要有聲紋識(shí)別、內(nèi)容識(shí)別、語種識(shí)別、語音標(biāo)準(zhǔn)識(shí)別等幾方面。語音識(shí)別過程實(shí)際上是一種認(rèn)識(shí)過程。就像人們聽語音時(shí),并不把語音和語言的語法結(jié)構(gòu)、語義結(jié)構(gòu)分開來,因?yàn)楫?dāng)語音發(fā)音模糊時(shí)人們可以用這些知識(shí)來指導(dǎo)對語言的理解過程,但是對機(jī)器來說,識(shí)別系統(tǒng)也要利用這些方面的知識(shí),只是如何有效地描述這些語法和語義還有困難。
90年代初,美國電報(bào)電話公司想用計(jì)算機(jī)技術(shù)促進(jìn)通訊業(yè)的發(fā)展,于是組織人馬研究出一種語音識(shí)別軟件。1992年3月,世界上第一套語音識(shí)別系統(tǒng)在美國誕生。當(dāng)時(shí)這套系統(tǒng)的主要任務(wù)是代表公司向用戶詢問采用何種付款方式:諸如用信用卡還是現(xiàn)金等。
1997年,IBM推出了第一套中文語音識(shí)別系統(tǒng),讓我們看到人和機(jī)器用自然語言交流成為現(xiàn)實(shí),為漢字輸入帶來了一股新鮮的潮流。1999年底,IBM中國公司在北京舉行了1999IBM中文語音技術(shù)大會(huì),首次發(fā)布了其普通話版本的電話語音識(shí)別技術(shù),讓我們看到了語音識(shí)別技術(shù)在電話系統(tǒng)中的廣泛應(yīng)用前景。近些年,很多領(lǐng)域都已經(jīng)成為語音識(shí)別技術(shù)的應(yīng)用熱點(diǎn),例如電話通信服務(wù)領(lǐng)域(如電話轉(zhuǎn)接中心或查詢中心)、金融領(lǐng)域(如家庭銀行或股票信息查詢)、旅游服務(wù)領(lǐng)域(如飛機(jī)訂票或旅館預(yù)訂)等。
進(jìn)入2000年以后,語音識(shí)別技術(shù)的發(fā)展更是突飛猛進(jìn)。在IBM公司新近推出的世紀(jì)版語音識(shí)別系統(tǒng)中,我們看到用戶不僅可以利用該系統(tǒng)口述文檔、口述電子郵件、使用語言進(jìn)行文檔格式編排,還能直接口述“網(wǎng)上沖浪”這樣的命令來訪問網(wǎng)頁,還可以實(shí)現(xiàn)真正的網(wǎng)上“聊天”。同時(shí),由于這個(gè)版本的語音識(shí)別系統(tǒng)具備“文章智能分析功能”,可以主動(dòng)學(xué)習(xí)用戶的語言模型、風(fēng)格,從而可以實(shí)現(xiàn)完全“只動(dòng)口,不動(dòng)手”操作計(jì)算機(jī)、網(wǎng)絡(luò)以及其他電子設(shè)備的夢想。
語音識(shí)別中的聲紋識(shí)別技術(shù);在軍事保密中有著重要的應(yīng)用價(jià)值。據(jù)美國《華盛頓時(shí)報(bào)》披露,美國國家安全局一直將聲音識(shí)別技術(shù)當(dāng)作研究重點(diǎn)。比如,利比亞領(lǐng)導(dǎo)人卡扎菲就是美國情報(bào)機(jī)構(gòu)重點(diǎn)識(shí)別的對象IhrehdaxolRCCVCD1H9LnA==,現(xiàn)在,只要卡扎菲利用利比亞的通信網(wǎng)絡(luò)進(jìn)行通話。聲音識(shí)別系統(tǒng)就會(huì)立即提醒工作人員:“卡扎菲正在通話,請注意?!弊罱绹扒閳?bào)官詹姆士·巴姆福德在其新著《秘密》一書中透露的一些內(nèi)幕消息也證實(shí)了這套聲音識(shí)別系統(tǒng)的存在。書中說,美國情報(bào)部門開始聲音識(shí)別技術(shù)的研究已經(jīng)有很多年了,最近幾年,這套系統(tǒng)的功能不斷完善,可以準(zhǔn)確地識(shí)別出具體的聲音。巴姆福德指出:“監(jiān)聽員甚至可以說出被監(jiān)聽者是否感冒了?!彼€透露,國家安全局擁有大量被監(jiān)聽者的資料,有時(shí)候,監(jiān)聽員在監(jiān)聽時(shí),旁邊就放著這些被監(jiān)聽者的照片。據(jù)報(bào)道,曾迫降在我國海南機(jī)場的美軍EP-3偵察機(jī)中就安裝了聲紋識(shí)別偵聽模塊。這一聲紋識(shí)別系統(tǒng)功能強(qiáng)人,只要被偵察者通過無線電進(jìn)行對話,該系統(tǒng)便能查明通話者的身份,尤其是高層領(lǐng)導(dǎo)者的身份。美軍正是靠著這套功能強(qiáng)大的系統(tǒng),掌握了其他國家大量絕密情報(bào)。五角大樓曾專門邀請語言學(xué)家,對被偵察國家的語言進(jìn)行了全面深入的研究,開發(fā)出了一套獨(dú)特的電子監(jiān)聽系統(tǒng),只要美軍截獲到對方的通話,這套系統(tǒng)能立即識(shí)別出通話者的身份,從而判斷出從中掌握到的情報(bào)的價(jià)值到底有多大。當(dāng)截獲到對方通話后,監(jiān)聽系統(tǒng)能自動(dòng)刪除雜音,通過與聲音數(shù)據(jù)庫相對照,準(zhǔn)確識(shí)別出通話者身份。
另一方面,裝備指紋識(shí)別系統(tǒng),配合語音識(shí)別技術(shù)來查找國內(nèi)隱藏的恐怖分子。目前,美國為每個(gè)美國人設(shè)計(jì)一張裝在計(jì)算機(jī)芯片的監(jiān)視識(shí)別卡,用于記錄居民的情況。當(dāng)有人使用這種卡時(shí),就會(huì)在機(jī)場安檢系統(tǒng)計(jì)算機(jī)里留下記錄。這些卡片可以與指紋或者在今后幾年的時(shí)間里與面部的特征協(xié)調(diào)起來,并被編成程序允許或禁止某人進(jìn)入機(jī)場。在機(jī)場,使用駕駛艙門和行李箱搜索新技術(shù),對機(jī)場休息室進(jìn)行掃描,并對照數(shù)據(jù)庫中可疑的恐怖分子檢查旅客的外表形象。此外,使用一種專門照相機(jī),可測出人體面部60~120種不同的變化,即使有人刮掉胡子或輕微整形登機(jī),也難逃其銳利的“法眼”。再者,使用通過查驗(yàn)旅客的指紋和視網(wǎng)膜技術(shù),以便能揪出恐怖分子。由于人的視網(wǎng)膜具有同指紋一樣的特性,每個(gè)人的視網(wǎng)膜絕不相同,因而任何在冊的可疑分子都無法逃過檢查。采取護(hù)照加指紋措施,把流竄于世界各國的經(jīng)常改名換姓的恐怖分子逮住。在接受檢查時(shí),護(hù)照與指紋同時(shí)證明持有者身份才有效。這樣,即使罪犯改頭換面也可辨認(rèn)出真假。
在軍事計(jì)算機(jī)系統(tǒng)和核心要害部位的封閉管理中,應(yīng)用聲紋識(shí)別技術(shù)進(jìn)行身份認(rèn)證,具有很高的精確度,可進(jìn)一步增加系統(tǒng)的安全性。一些應(yīng)用了聲紋識(shí)別技術(shù)的新型計(jì)算機(jī)安全產(chǎn)品,可以在普通的USB加密鑰匙基礎(chǔ)上,增加聲紋認(rèn)證功能,并對計(jì)算機(jī)系統(tǒng)進(jìn)行加密,保護(hù)計(jì)算機(jī)系統(tǒng)中的重要文件不被非法竊取、瀏覽、篡改、刪除或破壞。在一些軍事要地的核心部位,應(yīng)用語音識(shí)別技術(shù)實(shí)施門禁管理,可以有效辨識(shí)合法進(jìn)出者。保密管理系統(tǒng)根據(jù)輸入的自然語音信號,進(jìn)行聲紋身份認(rèn)證,并自動(dòng)開啟或閉合門禁設(shè)施。
應(yīng)用聲紋識(shí)別技術(shù),可以對發(fā)出命令者進(jìn)行身份確認(rèn),避免出現(xiàn)敵方利用我方信道偽裝我指揮員發(fā)出假命令,干擾我方軍事行動(dòng)的情況。由于在計(jì)算機(jī)信息處理中,錄音的過程要經(jīng)過模擬到數(shù)字的信號轉(zhuǎn)換,放音的過程還要經(jīng)過數(shù)字到模擬的信號轉(zhuǎn)換,因此,即使竊密者使用錄音設(shè)備錄下合法用戶的聲音進(jìn)行聲紋身份認(rèn)證,經(jīng)過從模擬到數(shù)字、再從數(shù)字到模擬的兩次信號轉(zhuǎn)換,聲音頻譜會(huì)有明顯衰減和失真,這種失真很容易被認(rèn)證程序分辯出來。所以,依靠錄音登錄也不能通過聲紋認(rèn)證。適當(dāng)調(diào)節(jié)聲紋認(rèn)證嚴(yán)格程度的閾值,聲紋認(rèn)證的“錯(cuò)誤接受率”和“錯(cuò)誤拒絕率”可以有所下