亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于聲紋識(shí)別的電網(wǎng)調(diào)度認(rèn)證系統(tǒng)設(shè)計(jì)

        2023-11-10 08:56:22孫麗麗張延童翟洪婷張慶銳
        山東電力技術(shù) 2023年10期
        關(guān)鍵詞:指令模型系統(tǒng)

        孫麗麗,翟 啟,張延童,翟洪婷,張慶銳

        (國(guó)網(wǎng)山東省電力公司信息通信公司,山東 濟(jì)南 250001)

        0 引言

        隨著人工智能技術(shù)成熟和新一代電網(wǎng)系統(tǒng)設(shè)備集成化程度提高,電網(wǎng)系統(tǒng)對(duì)管理信息化的要求與日俱增,智能化電網(wǎng)調(diào)度已成為當(dāng)前的研究熱點(diǎn)和實(shí)現(xiàn)形式。調(diào)度系統(tǒng)對(duì)“統(tǒng)一集中調(diào)度,各級(jí)按權(quán)管理”的需要,導(dǎo)致調(diào)度中心處理的數(shù)據(jù)量不斷增加。雖然智能電網(wǎng)自動(dòng)調(diào)度平臺(tái)系統(tǒng)內(nèi)部已經(jīng)建立相對(duì)較完備高效的多級(jí)權(quán)限管理控制機(jī)制,能滿(mǎn)足系統(tǒng)日常運(yùn)營(yíng)的實(shí)時(shí)調(diào)度業(yè)務(wù)需求,但系統(tǒng)調(diào)度執(zhí)行過(guò)程管理中,各類(lèi)系統(tǒng)安全性問(wèn)題不斷產(chǎn)生,例如,調(diào)度系統(tǒng)中可能存在崗位無(wú)關(guān)人員或使用系統(tǒng)其他部門(mén)人員提供的賬戶(hù),進(jìn)行超出正常權(quán)限范圍操作等問(wèn)題。此類(lèi)問(wèn)題根源在于現(xiàn)有調(diào)度系統(tǒng)主要以人工通過(guò)調(diào)度電話(huà)專(zhuān)線(xiàn)或者網(wǎng)絡(luò)發(fā)送操作指令的通信形式來(lái)實(shí)現(xiàn)[1],調(diào)度流程中缺乏足夠的人員身份認(rèn)證,對(duì)某些特殊調(diào)度指令缺少二次確認(rèn)和真?zhèn)舞b別,對(duì)電網(wǎng)安全造成潛在威脅。

        在人工智能技術(shù)飛速發(fā)展的今天,聲紋識(shí)別等相關(guān)技術(shù)無(wú)疑為提高電網(wǎng)調(diào)度效率和保障安全提供了新可能[2]。聲紋識(shí)別作為目前所有生物特征驗(yàn)證方法體系中唯一的非接觸與遠(yuǎn)程識(shí)別驗(yàn)證的方法,在調(diào)度運(yùn)行領(lǐng)域具有天然優(yōu)勢(shì)。近年來(lái),越來(lái)越多的調(diào)度系統(tǒng)采用聲紋識(shí)別調(diào)度,但實(shí)際上該技術(shù)的應(yīng)用僅僅集中在聲學(xué)模型、語(yǔ)言模型及分析應(yīng)用等幾個(gè)方面。文獻(xiàn)[3-4]在小規(guī)模詞語(yǔ)庫(kù)場(chǎng)景中進(jìn)行實(shí)驗(yàn)和驗(yàn)證,提出基于高斯混合-隱馬爾可夫模型(gaussian mixture hidden markov model,GMM-HMM)的電力調(diào)度場(chǎng)景下的聲學(xué)模型,但未能全面系統(tǒng)考慮語(yǔ)言模型變化對(duì)語(yǔ)音識(shí)別系統(tǒng)性能帶來(lái)的影響。文獻(xiàn)[5]設(shè)計(jì)一些在小規(guī)模電網(wǎng)語(yǔ)音調(diào)度系統(tǒng)場(chǎng)景下較簡(jiǎn)單并且實(shí)用有效的語(yǔ)法規(guī)則,用于電網(wǎng)語(yǔ)音調(diào)度系統(tǒng)中語(yǔ)音命令交互語(yǔ)法規(guī)則設(shè)計(jì),但該設(shè)計(jì)所提各種語(yǔ)義信息均不夠全面充分。文獻(xiàn)[6]在雙向編碼的TransFormer 模型基礎(chǔ)上提出一種全新的電網(wǎng)調(diào)度場(chǎng)景下語(yǔ)音識(shí)別模式,在現(xiàn)有基于BERT的語(yǔ)音識(shí)別模型上,刪改一部分語(yǔ)音片段特征并添加關(guān)鍵字特征、命名實(shí)體特征。上述文獻(xiàn)表明:針對(duì)現(xiàn)有電網(wǎng)語(yǔ)音調(diào)度系統(tǒng)的研究,大多只關(guān)注調(diào)度語(yǔ)音的表層語(yǔ)義信息,沒(méi)有考慮短語(yǔ)音和欺騙性語(yǔ)音等引發(fā)的安全問(wèn)題。

        為此,針對(duì)此類(lèi)電網(wǎng)調(diào)度安全挑戰(zhàn),提出基于深度卷積神經(jīng)網(wǎng)絡(luò)的聲紋識(shí)別技術(shù)和動(dòng)態(tài)口令技術(shù),設(shè)計(jì)一種結(jié)合語(yǔ)音識(shí)別和聲紋識(shí)別技術(shù)的身份驗(yàn)證方法,以提升在電網(wǎng)調(diào)度語(yǔ)音指揮業(yè)務(wù)中調(diào)度員身份聲紋識(shí)別準(zhǔn)確率,實(shí)現(xiàn)調(diào)度員身份驗(yàn)證。此外,還結(jié)合調(diào)度指令可行性校驗(yàn),確保調(diào)度的安全性。

        1 聲紋識(shí)別技術(shù)相關(guān)研究

        1.1 聲紋識(shí)別

        現(xiàn)有聲紋識(shí)別模型多基于身份向量(identity vectors,i-vectors)方法建立。在這些模型中,以無(wú)監(jiān)督的方式學(xué)習(xí)映射矩陣T,使得數(shù)據(jù)最大似然化。矩陣T將通用背景模型(universal background model,UBM)的高維統(tǒng)計(jì)信息映射為已知的低維特征信息向量ivectors。通過(guò)計(jì)算兩個(gè)信息向量ivectors的距離,可以判斷兩個(gè)聲紋是否歸屬于同一人。近期,有學(xué)者提出另一種基于xvectors方法的解決方案,這類(lèi)方法利用深度神經(jīng)網(wǎng)絡(luò)(deep neural networks,DNN)對(duì)訓(xùn)練數(shù)據(jù)中的說(shuō)話(huà)人進(jìn)行分類(lèi)。訓(xùn)練完成后,利用特征嵌入層提取特征信息xvectors。概率線(xiàn)性判別分析(piecewise linear discriminant analysis,PLDA)[7]分類(lèi)器用于比較特征信息,從而實(shí)現(xiàn)聲紋識(shí)別。這些方法大多采用人工設(shè)定的特征,如FilterBank 系數(shù)和梅爾頻率倒譜系數(shù)(mel-frequency cepstral coefficients,MFCC)[8]。上述人工特征均依據(jù)人的表征特征感知能力而設(shè)計(jì),難以適用于高效的聲紋識(shí)別任務(wù)。為解決這一缺陷,將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)應(yīng)用在了聲紋識(shí)別領(lǐng)域。

        CNN 因?yàn)闄?quán)值共享、局部濾波和池化等操作,有助于提高模型健壯性和表征能力,被廣泛應(yīng)用于圖像領(lǐng)域。但是,語(yǔ)音樣本的數(shù)據(jù)量相對(duì)于圖像樣本的數(shù)據(jù)量小,因此在使用CNN聲紋識(shí)別時(shí),卷積層中的參數(shù)個(gè)數(shù)不能太大,否則容易過(guò)擬合。此外,CNN在訓(xùn)練樣本數(shù)量較少的情況下,學(xué)習(xí)到的濾波器往往包含噪聲,因此無(wú)法有效地表示聲紋信號(hào)。為解決這些問(wèn)題,SincNet[9]減少第一卷積層中需要學(xué)習(xí)的參數(shù)并用Sinc 函數(shù)代替卷積從而實(shí)現(xiàn)帶通濾波器,SincNet比標(biāo)準(zhǔn)CNN收斂速度更快,效果更好。

        1.2 短時(shí)語(yǔ)音識(shí)別

        近年來(lái),聲紋識(shí)別技術(shù)發(fā)展迅速,各類(lèi)研究逐漸成熟,人們逐漸將研究方向轉(zhuǎn)向更具有挑戰(zhàn)性的復(fù)雜環(huán)境,例如信道失配、短時(shí)語(yǔ)音和背景噪聲等。聲紋識(shí)別系統(tǒng)對(duì)短時(shí)語(yǔ)音識(shí)別效果直接影響用戶(hù)的體驗(yàn),短時(shí)語(yǔ)音一般指時(shí)長(zhǎng)5 s 以?xún)?nèi)的語(yǔ)音,超過(guò)5 s 的語(yǔ)音錄入會(huì)讓用戶(hù)反感。然而在實(shí)際應(yīng)用中,現(xiàn)有聲紋識(shí)別系統(tǒng)僅能對(duì)長(zhǎng)度足夠的語(yǔ)音發(fā)揮較好的識(shí)別性能[10],包括支持向量機(jī)(support vector machine,SVM)[11]、基于高斯混合模型(gaussian mixture model,GMM)的聲紋識(shí)別模型[12]等,隨著語(yǔ)音長(zhǎng)度的縮短,這些聲紋識(shí)別系統(tǒng)的性能迅速下降,聲紋模型能從語(yǔ)音中學(xué)習(xí)到的身份信息較少,且從短時(shí)語(yǔ)音中提取的特征更易受說(shuō)話(huà)人狀態(tài)、語(yǔ)音內(nèi)容和語(yǔ)調(diào)的影響,在語(yǔ)音數(shù)據(jù)不足的情況下如何充分挖掘語(yǔ)音特征進(jìn)行身份識(shí)別成為研究熱點(diǎn)。文獻(xiàn)[13]對(duì)比各類(lèi)網(wǎng)絡(luò)模型的優(yōu)缺點(diǎn),發(fā)現(xiàn)CNN 在短時(shí)語(yǔ)音識(shí)別領(lǐng)域的優(yōu)勢(shì)?;诰矸e神經(jīng)網(wǎng)絡(luò)的聲紋識(shí)別系統(tǒng),以語(yǔ)音語(yǔ)譜圖為輸入,同時(shí)利用語(yǔ)音的時(shí)域信息和頻域信息,能更好地克服短時(shí)語(yǔ)音數(shù)據(jù)量不足的問(wèn)題,同時(shí)運(yùn)算速度更快,可以與用戶(hù)進(jìn)行實(shí)時(shí)互動(dòng)。

        1.3 欺騙性語(yǔ)音檢測(cè)

        隨著聲紋識(shí)別系統(tǒng)的廣泛使用,欺騙性語(yǔ)音逐漸成為威脅聲紋識(shí)別系統(tǒng)安全的因素,欺騙性語(yǔ)音攻擊方式主要有3 種:語(yǔ)音合成(text to speech,TTS)、語(yǔ)音轉(zhuǎn)換(voice conversion,VC)[14]以及錄音重放(recapture)。語(yǔ)音合成技術(shù)是指對(duì)給定的文本信息運(yùn)用合成技術(shù),將其轉(zhuǎn)換為一段音色接近于目標(biāo)說(shuō)話(huà)人的自然語(yǔ)言序列[15];語(yǔ)音轉(zhuǎn)換技術(shù)則是通過(guò)技術(shù)手段對(duì)某一個(gè)人的自然語(yǔ)音波形進(jìn)行修改變換,使之聽(tīng)起來(lái)與目標(biāo)說(shuō)話(huà)人的聲音相似,達(dá)到難以區(qū)分的程度;錄音重放攻擊指攻擊者事先采集目標(biāo)說(shuō)話(huà)人的音頻,再通過(guò)播放設(shè)備重放音頻來(lái)欺騙聲紋身份認(rèn)證系統(tǒng),獲得非法授權(quán),相比其他兩種欺騙性語(yǔ)音,錄音重放攻擊的成本低廉且沒(méi)有技術(shù)門(mén)檻,極難被聲紋身份認(rèn)證系統(tǒng)抵擋。

        為應(yīng)對(duì)欺騙性語(yǔ)音挑戰(zhàn),尤其是錄音重放攻擊,除在聲紋識(shí)別算法上進(jìn)行改進(jìn)外,在身份認(rèn)證系統(tǒng)中引入動(dòng)態(tài)認(rèn)證也是一種有效手段[16]。動(dòng)態(tài)身份認(rèn)證加入時(shí)間因子作為參數(shù),使用固定時(shí)間間隔隨機(jī)產(chǎn)生的口令代替?zhèn)鹘y(tǒng)的靜態(tài)口令,進(jìn)而避免口令語(yǔ)音泄露帶來(lái)的安全問(wèn)題。動(dòng)態(tài)身份認(rèn)證系統(tǒng)會(huì)設(shè)定時(shí)間限制,例如聲紋身份認(rèn)證系統(tǒng)中,以動(dòng)態(tài)口令生成時(shí)間為起點(diǎn),要求待認(rèn)證用戶(hù)必須在規(guī)定時(shí)間內(nèi)錄入動(dòng)態(tài)口令語(yǔ)音,否則不予通過(guò)。由于動(dòng)態(tài)口令的隨機(jī)性,攻擊者無(wú)法在短時(shí)間內(nèi)獲取包含指定內(nèi)容的目標(biāo)用戶(hù)語(yǔ)音。運(yùn)用基于動(dòng)態(tài)口令的身份驗(yàn)證方法可有效保證系統(tǒng)的可靠性和訪(fǎng)問(wèn)的安全性[17]。

        2 方案設(shè)計(jì)

        2.1 調(diào)度認(rèn)證系統(tǒng)構(gòu)建

        針對(duì)提出的各種基于聲紋識(shí)別的身份認(rèn)證挑戰(zhàn),構(gòu)建一種基于聲紋識(shí)別的調(diào)度認(rèn)證系統(tǒng),解決電網(wǎng)調(diào)度場(chǎng)景中可能存在的多種未知欺騙攻擊和錯(cuò)誤調(diào)度指令問(wèn)題。該系統(tǒng)的目標(biāo)是判斷訪(fǎng)問(wèn)用戶(hù)的輸入語(yǔ)音是否為真實(shí)語(yǔ)音以及實(shí)現(xiàn)對(duì)未知訪(fǎng)問(wèn)用戶(hù)的身份驗(yàn)證,對(duì)調(diào)度人員進(jìn)行訪(fǎng)問(wèn)控制。此外為避免錯(cuò)誤擬定指令對(duì)電網(wǎng)造成安全威脅,保障調(diào)度系統(tǒng)能夠發(fā)布合規(guī)的調(diào)度指令,該系統(tǒng)會(huì)對(duì)指令正確性進(jìn)行校驗(yàn),對(duì)調(diào)度指令進(jìn)行有效約束??紤]電網(wǎng)調(diào)度場(chǎng)景的實(shí)時(shí)性需求,該系統(tǒng)應(yīng)實(shí)現(xiàn)高效響應(yīng)用戶(hù)的請(qǐng)求,在執(zhí)行身份認(rèn)證的同時(shí)給予及時(shí)有效的相關(guān)反饋。

        文中設(shè)計(jì)的調(diào)度認(rèn)證系統(tǒng)如圖1 所示,主要分為四層架構(gòu):數(shù)據(jù)層、功能層、接口層和業(yè)務(wù)應(yīng)用層。每一層均包含相應(yīng)的功能組件,各層之間通過(guò)層級(jí)關(guān)系進(jìn)行數(shù)據(jù)傳輸以及功能連接,層級(jí)結(jié)構(gòu)保障整體系統(tǒng)高內(nèi)聚、低耦合的特征。前端業(yè)務(wù)應(yīng)用層主要實(shí)現(xiàn)用戶(hù)和系統(tǒng)之間的交互,該層向用戶(hù)提供身份認(rèn)證入口,后臺(tái)會(huì)對(duì)采集的語(yǔ)音進(jìn)行身份驗(yàn)證和指令校驗(yàn),然后向用戶(hù)返回“通過(guò)”并發(fā)布調(diào)度指令,或者“拒絕”;接口層是應(yīng)用層和功能層的橋梁,根據(jù)當(dāng)前身份認(rèn)證需求提供相應(yīng)的功能接口;功能層主要提供系統(tǒng)核心的聲紋處理功能,實(shí)現(xiàn)語(yǔ)音預(yù)處理、聲紋識(shí)別、語(yǔ)音識(shí)別和指令校驗(yàn)功能;數(shù)據(jù)層則包括聲紋數(shù)據(jù)庫(kù)、隨機(jī)文本庫(kù)和調(diào)度術(shù)語(yǔ)庫(kù),實(shí)現(xiàn)對(duì)聲紋特征和調(diào)度術(shù)語(yǔ)的存儲(chǔ),以及動(dòng)態(tài)口令的生成,為功能層提供數(shù)據(jù)支持。

        圖1 基于聲紋識(shí)別的調(diào)度認(rèn)證系統(tǒng)架構(gòu)Fig.1 Dispatching authentication system architecture based on voiceprint recognition

        提出的基于聲紋識(shí)別的調(diào)度認(rèn)證系統(tǒng)的實(shí)現(xiàn)流程如圖2所示。

        圖2 調(diào)度認(rèn)證系統(tǒng)的實(shí)現(xiàn)流程Fig.2 The implementation process of dispatching authentication system

        調(diào)度認(rèn)證系統(tǒng)的實(shí)現(xiàn)步驟如下:

        1)聲紋認(rèn)證階段。待驗(yàn)證人員首先錄入調(diào)度指令語(yǔ)音,聲紋模型提取語(yǔ)音輸入聲紋特征并在聲紋數(shù)據(jù)庫(kù)中檢索該聲紋特征,若匹配聲紋成功則進(jìn)入動(dòng)態(tài)驗(yàn)證環(huán)節(jié)。

        2)動(dòng)態(tài)驗(yàn)證階段。基于隨機(jī)文本庫(kù)生成隨機(jī)口令,并展示給待驗(yàn)證人員,待驗(yàn)證人員錄入動(dòng)態(tài)口令語(yǔ)音,首先將該語(yǔ)音輸入語(yǔ)音識(shí)別模型,轉(zhuǎn)換為文本序列,與展示的隨機(jī)口令文本進(jìn)行匹配,同時(shí)將該語(yǔ)音輸入聲紋識(shí)別模型提取聲紋特征,與步驟1)中提取的聲紋特征進(jìn)行匹配。若兩次匹配均通過(guò)則進(jìn)入步驟3)指令檢驗(yàn)階段。

        3)調(diào)度指令檢驗(yàn)階段。首先將錄入的調(diào)度指令語(yǔ)音輸入語(yǔ)音識(shí)別模型,得到文本序列,并在調(diào)度術(shù)語(yǔ)數(shù)據(jù)庫(kù)中檢索該調(diào)度指令內(nèi)容,旨在發(fā)現(xiàn)錄入的調(diào)度指令中存在的問(wèn)題,例如不合規(guī)術(shù)語(yǔ)和超出閾值的異常數(shù)值,對(duì)調(diào)度指令進(jìn)行安全性校驗(yàn)。如果發(fā)現(xiàn)調(diào)度指令存在安全隱患,則不予執(zhí)行并將調(diào)度指令退回,直至調(diào)度人員對(duì)指令進(jìn)行修改,通過(guò)合規(guī)性校驗(yàn)后,系統(tǒng)再發(fā)布調(diào)度指令。

        2.2 人員聲紋認(rèn)證

        在電網(wǎng)調(diào)度場(chǎng)景中,為避免指令歧義等隱患引起的安全風(fēng)險(xiǎn),調(diào)度系統(tǒng)通常要求調(diào)度員使用一套統(tǒng)一且嚴(yán)謹(jǐn)?shù)恼{(diào)度術(shù)語(yǔ)體系進(jìn)行聯(lián)系匯報(bào),這使得調(diào)度指令較為簡(jiǎn)練,語(yǔ)音時(shí)長(zhǎng)較短,同時(shí)也導(dǎo)致聲紋識(shí)別系統(tǒng)難以獲得大量聲紋信息,無(wú)法提取出足夠的聲紋特征[18]。因此在電網(wǎng)調(diào)度系統(tǒng)中,如何從有限的聲紋數(shù)據(jù)中獲取盡可能多的聲紋特征用于聲紋人員認(rèn)證,具有較大的研究?jī)r(jià)值。

        傳統(tǒng)的聲紋識(shí)別方法難以從原始語(yǔ)音中提取充足的信息來(lái)檢測(cè)短時(shí)語(yǔ)音,針對(duì)該短時(shí)語(yǔ)音安全挑戰(zhàn),引入卷積神經(jīng)網(wǎng)絡(luò)CNN 對(duì)聲紋進(jìn)行建模,CNN是近年來(lái)語(yǔ)音處理領(lǐng)域中最流行的架構(gòu)之一,其權(quán)重共享、局部感知域和池化層等特征有助于發(fā)現(xiàn)語(yǔ)音信息中魯棒的特征表示,因此引入CNN 可以有效解決短時(shí)語(yǔ)音挑戰(zhàn)中語(yǔ)音信息量不足的問(wèn)題[19]。首先,將說(shuō)話(huà)者的語(yǔ)音信號(hào)劃分為短時(shí)語(yǔ)音段;然后,從短時(shí)語(yǔ)音段生成短時(shí)間頻譜圖,并取對(duì)數(shù)獲得短時(shí)間對(duì)數(shù)頻譜圖;接著,將多個(gè)短時(shí)對(duì)數(shù)頻譜圖疊加為一組獲取特征譜圖,以減小樣本大小,并準(zhǔn)確地獲得穩(wěn)定的聲紋特征。最后,將特征譜圖輸入到卷積神經(jīng)網(wǎng)絡(luò)中,預(yù)測(cè)出最有可能的說(shuō)話(huà)人,采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)聲紋特征進(jìn)行提取,可以充分利用時(shí)域和頻域的特征,提高聲紋識(shí)別系統(tǒng)的性能[20]。

        所設(shè)計(jì)的聲紋認(rèn)證階段主要分為訓(xùn)練、注冊(cè)和識(shí)別3 個(gè)流程。在訓(xùn)練流程中,首先從非相關(guān)人員中采集大量的訓(xùn)練語(yǔ)音,然后將訓(xùn)練語(yǔ)音進(jìn)行預(yù)處理得到語(yǔ)譜圖,最后將語(yǔ)譜圖作為聲紋模型的輸入,訓(xùn)練出用于聲紋識(shí)別的通用背景模型,流程如圖3所示。

        圖3 聲紋認(rèn)證階段訓(xùn)練流程Fig.3 Voiceprint authentication phase training process

        在注冊(cè)流程中,首先需要采集相關(guān)調(diào)度人員的注冊(cè)語(yǔ)音,將注冊(cè)語(yǔ)音預(yù)處理生成語(yǔ)譜圖后,輸入到通用背景模型中得到聲紋嵌入向量,然后將同一個(gè)調(diào)度人員的多個(gè)聲紋嵌入向量進(jìn)行平均,最終得到屬于每一個(gè)調(diào)度人員的聲紋模型,存儲(chǔ)到聲紋數(shù)據(jù)庫(kù)中即視為完成注冊(cè),流程如圖4所示。

        圖4 聲紋認(rèn)證階段注冊(cè)流程Fig.4 Voiceprint authentication phase registration process

        在識(shí)別流程中,首先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理得到語(yǔ)譜圖,然后將語(yǔ)譜圖輸入訓(xùn)練得到的聲紋模型中,得到待識(shí)別語(yǔ)音的聲紋嵌入向量,最后與聲紋數(shù)據(jù)庫(kù)中的聲紋模型進(jìn)行對(duì)比,計(jì)算并評(píng)估聲紋嵌入向量與所有聲紋模型的相似性,得到大小為N的余弦距離矩陣(N表示說(shuō)話(huà)人數(shù)量)。使用該余弦距離矩陣中的值作為相似度得分,若數(shù)據(jù)庫(kù)存在相似度大于設(shè)定閾值的聲紋特征則判斷為通過(guò),進(jìn)入動(dòng)態(tài)驗(yàn)證階段,若無(wú)高于閾值的聲紋特征則不予通過(guò),流程如圖5所示。

        圖5 聲紋認(rèn)證階段識(shí)別流程Fig.5 Voiceprint authentication phase identification process

        2.3 口令動(dòng)態(tài)驗(yàn)證

        除短時(shí)語(yǔ)音安全挑戰(zhàn)外,欺騙性語(yǔ)音也是一個(gè)威脅聲紋識(shí)別身份認(rèn)證的安全挑戰(zhàn),欺騙性語(yǔ)音即系統(tǒng)闖入者使用語(yǔ)音合成、錄音重放等方法欺騙聲紋身份認(rèn)證系統(tǒng),試圖利用虛假語(yǔ)音通過(guò)身份認(rèn)證,獲取系統(tǒng)操作權(quán)限,實(shí)行不法行為。如何應(yīng)對(duì)欺騙性語(yǔ)音無(wú)疑對(duì)聲紋身份認(rèn)證系統(tǒng)提出更高的要求。通過(guò)技術(shù)合成的人工語(yǔ)音,無(wú)法完全模仿目標(biāo)用戶(hù)的真實(shí)語(yǔ)音,合成語(yǔ)音與真實(shí)語(yǔ)音在高頻區(qū)分布差別較大,難以合成連貫且自然的語(yǔ)音,先進(jìn)的聲紋識(shí)別算法可以識(shí)別合成語(yǔ)音與真實(shí)語(yǔ)音的差異,在一定程度上抵御合成語(yǔ)音威脅。而錄音重放的語(yǔ)音取自真實(shí)目標(biāo)用戶(hù)的語(yǔ)音,基于聲紋識(shí)別技術(shù)的身份驗(yàn)證系統(tǒng)無(wú)法識(shí)別驗(yàn)證語(yǔ)音是否為系統(tǒng)用戶(hù)本人錄入,抑或是錄音重放,因此現(xiàn)有聲紋身份認(rèn)證系統(tǒng)難以抵御此類(lèi)攻擊。

        針對(duì)欺騙性語(yǔ)音安全挑戰(zhàn),文中采用動(dòng)態(tài)口令驗(yàn)證技術(shù)來(lái)解決該問(wèn)題。聲紋識(shí)別技術(shù)可以分為文本有關(guān)型、文本無(wú)關(guān)型和文本提示型。3種聲紋識(shí)別技術(shù)各有其特色:文本相關(guān)型使用說(shuō)話(huà)人的發(fā)音關(guān)鍵詞和常用語(yǔ)句作為訓(xùn)練文本,識(shí)別時(shí),按照固定內(nèi)容發(fā)音,識(shí)別性能優(yōu)異,但更容易被盜用真實(shí)用戶(hù)語(yǔ)音;文本無(wú)關(guān)型的說(shuō)話(huà)人識(shí)別方法,無(wú)須限制識(shí)別時(shí)的語(yǔ)音內(nèi)容,使用起來(lái)更加靈活方便,但是性能不能得到保證;文本提示型同時(shí)具備文本有關(guān)型和文本無(wú)關(guān)型的優(yōu)勢(shì),既有良好的識(shí)別效率,也能防范欺騙性語(yǔ)音。動(dòng)態(tài)口令驗(yàn)證技術(shù)屬于文本提示型聲紋識(shí)別技術(shù),每次執(zhí)行身份認(rèn)證時(shí),系統(tǒng)會(huì)從預(yù)先設(shè)定的文本庫(kù)中隨機(jī)選擇并生成動(dòng)態(tài)文本,要求說(shuō)話(huà)人依照展示文本發(fā)音,系統(tǒng)同時(shí)也會(huì)設(shè)置時(shí)限,闖入者很難在短時(shí)間合成目標(biāo)用戶(hù)語(yǔ)音,更不可能提前獲取包含提示文本的目標(biāo)用戶(hù)的真實(shí)語(yǔ)音,通過(guò)動(dòng)態(tài)口令驗(yàn)證技術(shù)可以很好地解決欺騙性語(yǔ)音問(wèn)題。

        文中提出的動(dòng)態(tài)口令驗(yàn)證階段實(shí)現(xiàn)流程如圖6所示。

        圖6 動(dòng)態(tài)驗(yàn)證階段流程Fig.6 Dynamic verification phase process

        動(dòng)態(tài)口令驗(yàn)證階段實(shí)現(xiàn)步驟如下:

        1)從文本庫(kù)中隨機(jī)生成動(dòng)態(tài)口令,展示給待驗(yàn)證人員,待驗(yàn)證人員須在規(guī)定時(shí)間錄入動(dòng)態(tài)口令語(yǔ)音,否則驗(yàn)證失敗。

        2)將動(dòng)態(tài)口令語(yǔ)音輸入語(yǔ)音識(shí)別模型,得到文本識(shí)別結(jié)果,將識(shí)別結(jié)果與展示的動(dòng)態(tài)口令進(jìn)行匹配,若不匹配則要求重新錄入。

        3)若識(shí)別結(jié)果與動(dòng)態(tài)口令匹配,則繼續(xù)進(jìn)行聲紋特征提取,將動(dòng)態(tài)口令語(yǔ)音輸入到聲紋識(shí)別模型中,得到聲紋嵌入特征,與之前錄入的調(diào)度指令語(yǔ)音進(jìn)行聲紋特征余弦相似度判決,給出核驗(yàn)結(jié)果;

        4)若判決的余弦相似度大于設(shè)定的閾值,則判斷調(diào)度指令語(yǔ)音不屬于欺騙性語(yǔ)音,調(diào)度員身份檢驗(yàn)通過(guò),繼續(xù)執(zhí)行指令校驗(yàn)階段,若相似度低于閾值則不予執(zhí)行。

        2.4 指令有效性校驗(yàn)

        隨之電網(wǎng)智能化進(jìn)程的推進(jìn),電網(wǎng)安全問(wèn)題時(shí)有發(fā)生,例如無(wú)權(quán)限調(diào)度和錯(cuò)誤調(diào)度等。這些風(fēng)險(xiǎn)時(shí)刻威脅著電網(wǎng)系統(tǒng)的正常調(diào)度,加強(qiáng)電網(wǎng)風(fēng)險(xiǎn)管控,提高電網(wǎng)調(diào)度操作水平迫在眉睫。針對(duì)可能出現(xiàn)的錯(cuò)誤調(diào)度指令,文中提出了加入指令校驗(yàn)過(guò)程的構(gòu)想,調(diào)度指令校驗(yàn)是指當(dāng)系統(tǒng)即將執(zhí)行調(diào)度指令時(shí),先對(duì)調(diào)度指令進(jìn)行可行性校驗(yàn),即檢查指令的合規(guī)性和安全性,當(dāng)發(fā)現(xiàn)調(diào)度指令存在安全隱患或表達(dá)歧義等問(wèn)題時(shí),系統(tǒng)會(huì)退還調(diào)度指令并提示調(diào)度人員更改指令,直至指令通過(guò)校驗(yàn)后才被允許發(fā)布。對(duì)調(diào)度指令進(jìn)行校驗(yàn)既可以提升電網(wǎng)風(fēng)險(xiǎn)管理水平,還能提高電網(wǎng)調(diào)度效率,最大程度上規(guī)避錯(cuò)誤調(diào)度引起的安全事故。

        文中提出的調(diào)度指令校驗(yàn)實(shí)現(xiàn)流程如圖7所示。

        圖7 調(diào)度指令校驗(yàn)流程Fig.7 Dispatching instruction verification process

        調(diào)度指令校驗(yàn)實(shí)現(xiàn)步驟如下:

        1)首先將調(diào)度指令語(yǔ)音輸入語(yǔ)音識(shí)別模型和word2vec,輸出文本識(shí)別結(jié)果,接著計(jì)算文本中所有單詞的詞嵌入,最后對(duì)所有詞嵌入取平均。

        2)計(jì)算識(shí)別文本詞嵌入和調(diào)度術(shù)語(yǔ)數(shù)據(jù)庫(kù)中記錄的所有調(diào)度指令的詞嵌入之間的余弦相似度,得到余弦距離矩陣。

        3)若余弦距離矩陣中存在大于設(shè)定閾值的值,即說(shuō)明該調(diào)度語(yǔ)音是存在記錄在數(shù)據(jù)庫(kù)中的合規(guī)調(diào)度指令,判斷允許執(zhí)行;反之,若不存在則要求重新錄入調(diào)度指令語(yǔ)音。

        3 結(jié)束語(yǔ)

        針對(duì)傳統(tǒng)電網(wǎng)調(diào)度系統(tǒng)中缺乏調(diào)度認(rèn)證的問(wèn)題,結(jié)合電網(wǎng)運(yùn)行特點(diǎn)及調(diào)控需求,設(shè)計(jì)基于聲紋識(shí)別的調(diào)度認(rèn)證系統(tǒng),幫助遠(yuǎn)程識(shí)別現(xiàn)場(chǎng)的調(diào)度下令人員的真實(shí)身份,并校驗(yàn)調(diào)度指令的可行性。首先,引入深度學(xué)習(xí)算法模型提取語(yǔ)音特征,有效地抽取輸入語(yǔ)音更深層次的信息,提高模型的運(yùn)算速度,解決短時(shí)語(yǔ)音問(wèn)題;其次,引入動(dòng)態(tài)口令驗(yàn)證,剔除虛假調(diào)度語(yǔ)音,核驗(yàn)現(xiàn)場(chǎng)人員的真實(shí)身份,解決欺騙性語(yǔ)音問(wèn)題;最后,對(duì)調(diào)度指令進(jìn)行可行性校驗(yàn)和風(fēng)險(xiǎn)評(píng)估,減少不合規(guī)調(diào)度指令造成的風(fēng)險(xiǎn),提高電網(wǎng)調(diào)度的效率,同時(shí)避免重大安全事故。

        猜你喜歡
        指令模型系統(tǒng)
        一半模型
        聽(tīng)我指令:大催眠術(shù)
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無(wú)人機(jī)系統(tǒng)
        ZC系列無(wú)人機(jī)遙感系統(tǒng)
        重要模型『一線(xiàn)三等角』
        重尾非線(xiàn)性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        ARINC661顯控指令快速驗(yàn)證方法
        LED照明產(chǎn)品歐盟ErP指令要求解讀
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        成人精品一区二区三区电影| 韩国日本在线观看一区二区| 亚洲三级香港三级久久| 最美女人体内射精一区二区| 黑人巨大av在线播放无码| 亚洲熟妇在线视频观看| 亚洲全国最大的人成网站| 91精品国产综合久久熟女| 久久精品成人无码观看不卡| 日子2020一区二区免费视频| 免费毛片一区二区三区女同| av黄页网国产精品大全| 国产精品狼人久久久久影院| 不卡视频一区二区三区| 蜜桃av噜噜一区二区三区免费 | 国产免费人成视频在线观看| 初尝人妻少妇中文字幕| 人妻被黑人粗大的猛烈进出 | 日韩精品视频在线一二三| 一区二区三区日本伦理| 专干老肥熟女视频网站300部| 日韩欧美第一页| 中文字幕精品乱码一区| 亚洲a无码综合a国产av中文| 午夜无码片在线观看影视| 欧美成人免费看片一区| 亚洲一区免费视频看看| 国产乱人对白| 99这里只有精品| 丝袜美腿久久亚洲一区| 日本在线观看一区二区三| 深夜福利小视频在线观看| 色婷婷狠狠97成为人免费| 久久精品一区二区熟女| 亚洲日产一线二线三线精华液| 在线人妻无码一区二区| 国产在线视频一区二区三| 国产精品女同久久久久电影院| 韩日美无码精品无码| 久久伊人精品只有这里有| 精品人妻av一区二区三区|