宋江珉,成雨含,李子炎,洪 亮,孫科學,3
(1.南京郵電大學 電子科學與工程學院,江蘇 南京 210023;2.南京郵電大學 信息化建設(shè)與管理辦公室,江蘇 南京 210023;3.江蘇省射頻集成與微組裝工程實驗室,江蘇 南京 210023)
一種心音身份識別中序列碼的安全性分析
宋江珉1,成雨含2,李子炎1,洪 亮1,孫科學1,3
(1.南京郵電大學 電子科學與工程學院,江蘇 南京 210023;2.南京郵電大學 信息化建設(shè)與管理辦公室,江蘇 南京 210023;3.江蘇省射頻集成與微組裝工程實驗室,江蘇 南京 210023)
通過提出并利用相似度和平均相似度的概念,對現(xiàn)有的基于拐點序列碼的心音識別方法的安全性進行了評估。結(jié)果表明,現(xiàn)有的基于拐點序列碼的心音識別方法存在規(guī)律明顯、易于偽造的問題。為提高心音身份識別的安全性,提出了一種改進的(S1+S2)型內(nèi)部加密序列碼來優(yōu)化序列碼結(jié)構(gòu)。這種加密方法需要對一維心音信號進行小波去噪和幅值歸一化處理,并對獲取的原始二維心音信號進行預處理。在處理后的二維心音圖中獲取拐點序列碼,通過將第一心音和第二心音峰值兩側(cè)對應(yīng)拐點值相加形成新的序列碼,降低了序列碼的規(guī)律性。實驗結(jié)果表明,通過平均相似度來評估二維心音圖身份識別的安全性是必要的,改進的(S1+S2)型內(nèi)部加密序列碼能更好地提取心音的生物特征,提高了數(shù)字心音二維化識別的安全性。
二維心音圖;圖像處理;身份識別;序列碼內(nèi)部加密;平均相似度
隨著科技的發(fā)展,身份識別技術(shù)的應(yīng)用越來越大眾化,人們對身份識別的準確性、安全性也提出了更高的要求。在傳統(tǒng)的生物識別技術(shù)中,主要的生物特征有指紋、虹膜、視網(wǎng)膜、人臉、聲紋、步態(tài)等[1-4]。在這些生物特征中,指紋可以通過指紋復制膜偽造,虹膜和人臉可以被照相機拍攝復制,聲紋則可以被錄制重放,這對生物識別的安全性帶來了很大的挑戰(zhàn)。因此,人們開始著手于對新的生理或行為特征進行研究,如基因(DNA)、心電信號、大腦信號等。而且采用兩種或兩種以上的生物特征相結(jié)合的方式,以提高識別系統(tǒng)的性能[5-6]。
心音是人體內(nèi)的重要生理信號。在醫(yī)學中,心音信號的應(yīng)用有著悠久的歷史。心音中包含了心臟各個部分的生理信息,如心房、心室、心血管、各個瓣膜等的生理狀態(tài)。心音信號是一種具備普遍性、獨特性和可采集性的生物特征[7-13]。Beritelli等對心音信號中的第一心音(S1)和第二心音(S2)進行了頻譜分析,證實了心音具有獨一無二的生理特征,并對比了心音錄制后的重放音與在胸部獲得的心音信號,兩者的相似程度不到75%。因此,將心音信號應(yīng)用到身份識別中是可行的。
通過小波降噪和幅值歸一化等預處理將一維心音轉(zhuǎn)換為二維心音圖后,對背景歸一化、二值化、細化后的二維心音圖進行研究。在將拐點序列碼[14]用于身份識別的原理研究基礎(chǔ)上,提出了相似度和平均相似度的概念來評判拐點序列碼身份識別的安全性分析方法,并給出了一種改進的(S1+S2)型內(nèi)部加密序列碼。通過實驗對該序列碼的安全性進行驗證。
1.1一維心音信號的預處理
一維心音信號本質(zhì)上就是聲音信號,在采集過程中會受到外界噪聲的影響,如語音、呼吸音等。在心音信號的采集過程中,盡可能在安靜的環(huán)境下屏氣采集,但采集到的心音信號仍會受外界噪聲的影響,因此對原始的一維心音信號需要首先進行小波去噪[8]。
為了使后續(xù)的分析與研究具有統(tǒng)一性和可比性,還需對小波去噪后的心音信號進行幅值歸一化處理。
1.2二維心音圖的獲取
心音信號的生物特征信息主要集中在S1和S2,其中第一心音時長在0.1~0.12 s之間,第二心音時長在0.08~0.1 s之間。在截取二維心音圖時,第一心音截取前0.1 s時長,第二心音截取前0.8 s時長,則足以涵蓋心音信號的主要信息。
1.3二維心音圖的預處理
原始的二維心音圖是通過一維心音波形截取得到的,存在比較嚴重的背景噪聲,同時可能存在毛刺,使得二維心音圖中的波形走勢不夠光滑,會影響到拐點序列碼的生成。因此需要對原始的二維心音信號進行預處理。
由于在數(shù)字心音二維化識別的過程中,所提取的特征值為拐點序列碼,與二維心音圖的顏色無關(guān),因此首先需要對原始的二維心音圖進行灰度化,生成灰度圖像。
對于灰度化后的二維心音圖而言,圖像背景中的網(wǎng)格噪聲比較嚴重,這會影響到二維心音圖的后續(xù)處理,因此需對灰度化后的二維心音圖進行背景歸一化,濾去部分背景噪聲。
而對背景歸一化后的二維心音圖進行二值化,可以使二維心音圖中的波形與背景完全分離,生成黑白圖像。其中背景為白色,二維心音波形為黑色。此時,背景對二維心音圖的特征提取再無任何影響。
二值化后的二維心音圖中,心音波形會存在一定的寬度,其中包含了冗余信息[9-10]。因此,需對二值化后的二維心音圖進行細化,在不改變心音圖像的波形走勢和連通性的情況下,使心音波形只有一個像素的寬度,以突出波形的走勢,便于后續(xù)的拐點序列碼的生成。
2.1拐點序列碼的獲取
現(xiàn)有的拐點序列碼的獲取方法是先對二維心音圖按拐點周期進行分割,再計算每個拐點周期內(nèi)的拐點個數(shù),最后組成一組拐點序列碼。其中,一個拐點周期是指心音波形中第一個上升零點到第二個上升零點之間的波形。
對完成預處理的二維心音圖進行拐點序列生成,其結(jié)果如圖1所示。
從圖1可以看出,該心音信號的拐點序列碼為{2,2,2,4,2,2,2,2,2,2,2,2,4,2,2,2,2,4}{4,2,4,6,2,2,2,2,2,2,2,2,2,2,0}。其中,對于第一心音和第二心音分別用大括號分隔,且第一心音和第二心音中峰值所在位置的拐點值加粗顯示。
2.2拐點序列碼的安全性
分析圖1中獲得的拐點序列碼,其每位的取值只有三種可能,分別為2、4、6。對二維心音圖按照拐點周期進行分割可以發(fā)現(xiàn),二維心音圖實質(zhì)上是由雙峰子波、三峰子波及四峰子波組成的。
三種子波對應(yīng)的拐點值分別是2、4、6。拐點序列碼實質(zhì)上就是2、4、6三個數(shù)的排列組合。
圖1 二維心音圖序列碼的獲取
圖2 二維心音圖的基本拐點周期
2.2.1 拐點序列碼的缺點
在現(xiàn)有的拐點序列碼理論中,拐點序列碼的長度達到20個拐點值就足以用于身份識別。圖1中的拐點序列碼長度為33,截取前20個值,則拐點序列碼變?yōu)閧2,2,2,4,2,2,2,2,2,2,2,2,4,2,2,2,2,4}{4,2}??梢詫⒃摴拯c序列碼看作是一個長度為20,每位有三種取值可能的“密碼”,該密碼有320≈34.9億種可能,即在理論上34.9億人中才必然會出現(xiàn)兩人的拐點序列碼相同的情況。
分析該長度為20的拐點序列碼,有如下缺點:
(1)拐點序列碼的生成與心音信號的幅值無關(guān),忽略了心音信號幅值中的生理信息;
(2)截取長度為20的拐點序列碼主要集中在第一心音,占了90%,剩下的10%不足以涵蓋第二心音的生理信息;
(3)拐點值只包含了2和4,其中拐點值2占了序列碼75%,如此簡單而且規(guī)律性強的“密碼”易于偽造。
圖3是三種子波偽造的心音圖。在現(xiàn)有拐點序列碼的獲取算法下,偽造的心音圖能夠完美地獲得心音信號的拐點序列碼,且正確率為100%。由此可以看出,現(xiàn)有的拐點序列碼獲取算法的安全性還有待提高。
2.2.2 拐點序列碼的安全性評判
將拐點序列碼應(yīng)用于身份識別,人們更加關(guān)注其安全性。為了評判現(xiàn)有的拐點序列碼的安全性,提出了相似度及平均相似度的概念。
定義1(相似度):任意兩組拐點序列碼中,拐點值相等的位數(shù)與總長度的比值。
(1)
其中,Simi,j為i,j兩個樣本的相似度;TN為序列碼長度;Sami,j為i,j兩個樣本中對應(yīng)位相等的個數(shù)。
圖3 偽造的心音信號的拐點序列碼
定義2(平均相似度):某一組拐點序列碼與其他拐點序列碼的相似度的平均值。
(2)
其中,AVESimi為第i組拐點序列碼的平均相似度。
選取了五組樣本,在小數(shù)據(jù)范圍內(nèi)對現(xiàn)有的拐點序列碼的安全性進行了評估。表1給出了五組樣本的拐點序列碼及其平均相似度。
表1 五組樣本的拐點序列碼及其平均相似度
從表1可以看出,五組樣本之間的平均相似度均大于等于60%,這會大大增加數(shù)字心音二維化識別過程中的誤識別率,極大地降低了拐點序列碼應(yīng)用于身份識別的安全性。
之所以現(xiàn)有的拐點序列碼間的相似度很高,是因為按照現(xiàn)有的提取標準提取的拐點序列碼中,拐點值“2”占的比例非常大。也就是說在心音波形中,雙峰子波出現(xiàn)的概率非常大。表2給出了五組樣本的拐點序列碼中拐點值“2”所占的比例。
表2 五組樣本中拐點值“2”的個數(shù)及其所占比例
從表2可以看出,五組拐點序列碼中拐點值“2”出現(xiàn)的比例最大的能達到85%,而比例最小的也達到了65%。
從實驗結(jié)果可以看出,現(xiàn)有的拐點序列碼之間相似度極高,規(guī)律性明顯,且與心音幅值無關(guān),忽視了心音幅值中的生理信息。這大大降低了偽造的難度,也降低了將拐點序列碼應(yīng)用于身份識別中的安全性。
鑒于現(xiàn)有的拐點序列碼的安全性較低,若要投入到身份識別的實際運用中仍需進一步改進,因而提出一種改進的(S1+S2)型內(nèi)部加密序列碼。
3.1(S1+S2)型內(nèi)部加密序列碼的獲取
仍以圖1中使用的數(shù)字心音信號為例。其中第一心音的序列碼為{2,2,2,4,2,2,2,2,2,2,2,2,4,2,2,2,2,4},第二心音的序列碼為{4,2,4,6,2,2,2,2,2,2,2,2,2,2,0}。
所謂的(S1+S2)內(nèi)部加密是指分別對第一心音和第二心音求拐點序列碼,找出二者峰值所在位置的拐點值,以該拐點值為中心向兩側(cè)依次將對應(yīng)位置的拐點值相加(位數(shù)不足則補零),得到一組新的拐點序列碼。稱此序列碼為(S1+S2)型內(nèi)部加密序列碼。加密過程中采用的密鑰為數(shù)字心音信號的內(nèi)部特征(第一心音和第二心音的峰值),不需要提供外部密鑰,避免了密鑰泄露對心音身份識別安全性的影響。
(S1+S2)型內(nèi)部加密序列碼的計算過程如下:
2,2,2,4,2,2,2,2,2,2,2,2,4,2,2,2,2,4
由此可以得到圖1中使用的數(shù)字心音信號的(S1+S2)型內(nèi)部加密序列碼為2,2,6,6,6,8,4,4,4,4,4,4,6,4,4,4,2,4。
而對于圖3中偽造的數(shù)字心音信號而言,不僅無法區(qū)分出第一心音和第二心音,由于偽造時使用的子波信號的單一性,同時也不存在唯一的極大值。因此,在(S1+S2)型內(nèi)部加密序列碼的獲取算法下,偽造心音信號無法識別。
3.2(S1+S2)型內(nèi)部加密序列碼的安全性
原拐點序列碼的每位取值只可能為2、4、6三種,而(S1+S2)型內(nèi)部加密序列碼是由原拐點序列碼內(nèi)部相加得到的,其每位取值可能為2、4、6、8、10、12六種。由于613?320,對于(S1+S2)型內(nèi)部加密序列碼只需取前13個拐點值就足以用于身份識別。
3.2.1 (S1+S2)型內(nèi)部加密序列碼的優(yōu)點
將(S1+S2)型內(nèi)部加密序列碼同原拐點序列碼就其獲取過程、內(nèi)部結(jié)構(gòu)進行對比,可以發(fā)現(xiàn)(S1+S2)型內(nèi)部加密序列碼具有以下優(yōu)點:
(1)(S1+S2)型內(nèi)部加密序列碼的獲取過程將心音的幅值納入了考慮范圍,不會丟失幅值中的生理信息;
(2)截取的長度為13的內(nèi)部加密序列碼為第一心音的拐點序列碼與第二心音的拐點序列碼的和,充分涵蓋了第一心音與第二心音中的生理信息;
(3)拐點值的取值由3種增加到6種,大大增加了序列碼的偽造難度。
3.2.2 (S1+S2)型內(nèi)部加密序列碼的安全性評判
對表1中的五組樣本,按照(S1+S2)型內(nèi)部加密序列碼的獲取方法生成新的序列碼,新的(S1+S2)型內(nèi)部加密序列碼及其平均相似度如表3所示。
表3 五組樣本的(S1+S2)型內(nèi)部
將表3與表1對比可以發(fā)現(xiàn),(S1+S2)型內(nèi)部加密序列碼的平均相似度較原拐點序列碼的平均相似度有了顯著減小,其中最大的減小34.2%,最小的也減小了18.3%。
改進的(S1+S2)型內(nèi)部加密序列碼能很好地降低心音信號序列碼之間的相似度,并減小序列碼的規(guī)律性,提高了數(shù)字心音序列碼識別的安全性。
目前原始的拐點序列碼平均相似度較高,規(guī)律明顯且容易偽造,用于身份識別時安全性較低。而改進的(S1+S2)型內(nèi)部加密序列碼在提取時將心音幅值納入考慮,通過將第一心音、第二心音峰值兩側(cè)對應(yīng)位置拐點值相加得到新的拐點序列碼。新的拐點序列碼減小了序列碼的規(guī)律性,用于身份識別領(lǐng)域可提高身份識別的安全性。實驗結(jié)果表明,通過平均相似度來評估二維心音圖身份識別的安全性是十分必要的。
[1] 陳洪京.幾種生物識別方法的比較研究[J].河北省科學院學報,2007,24(4):33-37.
[2] Jain A K,Ross A,Prabhakar S.An introduction to biometric recognition[J].IEEE Transactions on Circuits and Systems for Video Technology,2004,14(1):4-20.
[3] 成謝鋒,馬 勇,劉 陳,等.心音身份識別技術(shù)的研究[J].中國科學:信息科學,2012,42(2):237-251.
[4] El-Asir B,Khadra L,Al-Abbasi A H,et al.Time-frequency analysis of heart sounds[C]//Proceedings of IEEE TENCON digital signal processing applications.[s.l.]:IEEE,1996:553-558.
[5] Ergen B,Tatar Y.The analysis of heart sounds based on linear and high order statistical methods[C]//23rd annual international conference on EMBS.Istanbul,Turkey:[s.n.],2001:2139-2141.
[6] Beritelli F,Serrano S.Biometric identification based on frequency analysis of cardiac sounds[J].IEEE Transactions on Information Forensics and Security,2007,2(3):596-604.
[7] 朱冰蓮,劉 倩.心音信號的自適應(yīng)小波去噪[J].計算機技術(shù)與發(fā)展,2006,16(10):83-84.
[8] 孫科學,成謝鋒.一種心音信號盲源分離方法[J].電子測量與儀器學報,2012,26(6):498-502.
[9] 商慶瑞,吳 晴,郭晶瑩.基于Matlab實現(xiàn)的指紋圖像預處理算法[J].計算機仿真,2007,24(3):215-218.
[10] 孫林森,吳小培,項 明.一種有效的指紋圖像預處理方法[J].計算機技術(shù)與發(fā)展,2009,19(2):133-136.
[11] 華 斌,張麗超,趙富強.基于加權(quán)MFCC的音頻檢索[J].計算機工程與應(yīng)用,2015,51(8):200-204.
[12] 孫科學,成謝鋒,林 宏.基于虛擬儀器的心音采集與分析系統(tǒng)設(shè)計[J].微型機與應(yīng)用,2012,31(4):64-66.
[13] 魏 敏, 孫科學,王晨曦,等.一種心音檢測儀的設(shè)計與實現(xiàn)[J].計算機技術(shù)與發(fā)展,2016,26(5):179-182.
[14] 成謝鋒,蔡華民.二維心音圖特征提取與識別方法的研究[J].圖學學報,2014,35(2):268-273.
SecurityAnalysisofSequenceCodeinHeartSoundIdentification
SONG Jiang-min1,CHENG Yu-han2,LI Zi-yan1,HONG Liang1,SUN Ke-xue1,3
(1.School of Electronic Science and Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;2.Office of Informatization and Management,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;3.Jiangsu Province Engineering Lab of RF Integration & Micropackage,Nanjing 210023,China)
The safety of existing heart sound recognition method based on the inflection point sequence code is evaluated by putting forward and using the concept of similar degree and average similar degree.The results indicate that there have been problems of clear rule and easy forging in the existing heart sound identification based on inflection point sequence code.In order to enhance the security of heart sound identification,a modified (S1+S2) intra-encrypted sequence code is proposed to optimize the structure of sequence code.This kind of encryption method needs to conduct wavelet denoising and amplitude normalization for one-dimension of heart sound signal,and preprocessing for the original two-dimensional heart sound signal which has been acquired.After that,the inflection sequence code is obtained in two-dimensional heart sound signal.The new sequence code is formed by adding value of the first heart sound and second heart sound peak corresponds to a turning point on both sides together,reduction of the rule of sequence code.The experimental results show the significance of evaluating the security and that the (S1+S2) model does better in extracting biological characteristics of heart sound,and can also enhance the identification security.
two-dimensional phonocardiogram;image processing;identification recognition;sequence code intra-encryption;average similar degree
2016-08-04
2016-11-10 < class="emphasis_bold">網(wǎng)絡(luò)出版時間
時間:2017-08-01
國家級大學生創(chuàng)新創(chuàng)業(yè)訓練計劃(SZDG2016009);江蘇省高校自然科學研究面上項目(15KJD510001);南京郵電大學實驗室工作研究重點課題(2016XSG02)
宋江珉(1995-),男,研究方向為數(shù)字信號處理技術(shù);孫科學,副教授,碩士生導師,研究方向為電子電路設(shè)計、智能信號處理、嵌入式系統(tǒng)與通信軟件設(shè)計。
http://kns.cnki.net/kcms/detail/61.1450.TP.20170801.1549.014.html
TP311.1
A
1673-629X(2017)11-0128-04
10.3969/j.issn.1673-629X.2017.11.028