裴振偉,朱平
(中北大學儀器與電子學院,山西 太原 030051)
肺音聽診法能更早地判斷出肺部早期病癥,是醫(yī)生確診的重要參照指標[1]。隨著5G時代的來臨,電子智能聽診器將會普及到家庭,可以完整地采集肺音數(shù)據(jù)并作出分析,通過信號識別判斷出可能存在的疾病,減少就診的時間成本[1-2]。由于肺音信號是高度非平穩(wěn)的微弱信號,采集時極易受到采集裝置和其他生理信號的干擾,增加了信號特征后期識別的難度,目前的研究中最讓研究人員關注的一點就是如何從復雜的干擾信號中過濾出目標肺音信號[3]。
將信號分解為多個分量是一種有效的數(shù)字信號處理技術,已廣泛地應用于濾波和數(shù)據(jù)壓縮。國內外學者在時頻域分析方面提出了不同于小波變換的信號分解方法,Huang等人[4-6]提出的經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)是在時間尺度上將自身信號分解成多個固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF),取消了基函數(shù)對分解結果的限制,從而使該方法極具適應性,讓研究人員可以剖析到信號深處的涵義。國內外研究人員相繼提出了EMD族的算法理論,一步步削減初代EMD理論分解結果的諸多弊端。理論算法方案從集合經(jīng)驗模態(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)發(fā)展到互補集合經(jīng)驗分解法(Complete Ensemble Empirical Mode Decomposition,CEEMD)、具有自適應噪聲的完全 EEMD(Complete EEMD with Adaptive Noise,CEEMDAN)和改進的CEEMDAN(ICEEMDAN)。ICEEMDAN方案[7]盡可能地消除模態(tài)混合的遺留問題,而且大大減少了IMF中的殘余分量,從而使信號重構結果更強于之前的方案?;贓MD族的技術已經(jīng)應用于處理各種生理采集信號,特別用于呼吸音信號降噪以及特征向量構建等[8]。
由于深層學習理論的進一步發(fā)展,多層感知器(MLP)這種早期機器學習方法重獲研究人員關注。它是一種前向結構的ANN人工神經(jīng)網(wǎng)絡,解決了感知器不能對線性不可分數(shù)據(jù)進行識別的問題,普遍應用于圖像辨別、模式匹配分類、優(yōu)化過程等領域[9]。
該文采用ICEEMDAN方案將非平穩(wěn)肺音信號轉化后使用測量頻譜平坦度參數(shù)篩選出適合的IMF分量,實現(xiàn)肺音信號特征向量的有效構建,然后加載到多層感知機進行識別訓練,最終完成正常呼吸音、干羅音、哮鳴音和中濕羅音的訓練,并且進行測試。測試表明,該方案可用于智能聽診器的信號處理。
EMD算法[10]基于所選信號的極大值和極小值求出局部均值,并計算出所選信號與局部均值之間的殘差。這個結果必須滿足IMF的條件,如果不滿足,則重復該過程,但將計算的剩余量作為輸入。這個迭代過程稱為篩選。當最后一個殘余分量不超過兩個極值時,分解結束。分解得到一個按頻率排序的IMF族,每個IMF包含頻率分量依次降低。CEEMDAN[11]在分解的每個階段添加一個特定的噪聲,并通過計算一個唯一的余數(shù)來獲得每個IMF,從而使其模式實現(xiàn)完全的無噪聲重建,但實際上在分解的早期階段仍然包含一些殘余噪聲,存在非對應模式。ICEEMDAN通過進一步降低CEEMDAN模式中的殘余噪聲和避免虛假模式,為IMF提供更多的物理意義。ICEEMDAN算法估計的是局部平均值,而不是模式,并且只使用白噪聲的模式,而不是白噪聲本身。其算法如下[12]:
步驟1:給原始信號 x添加白噪聲E1[w(i)],得到式(1):
其中,w(i)表示被添加的第i個白噪聲;
步驟2:由式(2)計算模態(tài)分量IMF1:
其中,M(·)為產(chǎn)生局部均值函數(shù)。
步驟3:由式(2)計算IMF2值:
步驟4:計算第k個模態(tài)分量IMFk的值:
其中,k=2,3,…,N。
多層感知器(Multi-layer Perceptron,MLP)信息處理結構是輸入層轉入隱藏層再到輸出層,其模型如圖1所示。
圖1 多層感知器結構
在網(wǎng)絡特征方面,層內神經(jīng)元沒有互聯(lián),層間神經(jīng)元也沒有反饋聯(lián)絡,所以也被叫做前饋神經(jīng)網(wǎng)絡。隱藏層節(jié)點映射采用非線性函數(shù),輸出層節(jié)點映射采用線性函數(shù)。神經(jīng)網(wǎng)絡分類器采用比例共軛梯度反向傳播學習算法進行訓練,避免了其他二階訓練算法的缺點[13]。這種訓練算法使用用戶獨立的參數(shù),解決了時間和內存問題。輸入行為各分量的加權和輸入層中神經(jīng)元的輸出,比傳統(tǒng)的反向傳播算法更快。
肺音分析分為4個階段:信號分解前處理、肺音信號周期判斷、典型特征參數(shù)構建和MLP分類。圖2表示了肺音信號識別過程,具體步驟如下:
1)由于記錄儀器增益、受試者年齡和性別等各種因素差異會引起振幅的變化,需要先進行振幅歸一化。設f(n)為第n個樣本的值,M為樣本空間中絕對最大值。歸一化信號fn(n)為:
圖2 肺音信號分析流程
其中,n=1,2,3,…,n表示信號中的樣本數(shù)。該歸一化信號為fn(n),其值在振幅的±1范圍內。
2)采用一階微分法降低信號中的儀器噪聲。信號的一階導數(shù)由式(6)計算:
其中,yd(n)是輸入信號y(n)對n的導數(shù)輸出,Δt是采樣時間。
3)前期準備的肺音信號被轉化后可以得到不同數(shù)量的分量和殘留余量。最短的肺音記錄用EMD分解成9個IMF,用ICEEMDAN分解成15個IMF,最長的記錄用EMD分解成12個IMF,用ICEEMDAN分解成19個IMF??紤]到肺音記錄被分解的最小IMF數(shù)是7,該文將兩種技術的所有肺音記錄分解為7個IMF。研究中使用了前7個IMF和殘余分量。這些IMF包含相對較高的頻率分量,可以通過測量頻譜平坦度參數(shù)來選擇。頻譜平坦度測量(SFM)是通過將幾何平均值(GM)除以不同頻率段的功率譜的算術平均值(AM)來計算的[10]。
其中,γj(i)是編號i的頻率點大小,zn是頻率分量的數(shù)量。當信號的功率譜在模式中變得完全平坦時,其SFM值將為1;對于正弦信號,其SFM值為零。統(tǒng)計IMF和殘余分量的特征,為下一階段的構造做準備。
4)用于分類聲音的特征是根據(jù)統(tǒng)計矩計算的,如平均值(μ)、標準偏差(σ)、偏度(γ)和峰度(k)[14]。將這些統(tǒng)計屬性構造成多維特征向量加載到MLP在神經(jīng)網(wǎng)絡中。特征向量(FVEMD)如式(8)所示。
式中,i=1,2,…,8表示7個選定的IMF分量以及殘余分量。
該文采用3M公司的3200型電子聽診器采集肺音正常肺音、哮鳴音、干羅音和中濕羅音4類肺音信號,臨床肺音采集過程中盡可能處于安靜環(huán)境來減少環(huán)境噪聲和人造偽影,每類采集18例,共72組數(shù)據(jù)作為肺音樣本進行研究。
圖3 該文信號的時域波形圖
該文使用多層感知機MLP對4種類型肺音信號識別匹配。在4類數(shù)據(jù)中每組分別隨機選取12組共48組數(shù)據(jù)作為訓練樣本,其余24組作為測試樣本。對隨機選取的訓練樣本數(shù)據(jù)處理后進行ICEEMDAN分解,構造出特征向量后加載到MLP進行訓練,對24組測試數(shù)據(jù)同樣構造出特征參數(shù)進行驗證。圖4和圖5分別表示正常肺音與哮鳴音的ICEEMDAN分解結果。
訓練時,正常肺音信號設置為1,哮鳴音信號設置為2,干羅音信號設置為3,中濕羅音信號設置為4。訓練中MLP分類4種信號的誤差一步步降低,從圖6可以看出誤差率降低至11.52%。多次訓練預測誤差穩(wěn)定后隨機樣本神經(jīng)網(wǎng)絡分類測試結果與實際肺音類型對比如圖7所示。
為了進一步分析MLP的識別能力,隨機采樣了10 組樣本數(shù)據(jù),同 時使用 ELM[15]和 BP 網(wǎng)絡[1,16]進行對比。表1給出了10次分類的精準率和計算時間。如表1所示,MLP具有較高的分類精準率,ELM次之,BP網(wǎng)絡的分類精準率最差。在計算機性能相同時,BP神經(jīng)網(wǎng)絡由于要反復迭代需要較長的時間。ELM在訓練時由于連接權值w和隱含層閾值b是隨機選擇的[15],因此預測時間次之。MLP在3種方案中具有較快的匹配速度和較高精準率。
圖4 正常肺音信號的ICEEMDAN分解結果
圖5 哮鳴音信號的ICEEMDAN分解結果
圖6 MLP分類肺音信號的誤差變化
圖7 單次隨機樣本MLP分類結果
表1 基于MLP、ELM、BP的分類結果
該文采用適用于高度非平穩(wěn)和非線性的IC EEMDAN算法對72組正常肺音、哮鳴音、干羅音和中濕羅音肺音數(shù)據(jù)信號進行特征提取,采用多層感知機為分類器,分類精度達到91.67%,綜合性能高于其他方法。此方法對于肺音信號的處理切實可行,可為今后獲得更多類型的肺音數(shù)據(jù)識別更多的病理狀況。