王文波,錢龍
(武漢科技大學 理學院,湖北 武漢 430065)
據統(tǒng)計,全世界每年發(fā)生260 多萬例死產,其中45%以上病例發(fā)生于孕婦分娩期間,因此產前胎兒健康檢測具有重要的生理學意義[1].通過在孕婦分娩前對胎兒心電信號進行檢測,并分析其波形,可以高效評估胎兒在子宮內的生長發(fā)育情況,從而降低圍產兒的死亡率和發(fā)病率[2-3].目前,多采用無創(chuàng)的非入侵式檢測方法對胎兒健康進行檢查[4-5].
非入侵式檢測方法是使用多導聯(lián)置電極技術分別記錄孕婦胸部和腹壁混合信號,然后將胎兒心電信號從孕婦腹壁混合信號中分離出來.然而由腹壁電極所采集的信號普遍包含較多的噪聲:導聯(lián)電極干擾、母體心電活動干擾、基線漂移[6]等,因此,如何有效抑制各種噪聲從而分離出純凈的胎兒心電信號成為一個國內外學者研究的熱點問題.
為了消除各種背景干擾和母體心電成分,國內外學者已經提出了一系列從腹壁混合信號中獲取胎兒心電信號的方法:盲源提取技術[7-8]是假設各個源信號未知的情況下,只提取出胎兒心電信號,但該技術對時間延遲周期的依賴性較大,其性能具有局限性;獨立成分分析(Independent Component Analysis,ICA)技術[9]在假定各信號成分統(tǒng)計獨立的基礎上建立ICA 模型,該算法一般采用梯度法對分離矩陣自適應尋優(yōu),且需要嚴格設定初始分離矩陣和步長,使得該技術容易陷入局部最優(yōu),導致分離的胎兒心電信號精度不高[10];自適應濾波法[11]計算量小且易于收斂,但該算法不能有效提取出母體心電和胎兒心電重合部分的胎兒心電信號;小波分解技術[12]涉及到小波基和其他參數的選擇,對于不同的數據,參數選擇較為困難,因此該方法適用性較低,不能用于實時提?。黄ヅ錇V波法[13]需要保持信號之間同一波形形態(tài),對濾波器的選擇較為困難;支持向量機技術[14]和人工神經網絡[15-16]技術在胎兒心電提取方法中得到了較多的應用,這些方法將傳統(tǒng)統(tǒng)計學作為基礎,以經驗風險最小化原則進行學習,存在著泛化能力弱、結構設計較難、易陷入局部最優(yōu)等問題.以上這些方法都是建立在復雜導聯(lián)多通道信號采集的基礎上,然而多通道記錄數據會要求在孕婦體表放置更多的電極,這可能會引起孕婦的身體不適從,并間接影響心電信號的提取效果.因此這些方法的臨床使用價值非常有限.
隨著胎兒心電提取方法的不斷深入研究,采用單通道腹壁混合心電信號進行胎兒心電提取的方法成為主流.這些方法以自適應噪聲消除技術[17]、奇異值分解技術[18]、模板去除技術[19]和卡爾曼濾波技術[20]等為基礎,從單通道腹壁混合心電信號中分離出胎兒心電信號.但現(xiàn)有的單通道胎兒心電提取方法仍存在一定的不足:模板去除技術很難從腹壁混合心電信號中消除噪聲和母體心電成分[21],導致提取效果較差;奇異值分解技術分解出來的矩陣往往解釋性較弱且分解矩陣隨時間越來越大,對存貯空間有較大的需求[22];卡爾曼濾波技術的計算復雜度較高,并且在胎兒心電與母體心電重疊的部分,該技術將失去其提取作用[23];自適應噪聲消除技術通常需要訓練特定的濾波器參數[24],該方法的臨床實用性較低.
為了解決上述問題并提取更為清晰的胎兒心電信號,本文提出了一種利用單通道腹壁混合信號進行胎兒心電信號分離的新方法,該方法只需記錄一次孕婦腹壁混合信號,極大降低了信號的電極干擾且可以進行長期監(jiān)測.該方法的具體思路為:首先,將平滑窗(Smooth Window,SW)技術與SVD 技術相結合(SW-SVD),用來估計孕婦腹壁混合信號中的母體心電成分,采用估計的母體心電信號代替母體胸部信號;然后,將SW-SVD 方法估計的母體心電信號作為輸入信號,利用最小二乘支持向量機(Least squares support vector machine,LSSVM)構造輸入信號和腹壁混合信號中母體心電成分的最佳映射模型,并采用布谷鳥優(yōu)化算法(cuckoo search,CS)優(yōu)化LSSVM 的關鍵超參數;最后,將CS-LSSVM 映射模型得到最佳母體心電信號與腹壁混合信號相減,即可分離出初步的胎兒心電信號,對初步獲取的胎兒心電信號再次使用SW-SVD 技術進一步消除母體心電的干擾,最終得到更為純凈的胎兒心電信號.實驗結果表明,與傳統(tǒng)的歸一化最小均方誤差(Normalized least mean squares,NLMS)、長短時記憶(Long short term memory,LSTM)網絡以及LSSVM 方法相比,文中所提出的方法具有更強的抗噪聲能力和泛化能力,可以得到更為清晰的胎兒心電信號.
設i 時刻母體腹壁的電極記錄母體腹壁混合心電信號為ui,ui中包含母體心電成分si、胎兒心電成分di和背景噪聲ηi三種信號,三者關系如下:
式中:母體心電成分si是在時刻由母體胸部參考心電信號mi經非線性變換所形成的信號,所以腹壁混合信號中的母體心電成分si的相位和幅度等參數都會發(fā)生改變[25],兩者的非線性變換函數為:
因此本文進行胎兒心電提取時,首先對腹壁混合信號使用SW-SVD 技術分離出母體胸部參考心電信號mi;然后將心電數據集的部分樣本作為訓練集{(Mi,ui),i=1,2,…,l},求得輸入信號Mi和目標輸出信號ui之間的非線性變換函數f(·)的最佳估計值,其中信號Mi由母體胸部參考心電信號mi和其J 維時間導數構成[26].本文選取CS-LSSVM 模型來對非線性變換函數f(·)進行擬合.
圖1 為本文方法的基本流程圖,主要分為三個階段.第一階段:采用SW-SVD 技術對母體腹壁混合信號進行分解,將分解出的母體信號作為母體胸部信號的參考信號;第二階段:將參考信號作為模型的輸入,單導聯(lián)母體腹壁混合信號作為目標輸出信號,采用CS-LSSVM 模型評算參考信號傳至腹壁的非線性映射并得到母體胸部信號的最佳參考,其后將胸部信號的最佳參考信號與腹壁混合信號相減,便可提取出初步的胎兒心電信號;第三階段:對初步提取的胎兒心電信號再次進行SW-SVD 技術,進一步去消除母體心電成分的干擾,即可提取出較為純凈的胎兒心電信號.
圖1 胎兒心電提取方法流程圖Fig.1 Flow chart of fetal ECG extraction method
設x(t)是一組實數域的一維時間序列,現(xiàn)按時間間隔τ 對每組序列采樣n 點,采樣m 組,構成m×n 的矩陣M:
則存在一個分解使得M=UΣV*,其中U 是m×n 階酉矩陣,Σ是半正定階對角矩陣,V*是m×n階酉矩陣,V*是V 的共軛轉置矩陣.這樣的分解就稱作M 的奇異值分解[27].
本文采用均值濾波來進行窗口平滑操作,該技術主要用來抑制噪聲和胎兒或母體心電信號的干擾.均值濾波是低通數字濾波的一種,處理思路比較簡單,濾波效率較高[32].均值濾波算法如式(5)所示:
在本文中SW-SVD 技術用于第一階段母體心電參考信號的分離和第三階段最終胎兒心電信號的分離.其操作流程如圖2 所示.
圖2 第一階段母體心電參考信號的SW-SVD 技術流程Fig.2 SW-SVD technical process of maternal ECG reference signal in the first stage
母體心電參考信號分離的第一步是從腹壁混合信號中提取QRS 波群[33-34],在本文中,檢測到母體R峰的位置后,采用對R 峰位置進行左右延拓的方式進行QRS 波群的提取,將QRS 波群長度定位101 個點,可完全覆蓋所有的QRS 波[35].然后,將所提取的QRS 波群以矩陣Y 的形式進行排列[36],每個連續(xù)的QRS 波依次占據矩陣所對應的每一行,而R 峰處在矩陣的同一列,因此矩陣Y 的構造如式(6)所示.
式中:w 為QRS 波群的點數,這里w=101;N 為該通道QRS 波的個數.
對第三階段提取的初步胎兒心電信號采用上述相同的SW-SVD 操作,這里將胎兒QRS 波群長度定位51 個點,可完全覆蓋所有的QRS 波,進而構造信號矩陣Y.該操作主要目的是消除母體心電干擾成分和其他噪聲,從而得到更為清晰的胎兒心電信號.
圖3 單個QRS 波周期圖Fig.3 Periodogram of a single QRS wave
LSSVM 是對傳統(tǒng)支持向量機(Support Vector Machine,SVM)的改進,兩者的主要區(qū)別在于LSSVM將SVM 中求解問題的不等式約束改為等式約束,且將樣本誤差平方和損失函數作為訓練集的經驗損失,也就是其代替?zhèn)鹘y(tǒng)二次規(guī)劃方法解決函數估計問題,引入最小二乘線性系統(tǒng)到支持向量機中,這樣不僅提高了求解問題的速度,減少計算復雜度,也使得模型的收斂精度有所提高[37].其算法描述如下:
1)對于給定的訓練樣本集{(xi,yi),i=1,2,…,l},xi為樣本輸入,yi為樣本輸出.在非線性狀態(tài)下,應用核函數將樣本轉換到高維空間中,則樣本滿足如下線性規(guī)律:
式中:h(x)為回歸函數,βT為高維空間超平面的法向量,b 為偏置量,φ(x)為非線性映射函數.
2)給每一個樣本引入松弛因子ei,依據結構風險最小化原理,將SVM 中的不等式約束問題轉化成一個等式約束的優(yōu)化問題,使得所求問題得到進一步簡化:
式(8)為LSSVM 模型優(yōu)化問題,其中βTβ 決定函數的復雜度,C 為模型的懲罰系數,用來平衡函數的復雜度和擬合誤差,ei為松弛因子.
3)引入拉格朗日函數后可得:
式中:αi(i=1,2,…,l)為Lagrange 乘子.
根據KKT 條件,對上式中各變量進行求偏導,并令其偏導為0 可求得LSSVM 回歸估計函數為:
本文中選擇徑向基函數作為核函數,即K(xi,x)=exp(-‖xi-x‖2/σ2),其中,σ 為核函數的寬度參數.
當使用LSSVM 模型進行計算時,其核函數參數σ 和懲罰系數C 這兩個關鍵超參數的選擇對于模型的預測性能起著至關重要的作用.因此,本文采用CS 算法對該模型的超參數進行尋優(yōu)處理,從而求得超參數的最優(yōu)組合.
布谷鳥搜索算法是一種自然啟發(fā)式算法,于2009 年由Xin-She Yang 和Suash Deb[38-39]提出,該算法是基于布谷鳥寄生卵育行為和萊維飛行特征而產生的一種新型群體智能算法,寄生卵育即通過局部隨機搜索的方法將自己的鳥蛋放入其他鳥窩中,且每個鳥窩都存在發(fā)現(xiàn)的概率;萊維飛行是一種隨機游走的搜索方式,通過這種方式不斷更新孵化地點,直至最優(yōu)[40].文獻表明[41]布谷鳥算法復雜度較低、涉及的參數較少、全局尋優(yōu)能力強等特點,該算法首先假設如下3 種理想狀態(tài):
①每只布谷鳥每次下1 個蛋,并將其放入隨機選擇的巢中;
②具有優(yōu)質蛋的最佳巢會被帶到下一代;
③可用的寄主巢數量是固定的,且寄主以Pa∈(0,1)的概率發(fā)現(xiàn)布谷鳥放的蛋.
該算法通過萊維飛行(Levy Flight)來增強全局搜索能力,搜索路徑和更新位置公式如下:
位置更新之后,用隨機數r∈[0,1]與Pa(Pa為發(fā)現(xiàn)概率)對比,若r >Pa,則對采用偏好隨機游動的方式進行改變,偏好隨機游動公式如下:
本文將CS 算法與LSSVM 模型相結合,構建基于CS-LSSVM 的母體心電估計模型.首先采用CS算法對LSSVM 的關鍵超參數作尋優(yōu)處理,得到參數的最優(yōu)組合,進一步提高模型的非線性映射能力和預測性能;然后利用最優(yōu)參數組合構建的CSLSSVM 模型作為母體參考心電信號與腹壁混合信號之間的非線性變換函數f(·);在此基礎上應用非線性變換函數f(·)求得母體參考信號的最佳估計,最后從母體腹壁的混合信號中進行分離,即可分離提取得到初步的胎兒心電信號的估計.模型具體操作流程如下.
步驟1:選擇訓練數據集.為了得到函數f(·)的最佳擬合,CS-LSSVM 模型的輸入數據由母體心電mi及其J 維時間導數構成,本文取J=2.CS-LSSVM模型的輸入信號用向量M 表示,目標輸出信號用向量u 表示,其中:
步驟2:利用CS 優(yōu)化LSSVM 模型參數.
1)將LSSVM 模型中核函數參數和懲罰系數作為優(yōu)化對象,隨機初始化鳥巢的位置,設置鳥巢數量n,最大迭代次數T 和發(fā)現(xiàn)概率Pa.
2)通過適應度函數計算并找出當代最優(yōu)鳥巢位置Xbest.判斷算法是否滿足終止條件,若滿足則算法結束;否則執(zhí)行步驟3).本文對粒子適應度函數的定義如下:
3)執(zhí)行Levy 飛行操作并更新鳥巢位置,計算更新之后鳥巢位置的適應度值,并與原鳥巢的適應度作比較,若優(yōu)于原鳥巢則代替原鳥巢位置,否則放棄該位置.
4)隨機產生一個[0,1]區(qū)間上的隨機數r,若r >Pa,則對Xt+1i按式(14)進行隨即改進,反之則不變.
5)利用新更新的鳥巢位置計算適應度值,并與前代鳥巢位置對應的適應度值進行比較,保留適應度值更好的鳥巢位置.
6)判斷算法終止條件,若不符合迭代終止條件則回到3)步;若符合終止條件,則將CS 求出的最優(yōu)參數作為LSSVM 模型的最終參數.
步驟3:訓練CS-LSSVM.將訓練數據集輸入最優(yōu)參數組合的CS-LSSVM 模型,CS-LSSVM 模型的輸出為腹壁混合信號中的母體心電成分s=f(M).將目標信號與輸出信號之差用誤差信號e 表示.CSLSSVM 模型根據均方誤差最小化擬合誤差E(eTe),最終得到母體胸部參考心電信號經歷非線性變換(f·)傳輸到腹壁的最優(yōu)擬合函數
步驟4:提取胎兒心電信號.將心電數據{(mi,ui),i=1,2,…,N}送入CS-LSSVM 模型,利用最優(yōu)擬合函數計算得到腹壁混合信號ui中的母體心電成分則胎兒心電信號就可以利用下式計算
對于心電信號提取的精度評價,本文采用靈敏度(Sensitivity,Se)、精確率(Positive Predictive value,PPV)、準確率(Accuracy,ACC)和總體概率(F1-measure,F(xiàn)1)四個指標來進行評估.Se、PPV、ACC 和F1的定義如下:
式中:TP 指正確檢測到的胎兒心電信號,F(xiàn)P 指錯誤檢測到的胎兒心電信號,F(xiàn)N 指漏檢的胎兒心電,四項統(tǒng)計指標的值越大,表明算法的性能越好[42].
本文實驗數據選取DaISy 數據集進行研究,并與NLMS[43]、LSTM 方法[44]和LSSVM 方法進行對比實驗.DaISy 數據庫(Database for the Identification of Systems)由Lieven De Lathauwer 提供[45],心電數據采樣頻率為250 Hz,記錄時長為10 s,各通道心電數據長度為2 500,采用電極放置法從孕婦體表獲取的八導聯(lián)(ch1~ch8)心電信號,ch1~ch5 導聯(lián)記錄孕婦腹部混合信號,ch6~ch8 導聯(lián)記錄孕婦胸部信號.考慮模型運算復雜度、計算時長和提取性能,選擇前1 500 點數據作為訓練數據集,剩余1 000 點數據作為測試數據集.NLMS 方法中,迭代步長設為0.005,迭代次數設為1 000.LSTM 方法中隱藏層神經元選為30 個,迭代次數設為400,學習率取為r=0.01.傳統(tǒng)LSSVM 方法中選擇徑向基函數作為核函數,核函數參數σ 和懲罰系數C 的取值分別為σ2=3,C=50.
4.3.1 母體心電參考信號的可視化提取結果
選取Daisy 數據集中的五個腹部心電信號進行單通道胎兒心電信號的提取,五個通道的信號波形如圖4 所示.為了去除基線漂移對信號的影響,本文對母體心電參考信號做了Savitzky-Golay(S-G)平滑濾波操作;然后利用第二節(jié)中所提出的SW-SVD 技術,提取母體心電參考信號,提取結果如圖7 所示.通過對比圖4 和圖5 的五通道信號可知,利用SW和SVD 結合的技術可以從腹壁混合心電信號中提取出清晰的母體心電參考信號.
圖4 Ch1~ch5 通道孕婦腹壁混合心電信號Fig.4 ch1~ch5 mixed ECG signal of pregnant women’s abdominal wall
圖5 ch1~ch5 通道采用SW-SVD 技術提取的母體心電參考信號Fig.5 ch1~ch5 channels adopt SW-SVD technology to extract the maternal ECG reference signal
4.3.2 胎兒心電信號提取結果的可視化對比分析
本文將ch1 和ch2 兩個腹部通道信號作為可視化結果分析,并與目前傳統(tǒng)的NLMS、LSTM 和LSSVM 方法進行對比實驗,實驗可視化對比結果如圖6 和圖7 所示.
圖6 和圖7 顯示了四種胎兒心電信號提取方法在ch1 和ch2 兩個通道上的可視化結果,可以看出本文提出的方法明顯優(yōu)于其他三種方法,基本上可以提取出所有的胎兒QRS 波,且有效避免了母體心電和其他噪聲的干擾.
圖6 ch1 通道四種方法的胎兒心電信號提取結果比較Fig.6 Comparison of fetal ECG signal extraction results of four methods of ch1 channel
圖7 ch2 通道四種方法的胎兒心電信號提取結果比較Fig.7 Comparison of fetal ECG signal extraction results of four methods of ch2 channel
4.3.3 胎兒心電信號提取結果的統(tǒng)計指標分析
為了定量研究CS-LSSVM 方法的提取效果,本文采用Se、PPV、ACC 和F1 四個指標來分析[12,13].選擇DaISy 數據集中ch1~ch5 共5 個通道孕婦腹壁心電數據進行統(tǒng)計分析,該數據集中每個通道記錄有22 個胎兒心電QRS 波,在測試集數據中每個通道有9 個QRS 波,本文統(tǒng)計5 個通道共45 個胎兒心電QRS 波.四種方法的統(tǒng)計分析結果如表1 所示.
表1 四種心電提取方法的統(tǒng)計分析Tab.1 Statistical analysis of four ECG extraction methods
由表1 可知,CS-LSSVM 心電信號提取方法在五個導聯(lián)上的胎兒心電信號提取效果最好,該方法可以提取到42 個胎兒心電QRS 波,誤檢和漏檢的胎兒心電個數相對較少,只有4 個QRS 波被誤檢且漏檢個數為3 個,模型準確率ACC 高達85.71%,靈敏度Se 為93.33%,精確度PPV 達到91.30%,且總體概率F1 為92.31%,四項統(tǒng)計指標均為最高.NLMS 方法能夠提取到40 個胎兒心電QRS 波,誤檢個數為12 個,漏檢的胎兒心電為5 個,模型準確率ACC 為70.18%,四項評價指標都不及本文提出的方法.這是由于NLMS 方法對胎兒心電信號適應性不強,尤其在母體心電與胎兒心電重疊部分,對胎兒心電的識別率較低.LSTM 方法可以提取到30 個胎兒心電QRS 波,在四項心電提取性能指標分析中,其ACC 只有51.72%,四項評價指標均為最低,這是由于LSTM 存在泛化能力弱,易陷入局部極值,導致該模型漏檢和誤檢較多.LSSVM 方法可以提取到40 個胎兒心電QRS 波,誤檢11 個,漏檢5 個,并且ACC為71.43%,Se 為88.89%,PPV 為78.43%,F(xiàn)1 為83.33%.由于LSSVM 方法的超參數很難人工取到最優(yōu)值,導致該方法提取性能低于CS-LSSVM.通過上述的對比可見,CS-LSSVM 心電提取方法在四項指標上均優(yōu)于其他三種心電提取方法.可見利用CS算法先對LSSVM 模型的關鍵超參數進行尋優(yōu)處理,然后構建CS-LSSVM 母體心電信號估計模型,并經過SW-SVD 操作可以有效提高胎兒心電信號提取性能.
在本文的研究中,提出了一種利用單通道母體腹部混合心電信號提取胎兒心電信號的新方法.該方法以LSSVM 模型為基礎構建CS-LSSVM 母體心電信號提取模型,采用CS 算法對LSSVM 模型的超參數進行尋優(yōu)處理,有效提高了模型的預測性能,減小了人為確定超參數的影響.并且結合平滑窗口和奇異值分解技術,建立母體心電參考信號,有效避免了至少記錄一個母體胸部心電信號的局限性.文中選取DaISy 數據集進行對比實驗,實驗表明,相比于傳統(tǒng)的NLMS、LSTM 和LSSVM 方法,本文提出的CS-LSSVM 心電提取方法表現(xiàn)出更優(yōu)的性能,能夠提取出42 個清晰的胎兒心電信號QRS 波,誤檢和漏檢的胎兒心電較少,為產前胎兒健康檢測提供了新思路,具有較好的臨床應用價值.