宋 群,袁青霞,王俊江
(1.西北工業(yè)大學(xué) 自動(dòng)化學(xué)院,陜西 西安 710072;2.中科銳眼(天津)科技有限公司,天津 300350;3.天津城建大學(xué) 體育部,天津 300384)
心臟疾病已經(jīng)成為當(dāng)今世界上最主要的公共衛(wèi)生挑戰(zhàn)之一,對(duì)人類的健康和生命造成了極大的威脅[1]。隨著現(xiàn)代生活方式的改變和人口老齡化程度的加深,心臟疾病的發(fā)病率不斷攀升。因此,心臟疾病的監(jiān)測(cè)變得至關(guān)重要,它可以幫助醫(yī)務(wù)人員盡早發(fā)現(xiàn)心臟問(wèn)題,及時(shí)采取干預(yù)措施,避免悲劇性后果的發(fā)生。有效的監(jiān)測(cè)不僅有助于診斷心臟病癥,還可以評(píng)估患者的風(fēng)險(xiǎn)因素,制定個(gè)體化的診療方案。因此,進(jìn)行實(shí)時(shí)心電監(jiān)測(cè)并對(duì)監(jiān)測(cè)結(jié)果進(jìn)行分析和解釋,對(duì)于保障人類健康、提高全人類生活質(zhì)量具有重要意義。
心電圖(electrocardiogram,ECG)是記錄心臟電活動(dòng)的無(wú)創(chuàng)方法,由于其簡(jiǎn)單、低成本和高精度,已經(jīng)成為心血管病診斷中最常用的工具之一[2]。運(yùn)動(dòng)ECG技術(shù)是一種能夠記錄運(yùn)動(dòng)過(guò)程中ECG變化的技術(shù),通過(guò)實(shí)時(shí)檢測(cè)ECG信號(hào),研究對(duì)象在物理活動(dòng)條件下的心臟生理學(xué)。近年來(lái),運(yùn)動(dòng)ECG技術(shù)得到了廣泛應(yīng)用,成為評(píng)估運(yùn)動(dòng)員運(yùn)動(dòng)期間心臟功能的常用工具[3]。而隨著傳感器和信號(hào)處理技術(shù)的快速進(jìn)步,運(yùn)動(dòng)ECG監(jiān)測(cè)設(shè)備的靈敏度和特異性也得到了極大的提高,使其成為篩查運(yùn)動(dòng)員是否患有潛在心血管疾病的有效工具之一。在此基礎(chǔ)上,高錦煒設(shè)計(jì)了一種基于離散小波變換(discrete wavelet transformation,DWT)的低功耗實(shí)時(shí)ECG信號(hào)處理器[4]。該處理器通過(guò)使用DWT算法將ECG信號(hào)轉(zhuǎn)換為時(shí)頻域信號(hào),并采用自適應(yīng)閾值算法進(jìn)行去噪和R波檢測(cè)。實(shí)驗(yàn)結(jié)果表明,該處理器準(zhǔn)確性高,節(jié)能效果顯著,非常適合移動(dòng)設(shè)備上的應(yīng)用。楊宇等人探討了基于小波變換和支持向量機(jī)(support vector machine,SVM)的ECG信號(hào)分類方法[5]。該方法用小波變換將ECG信號(hào)轉(zhuǎn)換到小波域,然后,使用SVM分類器對(duì)不同類別的ECG信號(hào)進(jìn)行分類。研究結(jié)果表明,該方法在分類準(zhǔn)確率和魯棒性方面表現(xiàn)優(yōu)異。Park等人提出了一種改進(jìn)的小波變換算法WTSEE用于R波檢測(cè)[6]。該算法在常規(guī)小波變換的基礎(chǔ)上,增加了非線性閾值控制和動(dòng)態(tài)滑動(dòng)窗口等優(yōu)化方式,能夠提高R波檢測(cè)的準(zhǔn)確性和穩(wěn)定性。實(shí)驗(yàn)結(jié)果表明,該算法比傳統(tǒng)的R波檢測(cè)算法更具優(yōu)勢(shì)。朱俊江等人討論了基于小波分析的ECG信號(hào)去噪方法[7]。該方法將小波分析與濾波技術(shù)相結(jié)合,能夠克服傳統(tǒng)帶通濾波器存在的較大幅度漂移和陡峭濾波器存在的過(guò)度去噪問(wèn)題,效果顯著。王鳳提出了一種基于多尺度分析的ECG信號(hào)分類算法[8]。該算法通過(guò)多尺度小波分解實(shí)現(xiàn)了對(duì)ECG信號(hào)的多層次特征提取,然后,使用基于集合經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)的自適應(yīng)閾值算法對(duì)不同類別的ECG信號(hào)進(jìn)行分類。研究結(jié)果表明,該算法在分類準(zhǔn)確率和穩(wěn)定性方面都表現(xiàn)良好。馬金偉探討了如何使用深度學(xué)習(xí)技術(shù)對(duì)ECG信號(hào)進(jìn)行自動(dòng)分類[9]。其提出的融合網(wǎng)絡(luò)模型可以從ECG信號(hào)中學(xué)習(xí)到有效的特征,并且能夠?qū)崿F(xiàn)高精度的分類,同時(shí)還可以用于檢測(cè)不同類型的心臟病。Prakash等人探討了如何改善ECG信號(hào)檢測(cè)中的假陽(yáng)性問(wèn)題[10]。該研究采用隨機(jī)森林算法對(duì)ECG信號(hào)進(jìn)行分類和去噪,能夠有效地減少假陽(yáng)性率,并提高整體的診斷準(zhǔn)確性,同時(shí)也適用于其他醫(yī)學(xué)領(lǐng)域中的信號(hào)處理問(wèn)題。孟琭等人提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的ECG信號(hào)分類算法[11]。該算法具有較高的分類準(zhǔn)確率,可以有效地區(qū)分正常和異常ECG信號(hào),此外,還表現(xiàn)出較強(qiáng)的魯棒性,適用于不同的數(shù)據(jù)集和應(yīng)用場(chǎng)景。吳佳全提出了一種基于雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的ECG信號(hào)分類算法[12]。該算法模擬了人類心臟的生理特性,能夠高效地提取和識(shí)別ECG信號(hào)中的特征,并且在分類準(zhǔn)確率和穩(wěn)定性方面都表現(xiàn)良好。孟瑤開(kāi)發(fā)了一款基于移動(dòng)設(shè)備的實(shí)時(shí)ECG信號(hào)檢測(cè)系統(tǒng)[13]。該系統(tǒng)采用低功耗計(jì)算架構(gòu)和自適應(yīng)閾值算法,可以實(shí)時(shí)獲取、去噪和分析ECG信號(hào),具有良好的性能和可靠性,適用于臨床和家庭健康監(jiān)測(cè)等領(lǐng)域。然而,由于人體生理特征和運(yùn)動(dòng)狀態(tài)下心臟電信號(hào)變化等因素的影響,ECG實(shí)時(shí)檢測(cè)技術(shù)在精度上還有一定的提升空間。
近年來(lái),機(jī)器學(xué)習(xí)在時(shí)序信號(hào)領(lǐng)域的應(yīng)用備受關(guān)注,其中,ECG信號(hào)是一個(gè)典型的例子[14]。過(guò)去,基于物理模型的方法如差分方程和傅里葉變換等被廣泛應(yīng)用于處理這類信號(hào),但需要手動(dòng)提取信號(hào)特征,往往過(guò)于簡(jiǎn)化實(shí)際情況。在近年的一些研究中,一些學(xué)者通過(guò)引入機(jī)器學(xué)習(xí)算法自動(dòng)提取時(shí)序信號(hào)特征,并對(duì)信號(hào)進(jìn)行分類和預(yù)測(cè)。然而,目前主流的機(jī)器學(xué)習(xí)模型都是由專家進(jìn)行人工設(shè)計(jì),需要手動(dòng)調(diào)整模型結(jié)構(gòu)和超參數(shù)設(shè)置,導(dǎo)致這些模型在不同數(shù)據(jù)集中的泛化性和靈活性受到限制。為了實(shí)現(xiàn)對(duì)模型結(jié)構(gòu)和參數(shù)的自適應(yīng)調(diào)整,有學(xué)者提出了新的理論,即神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索(neural architecture search,NAS)。該理論旨在自動(dòng)化地發(fā)現(xiàn)合適的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以完成特定的人工智能任務(wù)。其中, Liu等人提出了利用梯度下降算法搜索卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的高效策略DARTS,并在ImageNet數(shù)據(jù)集上獲得了令人矚目的結(jié)果[15]。Pham等人通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練一個(gè)控制器,從大量計(jì)算圖中選擇最優(yōu)子圖,并預(yù)測(cè)子圖驗(yàn)證準(zhǔn)確度,輕松構(gòu)建最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[16]。Chen等人提出采用序列化的模型優(yōu)化方法對(duì)更大規(guī)模的問(wèn)題進(jìn)行了優(yōu)化[17]。Cai等人提出一種基于梯度的可微架構(gòu)搜索算法,采用管道連接將神經(jīng)網(wǎng)絡(luò)分解為3個(gè)基本構(gòu)建塊:卷積、標(biāo)準(zhǔn)化和非線性變換[18]。Brock等人為每個(gè)可能的子網(wǎng)絡(luò)賦予一個(gè)共享的向量,并使用共享的控制器搜索網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)重,以支持快速、大規(guī)模的架構(gòu)搜索[19]。Shen等人通過(guò)采用新的搜索策略,將多個(gè)搜索過(guò)程組合起來(lái),更好地探索架構(gòu)空間,并使用注意力機(jī)制關(guān)注重要部分,實(shí)現(xiàn)高效的架構(gòu)搜索[20]。Wu等人采用自適應(yīng)資源分配來(lái)實(shí)現(xiàn)高效的訓(xùn)練,從一個(gè)較小的“種子”網(wǎng)絡(luò)開(kāi)始,逐步迭代并強(qiáng)化網(wǎng)絡(luò)性能[21]。Liu等人提出一種新型的、基于進(jìn)化算法的NAS方法,使用最小變異操作作為遺傳機(jī)制,并使用多目標(biāo)優(yōu)化算法進(jìn)行訓(xùn)練[22]。Huang等人使用3個(gè)模塊來(lái)優(yōu)化模型結(jié)構(gòu),其中一個(gè)模塊負(fù)責(zé)架構(gòu)搜索,另一個(gè)模塊用于權(quán)重學(xué)習(xí)和更新,第3個(gè)模塊負(fù)責(zé)共享參數(shù)[23]。Tan等人利用自動(dòng)化設(shè)計(jì)優(yōu)化神經(jīng)網(wǎng)絡(luò)、加速模型訓(xùn)練和推斷,并在圖像分類、對(duì)象檢測(cè)等方面獲得了較好的結(jié)果[24]。
雖然自動(dòng)機(jī)器學(xué)習(xí)方法在其他領(lǐng)域已經(jīng)取得了顯著進(jìn)展,但在ECG信號(hào)檢測(cè)領(lǐng)域尚未被廣泛應(yīng)用。因此,采用自動(dòng)機(jī)器學(xué)習(xí)方法設(shè)計(jì)更具泛化能力的模型,實(shí)現(xiàn)更高精度的ECG信號(hào)檢測(cè),具有重要的研究意義。本文旨在通過(guò)自動(dòng)機(jī)器學(xué)習(xí)理論,自動(dòng)設(shè)計(jì)和調(diào)整模型結(jié)構(gòu),更高效地提取和分類ECG信號(hào)特征。
針對(duì)當(dāng)前ECG檢測(cè)技術(shù)存在的瓶頸,創(chuàng)新性的將ECG時(shí)序信號(hào)轉(zhuǎn)換為圖像數(shù)據(jù),并結(jié)合計(jì)算機(jī)視覺(jué)領(lǐng)域成功的神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索算法實(shí)現(xiàn)了針對(duì)不同類型ECG數(shù)據(jù)的有效分類辨識(shí)。算法流程框架如圖1所示。
圖1 算法流程框架圖Fig.1 Algorithm flow framework diagram
針對(duì)原始ECG信號(hào),首先將其轉(zhuǎn)換為3種不同的圖像數(shù)據(jù),分別為格拉姆角場(chǎng)(gramian angular field,GAF)、遞歸圖(recurrence plot,PR)以及馬爾可夫轉(zhuǎn)移場(chǎng)(Markov transition field,MTF)。
1.1.1 格拉姆角場(chǎng)
格拉姆角場(chǎng)[25]是一種用于處理時(shí)間序列數(shù)據(jù)的特征提取方法,基于格拉姆矩陣和極角場(chǎng)的概念,將時(shí)間序列轉(zhuǎn)換為圖像形式,以便利用計(jì)算機(jī)視覺(jué)和圖像處理領(lǐng)域的成熟技術(shù)進(jìn)行分析。
格拉姆角場(chǎng)技術(shù)的基本思想是將時(shí)間序列分成多個(gè)時(shí)間段,并使用極坐標(biāo)系將每個(gè)時(shí)間段轉(zhuǎn)換為一個(gè)圖像。在極坐標(biāo)系中,每個(gè)時(shí)間點(diǎn)被轉(zhuǎn)換為一個(gè)點(diǎn),該點(diǎn)的半徑由時(shí)間序列的幅度確定,角度由時(shí)間序列的相位確定。然后,使用格拉姆矩陣將這些圖像轉(zhuǎn)換為對(duì)稱正定矩陣,以便使用特征向量分解等方法進(jìn)行進(jìn)一步分析。最后,使用基于格拉姆角場(chǎng)的特征向量進(jìn)行分類、聚類等任務(wù)。
具體而言,給定一個(gè)長(zhǎng)度為n的ECG時(shí)間序列x={x1,x2,…,xn},首先,將其分為k個(gè)時(shí)間段x(1),x(2),…,x(k)。對(duì)于每個(gè)時(shí)間段,使用以下公式將其轉(zhuǎn)換為極角場(chǎng),
(1)
式中:p和q為當(dāng)前時(shí)間段中的時(shí)間點(diǎn);τ為極角場(chǎng)的周期(通常取為N);l為當(dāng)前子序列序號(hào)。然后,使用以下公式計(jì)算格拉姆矩陣,
(2)
式中:i和j為不同時(shí)間段中對(duì)應(yīng)的時(shí)間點(diǎn)。最終,格拉姆矩陣可以看作是一個(gè)N×N的對(duì)稱正定矩陣,其中,每個(gè)元素都是k個(gè)時(shí)間段中對(duì)應(yīng)位置的極角場(chǎng)之間的相似度。
格拉姆角場(chǎng)的優(yōu)點(diǎn)在于它能夠很好地處理時(shí)間序列中的非線性關(guān)系,并且可以使用計(jì)算機(jī)視覺(jué)和圖像處理領(lǐng)域的技術(shù)對(duì)其進(jìn)行進(jìn)一步分析。此外,格拉姆角場(chǎng)的計(jì)算量較小,適用于大規(guī)模數(shù)據(jù)集。因此,本節(jié)使用格拉姆角場(chǎng)對(duì)ECG信號(hào)進(jìn)行特征提取。
1.1.2 遞歸圖
遞歸圖也稱為重現(xiàn)性圖,是一個(gè)圖形化的工具,用于分析時(shí)間序列中的重復(fù)模式[26]。其通過(guò)在時(shí)間序列上構(gòu)造一個(gè)二維圖像來(lái)顯示序列中的周期性或混沌性。遞歸圖現(xiàn)已廣泛應(yīng)用于各種領(lǐng)域,如物理學(xué)、生物學(xué)、經(jīng)濟(jì)學(xué)和氣象學(xué)等。
遞歸圖的構(gòu)造基于嵌入定理(embedding theorem)。該定理指出,可以通過(guò)將時(shí)間序列轉(zhuǎn)換為高維空間中的向量來(lái)捕捉序列中的結(jié)構(gòu)信息。遞歸圖的構(gòu)造涉及計(jì)算時(shí)間序列中任意兩個(gè)時(shí)間點(diǎn)之間的歐幾里得距離,并將距離值轉(zhuǎn)換為二進(jìn)制0或1。這樣,遞歸圖可以視為一個(gè)二維矩陣,其中行和列代表時(shí)間序列中的時(shí)間點(diǎn),而單元格中的數(shù)字表示相應(yīng)時(shí)間點(diǎn)之間的距離是否小于給定的閾值。基于1.1.1節(jié)的ECG信號(hào)定義,其遞歸圖可通過(guò)下式進(jìn)行計(jì)算,
R=α(λ-‖xp-xq‖)
(3)
式中:λ為閾值;α為重邊函數(shù);p和q為時(shí)間點(diǎn)。
遞歸圖的圖形化特征可以用于識(shí)別和分類時(shí)間序列中的不同模式,例如周期性和混沌性,因此,本節(jié)利用遞歸圖提取ECG信號(hào)特征。
1.1.3 馬爾可夫轉(zhuǎn)移場(chǎng)
馬爾可夫轉(zhuǎn)移場(chǎng)是一種將時(shí)間序列轉(zhuǎn)換為二維圖像的方法,用于描述時(shí)間序列數(shù)據(jù)的時(shí)空結(jié)構(gòu)。遵循已有方法[25],將ECG信號(hào)轉(zhuǎn)換為馬爾可夫轉(zhuǎn)移場(chǎng)。
在馬爾可夫轉(zhuǎn)移場(chǎng)中,首先,將ECG時(shí)間序列x={x1,x2,…,xn}分成k個(gè)長(zhǎng)度為N的子序列,然后,計(jì)算每個(gè)子序列i中連續(xù)兩個(gè)值j和f之間的轉(zhuǎn)移概率,這些概率被組合成一個(gè)N×N的轉(zhuǎn)移矩陣。
(4)
式中:P為轉(zhuǎn)移概率函數(shù);t為當(dāng)前時(shí)間點(diǎn);l為當(dāng)前子序列序號(hào);Pl為j和f間轉(zhuǎn)移概率。然后,使用這個(gè)轉(zhuǎn)移矩陣來(lái)生成一個(gè)二維圖像,其中,每個(gè)像素表示從一個(gè)狀態(tài)到另一個(gè)狀態(tài)的概率,
ml(j,f)=F(Pl(j,f))
(5)
式中:F是一個(gè)將概率值映射到像素值的函數(shù)。將所有時(shí)間點(diǎn)的圖像ml拼接起來(lái),即可得到當(dāng)前時(shí)間序列的馬爾可夫轉(zhuǎn)移場(chǎng)。
1.1.4 ECG信號(hào)圖像
將同一段ECG信號(hào)的格拉姆角場(chǎng)、遞歸圖以及馬爾可夫轉(zhuǎn)移場(chǎng)進(jìn)行合并,得到格式類似于紅綠藍(lán)(RGB)圖像的三通道ECG信號(hào)圖像。這一圖像將作為神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索算法的輸入,實(shí)現(xiàn)對(duì)ECG信號(hào)的分類辨識(shí)。
1.2.1 搜索空間
由于ECG信號(hào)圖像其數(shù)據(jù)結(jié)構(gòu)與RGB圖像相似,因此,使用計(jì)算機(jī)視覺(jué)中常用的3×3最大池化,3×3的平均池化,3×3、5×5的可分離卷積,3×3、5×5的擴(kuò)展卷積,直接連接和無(wú)連接作為候選操作,所有卷積核的數(shù)量被設(shè)定為16。
1.2.2 模型架構(gòu)
在將ECG信號(hào)圖像輸入模型前,首先,使用3×3卷積組成的根節(jié)點(diǎn)1與根節(jié)點(diǎn)2對(duì)ECG信號(hào)圖像進(jìn)行特征提取。根節(jié)點(diǎn)1與根節(jié)點(diǎn)2的輸出構(gòu)成模型主體的輸入。模型主體由普通模塊和壓縮模塊堆疊而成,二者使用相同的內(nèi)部結(jié)構(gòu)。
在模塊內(nèi)部,設(shè)置4個(gè)節(jié)點(diǎn),不包括2個(gè)輸入節(jié)點(diǎn)和1個(gè)輸出節(jié)點(diǎn)。節(jié)點(diǎn)的概念繼承自PC-DARTS,它本質(zhì)上代表了對(duì)網(wǎng)絡(luò)中張量的連接操作,這些張量來(lái)自前面位置的節(jié)點(diǎn)或模塊的輸出。節(jié)點(diǎn)這一特殊概念的引入促進(jìn)了網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)和改變。每個(gè)節(jié)點(diǎn)可以接收其前進(jìn)方向上任何2個(gè)節(jié)點(diǎn)的輸出,模塊內(nèi)所有節(jié)點(diǎn)的輸出將被串聯(lián)成模塊的輸出。
在模塊的外部,網(wǎng)絡(luò)由2個(gè)普通模塊與1個(gè)壓縮模塊交替構(gòu)建,壓縮模塊是一個(gè)特殊的模塊,引入的目的是減少通過(guò)網(wǎng)絡(luò)的特征圖的大小,提升模型感受野。為了達(dá)到這個(gè)目的,與壓縮模塊的輸入節(jié)點(diǎn)相鄰的所有節(jié)點(diǎn)都設(shè)置步長(zhǎng)為2。每個(gè)模塊將前面2個(gè)模塊的輸出作為輸入。
在交替堆疊2層普通模塊、1層壓縮模塊和2層普通模塊后,已經(jīng)高度抽象化的特征被輸入平均池化層和全連接層,得到最終的分類便是結(jié)果。
1.2.3 算法流程
為了能夠針對(duì)ECG信號(hào)圖像特征構(gòu)建針對(duì)性的辨識(shí)模型,引入基于梯度的神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索算法,在超空間中尋找最優(yōu)的模型架構(gòu)。PC-DARTS是一種基于梯度下降的架構(gòu)搜索算法[27],它的基本思想是在超圖空間中搜索最優(yōu)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),超圖由節(jié)點(diǎn)和邊組成。其中,節(jié)點(diǎn)表示神經(jīng)網(wǎng)絡(luò)中的隱藏層,邊表示神經(jīng)元之間的連接關(guān)系。在PC-DARTS中,每個(gè)節(jié)點(diǎn)可以選擇不同的操作,如卷積、池化或空間變換。通過(guò)搜索最優(yōu)的節(jié)點(diǎn)操作和連接關(guān)系,PC-DARTS可以得到最優(yōu)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
具體來(lái)說(shuō),PC-DARTS算法包括2個(gè)階段。
第1階段是基于弱監(jiān)督的搜索階段,通過(guò)對(duì)訓(xùn)練集進(jìn)行小批量采樣來(lái)更新神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。在每個(gè)小批量中,PC-DARTS使用梯度下降法優(yōu)化超圖中的權(quán)重,同時(shí),使用基于Softmax的方法更新節(jié)點(diǎn)的離散操作分布。
o(Si,j·xi)+(1-Si,j)·xi
(6)
為了保證采樣過(guò)程中無(wú)參數(shù)操作不會(huì)占據(jù)主導(dǎo)地位,引入邊緣歸一化來(lái)平衡所有候選操作的出現(xiàn)概率,
(7)
式中:βi,j代表了輸入xi的歸一化權(quán)重。
第2階段是基于強(qiáng)監(jiān)督的微調(diào)階段。在這個(gè)階段,PC-DARTS使用整個(gè)訓(xùn)練集來(lái)微調(diào)網(wǎng)絡(luò)結(jié)構(gòu),以得到最終的網(wǎng)絡(luò)模型。此時(shí),搜索過(guò)程已經(jīng)完成,PC-DARTS將使用之前搜索得到的結(jié)構(gòu)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。在微調(diào)過(guò)程中,PC-DARTS使用正常的反向傳播更新權(quán)重,使得模型的性能最大化。
PC-DARTS的優(yōu)點(diǎn)在于能夠自動(dòng)搜索最優(yōu)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),無(wú)需人為地指定網(wǎng)絡(luò)的結(jié)構(gòu)和超參數(shù),還可以在較短的時(shí)間內(nèi)得到最優(yōu)的結(jié)果,并且具有良好的可擴(kuò)展性。使用PC-DARTS對(duì)ECG信號(hào)圖像進(jìn)行針對(duì)性的模型搭建,對(duì)應(yīng)對(duì)不同的ECG分類檢測(cè)場(chǎng)景極為有效。
本節(jié)介紹研究所采用的2個(gè)ECG數(shù)據(jù)集,分別是PhysioNet MIT-BIH心律失常數(shù)據(jù)集和PTB診斷性ECG數(shù)據(jù)集。這2個(gè)數(shù)據(jù)集是常用的ECG信號(hào)分類和心肌梗塞檢測(cè)任務(wù)的基準(zhǔn)數(shù)據(jù)集。在實(shí)驗(yàn)中,采用采樣頻率為125 Hz的ECG第二導(dǎo)聯(lián)重采樣數(shù)據(jù)作為輸入,并使用ECG Heartbeat Categorization[28]提供的標(biāo)準(zhǔn)化形式的數(shù)據(jù)集,這些數(shù)據(jù)集已經(jīng)去噪,并且訓(xùn)練和測(cè)試部分以標(biāo)準(zhǔn)ECG心跳的形式提供。在此基礎(chǔ)上,還介紹了本研究的模型訓(xùn)練與優(yōu)化細(xì)節(jié)。
PhysioNet MIT-BIH[29]心律失常數(shù)據(jù)集是一個(gè)常用于ECG信號(hào)處理研究的數(shù)據(jù)集,該數(shù)據(jù)集包含來(lái)自MIT-BIH心律失常數(shù)據(jù)庫(kù)的47名被試的ECG記錄,是一組由麻省理工學(xué)院研究者在波士頓貝斯以色列醫(yī)療中心的患者身上采集的ECG數(shù)據(jù)。
該數(shù)據(jù)集包含48個(gè)半小時(shí)的ECG記錄,每個(gè)記錄都由專家團(tuán)隊(duì)逐拍注釋。記錄使用雙通道ECG采集設(shè)備,采樣率為360 Hz,每個(gè)樣本的分辨率為11位。這些記錄來(lái)自47名受試者,其中一些人患有心律失常,另一些人則身體健康。共有109 446個(gè)心拍被2名專家共同手動(dòng)注釋,利用這些注釋,按照AAMI EC57標(biāo)準(zhǔn)[30],創(chuàng)建了5個(gè)不同的心跳分類,如表1所示。
表1 數(shù)據(jù)集標(biāo)注與AAMI EC57類別之間映射關(guān)系
這個(gè)數(shù)據(jù)集已經(jīng)被廣泛應(yīng)用于心律失常識(shí)別、ECG信號(hào)分析、分類、噪聲去除等方面的研究。該數(shù)據(jù)集的標(biāo)準(zhǔn)化格式和詳細(xì)注釋使得研究人員可以更容易地使用這些數(shù)據(jù)進(jìn)行研究和比較不同算法的性能。
同時(shí),該數(shù)據(jù)集也帶有一些挑戰(zhàn),比如心律失常的種類和數(shù)量、ECG信號(hào)的噪聲和干擾等,使得研究人員需要使用一些高效的算法來(lái)處理這些問(wèn)題。因此,該數(shù)據(jù)集為研究ECG信號(hào)處理和心律失常識(shí)別提供了重要的基礎(chǔ)和平臺(tái)。
由于PhysioNet MIT-BIH數(shù)據(jù)集中不同類別的樣本量嚴(yán)重失衡,且部分類別樣本量過(guò)少無(wú)法支撐深度學(xué)習(xí)模型完成訓(xùn)練。因此,使用SMOTE[31]對(duì)少數(shù)類別進(jìn)行上采樣,最終,各個(gè)類別的樣本數(shù)如表2所示。
表2 PhysioNet MIT-BIH數(shù)據(jù)集數(shù)據(jù)增強(qiáng)后不同類別樣本量對(duì)比
PTB 診斷性ECG數(shù)據(jù)集[32]是一組經(jīng)過(guò)標(biāo)記的ECG數(shù)據(jù),用于心臟疾病的分類和診斷。該數(shù)據(jù)集由德國(guó)基爾大學(xué)的心臟病學(xué)家Heinrich Schiller教授領(lǐng)導(dǎo)的團(tuán)隊(duì)收集和標(biāo)記,旨在提供一個(gè)可靠的數(shù)據(jù)集,用于評(píng)估和比較不同的ECG分析算法。該數(shù)據(jù)集包含來(lái)自549名患者的549個(gè)12導(dǎo)聯(lián)ECG記錄,其中包括正常記錄和各種心臟病例,如心肌缺血、心肌梗死、心肌肥厚和心律失常等。每個(gè)記錄都由ECG機(jī)器記錄,并由一名經(jīng)驗(yàn)豐富的ECG技術(shù)人員進(jìn)行了手動(dòng)標(biāo)記。標(biāo)記包括了QRS波群、ST段、T波、P波等波形的位置和形態(tài)。
研究使用的數(shù)據(jù)為其中被診斷為心肌梗死的148名被試的ECG數(shù)據(jù),以及52名健康被試的數(shù)據(jù)。
為了驗(yàn)證算法的性能, 本研究將2個(gè)數(shù)據(jù)集分別進(jìn)行了劃分, 劃分結(jié)果如表3所示。 其中, MIT-BIH數(shù)據(jù)集在數(shù)據(jù)集提供者的劃分方式的基礎(chǔ)上, 使用SMOTE進(jìn)行數(shù)據(jù)增強(qiáng), 最終選取152 471個(gè)樣本作為訓(xùn)練集,21 892個(gè)樣本作為測(cè)試集。在PTB上,隨機(jī)選取6 400個(gè)樣本作為訓(xùn)練集,8 152個(gè)樣本作為測(cè)試集。
表3 訓(xùn)練集與測(cè)試集樣本劃分Tab.3 The samples split of the train and test set
在模型架構(gòu)搜索階段,即神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索算法的第1階段,使用訓(xùn)練集中70%的數(shù)據(jù)進(jìn)行模型架構(gòu)迭代,剩余的30%用于模型權(quán)重訓(xùn)練。在再訓(xùn)練階段,即神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索算法的第2階段,使用訓(xùn)練集中的全部數(shù)據(jù)對(duì)架構(gòu)固定的模型進(jìn)行權(quán)重再訓(xùn)練。
在將數(shù)據(jù)送入神經(jīng)架構(gòu)搜索算法前,首先,將ECG圖像大小調(diào)整為227×227。對(duì)2個(gè)不同的數(shù)據(jù)集分別選取不同的超參數(shù),以保證模型具有較高的辨識(shí)分類精度,如表4所示。
表4 模型超參數(shù)設(shè)定Tab.4 The hyperparameter setting of the model
對(duì)于PhysioNet MIT-BIH心律失常數(shù)據(jù)集,在模型架構(gòu)搜索階段設(shè)定批次大小為16,drop概率為0.35,初始通道數(shù)為8,模塊堆疊數(shù)為5,學(xué)習(xí)率為0.001,權(quán)重衰減為0.001,訓(xùn)練epoch數(shù)為50。在再訓(xùn)練階段,將批次大小設(shè)定為64,drop概率改為0.25,其余超參數(shù)保持不變。
對(duì)于PTB數(shù)據(jù)集,在模型架構(gòu)搜索階段設(shè)定批次大小為16,drop概率為0.35,初始通道數(shù)為8,模塊堆疊數(shù)為5,學(xué)習(xí)率為0.001,權(quán)重衰減為0.001,訓(xùn)練epoch數(shù)為50。在再訓(xùn)練階段,將批次大小設(shè)定為32,drop概率改為0.25,其余超參數(shù)保持不變。對(duì)于2個(gè)數(shù)據(jù)集,均采用動(dòng)量為0.99的Adam優(yōu)化器進(jìn)行優(yōu)化。
本研究所提出的方法在PyTorch中實(shí)現(xiàn),基于AMD CPU(R9-3950X,3.5 GHz)和NVIDIA GPU(RTX 3090)。
本節(jié)將展示在PhysioNet MIT-BIH和PTB數(shù)據(jù)集上的神經(jīng)架構(gòu)搜索結(jié)果,并將分類辨識(shí)精度與其他先進(jìn)算法進(jìn)行對(duì)比,以證明本研究算法的泛化性與魯棒性。
網(wǎng)絡(luò)架構(gòu)搜索算法在PhysioNet MIT-BIH數(shù)據(jù)集上搜索得到的模型最終架構(gòu)如圖2所示,其中,內(nèi)部連接結(jié)構(gòu)和候選操作選擇在表5中展示。在圖2中,壓縮模塊從模塊k和k-1引出的連線表示步長(zhǎng)為2的操作,這些操作進(jìn)一步壓縮了特征圖大小,提高了模型的感受野。從搜索結(jié)果中可以看出,在普通模塊中,模型傾向于選擇擴(kuò)張卷積和壓縮卷積來(lái)提取輸入的局部特征。而在壓縮模塊中,模型更傾向于選擇平均池化和最大池化來(lái)獲取輸入的全局特征,這一現(xiàn)象也符合模型最初的設(shè)計(jì)理念。
表5 在PhysioNet MIT-BIH數(shù)據(jù)集上搜索得到的網(wǎng)絡(luò)架構(gòu)參數(shù)Tab.5 The network architecture parameters obtained through searching on the PhysioNet MIT-BIH dataset
圖2 網(wǎng)絡(luò)架構(gòu)搜索在PhysioNet MIT-BIH數(shù)據(jù)集上的結(jié)果Fig.2 Result of the neural architecture search on the PhysioNet MIT-BIH dataset
表6展示了本研究所提出的模型和其他先進(jìn)模型的分類識(shí)別效果??梢钥闯?本研究的模型以98.7%的平均分類準(zhǔn)確率明顯優(yōu)于絕大多數(shù)的對(duì)比算法。
表6 在PhysioNet MIT-BIH數(shù)據(jù)集上的分類辨識(shí)結(jié)果
此外,本研究利用網(wǎng)絡(luò)架構(gòu)搜索技術(shù),避免了模型架構(gòu)設(shè)計(jì)的過(guò)程,大幅縮短了模型的部署時(shí)間,能夠有效應(yīng)對(duì)更多的應(yīng)用場(chǎng)景,并且具有更高的分類識(shí)別精度。因此,在與Pham等人模型[38]進(jìn)行比較時(shí),本研究具有一定的優(yōu)勢(shì)。
圖3展示了在PTB數(shù)據(jù)集上進(jìn)行的架構(gòu)搜索結(jié)果,其中,內(nèi)部連接結(jié)構(gòu)和候選操作選擇在表7中展示。與PhysioNet MIT-BIH數(shù)據(jù)集不同,PTB數(shù)據(jù)集上的普通模塊和壓縮模塊都包含了大量的卷積操作,而壓縮模塊中池化操作的使用頻率明顯降低。這可能是由于PTB數(shù)據(jù)集中樣本數(shù)量和樣本類別相對(duì)較少,模型只需提取局部特征就可以獲得足夠的分類準(zhǔn)確度。
表7 在PTB數(shù)據(jù)集上搜索得到的網(wǎng)絡(luò)架構(gòu)參數(shù)Tab.7 The network architecture parameters obtained through searching on the PTB dataset
圖3 網(wǎng)絡(luò)架構(gòu)搜索在PTB數(shù)據(jù)集上的結(jié)果Fig.3 Result of the neural architecture search on the PTB dataset
在表8中與其他先進(jìn)算法進(jìn)行比較,本研究的模型在PTB數(shù)據(jù)集上具有最優(yōu)秀的分類準(zhǔn)確度。此外,本研究的模型具有無(wú)需手動(dòng)調(diào)整架構(gòu)的優(yōu)點(diǎn)。綜上所述,本研究所設(shè)計(jì)的算法具有足夠的泛化能力,可以應(yīng)對(duì)不同的ECG識(shí)別場(chǎng)景,并具有廣泛的應(yīng)用前景。
表8 在PTB數(shù)據(jù)集上的分類辨識(shí)結(jié)果Tab.8 Discrimination results on the PTB dataset
本研究設(shè)計(jì)基于自動(dòng)機(jī)器學(xué)習(xí)的心電檢測(cè)算法,有效降低了在不同應(yīng)用場(chǎng)景下網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)所需要的人工時(shí)間與成本,提升了網(wǎng)絡(luò)架構(gòu)的可解釋性,為心電信號(hào)分類任務(wù)提供可靠的數(shù)據(jù)支撐和新的技術(shù)途徑。將心電時(shí)序信號(hào)轉(zhuǎn)換為圖像的操作進(jìn)一步提取了心電信號(hào)的抽象特征,提升了心電辨識(shí)準(zhǔn)確性。所設(shè)計(jì)的模型在PhysioNet MIT-BIH心律失常數(shù)據(jù)集和PTB診斷性ECG數(shù)據(jù)集上,分別取得了98.7%和99.0%的分類辨識(shí)精度,其性能優(yōu)于以往的最優(yōu)算法,且在實(shí)際應(yīng)用場(chǎng)景中具備更強(qiáng)的自適應(yīng)能力,未來(lái)將進(jìn)一步在運(yùn)動(dòng)健康領(lǐng)域開(kāi)展落地應(yīng)用。