王 銳,李 燦,李紅巖,郎許峰,周作建,黃 敏,程 俊
(南京中醫(yī)藥大學(xué)人工智能與信息技術(shù)學(xué)院,江蘇南京 210023)
房顫是最常見的心律失常類型。隨著年齡的增長(zhǎng),房顫發(fā)生率會(huì)不斷增加[1],其在有危重疾病風(fēng)險(xiǎn)的慢性病老年患者中非常普遍[2]。在世界范圍內(nèi),房顫的發(fā)生率約為0.4%~2%[3-4],其與冠心病、高血壓和心力衰竭等疾病有密切關(guān)系。根據(jù)房顫發(fā)作的持續(xù)時(shí)間,可將其分為陣發(fā)性房顫、持續(xù)性房顫和永久性房顫3 種類型[5]。一些陣發(fā)性房顫在日常生活中很難被發(fā)覺,患者無臨床癥狀或出現(xiàn)臨床癥狀后很快便會(huì)消失,因此普通心電圖檢查無明顯異常。對(duì)于頻繁發(fā)作的陣發(fā)性房顫可通過24h 動(dòng)態(tài)心電圖監(jiān)測(cè),但監(jiān)測(cè)設(shè)備佩戴繁瑣,患者依從性較差。因此,研究快速便捷的房顫?rùn)z測(cè)手段具有重要臨床價(jià)值。
傳統(tǒng)房顫?rùn)z測(cè)算法大多基于房顫發(fā)生時(shí)的信號(hào)特征提取實(shí)現(xiàn)[6],但復(fù)雜的人工特征定義和繁瑣的特征提取過程等限制了其推廣和應(yīng)用。深度學(xué)習(xí)技術(shù)以原始數(shù)據(jù)作為輸入,并自動(dòng)提取對(duì)檢測(cè)敏感的特征,具有更好的抗干擾能力,可提高房顫?rùn)z測(cè)算法的泛化能力[7]。目前基于深度學(xué)習(xí)的房顫?rùn)z測(cè)算法主要通過端到端的深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),通過學(xué)習(xí)大量數(shù)據(jù)特征,可適用于更多場(chǎng)景。目前,國(guó)內(nèi)外學(xué)者對(duì)基于深度學(xué)習(xí)的房顫?rùn)z測(cè)算法進(jìn)行了大量研究,如Chen 等[8]采用決策級(jí)融合方法融合遞歸復(fù)雜網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)建立房顫?rùn)z測(cè)算法,獲得了98.92%的檢測(cè)準(zhǔn)確率;Chen 等[9]利用小波變換和滑動(dòng)窗口濾波減少心電信號(hào)中的噪聲,然后使用前饋神經(jīng)網(wǎng)絡(luò)檢測(cè)房顫;Sanjana 等[10]基于深度殘差跳躍卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行房顫的自動(dòng)檢測(cè),準(zhǔn)確率可達(dá)99%;Petmezas 等[11]提出一種利用焦點(diǎn)損失處理不平衡訓(xùn)練數(shù)據(jù)的新型混合神經(jīng)模型,通過將卷積神經(jīng)網(wǎng)絡(luò)提取的心電圖特征輸入到長(zhǎng)短期記憶模型中進(jìn)行時(shí)間動(dòng)態(tài)記憶,從而更準(zhǔn)確地分析房顫心電圖類型。然而,深度學(xué)習(xí)技術(shù)仍存在一些局限性,如模型梯度易消失、對(duì)網(wǎng)絡(luò)的要求較高、數(shù)據(jù)庫比較單一等[12]。
早期識(shí)別房顫可降低卒中等并發(fā)癥的發(fā)生率,明顯改善患者預(yù)后,提高其生活質(zhì)量[13]。因此,本文運(yùn)用CiteSpace 軟件對(duì)中國(guó)知網(wǎng)中收錄的關(guān)于房顫?rùn)z測(cè)算法的文獻(xiàn)進(jìn)行系統(tǒng)分析,總結(jié)該領(lǐng)域的研究熱點(diǎn)和發(fā)展趨勢(shì),為相關(guān)研究者提供參考和指引。
選擇中國(guó)知網(wǎng)數(shù)據(jù)庫,以房顫?rùn)z測(cè)、算法為主題詞進(jìn)行檢索,年限設(shè)定為2001-2022 年3 月16 日,結(jié)果共檢索到174 篇相關(guān)文獻(xiàn)。剔除無關(guān)算法以及僅含醫(yī)學(xué)知識(shí)、無作者等文獻(xiàn),篩選到符合條件的文獻(xiàn)共158篇。
將檢索結(jié)果以Refwork 格式導(dǎo)出,并保存為txt 格式。使用CiteSpace 軟件分析文獻(xiàn)中的摘要、關(guān)鍵詞、作者、所屬單位等信息,基于作者(Author)、機(jī)構(gòu)(Institution)、關(guān)鍵詞(Keywords)3 個(gè)模塊進(jìn)行分析,并繪制相應(yīng)的知識(shí)圖譜和表格。
由圖1 可以看出,2001-2007 年期間,關(guān)于房顫?rùn)z測(cè)算法的文獻(xiàn)年發(fā)文量不超過3 篇;而2008-2017 年,年發(fā)文量有所上升,但不超過10 篇;2018-2021 年,年發(fā)文量大幅上升,均超過20 篇,在2020 年甚至超過了25 篇;2022 年由于統(tǒng)計(jì)時(shí)長(zhǎng)限制,發(fā)文量不具備參考價(jià)值。
Fig.1 Distribution of annual published literature number圖1 年度發(fā)表文獻(xiàn)數(shù)量分布
發(fā)文量排名前10位的作者及其單位信息見表1。
Table 1 Top 10 authors and their organizations表1 發(fā)文量前10位的作者及其單位信息
以“author”為節(jié)點(diǎn),設(shè)置單個(gè)時(shí)間區(qū)間長(zhǎng)度為1,展示發(fā)文量不少于2 篇的作者分布情況,結(jié)果見圖2,共出現(xiàn)202 個(gè)節(jié)點(diǎn),83 條線,網(wǎng)絡(luò)密度為0.004 1。作者之間的連接可以反映出該領(lǐng)域中某個(gè)學(xué)者或團(tuán)隊(duì)作出的貢獻(xiàn)以及各個(gè)作者之間的合作強(qiáng)度。可以發(fā)現(xiàn),作者之間的合作較為松散,最大的合作團(tuán)隊(duì)由劉明、韓小岑、孟憲輝等人組成,其次劉廣雄團(tuán)隊(duì)和以孫亞楠、張瑞、韋杰英、王迪為主的團(tuán)隊(duì)也具有一定規(guī)模,其余為規(guī)模較小的團(tuán)隊(duì)和無合作的個(gè)人。這些團(tuán)隊(duì)均相對(duì)獨(dú)立,團(tuán)隊(duì)間未能展現(xiàn)合作關(guān)系。
Fig.2 Author distribution visualization map圖2 作者分布可視化圖譜
以“institution”為節(jié)點(diǎn),單一時(shí)間間隔設(shè)為1年,發(fā)文機(jī)構(gòu)分布如圖3 所示,共出現(xiàn)70 個(gè)節(jié)點(diǎn),10 條邊,網(wǎng)絡(luò)整體密度為0.004 1。在數(shù)據(jù)處理時(shí),將河北大學(xué)電子信息工程學(xué)院和河北省數(shù)字醫(yī)療工程重點(diǎn)實(shí)驗(yàn)室統(tǒng)一為河北大學(xué);西北大學(xué)醫(yī)學(xué)大數(shù)據(jù)研究中心統(tǒng)一為西北大學(xué);復(fù)旦大學(xué)數(shù)字醫(yī)學(xué)研究中心上海市醫(yī)學(xué)圖像處理與計(jì)算機(jī)輔助手術(shù)重點(diǎn)實(shí)驗(yàn)室和復(fù)旦大學(xué)電子工程系統(tǒng)一為復(fù)旦大學(xué);河南科技大學(xué)機(jī)電工程學(xué)院和河南科技大學(xué)醫(yī)學(xué)技術(shù)與工程學(xué)院統(tǒng)一為河南科技大學(xué);東南大學(xué)儀器科學(xué)與工程學(xué)院生物電子學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室中心統(tǒng)一為東南大學(xué);中國(guó)礦業(yè)大學(xué)人工智能研究院智慧醫(yī)療研究中心與中國(guó)礦業(yè)大學(xué)信息與控制工程學(xué)院統(tǒng)一為中國(guó)礦業(yè)大學(xué);桂林電子科技大學(xué)電子工程與自動(dòng)化學(xué)院和桂林電子科技大學(xué)生命與環(huán)境科學(xué)學(xué)院統(tǒng)一為桂林電子科技大學(xué);電子科技大學(xué)生命科學(xué)與技術(shù)學(xué)院和電子科技大學(xué)電子工程學(xué)院統(tǒng)一為電子科技大學(xué);浙江中醫(yī)藥大學(xué)信息技術(shù)學(xué)院與浙江中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院統(tǒng)一為浙江中醫(yī)藥大學(xué);浙江大學(xué)生命科學(xué)學(xué)院和浙江大學(xué)生物醫(yī)學(xué)工程與儀器學(xué)院統(tǒng)一為浙江大學(xué)。經(jīng)統(tǒng)計(jì),發(fā)文量排前3 位的單位依次為電子科技大學(xué)(21 篇)、河北大學(xué)(16 篇)和復(fù)旦大學(xué)(10 篇)。電子科技大學(xué)與四川省人民醫(yī)院合作發(fā)表了多篇文獻(xiàn);河北大學(xué)較為獨(dú)立;復(fù)旦大學(xué)與上海理工大學(xué)醫(yī)療器械與食品學(xué)院、上海微創(chuàng)電生理醫(yī)療科技股份有限公司開展了合作研究??傮w而言,研究機(jī)構(gòu)以高校為主,機(jī)構(gòu)間的合作較為松散,多為獨(dú)立發(fā)表。
Fig.3 Distribution of issuing agencies圖3 發(fā)文機(jī)構(gòu)分布
以“keywords”為節(jié)點(diǎn),單一時(shí)間間隔設(shè)為1 年,閾值設(shè)置為TOP=50,得到關(guān)鍵詞共現(xiàn)分析結(jié)果如圖4 所示。圖中展示了頻次不少于2 的關(guān)鍵詞,節(jié)點(diǎn)為344 個(gè),連線為423個(gè),密度為0.007 2??梢钥闯鲈~頻較大的房顫、心電圖、心電信號(hào)、房顫?rùn)z測(cè)等與卷積神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、支持向量機(jī)等密切相關(guān)。
Fig.4 Keyword co-occurrence analysis圖4 關(guān)鍵詞共現(xiàn)分析
出現(xiàn)頻次較高的關(guān)鍵詞如表2 所示。排名首位的為房顫,其頻次遠(yuǎn)高于其他關(guān)鍵詞,其余依次為心電圖、心電信號(hào)、卷積神經(jīng)網(wǎng)絡(luò)、心率失常等。
Table 2 Keyword frequency表2 關(guān)鍵詞頻次
網(wǎng)絡(luò)模塊化值(值越大表示聚類效果越好)以及剪影值(剪影值越接近1 說明同質(zhì)性越高)是評(píng)估網(wǎng)絡(luò)整體結(jié)構(gòu)的重要指標(biāo)。聚類模塊值=0.724 4(>0.3),說明聚類有效;聚類平均輪廓值=0.880 3(>0.7),說明該聚類成員間同質(zhì)性非常高[13]。本文聚類采用tf*idf 聚類方法,共提取到31 個(gè)類,排名前16 位的分別為:超限學(xué)習(xí)機(jī)(#0)、r 波定位(#1)、希式束(#2)、模式識(shí)別(#3)、qrs 波檢測(cè)(#4)、心室纖顫(#5)、p 波(#6)、盲源提?。?7)、檢測(cè)(#8)、獨(dú)立成分分析(#9)、機(jī)器學(xué)習(xí)(#10)、預(yù)處理(#11)、混沌(#12)、信息熵(#13)、波動(dòng)圖(#14)、統(tǒng)計(jì)性能(#15),結(jié)果見圖5。每種聚類包含4~5 個(gè)關(guān)鍵詞,表3 展示了聚類的規(guī)模、輪廓值以及所包含的關(guān)鍵詞。
Fig.5 Co-occurrence clustering map of keywords圖5 關(guān)鍵詞共現(xiàn)聚類圖譜
我國(guó)關(guān)于房顫?rùn)z測(cè)算法的文獻(xiàn)量總體呈上升趨勢(shì),但關(guān)注度仍有待提高,發(fā)文總量仍處于較低水平。目前發(fā)文量最多的為河北大學(xué)的劉明團(tuán)隊(duì),其研究方向?yàn)榛诶杪餍蜗∈杈幋a的陣發(fā)性房顫?rùn)z測(cè)算法[14],該算法采用協(xié)方差矩陣計(jì)算RR 間期的變化,使數(shù)據(jù)處于黎曼流形空間中,計(jì)算心率變異信號(hào),在可穿戴智能檢測(cè)設(shè)備中具有廣闊的應(yīng)用前景;其次是上海理工大學(xué)醫(yī)療器械與食品安全學(xué)院的陸宏偉團(tuán)隊(duì),其利用時(shí)域、頻域和非線性分析技術(shù)識(shí)別基于體表的心電圖,提取RR 間期的房顫特征[15];然后是西北大學(xué)醫(yī)療大數(shù)據(jù)研究中心的孫亞楠團(tuán)隊(duì),其采用心電信號(hào)去噪、心電信號(hào)的R 峰檢測(cè)和心電特征提取技術(shù)檢測(cè)陣發(fā)性房顫[16];接著是復(fù)旦大學(xué)的楊翠微團(tuán)隊(duì),其采用功率譜分析、近似熵和樣本熵分析、遞歸分析以及時(shí)間序列符號(hào)化4 種方法進(jìn)行陣發(fā)性房顫?rùn)z測(cè)[17];最后是電子科技大學(xué)的劉廣雄團(tuán)隊(duì),其采用主成分分析法提取房顫信號(hào)中的特征,然后使用分類器進(jìn)行分類[18]。目前對(duì)房顫?rùn)z測(cè)算法的研究主要集中在科研院所的重點(diǎn)實(shí)驗(yàn)室,可能是受地域限制,機(jī)構(gòu)間的合作較為分散。
從關(guān)鍵詞頻次中可以看出,使用卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)方法進(jìn)行房顫?rùn)z測(cè)的研究較多,相應(yīng)的心電信號(hào)處理方法包括小波變換、R 波檢測(cè)、獨(dú)立成分分析、QRS 波檢測(cè)、盲源提取等。關(guān)于房顫?rùn)z測(cè)算法的聚類標(biāo)簽包括超限學(xué)習(xí)機(jī)、R 波定位、希氏束、模式識(shí)別、QRS 波檢測(cè)、心室纖顫、盲源提取、檢測(cè)、經(jīng)驗(yàn)?zāi)J椒纸?、機(jī)器學(xué)習(xí)、預(yù)處理、混沌、波動(dòng)圖、性能統(tǒng)計(jì)。心電信號(hào)的預(yù)處理方法較多,如可利用灰度直方圖進(jìn)行房顫?rùn)z測(cè),其中一個(gè)重要步驟就是心電信號(hào)分解[19];改進(jìn)切片頻率的小波變換處理低頻信號(hào)具有較好效果[20],但對(duì)高頻信號(hào)的處理差強(qiáng)人意;離散小波分解可對(duì)頻率信號(hào)進(jìn)行分層處理,因而對(duì)多種信號(hào)有較好的處理效果[21];利用統(tǒng)計(jì)模型與信息熵相結(jié)合的方式可分析RR 間期波形的分布規(guī)律,以提供多維時(shí)間序列的關(guān)聯(lián)信息,但該方法更適合長(zhǎng)時(shí)序列,應(yīng)用于短時(shí)序列有一定的局限性[22]。心電信號(hào)特征提取常用方法包括黎曼流形、支持向量機(jī)、深度學(xué)習(xí)等。黎曼流形可定位異常波形的位置以完成特征提取,在數(shù)據(jù)量有限的情況下表現(xiàn)依舊較好,然而該方法具有一定的挑戰(zhàn)性[23];支持向量機(jī)可實(shí)現(xiàn)基于多個(gè)特征的自動(dòng)診斷,但該方法依賴于QRS 波的檢測(cè)[21];深度學(xué)習(xí)法可直接提取特征,且具有一定的泛化能力[24],但當(dāng)數(shù)據(jù)量和種類有限時(shí),其分類效果不如支持向量機(jī)。因此,需要依據(jù)實(shí)際情況選擇合適的心電信號(hào)特征提取方法。
房顫的智能化檢測(cè)對(duì)于預(yù)防嚴(yán)重心血管疾病的發(fā)生具有重要意義。本文通過對(duì)房顫?rùn)z測(cè)算法的相關(guān)文獻(xiàn)進(jìn)行分析發(fā)現(xiàn),近年來基于深度學(xué)習(xí)技術(shù)的房顫?rùn)z測(cè)研究熱度不斷上升,提取房顫信號(hào)特征的方法逐漸增多,分類模型也逐漸得到優(yōu)化,準(zhǔn)確度和精度不斷提高。然而,不同研究機(jī)構(gòu)之間的合作與交流有限,今后需加強(qiáng)交流與合作,互相取長(zhǎng)補(bǔ)短,探索出準(zhǔn)確率更高的房顫?rùn)z測(cè)算法。例如可通過R 波、QRS 波、P 波、心室率等指標(biāo)檢測(cè)出房顫的具體類型,然后利用模式識(shí)別、盲源提取、獨(dú)立成分分析、信息熵等方法分析和提取心電信號(hào),采用機(jī)器學(xué)習(xí)模型進(jìn)行分類,采用深度學(xué)習(xí)模型簡(jiǎn)化特征提取步驟,以獲得更好的泛化能力。此外,本研究還存在一定局限性,如僅選取了中國(guó)知網(wǎng)數(shù)據(jù)庫作為研究對(duì)象,沒有納入外文數(shù)據(jù)庫,缺少國(guó)內(nèi)外研究的橫縱對(duì)比等,今后將擴(kuò)大研究范圍,以獲取最前沿的研究趨勢(shì)。
Table 3 Size,silhouette coefficient and keywords included in the cluster表3 聚類規(guī)模、輪廓值以及包含的關(guān)鍵詞