亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于XGBoost模型的心律失常分類算法研究

        2019-07-25 08:27:44李云吳水才袁麗
        中國醫(yī)療設(shè)備 2019年7期
        關(guān)鍵詞:分類數(shù)據(jù)庫特征

        李云,吳水才,袁麗

        北京工業(yè)大學(xué) 生命科學(xué)與生物工程學(xué)院,北京 100124

        引言

        心律失常是一種常見的心血管疾病[1],嚴(yán)重威脅著中老年人的身體健康,某些心律失常(如心室顫動(dòng)和心動(dòng)過速)會(huì)出現(xiàn)致死現(xiàn)象。心電圖(Electrocardiograph,ECG)能直接反映心臟的電生理活動(dòng),但心律失常的出現(xiàn)具有偶然性和突發(fā)性,目前比較有效的方法是采用動(dòng)態(tài)心電監(jiān)護(hù)儀記錄30 min或更長時(shí)間的心電信號(hào),但人工分析較長時(shí)間(>30 min)的ECG存在效率低、僅憑借醫(yī)生經(jīng)驗(yàn)等問題。隨著信息傳輸技術(shù)和機(jī)器學(xué)習(xí)算法的高速發(fā)展,越來越多的學(xué)者開始使用計(jì)算機(jī)自動(dòng)識(shí)別技術(shù)對心電信號(hào)進(jìn)行分類,在保證分類結(jié)果具有較高準(zhǔn)確率的同時(shí)使心律失常實(shí)時(shí)分類成為可能。

        心律失常自動(dòng)分類的主要技術(shù)手段通常是在特征提取[2](如形態(tài)特征[3]、RR間期[4]、獨(dú)立成分分析[5]、小波特征[6])的基礎(chǔ)上,利用各種機(jī)器學(xué)習(xí)分類器,如人工神經(jīng)網(wǎng)絡(luò)[6]、支持向量機(jī)[7]、隨機(jī)森林[8]、貝葉斯網(wǎng)絡(luò)[9]和深度學(xué)習(xí)[10]等對心律失常進(jìn)行分類。Knvps等[11]采用經(jīng)驗(yàn)?zāi)J椒纸鈱CG信號(hào)分解為固有模式函數(shù),隨后提取樣本熵、變異系數(shù)、奇異值和IMF的頻帶功率作為特征,輸入到基于多項(xiàng)式核函數(shù)的最小優(yōu)化支持向量機(jī)中,結(jié)果表明心律失常分類準(zhǔn)確率高達(dá)99.2%,但此算法只包括了五種特定類型的心電信號(hào),并沒有涵蓋所有的心律失常。Shadmand等[12]借助Hermit激活函數(shù)(多項(xiàng)式)提取ECG信號(hào)中的形態(tài)特征和RR間期特征形成特征向量,輸入到粒子群算法優(yōu)化的人工神經(jīng)網(wǎng)絡(luò)分類器中,結(jié)果根據(jù)美國醫(yī)療促進(jìn)協(xié)會(huì)(Association for the Advancement of Medical Instrumentation,AAMI)制定的標(biāo)準(zhǔn)將心律失常類型分為五類,平均識(shí)別準(zhǔn)確率達(dá)到97%,但是由于其測試集與訓(xùn)練集含有相同患者的數(shù)據(jù),因此這種方法泛化能力[13]比較弱,只適用于給每個(gè)個(gè)體建立一個(gè)特異性模型[14]。Oliveira等[15]提出采用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(Dynamic Bayesian Network,DBN)來解決ECG信號(hào)分類問題,使用DBN基于室性早搏(Premature Ventricular contraction,PVC)構(gòu)建拓?fù)浣Y(jié)構(gòu),對PVC最大識(shí)別率為99%。以上心電分類研究獲得了較好的分類效果,但是存在識(shí)別種類不全面或者沒有考慮不同患者間心電信號(hào)的差異性問題。

        本文提出一種基于極限梯度提升(Extreme Gradient Boosting,XGBoost)模型的心律失常分類方法,考慮到患者間的個(gè)體差異, 將心律類型按照AAMI標(biāo)準(zhǔn)分為四類。首先采用小波中值閾值法對心電信號(hào)去噪,根據(jù)R波峰位置分割心電信號(hào),提取每個(gè)心拍的投影特征和RR間期相關(guān)特征,輸入到XGBoost分類器中,實(shí)現(xiàn)對心律失常的分類。該算法在MIT-BIH心律失常數(shù)據(jù)庫上進(jìn)行測試,實(shí)驗(yàn)結(jié)果表明心律失常分類平均識(shí)別準(zhǔn)確率達(dá)到94.1%,高于同類文獻(xiàn)[3,5,7]的結(jié)果。

        1 材料和方法

        1.1 數(shù)據(jù)來源

        MIT-BIH心律失常數(shù)據(jù)庫由美國麻省理工學(xué)院提供,是研究心律失常分類算法的常用數(shù)據(jù)庫之一,并已被廣泛用于心律失常算法的驗(yàn)證[5,7,16-17]。本研究選擇該數(shù)據(jù)庫作為研究對象,包含47位患者的48條記錄,其中23條記錄(編號(hào)范圍是 100~109、111~119、121~124)是常規(guī)心律失常樣本,25條記錄(編號(hào)范圍是200~203、205、207~210、212~215、217、219~223、228、230~234)是臨床罕見的心律失常情況,每條記錄包含30 min的心電信號(hào),采樣率為360 Hz。本研究采用AAMI制定的心律失常分類標(biāo)準(zhǔn),表1給出了MIT-BIH數(shù)據(jù)庫注釋類型與AAMI分類標(biāo)準(zhǔn)的對應(yīng)關(guān)系[18]。

        表1 AAMI心律分類標(biāo)準(zhǔn)與MIT-BIH心律注釋對照表

        1.2 心律失常算法評(píng)價(jià)方案

        目前國內(nèi)外評(píng)價(jià)心律失常分類算法的方式有兩種:一種是被稱為患者內(nèi)的心律分類方式,另一種是患者間的心律分類方式。基于患者內(nèi)的研究[2,4,16]往往在測試集上有較好的分類效果,但訓(xùn)練集和測試集中含有同一個(gè)患者的心電樣本,忽略了不同患者間的心電信號(hào)存在差異性。為了解決這個(gè)問題,de Chazal等[3]提出了患者間的心律分類方式,使訓(xùn)練集和測試集的數(shù)據(jù)樣本來自不同的患者個(gè)體。多項(xiàng)研究[3,5,7]表明,基于患者間的心律分類具有更好的臨床價(jià)值和優(yōu)秀的泛化能力。本研究考慮到患者間的個(gè)體差異,實(shí)現(xiàn)患者間的心律失常自動(dòng)分類,將MIT-BIH數(shù)據(jù)庫中受試者分成兩組,分別為訓(xùn)練集和測試集,去掉數(shù)據(jù)庫中含有起搏心拍的受試者(102、104、107、214),具體見表2。

        表2 數(shù)據(jù)集劃分情況

        1.3 心律失常檢測方法

        本文所提出的心律失常分類方法分為3個(gè)部分,即預(yù)處理、特征提取和特征分類,算法流程如圖1所示。

        圖1 心律失常算法流程圖

        1.3.1 預(yù)處理

        在心電信號(hào)采集過程中往往會(huì)受到噪聲的干擾,這些噪聲主要是基線漂移、肌電干擾和工頻干擾[2]。本研究對心電信號(hào)進(jìn)行小波變換,將心電信號(hào)分解到不同尺度,利用中值閾值法[19]去除不同尺度上的噪聲分量,從而得到心電信號(hào)的有效信息。小波變換的核心是基函數(shù)和分解尺度,本研究為保證信號(hào)的完整性及算法的實(shí)時(shí)性,選擇DB 1(Daubechies 1)小波作為基函數(shù),分解尺度定為8。首先去除第八層的近似系數(shù)(頻率范圍小于1 Hz)以去除基線漂移,其次對小波分解的一階、二階、三階的細(xì)節(jié)系數(shù)進(jìn)行閾值處理以去除肌電干擾和工頻干擾,其閾值t如公式(1)所示:

        其中n為小波系數(shù)向量長度,L為小波分解層數(shù),K為小波分解當(dāng)前層數(shù)(取值范圍是1~3), 是噪聲方差,其估計(jì)值見公式(2):

        其中abs是取絕對值,median取中位數(shù),x為當(dāng)前系數(shù)向量。最后由于肌電干擾接近高斯白噪聲分布,按照模型(3)得到去噪后的小波系數(shù)y。

        將小波系數(shù)按照軟閾值的方式進(jìn)重構(gòu)得到有效信號(hào)。圖2是信號(hào)去噪的前后對比圖,可以看出在保證信號(hào)完整性的基礎(chǔ)上,對去噪有明顯的效果。

        圖2 心電信號(hào)去噪對比圖

        特征提取之前需要對心電信號(hào)進(jìn)行切片分割。本研究的目的是心律失常分類,因此直接通過MIT-BIH心律失常數(shù)據(jù)庫標(biāo)記的R峰位置分割信號(hào)。一個(gè)完整的心電周期包括P波、PR間期、QRS波、ST段、T段和QT間期。不同波群反應(yīng)心臟不同的活動(dòng)情況[4],P波代表了從竇房結(jié)到房室結(jié)、從右心房到左心房的去極化過程,通常間隔小于80 ms,PR間期反映了電脈沖從竇房結(jié)傳遞到房室結(jié)的時(shí)間,間隔為120~200 ms,QRS波群反映了左右心室的快速去極化過程,寬度一般為80~100 ms,ST段是連接QRS波和T波的一段區(qū)域,代表了心室去極化之后的一段時(shí)間。QT間期指從QRS波開始到T波結(jié)束的一段時(shí)間,間隔通常小于440 ms。根據(jù)QRS波形的特征,R峰前200 ms和R峰后440 ms一般能包含心拍的一個(gè)完整周期,因此我們?nèi)峰前80、后160個(gè)點(diǎn)形成特征片段。

        1.3.2 特征提取

        1.3.2.1 高斯隨機(jī)矩陣

        高斯隨機(jī)投影矩陣提供了一種有效的方法來減少波形特征的數(shù)量。Shadmand等[12]也證明了隨機(jī)投影矩陣在對數(shù)據(jù)進(jìn)行50%的壓縮比例情況下,重建的信號(hào)與原始信號(hào)幾乎重合,均方誤差為0.0005,表明投影特征包含了原始心電的大部分有效信息。

        在投影變換式(4)中,數(shù)據(jù)域X通過高斯隨機(jī)矩陣 變換到壓縮域Y,N為原始數(shù)據(jù)X的維度,M是壓縮后數(shù)據(jù)Y的維度。M決定了分類器的運(yùn)行性能,Chen等[20]對M值進(jìn)行了試驗(yàn),在M為30的時(shí)候既能保證運(yùn)行效率且使準(zhǔn)確率最大化,因此本文的M值初始化為30。

        1.3.2.2 RR間期

        RR間期表示心臟活動(dòng)的頻率,包含了心臟活動(dòng)的動(dòng)態(tài)特征信息。文獻(xiàn)[15]表明RR間期可以檢測和分類某些類型的心律失常如室性早搏、心室顫動(dòng)和傳導(dǎo)阻滯等。

        本文計(jì)算心電的平均RR間期、前RR間期和后RR間期作為心電的動(dòng)態(tài)信息特征。前RR間期是當(dāng)前R波峰位置與前一R波峰位置之間的距離;后RR間期是當(dāng)前R波峰位置與后一R波峰位置之間的距離,這兩個(gè)特征代表了心電信號(hào)的瞬時(shí)特征。由于MIT-BIH數(shù)據(jù)庫中每條記錄的長度在30 min,計(jì)算平均RR間期是不現(xiàn)實(shí)的,因此取當(dāng)前R波峰之前的10個(gè)RR間隔的平均距離計(jì)算為平均RR間期,其優(yōu)點(diǎn)是能立即計(jì)算出當(dāng)前節(jié)拍的平均RR間期,保證實(shí)時(shí)特征提取。圖3統(tǒng)計(jì)了4種心電類型的3種RR間期情況,每個(gè)類別隨機(jī)獲取了100個(gè)RR間期,心電類型依次為N、S、V、F。從圖中可以看出N、F類的前RR間期與S、V類有明顯的區(qū)別,F(xiàn)類的后RR間期與N、S、V類也有顯著的差異。

        圖3 RR間期統(tǒng)計(jì)表

        1.3.3 XGboost分類器

        XGboost分類器是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)中最常用的算法之一。由于其分類效果顯著,計(jì)算復(fù)雜度不高,對輸入要求不敏感,經(jīng)常被用在一些比賽中[10,16]。XGBoost的分布式版本有廣泛的可移植性,支持在多種平臺(tái)上運(yùn)行。XGBoost的基本組成部分是回歸樹(Regression Tree),采用集成思想,將多個(gè)回歸樹進(jìn)行組合達(dá)到準(zhǔn)確的分類效果。其建樹過程為,首先確定初始樹為那么建立第t棵樹時(shí)的預(yù)測模型為:

        其中xi是屬于樣本集中第i個(gè)樣本,fk表示第K棵樹,表示樣本xi的預(yù)測結(jié)果。在建立模型過程中不斷優(yōu)化目標(biāo)損失函數(shù),使其最小,如(6):

        其中γ、λ分別表示懲罰系數(shù),T表示樹的葉子結(jié)點(diǎn)數(shù),w為葉子結(jié)點(diǎn)的取值。XGBoost通過將使用二階泰勒公式展開得:

        其中,gi、hi表示在第i個(gè)樣本下泰勒展開式的一階導(dǎo)數(shù)、二階導(dǎo)數(shù),通過(8)可以得到是關(guān)于wj的一元二次方程,因此能夠找到使取值最小的wj。為簡化公式,定義,那么當(dāng):

        通過以上步驟完成第t棵樹的建立。XGBoost模型在工作時(shí)需要設(shè)置三類參數(shù)。分別是通用參數(shù)、Booster參數(shù)和學(xué)習(xí)目標(biāo)參數(shù)。通用參數(shù)包括基礎(chǔ)模型的設(shè)置和多線程控制等;Booster參數(shù)是設(shè)置基礎(chǔ)模型的參數(shù),以樹形結(jié)構(gòu)為例,包括學(xué)習(xí)率、樹的最大深度、最大葉子數(shù)量等;學(xué)習(xí)目標(biāo)參數(shù)包括定義目標(biāo)損失函數(shù)、樹的復(fù)雜度和隨機(jī)數(shù)的種子。在本研究中基礎(chǔ)模型選擇了樹形結(jié)構(gòu),目標(biāo)損失函數(shù)為負(fù)對數(shù)似然函數(shù)(Mlogloss),Booster參數(shù)的調(diào)整通過訓(xùn)練集驗(yàn)證來確定,具體參數(shù)設(shè)置如表3。

        表3 XGboost模型參數(shù)

        2 結(jié)果與分析

        2.1 算法評(píng)價(jià)指標(biāo)

        本文計(jì)算靈敏度(Sensitivity,Se)、真陽性檢測率(Positive Predictive Value,+P)、準(zhǔn)確率(Accuracy,Acc)作為衡量分類器的性能指標(biāo)。其計(jì)算方法如公式(11)(12)(13)所示,其中TP表示真陽性數(shù)量,F(xiàn)P為假陽性數(shù)量,TN為真陰性數(shù)量,F(xiàn)N為假陰性數(shù)量。

        2.2 結(jié)果分析

        AAMI規(guī)定了心律失常分類檢測算法的評(píng)估標(biāo)準(zhǔn),一般通過混淆矩陣表示算法測試結(jié)果,實(shí)驗(yàn)結(jié)果如表4中矩陣所示,表中橫軸表示真實(shí)標(biāo)簽數(shù)據(jù)情況,縱軸表示預(yù)測標(biāo)簽情況,對角線上的數(shù)據(jù)表示準(zhǔn)確的預(yù)測值,混淆矩陣中給出了N、S、V和F類的分類情況。為了體現(xiàn)算法的優(yōu)越性,在使用同樣的訓(xùn)練集和數(shù)據(jù)集的情況下,與已有研究[3,5,7]的結(jié)果進(jìn)行了比較,結(jié)果見表5。

        表4 實(shí)驗(yàn)結(jié)果

        表5 試驗(yàn)結(jié)果對比

        從表5中可以看出,本算法在全局準(zhǔn)確度和N、V類的靈敏度方面有較好的表現(xiàn)。N、V類的陽性預(yù)測值略低于之前的研究,然而S類的陽性預(yù)測值、靈敏度普遍不高,其原因可能有兩點(diǎn),一是訓(xùn)練數(shù)據(jù)相對較少,其次S類中的室上性早搏與N類的波形極其相似。值得說明的是,由于不同個(gè)體之間心電信號(hào)存在著差異,因此基于患者間的評(píng)估方案有很高的臨床價(jià)值。本文平均識(shí)別準(zhǔn)確率達(dá)到94.1%,S類陽性預(yù)測值、V類靈敏度進(jìn)一步提高,因此本文方法對于心律失常分類研究有很高的參考價(jià)值。

        3 結(jié)論

        本文針對動(dòng)態(tài)心電監(jiān)護(hù)中數(shù)據(jù)量大、人工分析效率低及準(zhǔn)確率難以保證等問題,提取心電信號(hào)的投影特征和RR間期特征,訓(xùn)練了一個(gè)XGBoost模型,成功將心律類型按照AAMI標(biāo)準(zhǔn)分為4類。經(jīng)過MIT-BIH心律失常數(shù)據(jù)庫的驗(yàn)證,本方法的平均識(shí)別準(zhǔn)確率高達(dá)94.1%,可作為醫(yī)護(hù)人員診斷心臟疾病的參考依據(jù)。另外,XGBoost模型速度快、準(zhǔn)確率高,可分布式部署,能集成到當(dāng)前流行的Hadoop、spark數(shù)據(jù)處理框架之中,使得本方法可快速移植到服務(wù)器軟件平臺(tái)。

        猜你喜歡
        分類數(shù)據(jù)庫特征
        分類算一算
        如何表達(dá)“特征”
        不忠誠的四個(gè)特征
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        抓住特征巧觀察
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        日本肥老熟妇在线观看| 国产亚洲精品bt天堂精选| 天堂网站一区二区三区| 亚洲中文字幕无码一久久区| 色av综合av综合无码网站| av草草久久久久久久久久久| 日韩激情视频一区在线观看| 大肉大捧一进一出好爽视频动漫| 国产一区二区精品久久| 国产人成无码视频在线| 国产一区二区三区涩涩涩| 美女很黄很色国产av| 欧美大成色www永久网站婷| 日韩精品国产自在久久现线拍| 中文字幕乱偷乱码亚洲| 牛仔裤人妻痴汉电车中文字幕| 91偷自国产一区二区三区| 欧美丰满熟妇bbbbbb| 小12萝8禁在线喷水观看| 亚洲一级无码片一区二区三区| 亚洲一区二区三区在线更新| 国产日韩厂亚洲字幕中文| 国产日产欧产精品精品蜜芽| 三男一女吃奶添下面| 2021国产精品一区二区在线| 免费视频一区二区三区美女| 亚洲日韩精品一区二区三区无码| 真人二十三式性视频(动)| 最新手机国产在线小视频| 香港三级日本三韩级人妇久久| 国产做爰又粗又大又爽动漫| 另类免费视频在线视频二区| 在线日本高清日本免费| 多毛小伙内射老太婆| 男人扒开女人下面狂躁小视频| 亚洲精品亚洲人成在线播放| 国产精品一区二区夜色不卡| 公和我做好爽添厨房中文字幕| 国产精品多人P群无码| 国产喷白浆精品一区二区豆腐| 国产极品裸体av在线激情网|