亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于L-ISOMAP流形的癲癇數(shù)據(jù)降維可視化方法

        2021-12-10 08:31:30連召洋段立娟陳軍成喬元華
        計(jì)算機(jī)仿真 2021年11期
        關(guān)鍵詞:癲癇可視化方法

        連召洋,段立娟*,陳軍成,喬元華

        (1.北京工業(yè)大學(xué)信息學(xué)部,北京 100124;2.可信計(jì)算北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124;3.信息安全等級保護(hù)關(guān)鍵技術(shù)國家工程實(shí)驗(yàn)室,北京 100124;4.北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院,北京 100124)

        1 引言

        腦電波(EEG,electroencephalogram)是采集到的局部神經(jīng)元電活動(dòng)的總和的腦電信號(hào)。近年來,隨著腦科學(xué)及人工智能的發(fā)展,腦電信號(hào)分析方法已經(jīng)成為人們研究的熱點(diǎn)問題。其中,因?yàn)閷δX電信號(hào)進(jìn)行分析可以了解病人病因和病理,更為癲癇、抑郁癥、老年癡呆等腦部疾病的診斷和治療提供詳細(xì)有效的參考,所以基于腦電信號(hào)的腦疾病輔助診斷方法引起研究人員的廣泛關(guān)注。

        癲癇作為一種慢性神經(jīng)系統(tǒng)疾病,嚴(yán)重?fù)p害患者的身心健康。將癲癇腦電信號(hào)不同時(shí)期的檢測出來,能夠給醫(yī)生診斷病情帶來幫助。此外,如果能夠及時(shí)預(yù)測癲癇發(fā)作,則可以顯著改善癲癇患者的生活質(zhì)量,為癲癇疾病的防治開辟新的治療思路[1]。有效的特征提取方法成為不同時(shí)期的癲癇檢測及癲癇預(yù)測的關(guān)鍵[2]。

        在特征提取方面,Gotman等人首次對腦電信號(hào)進(jìn)行"半波"(Half-wave)分解,然后從中提取腦電特征,包括相對于背景的平均幅度、持續(xù)時(shí)間和變異系數(shù)等特征,并根據(jù)專家經(jīng)驗(yàn)設(shè)定閾值,將這些特征參數(shù)與該閾值進(jìn)行比較,以此來判斷是否為癲癇信號(hào)[3-5]。Nhan Duy Truong等人提出了一種自動(dòng)電極選擇方法對顱內(nèi)癲癇數(shù)據(jù)做預(yù)處理,并在時(shí)域和頻域中提取特征,計(jì)算通道功率和通道對之間的相關(guān)性,以此來完成發(fā)作期和發(fā)作前期的區(qū)分[6]。但是這些特征提取方法需要專家經(jīng)驗(yàn)和頻帶等方面的先驗(yàn)知識(shí)。

        盡管PCA(Principal Component Analysis)、LDA (Linear Discriminant Analysis)和NMF(Non-negative Matrix Factorization)等在特征提取應(yīng)用中的效果比較好,但是它們都是線性的模型,只能發(fā)現(xiàn)數(shù)據(jù)的全局的特征,并且LDA是有監(jiān)督的,并且訓(xùn)練時(shí)需要給定標(biāo)簽信息[7],但是在醫(yī)學(xué)領(lǐng)域有標(biāo)簽的數(shù)據(jù)很少,標(biāo)注的成本很高。近來,大量研究開始聚焦于腦電無監(jiān)督領(lǐng)域。不同領(lǐng)域的研究者發(fā)現(xiàn):高維空間中的數(shù)據(jù)點(diǎn)近似位于嵌入的低維空間中—個(gè)子流形上[7,8]。為了發(fā)現(xiàn)高維數(shù)據(jù)空間的非線性結(jié)構(gòu),有的研究者提出了核方法,但是,核方法的計(jì)算量大,也沒有考慮原始高維數(shù)據(jù)的內(nèi)在流形結(jié)構(gòu)。而基于流形的方法可以有效的解決以上問題。在[9]中發(fā)現(xiàn)應(yīng)用t-SNE (t-distributed Stochastic Neighbor Embedding)算法對fMRI數(shù)據(jù)降維后的可視化效果明顯。

        本文把不同的流形及降維方法應(yīng)用在醫(yī)療中癲癇的EEG公開數(shù)據(jù)上,對13主流的流行降算法(包括經(jīng)典的LLE(Locally Linear Embedding)[10]t-SNE[11,12]、LLSTA(Line Local Tangent Space Alignment)[13]以及較新的Manifold K-ELMC (K-Extreme Learning Machine Clustering)[23]等)無監(jiān)督情況下的降維聚類效果分別在2維和3維空間上可視化,并做對比分析。實(shí)驗(yàn)結(jié)果表明L-ISOMAP(Landmark ISOMAP)的可視化效果明顯,有很好的聚類表現(xiàn)。當(dāng)樣本大小不同時(shí),還能保持類似的數(shù)據(jù)流形結(jié)構(gòu),有一定的普適性。四組中L-ISOMAP都呈類似長條彗星狀的數(shù)據(jù)流形結(jié)構(gòu),保持癲癇間期的藍(lán)色樣本點(diǎn)在頭部集中,而癲癇發(fā)作期的紅色數(shù)據(jù)集在尾部,并且兩類樣本點(diǎn)的分類界限明顯。

        2 基于L-ISOMAP流形的癲癇數(shù)據(jù)降維算法

        2.1 基于L-ISOMAP的癲癇降維算法原理

        ISOMAP[14]是一種可以保持全局特性的無監(jiān)督流形方法,是MDS(Multi-Dimensional Scaling)算法[15]在非線性特征提取上的推廣,ISOMAP算法用非線性的測地距離代替歐式距離作為樣本點(diǎn)之間的相似性度[16]。L-ISOMAP(Landmark ISOMAP)[17,18]算法是基于ISOMAP的改進(jìn)算法,只計(jì)算每個(gè)樣本點(diǎn)到Landmark點(diǎn)的測地距離生成維矩陣,然后用LMDS (Landmark MDS)得到觀測數(shù)據(jù)的歐式嵌入。在本公開癲癇數(shù)據(jù)集中,經(jīng)過L-ISOMAP降維后癲癇數(shù)據(jù)集的分界比較明顯。

        2.2 基于L-ISOMAP的癲癇降維算法流程

        基于L-ISOMAP算法的癲癇降維可視化流程如圖1所示。

        圖1 癲癇降維可視化流程

        基于該思想的癲癇數(shù)據(jù)的降維算法可視化的具體步驟如下:

        1)將數(shù)據(jù)集中癲癇病人的發(fā)作間期樣本和發(fā)作期樣本隨機(jī)打亂合并,組成N*4097維數(shù)據(jù),設(shè)定各種參數(shù)如k近鄰值、低維空間目標(biāo)維數(shù)等。

        求N個(gè)全部樣本點(diǎn)與選取的n個(gè)點(diǎn)之間的歐式距離,得到矩陣d,其中dij代表樣本點(diǎn)xi和Landmark點(diǎn)xj之間的歐式距離。

        3)構(gòu)建鄰域圖

        k-NN方法:找出與每個(gè)樣本點(diǎn)最近的k個(gè)點(diǎn);

        其中,鄰接圖G中每條邊權(quán)重為dE(i,j)。

        如果樣本點(diǎn)xi和xj在圖G中相連,則它們之間最短路徑的初始值為dG(i,j)=dE(i,j),否則dG(i,j)=∞。令q=1,2,…,N,N是樣本點(diǎn)的總數(shù)量,計(jì)算下面公式

        dG(i,j)=min{dG(i,j),dG(i,q)+dG(q,j)}

        (1)

        由此可得所有樣本點(diǎn)對之間的測地距離組成測地距離矩陣DG={dG(i,j)}并計(jì)算最短路徑。

        4)計(jì)算低維嵌入坐標(biāo)

        將MDS算法應(yīng)用到測地距離矩陣DG,最小化下面的目標(biāo)函數(shù)得到樣本的紙維嵌入坐標(biāo)Y

        (2)

        3 實(shí)例驗(yàn)證

        本文對不同的流形及降維算法在癲癇數(shù)據(jù)上的降維效果進(jìn)行可視化,并和本文提出的算法做對比分析。

        2.1 對比分析

        數(shù)據(jù)集采用的是德國波恩大學(xué)對外公開的數(shù)據(jù)[20]。數(shù)據(jù)集一共由5個(gè)集合組成,每個(gè)集合里面有5個(gè)人,每個(gè)集合里面100個(gè)EEG數(shù)據(jù)段,每段數(shù)據(jù)的采樣點(diǎn)個(gè)數(shù)為4097,時(shí)長為23.6s。集合A和集合B里面分別是健康人的顱外EEG數(shù)據(jù);集合D里面是癲癇病人發(fā)作間期的數(shù)據(jù);集合E里面是癲癇病人發(fā)作時(shí)的數(shù)據(jù)。集合D來自癲癇區(qū)域,集合C遠(yuǎn)離病灶。所有EEG信號(hào)的采樣頻率都是173.61Hz,頻段為0.5~85Hz。本文選擇了集合D和集合E,將這兩個(gè)數(shù)據(jù)集的200個(gè)EEG數(shù)據(jù)段隨機(jī)打亂,生成200個(gè)4096維的輸入數(shù)據(jù)。圖2是對打亂的200個(gè)癲癇間期和發(fā)作期的樣本中隨機(jī)抽出5個(gè)樣本的可視化。

        圖2 隨機(jī)可視化5個(gè)樣本的癲癇腦電信號(hào)

        為了對比降維后聚類的可視化效果,分別用MDS(Multi-Dimensional Scaling)、LLE(Locally Linear Embedding)、PCA(Principal Component Analysis)、KPCA(Kernel Principal Component Analysis)、Laplacian、SNE(Stochastic Neighbor Embedding)、t-SNE(t-distributed Stochastic Neighbor Embedding)、ISOMAP、L-ISOMAP、DM (Diffusion Maps)[21]、LLC(Locally Linear Coordination)、LLTSA(Line Local Tangent Space Alignment)多種主流的流形及降維工具[22]對生成的4096維輸入數(shù)據(jù)進(jìn)行降維,分別得到對應(yīng)的2維和3維低維嵌入坐標(biāo)。并對降維后的數(shù)據(jù)進(jìn)行了可視化。各算法在降維過程中均不提供標(biāo)簽,標(biāo)簽只在得到嵌入坐標(biāo)后可視化時(shí)用于標(biāo)記顏色。這幾種流形及降維方法對本數(shù)據(jù)集中原始EEG數(shù)據(jù)的降維后的可視化效果如圖3、圖4所示。隨后與較新的Manifold K-ELMC算法[23]在癲癇數(shù)據(jù)集上降維后的2維可視化效果做對比,如圖3所示。

        圖3 不同經(jīng)典數(shù)據(jù)降維算法在癲癇數(shù)據(jù)中2維內(nèi)的可視化結(jié)果

        圖中紅色代表癲癇病人發(fā)作期的樣本,藍(lán)色是代表癲癇病人發(fā)作間期的樣本。在平面或空間中的位置坐標(biāo)是4097維原始數(shù)據(jù)經(jīng)過不同算法降成2維或3維中的嵌入坐標(biāo)。從圖3、圖4中可以看出在12種經(jīng)典的流形及降維算法中,SNE、KPCA、LLE、LLTSA等方法的200個(gè)數(shù)據(jù)點(diǎn)分布散亂,并且嚴(yán)重重疊,沒有明顯特征和聚類,發(fā)作間期和發(fā)作期的數(shù)據(jù)點(diǎn)交叉混亂。Laplacian、DM等方法的200個(gè)數(shù)據(jù)點(diǎn)的分布成彗星狀,Laplacian方法的數(shù)據(jù)點(diǎn)交叉嚴(yán)重并且還有散點(diǎn),DM方法的數(shù)據(jù)點(diǎn)分布比Laplacian方法的可視化效果好一些,但是也有交疊,LLC的數(shù)據(jù)點(diǎn)分布都集中在幾個(gè)零散的點(diǎn),藍(lán)色的癲癇間期樣本點(diǎn)丟失嚴(yán)重。采用MDS和PCA方法降維后的可視化形狀比較相似,數(shù)據(jù)點(diǎn)呈星狀散射。采用ISOMAP方法的數(shù)據(jù)點(diǎn)可視化效果也一般。從圖5中可以看出采用較新的Manifold K-ELMC算法降維后呈長條狀,紅藍(lán)兩類樣本點(diǎn)重疊嚴(yán)重,并且在左上部有紅色散點(diǎn)出現(xiàn),而經(jīng)過L-ISOMAP方法降到低維空間后,在2維和3維空間的可視化效果都很明顯,其形狀像一顆彗星。頭部是癲癇病人發(fā)作間期的藍(lán)色樣本,數(shù)據(jù)點(diǎn)比較集中,尾部是癲癇病人發(fā)作期的紅色樣本,相對零散一些。發(fā)作間期藍(lán)色樣本點(diǎn)和發(fā)作期紅色樣本點(diǎn)分界明顯。

        圖4 不同經(jīng)典數(shù)據(jù)降維算法在癲癇數(shù)據(jù)中3維內(nèi)的可視化結(jié)果

        圖5 L-ISOMAP與Manifold K-ELMC在2維中可視化對比

        3.2 適用性分析

        為了進(jìn)一步驗(yàn)證L-ISOMAP方法在本癲癇數(shù)據(jù)集上的有效性,我們把隨機(jī)混合后的200個(gè)樣本中抽取分別隨機(jī)抽取50個(gè)、100個(gè)、150個(gè)、200個(gè)樣本,用L-ISOMAP分別對其降維生成每個(gè)樣本嵌入坐標(biāo),并在2維和3維空間上進(jìn)行可視化分別如圖6、圖7所示,用L-ISOMAP算法對該數(shù)據(jù)集中不同樣本量的數(shù)據(jù)降維后可視化效果都很好,四組中都呈類似長條彗星狀的數(shù)據(jù)流形結(jié)構(gòu),保持癲癇間期的藍(lán)色樣本點(diǎn)在頭部集中,而癲癇發(fā)作期的紅色數(shù)據(jù)集在尾部,并且兩類樣本點(diǎn)的分類界限明顯。

        圖6 樣本數(shù)不同時(shí)L-ISOMAP算法的2維中可視化結(jié)果

        圖7 樣本數(shù)不同時(shí)L-ISOMAP算法的3維中可視化結(jié)果

        4 結(jié)論

        本文將不同的流形及降維方法應(yīng)用在醫(yī)療中癲癇的EEG數(shù)據(jù)上,在此公開數(shù)據(jù)集上,基于L-ISOMAP的癲癇數(shù)據(jù)降維可視化方法在13種流形降維方法中的效果最好,癲癇間期和發(fā)作期的樣本點(diǎn)分界面明顯。通過調(diào)節(jié)不同的樣本大小,經(jīng)過L-ISOMAP降維后數(shù)據(jù)樣本點(diǎn)在2維和3維中的數(shù)據(jù)分布保持相似的呈長條彗星狀的數(shù)據(jù)流形結(jié)構(gòu),有一定的規(guī)律性。

        猜你喜歡
        癲癇可視化方法
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        癲癇中醫(yī)辨證存在的問題及對策
        基于CGAL和OpenGL的海底地形三維可視化
        “融評”:黨媒評論的可視化創(chuàng)新
        傳媒評論(2019年4期)2019-07-13 05:49:14
        玩電腦游戲易引發(fā)癲癇嗎?
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        捕魚
        国产精品人成在线765| 丰满人妻被中出中文字幕| 亚洲午夜精品久久久久久一区| 北岛玲精品一区二区三区| 日本老熟妇五十路一区二区三区| 欲求不満の人妻松下纱荣子| 欧美日韩国产一区二区三区不卡 | 亚洲中文字幕av一区二区三区人| 国产乱淫h侵犯在线观看| 亚洲人成网网址在线看| 亚洲av久久无码精品九九 | 日日噜噜夜夜狠狠视频| 亚洲综合精品伊人久久| 少妇无码av无码去区钱| 亚洲熟女一区二区三区不卡 | 国产70老熟女重口小伙子| 亚洲性69影视| 国产黄色一区二区三区av| 草草地址线路①屁屁影院成人| 日韩人妻无码一区二区三区久久99| 精品国产一区二区三区久久女人| 中文字幕文字幕一区二区| 国产猛烈高潮尖叫视频免费| 久久久www成人免费无遮挡大片| 午夜亚洲国产精品福利| 国产精品又湿又黄九九九久久嫩草| 国内精品久久久久国产盗摄 | 久久这里只精品国产2| 精品国产av一区二区三四区| 无套内谢老熟女| 久久丫精品国产亚洲av| 精品国产福利一区二区三区| 蜜桃视频在线观看网址| 亚洲综合色区另类av| 国产最新AV在线播放不卡| 亚洲五码av在线观看| 国产精品理论片在线观看| 欧美性xxxx狂欢老少配| 亚洲AV无码日韩一区二区乱| 丰满少妇被猛进去高潮| 国产一卡2卡3卡四卡国色天香 |