亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學習構建江西地區(qū)缺血性腦卒中風險預測模型

        2022-08-23 02:47:04常懷文姚音
        西部醫(yī)學 2022年8期
        關鍵詞:貝葉斯分類器缺血性

        常懷文 姚音

        (復旦大學生命科學學院計算生物學系,上海 200438)

        腦卒中包括缺血性腦卒中和出血性缺血性腦卒中兩種,其中缺血性腦卒中占70%~80%,是我國成年人致死和致殘的首位原因[1-2]。缺血性腦卒中是由于腦供血動脈(頸動脈和椎動脈)狹窄或閉塞,腦供血不足而引起的腦組織壞死的總稱[3]。然而,許多患者無法從早期治療中獲益,大量的時間在院外丟失,這往往是因為缺乏對腦卒中癥狀的認知,缺乏快速尋求緊急救治的途徑,或對其缺乏應急反應[4]。據不完全統計,缺血性腦卒中多發(fā)生于中老年人,其主要原因是長期吸煙、酗酒、肥胖,以及長期控制不佳的高血壓、糖尿病、高脂血癥,使腦動脈粥樣硬化越來越嚴重[5]。由于病理特征復雜,且影響因素眾多,目前臨床上難以判定多種因素作用的程度會對缺血性腦卒中的發(fā)生產生何種影響,而其前期的預防干預優(yōu)勢又顯著大于后期治療[2-3,5]。如今,隨著大數據的深入應用,機器學習已經進入醫(yī)療領域,其卓越的算法特性能夠更好、更快地幫助我們找出發(fā)病源及關聯屬性,為后期精準醫(yī)療提供幫助[6]。因此本研究以選取江西地區(qū)的樣本數據為例,利用多種機器學習方法構建缺血性腦卒中風險預測模型,以此挖掘缺血性腦卒中的發(fā)病機制,為缺血性腦卒中的提前干預與控制提供理論依據。

        1 資料與方法

        1.1 一般資料 研究使用的數據共745例,來自于2020年1月~2020年12月就診于江西省某三甲醫(yī)院的574例缺血性腦卒中患者及171例健康人群問卷調查數據。納入標準:①診斷為缺血性腦卒中成年患者。②具備基本的認知能力。③簽署知情同意書。其中,非腦卒中數據以問卷形式在江西地區(qū)發(fā)放,抽取無心腦血管疾病的健康人群問卷作為調查樣本;缺血性腦卒中患者均為首次就診,符合條件的參與者在癥狀出現后48 h內通過CT或MRI證實為缺血性腦卒中,并且收縮壓升高在140~220 mmHg。該研究獲得了醫(yī)院機構委員會的倫理批準(CKLL-2018005),所有研究活動均按照其指導方針進行。在詳細解釋本研究的性質后,從所有研究參與者處獲得書面知情同意書。

        1.2 方法

        1.2.1 指標選取 由于人群特征的不同,不同地區(qū)心血管疾病危險因素的選擇存在一些差異,但相關專業(yè)人士一致認為主要危險因素應符合以下標準[7]:①于許多人群中的存在率很高。②對心血管疾病的風險有重要的獨立影響。③經過治療和控制,可以降低風險。基于此,本研究對用于調查的影響心血管疾病發(fā)生的重要生物學指標進行介紹并對其進行數據編碼,見表1。

        表1 定性指標的選取及變量定義

        1.2.1.1 性別和年齡 影響心血管疾病的不可控制的危險因素之中主要包含性別和年齡。一般而言,心血管疾病的風險隨著年齡的增長而增加[2-3,6]。研究表明,男性心血管疾病的風險高于女性,同時,隨著年齡的增長,心血管疾病復發(fā)率的性別差異呈現逐漸減弱的跡象[5,7]。

        1.2.1.2 高血壓 根據JNC-VII,年齡在40~70歲且血壓為(115~185)/(75~115) mmHg的個體,收縮壓(SBP)每增加20 mmHg和舒張壓(DBP)每增加10 mmHg,患心血管疾病的危險性將以倍數的形式提升[8]。高血壓最終會導致心臟、大腦、腎臟和外周血管發(fā)生病理變化,從而導致一系列并發(fā)癥,例如充血性心力衰竭、左心室肥大、冠心病及腦血管疾病等并發(fā)癥[9]。

        2 結果

        2.1 指標分布差異性分析及可視化 本研究考慮在患缺血性腦卒中與健康兩種情況下對比上述所選指標間是否存在顯著差異性。對于參數檢驗,其假定數據可以由一個或多個參數定義的分布很好地描述,且在大多數情況下是通過正態(tài)分布來描述的[10]。如果樣本數據集無法被選擇的分布近似的時候,參數檢驗的結果會存在極大的誤差,此時應當考慮非參數檢驗[11]。因此,本研究對所選指標繪制概率密度函數圖,發(fā)現收縮壓的分布不具有正態(tài)性,呈現偏態(tài)分布,見圖1。

        圖1 所選指標的概率密度函數圖

        2.2 差異性檢驗

        2.2.1 參數檢驗 本研究對患缺血性腦卒中與健康兩種情況下服從正態(tài)分布的指標進行獨立組別之間的t檢驗。顯著性水平為α=0.05,檢驗統計量為

        (1)

        表2 正態(tài)性指標獨立組別之間的t檢驗結果

        2.2.2 非參數檢驗 本研究對患缺血性腦卒中與健康兩種情況下不服從正態(tài)分布的收縮壓指標進行Mann-Whitney檢驗。顯著性水平為α=0.05,檢驗假設為

        H0:F(x)=G(y);H1:F(x)≠G(y)

        (2)

        H0的拒絕域為

        (3)

        其中r1與r2由下式算出:

        (4)

        2.3 基于樸素貝葉斯的缺血性腦卒中風險預測模型構建

        2.3.1 基本模型 樸素貝葉斯法對條件概率分布的條件獨立性假設為

        P(X=x|Y=ck)=

        P(X(1)=x(1),…,X(n)=x(n)|Y=ck)

        (5)

        針對所得輸入x,后驗概率分布P(Y=ck|X=x)可由學習模型計算所得。與此同時,x的類輸出可由后驗概率最大的類所得。根據貝葉斯定理計算后驗概率:

        P(Y=ck|X=x)=

        (6)

        式(5)代入式(6),有

        P(Y=ck|X=x)=

        (7)

        也即樸素貝葉斯分類公式。

        2.3.2 模型構建 基于樸素貝葉斯分類器的高效性,其通過單獨查看每個特征來學習參數,并從每個特征中收集簡單的類別統計數據,且本研究所選指標數據大多為二分類數據,考慮使用BernoulliNB進行機器學習,其假設缺血性腦卒中特征的先驗概率為多項式分布,即為

        (8)

        其中,P(Xj=xjl|Y=ck)為第k個類別的第j維特征的取值條件概率,mk為訓練集中第k類輸出的樣本數量,λ為大于0的常數,通常等于1,即拉普拉斯平滑[12]。

        由于BernoulliNB含有一個參數α(即上述拉普拉斯平滑參數λ),用于控制模型復雜度。α的工作原理是,算法向數據中添加α這么多的虛擬數據點,這些點對所有特征都取正值。這可以將統計數據“平滑化”。α越大,平滑化越強,模型復雜度就越低。另一方面,算法的性能對α值的魯棒性相對較好。需要強調的是,調整α將會使得精度略有提高。本研究分別選取α=1,α=10,α=100構建伯努利樸素貝葉斯分類器,其中模型精度見表3。

        表3 對于不同的α值的伯努利樸素貝葉斯分類器在缺血性腦卒中數據集上的模型精度

        由于α=1時模型精度最高,故本研究最終選取考慮先驗概率且α=1的伯努利樸素貝葉斯分類器。

        2.4 基于支持向量機的的缺血性腦卒中風險預測模型構建

        2.4.1 基本模型 本文給出線性可分支持向量機學習算法步驟:輸入:線性可分訓練集T={(x1,y1),(x2,y2),…,(xN,yN)},其中xi∈X=Rn,yi∈Y={-1,+1},i=1,2,…,N。

        輸出:分類決策函數以及分離超平面。

        (1)構造并求解約束最優(yōu)化問題

        (9)

        (2)計算

        (3)求得分離超平面

        w*·x+b*=0

        (12)

        分類決策函數:

        f(x)=sign(w*·x+b*)

        (13)

        2.4.2 模型構建 對于所得樣本數據集,由于樣本在不同特征上的維度不同,將會使得距離計算存在問題,則考慮先進行標準化[13]。同時考慮其具有較強的線性可分性,故使用線性支持向量機。要注意的是,對于線性支持向量機,與Logistic回歸類似,具有決定正則化強度的權衡參數C[11,14]。本研究分別選取C值0.001、1.000和100.000構建線性支持向量機,模型精度見表4。

        表4 對于不同的C值,線性支持向量機在缺血性腦卒中數據集上的模型精度

        由于C=1.000時模型精度最高,故本研究最終選取C=1.000的線性軟間隔支持向量機,其分類決策函數見式(14),其中xj,j=1,…,5為缺血性腦卒中數據集輸入變量。

        f(x)=sign(0.06x1+0.54x2+1.42x3-0.14x4+

        0.63x5+1.60)

        (14)

        2.5 基于ROC與AUC的模型選擇ROC曲線考慮給定分類器的所有可能閾值,并顯示假正例率和真正例率,而不是報告準確率和召回率[15-16]。對于ROC曲線,理想曲線應接近左上角。本研究希望分類器的召回率很高,同時使假正例率很低。利用AUC分數來比較樸素貝葉斯模型及支持向量機,本研究發(fā)現支持向量機的表現比樸素貝葉斯模型要略好一些,見表5。綜上所述,本研究最終選取支持向量機模型(C=1.000)作為缺血性腦卒中風險預測模型。

        表5 兩種自動化模型的AUC

        3 討論

        3.1 缺血性腦卒中的現狀分析 本研究的研究重點在于缺血性腦卒中前期風險預測及干預?;?45例樣本數據,借助t檢驗及Mann-Whitney檢驗發(fā)現,在患缺血性腦卒中與健康兩種情況下年齡(P=0.000)、頸動脈狹窄或閉塞是否有癥狀(P=0.000)及收縮壓(u=14539.500,P=0.000)間存在顯著差異,在后續(xù)缺血性腦卒中的預防干預以及精準醫(yī)療過程中應當重點關注。

        3.2 缺血性腦卒中風險預測模型 缺血性腦卒中具有發(fā)病率高、致殘率高、死亡率高和復發(fā)率高的特點。因此,在源頭控制缺血性腦卒中發(fā)病率及風險干預尤為重要[17]。因此,本研究對所得樣本數據進行全方位、多角度的挖掘分析,利用機器學習方法構建風險預測模型并進行嚴格的模型選擇力求獲得最優(yōu)的缺血性腦卒中風險預測模型。

        在缺血性腦卒中的預測研究中,許多已構建的穩(wěn)定的評分方法與預測模型普遍建議選擇改良的弗明漢缺血性腦卒中量表、匯集隊列方程、缺血性腦卒中風險計算器等工具進行缺血性腦卒中風險評估,但是這些模型主要針對歐美人群,對我國人群的缺血性腦卒中風險評估預測效果不佳[18-20]。同時需要注意的是,上述模型雖然容易被理解,但準確性不高、誤差較大。本研究以江西地區(qū)的案例為基礎,從中國缺血性腦卒中實際病理情況出發(fā),通過數據挖掘的方式揭示影響缺血性腦卒中的危險因素,同時探討各因素之間的分布特征及相關性,并選取少數典型指標用于后續(xù)建模,這極大降低了計算復雜度與算法迭代次數,同時使得模型更準確、誤差小且區(qū)分度高,更容易被理解[19,21-23]。

        另一方面,憑借機器學習的卓越特性,本研究還利用ROC與AUC進行模型篩選。需要強調的是,由于本研究所得到的為不平衡數據,認為AUC是一個比精度好得多的指標。AUC等價于從正類樣本(患有缺血性腦卒中)中隨機挑選一個點,由分類器給出的分數比從反類樣本(健康)中隨機挑選一個點的分數更高的概率[21-24];可以被解釋為評估正例樣本的排名[25]。本研究所訓練支持向量機模型的AUC為1.000,說明所有正類點的分數高于所有反類點?;诖耍狙芯空J為對于所得不平衡的缺血性腦卒中數據集,使用AUC進行模型選擇比使用精度更有意義。本研究最終從數理方向論證支持向量機為最優(yōu)缺血性腦卒中風險預測模型,所構建模型具有較高的準確性,在一定程度上極大地確保了本研究的完備性及可靠性,提高了最初無癥狀人群中缺血性腦卒中預測干預的準確性。

        4 結論

        本研究所構建的基于現階段的符合我國國情的缺血性腦卒中風險預測模型可在源頭上控制缺血性腦卒中發(fā)病率,并通過采取及時且準確的干預措施,極大程度地確保國民的健康。

        猜你喜歡
        貝葉斯分類器缺血性
        缺血性二尖瓣反流的研究進展
        針灸在缺血性視神經病變應用
        BP-GA光照分類器在車道線識別中的應用
        電子測試(2018年1期)2018-04-18 11:52:35
        貝葉斯公式及其應用
        加權空-譜與最近鄰分類器相結合的高光譜圖像分類
        結合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
        基于貝葉斯估計的軌道占用識別方法
        缺血性腦卒中恢復期的中蒙醫(yī)康復治療
        一種基于貝葉斯壓縮感知的說話人識別方法
        電子器件(2015年5期)2015-12-29 08:43:15
        內皮祖細胞在缺血性腦卒中診治中的研究進展
        成人做受黄大片| 亚洲中文字幕日产喷水| 中文字幕无码免费久久9| 91在线观看国产自拍| 久久成人精品国产免费网站| 在线观看国产视频午夜| 激情综合色综合啪啪开心| 亚洲熟妇少妇任你躁在线观看无码 | 91精品国产综合久久久蜜臀九色 | 就爱射视频在线视频在线| 久久久亚洲av波多野结衣| 欧洲vat一区二区三区| 亚洲av纯肉无码精品动漫| 人妻少妇精品无码专区二| 久久99久久99精品免视看国产成人| 天堂av中文在线官网| 国产精品熟女少妇不卡| 国产特级毛片aaaaaa高潮流水| 国产又色又爽又黄的| 无码a∨高潮抽搐流白浆| 色丁香在线观看| 嗯啊 不要 啊啊在线日韩a| 国产精品一品二区三区| 在线日本看片免费人成视久网 | 精品国模一区二区三区| 中文字幕第一页亚洲| 91精品综合久久久久m3u8| 天堂a版一区二区av| 国产乱淫h侵犯在线观看| 人人妻人人澡人人爽国产| 大肉大捧一进一出好爽视频| 欧美喷潮久久久xxxxx| 日本一区二区三区激情视频| 青青草视全福视频在线| 麻豆精品一区二区三区| 久久无码字幕中文久久无码 | 久久亚洲av无码精品色午夜| 99亚洲男女激情在线观看| 国产亚洲日韩欧美一区二区三区 | av在线免费观看你懂的| 免费观看在线视频播放|