亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學(xué)習(xí)預(yù)測自發(fā)性腦出血血腫擴大研究

        2022-06-22 08:05:24袁偉侯文仲王倩莊堅偉謝國喜陳向林
        廣東藥科大學(xué)學(xué)報 2022年3期
        關(guān)鍵詞:學(xué)習(xí)機決策樹血腫

        袁偉,侯文仲,王倩,莊堅偉,謝國喜,陳向林*

        (1.廣州醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院生物醫(yī)學(xué)工程系,廣東 廣州 511436;2.廣州醫(yī)科大學(xué)附屬第六醫(yī)院腦血管病科,廣東 清遠 511518)

        自發(fā)性腦出血是指非創(chuàng)傷性的腦實質(zhì)內(nèi)或非腦室系統(tǒng)局灶性的血液集聚并多伴隨快速進展的神經(jīng)功能障礙[1-2]。其在腦卒中各亞型中的發(fā)病率僅次于缺血性腦卒中,位居第二,約占所有卒中的10%~15%,是一種高致死致殘的疾患[3]。在早期約有30%的患者會出現(xiàn)血腫增大,并且致死致殘率會有明顯的上升。盡管存在一些爭議[2],但一般認為血腫體積增大13%~32%會明顯引起預(yù)后向更差的方向發(fā)展[4]。同時有學(xué)者研究證實針對有血腫增大風(fēng)險的患者進行早期干預(yù)可以降低血腫增大的發(fā)生幾率[5-6]。

        目前預(yù)測腦血腫擴大概率的方法有“9 分評分”“BRAIN 評分”“BAT 評分”“NAG 評分”等多種評分模型。最為常用的BRAIN 評分是由學(xué)者Wang[7]在2014年提出,評分項包括基線腦出血量(B)、復(fù)發(fā)性腦出血(R)、使用華法林抗凝(A)、腦室出血(I)和從發(fā)病至CT 時間(N)5 項,總分最高24 分,如表1 所示。其基于一項前瞻性大樣本研究,隨著分數(shù)的增加伴隨著腦血腫擴大的可能性上升,0~24分的血腫擴大概率為3.4%~85.8%。BRAIN 評分對腦出血患者血腫擴大具有較好預(yù)測效能。

        表1 BRAIN評分量表Table 1 BRAIN rating scale

        但BRAIN 評分也存在一定的局限性。BRAIN評分標準提出者只是寬泛地給出了0~24 分的血腫擴大概率范圍,而在實際應(yīng)用中,計算出某位病人BRAIN 評分后,參照這個結(jié)論也無法準確地獲得血腫擴大的具體概率值,臨床應(yīng)用具有局限性。而其他研究者,如王永平等[8]根據(jù)收集的111例病人數(shù)據(jù)進行血腫擴大概率計算,結(jié)果為0%~62.9%,與BRIAN 結(jié)論不同。學(xué)者Joshua[9]統(tǒng)計的122 位病人的BRAIN 血腫擴大概率為11%~57%,也與其結(jié)論存在較大的差異?;谏鲜龅囊蓡枺芯繄F隊對該中心部分病人使用金標準(即24 h 內(nèi)2 次CT 檢查,且血腫擴大體積超過6 mL)確定血腫擴大與否,得到的血腫擴大概率為25.0%~72.8%,與BRAIN 評分結(jié)果差異性較大。因此,如果本研究采集的樣本數(shù)據(jù)直接采用BRAIN 作者的血腫擴大概率結(jié)論來預(yù)測血腫擴大發(fā)生的可能性,會產(chǎn)生較大的誤判,指導(dǎo)臨床診斷會有一定的錯誤,不利于后續(xù)治療的進行。此外,因為很多臨床醫(yī)生在實際使用時會將0~24 的評分劃分為0~5、6~9、10~11、12~244 個區(qū)間段,分別計算每個區(qū)間對應(yīng)的血腫擴大概率,具體病人根據(jù)所屬區(qū)間段確定血腫擴大的可能性[8-9]。但是因為樣本空間的問題,不同單中心計算的區(qū)間血腫概率也存在很大的差異,直接參看相互結(jié)論會造成大概率的誤診??梢夿RAIN 評分非常依賴研究對象本身的樣本特點,因此使用時不應(yīng)參照已有的研究結(jié)果,應(yīng)該根據(jù)本中心的數(shù)據(jù),獨立地進行0~24分的概率值或者概率區(qū)間的統(tǒng)計,同時應(yīng)留意樣本數(shù)據(jù)的增加,及時進行重新統(tǒng)計,確保結(jié)論的準確性。

        相比于BRAIN評分,血腫擴大的金標準雖然檢測手段單一,但是因為資源的限制,并且2 次CT 檢查間隔需要一定的時間,期間病人的病情會發(fā)生劇烈的變化,因此,常常希望借助已有的常規(guī)檢查數(shù)據(jù)在第1 次CT 檢查后就能得出病人血腫擴大的可能性,以為及時正確的治療方案提供幫助。但是BRAIN 評分又有一定的不足?;谏鲜龅膯栴},本研究使用支持向量機、邏輯回歸、決策樹和極限學(xué)習(xí)機4 種自動預(yù)測模型進行血腫擴大的分類,對比BRAIN 評分結(jié)果的優(yōu)劣,預(yù)期在訓(xùn)練精度、測試精度、敏感性、特異性、模型的實時訓(xùn)練提升等指標上獲得提高,同時減輕醫(yī)生的計算負擔(dān),更好地輔助臨床的診斷和治療。

        1 對象與方法

        1.1 對象

        回顧性連續(xù)納入廣州醫(yī)科大學(xué)附屬第六醫(yī)院2015 年1月至2019 年12月期間腦科住院的自發(fā)性腦出血患者150例。其中男性98例,女性52例。本研究遵守赫爾辛基宣言,并獲得廣州醫(yī)科大學(xué)附屬第六醫(yī)院倫理委員會的批準,每位參與研究的對象均簽署了知情同意書。

        納入標準:(1)腦出血診斷符合2019 年中國腦出血診治指南修訂的腦出血診斷標準;(2)發(fā)病6 h內(nèi)首次行頭部CT;(3)發(fā)病24 h 內(nèi)完成頭部CT 復(fù)查。排除標準:(1)既往發(fā)生顱內(nèi)出血;(2)單純的腦室出血(不伴有明顯的腦實質(zhì)出血)、腦干出血、蛛網(wǎng)膜下腔出血、硬膜下血腫、硬膜外血腫及腦梗死后出血等;(3)因血液系統(tǒng)疾病導(dǎo)致的腦出血或其他原因不明的腦出血。

        1.2 研究方法

        1.2.1 資料收集 基線數(shù)據(jù)收集 患者的年齡、性別、居住地、種族、出生日期(可用身份證信息識別)。其他一般病史相關(guān)資料,包括既往有無高血壓史、糖尿病、吸煙、酗酒、相關(guān)其他遺傳病史及家族史、手術(shù)史、藥物治療史,過敏史以及其他特殊疾病史。

        所有自發(fā)性腦出血患者入院的生命體征,包括體溫、血壓、脈搏及呼吸次數(shù),其中血壓記錄最重要,包括收縮壓及舒張壓數(shù)值。患者入院時的格拉斯哥昏迷量表評分(GCS)標準包括睜眼、語言、運動反應(yīng),最高分為15分。目的是準確判斷自發(fā)性腦出血患者入院時意識障礙程度,分數(shù)越低意識障礙越重。

        影像學(xué)資料收集:收集發(fā)病后6 h 內(nèi)的首次CT和發(fā)病后24 h內(nèi)2次復(fù)查CT資料,包括初始血腫體積、增大后血腫體積。血腫體積計算由廣州醫(yī)科大學(xué)附屬第六醫(yī)院2名影像科醫(yī)師獨立閱片并出具書面報告結(jié)果。計算方法是根據(jù)多田公式計算得出,公式為:V(出血量)=即血腫體積=(A×B×C)/2[10],其中A:最大血腫面積層面血腫的最長徑,B:最大血腫面積層面上與最長徑垂直的橫徑,C:CT片中出現(xiàn)出血的厚度,長度計算方式為:層厚×層面數(shù),實際應(yīng)用中組織層厚常設(shè)為5 mm。血腫擴大定義為血腫體積較前增加超過6 mL,并將其作為血腫擴大的金標準。所有患者的原始DICOM 圖像均由GE 公司的64排螺旋CT掃描完成,層厚為5 mm。

        高血壓病定義為:既往確診高血壓病史,或收縮壓≥140 mmHg,或舒張壓≥90 mmHg,或使用降壓藥物。吸煙的定義為:吸煙≥1 支/天。飲酒的定義為:任意的酒精攝入≥1 次/周[11]。

        最終確定納入數(shù)據(jù)分析的檢測項目包括:性別、吸煙史、飲酒史、使用華法林抗凝、抗血小板、破入腦室、年齡、GCS、入院收縮壓、入院舒張壓、急診血壓、急舒張壓、血糖(Glu)、總膽固醇(TC)、三酰甘油(TG)、高密度脂蛋白膽固醇(HDL-C)、低密度脂蛋白膽固醇(LDL-C)、活化部分凝血活酶時間(APTT)、凝血酶原時間(PT)、國際標準化比值(INR)、血紅蛋白(Hb)、血小板計數(shù)(PLT)、血鈣(Ca)、初始血腫體積、發(fā)病至首次CT 檢查時間??偣?5項。

        1.3 自動預(yù)測模型簡介

        1.3.1 支持向量機 支持向量機由Cortes和Vapnik[12]于1995年提出,是一種二分類模型。它的基本思想是求解特征空間上正確劃分訓(xùn)練數(shù)據(jù)集的唯一分離超平面,并且使得距離超平面最近的異類樣本之間的間隔最大化??尚问交癁橐粋€求解凸二次規(guī)劃問題[13-14]。一般分離超平面被定義為:

        對于給定的超平面樣本點(xi,yi)來說,只需根據(jù)公式(2),(3)計算得到w和b的值,超平面即可確定:

        其中:λi為拉格朗日乘子,S為假設(shè)的支持向量個數(shù)[15]。

        支持向量機是在包括醫(yī)療領(lǐng)域在內(nèi),廣泛使用的數(shù)據(jù)分類方法[16-17]。根據(jù)本研究的數(shù)據(jù)特點,參數(shù)設(shè)置時懲罰系數(shù)的取值為0.1;核函數(shù)選取為線性(linear);正則化時采用L2 正則化,即直接在原來的損失函數(shù)基礎(chǔ)上加上權(quán)重參數(shù)的平方和;誤差項達到指定值時則停止訓(xùn)練參數(shù)為0.001;默認所有類權(quán)重值相同。

        1.3.2 邏輯回歸 邏輯回歸又稱為邏輯回歸分析,是一種廣義線性回歸分類模型,目標是通過一組變量的組合使得預(yù)測結(jié)果的概率最大化[18]。

        邏輯回歸采用對數(shù)似然損失函數(shù)(代價函數(shù))[19]:

        預(yù)測函數(shù)為:

        使用梯度下降算法進行邏輯回歸模型參數(shù)的更新:

        其中:α為懲罰系數(shù),調(diào)節(jié)懲罰項的大小。

        邏輯回歸具有簡單高效、并行性、解釋性好以及方便擴展等優(yōu)點,被廣泛地應(yīng)用于醫(yī)學(xué)數(shù)據(jù)分類任務(wù)[20-23]。本研究中正則化系數(shù)取值為0.00001;正則化時采用L1正則化,即直接在原來的損失函數(shù)基礎(chǔ)上加上權(quán)重參數(shù)的絕對值;誤差項達到指定值時則停止訓(xùn)練參數(shù)大小為0.0001;最大迭代次數(shù)為1000。

        1.3.3 決策樹 決策樹是一種基于if-then-else 規(guī)則的有監(jiān)督分類學(xué)習(xí)算法,采用樹形結(jié)構(gòu),使用層層推理來實現(xiàn)最終的分類。一般由根節(jié)點(包含樣本的全集)、內(nèi)部節(jié)點(對應(yīng)特征屬性測試)和葉節(jié)點(代表決策的結(jié)果)3 個元素構(gòu)成。決策樹的生成通常有3 個步驟:特征選擇、決策樹的生成、決策樹的修剪。

        1、特征選擇

        “佳禾農(nóng)資不管發(fā)展到多大規(guī)模,永遠不離開農(nóng)業(yè),離不開農(nóng)村。我們種地就是為農(nóng)民打工?!彼硎?,作為一個負責(zé)任的化肥貿(mào)易商、生產(chǎn)商,通過整合農(nóng)業(yè)生產(chǎn)各要素,輸出種植模式,才能更好地為農(nóng)業(yè)服務(wù),使自身的經(jīng)營工作更接地氣、更加穩(wěn)健,從而才能把佳禾打造成一個基業(yè)長青的“百年老店”。

        在訓(xùn)練數(shù)據(jù)集中,每個樣本的屬性可能有很多個,不同屬性的作用大小不同。通常使用“信息增益”篩選出與分類結(jié)果相關(guān)性較高的特征,也就是分類能力較強的特征,公式(7)。

        其中,pk為當前樣本集D中第k類樣本所占的比例。K為類別的總數(shù)。

        2、決策樹生成

        特征選定,就可以從根節(jié)點觸發(fā),計算所有節(jié)點特征的信息增益,選擇信息增益最大的特征作為節(jié)點特征,再根據(jù)該特征的不同取值建立子節(jié)點,并對每個子節(jié)點使用相同的方式生成新的子節(jié)點,直到信息增益很小或者沒有特征可以選擇為止。

        3、決策樹剪枝

        防止算法過擬合,去掉部分分支來降低過擬合的風(fēng)險。

        決策樹是最簡單的機器學(xué)習(xí)算法,它易于實現(xiàn),可解釋性強,完全符合人類的直觀思維,在金融決策、醫(yī)療診斷領(lǐng)域有著廣泛的應(yīng)用[24-25]。

        1.3.4 極限學(xué)習(xí)機 極限學(xué)習(xí)機是一種用來訓(xùn)練單隱藏層前饋神經(jīng)網(wǎng)絡(luò)算法[26]。根據(jù)插值定理和普通極限定理推導(dǎo)可知,只要激活函數(shù)無限可微,當隱含層神經(jīng)元數(shù)等于訓(xùn)練樣本數(shù)時,單隱藏層前饋神經(jīng)網(wǎng)絡(luò)可以零誤差逼近訓(xùn)練樣本,且與隱含層輸入權(quán)值wi和閾值bi的選取無關(guān)[27]。

        極限學(xué)習(xí)機的輸入層權(quán)值和閾值采用隨機選取方式產(chǎn)生,并且不需要人為設(shè)置網(wǎng)絡(luò)初始權(quán)值和初始閾值等參數(shù),大大提高了訓(xùn)練速度,同時克服了過擬合問題。

        “廣義”的單隱藏層前饋神經(jīng)網(wǎng)絡(luò)極限學(xué)習(xí)機的輸出表示為[28]:

        其中:L為節(jié)點數(shù)目,β是隱藏層與輸出層之間的輸出權(quán)重,hi(x)是第i個隱藏層節(jié)點的輸出,H(x)是隱藏層輸出矩陣。在實驗中設(shè)置的神經(jīng)元數(shù)為120,與訓(xùn)練樣本數(shù)相同。

        近些年極限學(xué)習(xí)機在醫(yī)學(xué)領(lǐng)域得到廣泛的使用,Hu 等[29]使用深度CNN 和極限學(xué)習(xí)機器從X 射線圖像中進行實時COVID-19 的診斷,徐丹使用極限學(xué)習(xí)機進行乳腺腫瘤識別和診斷[30],王之瓊等[31]利用基于極限學(xué)習(xí)機算法進行輕度認知障礙的輔助診斷,都取得了比較好的效果。

        1.4 統(tǒng)計學(xué)分析

        應(yīng)用SPSS 26 軟件對數(shù)據(jù)進行統(tǒng)計分析,采用多因素logistic 回歸統(tǒng)計樣本的基本數(shù)據(jù),并進行血腫擴大的影響因素及其共線性分析,見表2。其中性別使用女性作為統(tǒng)計參考類別;吸煙史、飲酒史、抗凝、抗血小板、破入腦室使用陰性作為統(tǒng)計參考類別。根據(jù)BRAIN 評分標準(24 分制,見表1),統(tǒng)計每位病人包括基線腦出血量(B)、復(fù)發(fā)性腦出血(R)、使用華法林抗凝(A)、腦室出血(I)和從發(fā)病至CT 時間(N)在內(nèi)的5 個指標,給出BRAIN 評分結(jié)果。將0~24 的評分劃分為0~5、6~9、10~11、12~244 個區(qū)間段,對應(yīng)CT 檢測金標準分別計算每個區(qū)間對應(yīng)的血腫擴大、非血腫擴大以及血腫擴大的概率。應(yīng)用受試者工作特征曲線(receiver operating characteristic curve, ROC)評估BRAIN 評分對血腫擴大的預(yù)測結(jié)果,計算其敏感度、特異度,以及曲線下面積(area under the curve,AUC)數(shù)值,以P<0.05為差異有統(tǒng)計學(xué)意義。

        支持向量機、邏輯回歸、決策樹與極限學(xué)習(xí)機4種算法是在基于python3.6,tensorflow1.2.0 版本Pycharm 軟件下編程實現(xiàn)的。電腦配置為Intel(R)Xeon(R)CPU E3-1225 v6@3.30GHz,RAM 12.0GB。隨機抽取80%(120 個樣本)形成訓(xùn)練集,剩余20%(30 個樣本)為測試集。算法訓(xùn)練時采用10 折交叉驗證,取平均值作為結(jié)果。最后統(tǒng)計4 種算法的訓(xùn)練精度和測試精度、敏感度、特異性和ROC 曲線以及AUC值。

        2 結(jié)果

        2.1 腦出血血腫擴大的危險因素分析

        根據(jù)統(tǒng)計結(jié)果(P<0.05),150 例腦出血患者中65例(43.33%)出現(xiàn)血腫擴大,85例(56.67%)未出現(xiàn)血腫擴大。吸煙史、使用華法林抗凝、抗血小板、GCS 評分、均有統(tǒng)計學(xué)意義,為血腫擴大的獨立影響因素。其中吸煙的患者比不吸煙的患者血腫擴大概率增加1.925 倍;使用了華法林抗凝比未使用的情況血腫擴大概率增加14.50 倍;使用抗血小板后血腫擴大的概率會比未使用的情況增加9.97 倍;GCS 評分增加一個級別,血腫擴大概率下降為73.1%,即較低的GCS 評分與血腫擴大顯著相關(guān)。對上述因素進行共線性分析,吸煙史、使用華法林抗凝、抗血小板、GCS 評分的方差膨脹因子(VIF)分別為1.695、1.373、1.785 和1.710,容差分別為0.590、0.729、0.560 和0.585。膨脹因子均小于10,同時容差均大于0.1,各因素之間無共線,均為獨立危險因素,見表2。

        表2 患者臨床資料統(tǒng)計結(jié)果Table 2 Statistical results of clinical data of patients

        剩余的因素均無顯著性(P>0.05),是血腫擴大的非獨立因素。其中與血腫擴大概率增大正相關(guān)的因素為“性別”“破入腦室”“年齡”“入院舒張壓”“急舒張壓”“血糖”“總膽固醇”“三酰甘油”“國際標準化比值INR”“血小板計數(shù)”。與血腫擴大概率增大負相關(guān)的因素為“飲酒史”“入院收縮壓”“急診血壓”“高密度脂蛋白膽固醇”“低密度脂蛋白膽固醇”“活化部分凝血活酶時間”“凝血酶原時間”“血紅蛋白”“血鈣”“初始血腫體積”和“發(fā)病至首次CT 檢查時間”。共線性分析顯示,所有因素的膨脹因子也均小于10,且容差均大于0.1,各因素之間無共線,是影響血腫擴大的必要因素。

        2.2 自動預(yù)測模型與BRAIN評分對比

        單獨對BRAIN 評分進行分析,所有樣本的BRAIN 評分平均值為8.65(標準誤差0.041),顯著性小于0.01,且評分值增加一個等級血腫擴大概率增加1.18倍。ROC曲線結(jié)果顯示,BRAIN評分預(yù)測血腫擴大的敏感度為56.9%,特異性為74.1%,曲線下面積為0.706,95%CI 為: 0.62~0.79,見表3、圖1。根據(jù)BRAIN 評分標準,0~5、6~9、10~11、12~244 個區(qū)間的實際血腫擴大概率分別為25%(11/44)、36.2%(17/47)、45.5%(10/22)、72.8%(27/37),見表4。結(jié)果顯示隨著BRAIN 的評分增加血腫擴大率有明顯的上升趨勢,但是較低分數(shù)段的血腫擴大概率高于以往研究結(jié)論(0~24 分的血腫擴大概率為3.4%~85.8%)[7]。

        圖1 BRAIN 評分預(yù)測血腫擴大的受試者工作特征曲線Figure 1 ROC curve of BRAIN score prediction model

        表3 BRAIN 評分的logistic回歸分析Table 3 Logistic regression analysis of BRAIN score

        表4 BRAIN評分區(qū)間實際血腫擴大和非血腫擴大的統(tǒng)計結(jié)果Table 4 Statistical results of actual hematoma enlargement and non-hematoma enlargement in BRAIN score range

        從4 種算法之間的對比來看,決策樹模型雖然在訓(xùn)練精度和敏感度上分別達到了93.33% 和80.00%,高于支持向量機和邏輯回歸模型,但是在測 試 精 測(66.67%)、特 異 性(53.33%)和AUC(0.667)3 個指標中都是4 種算法最差的。支持向量機與邏輯回歸模型的5項指標非常接近。最好的模型為極限學(xué)習(xí)機,它的訓(xùn)練精度為99.25%,測試精度為93.33%,敏感度為98.50%,特異性為85.90%,AUC為0.926,所有指標都是4種算法中最優(yōu)的。可見目前作為主流的神經(jīng)網(wǎng)絡(luò)方法優(yōu)于傳統(tǒng)的統(tǒng)計學(xué)分類方法,能夠?qū)W習(xí)更為復(fù)雜的樣本數(shù)據(jù),也說明其廣泛應(yīng)用于醫(yī)學(xué)數(shù)據(jù)分類任務(wù)的合理性,見表5。圖2可以直觀看到4種算法的ROC對比圖。

        表5 4種自動預(yù)測模型間的指標對比Table 5 Index comparison among four automatic prediction models

        圖2 4種自動預(yù)測模型血腫擴大的受試者工作特征曲線Figure 2 ROC curve of four automatic prediction models

        將4 種算法與BRAIN 評分進行對比,決策樹在特異性、AUC 兩個指標以及邏輯回歸模型的特異性一個指標比BRAIN 評分稍差,其他結(jié)果都高于BRAIN 評分??傮w而言,支持向量機、邏輯回歸和極限學(xué)習(xí)機都優(yōu)于BRAIN評分,尤其是極限學(xué)習(xí)機模型,敏感度、特異性、AUC 3項指標都遠超BRAIN評分。這也說明按照金標準統(tǒng)計出的BRAIN 0~24分血腫擴大概率值,用來評判新的數(shù)據(jù),在準確度上遜色于機器學(xué)習(xí)算法,反映出BRAIN評分標準設(shè)計合理性欠缺。

        此外,本研究也對比了不同研究者BRAIN區(qū)間概率統(tǒng)計結(jié)果的差異性。表6 提供了學(xué)者王永平[8]和Joshua[9]各自給出的BRAIN 區(qū)間血腫擴大概率值,同時也計算了本研究150 例病人在金標準下實際的區(qū)間血腫概率擴大值,并且對比了4 種算法按照BRAIN 評分區(qū)間各自預(yù)測的血腫擴大概率結(jié)果(樣本數(shù)據(jù)中每個區(qū)間隨機抽取20%樣本數(shù)據(jù)進行預(yù)測)。從中可以看出,兩位學(xué)者統(tǒng)計的BRAIN 4個區(qū)間的血腫擴大概率值與本中心實際血腫擴大的概率值差距較遠,也與BRAIN評分提出者給的結(jié)論不同,說明4個研究中的數(shù)據(jù)差異較大,無法直接作為結(jié)論相互參看。而如果使用4種血腫擴大的自動預(yù)測模型進行BRAIN 區(qū)間的血腫擴大概率計算會發(fā)現(xiàn),支持向量機、邏輯回歸和決策樹3種模型只是在0~5 范圍預(yù)測血腫擴大概率相對誤差稍大(其中邏輯回歸模型預(yù)測概率相對較好,為18.2%,實際血腫擴大概率為25.0%)。隨著BRAIN 評分區(qū)間的提高,3 種算法的預(yù)測血腫擴大概率都與實際金標準值逐漸接近。當為最大值區(qū)間12~24 時,基本和實際血腫擴大概率值相同,其中支持向量機模型預(yù)測結(jié)果與實際血腫擴大概率完全吻合(實際血腫擴大概率為72.8%),而決策樹相對差一些。單獨分析極限學(xué)習(xí)機模型,其在BRAIN 評分的4 個區(qū)間內(nèi),都可以準確地預(yù)測血腫擴大的概率,與實際金標準統(tǒng)計結(jié)論的情況非常接近。相比BRAIN模型,預(yù)測血腫發(fā)生概率更符合樣本采集醫(yī)院的實際情況,預(yù)測的結(jié)果也更加準確,屬于4種模型中最好的。

        表6 4種自動預(yù)測模型在BRAIN評分區(qū)間預(yù)測血腫擴大概率的對比結(jié)果Table 6 Comparison results of four automatic prediction models in predicting hematoma expansion probability in BRAIN score interval %

        另外,4 種算法都可以保存以往的訓(xùn)練模型,當新的樣本數(shù)據(jù)加入,可以自動地進行血腫擴大的判定,減輕了醫(yī)護人員的負擔(dān)。表7 列舉了支持向量機、邏輯回歸、決策樹和極限學(xué)習(xí)機在進行模型訓(xùn)練和測試新增單一數(shù)據(jù)時的運行時間。不同于BRAIN 評分標準的較長計算時間,只有極限學(xué)習(xí)機的訓(xùn)練時間為18.902 s,其余時間均在1 s 以下。日后當病例數(shù)據(jù)增加時動態(tài)地進行模型的重新訓(xùn)練也非常的省時,也能使得模型更為貼合研究所在醫(yī)院的實際血腫擴大概率分布特點。

        表7 4種自動預(yù)測模型的模型訓(xùn)練與新樣本血腫擴大概率判別時間對比Table 7 Comparison between model training time of four automatic prediction models and evaluating time of hematoma enlarge‐ment probability of new samples

        3 討論

        腦出血具有較高發(fā)病率、病死率、致殘率的特點。血腫擴大是腦出血急性期較為常見現(xiàn)象,也是不良預(yù)后的重要危險因素。因此,發(fā)現(xiàn)靈敏準確的血腫擴大概率的預(yù)測模型,盡早識別腦出血患者中血腫擴大的高危人群,成為目前該領(lǐng)域研究的重點問題。

        本研究根據(jù)多因素logistic 回歸統(tǒng)計分析,得出吸煙史、使用華法林抗凝、抗血小板、GCS 評分為血腫擴大的獨立因素,在血腫擴大概率評判時應(yīng)該作為重點因素考慮。同時本研究對比了BRAIN 評分模型與支持向量機、邏輯回歸、決策樹和極限學(xué)習(xí)機這4 種自動預(yù)測模型的優(yōu)缺點。測試結(jié)果也顯示,無論從訓(xùn)練精度、測試精度、到敏感性、特異性和ROC 曲線下面積,支持向量機、邏輯回歸和極限學(xué)習(xí)機3 種算法都優(yōu)于BRAIN 評分標準,尤其是極限學(xué)習(xí)機模型,各項結(jié)果都非常的優(yōu)異。并且當數(shù)據(jù)量增加時,極短的運行時間,自動地進行模型的訓(xùn)練,都使得模型的調(diào)整成為可能,而傳統(tǒng)的BRAIN 評分的區(qū)間統(tǒng)計方式是不具備這樣的優(yōu)勢的。

        分析上述預(yù)測模型優(yōu)略的原因,主要的因素在于BRAIN評分的分數(shù)取值為離散值,并且各個因素的取值大小也是作者的經(jīng)驗考慮,沒有能夠進行精確的數(shù)學(xué)建模和計算,自然精準性就差一些,同時該模型也只是考慮了血腫擴大的5個因素,而廣泛的研究顯示影響血腫擴大的因素并非只有這5個指標,因此該評分標準與血腫擴大的關(guān)聯(lián)性就不夠全面。

        而4種自動預(yù)測模型將與血腫擴大相關(guān)的獨立和非獨立因素全部納入到預(yù)測模型的輸入變量中,根據(jù)數(shù)學(xué)的統(tǒng)計算法和神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機制,客觀的進行血腫擴大概率的學(xué)習(xí)和識別,自然可以得到相對較好的判別結(jié)果。支持向量機、邏輯回歸、決策樹屬于傳統(tǒng)的機器學(xué)習(xí)模型,它們是根據(jù)具體的算法規(guī)則進行血腫擴大的預(yù)測,一些特異性的數(shù)據(jù)在“規(guī)則”下是無法正確地評判的。而極限學(xué)習(xí)機算法屬于神經(jīng)網(wǎng)絡(luò)模型的一種,具備處理線性不可分的問題,并且更精準,容錯性更好。在學(xué)習(xí)過程中,神經(jīng)網(wǎng)絡(luò)能夠從輸入數(shù)據(jù)中挖掘更多的信息,完成更復(fù)雜的任務(wù)。因此非常適合學(xué)習(xí)非線性、高緯度、復(fù)雜的樣本數(shù)據(jù),掌握區(qū)分是否血腫擴大的特征,得到了最優(yōu)的結(jié)果。這也是目前在醫(yī)學(xué)數(shù)據(jù)分析中大量引入神經(jīng)網(wǎng)絡(luò)的原因。因此根據(jù)腦血腫擴大預(yù)測指標的特點,建議臨床醫(yī)生在選擇自動預(yù)測模型時使用極限學(xué)習(xí)機模型。

        本研究也具有一定的局限性,如所有模型的測試精度都稍差于訓(xùn)練精度,造成的原因是樣本量太少,測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)不完全一致,模型訓(xùn)練后始終無法對少量測試數(shù)據(jù)進行識別。應(yīng)該在今后的研究中不斷的加大樣本數(shù)據(jù)量。此外,樣本量的不足也造成了采用多因素logistic 回歸進行數(shù)據(jù)統(tǒng)計時,飲酒史對于血腫擴大的影響并沒有正確的體現(xiàn)出來,而在很多研究中這個因素都被認定為影響血腫擴大的獨立影響因素。

        4 結(jié)論

        綜上所述,本研究引入支持向量機、邏輯回歸、決策樹和極限學(xué)習(xí)機這4種自動預(yù)測模型來進行血腫擴大概率的預(yù)測分析,在多個指標對比中都優(yōu)于傳統(tǒng)的BRAIN 評分標準,尤其是極限學(xué)習(xí)機模型,各項結(jié)果都非常的優(yōu)異。并且模型可以動態(tài)地學(xué)習(xí)和調(diào)整樣本數(shù)據(jù),進一步提高了預(yù)測準確性,能夠得出更為準確的血腫擴大預(yù)測結(jié)果,為臨床醫(yī)生的后續(xù)診斷和治療提供幫助。

        猜你喜歡
        學(xué)習(xí)機決策樹血腫
        頭皮血腫不妨貼敷治
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        極限學(xué)習(xí)機綜述
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于極限學(xué)習(xí)機參數(shù)遷移的域適應(yīng)算法
        分層極限學(xué)習(xí)機在滾動軸承故障診斷中的應(yīng)用
        慢性硬膜下血腫術(shù)后血腫復(fù)發(fā)的相關(guān)因素研究
        基于決策樹的出租車乘客出行目的識別
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        問題2:老年患者中硬膜外血腫的手術(shù)指征?
        特级毛片a级毛片100免费播放| 韩国日本在线观看一区二区| 国产诱惑人的视频在线观看| 国产亚洲精品美女久久久久| 国产一区二区内射最近更新 | 欧美日韩综合网在线观看| 一本色道久久综合狠狠躁中文| 国产美女高潮流白浆视频| 摸丰满大乳奶水www免费| 亚洲精品无码久久久久| 国产亚洲欧洲AⅤ综合一区| 精品国产精品久久一区免费| 久久久久久久久无码精品亚洲日韩 | 国产亚洲一区二区精品| 日本丰满老妇bbw| 内谢少妇xxxxx8老少交| 男女好痛好深好爽视频一区| 国产超碰在线91观看| 日韩 无码 偷拍 中文字幕| 亚洲av无码专区在线电影| 911国产在线观看精品| av国产自拍在线观看| 久久精品国产99国产精偷| 女人夜夜春高潮爽a∨片| 国产自精品在线| 国产一区二区三区成人| 情人伊人久久综合亚洲| 五月天激情小说| 一本大道久久精品一本大道久久| 在线观看麻豆精品视频| 影音先锋女人aa鲁色资源| 毛片毛片免费看| 国产高清自产拍av在线| 蜜臀久久99精品久久久久久| 依依成人精品视频在线观看| 91精品综合久久久久m3u8| 丝袜美腿制服诱惑一区二区| av无码av天天av天天爽| 久久国产精品不只是精品 | 免费在线视频一区| 亚洲大胆视频在线观看|