楊凱 白映紅 王智 房建忠 郝解賀
【摘要】 目的 通過無監(jiān)督機器學習算法將自發(fā)性腦出血分為不同的類型,評估急性期可能出現(xiàn)血腫擴大的患者。方法 收集2018年7月—2020年12月晉中市第一人民醫(yī)院收治的348例自發(fā)性腦出血患者的臨床資料和影像學數(shù)據(jù),采用3D Slicer軟件描記血腫并提取影像學特征,使用無監(jiān)督學習算法將這些患者分為不同的類型。不同分型間進行了臨床基線特征、是否出現(xiàn)血腫擴大和患者預后的比較。結(jié)果 最終共選定166個特征,包括54個臨床特征和112個影像學特征,通過無監(jiān)督學習方法分為A、B、C、D、E 5個不同的分型,不同分型間比較提示有多個特征存在顯著差異(P<0.05),其中D型和E型發(fā)生血腫擴大的比例較高。與未發(fā)生血腫擴大相比,發(fā)生血腫擴大的患者入院時GCS評分低(t=2.214 4,P<0.05),初次頭顱CT檢查的血腫量較大(t=3.940 7,P<0.05),中線結(jié)構(gòu)移位明顯(t=2.001 3,P<0.05),預后更差(t=4.953 4,P<0.05)。結(jié)論 首次頭顱CT檢查顯示出血量偏大、中線移位明顯、GCS評分低的自發(fā)性腦出血患者發(fā)生血腫擴大的可能性大、預后差。可以通過整合臨床資料和頭顱CT影像數(shù)據(jù),使用無監(jiān)督學習算法對自發(fā)性腦出血患者進行分型,輔助臨床預測及判斷。
【關(guān)鍵詞】 腦出血;血腫擴大;機器學習;無監(jiān)督學習
【中圖分類號】 R651 【文獻標志碼】 A 【文章編號】 1672-7770(2023)02-0141-06
Abstract: Objective To classify spontaneous intracerebral hemorrhage(SICH) into different types to assess patients who may experience hematoma enlargement during the acute phase by using unsupervised machine learning algorithms. Methods The clinical data and imaging data of 348 patients with SICH who hospitalized in the First People's Hospital of Jinzhong from July 2018 to December 2020 were collected. By 3D Slicer software,the hematoma was recorded and the imaging features were extracted. Then unsupervised learning algorithm was used to categorize these patients by similarities in clinical and imaging parameters. Results A total of 166 features, including 54 clinical features and 112 imaging features were selected. Through unsupervised learning, five different types of ABCDE were classified. The comparison between different types suggested significant differences in multiple characteristics(P<0.05), with a higher proportion of hematoma enlargement occurring in type D and type E. Compared with patients without hematoma enlargement, patients with hematoma enlargement had a lower GCS score on admission(t=2.214 4,P<0.05), a larger hematoma volume on initial head CT examination(t=3.9407,P<0.05), a significant displacement of the midline structure(t=2.001 3,P<0.05), and a worse prognosis(t=4.953 4,P<0.05). Conclusions The first cranial CT scan showed that patients with SICH who have a large amount of bleeding, significant midline displacement, and low GCS score have a higher probability of hematoma expansion and a poor prognosis. By integrating clinical data and skull CT image data, unsupervised learning algorithms can be used to classify patients with spontaneous cerebral hemorrhage to assist in clinical prediction and judgment.
Key words: spontaneous intracerebral hemorrhage; hematoma expansion; machine learning; unsupervised learning
基金項目:山西省衛(wèi)生健康委科研課題計劃項目(2020156)
作者單位:030600 晉中,晉中市第一人民醫(yī)院神經(jīng)外科(楊凱,白映紅,王智,房建忠);山西醫(yī)科大學第一醫(yī)院神經(jīng)外科(郝解賀)
通信作者:郝解賀
自發(fā)性腦出血(spontaneous intracerebral hemorrhage,SICH)指非創(chuàng)傷因素所致的腦實質(zhì)內(nèi)的出血,多由高血壓引起,病情進展迅速、差異較大,病變轉(zhuǎn)歸不確定性也較大,臨床工作中常常無法及時觀察到患者的病情變化。早期、快速識別血腫擴大高危患者,可以采取相應的干預措施從而改善預后[1]。無監(jiān)督機器學習可以根據(jù)多種特征(包括但不限于人口統(tǒng)計學特征、既往病史、相關(guān)檢查等)將患者進行分型[2],來分析不同分型間的特征及預后的差異。本研究收集2018年7月—2020年12月晉中市第一人民醫(yī)院收治的348例SICH患者的臨床資料和影像學數(shù)據(jù)(DICOM格式),基于無監(jiān)督學習算法,通過臨床資料和頭顱CT影像學特征將不同的SICH患者進行分型,以利于采取不同的治療策略,更好地診治腦出血患者并改善其預后。
1 資料與方法
1.1 一般資料 共納入348例患者,其中男215例(61.78%),女133例;年齡28~89歲,平均年齡(61.60±11.78)歲;此次發(fā)病前診斷有高血壓者226例(64.94%),68例(19.54%)既往服用了阿司匹林,入院時GCS評分均值為12.71,基線血腫體積為(18.43±16.53)mL;出血位于丘腦和基底節(jié)區(qū)為258例(74.14%)、腦葉為59例(16.95%)、幕下為31例(8.91%);出現(xiàn)血腫擴大者42例(血腫增加>6 mL,12.07%)。納入標準:(1)年齡滿18周歲;(2)首次CT檢查時間在發(fā)病后24 h以內(nèi);(3)血腫位于腦實質(zhì)且發(fā)病48 h內(nèi)復查了頭顱CT。排除標準:(1)偽影嚴重;(2)進行手術(shù)治療以及出血原因明確為創(chuàng)傷、動脈瘤、血管畸形、血液病等。所有患者均簽署知情同意書,且本研究獲得晉中市第一人民醫(yī)院倫理審查委員會的批準。
1.2 血腫擴大的判斷 分別將首次及復查的頭顱CT原始數(shù)據(jù)導入3D Slicer軟件(v4.11),逐層描記血腫邊界測得血腫體積,不包括腦室內(nèi)和蛛網(wǎng)膜下腔的出血,對于部分血腫破入腦室或蛛網(wǎng)膜下腔邊界不清之處,可根據(jù)腦室或腦溝的輪廓來大致判斷。血腫體積增加6 mL以上者確定為血腫擴大。
1.3 影像數(shù)據(jù)處理及特征提取 將所有患者的首次頭顱CT數(shù)據(jù)分別導入3D Slicer軟件(v4.11),手工逐層描記原發(fā)出血部位的血腫邊界形成ROI區(qū),導出模型,通過python(3.7.5)的radiomics模塊提取影像學特征(圖1A)。
1.4 基線特征和數(shù)據(jù)預處理 收集患者的基線特征,包括臨床信息、既往病史及用藥史、個人史、入院時體征、入院后首次實驗室檢查(血細胞分析、肝功、腎功、離子、隨機血糖、血凝等)及頭顱CT影像學表現(xiàn)(包括血腫量、出血部位、是否破入腦室、中線移位情況)。將收集到的特征全部轉(zhuǎn)換為數(shù)字形式,刪除缺失數(shù)據(jù)≥20%、Pearson相關(guān)系數(shù)≥0.8的特征。根據(jù)均數(shù)、標準差來填充缺失數(shù)據(jù)。
1.5 無監(jiān)督機器學習 采用python(3.7.5)分析臨床資料及影像學特征,對每位患者的臨床參數(shù)以及影像DICOM數(shù)據(jù)和ROI數(shù)據(jù)進行分析。通過無監(jiān)督學習算法分析,使用sklearn模塊將輸入數(shù)據(jù)進行標準化處理后進行降維(2維),使用Kmeans模塊進行聚類(圖1B)。
1.6 統(tǒng)計學分析 分類變量以計數(shù)和百分比表示,采用χ2檢驗評估不同分型間的差異。連續(xù)變量用均數(shù)±標準差(x-±s)表示,采用方差分析或t檢驗評估不同分型間或組間差異。以P<0.05認差異為有統(tǒng)計學意義。
2 結(jié) 果
2.1 特征提取及預處理 共收集到130個臨床參數(shù),篩選確定了54個臨床特征,這些基線特征數(shù)據(jù)缺失0~18.4%。根據(jù)頭顱CT影像原始數(shù)據(jù)和手工繪制的ROI區(qū)域,提取了129個影像學特征,篩選確定了112個特征。最終共選定了166個特征輸入機器學習算法(圖1、表1)。
2.2 機器學習分型結(jié)果 依據(jù)選定的166個特征使用無監(jiān)督機器學習的方法將病例進行分型(即聚類),嘗試分為2~10型多個不同的分型方案,比較發(fā)現(xiàn)五型方案最佳,將整個患者群體分為A、B、C、D、E共5型,即5個具有不同臨床和影像學特征的分型(圖1)。其中A型出現(xiàn)血腫擴大(>6 mL)的比例最低,為1.92%,且血腫增加量超過>12 mL的比例為0,發(fā)病后30 d的mRS評分為(2.04±1.52),預后最佳。而E型出現(xiàn)血腫擴大(>6 mL)達28.26%,預后也最差,30 d的mRS評分為(4.10±1.45)。見表1。
2.3 不同分型間基線特征及預后的比較 A型中有52例患者,年齡(66.13±10.14)歲,高于平均年齡,既往診斷糖尿病、腦梗死者比例較高,吸煙、飲酒者少,發(fā)病后意識障礙程度輕,初始血腫體積較小,(3.11±2.11)mL,中線結(jié)構(gòu)移位不明顯。B型有88例患者,服用阿司匹林比例高,發(fā)病后意識清楚者比例高,GCS評分較高。C型67例患者,男性居多,達74.63%,既往飲酒者居多,初始血腫體積較大。D型95例,既往患有高血壓、糖尿病、腦出血者較多,發(fā)病后意識清楚者比例低。E型患者46例,男性比例高,69.57%,平均年齡大,(66.54±13.14)歲,既往有高血壓病史的患者比例較其他組低,既往患腦出血、腦梗死及服用阿司匹林等藥物者少,入院后GCS評分偏低,初始血腫量為(47.02±18.20)mL,中線結(jié)構(gòu)移位明顯,破入腦室、蛛網(wǎng)膜下腔者較多,腦葉出血比例高(表1)。
不同分型間比較差異顯著,有統(tǒng)計學差異(P<0.05)的特征包括性別、年齡、高血壓病史、飲酒史、意識障礙、GCS評分、首次CT出血量、出血部位、白細胞計數(shù)等(表1)。不同分型間血腫擴大和預后分析顯示,A型發(fā)生血腫擴大的比例最低,預后也最好。B型與A型接近。C型出現(xiàn)血腫擴大的風險高于A、B兩型,預后也較差。E型出現(xiàn)血腫擴大的風險最高,>6 mL者13例(28.26%),>12 mL者8例(17.39%),發(fā)生血腫擴大的患者較多,血腫增加量較大,總體預后最差。D型發(fā)生血腫擴大的風險也比較高,但預后比E型好(表2)。不同分型間血腫擴大和30 d mRS評分的比較統(tǒng)計學意義顯著(P<0.05)。見表1。
2.4 血腫擴大相關(guān)因素分析 根據(jù)是否發(fā)生血腫擴大,將患者分為血腫擴大組和無血腫擴大組。組間比較顯示,與無血腫擴大組相比,血腫擴大組入院時GCS評分低(t=2.214 4,P<0.05),初次頭顱CT檢查的血腫量較大(t=3.940 7,P<0.05),中線結(jié)構(gòu)移位明顯(t=2.001 3,P<0.05),預后更差(t=4.953 4,P<0.05)。見表3。
3 討 論
SICH起病急,進展迅速,病死率、致殘率高[1]。丘腦和基底節(jié)區(qū)是最常見的出血部位,可破入腦室或蛛網(wǎng)膜下腔。中國約46%的腦出血患者在發(fā)病1年內(nèi)死亡或嚴重殘疾[3]。出現(xiàn)血腫擴大是病情進展、導致患者死亡的重要因素之一。早期血腫擴大者預后差、死亡率高[4]。腦出血早期血腫擴大導致患者神經(jīng)功能迅速惡化,是預后不良的重要預測因素。血腫擴大是腦出血患者臨床干預的一個指征,是臨床醫(yī)師進行治療決策、手術(shù)時機、術(shù)式選擇及預后評估的重要依據(jù),因此預測血腫擴大具有重要意義[5]。
目前腦出血患者出現(xiàn)血腫擴大的影像學特征相關(guān)研究為一大熱點,包括CTA點征[6]和NCCT影像標志物,如血腫內(nèi)低密度、黑洞征、漩渦征、混合征、血腫密度不均勻、血腫形狀不規(guī)則、島征、衛(wèi)星征等[7-15],以及預測量表[16-17]。依據(jù)有無這些影像學特征分組進行比較研究,來判斷這些特征是否為血腫擴大的風險因素,篩選血腫擴大可能性高的患者,進一步指導治療和判斷預后。然而,這些影像學特征的評估主觀性較強,評判者一致性差,評定復雜,不便操作,耗時耗力,漏診率高,準確率差,評估不精確。根據(jù)某一個特征對研究人群進行分組后,組內(nèi)患者的異質(zhì)性顯著,組間其他特征也難以做到基線一致,研究人員還可能根據(jù)自己希望的結(jié)論有選擇性地納入病例、剔除不利于論點的病例,因此研究結(jié)果的可信度較低,選擇多個分組依據(jù)同時進行分組,增加分組數(shù)量,仍無法克服這些弱點。此外,患者的臨床特征有許多個,某一個特征無法完整描述患者的疾病特點,SICH患者出現(xiàn)血腫擴大、預后差的原因可能不是某一個或數(shù)個特征所致,而是由患者的所有臨床信息(包括臨床表現(xiàn)、既往病史、實驗室檢查、影像學檢查等)共同所致,依據(jù)少數(shù)特征對患者分組存在一定的局限性。
近年來隨著人工智能機器學習技術(shù)的發(fā)展,已經(jīng)應用于多種疾病的臨床診斷及結(jié)局預測[18-21]。無監(jiān)督學習是一種機器學習方法,根據(jù)多個特征發(fā)現(xiàn)患者之間的相似性,將相似的患者聚類在一起,就可以分析相似個體的特征,并將它們與病情變化或預后聯(lián)系起來[2]。本研究引入影像組學與人工智能的方法,將臨床指標和影像學特征綜合考慮,即把患者全部可能有關(guān)的醫(yī)學信息作為分組依據(jù),將納入的研究病例分為不同的類型,不同分型的患者出現(xiàn)血腫擴大的概率不同,以此來預測血腫擴大的風險。通過整理分析收集到的全部信息,最終選定166個特征作為分組依據(jù),包括54個臨床特征和112個頭顱CT影像學特征,將這些特征進行標準化處理后降成二維,然后使用Kmeans聚類法,根據(jù)數(shù)據(jù)之間的內(nèi)在關(guān)系,把SICH患者劃分為不同的類型,同一分型的患者相似度高,不同分型間的患者相似度低。嘗試了分為2~10型多個不同的分型方案,發(fā)現(xiàn)分為5個類型后,血腫體積增大及預后的分型間比較差異最為顯著,所以最后選擇了A、B、C、D、E 5型的分型方案。臨床工作中可以通過該方法將新入院患者歸屬于其中一個型,以此來評估出現(xiàn)血腫擴大的可能性和判斷預后,比如某患者屬于E型,則血腫擴大風險高、預后差,即使當前出血量不大,也需警惕發(fā)生血腫擴大的風險,應密切觀察神經(jīng)系統(tǒng)功能變化,及時復查CT,做好手術(shù)準備,告知預后不良可能。該分型方案中,性別、年齡、高血壓病史、飲酒史、意識障礙、GCS評分、首次CT出血量、出血部位等特征在不同分型間比較差異顯著,可能對分型的作用較大。
此外,許多研究提出,血腫擴大的相關(guān)因素包括發(fā)病到首次頭顱CT時間,基線血腫體積,GCS評分,服用抗凝、抗血小板藥物,血小板計數(shù)及功能,纖維蛋白原等[22-23]。本研究進一步分析了導致血腫擴大的風險因素,提示出現(xiàn)血腫擴大的患者GCS評分低,血腫量大,中線結(jié)構(gòu)移位明顯。腦內(nèi)血腫量較大時,血腫的占位效應對周圍腦組織造成牽拉,由于剪切作用撕裂周圍多個微小動脈破裂誘發(fā)活動性出血,導致血腫穩(wěn)定性差,從而導致繼發(fā)性出血和血腫再擴大[22,24-26]。 凝血功能異常的SICH患者發(fā)生血腫擴大的風險高[9-10,25,27]。本研究中,存在血小板計數(shù)異常和凝血功能障礙的患者已被剔除,相關(guān)指標在正常范圍內(nèi)的波動可能不是導致血腫擴大的原因。既往服用阿司匹林可能是導致腦出血的高危因素[27],但是否會導致血腫擴大尚不清楚,其他抗血小板藥物和抗凝藥物的使用比例偏低,分析結(jié)果可能不準確。
本研究的價值在于開發(fā)了一種基于人工智能的SICH影像組學分型方法,不同分型間比較差異顯著證明該分型方案有效、可行。當然該分型方法及過程較為復雜,可以把運行代碼編譯為臨床應用軟件進行操作,使用人工智能工具來輔助臨床診療,為臨床醫(yī)生篩選血腫擴大高危人群提供高效便捷的工具。下一步將納入更多的病例數(shù)來測試其穩(wěn)定性,擴大納入標準增加適用范圍,與其他分組方案進行比較證實其優(yōu)越性。
[參 考 文 獻]
[1]中華醫(yī)學會神經(jīng)外科學分會,中國醫(yī)師協(xié)會急診醫(yī)師分會,中華醫(yī)學會神經(jīng)病學分會腦血管病學組,等.高血壓性腦出血中國多學科診治指南[J].中國急救醫(yī)學,2020,40(8):689-702.
[2]Cikes M,Sanchez-Martinez S,Claggett B,et al.Machine learning-based phenogrouping in heart failure to identify responders to cardiac resynchronization therapy[J].Eur J Heart Fail,2019,21(1):74-85.
[3]Wang WZ,Jiang B,Sun HX,et al.Prevalence,incidence,and mortality of stroke in China:results from a nationwide population-based survey of 480 687 adults[J].Circulation,2017,135(8):759-771.
[4]Sporns PB,Kemmling A,Minnerup J,et al.Imaging-based outcome prediction in patients with intracerebral hemorrhage[J].Acta Neurochir(Wien),2018,160(8):1663-1670.
[5]Liu JJ,Xu HL,Chen Q,et al.Prediction of hematoma expansion in spontaneous intracerebral hemorrhage using support vector machine[J].EBioMedicine,2019,43(5):454-459.
[6]庫洪彬,孟志勇,張衛(wèi)民,等.CTA點征在中等量腦出血超早期手術(shù)方式選擇中的應用價值分析[J].中華神經(jīng)醫(yī)學雜志,2020,19(7):689-694.
[7]Yu ZY,Zheng J,He MY,et al.Accuracy of swirl sign for predicting hematoma enlargement in intracerebral hemorrhage:a meta-analysis[J].J Neurol Sci,2019,399(2):155-160.
[8]Yang WS,Zhang SQ,Shen YQ,et al.Noncontrast computed tomography markers as predictors of revised hematoma expansion in acute intracerebral hemorrhage[J].J Am Heart Assoc,2021,10(3):e018248.
[9]毛益光,孫青,陳罡.自發(fā)性腦出血發(fā)生血腫擴大的影響因素分析[J].中華神經(jīng)外科雜志,2022,38(1):89-93.
[10]王希,仲艷,顏偉,等.CT平掃島征和黑洞征對原發(fā)性腦出血早期血腫擴大的預測價值[J].中華神經(jīng)外科雜志,2021,37(6):557-561.
[11]孫帆,周赤忠,羅寬.島征與凝血功能對高血壓腦出血血腫擴大預測價值研究[J].中風與神經(jīng)疾病雜志,2021,38(10):1075-1078.
[12]楊文松,李琦,王星辰,等.CT平掃混合征和黑洞征及其聯(lián)合征象對腦出血患者早期血腫擴大的預測價值[J].中國腦血管病雜志,2017,14(11):561-565,579.
[13]王業(yè)青,時代,陸寬,等.CT平掃漩渦征與黑洞征在預測腦出血早期血腫擴大中的價值研究[J].中華神經(jīng)醫(yī)學雜志,2020,19(1):29-35.
[14]王玉才,王會,張梅.黑洞征和島征對急性自發(fā)性腦出血血腫擴大的預測價值[J].臨床神經(jīng)病學雜志,2019,32(4):273-277.
[15]賀桂女,郭好戰(zhàn),韓雄.預測腦出血早期血腫擴大的非增強CT征象[J].中華神經(jīng)科雜志,2018,51(8):649-652.
[16]Morotti A,Dowlatshahi D,Boulouis G,et al.Predicting intracerebral hemorrhage expansion with noncontrast computed tomography:the BAT score[J].Stroke,2018,49(5):1163-1169.
[17]李子聰,孔祥宇,黃鴻翔,等.基于平掃CT征象的腦出血早期血腫擴大預測量表[J].臨床神經(jīng)外科雜志,2021,18(4):375-380.
[18]Ehteshami Bejnordi B,Veta M,Johannes van Diest P,et al.Diagnostic assessment of deep learning algorithms for detection of lymph node metastases in women with breast cancer[J].JAMA,2017,318(22):2199-2210.
[19]Ting DSW,Cheung CYL,Lim G,et al.Development and validation of a deep learning system for diabetic retinopathy and related eye diseases using retinal images from multiethnic populations with diabetes[J].JAMA,2017,318(22):2211-2223.
[20]陳凱,佘華龍,吳濤,等.9種機器學習模型預測幕上深部自發(fā)性腦出血早期血腫擴張及預后不良的比較[J].中華解剖與臨床雜志,2022,27(9):601-607.
[21]常健博,姜燊種,陳顯金,等.基于卷積神經(jīng)網(wǎng)絡的自發(fā)性腦出血血腫分割方法的一致性評價[J].中國現(xiàn)代神經(jīng)疾病雜志,2020,20(7):585-590.
[22]劉彪,王鵬,周游.高血壓性腦出血病理解剖學與病理生理學的研究進展[J].中國臨床神經(jīng)外科雜志,2022,27(7):604-606.
[23]殷友永,石碑田,徐禮林.高血壓腦出血早期血腫擴大的危險因素及入院時GCS評分聯(lián)合血糖水平的臨床預測價值[J].中風與神經(jīng)疾病雜志,2020,37(5):424-428.
[24]Schlunk F,Bhm M,Boulouis G,et al.Secondary bleeding during acute experimental intracerebral hemorrhage[J].Stroke,2019,50(5):1210-1215.
[25]張爽,曾敏靈,郭春保,等.原發(fā)性腦出血患者血腫增大的影響因素及血栓彈力圖參數(shù)的預測價值[J].中國實用神經(jīng)疾病雜志,2021,24(14):1232-1238.
[26]張巧瑩,周俊林.預測腦出血血腫擴大研究進展[J].中國醫(yī)學影像技術(shù),2019,35(3):443-446.
[27]蔣小兵,高文文,趙???高血壓腦出血術(shù)后再出血危險因素的Meta分析[J].臨床神經(jīng)外科雜志,2021,18(2):209-213.
(收稿2022-09-08 修回2022-10-05)