郭靜麗,彭明洋,王同興,陳國中,殷信道,劉浩
作者單位:南京醫(yī)科大學(xué)附屬南京醫(yī)院(南京市第一醫(yī)院)醫(yī)學(xué)影像科,南京210006
醒后卒中是指入睡前無明顯異常而起床后發(fā)現(xiàn)神經(jīng)功能缺損癥狀的卒中,是缺血性卒中的一個(gè)亞型,約占缺血性卒中的14%~25%[1-2]。由于發(fā)病時(shí)間不確定,目前大多數(shù)醒后卒中被排除在靜脈溶栓治療之外。因此,準(zhǔn)確預(yù)測(cè)卒中發(fā)病時(shí)間對(duì)患者的治療至關(guān)重要。以往的研究認(rèn)為彌散加權(quán)成像(diffusion weighted imaging,DWI)和液體衰減反轉(zhuǎn)恢復(fù)序列(fluid attenuated inversion recovery,F(xiàn)LAIR)不匹配可顯示缺血組織的發(fā)展情況,進(jìn)而選擇可能受益于溶栓治療的醒后卒中患者[3-4]。然而,DWI-FLAIR 不匹配敏感度低、主觀性強(qiáng),可能會(huì)高估實(shí)際發(fā)病時(shí)間,因此排除了太多可能從溶栓治療中獲益的患者。近年來,影像組學(xué)和機(jī)器學(xué)習(xí)的發(fā)展為醒后卒中發(fā)病時(shí)間的預(yù)測(cè)提供了新的方法。影像組學(xué)可從圖像中提取高維的定量特征(包括人類肉眼看不見的特征)[5],機(jī)器學(xué)習(xí)能夠從數(shù)據(jù)集中自動(dòng)學(xué)習(xí)這些特征,進(jìn)而構(gòu)建預(yù)測(cè)模型,實(shí)現(xiàn)精準(zhǔn)診斷及預(yù)測(cè)[6]。以往的研究顯示醒后卒中患者的早期影像學(xué)特征與已知發(fā)病時(shí)間的腦卒中患者相似。因此,本研究基于發(fā)病時(shí)間明確的急性腦卒中患者的DWI 和FLAIR 圖像,利用影像組學(xué)和機(jī)器學(xué)習(xí)方法構(gòu)建預(yù)測(cè)卒中發(fā)病時(shí)間的預(yù)測(cè)模型,為醒后卒中發(fā)病時(shí)間預(yù)測(cè)提供指導(dǎo)。
本研究經(jīng)過南京醫(yī)科大學(xué)倫理委員會(huì)批準(zhǔn)[批準(zhǔn)文號(hào):(2019-664)],免除受試者知情同意?;仡櫺苑治?017 年1 月至2020 年12 月在南京市第一醫(yī)院就診的急性腦卒中患者的臨床及影像資料。入組標(biāo)準(zhǔn):(1)發(fā)病時(shí)間明確;(2)發(fā)病24 h以內(nèi);(3)治療前行MRI檢查。排除標(biāo)準(zhǔn):(1)存在腦出血、腫瘤、外傷或手術(shù)史;(2)參與其他研究,接受額外藥物或治療;(3)圖像偽影或其他因素影響圖像評(píng)估。最終共有188 例患者納入本次研究,其中男109 例,女79 例,年齡(74.15±13.28)歲。根據(jù)發(fā)病至圖像采集時(shí)間,將患者分為發(fā)病時(shí)間≤4.5 h 組(91 例)和>4.5 h 組(97例)[7]。采用隨機(jī)分層抽樣法將患者隨機(jī)分為訓(xùn)練集131例,測(cè)試集57例。
采用Philips Ingenia 3.0 T MRI 掃描設(shè)備。掃描參數(shù)如下:DWI采用自旋回波序列:TR=2501 ms,TE=98 ms,F(xiàn)A=90°,視野=230 mm×230 mm,矩陣=152×122,層厚6 mm,18 層,層間距1.3 mm,b=0、1000 s/mm2;FLAIR 采用反轉(zhuǎn)恢復(fù)序列:TR=9000 ms,TE =120 ms,TI=2600 ms,矩陣=356×151,視野=230 mm×230 mm,F(xiàn)A=90°,層厚6 mm,層間距1.3 mm。
DWI-FLAIR不匹配定義為DWI圖像上責(zé)任血管供血區(qū)高信號(hào)且ADC 為低信號(hào)區(qū)域在FLAIR 圖像相應(yīng)區(qū)域未表現(xiàn)為高信號(hào)。由2 名具有6 年工作經(jīng)驗(yàn)的神經(jīng)放射學(xué)診斷醫(yī)師采用雙盲法進(jìn)行評(píng)估,意見不一致時(shí)與另一位具有10年工作經(jīng)驗(yàn)的神經(jīng)放射學(xué)診斷醫(yī)師共同商定。
影像組學(xué)特征提取及篩選分為感興趣區(qū)分割、特征提取及特征篩選三個(gè)步驟,具體步驟如下:(1)感興趣區(qū)分割:使用ITK-SNAP 軟件(版本3.4.0,http://www.itksnap.org)手動(dòng)分割DWI 高信號(hào)急性腦梗死區(qū)和對(duì)應(yīng)的FLAIR 急性梗死區(qū)作為感興趣區(qū)(region of interest,ROI) (圖1)。由1 名有10 年神經(jīng)影像診斷經(jīng)驗(yàn)的放射科醫(yī)師進(jìn)行ROI 的勾畫。(2)特征提?。菏褂萌斯ぶ悄軕?yīng)用平臺(tái)(artificial intelligent kit,A.K.) (人工智能工具包V3.0.0.R,GE Healthcare)對(duì)圖像進(jìn)行圖像插值、強(qiáng)度歸一化和灰度級(jí)離散化預(yù)處理。再分別對(duì)DWI和FLAIR的ROI進(jìn)行特征提取,包含一階特征(First Order)、灰度共生矩陣特征(gray-level co-occurrence matrix,GLCM)、灰度相關(guān)矩陣(gray-level dependence matrix,GLDM)、灰度游程矩陣(gray-level run length matrix,GLRLM)、灰度尺寸區(qū)域矩陣(gray-level size zone matrix,GLSZM)、相鄰灰度差分矩陣(neighboring gray tone difference matrix,NGTDM)等共396 個(gè)特征。(3)特征篩選:使用方差分析、Spearman 相關(guān)性檢驗(yàn)及最小絕對(duì)收縮與選擇算子算法(least absolute shrinkage and selection operator,LASSO)逐步進(jìn)行特征篩選,通過構(gòu)造懲罰函數(shù)得到一個(gè)較為精練的模型,壓縮一些回歸系數(shù),并設(shè)定一些回歸系數(shù)為零,同時(shí)采用十折交叉驗(yàn)證對(duì)模型參數(shù)進(jìn)行最優(yōu)化。
圖1 DWI和FLAIR感興趣區(qū)分割示意圖。Fig.1 Schematic diagram of region of interest segmentation on DWI and FLAIR images.
應(yīng)用支持向量機(jī)(support vector machine,SVM)分類器,對(duì)篩選的特征進(jìn)行機(jī)器學(xué)習(xí),構(gòu)建模型。SVM采用線性核,應(yīng)用五折交叉驗(yàn)證進(jìn)行模型訓(xùn)練。
臨床數(shù)據(jù)應(yīng)用SPSS 26.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。應(yīng)用Kolmogorov-Smimov 檢驗(yàn)計(jì)量資料是否符合正態(tài)分布,正態(tài)分布的計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差表示并用獨(dú)立t檢驗(yàn)分析;計(jì)數(shù)資料采用例數(shù)(百分率)表示并用卡方檢驗(yàn)分析。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。應(yīng)用Kappa 檢驗(yàn)進(jìn)行觀察者間一致性分析,Kappa 值大于0.75 表示一致性好。應(yīng)用ROC 曲線評(píng)估DWI-FLAIR預(yù)測(cè)發(fā)病時(shí)間的準(zhǔn)確度。LASSO回歸模型、SVM 分類器分別基于“glmnet”、“e1071”程序包完成。應(yīng)用Sklearn (http://scikit.learn.org/stable/) 機(jī)器學(xué)習(xí)模塊的受試者操作特征(receiver operating characteristic,ROC)曲線分析評(píng)估模型預(yù)測(cè)卒中發(fā)病時(shí)間的預(yù)測(cè)效能。獲得受試者工作特征曲線下面積(area under curve,AUC)、準(zhǔn)確度、敏感度、特異度、陽性預(yù)測(cè)值、陰性預(yù)測(cè)值等模型評(píng)價(jià)指標(biāo)。人工識(shí)別與機(jī)器學(xué)習(xí)模型效能間比較采用Delong檢驗(yàn)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
共188例患者納入分析,發(fā)病時(shí)間≤4.5 h組患者共91例,其中45例(49.45%)患者表現(xiàn)為FLAIR高信號(hào),DWI-FLAIR 不匹配46 例(50.55%),觀察者間一致性為k=0.95 (95%CI:0.92~0.99)。發(fā)病時(shí)間>4.5 h組患者97例,其中74例(76.29%)患者表現(xiàn)為FLAIR高信號(hào),DWI-FLAIR不匹配23例(23.71%),觀察者間一致性為k=0.93 (95%CI:0.91~0.97)。發(fā)病時(shí)間≤4.5 h組與發(fā)病時(shí)間>4.5 h組患者間性別、年齡、入院時(shí)美國國立衛(wèi)生院卒中量表(National Institute of Health Stroke Scale,NIHSS)評(píng)分、閉塞血管情況、高血壓、糖尿病、高脂血癥及高同型半胱氨酸差異均無統(tǒng)計(jì)學(xué)意義(P>0.05) (表1)。ROC 分析顯示人工識(shí)別DWI-FLAIR 不匹配預(yù)測(cè)急性腦卒中發(fā)病時(shí)間的AUC 為0.634,敏感度和特異度分別為0.667、0.622 (表2)。
表1 發(fā)病時(shí)間≤4.5 h組和發(fā)病時(shí)間>4.5 h組的臨床基線資料比較Tab.1 Comparison of basic clinical data between onset time ≤4.5 h and onset time >4.5 h
表2 人工識(shí)別及機(jī)器學(xué)習(xí)方法預(yù)測(cè)急性卒中發(fā)病時(shí)間的效能Tab.2 Efficacy of human readings and machine learning methods in predicting onset time of acute stroke
DWI 和FLAIR 分別提取了396 個(gè)特征,通過方差分析+秩和檢驗(yàn)后剩下168 個(gè)特征,Spearman 相關(guān)性檢驗(yàn)后剩下56 個(gè)特征,最后使用LASSO 降維后選擇的特征數(shù)為10 個(gè),包含7 個(gè)DWI 特征(3 個(gè)GLCM、1 個(gè)GLRLM、2 個(gè)GLSZM、1 個(gè)First Order)和3 個(gè)FLAIR 特征(1 個(gè)GLCM、1 個(gè)GLRLM、1 個(gè)First Order)。影像組學(xué)特征的LASSO 系數(shù)分布圖見圖2,篩選的最佳影像組學(xué)特征熱圖見圖3?;谒玫淖罴延跋窠M學(xué)特征構(gòu)建急性卒中發(fā)病時(shí)間的預(yù)測(cè)模型。ROC 曲線分析顯示訓(xùn)練集患者預(yù)測(cè)發(fā)病時(shí)間的AUC 為0.975,敏感度和特異度分別為0.932、0.950,準(zhǔn)確度為0.939;測(cè)試集患者預(yù)測(cè)發(fā)病時(shí)間的AUC 為0.915,敏感度和特異度分別為0.868、0.852,準(zhǔn)確度為0.862 (圖4)。人工識(shí)別與機(jī)器學(xué)習(xí)模型間比較差異有統(tǒng)計(jì)學(xué)意義(人工識(shí)別vs.訓(xùn)練集:Z=0.771,P=0.001;人工識(shí)別vs.測(cè)試集:Z=1.336,P=0.003)。
圖2 影像組學(xué)特征降維LASSO 系數(shù)收斂圖。每條曲線代表了不同懲罰系數(shù)對(duì)應(yīng)的自變量系數(shù)的變化軌跡,虛線為最小懲罰系數(shù)。LASSO:最小絕對(duì)收縮與選擇算子算法。Fig. 2 The distribution of LASSO coefficients of radiomics. Each curve represents the change track of independent variable coefficients corresponding to different penalty coefficients, and the dotted line is the minimum penalty coefficient. LASSO: least absolute shrinkage and selection operator.
圖3 最佳篩選的10 個(gè)特征的相關(guān)性熱圖。每個(gè)小方塊代表第j 列患者對(duì)應(yīng)第i 行特征的權(quán)重值經(jīng)過Z-score 轉(zhuǎn)換后的值對(duì)應(yīng)的顏色大小,其中紅色代表高,綠色代表低。Fig. 3 The correlation heatmap of the best screened 10 features. Each small square represents the color size corresponding to the weight value of the characteristic of row i corresponding to the patient in column j after Z-score conversion,in which red represents high and green represents low.
圖4 訓(xùn)練集和測(cè)試集用于急性腦卒中發(fā)病時(shí)間預(yù)測(cè)的ROC曲線。Fig. 4 Receiver operating characteristic curve of training set and test set for predicting onset time of acute stroke.
本研究對(duì)188例DWI和FLAIR的影像組學(xué)特征進(jìn)行篩選、降維,共篩選出與醒后卒中發(fā)病時(shí)間密切相關(guān)的10 個(gè)影像組學(xué)特征,包含7 個(gè)DWI 特征(3 個(gè)GLCM、1個(gè)GLRLM、2個(gè)GLSZM、1個(gè)First Order)和3個(gè)FLAIR 特征(1 個(gè)GLCM、1 個(gè)GLRLM、1 個(gè)First Order)。經(jīng)機(jī)器學(xué)習(xí)建模后,結(jié)果顯示該模型預(yù)測(cè)醒后卒中時(shí)間窗的效能明顯優(yōu)于傳統(tǒng)人工識(shí)別。本研究結(jié)果可有效克服由于人工識(shí)別的主觀性及可變性帶來的主觀誤差及低敏感性。通過構(gòu)建的模型可使臨床醫(yī)生能夠通過模型快速準(zhǔn)確地判斷醒后卒中的發(fā)病時(shí)間,指導(dǎo)臨床個(gè)性化的溶栓治療。
醒后卒中患者常不能提供準(zhǔn)確的發(fā)病時(shí)間,給溶栓治療帶來了困難。影像學(xué)檢查在患者發(fā)病時(shí)間的評(píng)估和治療中具有重要的作用。DWI 對(duì)細(xì)胞源性水腫敏感,而FLAIR 對(duì)血管源性水腫敏感[8-9]。腦卒中發(fā)生的幾分鐘內(nèi)便可檢測(cè)到病變區(qū)域的表觀擴(kuò)散系數(shù)降低,即DWI 信號(hào)增強(qiáng),隨著卒中的發(fā)展,血管源性水腫在1~4 h 內(nèi)發(fā)生,隨后可觀察到FLAIR 增強(qiáng)[10]。因此,目前研究推薦采用DWI 和FLAIR 不匹配征象識(shí)別發(fā)病時(shí)間≤4.5 h 的患者,從而指導(dǎo)臨床治療[11]。
以往已有較多研究顯示DWI-FLAIR 不匹配可預(yù)測(cè)急性腦卒中發(fā)病時(shí)間[12-14]。耿文等[15]研究顯示DWI-FLAIR 不匹配預(yù)測(cè)卒中發(fā)病時(shí)間(<180 min、180~270 min、≥270 min)的AUC 為0.753,當(dāng)臨界值為181.5 min 時(shí),其預(yù)測(cè)敏感度和特異度分別為84.6%、55.1%。Emeriau 等[16]發(fā)現(xiàn)DWI-FLAIR 不匹配雖然可預(yù)測(cè)卒中發(fā)病4.5 h以內(nèi)的患者,但其敏感度較低(0.55),特異度較低(0.60)。本研究結(jié)果顯示DWI-FLAIR 預(yù)測(cè)卒中發(fā)病時(shí)間的AUC 為0.634,敏感度和特異度分別為0.667、0.622。與以往的研究結(jié)果一致。人工識(shí)別的敏感度和特異度較低的原因可能為DWI-FLAIR評(píng)估方法僅通過DWI和FLAIR匹配與否,而不考慮病灶的其他特征。Emeriau 等[16]的研究中約有44.5%的患者在4.5 h內(nèi)FLAIR信號(hào)可發(fā)生變化,而本研究中約49.45%患者在4.5 h內(nèi)FLAIR表現(xiàn)為高信號(hào),這就嚴(yán)重影響了DWI-FLAIR不匹配的預(yù)測(cè)效果。此外,Duchaussoy等[17]發(fā)現(xiàn)T2弛豫時(shí)間差異、比率、絕對(duì)T2 弛豫時(shí)間及FLAIR 信號(hào)強(qiáng)度比與卒中發(fā)病時(shí)間相關(guān),T2指標(biāo)可能成為具有輕微FLAIR高信號(hào)的醒后卒中發(fā)病時(shí)間評(píng)估工具。以往的研究顯示病變攝水率是一種基于CT 的成像生物標(biāo)志物,可反映血管源性水腫,可在一定程度上評(píng)估卒中的發(fā)病時(shí)間[18-19]。然而,這些評(píng)估方法仍存在敏感度低、參數(shù)不統(tǒng)一、主觀性強(qiáng)等不足,臨床上應(yīng)用這些指標(biāo)篩選受益于溶栓治療的卒中患者仍十分謹(jǐn)慎。
近年來,影像組學(xué)的發(fā)展為急性腦卒中發(fā)病時(shí)間的預(yù)測(cè)提供了新的契機(jī)。它可挖掘圖像中肉眼無法感知的信息,提取高通量的紋理特征,從而促進(jìn)疾病的識(shí)別和分類[20]。目前在急性腦卒中的診斷、治療及預(yù)后評(píng)估中已有較多研究[7,21-22]。本研究基于DWI和FLAIR 的影像組學(xué)特征提取和篩選,最終篩選出10 個(gè)與發(fā)病時(shí)間密切相關(guān)的特征,包含7 個(gè)DWI 特征和3 個(gè)FLAIR 特征。一階特征可以定量的方式描述圖像中體素分布;灰度共生矩陣特征可反映病變的同、異質(zhì)性;灰度游程矩陣特征可反映圖像紋理的方向性和粗糙程度等信息[23]。這些特征可為預(yù)測(cè)急性卒中發(fā)病時(shí)間提供更多肉眼無法識(shí)別的信息。
機(jī)器學(xué)習(xí)模型能夠利用和學(xué)習(xí)數(shù)據(jù)來進(jìn)行預(yù)測(cè),因其較好的分類效能已廣泛應(yīng)用于醫(yī)療領(lǐng)域。本研究基于以上篩選的最佳影像組學(xué)特征進(jìn)行機(jī)器學(xué)習(xí)構(gòu)建模型,結(jié)果顯示其預(yù)測(cè)效能明顯優(yōu)于人工識(shí)別的結(jié)果。Lee 等[24]利用DWI 和FLAIR 每個(gè)序列的89 個(gè)影像組學(xué)特征進(jìn)行機(jī)器學(xué)習(xí)預(yù)測(cè)發(fā)病時(shí)間,結(jié)果顯示機(jī)器學(xué)習(xí)方法同樣優(yōu)于人工識(shí)別。但本研究較Lee等研究提取了更多的影像組學(xué)特征,較多的特征可能為預(yù)測(cè)發(fā)病時(shí)間提供更多的信息。Ho 等[25]基于FLAIR、DWI 和灌注成像進(jìn)行深度學(xué)習(xí)預(yù)測(cè)發(fā)病時(shí)間,敏感度為79%,特異度為61%。該模型需要完整的MRI 序列(包括灌注成像序列)。然而,大部分患者由于癥狀較重或基層醫(yī)院條件受限,可能無法完成灌注成像。本研究的模型僅使用了常規(guī)的FLAIR和DWI序列來預(yù)測(cè)發(fā)病時(shí)間,具有更普遍的適用性。
本研究仍存在一定的局限性。首先,本研究為單中心回顧性研究,為確保兩組樣本均衡,在樣本選擇時(shí)可能存在偏倚。其次,本研究僅以4.5 h為分界預(yù)測(cè)卒中患者發(fā)病時(shí)間,但有研究認(rèn)為靜脈溶栓的時(shí)間窗可延長至6 h。因此本研究模型會(huì)使部分發(fā)病時(shí)間在4.5~6 h并可進(jìn)行靜脈溶栓的患者排除在外。此外,本研究未做外部驗(yàn)證。
綜上所述,基于DWI 和FLAIR 影像組學(xué)的機(jī)器學(xué)習(xí),能夠較為準(zhǔn)確地預(yù)測(cè)急性腦卒中患者的發(fā)病時(shí)間,為臨床靜脈溶栓治療的選擇提供影像指導(dǎo)。
作者利益沖突聲明:全部作者均聲明無利益沖突。