張力,于淑靖,張迎,馬建楠,付蘭,姚麗
木村病又稱嗜酸性淋巴肉芽腫,是一種相對少見的、原因未明的慢性炎癥性疾病。1948年日本學(xué)者木村(Kimura)對該病進(jìn)行系統(tǒng)描述,稱之為木村病[1]。該病主要臨床表現(xiàn)為頭頸部多發(fā)無痛性結(jié)節(jié)及腫塊,常累及大涎腺和周圍淋巴結(jié)。腫大淋巴結(jié)在CT上邊界清晰、無明顯液化壞死及鈣化、且無明顯融合趨勢,但該病仍難以與其他引起淋巴結(jié)腫大的疾病鑒別,易誤診為淋巴瘤等惡性腫瘤,臨床上需結(jié)合病史和病理組織學(xué)檢查來提高診斷準(zhǔn)確性[2,3]。
近幾年來,影像組學(xué)作為一項新興的疾病診斷和輔助檢測技術(shù)成為臨床醫(yī)學(xué)和生物醫(yī)學(xué)工程領(lǐng)域的研究熱點[4,5]。影像組學(xué)在腫瘤良惡性鑒別、腫瘤分期、分子分型以及基因突變等領(lǐng)域應(yīng)用廣泛[6,7]。作為一種醫(yī)學(xué)輔助工具,影像組學(xué)分類效果或高于傳統(tǒng)的臨床因子和評分系統(tǒng)[8],組學(xué)特征與其他傳統(tǒng)診斷方法相結(jié)合顯示出較高的診斷價值[9]。本研究基于增強CT掃描圖像,探討影像組學(xué)鑒別頭頸部木村病淋巴結(jié)病變和淋巴瘤的可行性,并對建立的邏輯回歸診斷模型進(jìn)行驗證,以期為該病的鑒別診斷提供有效、無創(chuàng)的參考。
1.病例資料
回顧性分析河北滄州市中心醫(yī)院2011年7月-2018年8月經(jīng)手術(shù)病理或穿刺活檢證實的頭頸部木村病和淋巴瘤患者的CT檢查資料。本研究獲得河北省滄州市中心醫(yī)院倫理委員會批準(zhǔn)。納入標(biāo)準(zhǔn):①均行頭頸部增強CT檢查;②有多發(fā)腫大淋巴結(jié),淋巴結(jié)短徑均≥1.0 cm,且有組織病理學(xué)檢查結(jié)果;③腫大淋巴結(jié)均無明顯液化、壞死及鈣化,且無明顯融合趨勢;④病灶邊界清晰且無明顯偽影干擾。最終納入研究的頭頸部木村病患者14例,淋巴瘤患者27例。14例頭頸部木村病患者中,男12例,女2例,年齡26~66歲,平均年齡41.7歲。每例選取2~3枚腫大淋巴結(jié),共38枚淋巴結(jié)。淋巴結(jié)位于Ⅰ區(qū)8枚,Ⅱ區(qū)10枚,Ⅲ區(qū)1枚,Ⅴ區(qū)2枚,Ⅷ區(qū)17枚。27例淋巴瘤患者中(霍奇金淋巴瘤7例,非霍奇金淋巴瘤20例),男13例,女14例,年齡17~81歲,平均年齡55.6歲。每例選取1~2枚腫大淋巴結(jié),共37枚淋巴結(jié)。淋巴結(jié)位于Ⅰ區(qū)6枚,Ⅱ區(qū)7枚,Ⅲ區(qū)11枚,Ⅳ區(qū)1枚,Ⅴ區(qū)11枚,Ⅷ區(qū)1枚。淋巴結(jié)分組采用新版頭頸部腫瘤頸部淋巴結(jié)分區(qū)指南[10]。
2.CT檢查方法
采用美國GE Light Speed 64/16層螺旋 CT掃描儀進(jìn)行橫軸面掃描,患者取仰臥位,掃描范圍從顱底至胸骨切跡水平。管電壓120 kV,自適應(yīng)管電流。層厚2.5 mm,層間隔2.5 mm,螺距1.375。對比劑為碘海醇(350 mg I/mL,1.5 mL/kg),采用高壓注射器經(jīng)肘靜脈以3.5 mL/s流率團(tuán)注,動脈期及靜脈期掃描時間分別為注射后25~30 s和60~70 s。
3.數(shù)據(jù)收集、特征選擇和模型構(gòu)建
考慮到所有病灶在靜脈期顯示最清晰,為避免誤差,只選擇靜脈期進(jìn)行腫大淋巴結(jié)勾畫。將病灶所有層面的CT靜脈期圖像導(dǎo)入開源ITK-SNAP軟件(www.itksnap.org),采用軟組織窗觀察圖像(窗寬400 HU,窗位35 HU)。淋巴結(jié)病變區(qū)域由一名具有10年工作經(jīng)驗的影像科主治醫(yī)生沿病變邊緣內(nèi)側(cè)1~2 mm逐層手動勾畫,另一名高年資影像科醫(yī)師進(jìn)行核查,出現(xiàn)異議時,兩名醫(yī)師經(jīng)商討達(dá)成共識。軟件將勾畫的所有層面ROI自動融合成立體感興趣區(qū)(volume of interest,VOI)(圖1、2)。采用GE artificial intelligence kit(AK)軟件提取VOI內(nèi)定量影像特征參數(shù),共獲得包括直方圖特征、形態(tài)學(xué)特征和紋理特征在內(nèi)的396個特征。由于病例數(shù)較少,本研究僅探討病變在紋理特征中的差異,剔除和形態(tài)學(xué)相關(guān)的特征,對387個特征進(jìn)行數(shù)據(jù)分析。
首先對提取的特征值進(jìn)行預(yù)處理,用平均值替換異常值和缺失值;然后將數(shù)據(jù)標(biāo)準(zhǔn)化,以消除量綱的影響;最后按7:3的比例將病變隨機分為訓(xùn)練組與驗證組。38枚木村病腫大淋巴結(jié)中,訓(xùn)練組24枚,驗證組14枚;淋巴瘤37枚腫大淋巴結(jié)中,訓(xùn)練組29枚,驗證組8枚。對訓(xùn)練組和驗證組的樣本分布進(jìn)行卡方或Fisher精確檢驗。采用方差分析+秩和檢驗、一般線性模型(GLM)和Lasso算法進(jìn)行特征降維,減少特征冗余,最終從387個特征中篩選出5個影像組學(xué)特征,并以此構(gòu)建邏輯回歸模型,采用5折交叉驗證方法驗證模型精度,避免模型過擬合。對模型擬合優(yōu)度進(jìn)行Hosmer-Lemeshow 檢驗。建立ROC曲線、決策曲線和臨床影響曲線評價模型鑒別性能。ROC曲線下面積(AUC)、敏感性和特異性越大說明模型越可靠。最后建立模型列線圖,實現(xiàn)模型應(yīng)用。
4.統(tǒng)計學(xué)方法
表1 5個影像組學(xué)特征的描述性分布統(tǒng)計和組間差異比較
本研究的數(shù)據(jù)預(yù)處理、特征降維采用AK軟件完成。采用RStudio(1.1.463)進(jìn)行數(shù)據(jù)分析和建立邏輯回歸模型。使用IBM SPSS Statistics 22.0統(tǒng)計學(xué)分析軟件。對定量資料進(jìn)行正態(tài)分布檢驗(Shapiro-Wilk)和方差齊性檢驗(Levene)。組間差異采用獨立樣本t檢驗或Mann-Whitney U非參數(shù)檢驗。定性數(shù)據(jù)采用卡方檢驗或Fisher精確檢驗。P<0.05為差異有統(tǒng)計學(xué)意義。
1.影像組學(xué)特征
兩組樣本在訓(xùn)練組和驗證組的頻數(shù)分布均無統(tǒng)計學(xué)差異(訓(xùn)練組:P=1;驗證組:P=1)。通過Lasso模型降維(圖3),最終從387個特征中篩選出5個特征,包括3個灰度共生矩陣和2個灰度游程矩陣特征。對木村病和淋巴瘤中的5個特征分布進(jìn)行Mann-WhitneyU非參數(shù)檢驗,P值均<0.05(表1)。
不同CT圖像數(shù)據(jù)在兩組間的分布無統(tǒng)計學(xué)差異(χ2=1.090,P=0.296)。對5個特征在不同CT型號間的分布進(jìn)行非參數(shù)檢驗,結(jié)果顯示GLCMEntropy_AllDirection_offset1_SD和Inertia_angle135_offset1在兩種CT型號間的分布具有統(tǒng)計學(xué)差異(P均<0.05);ShortRunEmphasis_AllDirection_offset4_SD、ShortRunEmphasis_angle0_offset4和ShortRun-HighGreyLevelEmphasis_AllDirection_offset4_SD均無統(tǒng)計學(xué)差異(P均>0.05)。
表2 邏輯回歸模型相關(guān)參數(shù)
5個特征對模型鑒別性能的貢獻(xiàn)度見圖4。Inertia_angle135_offset1在本研究建立的模型中,對鑒別診斷的貢獻(xiàn)度最大。
2.模型建立
用篩選的5個影像組學(xué)特征建立邏輯回歸模型,為避免模型過擬合,進(jìn)行5折交叉驗證。5折交叉驗證將數(shù)據(jù)集分成5份互斥子集,輪流將其中4份作為訓(xùn)練集,剩下1份數(shù)據(jù)作為驗證集,交叉驗證重復(fù)5次,得到5個訓(xùn)練集模型的平均準(zhǔn)確率,作為對算法精度的估計(平均值:0.945,值分布:1,0.818,0.909,1,1)。確定模型的最優(yōu)參數(shù)后,建立影像組學(xué)標(biāo)簽公式,并根據(jù)該公式算出每位患者的組學(xué)標(biāo)簽值(Radscore),通過Sigmoid函數(shù)轉(zhuǎn)換進(jìn)而得出患者的陽性患病概率。邏輯回歸模型各參數(shù)見表2。
3.模型評價
對模型進(jìn)行Hosmer-Lemeshow檢驗,結(jié)果顯示模型具有較好的擬合優(yōu)度(χ2=4.812,P=0.777),表明該模型接近實際鑒別模型。繪制Hosmer-Lemeshow檢驗的可視化校準(zhǔn)曲線(圖5),訓(xùn)練組:均方誤差=0.042,絕對誤差的90%分位數(shù)=0.088;驗證組:均方誤差=0.092,絕對誤差的90%分位數(shù)=0.151。建立訓(xùn)練組和驗證組的ROC曲線(圖6)。模型在訓(xùn)練組中概率截斷值為0.629,鑒別效能的AUC為0.987(95%置信區(qū)間:0.9648~1),敏感度為0.966,特異度為0.958;在驗證組中概率截斷值為0.363,AUC為0.938(95%置信區(qū)間:0.8433~1),敏感度為1,特異度為0.786。采用Delong檢驗對訓(xùn)練組和驗證組的AUC進(jìn)行比較發(fā)現(xiàn),兩組間的AUC無統(tǒng)計學(xué)差異(P=0.323),說明邏輯回歸模型在訓(xùn)練組和驗證組間鑒別診斷木村病和淋巴瘤的性能無統(tǒng)計學(xué)差異。
建立模型的決策曲線(圖7)和臨床影響曲線(圖8)。閾值概率為0~1之間時,采用列線圖進(jìn)行決策所獲得的標(biāo)準(zhǔn)凈收益最大。閾值概率越小,收益成本比越大。臨床影響曲線使用模型模擬鑒別1000人,紅色曲線表示在各個閾概率下,被模型劃分為陽性(高風(fēng)險)的人數(shù),藍(lán)色曲線為各個閾概率下真陽性人數(shù),在95%置信區(qū)間內(nèi),當(dāng)閾值概率為0~1之間時模型的預(yù)測值近似真實值。
4.影像組學(xué)列線圖的應(yīng)用
基于訓(xùn)練集數(shù)據(jù)的Radscore值并建立列線圖(圖9)。根據(jù)Radscore值中位數(shù)(0.798)將病例分為高Radscore組和低Radscore組,低Radscore組患淋巴結(jié)病變的比例(59.46%,22/37)明顯高于高Radscore組(39.47%,15/38)??梢?,Radscore值可作為鑒別頭頸部木村病淋巴結(jié)病變與淋巴瘤的風(fēng)險因子。圖1、2分別為木村病和淋巴瘤患者。兩位患者的5個特征值和Radscore值以及最終的患(淋巴瘤)病概率見表3。木村病患者的患病概率(38%)遠(yuǎn)低于淋巴瘤患者(68%),表明Radscore值具有較好的風(fēng)險預(yù)測能力。
表3 兩名木村病和淋巴瘤患者的列線圖評分
注:Radscore為邏輯回歸模型計算的組學(xué)標(biāo)簽;total points為列線圖中通過Radscore所得到的總評分;probability為列線圖中通過總評分得到的患淋巴瘤的風(fēng)險概率。
木村病發(fā)病率低,國內(nèi)外報道多為個案報道,其影像表現(xiàn)文獻(xiàn)報道較少[11,12]。頭頸部木村病在CT上有以下3種表現(xiàn):(1)多發(fā)結(jié)節(jié)型,表現(xiàn)為多發(fā)結(jié)節(jié),邊界清晰,增強掃描呈明顯均勻強化;(2)彌漫腫塊型,常位于頜面部皮下脂肪間隙內(nèi),表現(xiàn)為皮下彌漫性腫塊,邊界模糊,鄰近皮膚增厚,增強掃描呈輕中度不均勻強化;(3)混合型,同時具有結(jié)節(jié)及腫塊特點。多數(shù)患者伴有頸部淋巴結(jié)腫大,由于該病表現(xiàn)為皮下腫瘤樣結(jié)節(jié)且伴大涎腺和局部淋巴結(jié)受累,故易誤診為惡性腫瘤,尤其是以多發(fā)無痛性腫大淋巴結(jié)為體征的淋巴瘤,即使是CT、MRI也不能很好的將兩者鑒別[13]。木村病的治療方法與惡性腫瘤不同,不需根治性手術(shù)切除,所以術(shù)前明確診斷非常必要[14]。雖然有國內(nèi)外學(xué)者總結(jié)出一些頭頸部木村病的影像學(xué)特點,但其表現(xiàn)還是缺乏特征性,且準(zhǔn)確率不高,需結(jié)合臨床及實驗室檢查綜合判斷來提高診斷準(zhǔn)確率。
2012年,Lambin等[15]首次提出影像組學(xué)的概念,即從影像圖像中提取大量影像學(xué)特征,通過高通量定量分析,將影像圖像轉(zhuǎn)化為具有高分辨率的、可發(fā)掘的空間數(shù)據(jù)。通過獲得的高保真目標(biāo)信息綜合評價病變,尤其是利用圖像中不被肉眼識別的紋理特征來揭示組織內(nèi)在異質(zhì)性,反映不同組織間的細(xì)微差別,亦可與CT圖像表現(xiàn)相結(jié)合,進(jìn)一步提高對病變的鑒別診斷能力[16]。本研究采用的影像組學(xué)分析軟件(AK軟件),已應(yīng)用于多項國內(nèi)外研究報道中[17-19]。
由于木村病是一種少見病,但病例中受累的腫大淋巴結(jié)常為多發(fā),因此本研究選取病變淋巴結(jié)作為研究對象,使用AK軟件進(jìn)行特征提取和降維。共提取396個影像組學(xué)特征,篩選出5個紋理特征對木村病和淋巴瘤進(jìn)行鑒別,并以此建立邏輯回歸模型,對模型進(jìn)行5折交叉驗證以評估模型算法的精度,避免模型過度擬合,5折交叉驗證的準(zhǔn)確度平均值為0.945。本研究中,訓(xùn)練組數(shù)據(jù)模型鑒別的AUC為0.987,敏感度為0.966,特異度為0.958;驗證組AUC為0.938,敏感度為1,特異度為0.786,結(jié)果表明該模型具有較高的鑒別效能,且訓(xùn)練組和驗證組的AUC無統(tǒng)計學(xué)差異。對5種特征在木村病和淋巴瘤間的分布進(jìn)行差異性檢驗,結(jié)果顯示5種特征值在組間分布顯著不同,在特征重要性圖中,以Inertia_angle135_offset1對模型分類的貢獻(xiàn)度最大。Inertia_angle135_offset1屬于高階的灰度共生矩陣特征,是一種慣性特征,反映圖像的清晰度和紋理溝紋深淺的程度,值越大表示圖像分布越不均勻[20]。最終篩選的5個特征在兩種CT圖像間分布的非參數(shù)檢驗結(jié)果提示,不同CT機型圖像的特征差異性程度以及這種差異對影像組學(xué)模型的影響還需要進(jìn)一步的研究。模型的決策曲線和臨床影響曲線表明,在特定的閾值概率范圍內(nèi)(0~1),使用模型作為決策依據(jù),凈收益大于對所有患者進(jìn)行治療和所有患者均不進(jìn)行治療的標(biāo)準(zhǔn)凈收益。列線圖是模型的重要應(yīng)用之一,通過列線圖可對每一位患者的患病風(fēng)險進(jìn)行預(yù)測[21-22]。本研究采用訓(xùn)練組的Radscore值作為評分建立列線圖,以Radscore值中位數(shù)將患者分為高Radscore組和低Radscore組,結(jié)果發(fā)現(xiàn)低Radscore組患淋巴結(jié)病變的比例(59.46%,22/37)明顯高于高Radscore組(39.47%,15/38),表明Radscore值可作為鑒別木村病和淋巴瘤的可靠因子。
本研究存在局限性。①由于木村病較罕見,可獲得的影像資料樣本量較小。②本研究沒有將臨床特征、基因數(shù)據(jù)或免疫組化的數(shù)據(jù)納入研究,因此獲得的模型可靠性存在很大的提升空間。③本研究沒有進(jìn)行外部驗證。后續(xù)研究可開展多中心、多序列或圖像轉(zhuǎn)換、加入免疫組化數(shù)據(jù)、開展影像基因組學(xué)等研究以增加樣本量或特征量,獲得更加可靠的模型。
綜上所述,影像組學(xué)可以對圖像信息進(jìn)行深層次的挖掘獲得高通量的特征集,并通過統(tǒng)計分析的方式有效鑒別木村病淋巴結(jié)病變和淋巴瘤。