袁小記 孫秀彬 韓榕 倪聰慧 王武章 于德新
2022年全球結(jié)核病報告顯示,中國是全球第三大結(jié)核病高負擔(dān)國家[1]??v隔淋巴結(jié)腫大最常見的感染性原因是淋巴結(jié)結(jié)核,最常見的腫瘤性原因是淋巴結(jié)轉(zhuǎn)移瘤,并以非小細胞肺癌最為多見[2-4]。目前,常規(guī)鑒別縱隔淋巴結(jié)腫大性質(zhì)的方法主要依靠CT掃描,但臨床工作中很多患者的原發(fā)病灶及腫大淋巴結(jié)在結(jié)核病及腫瘤的CT檢查中表現(xiàn)極為相似,導(dǎo)致常規(guī)CT檢查難以鑒別,特別是對于成人原發(fā)性肺結(jié)核,誤診率極高[5]。即便是對腫瘤診斷有極高價值的正電子發(fā)射計算機斷層顯像(positron emission tomography,PET-CT)也對兩者的鑒別能力有限,淋巴結(jié)結(jié)核的誤診率甚至高達70.6%[6]。盡管基因組二代測序技術(shù)(mNGS)、抗酸桿菌染色涂片鏡檢及分枝桿菌培養(yǎng)等實驗室檢查手段可以提供一定的鑒別信息,但檢測敏感度均較低[7-8],實際臨床價值受到限制。而基于人工智能大數(shù)據(jù)的放射組學(xué)分析方法為縱隔淋巴結(jié)腫大的良惡性鑒別提供了契機,大量組學(xué)特征可以彌補肉眼識別的不足,但由于肺結(jié)核原發(fā)病灶病程不一、成份復(fù)雜,或部分患者無明確原發(fā)灶,均可能導(dǎo)致放射組學(xué)統(tǒng)計結(jié)果發(fā)生偏倚?;诖?筆者選擇了結(jié)核性和轉(zhuǎn)移性縱隔淋巴腫結(jié)大患者進行研究,以期探討CT影像組學(xué)在二病鑒別診斷中的價值,為臨床診斷提供更多信息。
采用回顧性研究方法,于2017年9月至2021年11月參照入組標(biāo)準分別從山東省公共衛(wèi)生臨床中心(原山東省胸科醫(yī)院)和山東大學(xué)齊魯醫(yī)院納入109例縱隔淋巴結(jié)結(jié)核(結(jié)核組)和65例肺癌縱隔淋巴結(jié)轉(zhuǎn)移瘤(轉(zhuǎn)移瘤組)患者作為研究對象,分析其CT影像組學(xué)特征對兩種疾病的鑒別診斷價值。其中,96例結(jié)核病患者和47例轉(zhuǎn)移瘤患者來自山東省公共衛(wèi)生臨床中心,13例結(jié)核病患者和18例轉(zhuǎn)移瘤患者來自山東大學(xué)齊魯醫(yī)院;結(jié)核組患者中,男性65例(59.6%)、女性44例(40.4%),年齡中位數(shù)(四分位數(shù))為32(15,70)歲;轉(zhuǎn)移瘤組患者中,男性46例(70.8%)、女性19例(29.2%),年齡中位數(shù)(四分位數(shù))為63(41,84)歲;兩組間性別差異無統(tǒng)計學(xué)意義(χ2=2.186,P=0.139),年齡差異有統(tǒng)計學(xué)意義(Z=9.359,P<0.001)。
納入標(biāo)準:(1)結(jié)核組:經(jīng)手術(shù)切除或穿刺后病理檢查、實驗室檢查確診為結(jié)核病,或經(jīng)臨床和影像綜合診斷,并經(jīng)抗結(jié)核藥物治療有效;(2)轉(zhuǎn)移瘤組:所有入組淋巴結(jié)均經(jīng)淋巴結(jié)穿刺活檢或手術(shù)病理證實為轉(zhuǎn)移癌;(3)縱隔、肺門淋巴結(jié)短徑>10 mm;(4)圖像質(zhì)量符合放射組學(xué)分析要求。
排除標(biāo)準:(1)雖確診為縱隔淋巴結(jié)轉(zhuǎn)移瘤但淋巴結(jié)最短徑≤10 mm者;(2)肺結(jié)核合并肺癌者;(3)臨床資料證實可能存在混合感染者;(4)結(jié)核組對應(yīng)的抗結(jié)核治療無效者;(5)CT圖像存在運動偽影,圖像質(zhì)量不清晰者。
1.CT掃描:本研究患者均行飛利浦64排CT掃描,掃描前質(zhì)量矯正合格。掃描方法:患者平臥,雙手上舉,深吸氣后在屏氣狀態(tài)下自肺尖掃描至雙肋膈角。掃描條件:探測器準直64×0.625;掃描速度為0.5 s/周;螺距:1.375;管電壓:120 kV;管電流:250~400 mA;使用自動管電流調(diào)制;層厚:5 mm。對比劑用量:1~1.5 ml/kg,注射速率:3~4 ml/s,主動脈期增強掃描后,延遲30 s掃描靜脈期。掃描范圍自肺尖至肺底,單次屏氣完成掃描。
依據(jù)歐洲胸外科協(xié)會指南(ESTS guideline)[9],淋巴結(jié)最短徑>1 cm可考慮淋巴結(jié)轉(zhuǎn)移。本研究選取最短徑>1 cm的縱隔淋巴結(jié)作為研究對象。因腫瘤組入組淋巴結(jié)部分為穿刺活檢結(jié)果,穿刺淋巴結(jié)部位多集中在4/7/10區(qū)等,其他區(qū)域淋巴結(jié)納入少,本研究無法進行分區(qū)鑒別。
2.圖像分割:研究搜集入組患者胸部增強CT靜脈期的醫(yī)學(xué)數(shù)字成像和通信(digital imaging and communications in medicine,DICOM)圖像上傳至匯醫(yī)慧影醫(yī)療Radcloud平臺,再采用雙盲法由2名不了解患者疾病情況的放射科醫(yī)師對所有患者的CT圖像進行觀測和勾畫。首先,由1名主治醫(yī)生手動在縱隔窗(WL:40;WW:350)上對感興趣區(qū)域(volume of interests,VOI)淋巴結(jié)的面積進行勾畫,盡量保證勾畫的準確性。VOI涵蓋了縱隔、肺門所有短徑>1 cm的淋巴結(jié),并在每層有病灶的圖像中勾畫淋巴結(jié)面積。輪廓線貼近淋巴結(jié)實性邊緣,如果有血管被完全包繞在病灶內(nèi),則可視為病灶的一部分進行勾畫;如果血管貼于病灶邊緣或部分被包繞,則可予以剔除,不勾畫血管;如果因兩個或多個淋巴結(jié)融合而無法分辨界限,則可將其視為1個病灶進行勾畫,作為1個VOI;如果淋巴結(jié)為多發(fā),則可單獨勾畫每個淋巴結(jié),也作為1個VOI。最后由1名高級職稱放射科醫(yī)師對所有勾畫的目標(biāo)進行復(fù)查,并確定差異≥5%的VOI邊界[10]。圖1~4為10R區(qū)腫大淋巴結(jié)的勾畫展示。
圖1,2 患者,男,56歲,右肺門淋巴結(jié)轉(zhuǎn)移瘤。圖1為10R區(qū)腫大淋巴結(jié)無勾畫;圖2為10R區(qū)腫大淋巴結(jié)的勾畫與強化方式。勾畫時輪廓線貼近腫大淋巴結(jié)實性部分邊緣;增強CT掃描(右肺門層面)可見10R區(qū)增大的淋巴結(jié),以環(huán)形強化為主,與常規(guī)淋巴結(jié)結(jié)核強化方式相似,普通CT增強難以鑒別 圖3,4 患者,男,45歲,右肺門淋巴結(jié)結(jié)核。圖3為10R區(qū)腫大淋巴結(jié)無勾畫;圖4為10R區(qū)腫大淋巴結(jié)的勾畫與強化方式。勾畫時血管貼于病灶邊緣或部分被包繞,可予以剔除,不勾畫血管;增強CT掃描(右肺門層面)可見10R區(qū)腫大淋巴結(jié)以分隔樣強化為主,內(nèi)見多發(fā)小的低密度灶,僅從強化方式上與淋巴結(jié)轉(zhuǎn)移瘤難以鑒別
3.放射組學(xué)特征提取:利用Radcloud平臺從CT圖像中提取定量成像特征,可將特征分為4組:第1組(一階統(tǒng)計),由常用的、基本的、可定量描述CT圖像中體素強度分布的描述符組成;第2組(基于形狀和大小的特征),包含反映區(qū)域形狀和大小的三維特征;第3組(紋理特征),根據(jù)灰度運行長度和灰度共生紋理矩陣計算,對能量化區(qū)域異質(zhì)性差異的紋理特征進行分區(qū);第4組(高階統(tǒng)計特征),包括由原始圖像小波變換得到的強度和紋理特征。本研究使用了5種類型的濾波器:指數(shù)濾波器、平方濾波器、平方根濾波器、對數(shù)濾波器和小波濾波器(小波HHH、小波HLL、小波LHL、小波LHH)。
4.放射組學(xué)特征選擇:首先采用特征標(biāo)準化方法將上述影像組學(xué)特征的特征值縮放到(0,1)之間,再采用單因素logistic回歸分析選擇對鑒別診斷有價值的特征。選擇回歸分析中概率值P<0.05且模型評價C指數(shù)>0.65的特征,然后對篩選出來的特征進行共線性診斷。剔除存在共線性的特征后,采用SPSS 22.0軟件基于最大自然估計的向前逐步回歸法(forward:LR)進行多因素logistic回歸的特征篩選,保留相互獨立的放射組學(xué)特征構(gòu)建機器學(xué)習(xí)模型。
5.建立模型評價診斷效果:利用上述選擇出的放射組學(xué)特征,采用5折交叉驗證方法分別建立k-近鄰判別法(k-nearest neighbor,KNN)、支持向量機(support vector machine, SVM)、極限梯度提升算法(eXtreme gradient boosting,XGBoost)、隨機森林(random forest, RF)、logistic回歸(logistic regression, LR)和決策樹(decision trees, DT)等6種機器學(xué)習(xí)模型,評價各模型的診斷效能,并選擇最終模型。本研究曾在放射組學(xué)特征模型的基礎(chǔ)上增加了患者性別和年齡的兩個個體特征,但這并未使模型的診斷性能得到明顯改善,因此,基于本研究主要評價CT影像放射組學(xué)特征對兩種疾病的鑒別診斷價值,在構(gòu)建所有診斷模型時均未納入患者年齡和性別兩個特征。
6.建立最終模型:選擇上述確定的機器學(xué)習(xí)方法,以山東省公共衛(wèi)生臨床中心的患者作為訓(xùn)練集,利用其數(shù)據(jù)評價該機器學(xué)習(xí)模型的診斷效果;進一步以山東大學(xué)齊魯醫(yī)院的患者作為測試集,利用其測試的效果指標(biāo)評價所建模型的診斷效果。本研究所有機器學(xué)習(xí)建模及模型評價時均將轉(zhuǎn)移瘤組定義為患者、結(jié)核組定義為非患者。其中,效果評價指標(biāo)包括接受者操作特征(ROC)曲線及ROC曲線下面積(AUC)、敏感度、特異度、陽性預(yù)測值、陰性預(yù)測值和F分數(shù)(F-score)。其中,AUC值越大,正確率越高。
使用Excel 2016軟件進行部分數(shù)據(jù)的整理工作,采用IBM SPSS Statistics 22.0軟件進行單因素logistic回歸分析和放射組學(xué)特征的共線性診斷以選擇建模特征,利用weka 3.6.4平臺實現(xiàn)機器學(xué)習(xí)建模。非正態(tài)分布計量資料以“中位數(shù)(四分位數(shù))[M(Q1,Q3)]”描述,兩組間差異的比較采用Mann-WhitneyU檢驗;計數(shù)資料以“例(構(gòu)成比/百分率,%)”描述,組間差異的比較采用χ2檢驗,所有數(shù)據(jù)均為雙側(cè)檢驗,檢驗水準為0.05。
174例研究對象經(jīng)胸部CT掃描共獲得最短徑>1 cm的縱隔淋巴結(jié)281個,利用雙盲法共勾畫出281個VOI用于受試者放射組學(xué)特征分析,其中109例結(jié)核組患者分割出196個,每例患者分割出VOI中位數(shù)(四分位數(shù))為1(1,8)個;轉(zhuǎn)移瘤組分割出85個,每例患者分割出VOI中位數(shù)(四分位數(shù))為1(1,3)個;兩組患者VOI差異有統(tǒng)計學(xué)意義(Z=2.827,P=0.005)。
利用Radcloud平臺從上述281個VOI中提取出1409個定量成像特征,其中,第1組由126個描述符組成,用于定量描述CT圖像中體素強度分布;第2組包含14個反映ROI形狀和大小的三維特征;第3組獲得525個有能量化區(qū)域異質(zhì)性差異的紋理特征;第4組包括744個利用小波變換得到的高階統(tǒng)計特征。采用特征標(biāo)準化方法將1409個放射組學(xué)特征的特征值縮放到(0,1)之間,進行單因素logistic回歸分析。選擇單因素分析中概率值P<0.05且模型評價的C指數(shù)>0.65的特征共計29個;對29個特征進行共線性診斷,剔除7個與其他特征存在共線性的特征,進一步采用多因素logistic 回歸分析篩選有統(tǒng)計學(xué)意義的特征,共篩選出相互獨立的8個放射組學(xué)特征作為建立機器學(xué)習(xí)鑒別診斷模型的變量,8個特征均為小波濾波器變換后的CT圖像特征。多因素logistic回歸分析及篩選出的8個放射組學(xué)特征結(jié)果見表1、2。
表1 多因素logistic回歸分析篩選出的8個用于建模的影像組學(xué)特征及其類別和濾波器
基于上述8個放射組學(xué)特征,使用5折交叉驗證方法分別建立KNN、SVM、XGBoost、RF、LR和DT共6種機器學(xué)習(xí)模型。經(jīng)ROC曲線和評價指標(biāo)(圖5,表2)評價各模型的診斷效能。結(jié)果顯示,LR和SVM兩種模型的診斷效果較好,可作為建立結(jié)核組和轉(zhuǎn)移瘤組鑒別診斷的機器學(xué)習(xí)模型。
表2 篩選出的8個用于建模的放射組學(xué)特征的多因素logistic回歸分析結(jié)果
表3 采用5折交叉驗證方法建立的6種機器學(xué)習(xí)模型的診斷效能
注 KNN:k-近鄰判別法;SVM:支持向量機;XGBoost:極限梯度提升算法;RF:隨機森林;LR:logistic回歸;DT:決策樹圖5 采用5折交叉驗證方法建立的6種機器學(xué)習(xí)模型的ROC曲線
利用訓(xùn)練集數(shù)據(jù)建立LR和SVM兩種機器學(xué)習(xí)模型以鑒別診斷結(jié)核組和轉(zhuǎn)移瘤組,再利用驗證集數(shù)據(jù)評價兩種模型的診斷效能。結(jié)果顯示:LR和SVM模型在驗證集中的AUC值和F分數(shù)基本與訓(xùn)練集相同,且AUC均超過0.8,敏感度和特異度也表現(xiàn)良好,說明模型在外推應(yīng)用時仍具有穩(wěn)定的診斷效能,且SVM模型的診斷效果優(yōu)于LR模型。具體見圖6、7和表4。
表4 LR和SVM模型對訓(xùn)練集和測試集患者的診斷效能
圖6 logistic模型訓(xùn)練集和測試集的ROC曲線
圖7 支持向量圖模型訓(xùn)練集和測試集的ROC曲線
縱隔淋巴結(jié)結(jié)核是原發(fā)性肺結(jié)核的一種,可以沒有肺實質(zhì)浸潤而單獨存在[11],可從病理上分為4期[12-13]:第1期,淋巴結(jié)組織增生,形成結(jié)節(jié)或肉芽腫;第2期,淋巴結(jié)內(nèi)干酪樣壞死液化;第3期,淋巴結(jié)包膜破壞,互相融合并淋巴結(jié)周圍炎;第4期,干酪樣物質(zhì)穿破至周圍軟組織形成冷膿腫或竇道。同一患者由于病程較長,其病灶內(nèi)常有多個病理時期病變共存,形成了淋巴結(jié)結(jié)核復(fù)雜的影像學(xué)特征;且在縱隔內(nèi)破潰時易引起鄰近的肺內(nèi)浸潤、播散,周圍脂肪浸潤等,與腫瘤難以鑒別,常被誤診[14]。而縱隔淋巴結(jié)轉(zhuǎn)移瘤大多表現(xiàn)為不對稱性,內(nèi)可見液化壞死,增強可呈不均勻強化[15],這導(dǎo)致縱隔淋巴結(jié)結(jié)核與縱隔淋巴結(jié)轉(zhuǎn)移瘤的均勻或不均勻強化表現(xiàn)存在很多交叉。因此,當(dāng)肺內(nèi)病變不典型難以判斷其性質(zhì),如成人原發(fā)性肺結(jié)核[5],或肺結(jié)核合并肺癌,但肺內(nèi)癌性病變比較隱蔽[16],或僅有縱隔淋巴結(jié)腫大但肺內(nèi)無明顯病變時,僅靠常規(guī)的CT檢查均難以判斷。而對于淋巴結(jié)轉(zhuǎn)移瘤有較好判斷能力的18F-氟脫氧葡萄糖正電子發(fā)射計算機斷層顯像(18F-FDG PET-CT)檢查,對胸內(nèi)淋巴結(jié)結(jié)核的鑒別作用也相對有限,如一項對18F-FDG PET-CT肺外結(jié)核影像表現(xiàn)的研究表明,淋巴結(jié)結(jié)核的誤診率高達70.6%[6],這可能是惡性病灶與結(jié)核病灶的SUV值有極大的重疊,無法單純從攝取值的高低來區(qū)分兩病[15]。因此,病理及細菌學(xué)檢查依舊是鑒別縱隔淋巴結(jié)結(jié)核、非小細胞肺癌和縱隔淋巴結(jié)轉(zhuǎn)移瘤的金標(biāo)準[16],但病理及細菌學(xué)診斷需要穿刺活檢或術(shù)后病理獲得。在某些情況下,若穿刺活檢及手術(shù)無法進行而不能及時獲得病理結(jié)果,則會影響疾病的及時診斷。
近年來,放射組學(xué)發(fā)展迅速,它將醫(yī)學(xué)圖像轉(zhuǎn)換成高維圖像,通過定量的高通量提取來挖掘數(shù)據(jù)特征并分析以供決策支持。目前,放射組學(xué)在判斷肺小結(jié)節(jié)良惡性、指導(dǎo)治療肺癌及預(yù)后判斷等方面都顯示出良好的敏感度和預(yù)測價值[17-19]。本研究采用放射組學(xué)來提取縱隔淋巴結(jié)結(jié)核與非小細胞肺癌縱隔淋巴結(jié)轉(zhuǎn)移瘤的放射組學(xué)特征,在原始圖像上提取了1409 個特征。在特征選擇過程中,為了避免“維度災(zāi)難”,我們依據(jù)單因素logistic回歸分析結(jié)果選擇了那些有意義的放射組學(xué)特征,并通過考慮共線性的影響進一步進行特征篩選,篩選出7個紋理分析特征組和1個一階統(tǒng)計特征組,利用這些放射組學(xué)特征首先采用5折交叉驗證策略的建模策略對分類器進行篩選,選擇了診斷效果較好的LR和SVM分類器,再將所有數(shù)據(jù)隨機分為建模組(訓(xùn)練組)和驗證組(測試組)建立LR和SVM分類器模型,并驗證其鑒別效果,結(jié)果表明兩個分類器模型的AUC均超過0.8,且具有良好的的敏感度和特異度;另外,依據(jù)放射組學(xué)數(shù)據(jù)建立的LR模型和SVM模型在訓(xùn)練集上的診斷效果與測試集差別均不大,說明模型診斷效果在測試集中仍然穩(wěn)定,外推時結(jié)果可靠,這些均提示定量分析放射組學(xué)特征有助于縱隔淋巴結(jié)結(jié)核和非小細胞肺癌縱隔淋巴結(jié)轉(zhuǎn)移瘤的鑒別診斷。
研究結(jié)果顯示,非小細胞肺癌縱隔淋巴結(jié)轉(zhuǎn)移瘤組VOI數(shù)量明顯少于胸內(nèi)淋巴結(jié)結(jié)核組,可能與未把所有轉(zhuǎn)移的淋巴結(jié)計入縱隔淋巴結(jié)轉(zhuǎn)移組有關(guān),因為有部分淋巴結(jié)是活檢病理結(jié)果,但并沒有包括所有已經(jīng)轉(zhuǎn)移且大于1 cm的淋巴結(jié);只有手術(shù)組將所有轉(zhuǎn)移且大于1 cm的淋巴結(jié)計入結(jié)果。
CT影像放射組學(xué)研究可以評估腫瘤與淋巴結(jié)的組織密度、形狀和紋理[20-22],早期的研究之一是將紋理測量的相關(guān)性和差異熵作為區(qū)分肺部良惡性結(jié)節(jié)的主要特征[23-25]。但有研究表明,放射組學(xué)研究中很多基于紋理或統(tǒng)計特征的放射組學(xué)特征存在強烈的特征-腫瘤體積混雜效應(yīng),但灰度值相關(guān)特征與體積不存在交互作用,這可以保證其穩(wěn)定的預(yù)測和鑒別能力[26]。本研究選出的8個特征中有7個為灰度值相關(guān)放射組學(xué)特征,這避免了因病灶體積與放射組學(xué)特征間的擾動而導(dǎo)致的非魯棒性[27]對鑒別診斷效果的影響。
本研究曾在放射組學(xué)特征模型的基礎(chǔ)上增加了患者性別和年齡的兩個個體特征,但這并未使模型的診斷性能得到明顯改善,原因可能在于研究采取的特征篩選策略只是針對放射組學(xué)特征的篩選,這樣可以保證所篩選出的放射組學(xué)特征間有意義且不存在共線性,而兩種疾病患者間的年齡存在明顯差異,且與所篩選出的放射組學(xué)特征間存在相關(guān)性,因此,將這兩個特征加入模型后并未提升模型的診斷性能。因此,只包含放射組學(xué)特征的分類器模型的鑒別診斷效果更進一步驗證了放射組學(xué)對兩種疾病的鑒別診斷能力。
本研究還有一些不足:(1)轉(zhuǎn)移瘤組患者樣本量偏少,可能會影響模型的穩(wěn)定性,需繼續(xù)擴大樣本量進一步研究;(2)轉(zhuǎn)移瘤組部分患者為穿刺活檢病理結(jié)果,未納入已經(jīng)轉(zhuǎn)移且大于1 cm的淋巴結(jié)進行統(tǒng)計分析,影響本組統(tǒng)計樣本的全面性;(3)本文主要討論放射組學(xué)的鑒別診斷價值,機器學(xué)習(xí)模型中未納入患者臨床特征;(4)本研究所采用的分類器為基礎(chǔ)機器學(xué)習(xí)分類器,隨著深度學(xué)習(xí)方法的發(fā)展及其在疾病預(yù)測和診斷中的應(yīng)用,后續(xù)我們會采用深度學(xué)習(xí)模型進一步探討放射組學(xué)在這兩種疾病中的診斷價值。
總之,本文通過圖像分隔、放射組學(xué)特征提取及定量分析,建立了機器學(xué)習(xí)方法的交叉驗證模型,該模型在縱隔淋巴結(jié)結(jié)核與非小細胞肺癌縱隔淋巴結(jié)轉(zhuǎn)移瘤的鑒別中具有較好的診斷效能,為這兩種疾病的鑒別診斷提供了新的有效的方法。
利益沖突所有作者均聲明不存在利益沖突
作者貢獻袁小記:實施研究、論文撰寫和修改;孫秀彬:數(shù)據(jù)統(tǒng)計學(xué)復(fù)核及論文修改;韓榕和倪聰慧:數(shù)據(jù)收集;王武章和于德新:實施研究、論文修改