楊 鵬 武志峰
山西白求恩醫(yī)院(山西醫(yī)學(xué)科學(xué)院)放射科(山西 太原 030012)
近年來,甲狀腺結(jié)節(jié)發(fā)病率呈上升趨勢(shì)[1]。甲狀腺結(jié)節(jié)非常常見:可觸及結(jié)節(jié)的患病率約為4%~18.8%。尸檢病理檢查發(fā)現(xiàn)的甲狀腺結(jié)節(jié)患病率接近50%,判定結(jié)節(jié)良惡性對(duì)后續(xù)治療及疾病轉(zhuǎn)歸至關(guān)重要[2]。但在影像檢查中,良惡性結(jié)節(jié)診斷缺乏特異性,術(shù)前誤診率高達(dá) 40%~70%[3]。目前對(duì)于甲狀腺結(jié)節(jié)的主要檢查手段,首選仍然是超聲,超聲檢查的優(yōu)點(diǎn)有價(jià)格低、無創(chuàng)及實(shí)時(shí)成像等,但是超聲結(jié)果的準(zhǔn)確性與操作者的經(jīng)驗(yàn)及手法有比較密切的關(guān)系,同時(shí)對(duì)于胸骨后病變,可能評(píng)估受限。
影像組學(xué)是近年來新興的影像分析技術(shù),是從傳統(tǒng)的影像中提取高通量特征來量化腫瘤病灶,并通過深度學(xué)習(xí)的方法挖掘與病理有潛在關(guān)聯(lián)的特征,用于疾病的診斷及預(yù)后評(píng)估。本研究是基于胸部CT獲得的圖像建立影像組學(xué)模型,以期通過胸部CT機(jī)會(huì)性篩查,提高對(duì)甲狀腺結(jié)節(jié)良惡性的鑒別能力。
1.1 一般資料回顧性搜集2020年9月到2021年12月山西白求恩醫(yī)院經(jīng)手術(shù)病理證實(shí)的甲狀腺結(jié)節(jié)患者。
納入標(biāo)準(zhǔn):術(shù)前接受胸部 CT檢查,且檢查與手術(shù)時(shí)間間隔 1~15 d;無其他腫瘤病史;術(shù)前超聲檢查甲狀腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(thyroid imaging-reporting and data system,TI-RADS)分級(jí)為Ⅱ~Ⅳ級(jí);病灶直徑>0.6cm;初診患者,病灶未經(jīng)穿刺及放化療。排除標(biāo)準(zhǔn):圖像質(zhì)量較差;CT檢查前接受穿刺活檢或其他治療手段。
1.2 影像檢查方法采用德國 Siemens Definition 雙源 64層 CT掃描儀,管電壓 120 kV,管電流 250 mAs,螺距1.0,矩陣512×512,層厚1.0mm,掃描前訓(xùn)練患者呼吸屏氣,掃描時(shí)囑患者仰臥、頸過仰,肩部盡量外擴(kuò),雙手伸過頭頂,禁吞咽動(dòng)作。掃描范圍自下頜至肺底。
1.3 圖像分析和特征提取本研究選取患者的CT平掃縱膈窗1mm薄層圖像,將顯示病灶的薄層圖像以DICOM的格式上傳至達(dá)爾文醫(yī)準(zhǔn)科研平臺(tái),分層隨機(jī)以8:2的比例分隔為訓(xùn)練組及測(cè)試組。首先由一位具有5年頸部疾病影像診斷經(jīng)驗(yàn)的醫(yī)師,根據(jù)胸部CT圖像上甲狀腺結(jié)節(jié)中心層面進(jìn)行ROI的勾畫,ROI應(yīng)避免壞死、囊變及鈣化區(qū)域,并在相鄰的上一層及下一層手動(dòng)勾畫ROI;再由一位有10年以上頸部疾病診斷經(jīng)驗(yàn)的主任醫(yī)師確認(rèn)ROI勾畫結(jié)果,見圖1。
圖1 男,65歲,甲狀腺右側(cè)葉乳頭狀甲狀腺癌,左圖在達(dá)爾文科研平臺(tái)上薄層病灶中心層面手動(dòng)勾畫ROI(紅色實(shí)線區(qū)域),右圖為勾畫感興趣區(qū)的三維立體顯示。
采用達(dá)爾文科研平臺(tái)內(nèi)置的R語言算法完成特征篩選,對(duì)CT圖像進(jìn)行最小、最大值歸一化預(yù)處理,對(duì)每一維度特征的線性進(jìn)行拉伸。然后采用Lasso Glogistic 回歸模型進(jìn)行模型選擇,對(duì)特征的重要性進(jìn)行評(píng)估,通過這些模型給出的重要性分?jǐn)?shù),篩去低于閾值的特征。最后以篩選出的特征維度為特征參數(shù)構(gòu)建 Lasso Glogistic 回歸模型,模型計(jì)算公式見表1,采用ROC曲線評(píng)價(jià)模型的診斷效能,計(jì)算敏感度、特異度和診斷符合率。
2.1 基本資料回顧性收集2020年9月到2021年12月山西白求恩醫(yī)院經(jīng)手術(shù)病理證實(shí)的甲狀腺結(jié)節(jié)患者。共收集甲狀腺結(jié)節(jié)患者185例,根據(jù)2017版WHO甲狀腺腫瘤分類簡(jiǎn)表[4],排除23例病理類型為濾泡性腫瘤、惡性潛能未定的濾泡性腫瘤(FT-UMP)、惡性潛能未定的高分化腫瘤(WT-UMP)等交界性或不確定性腫瘤的病例。共納入162例患者,其中男36例、女126例,年齡25~74 (49±11)歲;共186枚結(jié)節(jié),其中良性結(jié)節(jié)104枚,包括結(jié)節(jié)性甲狀腺腫102枚,濾泡性腺瘤1枚,嗜酸細(xì)胞腺瘤1枚;惡性結(jié)節(jié)82枚,其中乳頭狀癌75枚,濾泡性癌3枚,未分化癌1枚,肉瘤1枚,淋巴瘤1枚,低分化鱗狀細(xì)胞癌1枚。
2.2 特征降維及模型選擇運(yùn)用達(dá)爾文平臺(tái)(Darwin research platform)軟件內(nèi)置的特征降維組件進(jìn)行降維。共提取1316個(gè)特征,首先經(jīng)過最大絕對(duì)值歸一化和最小最大值歸一化,數(shù)據(jù)預(yù)處理組件用于對(duì)原始的特征向量進(jìn)行拉伸、標(biāo)準(zhǔn)化或者歸一化處理,將每一維度線性拉伸到(0,1)區(qū)間內(nèi),共獲得34個(gè)特征,采用Lasso Glogistic 回歸模型進(jìn)行模型選擇,對(duì)特征的重要性進(jìn)行評(píng)估,通過這些模型給出的重要性分?jǐn)?shù),篩去低于閾值的特征,共獲得8個(gè)選擇特征維度。包括,依賴不均勻性 (dependence Non-uniformity normalized,DNN)、小依賴低灰度優(yōu)勢(shì)(small dependence low gray level emphasis,SDLGLE)、相關(guān)性關(guān)聯(lián)措施(imc1)量化紋理的復(fù)雜性、最大概率(maximum probability,MP)、依賴方差(dependence variance)、區(qū)域大小不均勻歸一化(size zone non-uniformity normalized,SZNN)、伸長(zhǎng)(elongation)、低灰度優(yōu)勢(shì)(low gray level emphasis,LGLE),最后以篩選出的8個(gè)特征維度為特征參數(shù)構(gòu)建 Lasso Glogistic 回歸模型,模型公式如表1,并進(jìn)行ROC曲線分析。最終得出結(jié)論,訓(xùn)練組模型的曲線下面積為0.83(95%CI:0.73,0.93),靈敏度和特異度分別為 88.7%、82.0%,診斷準(zhǔn)確率 75%;和測(cè)試組線下曲線下面積為0.81(95%CI:0.6,0.99),靈敏度和特異度分別為 88.5%、84.6%,診斷準(zhǔn)確率 76.13%,見圖2。
表1 預(yù)測(cè)模型模型公式
圖2 圖2A為訓(xùn)練組ROC曲線,AUC值為0.83(95%可信區(qū)間:0.73-0.93),圖2B為測(cè)試組ROC曲線,AUC值為0.81(95%CI:0.6,0.99)。
近年來隨著低劑量 CT的推廣應(yīng)用,安全劑量范圍內(nèi)CT檢查在甲狀腺疾病中的臨床應(yīng)用越來越多[5]。本研究基于CT平掃圖像為基礎(chǔ),通過影像組學(xué)模型的建立完成對(duì)甲狀腺結(jié)節(jié)的良惡性的預(yù)測(cè)。雖然超聲檢查仍然是甲狀腺結(jié)節(jié)診斷的重要檢查手段,但近年來CT及MR運(yùn)用于甲狀腺結(jié)節(jié)良惡性的診斷及甲狀腺癌淋巴結(jié)轉(zhuǎn)移的研究逐漸增多。趙泓博,尹昳麗等關(guān)于影像組學(xué)模型預(yù)測(cè)甲狀腺乳頭狀癌頸部淋巴結(jié)轉(zhuǎn)移的研究中,對(duì)于淋巴結(jié)轉(zhuǎn)移的預(yù)測(cè),AUC值達(dá)85%[6]。
影像組學(xué)最早于2012年提出,作為一種新興的影像分析方法,其目的是利用大數(shù)據(jù)分析技術(shù),從影像數(shù)據(jù)中挖掘可量化病變的海量特征,并構(gòu)建特征性影像組學(xué)標(biāo)簽,以期解析影像與病理、臨床的潛在關(guān)聯(lián),尤其是一些高階紋理特征,它們不僅反映了腫瘤組織學(xué)的異質(zhì)性,甚至還在一定程度上反映出相應(yīng)的遺傳學(xué)差異[7]。紋理特征是結(jié)構(gòu)內(nèi)部體素分布差異的表現(xiàn),是基于特定像素的聯(lián)合概率分布。惡性腫瘤內(nèi)部結(jié)構(gòu)往往比較復(fù)雜,主要原因是腫瘤內(nèi)出現(xiàn)壞死、腫瘤血管的異常增殖以及細(xì)胞壁破壞所致通透性的改變,進(jìn)而導(dǎo)致影像灰度的差異,所以其紋理特征會(huì)出現(xiàn)差異。上述變化肉眼不易察覺,但通過紋理特征可以發(fā)現(xiàn),且不受主觀影響[8]。基于CT圖像的紋理分析已被發(fā)現(xiàn)與病理信息相關(guān)[9-10]。
本研究共研究基于胸部縱膈窗CT 平掃圖像影像組學(xué)對(duì)甲狀腺結(jié)節(jié)進(jìn)行評(píng)估,經(jīng)預(yù)處理和特征降維,結(jié)果顯示8個(gè)紋理特征均具有預(yù)測(cè)價(jià)值.其中灰度依賴矩陣特征4個(gè)、灰度共生矩陣特征2個(gè)、灰度區(qū)域大小矩陣特征1個(gè)及一階特征1個(gè)。本研究中,紋理特征數(shù)量最多,說明腫瘤的內(nèi)部結(jié)構(gòu)及異質(zhì)性與結(jié)節(jié)良惡性密切相關(guān),但單個(gè)特征所占權(quán)重不大,可能與單個(gè)紋理特征僅能反映病灶的部分內(nèi)部特征有關(guān),需綜合多個(gè)紋理特征才能提高其診斷效能。本研究通過 Lasso Glogistic 回歸模型訓(xùn)練及預(yù)測(cè)甲狀腺結(jié)節(jié)的良惡性,得出測(cè)試組AUC面積為0.81,有較高的診斷效能。LASSO是目前應(yīng)用最多的特征篩選方法,它通過增加約束條件、構(gòu)建懲罰函數(shù)的方式對(duì)模型中的系數(shù)進(jìn)行壓縮,一些影響較小或沒有影響的自變量系數(shù)被壓縮為 0,僅保留系數(shù)非 0的自變量。其中,由參數(shù) λ控制懲罰力度,λ越小表示懲罰力度越小,容易導(dǎo)致過擬合,反之懲罰力度大會(huì)造成擬合不足,故而λ值非常重要[11]。
影像組學(xué)的紋理分析在腫瘤影像中的應(yīng)用主要是為了揭示腫瘤的臨床相關(guān)特征,而目前大家對(duì)于影像組學(xué)的開發(fā)主要集中于基于紋理分析的計(jì)算機(jī)輔助診斷(CADx)系統(tǒng),可以幫助區(qū)別甲狀腺結(jié)節(jié)的良惡性,自動(dòng)甲狀腺結(jié)節(jié)檢測(cè)和經(jīng)典化系統(tǒng)的目標(biāo)是實(shí)現(xiàn)至少可與標(biāo)準(zhǔn)細(xì)針抽吸檢查相媲美的性能[12]。本研究創(chuàng)新之處在于運(yùn)用了胸部CT縱膈窗圖像,不僅可以充分利用機(jī)會(huì)性篩查的影像數(shù)據(jù),又能盡早發(fā)現(xiàn)甲狀腺病變,為患者的診斷、治療及預(yù)后起到重要作用。然而由于胸部CT掃描時(shí)雙手位置的差異所導(dǎo)致圖像質(zhì)量參差不齊的問題,仍需要解決;對(duì)于患者手臂擺放位置,仍需要不斷探索,從而獲得最佳圖像質(zhì)量;其次甲狀腺結(jié)節(jié)病灶基于手工繪出,存在較大誤差,隨人工智能的不斷發(fā)展,可通過深度學(xué)習(xí)等技術(shù)手段實(shí)現(xiàn)病灶的繪畫,能夠進(jìn)一步降低誤差[13]。雖然目前影像組學(xué)正在興起,并且贏得廣大影像工作者的追捧,但由于其尚處于起步階段,仍然不太成熟,可重復(fù)性較差,多中心數(shù)據(jù)采集與單中心數(shù)據(jù)相比,其提取的特征仍存在一定差異[14]。