楊柳瓊,李穎,鄭建軍
塵肺病是勞動者在職業(yè)活動中長期吸入不同致病性的生產(chǎn)性粉塵,并在肺內(nèi)潴留而引起的以肺組織彌漫性纖維化為主的一種全身性疾病[1],其中硅肺病是我國發(fā)病率最高、危害性最強(qiáng)的病種[2]。硅肺病的影像分期是目前主要的病情評估指標(biāo)[3],而分期診斷過程耗時費(fèi)力、可重復(fù)性差,且由于胸片固有缺陷及診斷醫(yī)師主觀性的限制導(dǎo)致最后判別結(jié)果一致性差、誤診率高[4-5]。影像組學(xué)及深度學(xué)習(xí)方法作為醫(yī)學(xué)影像分析的新手段可以挖掘到肉眼觀察不到的深層次信息來進(jìn)行分類和預(yù)測,進(jìn)而無創(chuàng)、全面地評估疾病[6-7]。本研究探討和比較基于CT 影像組學(xué)及深度學(xué)習(xí)方法構(gòu)建的多分類模型對于硅肺病影像分期的預(yù)測能力,現(xiàn)報道如下。
1.1 一般資料 回顧性收集2016 年1 月至2020 年12 月寧波市第二醫(yī)院經(jīng)職業(yè)病診斷且具有明確硅塵接觸史的245 例患者的基本臨床資料、分期結(jié)果及CT 影像資料。納入標(biāo)準(zhǔn):(1)有明確的硅塵接觸史;(2)在X 線檢查前/后1 個月內(nèi)接受CT 檢查;(3)有明確的依據(jù)GBZ70-2015《職業(yè)性塵肺病的診斷》[3]的專家小組鑒定的分期結(jié)果。排除標(biāo)準(zhǔn):(1)除硅肺病外其他類型的塵肺病;(2)CT 圖像質(zhì)量不能滿足診斷要求;(3)合并其他病變,如肺感染性疾病、肺結(jié)核等。最終共納入0 期(無矽肺)104 例,Ⅰ期矽肺病77 例,Ⅱ期矽肺病30 例,Ⅲ期矽肺病24 例。本研究經(jīng)寧波市第二醫(yī)院醫(yī)學(xué)倫理委員會批準(zhǔn)。
1.2 CT 掃描方法 采用Siemens Somatom Definition Flash 及AS 64 排螺旋CT 機(jī)行胸部CT 掃描。掃描參數(shù):管電壓120 kV,自適應(yīng)電流,視野342 mm×267 mm,采集矩陣512×512,軸向圖像層厚5 mm,層間距5 mm,以2 mm層厚重建成像,用此薄層圖像重構(gòu)MIP圖像,投影厚度為10 mm,無間隔成像。
1.3 影像組學(xué)分析方法
1.3.1 圖像分割與特征提取 將MIP 重建圖像重采樣至1 mm×1 mm×1 mm 的體素大小,導(dǎo)入3Dslicer 軟件(version 4.11.0),先由1 名有豐富經(jīng)驗的放射科醫(yī)師在對分期結(jié)果不知情的情況下進(jìn)行半自動圖像分割,具體分割步驟:基于分水嶺方法自動勾勒肺區(qū)域的邊緣并選中,將葉以上支氣管及血管排除在外以減少干擾,然后根據(jù)正常肺實質(zhì)的CT 值閾值(-∞~-750 HU)減去正常肺組織區(qū)域,最后得到病灶加肺紋理區(qū)域,見圖1。逐層進(jìn)行勾畫得到VOI,之后由另1 名醫(yī)師對其分割結(jié)果進(jìn)行審核以提高準(zhǔn)確性。使用Artificial Intelligence Kit(V3.3.0.R,GE Healtheare)軟件對VOI 進(jìn)行特征提取,計算后得到一階特征、形態(tài)學(xué)特征及紋理特征共107 個影像組學(xué)特征。
圖1 ROI 勾畫示意圖
1.3.2 特征篩選與影像組學(xué)建模 對影像組學(xué)特征進(jìn)行歸一化和標(biāo)準(zhǔn)化處理,按照7∶3 的比例隨機(jī)分為訓(xùn)練組和驗證組。依次采用相關(guān)性分析及梯度提升迭代決策樹(GBDT)算法篩選出最有效的特征組合?;谶@些特征采用支持向量機(jī)(SVM)進(jìn)行機(jī)器學(xué)習(xí),采用5 折交叉驗證法訓(xùn)練模型,并計算它們在驗證集中的分類準(zhǔn)確性。
1.4 深度學(xué)習(xí)分析方法(1)數(shù)據(jù)預(yù)處理:為了減少人工勾畫主觀性帶來的差異,本研究使用全肺區(qū)域CT圖像來訓(xùn)練深度學(xué)習(xí)模型,將三維的掩膜數(shù)據(jù)以切片的形式保存為分辨率512×512 大小的JPG 格式,從而將三維數(shù)據(jù)轉(zhuǎn)換成二維圖像,通過縮放、隨機(jī)剪裁等數(shù)據(jù)增強(qiáng)方法來增加模型對于不同數(shù)據(jù)分布條件下的適應(yīng)能力。(2)深度學(xué)習(xí)模型建立:在Ubuntu 系統(tǒng)下采用pytorch 1.04 深度學(xué)習(xí)庫建模。按照4∶1 的比例隨機(jī)分為訓(xùn)練組和驗證組。選擇Hao 等[8]發(fā)表的不確定性導(dǎo)向的圖注意網(wǎng)絡(luò)(UGGAT)方法,這種方法不僅繞過對大規(guī)模標(biāo)注數(shù)據(jù)集的要求,避免三維網(wǎng)絡(luò)由于高維體輸入而導(dǎo)致的過擬合缺陷,而且利用不同切片之間的空間關(guān)系。整個方法由特征提取器和CT 圖像分類器組成,分為兩個階段分別進(jìn)行訓(xùn)練,見圖2。所有試驗均在單卡GTX 2080 Ti 下進(jìn)行。
圖2 UG-GAT 方法流程圖
1.5 統(tǒng)計方法 采用R3.5.1 軟件和Python3.5.6 軟件進(jìn)行分析,計數(shù)資料采用Fisher's 精確檢驗,符合正態(tài)分布的計量資料以均數(shù)±標(biāo)準(zhǔn)差表示,采用單因素方差分析。在訓(xùn)練組和驗證組分別繪制受試者工作特征曲線(ROC),計算曲線下面積(AUC),同時使用準(zhǔn)確度、敏感度、特異度等指標(biāo)來檢驗?zāi)P偷念A(yù)測效能。P <0.05 表示差異有統(tǒng)計學(xué)意義。
2.1 一般資料 本研究共納入245 例患者,不同期別硅肺病患者性別、年齡和工齡差異均無統(tǒng)計學(xué)意義(P >0.05),見表1。
表1 一般資料情況
2.2 影像組學(xué)分析 篩選出7 個影像組學(xué)特征分別為偏度、伸長率、球度、為依賴熵、集群趨勢、聯(lián)合能量和強(qiáng)度,基于上述7 個特征建立的影像組學(xué)模型效能見表2。
表2 影像組學(xué)模型在訓(xùn)練組和驗證組中鑒別各期硅肺病的診斷效能
2.3 深度學(xué)習(xí)模型的效能 基于UG-GAT 網(wǎng)絡(luò)訓(xùn)練的硅肺病分期預(yù)測模型對0 ~Ⅲ期硅肺病分類的AUC、準(zhǔn)確率、敏感度、特異度均高于影像組學(xué)模型,見表3。
表3 深度學(xué)習(xí)模型在訓(xùn)練組和驗證組中鑒別各期硅肺病的診斷效能
按照目前的診斷標(biāo)準(zhǔn)[3],高千伏胸片仍是硅肺病分期的主要依據(jù),但其由于密度分辨率低、組織重疊等原因不能清楚顯示病灶,而CT 圖像克服了這些局限[9],在臨床實際工作中參考CT 圖像已經(jīng)成為醫(yī)師對硅肺病進(jìn)行影像分期診斷時不可或缺的重要環(huán)節(jié)[10]。我國有學(xué)者嘗試參照診斷標(biāo)準(zhǔn)探討CT 圖像的小陰影密集度判定方法并進(jìn)行診斷分期[11],結(jié)果顯示CT 和高千伏胸片對硅肺病分期診斷結(jié)果無明顯差異,但兩者對小陰影總體密集度的判斷符合率低(59.05%),同樣,該方法存在過程繁瑣且嚴(yán)重依賴于診斷醫(yī)師的主觀視覺及診斷經(jīng)驗等問題。
人工智能在醫(yī)學(xué)影像領(lǐng)域的蓬勃發(fā)展為臨床提供了一種新的分析思路,目前也已經(jīng)有一些研究基于X 線胸片訓(xùn)練深度學(xué)習(xí)模型用于硅肺病篩查與分期[12-14],這表明了計算機(jī)系統(tǒng)輔助診斷硅肺病有助于提高診斷效率和準(zhǔn)確性,具有重要的應(yīng)用價值。但既往的研究重點都集中于分析胸片和篩查硅肺病方面,為了克服現(xiàn)有方法的不足,筆者對人工智能技術(shù)應(yīng)用于基于CT 圖像的硅肺病影像分期診斷進(jìn)行探索性研究,使用影像組學(xué)和深度學(xué)習(xí)方法分析學(xué)習(xí)硅肺病CT 圖像特征。本文結(jié)果顯示兩種模型在訓(xùn)練集和驗證集均表現(xiàn)良好,能夠較準(zhǔn)確地鑒別0 期及各期硅肺病,可以為診斷提供一些基于圖像衍生的用于硅肺病分期的放射學(xué)標(biāo)志物。
本研究利用同一批數(shù)據(jù),分別建立了基于CT圖像的傳統(tǒng)影像組學(xué)模型和深度學(xué)習(xí)模型,評估其對于不同期別矽肺病的分類預(yù)測能力。本研究結(jié)果表明CT影像組學(xué)分析可以較準(zhǔn)確地預(yù)測硅肺病分期,且深度學(xué)習(xí)技術(shù)可以進(jìn)一步提高診斷的準(zhǔn)確性,這可能與深度學(xué)習(xí)避免了人工提取特征這一過程有關(guān),深度學(xué)習(xí)方法利用圖像塊進(jìn)行特征提取,避免了分割病灶這一過程,在一定程度上降低了人為因素導(dǎo)致的誤差[15]。另外深度學(xué)習(xí)技術(shù)可以獲得更高層次及更豐富的特征,并能保留圖像的全局信息,也可能進(jìn)一步提高預(yù)測性能。
本研究的局限性:(1)為單中心研究,缺乏外部驗證;(2)由人工手動分割圖像,存在一定的主觀影響;(3)缺乏更多的臨床信息。
利益沖突所有作者聲明無利益沖突