曹新玥,朱美霖,印隆林*,劉一銘,吳 穎
(1.四川省醫(yī)學科學院·四川省人民醫(yī)院放射科,四川 成都 610072;2.電子科技大學醫(yī)學院,四川 成都 610054;3.西南醫(yī)科大學附屬醫(yī)院放射科,四川 瀘州 646000;4.川北醫(yī)學院附屬醫(yī)院放射科,四川 南充 637000)
腎細胞癌病理分級可用于衡量其惡性程度并預測預后[1],而穿刺活檢為有創(chuàng)檢查,取材局限,且存在出血及種植轉(zhuǎn)移等風險。影像組學可基于醫(yī)學圖像提取數(shù)據(jù)并加以分析,據(jù)以建立的模型能提高診斷效能及預測預后的準確性[2-4]。本研究以Meta分析觀察基于CT影像組學預測腎透明細胞癌(clear cell renal cell carcinoma, ccRCC)病理分級的價值。
1.1 文獻檢索 檢索PubMed、Web of Science、EMbase及中國知網(wǎng)、中國生物醫(yī)學文獻服務系統(tǒng)和萬方醫(yī)學網(wǎng)自建庫至2021年1月文獻,英文檢索詞為“renal cell carcinoma”“radiomic”“texture analysis”“textural analysis”“Fuhrman”“ISUP”“grading”“histogram”,中文檢索詞為“影像組學” “腎癌”“紋理分析”“分級”。
1.2 文獻納入與排除標準 納入標準:①CT影像組學預測ccRCC病理分級相關研究;②納入患者均經(jīng)病理確診為ccRCC,組織病理學分級明確;③中文或英文文獻;④可提取或通過重建得到2×2列聯(lián)表;⑤存在重復研究時,選擇其中樣本量最大者。排除綜述、會議摘要、書籍及評論性文章。
1.3 文獻質(zhì)量評價 由2名研究者獨立評價文獻質(zhì)量及提取資料,發(fā)生分歧時請第3名研究者加入討論并達成一致;若文獻涉及多個相關影像組學模型,則選擇診斷效能最高者進行評價。
以診斷準確性研究質(zhì)量評價 (quality assessment of diagnostic accuracy studies-2, QUADAS-2)標準[5]為基礎,根據(jù)研究內(nèi)容和目的加以調(diào)整,刪除其中“病例選擇”中“是否避免采用病例-對照設計”問題,并于“待評價診斷實驗”中添加了“是否采用多種檢查設備和層厚”問題,判斷納入文獻偏倚風險:若某領域均為“低風險”,則該領域偏倚風險為“低風險”;若某領域存在1~2個“不確定”,則該領域為“不確定”;若某領域存在2個以上“不確定”或 “高風險”,則該領域為“高風險”。
采用影像組學質(zhì)量評分 (radiomics quality score, RQS)[6]于16個維度評價研究方法,得分范圍為-8~36分。
1.4 統(tǒng)計學分析 采用Stata 16.0統(tǒng)計分析軟件。計算Spearman相關系數(shù)r值及P值,判斷是否存在閾值效益,r>0.5且P<0.05為存在閾值效益;若不存在閾值效益,則基于真陽性(true positive, TP)、假陽性(false positive, TP)、假陰性(false negative, FN)及真陰性(true negative, TN)數(shù)據(jù),在雙變量混合效應二元回歸模型基礎上計算合并敏感度(sensitivity, SEN)、合并特異度(specificity, SPE)、陽性似然比(positive likelihood ratio, PLR)、陰性似然比(negative likelihood ratio, NLR)及診斷比值比(diagnostic odds ratio, DOR)。繪制綜合受試者工作特征(summary receiver operating characteristics, SROC)曲線,計算曲線下面積(area under the curve, AUC)。采用Cochran-Q方法和異質(zhì)性指數(shù)(I2)評價文獻異質(zhì)性(檢驗水準α=0.05):I2<50%提示差異無統(tǒng)計學意義,直接行meta分析;I2≥50%為存在異質(zhì)性,以meta回歸分析或亞組分析等方法分析異質(zhì)性來源;如異質(zhì)性明顯(I2>80%),則僅行描述性分析。繪制Deek漏斗圖評估發(fā)表偏倚,P>0.05提示不存在發(fā)表偏倚。以敏感性分析驗證meta分析結(jié)果的穩(wěn)定性及可靠性。
2.1 文獻檢索 初步檢索獲得349篇文獻。經(jīng)篩選后納入16篇[7-22],其中英文文獻10篇[11-17,20-22]、中文文獻6篇[7-10,18-19],共2 489例患者、2 495個ccRCC病灶。見表1、2。
表1 16篇CT影像組學預測ccRCC病理分級文獻基本特征
2.2 文獻質(zhì)量評價 基于文獻與QUADAS-2評價問題的匹配程度進行的適用性評價結(jié)果顯示,16篇納入文獻的適用性均良好(圖1),RQS評分為0~16分,中位數(shù)為6.5分。
2.3 meta分析 CT影像組學預測ccRCC病理分級文獻無明顯閾值效益(r=0.12,P<0.01)而具有較高異質(zhì)性(I2≥50%),其中ROI/VOI、病理分級方式(WHO/ISUP或Fuhrman)及是否采用ML為潛在異質(zhì)性來源(圖2及表3)。
表3 CT影像組學預測ccRCC病理分級異質(zhì)性來源分析結(jié)果
基于CT影像組學預測ccRCC病理分級的合并SEN為0.85[95%CI(0.80,0.89)],合并SPE為0.86[95%CI(0.81,0.90)],PLR為6.00[95%CI(4.30,8.30)],NLR為0.18[95%CI(0.13,0.24)],DOR為34.00[95%CI(20.00,57.00)]、AUC為0.92。見圖3、4。
CT影像組學預測ccRCC病理分級文獻無明顯發(fā)表偏倚(P=0.87,圖5)。敏感性分析結(jié)果顯示本研究結(jié)果具有穩(wěn)定性。
本研究結(jié)果顯示,基于CT影像組學預測ccRCC病理分級效能較佳。
表2 16篇CT影像組學預測ccRCC病理分級文獻的影像組學特征提取表
本研究納入研究均為手動勾畫ROI/VOI,其中部分由不同醫(yī)師進行多次分割以減少偏倚,8篇則僅于單一層面分割ROI,可能低估腫瘤異質(zhì)性[23]。既往研究[24]認為VOI包含較多病灶壞死成分,相比ROI更易出現(xiàn)繪制錯誤及混雜效應而影響結(jié)果。本研究發(fā)現(xiàn)VOI相關研究的AUC(0.93)略高于ROI(0.91),有待更多研究加以驗證。
Fuhrman病理分級系統(tǒng)應用多年,但對多形性核定義不精確,重復性較差[25];WHO提議的新WHO/ISUP分級系統(tǒng)現(xiàn)已逐漸取而代之。本研究發(fā)現(xiàn),以Fuhrman分級進行研究的AUC(0.87)低于WHO/ISUP(0.94,P<0.05),提示病理分級方式為異質(zhì)性來源之一。本研究發(fā)現(xiàn)合并CIF模型的AUC(0.96)略高于未合并CIF模型(0.90),與既往針對非小細胞肺癌影像組學的meta分析[4]結(jié)論類似。有學者[8,14]認為多期相、多序列圖像特征模型預測ccRCC病理分級的效能高于僅單序列。本研究結(jié)果顯示,影像組學結(jié)合ML可提高診斷效能(AUC 0.90提高至0.93),有待進一步證實。
本組文獻平均RQS質(zhì)量較低,與既往關于乳腺癌、腎癌及前列腺的影像組學研究[3,26-27]結(jié)果基本一致,主要原因在于影像組學特征對圖像采集參數(shù)具有依賴性[28-29],而目前影像組學研究多為單中心、小樣本量回顧性研究,缺乏全面的圖像采集數(shù)據(jù),且難以實現(xiàn)標準化圖像采集及重建;另外,多數(shù)影像組學研究未對模型進行獨立驗證,可致模型過擬合而使診斷效能虛高。
綜上,CT影像組學預測ccRCC病理分級效能較佳。本研究主要局限:①納入文獻異質(zhì)性較高;②僅納入中、英文文獻;③部分文獻未提及病例選擇標準及所用盲法;④多為單中心回顧性研究,且部分未設立驗證集。