陳璟泰,侯令密,唐云輝,錢雙強,蒲虹羽,高硯春
根據(jù)報道,19%~68%的人存在甲狀腺結(jié)節(jié)[1]。甲狀腺結(jié)節(jié)是甲狀腺癌最常見的臨床表現(xiàn),準確鑒別甲狀腺結(jié)節(jié)良惡性對于患者治療方式的選擇至關(guān)重要。彩超因無創(chuàng)、無電離輻射且價格低廉而被廣泛接受為甲狀腺結(jié)節(jié)的一線影像學檢查手段,但其診斷準確性常與醫(yī)生的經(jīng)驗、水平相關(guān)[2]。
計算機輔助診斷(computer aided diagnosis,CAD)技術(shù)是人工智能與現(xiàn)代醫(yī)學研究的熱點之一。近年來,隨著構(gòu)建人工智能的技術(shù)進步,人們已經(jīng)開發(fā)了基于超聲的CAD系統(tǒng),并被引入商用的超聲診斷軟件[3],在乳腺和甲狀腺腫瘤檢查工作中,其有效性得到了初步驗證[4-5]。人工智能與超聲影像結(jié)合可簡化操作步驟、避免主觀差異性、節(jié)約醫(yī)師資源、縮短報告時間、提高診斷效率,具有廣闊的應用前景。
S-Detect是目前常用的一項針對甲狀腺結(jié)節(jié)的超聲CAD技術(shù),通過前期數(shù)據(jù)學習及算法優(yōu)化,該技術(shù)可對甲狀腺結(jié)節(jié)的良性或惡性進行鑒別診斷。本研究廣泛納入國內(nèi)外多篇文獻進行定量合成,旨在明確S-Detect對甲狀腺結(jié)節(jié)良惡性的鑒別診斷價值。
1.1 文獻納入與排除標準
1.1.1 文獻納入標準 (1)評估S-Detect診斷準確性的研究;(2)必須通過病理學檢查明確甲狀腺結(jié)節(jié)的良惡性;(3)應提供或可以計算出相應的診斷準確性的統(tǒng)計信息,包括真陽性(TP)、假陽性(FP)、假陰性(FN)、真陰性(TN)。
1.1.2 文獻排除標準 (1)研究沒有提供足夠的數(shù)據(jù)來計算TP、FP、FN和TN;(2)重復研究,低質(zhì)量研究,信函,會議論文,病例報告,綜述;(3)與本研究主題無關(guān)。
1.2 文獻檢索策略 計算機檢索PubMed、EMBase、Web of Science、the Cochrane Library、萬方數(shù)據(jù)知識服務平臺、中國知網(wǎng)、維普網(wǎng)和中國生物醫(yī)學文獻服務系統(tǒng),檢索時限為建庫至2021-01-06。中文檢索詞包括:甲狀腺、S-Detect、計算機輔助診斷。本研究搜索了相關(guān)主要出版物中的參考文獻,以確定其他符合條件的研究,并對最終被納入的研究所包含的參考文獻進行了審查,擴大了搜索范圍,以確定其他潛在的相關(guān)研究。英文檢索詞包括S-Detect,thyroid,computer aided diagnosis,Artificial Intelligence等。以PubMed為例,其文獻檢索策略見表1。
表1 PubMed文獻檢索策略Table 1 Search strategy used to identify studies about the value of S-Detect in differentially diagnosing thyroid nodules in PubMed database
1.3 資料提取與質(zhì)量評價 由2名評價者根據(jù)文獻納入與排除標準獨立篩選文獻,確定最終納入研究的文獻。對于文獻檢索過程中出現(xiàn)的爭議,由第3名評價者與前2名評價者共同分析,得出一致的結(jié)論。最終,提取和錄入納入文獻的基本資料,包括第一作者、發(fā)表時間、國家、例數(shù)、年齡、性別、結(jié)節(jié)數(shù)目、探頭頻率、儀器、TP、FP、FN、TN。納入研究的方法學質(zhì)量評價采用 QUADAS(Quality Assessment for Diagnostic Accuracy Studies)工具[6]。QUADAS工具共包括14項條目:每項條目以“是”“否”或“不清楚”進行評價。以上過程均由2名評價者按照標準獨立進行。
1.4 統(tǒng)計學方法 采用Meta-Disc 1.4和Stata 15軟件進行統(tǒng)計學分析。通過繪制集成受試者工作特征(SROC)曲線觀察圖形是否為“肩臂狀”,再通過計算Spearman秩相關(guān)系數(shù)判斷是否存在閾值效應。通過I2判斷研究的異質(zhì)性大小,I2<50%且P>0.1時采用固定效應模型進行分析,否則采用隨機效應模型。統(tǒng)計指標為合并靈敏度、合并特異度、合并陽性似然比、合并陰性似然比、合并診斷比值比和受試者工作特征(ROC)曲線下面積(AUC);檢驗水準α=0.05。采用“逐一排除法”進行敏感性分析;繪制Deek漏斗圖判斷發(fā)表偏倚,P<0.10時表明存在發(fā)表偏倚。
2.1 文獻檢索結(jié)果 共檢出相關(guān)文獻962篇,經(jīng)逐層篩選后,最終納入16篇文獻[5,7-21]、2 453例患者,其中 4 篇為中文文獻[7-10]、12 篇為英文文獻[5,11-21]。文獻篩選流程見圖1。納入文獻的基本特征見表2。根據(jù)QUADAS工具評價結(jié)果,納入文獻中評價為“是”的條目數(shù)均≥11項,可見納入文獻的質(zhì)量較好,文獻質(zhì)量評價結(jié)果見表3。
表2 納入文獻的基本特征Table 2 Basic characteristics of included studies
表3 納入文獻的質(zhì)量評價結(jié)果Table 3 Quality assessment of included studies
圖1 文獻篩選流程圖Figure 1 Flowchart of literature screening
2.2 Meta分析結(jié)果 SROC平面散點圖未呈明顯“肩臂狀”,Spearman秩相關(guān)系數(shù)為0.193,P=0.474,提示各文獻間不存在由閾值效應引起的異質(zhì)性。所有結(jié)局指標I2>50%,故采用隨機效應模型進行Meta分析。Meta分析結(jié)果顯示,S-Detect鑒別診斷甲狀腺結(jié)節(jié)良惡性的合并靈敏度、合并特異度、合并陽性似然比、合并陰性似然比、合并診斷比值比、AUC分別為0.84〔95%CI(0.81,0.86),P=0.003 6〕、0.71〔95%CI(0.69,0.73),P<0.000 1〕、3.31〔95%CI(2.45,4.47),P<0.000 1〕、0.22〔95%CI(0.17,0.29),P=0.000 6〕、15.93〔95%CI(9.85,25.78),P<0.000 1〕、0.89〔95%CI(0.84,0.94)〕。詳見圖 2~7。
圖2 S-Detect鑒別診斷甲狀腺結(jié)節(jié)良惡性的合并靈敏度Figure 2 Pooled sensitivity of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
圖3 S-Detect鑒別診斷甲狀腺結(jié)節(jié)良惡性的合并特異度Figure 3 Pooled specificity of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
圖4 S-Detect診斷甲狀腺結(jié)節(jié)良惡性的合并陽性似然比Figure 4 Pooled positive likelihood ratio of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
圖5 S-Detect診斷甲狀腺結(jié)節(jié)良惡性的合并陰性似然比Figure 5 Pooled negative likelihood ratio of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
圖6 S-Detect診斷甲狀腺結(jié)節(jié)良惡性的合并診斷比值比Figure 6 Pooled diagnostic odds ratio of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
圖7 S-Detect診斷甲狀腺結(jié)節(jié)良惡性的SROC曲線Figure 7 SROC curves of S-Detect in the differential diagnosis of benign and malignant thyroid nodules
2.3 敏感性分析 逐一剔除單項研究后對其余研究重新進行Meta分析,結(jié)果顯示各結(jié)局指標合并效應量均未發(fā)生明顯變化,提示本研究結(jié)果穩(wěn)定、可靠。
2.4 發(fā)表偏倚 Deek漏斗圖基本對稱且趨近于垂直(圖8),P=0.38,提示無發(fā)表偏倚。
圖8 Deek漏斗圖Figure 8 Deek's funnel plot for assessing the publication bias of included studies
近年來甲狀腺結(jié)節(jié)發(fā)病率逐年升高[22],超聲檢查已被廣泛應用于甲狀腺結(jié)節(jié)的診斷。隨著醫(yī)學影像技術(shù)的發(fā)展,彈性成像、超聲造影及人工智能等新技術(shù)被更多地應用于甲狀腺疾病的輔助診斷。為加快診斷過程并減少觀察者之間的差異,目前已開發(fā)CAD系統(tǒng)以幫助放射科醫(yī)生對超聲圖像進行解釋,其中S-Detect是第一個可商購的甲狀腺超聲CAD系統(tǒng)[23],目前其已在多個國家廣泛應用。為驗證S-Detect的臨床應用價值,本研究納入多篇文獻對其在區(qū)分甲狀腺結(jié)節(jié)良惡性方面的診斷性能進行了全面評估。
本研究廣泛收集了國內(nèi)外關(guān)于S-Detect對甲狀腺結(jié)節(jié)良惡性鑒別診斷價值的文獻并進行了Meta分析,結(jié)果顯示,S-Detect鑒別診斷甲狀腺結(jié)節(jié)良惡性的合并靈敏度為0.84,合并特異度為0.71,表明有84%的惡性結(jié)節(jié)和71%的良性結(jié)節(jié)能被S-Detect鑒別;此外,合并陽性似然比為3.31,合并陰性似然比為0.22,AUC=0.89。診斷比值比是檢測診斷準確性的重要指標,其數(shù)值越大表明診斷準確性越高,本研究得出的合并診斷比值比為15.93,表明S-Detect的總體準確性較高。從以上結(jié)果可以看出,S-Detect鑒別診斷甲狀腺結(jié)節(jié)良惡性的靈敏度較佳,但特異度稍低,這可能與S-Detect主要是評價結(jié)節(jié)的形狀、方向、邊界、后方特征、回聲等,對腫塊內(nèi)部的鈣化灶并不敏感,而腫瘤內(nèi)部的微鈣化常是診斷甲狀腺癌的可靠征象;因此,單獨應用S-Detect鑒別診斷甲狀腺結(jié)節(jié)的良惡性可能會增加不必要的穿刺或手術(shù),需要繼續(xù)改進算法,增加陰性病例學習數(shù)量以提高特異度及S-Detect的診斷效率,而S-Detect要替代經(jīng)驗豐富的影像科醫(yī)師還有很長的路要走。YOO等[17]研究表明,與單獨的影像科醫(yī)師相比,CAD系統(tǒng)輔助影像科醫(yī)師的診斷靈敏度更高,這意味著CAD系統(tǒng)使影像科醫(yī)師能夠檢測出更高比例的真正的惡性腫瘤,因此,S-Detect可用于彩超圖像的輔助判斷,為影像科醫(yī)師的決策提供參考。
本研究納入的文獻質(zhì)量較高,且敏感性分析結(jié)果較穩(wěn)定,Deek漏斗圖提示無明顯發(fā)表偏倚,表明本研究分析結(jié)果穩(wěn)定、可信,但本研究也存在局限性:(1)僅納入了中、英文文獻,可能存在語言偏倚;(2)多個結(jié)局指標中存在明顯的異質(zhì)性,可能與納入研究間的結(jié)節(jié)大小、疾病譜構(gòu)成等有關(guān);(3)S-Detect是對錄入的二維超聲圖像進行分析,采用不同標準切面時S-Detect診斷符合率有差異,存在一定誤差;(4)納入的研究多為單中心研究,且樣本量較小,研究結(jié)果可能具有局限性。
綜上所述,當前的證據(jù)顯示,S-Detect對甲狀腺結(jié)節(jié)良惡性的鑒別診斷價值較高,可以作為常規(guī)彩超檢查的有益補充;但是,目前尚不建議將其作為甲狀腺結(jié)節(jié)良惡性診斷的單一確定性檢測方法。此外,為進一步評估S-Detect的價值,還有必要在各個地區(qū)進行大量高質(zhì)量、多中心、大樣本量前瞻性研究。
作者貢獻:陳璟泰、侯令密、高硯春進行文章的構(gòu)思與研究的設計;陳璟泰、侯令密、唐云輝進行研究的實施與可行性分析;陳璟泰、唐云輝、蒲虹羽進行數(shù)據(jù)收集及整理;陳璟泰、錢雙強進行統(tǒng)計學處理,結(jié)果的分析與解釋;陳璟泰撰寫論文;侯令密進行論文的修訂;侯令密、高硯春負責文章的質(zhì)量控制及審校;高硯春對文章整體負責,監(jiān)督管理。
本文無利益沖突。