何巧,李芳 綜述 孫輝 審校
(吉林大學中日聯(lián)誼醫(yī)院 甲狀腺外科/吉林省外科轉化醫(yī)學重點實驗室/吉林省甲狀腺疾病防治工程實驗室,吉林長春 130033)
超聲是甲狀腺結節(jié)的首選檢查方法。為了更好地鑒別良惡性,優(yōu)化結節(jié)管理,2009年甲狀腺影像報告和數(shù)據(jù)系統(tǒng)(thyroid imaging reporting and data system,TIRADS)被首次提出。歷經(jīng)十年發(fā)展,TIRADS不斷更新迭代,臨床應用日趨廣泛。對于外科醫(yī)生,無論是閱讀超聲報告或是親自超聲檢查,分析、領悟并掌握TIRADS內涵,有助于有效解讀報告并進行準確診斷評估,從而制定合理診療策略。本文從TIRADS的發(fā)展史及其特點、診斷效能及相關影響因素、臨床應用現(xiàn)況和臨床研究熱點方面進行綜述。
甲狀腺超聲檢查起步較晚,應用管理不盡規(guī)范。2009年,Horvath等[1-2]先后提出了TIRADS概念。此后,各國學者對TIRADS進行多次改良、簡化、更新,如韓國Kwak版、法國Russ版,均取得較為廣泛的臨床應用[3-4];各國學術組織也制訂了相應的甲狀腺超聲風險分層和管理體系,如2009年美國甲狀腺協(xié)會(ATA)、2010年美國臨床內分泌醫(yī)師協(xié)會/美國內分泌協(xié)會/歐洲甲狀腺協(xié)會(AACE/ACE/ETA)、2011年韓國甲狀腺放射學會(KSThR)等[5-7]。
值得關注的是,領銜制定BIRADS的美國放射學會(ACR)于2015年和2017年分別發(fā)表“甲狀腺超聲報告詞典”和“ACR甲狀腺影像報告和數(shù)據(jù)系統(tǒng)”兩部白皮書[8-9]。ACR-TIRADS評估5類超聲征象并采用積分制,將結節(jié)分為TR1~TR5,并結合大小給出FNA、隨訪或無需隨訪的明確建議,簡便實用,可操作性強。此后,各版TIRADS相繼更新或創(chuàng)建,2016年韓國更新Ks-TIRADS、法國出臺French-TIRADS、2017年ETA創(chuàng)建EUTIRADS[10-12]。在國內,2017年中國醫(yī)師協(xié)會超聲醫(yī)師分會和中華醫(yī)學超聲雜志編委會淺表器官學組也相繼制定了相應的甲狀腺超聲危險分層和管理體系[13-14]。
簡而言之,TIRADS的發(fā)展趨勢具有3個特點:⑴ 簡單實用化。Horvath和Park版涉及超聲征象及疾病模型多達10余種,直到Kwak將其簡化為5項可疑征象,才開始被臨床所接受。后續(xù)各版本可疑征象都不超過5個。⑵ 規(guī)范明確化。最初術語、報告、診療建議均相對雜亂含糊,后逐漸注重超聲術語的明確定義、檢查報告的規(guī)范書寫、診療建議的具體參考。⑶ 定量積分化。最初僅對結節(jié)性質進行主觀描述,后逐漸對結節(jié)性質進行分級、賦值,從而對惡性風險有了客觀量化。
診斷效能的評價指標包括兩類:一是對良惡性結節(jié)鑒別的敏感度、特異度、準確度、陽性預測值、陰性預測值;二是指根據(jù)TIRADS分級推薦活檢的準確性,包括活檢惡性率(活檢中惡性結節(jié)數(shù)/活檢結節(jié)總數(shù))、不必要活檢率(活檢中良性結節(jié)數(shù)/結節(jié)總數(shù))。各版本TIRADS的診斷效能不一(表1)。Ha等[15]對比研究了7個版本的TIRADS,結果顯示:ACR-TIRADS、French-TIRADS、AACE/ACE/AME的特異度、準確度、陽性預測值較高,但敏感度、陰性預測值較低,活檢惡性率較高,不必要活檢率較低;Ks-TIRADS、NCCN、ATA反之,可以看出其相對較為激進。
⑴ 大小:微小結節(jié)超聲評估假陽性率較高,即便是經(jīng)驗豐富的醫(yī)生評估<5 mm的結節(jié),假陽性率仍可高達68.2%[23]。⑵ 位置:位于峽部、錐狀葉及腺葉兩極的結節(jié),因周圍正常組織少,回聲強度的判斷有一定困難,從而較易導致假陰性結果[11]。⑶ 合并其它病變:當存在橋本及亞急性甲狀腺炎等彌漫性病變時,腺體背景回聲紊亂,易導致可疑征象的誤判,從而降低TIRADS診斷效能[11]。⑷ 病理類型:目前所有的風險分層都主要是針對經(jīng)典型PTC。但對于FVPTC及FTC,更多的表現(xiàn)為無鈣化、邊界規(guī)則、縱橫比<1、等/高回聲等良性征象,因而更易誤判為低到中度可疑[24]。對于MTC,約1/3超聲表現(xiàn)為良性征象,可被分類為中度可疑[25],只有大小達到較高標準方推薦活檢,因此可能延誤MTC的早期診斷及治療。⑸TIRADS不能分類結節(jié):導致無法分類的原因主要有:本身缺乏相應類別或超聲特征無法判別以致無法分類,如鈣化密集及后方聲影導致結節(jié)成分、回聲、邊緣等不能確定。Ha等[15]研究表明,應用ATA超聲模型時,約有5%的結節(jié)不能進行分類,但其惡性率可達19%。當將不能分類的結節(jié)歸入中等可疑風險時,該模型的敏感性可有所提高(89.6%vs. 93.8%)。⑹ 觀察者偏倚:超聲診斷效能易受到醫(yī)生經(jīng)驗的影響,較易誤判的超聲特征有邊緣、成分、回聲等。研究指出,隨著診療經(jīng)驗的增加,觀察者偏倚減小,TIRADS診斷效能也相應有所提高[23]。
表1 10個版本甲狀腺超聲體系的診斷效能比較Table1 Comparison of diagnostic efficacy of ten versions of thyroid ultrasound system
TIRADS的臨床應用價值主要體現(xiàn)在4個方面:第一,對于暫無條件開展FNA的基層醫(yī)院,應用TIRADS對結節(jié)進行惡性風險分層管理,將使診療更加合理化、精準化。按照TIRADS相關標準嚴格進行分級,客觀評價惡性風險,減少診斷性手術。第二,作為FNA適應證的參考標準,將有利于減少不必要的有創(chuàng)檢查及診斷手術。與個人經(jīng)驗相比,使用ACR-TIRADS后推薦活檢減少高達41%,并且這部分結節(jié)大部分為良性[26]。第三,對于FNA結果I-IV類的結節(jié),聯(lián)合TIRADS將有助于更加科學合理地制定進一步的診療策略,減少重復穿刺及漏診,合理調整隨訪方案。已有研究[27]將TIRADS與細胞學診斷系統(tǒng)結合,創(chuàng)建了新的分級系統(tǒng),如“CU”系統(tǒng)(Cytology-Ultrasonography)。Yoon等[28]報道顯示,當細胞學無法診斷而TIRADS分級為3、4a類結節(jié),其惡性率相對較低(1.6%、3%),建議連續(xù)超聲監(jiān)測而非重復FNA。此外,使用TIRADS結構化報告模板,不僅便于動態(tài)評估和同行溝通,還有助于提高臨床效率。結構化報告模板對每個結節(jié)的征象描述完整率達96%~100%,報告時間不超過20 s,僅有6%無診療建議,而未使用模板時則高達34%[29-30]。
但由于目前國內外均缺乏甲狀腺超聲檢查、診斷、管理的統(tǒng)一標準,在此基礎之上的TIRADS應用也較為混亂,尤其是外科醫(yī)生超聲理論知識和實踐經(jīng)驗相對不足,更應注重以下幾個亟待解決的問題:首先,超聲描述術語不標準、征象指標不統(tǒng)一,報告結構不盡相同、診療建議尚不規(guī)范。其次,TIRADS應用與否的觀念尚未達成共識,超聲科、外科、內科、核醫(yī)學科等多學科間的溝通有所受限。再者,國內醫(yī)院使用多個版本TIRADS,不同醫(yī)院掌握的分類方法和處理原則有所差異,尚無通用標準。所以當患者攜帶超聲報告單上提示TIRADS分級但沒有準確標明版本時,其參考價值仍有待商榷。
隨著TIRADS相關循證醫(yī)學證據(jù)積累,臨床應用逐漸增多,學界關注度日趨增高。近期中華醫(yī)學會超聲分會淺表器官學組發(fā)起的一項調查顯示,89%的超聲科醫(yī)生、92%的內外科等臨床科室醫(yī)生、95%的放射科醫(yī)生,均支持建立中國版的C-TIRADS。鑒于目前國內使用的TIRADS版本均為國外學者創(chuàng)建,并不一定完全適用于中國國情,因此C-TIRADS的創(chuàng)建將可能有助于更為有效地改善目前的混亂局面。
TIRADS結合細胞學結果、分子檢測結果、臨床信息等,或將進一步提高特異性和準確性。例如,加入年齡和性別因素后,ACR-TIRADS及AACE/ACE/AME的AUC顯著提高(P<0.001)[31];TSH、TgAb水平等也被證實能提高超聲診斷的準確性[32-33]。Ianni等[34]結合臨床(clinical,C)、超聲(ultrasonographic,U)和細胞學(thyroid cytology,T)建立了“CUT”評分系統(tǒng)。同樣地,Zhang等[35]結合病史、性別年齡、體格檢查、甲功等7項臨床信息創(chuàng)建綜合風險分層系統(tǒng),使Kwak-TIRADS的特異度(90.3% vs. 68.2%)、準確度(89.3%vs. 74.9%)及陽性預測值(77.3%vs.52.5%)均有所提高。
2015年ACR出臺了《影像偶發(fā)甲狀腺結節(jié)管理白皮書》,對CT、MRI、核素、超聲檢查中發(fā)現(xiàn)的偶發(fā)結節(jié)的管理作出了一定的指導[36]。由于18FDG的攝取可能標志著低分化DTC和ATC,PET偶發(fā)結節(jié)容易引起患者的恐慌和醫(yī)生過度處理[37]。2015版ATA指南建議局部攝取18FDG>1 cm時應行FNA,但此類結節(jié)惡性率差異大,因此該推薦并未得到充分支持[20]。學者[38]報道TIRADS結合PET檢查,對偶發(fā)結節(jié)性質判斷的特異度和陽性預測值提高,但敏感度及陰性預測值降低。TIRADS對PET偶發(fā)結節(jié)的評估價值還有待進一步驗證。
TIRADS與超聲實時彈性成像或超聲造影聯(lián)合,可提高結節(jié)良惡性鑒別診斷的敏感性、特異性和準確性,特別是4類結節(jié)(Kwak版);與聲脈沖輻射力成像聯(lián)合,可提高甲狀腺微小癌的診斷水平;與剪切波彈性成像聯(lián)合,診斷甲狀腺微小癌的準確性(89.16%)高于TIRADS(87.00%)、剪切波彈性成像(54.49%)的單獨應用[39]。但也有部分研究顯示不同結果,多模態(tài)超聲技術是否可作為TIRADS 分級的輔助診斷技術還需深入研究。
隨著現(xiàn)代科技的發(fā)展,更多先進手段與醫(yī)學結合,涌現(xiàn)出網(wǎng)頁版、手機APP版等多種TIRADS的靈活應用形式。計算機輔助診斷技術(CAD)憑借其自動、高效、客觀以及準確的圖像分析性能為解決普通超聲檢查的局限性找到了新的方案,雖處于半自動階段,但已實現(xiàn)CAD診斷軟件系統(tǒng)的商業(yè)轉化。安克甲狀偵?是全球唯一通過美國FDA及歐盟CE Mark認證的甲狀腺超聲CAD軟件,已在我國、巴西、澳大利亞等開展相關業(yè)務及推廣[40]。同時,神經(jīng)卷積網(wǎng)絡、深度學習等更加高級、復雜的算法也已成為研究熱點。
綜上所述,TIRADS通過惡性風險分層管理,對甲狀腺結節(jié)的診斷和治療有一定提示指導作用。歷經(jīng)10年發(fā)展,整個體系從復雜到簡單,可操作性提高,臨床應用日趨廣泛,科學研究兼具機遇與挑戰(zhàn)。甲狀腺疾病的術前評估、術中決策與術后隨訪多個環(huán)節(jié)均需要超聲技術的支持,甲狀腺外科醫(yī)師通過對TIRADS的理論學習與臨床應用,將更好地規(guī)范掌握甲狀腺超聲技術,從而提高超聲診斷效能。目前,國內外TIRADS版本眾多,亟待更多前瞻性、大樣本研究驗證,以期加強行業(yè)使用規(guī)范,助力甲狀腺結節(jié)的精準診療。