徐吉,張燕
作為最常見的內(nèi)分泌疾病,甲狀腺結(jié)節(jié)可在大約5%的女性和1%的男性中出現(xiàn),且在50%的60 歲以上人群中出現(xiàn)[1]。大多數(shù)的甲狀腺結(jié)節(jié)患者預后良好,終身無需手術(shù),但有7%~15%的結(jié)節(jié)為甲狀腺惡性腫瘤[2]。在甲狀腺結(jié)節(jié)良惡性的判別中,除了手術(shù)病理“金標準”結(jié)果外,超聲引導下的細針穿刺細胞學檢查(FNAC)因其微創(chuàng)、易實行及準確率較高的特點,被作為術(shù)前鑒別甲狀腺良惡性結(jié)節(jié)的輔助診斷方法,在臨床中已被廣泛使用[3],然而對于穿刺結(jié)果中不明確的細胞非典型性病變或濾泡性病變(AUS/FLUS),目前仍然沒有良好的進一步明確診斷方法,因此開發(fā)新型的AUS/FLUS類別診斷模型以提高術(shù)前甲狀腺良惡性結(jié)節(jié)鑒別診斷效能成為本研究的重點[4]?,F(xiàn)報道如下。
1.1 一般資料 本研究最終入選82 例甲狀腺結(jié)節(jié)患者,均于2017 年1 月至2019 年12 月在中國科學院大學寧波華美醫(yī)院超聲介入科就診,所有患者均簽署知情同意書,且本研究得到醫(yī)院倫理委員會批準。納入標準:(1)FNAC 結(jié)果為AUS/FLUS類別;(2)具有明確的手術(shù)病理結(jié)果;(3)行BRAF 基因突變檢測與常規(guī)甲狀腺二維超聲檢查。排除標準:(1)甲狀腺結(jié)節(jié)FNAC 結(jié)果為標本無法診斷或不滿意、良性、濾泡性腫瘤或可疑的濾泡性腫瘤、惡性腫瘤;(2)既往甲狀腺腫瘤病史,結(jié)節(jié)復發(fā)或行2 次手術(shù)的患者;(3)資料不齊或?qū)ρ芯窟^程抵觸的患者。
1.2 方法 KNN診斷模型的構(gòu)建:本研究統(tǒng)計分析及KNN 診斷模型的構(gòu)建均使用R 3.4.3 軟件完成,并采用ROC 曲線分析。首先將各變量指標轉(zhuǎn)換為數(shù)值型(表1)以便于后續(xù)數(shù)據(jù)處理,82 例患者使用圖1 中的流程構(gòu)建KNN分類器,將82 例患者分為訓練數(shù)據(jù)集(50 例)與測試數(shù)據(jù)集(32 例),在訓練數(shù)據(jù)集中首先使用LASSO+10 倍交叉驗證的方法,最終確定分類錯誤最低時的K 值,將該K 值在測試數(shù)據(jù)集中驗證,最終在最初82 例患者構(gòu)成的數(shù)據(jù)集中再次驗證,以評估分類器的性能。
表1 診斷模型中變量的轉(zhuǎn)換
圖1 KNN 分類器構(gòu)建流程
2.1 BRAF基因檢測結(jié)果與手術(shù)病理結(jié)果的關(guān)系 BRAF基因檢測的靈敏度為71.7%(43/60),特異度為72.7%(16/22),陽性預測值為87.8%(43/49),陰性預測值為48.5%(16/33),見表2。
表2 BRAF 基因檢測結(jié)果及手術(shù)病理結(jié)果對比 例
2.2 判定模型的構(gòu)建 對各變量的重要性進行評估確定分類錯誤率最低時的變量個數(shù),結(jié)果表明在變量數(shù)為4個時,分類器的錯誤率最低,而在隨機森林算法中,BRAF 基因結(jié)果、結(jié)節(jié)回聲、結(jié)節(jié)形態(tài)、結(jié)節(jié)邊界這4項變量對分類器的性能最為重要。最終使用以上4 種變量構(gòu)建了KNN分類器,在K=18 時分類器的錯誤率最低。
2.3 KNN分類器性能的評估 KNN分類器模型的AUC 為0.842,優(yōu)于單項指標構(gòu)建的KNN分類器,同時該分類器的敏感度為91.8%,特異度為84.9%,見表3 ~4。
表3 KNN 分類器模型與各項指標單獨構(gòu)建模型的ROC 曲線分析
近年來,由于高分辨診斷技術(shù)的發(fā)展及環(huán)境因素等影響,甲狀腺癌的發(fā)病率與檢出率在全球范圍內(nèi)都呈現(xiàn)遞增趨勢[5]?,F(xiàn)臨床上FNAC 作為術(shù)前鑒別診斷甲狀腺腫瘤性質(zhì)已被廣泛使用[6]。采用國際公認的Bethesda報告系統(tǒng)[7]對穿刺標本進行解讀,其中85%~95%的穿刺結(jié)果可明確診斷,但由于受多灶、大小、細胞病理學醫(yī)生的經(jīng)驗及惡性腫瘤細胞形態(tài)特征的混雜等多種因素影響,仍有部分結(jié)果不能明確[8]。另有研究表明,甲狀腺癌發(fā)病率在AUS/FLUS類別中為5%~15%[9]。上述結(jié)果說明該類別患者中必定存在良性結(jié)節(jié)患者接受過度治療及惡性結(jié)節(jié)患者未得到有效治療的情況,因此也更需要檢測特異性更高的手段來提升術(shù)前鑒別診斷甲狀腺良惡性結(jié)節(jié)的準確性。
表4 KNN 分類器模型在甲狀腺良惡性結(jié)節(jié)中的診斷價值 例
有研究表明BRAF基因突變在結(jié)腸癌、直腸癌、卵巢癌和甲狀腺癌均有發(fā)現(xiàn)[10]。有研究通過觀察292 例細胞學檢查為良性的高危甲狀腺結(jié)節(jié)患者,結(jié)果表明在其中36 例BRAF 基金突變患者中,31 例患者最終出現(xiàn)惡性甲狀腺結(jié)節(jié),這表明BRAF 基因的篩查能夠降低細胞學檢查的假陰性率[11]。本研究結(jié)果也說明BRAF基因檢測作為一個單獨檢測指標而言,陽性預測值較高,故認為使用BRAF基因檢測作為診斷指標能夠很好的改進現(xiàn)有的診斷模型。但同時筆者發(fā)現(xiàn)BRAF基因無突變但手術(shù)治療的33 例患者中有17 例為惡性結(jié)節(jié)。這表示若只應用BRAF基因檢測作為衡量該類患者是否需要手術(shù)的唯一指標,仍存在不確定性。
為進一步探討快速高效的診斷方法,筆者運用機器學習的方法構(gòu)建診斷模型,將已收集的各變量對甲狀腺結(jié)節(jié)良惡性分類的重要性進行研究。在隨機森林算法中,得知BRAF 基因、結(jié)節(jié)回聲、結(jié)節(jié)形態(tài)、結(jié)節(jié)邊界這4 項變量對分類器的性能,也就是鑒別該類別的甲狀腺結(jié)節(jié)良惡性最為重要,且BRAF基因的重要性遠高于其他變量,更進一步確定了BRAF 基因在鑒別診斷甲狀腺結(jié)節(jié)的重要作用。本研究中構(gòu)建的KNN 分類器模型的靈敏度為91.8%,特異度為84.9%,優(yōu)于單項指標BRAF 基因檢測的靈敏度及特異度。除此之外,該KNN 分類器模型的AUC也優(yōu)于各指標單獨構(gòu)建的分類器模型。這證實了該分類器對于診斷甲狀腺良惡性結(jié)節(jié)有一定的潛力。
但在本研究中,對于變量的納入仍有所欠缺,目前對于甲狀腺結(jié)節(jié)的輔助檢查還包括超聲彈性成像(SWE/UE)、超聲造影成像(CEUS)等,基于此,筆者認為下一步研究方向可使用上述機器學習方法,擴大變量的納入范圍對穿刺結(jié)果不明確的甲狀腺結(jié)節(jié)進行多模態(tài)的綜合分析,從而使甲狀腺癌的檢出率進一步提高,實現(xiàn)為患者提供個體化精準治療的期望。