馬利,李淑琪
(湖北中醫(yī)藥大學(xué) 信息工程學(xué)院,武漢 430074)
橋本氏甲狀腺炎(Hashimoto's thyroiditis,HT)是以甲狀腺組織內(nèi)發(fā)生彌漫性淋巴細(xì)胞浸潤(rùn)、纖維化及間質(zhì)萎縮為主要病理變化的自身免疫性甲狀腺疾?。?].HT常與惡性甲狀腺結(jié)節(jié)相伴發(fā)生[2],部分HT患者由于纖維化程度不同可導(dǎo)致良性結(jié)節(jié)與甲狀腺癌難以鑒別[3].有研究人員長(zhǎng)期隨訪發(fā)現(xiàn),伴HT患者發(fā)生甲狀腺癌的風(fēng)險(xiǎn)更大[4].因此,及時(shí)準(zhǔn)確鑒別HT背景下甲狀腺結(jié)節(jié)性質(zhì)對(duì)于預(yù)防結(jié)節(jié)惡變非常關(guān)鍵.美國(guó)放射學(xué)會(huì)(ACR)于2017年發(fā)布了甲狀腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(TI-RADS,TR),同時(shí)建立甲狀腺結(jié)節(jié)TR分級(jí)標(biāo)準(zhǔn)對(duì)結(jié)節(jié)的病變程度分層,綜合超聲影像中結(jié)節(jié)的結(jié)構(gòu)、回聲、形態(tài)、邊緣及局灶性強(qiáng)回聲5個(gè)特征對(duì)患者評(píng)估,判斷甲狀腺結(jié)節(jié)惡變發(fā)生風(fēng)險(xiǎn)[5],并廣泛運(yùn)用于醫(yī)院的超聲檢查診斷中.本文基于TI-RADS分類結(jié)果探討HT合并結(jié)節(jié)的惡變危險(xiǎn)因素,輔助臨床診斷,同時(shí)為早期防治和患者的自我健康管理提供依據(jù).
回顧性選擇2016年1月至2018年12月某省級(jí)三甲醫(yī)院內(nèi)分泌科就診的所有橋本甲狀腺炎門診患者資料,排除未合并結(jié)節(jié)及無超聲檢查結(jié)果的資料,共502例HT伴甲狀腺結(jié)節(jié)患者.其中女性449例,男 性53例,年 齡16~82歲,平 均 年 齡(46.03±13.83)歲.
采用PyCharm 2020、Microsoft Excel 2019軟件對(duì)數(shù)據(jù)進(jìn)行預(yù)處理.甲狀腺結(jié)節(jié)直徑取測(cè)量結(jié)果中最大值與最小值的平均數(shù),如果為多發(fā)結(jié)節(jié),即結(jié)節(jié)的數(shù)量大于1,則選擇直徑最大的結(jié)節(jié).例如某HT合并結(jié)節(jié)患者超聲結(jié)果顯示各結(jié)節(jié)大小分別為0.6 cm×0.3 cm、1.2 cm×1.4 cm,則該患者的結(jié)節(jié)直徑為(1.2+1.4)cm/2=1.3 cm.
橋本甲狀腺炎以2008年中華醫(yī)學(xué)會(huì)內(nèi)分泌學(xué)分會(huì)發(fā)布的《中國(guó)甲狀腺疾病診治指南(慢性淋巴細(xì)胞性甲狀腺炎)》為診斷標(biāo)準(zhǔn).
參照美國(guó)放射學(xué)會(huì)(ACR)2017年發(fā)布的甲狀腺結(jié)節(jié)TI-RADS分級(jí)標(biāo)準(zhǔn):(1)TR1級(jí)表示是良性結(jié)節(jié);(2)TR2級(jí)表示惡性可能≤2%;(3)TR3級(jí)表示惡性可能≤5%;(4)TR4級(jí)可疑為惡性結(jié)節(jié),惡性可能5%~20%;(5)TR5級(jí)表示惡性可能>20%.
采集患者晨起空腹靜脈血檢測(cè)甲狀腺功能各項(xiàng)指標(biāo),F(xiàn)T3正常值范圍在1.8~4.8 pg·mL-1,F(xiàn)T4正常值范圍在0.7~1.99 ng·dL-1,TSH正常值范圍為0.3~5 μIU·mL-1,TROAb正常值范圍在0~60 U·mL-1,TGAb正常值范圍為0~80 IU·L-1,TRAb正常值范圍為0~1.5 IU·L-1.
計(jì)量資料用xˉ±s,兩組以上比較采用方差分析或非參數(shù)檢驗(yàn);計(jì)數(shù)資料用構(gòu)成比或率表示;組間比較運(yùn)用χ2分析,如果有實(shí)際測(cè)量數(shù)≤1,則用Fisher精確檢驗(yàn).由于本研究反應(yīng)變量的3個(gè)水平之間存在有序關(guān)聯(lián),屬于多分類有序反應(yīng)變量,因此多因素分析應(yīng)用累積Logistic回歸,采用逐步回歸篩選變量,模型性能評(píng)價(jià)以AIC信息統(tǒng)計(jì)量為準(zhǔn)則,優(yōu)先考慮AIC值最小的模型,檢驗(yàn)水準(zhǔn)α<0.05.累積逐步logistic回歸分析結(jié)果用森林圖展示.統(tǒng)計(jì)分析工具應(yīng)用RStudio軟件.
HT合并甲狀腺結(jié)節(jié)患者有502例,男女比例約為1∶9(53∶449),年齡16~82歲,平均年齡(46.03±13.83)歲.502例患者的甲狀腺結(jié)節(jié)均為良性結(jié)節(jié),共有346例有超聲TI-RADS結(jié)果,其中結(jié)節(jié)惡性風(fēng)險(xiǎn)≤2%的患者(TI-RADS1級(jí)和TI-RADS2級(jí))83例,占比23.99%;惡性風(fēng)險(xiǎn)≤5%有(TI-RADS3級(jí))201個(gè),占58.09%;惡性風(fēng)險(xiǎn)在5%~20%(TI-RADS4級(jí))或>20%的有(TI-RADS5級(jí))有62個(gè),占17.92%.
患者疾病史分類特征如圖1所示.502例HT合并結(jié)節(jié)患者中,合并糖尿病、高血壓各12例,有18例合并高脂血癥,同時(shí)合并2類疾病的有9例,同時(shí)合并3類疾病的有2例.12名糖尿病患者中,4人為高血壓,高脂血患者2名.未患糖尿病的490名患者中,有8名高血壓患者,15名高脂血患者.502例HT合并結(jié)節(jié)患者中,高血壓患者共有12例,其中未患高血壓的490名HT合并結(jié)節(jié)患者中,16位患高脂血癥.
圖1 502例HT合并結(jié)節(jié)患者疾病史分類特征Fig.1 Classification characteristics in 502 patients with HT complicated with nodules
本文按甲狀腺結(jié)節(jié)TI-RADS級(jí)別對(duì)應(yīng)分為低、中、高三類,TI-RADS 1級(jí)與2級(jí)合并,記結(jié)節(jié)惡性風(fēng)險(xiǎn)等級(jí)為“低”;3級(jí)記為“中”;4級(jí)與5級(jí)合并為“高”.對(duì)性別、年齡、是否患糖尿病、結(jié)節(jié)直徑、是否出現(xiàn)彌漫性病變等14個(gè)研究因素進(jìn)行單因素分析.結(jié)果如表1所示,結(jié)節(jié)個(gè)數(shù)、結(jié)節(jié)直徑、FT4、FT3、TSH水平對(duì)甲狀腺結(jié)節(jié)惡變風(fēng)險(xiǎn)有顯著性影響(P<0.05).
以HT合并甲狀腺結(jié)節(jié)的惡變風(fēng)險(xiǎn)低、中、高為結(jié)局變量,將表1中結(jié)節(jié)個(gè)數(shù)、結(jié)節(jié)直徑等有統(tǒng)計(jì)學(xué)意義的5個(gè)單因素納入累積logistic回歸模型中進(jìn)行逐步回歸.全模型的AIC值為672.51,將現(xiàn)有的5個(gè)變量分別與結(jié)局變量構(gòu)建5個(gè)回歸模型,計(jì)算每個(gè)模型中變量對(duì)應(yīng)的AIC統(tǒng)計(jì)量,將AIC統(tǒng)計(jì)量最小為663.24的模型對(duì)應(yīng)的自變量FT3加入到模型中;再在已經(jīng)加入FT3的模型里分別加入剩下的變量得到4個(gè)模型,選擇AIC值最小為660.72并且顯著的變量結(jié)節(jié)直徑加入模型;在已包含F(xiàn)T3和結(jié)節(jié)直徑的模型中分別加入剩下3個(gè)變量得到3個(gè)模型,結(jié)果顯示,加入TSH后模型AIC值最小為658.37.繼續(xù)加入剩余變量,AIC統(tǒng)計(jì)量均增大,不滿足加入條件.由于納入模型的變量未達(dá)到4個(gè),不必進(jìn)行向后選擇剔除變量,此時(shí)模型達(dá)到最優(yōu).逐步回歸選擇變量的過程如表2所示.
表1 影響HT合并結(jié)節(jié)TI-RADS分類的單因素分析Tab.1 Single factor analysis on TI-RADS classification of HT patients with thyroid nodules
表2 累計(jì)logistic逐步回歸模型的變量選擇Tab.2 Variable selection of cumulative logistic stepwise regression model
基于逐步Logistic回歸,依據(jù)AIC準(zhǔn)則選擇變量后重新擬合模型,新模型的每個(gè)變量均有顯著性(P<0.05),最終模型的回歸分析結(jié)果森林圖如圖2所示.圖2中以橫坐標(biāo)刻度為1作為垂直無效線,平行于橫軸的3條線段分別表示FT3水平升高、TSH水平降低、結(jié)節(jié)直徑是HT合并結(jié)節(jié)惡變的危險(xiǎn)因素(P<0.05),而FT4水平、結(jié)節(jié)個(gè)數(shù)對(duì)HT合并甲狀腺結(jié)節(jié)惡變風(fēng)險(xiǎn)沒有顯著影響(P>0.05).中間的矩形點(diǎn)表示OR值的大小,同時(shí)有一根水平線向點(diǎn)的兩端延伸代表OR值的置信區(qū)間(CI,通常是95%CI).FT3水平升高相對(duì)于FT3正常的HT合并結(jié)節(jié)患者來說,惡變風(fēng)險(xiǎn)增大一個(gè)級(jí)別的概率增大3.070倍(OR=3.070,CI:0.960~9.815,P<0.05).TSH降低相對(duì)于TSH正常的患者惡變風(fēng)險(xiǎn)增大一個(gè)級(jí)別的概率增大2.088倍(OR=2.088,CI:1.021~4.268,P<0.05).結(jié)節(jié)直徑每增加一個(gè)單位,惡變風(fēng)險(xiǎn)增大一個(gè)級(jí)別的概率增大1.582倍(OR=1.582,CI:1.036~2.414,P<0.05).
圖2 Logistic回歸模型森林圖Fig.2 Forest map in Logistic regression model
橋本甲狀腺炎(HT)病程長(zhǎng)、易反復(fù),常需終身監(jiān)測(cè)和治療[6].伴有甲狀腺結(jié)節(jié)的患者在HT背景下,出現(xiàn)甲狀腺惡性腫瘤的風(fēng)險(xiǎn)更高[7].同時(shí)有研究表明,HT患者出現(xiàn)甲狀腺結(jié)節(jié)的幾率更高,其結(jié)節(jié)癌變率所占比例高達(dá)23%[8].近年來,隨著彈性成像技術(shù)在臨床上廣泛應(yīng)用,為盡量減少不必要的細(xì)胞學(xué)及組織活檢,超聲已成為篩查甲狀腺癌的主要手段[9],盡可能發(fā)現(xiàn)具有惡性高風(fēng)險(xiǎn)的結(jié)節(jié).國(guó)內(nèi)外學(xué)者普遍認(rèn)為“低回聲”、“微小鈣化”、“縱橫比(A/T)>1”是甲狀腺結(jié)節(jié)惡變的預(yù)測(cè)因素[3,10],但是臨床上這些特征性指標(biāo)往往無法同時(shí)出現(xiàn).雖然TR能顯著提高預(yù)測(cè)結(jié)節(jié)性質(zhì)的準(zhǔn)確性,但在其應(yīng)用過程中依舊存在很多影響因素.本文基于TI-RADS分類結(jié)果探討HT合并結(jié)節(jié)的潛在影響因素,以有效輔助臨床監(jiān)測(cè),通過早期篩查并干預(yù),對(duì)其惡性病變預(yù)防具有重要意義.
根據(jù)2015年美國(guó)甲狀腺學(xué)會(huì)發(fā)布的《成人甲狀腺結(jié)節(jié)與分化型甲狀腺癌診治指南》,結(jié)節(jié)直徑大小是超聲報(bào)告結(jié)果之一,應(yīng)根據(jù)結(jié)節(jié)大小,輔助臨床判斷有無采取細(xì)針抽吸活檢(FNA)的必要.TI-RADS顯示若結(jié)節(jié)直徑大于1.0 cm,可推薦納入惡性風(fēng)險(xiǎn)分層預(yù)測(cè)閾值.有研究結(jié)果顯示,良、惡性結(jié)節(jié)超聲特征中結(jié)節(jié)直徑比較有顯著性差異[11],本文發(fā)現(xiàn)結(jié)節(jié)直徑是HT合并甲狀腺結(jié)節(jié)惡變的影響因素之一,中、高危分類人群的結(jié)節(jié)直徑均超過1.0 cm.甲狀腺激素水平是衡量甲狀腺功能的敏感性參數(shù),對(duì)臨床各類甲狀腺疾病的鑒別和診斷有關(guān)鍵意義.以往研究表明TSH水平升高是HT發(fā)生甲狀腺癌的預(yù)測(cè)因子,近年來有學(xué)者通過一項(xiàng)回顧性研究指出:甲亢患者相對(duì)于普通人群或甲狀腺功能正常的人群,甲狀腺癌發(fā)生率增高[12].根據(jù)本文最終的Logistic回歸結(jié)果,TSH較正常值降低、FT3水平升高是HT合并結(jié)節(jié)發(fā)生惡變的危險(xiǎn)因素,這一結(jié)果進(jìn)一步驗(yàn)證甲狀腺功能亢進(jìn)也會(huì)增加患癌風(fēng)險(xiǎn).相關(guān)研究表明:TgAb、TPOAb水平與IgG4呈顯著正相關(guān),IgG4升高的HT患者發(fā)生甲狀腺癌的幾率更大[13].本文單因素分析顯示:TGAb與TPOAb在HT合并結(jié)節(jié)不同惡變風(fēng)險(xiǎn)人群中無顯著性差異,與以往研究存在差異,需后續(xù)擴(kuò)大樣本量后再次研究驗(yàn)證.研究過程中也可結(jié)合臨床專業(yè)角度與統(tǒng)計(jì)學(xué)考慮,適當(dāng)放寬篩選顯著變量的標(biāo)準(zhǔn)以避免漏掉臨床共識(shí)中重要的因素[14].
與未發(fā)生惡變的病例相比,HT合并甲狀腺結(jié)節(jié)惡變的病例樣本較少,真實(shí)臨床中可獲取的訓(xùn)練樣本較少,是非平衡的小樣本數(shù)據(jù)集.患者分類非平衡背景下,一般分類器會(huì)傾向多數(shù)類而忽略少數(shù)類,模型效果可能不太理想.未來可以將探討不平衡數(shù)據(jù)處理方法作為研究目標(biāo),例如基于XGBoost算法建立集成模型可以有效降低模型的方差和偏差,或者采用Bootstrap重復(fù)抽樣等方法構(gòu)建若干個(gè)平衡訓(xùn)練子集解決樣本不平衡和樣本量過少的問題[15].
綜上所述,基于HT合并結(jié)節(jié)患者超聲TI-RADS分類結(jié)果研究顯示:FT3升高、TSH降低、結(jié)節(jié)直徑是橋本甲狀腺炎合并結(jié)節(jié)惡變的危險(xiǎn)因素.臨床診斷時(shí)應(yīng)密切關(guān)注結(jié)節(jié)直徑較大的患者,并結(jié)合FT3和TSH水平的變化等多種因素進(jìn)行綜合分析,為疾病的診治、惡性評(píng)估以及有效預(yù)防提供輔助依據(jù).但是,累積Logistic逐步回歸未考慮到不平衡數(shù)據(jù)對(duì)分類效果的影響,故算法本身還存在許多不足.未來研究應(yīng)多關(guān)注臨床數(shù)據(jù)樣本量過少、類別不平衡等影響研究結(jié)果的統(tǒng)計(jì)學(xué)問題,探究提高類別不平衡下模型分類性能的建模方法.