隋 鑫 解 朋 劉宗杰 趙 穎 陳思美 趙冰歆 劉 佳 張 屹
1.河北醫(yī)科大學第三醫(yī)院超聲醫(yī)學科,河北石家莊 050051;2.河北醫(yī)科大學第三醫(yī)院核醫(yī)學科,河北石家莊 050051;3.河北科技大學理學院,河北石家莊 050018
甲狀腺是人體內(nèi)重要的內(nèi)分泌腺,甲狀腺結(jié)節(jié)(thyroid nodule,TN)是指甲狀腺腺體內(nèi)的結(jié)節(jié)狀結(jié)構(gòu)。超聲檢查是目前診斷甲狀腺病變的主要影像學手段,隨著超聲檢查的普及,TN 的發(fā)現(xiàn)率日益增加,并且有可能伴隨著甲狀腺癌(thyroid cancer,TC)的出現(xiàn)。TC 為常見的頭頸部及內(nèi)分泌系統(tǒng)惡性腫瘤,2018 年Bray 等[1]報道分化型甲狀腺癌(differentiated thyroid cancer,DTC)占90%。DTC 的生物學行為相對惰性,若診療規(guī)范5 年生存率可達到90%[2]。《中國臨床腫瘤學會(CSCO)分化型甲狀腺癌診療指南(2021)》[3]指出,超聲檢查已成為DTC 初發(fā)患者術(shù)前診斷的標準方法。然而,由于TN 的良惡性特征在二維灰階超聲上有一定程度的重疊[4-5],為了更好地區(qū)分,課題組結(jié)合計算機圖像處理、人工智能和數(shù)據(jù)分析,研究出一種快速、準確計算TN 超聲圖像的方法,通過提取TN 超聲顯著特征,準確判斷結(jié)節(jié)的良惡性。
收集河北醫(yī)科大學第三醫(yī)院2015 年6 月至2021 年6 月行超聲檢查發(fā)現(xiàn)TN 的患者資料。納入標準:進行二維灰階超聲檢查證實其有TN 并進行手術(shù)切除,術(shù)后經(jīng)病理證實。排除標準:術(shù)前行內(nèi)分泌治療;伴其他部位惡性腫瘤。根據(jù)納排標準篩選出504 例TN 患者,其中女422 例,男82 例;年齡17~76 歲,平均(45.16±13.32)歲;術(shù)中共切取546 個樣本行病理學檢查,其中良性結(jié)節(jié)415 個,惡性結(jié)節(jié)131 個。
HITACHI ARIETTA 70 彩色超聲診斷儀(日本,東京都,日立),SUPERSONIC AIXPLORER Ⅴ彩色超聲診斷儀(法國,普羅旺斯,聲科影像),選用探頭頻率為7.5~15 MHz。
選用甲狀腺模式,對超聲儀器的焦點位置、成像深度、增益、動態(tài)范圍進行調(diào)節(jié),以便使顯像達到最佳效果,獲取超聲圖像并記錄。
本研究中TN 良性樣本較多,為了避免分類器在區(qū)分良惡性時,出現(xiàn)大量吸引良性樣本的情況,影響結(jié)果的精度和覆蓋度,故本研究選取TN 良性樣本的訓(xùn)練集及檢驗集與惡性樣本的數(shù)量相同。構(gòu)建分類器時,在131 個惡性樣本中,隨機選取其中93 個(71%)樣本作為訓(xùn)練集,38 個(29%)樣本作為檢驗集;在415 個良性樣本中,同樣隨機的選取93 個(22%)樣本作為訓(xùn)練集、38 個(9%)樣本作為檢驗集。
2.2.1 摳取TN 超聲圖像 為了去掉TN 以外的因素對圖像的干擾,用photoshop 把TN 單獨摳出來。摳圖時,務(wù)必以保證TN 的邊緣完整。見圖1。
2.2.2 端正TN 圖像位置 由于TN 的顯示形式各有差異,傾斜角度也均有不同,故對結(jié)節(jié)的圖像進行調(diào)整,把最長的徑線調(diào)整為水平方向,排除其他因素對分類算法的影響。見圖2。
2.3.1 讀取TN 圖像的灰度值 使用MATLAB 軟件,通過TN 圖像來讀取RGB 值[6],把它轉(zhuǎn)化為圖像的灰度值,并對應(yīng)相應(yīng)的灰度值矩陣(白色邊緣部分是255)。見圖3。
2.3.2 除去圖像的白色邊緣 為了確保圖像的信息完整準確,除去圖像里白色邊緣部分的數(shù)據(jù)。見圖4。
2.3.3 將灰度值矩陣進行切塊 由于白色邊緣的灰度值是255,將灰度值矩陣四周空白部分和TN 邊緣部分處的切塊矩陣賦為0,計算切塊矩陣平均灰度值。見圖5。
2.3.4 將灰度值按照范圍進行字母化 把灰度值0~255 平均分成16 段,每段對應(yīng)字母A~P。見圖6。
2.3.5 圖像進行字母化 把灰度平均值,按照字母串起來,形成一個相應(yīng)的字母串。見圖7。
2.3.6 計算圖像的特征頻率 字母串中包括A~P 中的任意i(i=1,2,3)個字母的頻率,共(16+162+163=4368)個頻率,稱之為特征頻率,簡稱為特征。
2.3.7 進行秩和檢驗 [p,h]=Ranksum(Y1(i),Y2(i),0.05)(i=1,2,……,4367,4368)[其中Y1(i)和Y2(i)分別為良、惡性訓(xùn)練集所有樣本的第i 個特征](注:p值是在假定特征i 在良、惡性樣本Y1(i)和Y2(i)中分布函數(shù)相等的情況下,出現(xiàn)目前這兩組觀測數(shù)據(jù)的概率。p 值越小,越說明特征i 在良惡性樣本中有不同的分布函數(shù)和統(tǒng)計特性,該特征可以入選分類特征)。
2.3.8 構(gòu)建多種分類器并尋找出最優(yōu)分類器 為了在不同的分類器中尋找到最優(yōu)的分類器,假定一些TN樣本,已知良性樣本X1個,惡性樣本X2個;預(yù)測為良性TN 的Y1個,惡性TN 的Y2個;在Y1中預(yù)測正確的Y11個,在Y2中預(yù)測正確的Y21個,則
通過計算不同分類器的良性及惡性的精度、覆蓋度進而得到最優(yōu)的分類器。
2.4.1 Fisher 分類
(一)Fisher 式一
(1)計算分類的閾值
(其中Ni和mi分別為第i 類訓(xùn)練集樣本的個數(shù)和均值向量,i=1,2)
(2)把檢驗集內(nèi)的樣本進行投影
y=W’X(其中W 為投影向量)
(3)根據(jù)決策的規(guī)則進行分類
(4)結(jié)果
該分類器鑒別良性結(jié)節(jié)的精確度為0,良性覆蓋度為0,鑒別惡性結(jié)節(jié)的精確度為50%,惡性覆蓋度為100%。
(二)Fisher 式二
(1)計算分類的閾值
(其中M2和Nstd分別為第二類訓(xùn)練集樣本映射點的均值和標準差,X 為檢驗集樣本)
(2)根據(jù)決策的規(guī)則進行分類
(3)結(jié)果
該分類器鑒別良性結(jié)節(jié)的精確度為38.46%,良性覆蓋度為13.16%,鑒別惡性結(jié)節(jié)的精確度為47.62%,惡性覆蓋度為78.95%。
2.4.2 貝葉斯分類
(1)計算兩種狀態(tài)的先驗概率
(其中L1和L2分別為訓(xùn)練集樣本第一、二類的個數(shù))
(2)計算檢驗集樣本的gi(X)
(其中ui和Di分別為訓(xùn)練集樣本的均值和協(xié)方差,i=1,2)
(3)根據(jù)決策的規(guī)則進行分類
(4)結(jié)果
該分類器鑒別良性結(jié)節(jié)的精確度為0,良性覆蓋度為0,鑒別惡性結(jié)節(jié)的精確度為50%,惡性覆蓋度為100%。
2.4.3 回歸分類
(1)設(shè)置訓(xùn)練集的目標值
(其中L1和L2分別為訓(xùn)練集樣本第一、二類的個數(shù))
注:ones(L1,1)是一個全是1、長為L1的數(shù)組,zeros(L2,1)是一個全是0、長為L2的數(shù)組。
(2)構(gòu)建回歸模型
注:glmfit 是matlab 實現(xiàn)邏輯回歸(logistic regression)的命令。binomial 表示y 值為二項分布,“l(fā)ink”“l(fā)ogit”說明這個回歸所用到的上述變換。獲得回歸模型如下:
(3)根據(jù)決策的規(guī)則進行分類
把檢驗集樣本向量代入到回歸模型
(4)結(jié)果
該分類器鑒別良性結(jié)節(jié)的精確度為0,良性覆蓋度為0,鑒別惡性結(jié)節(jié)的精確度為50%,惡性覆蓋度為100%。
2.4.4 Libsvm 分類
(1)構(gòu)建分類模型model
注 data 是指訓(xùn)練集樣本的矩陣,矩陣大小是n×m(訓(xùn)練集樣本數(shù)是n,顯著特征數(shù)是m);label 是類別標簽矩陣,矩陣大小是1×n,1 是指良性,-1 是指惡性;c,g是參數(shù)。
(2)進行參數(shù)的優(yōu)化訓(xùn)練
為了獲得最優(yōu)的分類模型,需要優(yōu)化參數(shù),通過函數(shù)對參數(shù)進行訓(xùn)練,以達到最優(yōu)。
通過訓(xùn)練參數(shù)c,g,得到c=8,g=4.8 是最優(yōu)。
(3)對檢驗集進行預(yù)測
注 testdata 是檢驗集樣本的矩陣,矩陣大小是n×m(檢驗集樣本數(shù)是n,顯著特征數(shù)是m);testdatalbel 是類別標簽矩陣,矩陣大小是1×n,矩陣元素均設(shè)置是1。
(4)結(jié)果
該分類器鑒別良性結(jié)節(jié)的精確度為93.8%,其良性結(jié)節(jié)的覆蓋度為78.9%,鑒別惡性結(jié)節(jié)的精確度為81.8%,其惡性結(jié)節(jié)覆蓋度為94.7%。
TC 占全球癌癥的3%[7]。TC 的早期診斷與及時治療對預(yù)后非常重要。因此,早期、精準判斷TN 的良惡性,有助于選擇最佳的治療方案。超聲是目前臨床上最常用的影像學檢查方法,其操作簡便、安全,價格相對較低,具有多種診斷優(yōu)勢,對良惡性腫瘤具有較高的分辨性能,是甲狀腺篩查及風險評估的首選影像學檢查手段[8]。大部分結(jié)節(jié)可以通過超聲檢查來明確良惡性,對于可疑或者明確的TN,臨床醫(yī)師應(yīng)該行包括甲狀腺和頸部淋巴結(jié)在內(nèi)的頸部超聲檢查,并結(jié)合其他影像學檢查(CT 或MRI)綜合分析判斷。超聲是TC患者影像學療效評價的重要手段,對于接受手術(shù)或者接受熱/化學消融治療的患者,臨床醫(yī)師應(yīng)為患者定期進行頸部超聲檢查,評估并定期隨訪觀察病灶的持續(xù)性以及有無新發(fā)病變等情況。
Fisher 判別法是最早應(yīng)用判別分析的工具之一[9],它是借助方差分析的思想,建立起來的一種能夠很好區(qū)分各個總體的線性判別法。Fisher 判別法是一種投影方法、降維處理方法,其實就是把高維空間的點向低維空間投影。在原有坐標下,很難能夠把樣本分開,但投影后就可能區(qū)別明顯??梢韵葘⑼队暗揭痪S空間(直線),如果效果不滿意,再投影到另一條直線(構(gòu)成二維空間),以此類推。每個投影可以建立一個判別函數(shù)[10]。
貝葉斯分類算法是一種非規(guī)則的分類方法,通過對已經(jīng)分類的樣本進行訓(xùn)練,歸納出分類函數(shù),利用訓(xùn)練得到的分類器對未分類的數(shù)據(jù)進行分類,它可以應(yīng)用于大型數(shù)據(jù)庫中,具有使用簡單、分類準確率高的特點。樸素貝葉斯分類算法是一種簡單的算法,其在運算效果方面,比決策樹和神經(jīng)網(wǎng)絡(luò)的分類算法還要好,具有運算速度快,準確率高的特點。但是,由于貝葉斯定理中做出了“一個屬性值對給定類的影響?yīng)毩⒂谄渌麑傩缘闹怠钡募僭O(shè),而這種假設(shè)情況在實際中通常是不成立的,因此,這種分類方法的準確率可能會受損害。
回歸分類是一種數(shù)學模型。當因變量和自變量為線性關(guān)系時,它是一種特殊的線性模型[11]?;貧w分類要分析現(xiàn)象之間相關(guān)的具體形式,確定其因果關(guān)系,并用數(shù)學模型的形式來表現(xiàn)其具體關(guān)系[12]。在回歸分類分析中,一般先設(shè)置訓(xùn)練集的目標值,通常設(shè)置為0 和1,對應(yīng)著兩個類;然后利用訓(xùn)練集樣本進行回歸運算,得到樣本向量的系數(shù)向量。如果樣本向量的值是維,這樣可以獲得系數(shù)向量的值是維,最后運算獲得回歸模型。為了預(yù)測對應(yīng)的分類,只需要把檢驗集樣本代入獲得的回歸模型中,根據(jù)得出的值與0 或1哪個值更為接近,據(jù)此作出分類判斷。
Libsvm 分類是一項非常實用的數(shù)據(jù)分類技術(shù)。它的基本原則是升維和線性化,是在分類時通過非線性映射將樣本的空間映射到更高維(甚至是無窮維)的空間里,即Hilbert 空間,通過映射將原樣本空間中的非線性可分的問題變?yōu)樵谔卣骺臻g中的線性可分的問題[13]。通常來說,升維會使計算過程變得復(fù)雜,而Libsvm 分類方法則完美地解決了這一復(fù)雜問題[14]。
本研究充分利用超聲醫(yī)學、計算機科學和數(shù)學等多學科交叉融合,研究內(nèi)容蘊含著創(chuàng)新的算法思想和各種分類的數(shù)學模型。本研究利用k-mer 串算法,以便能夠更加精準地獲得超聲圖像的灰度特征,采用秩和檢驗的統(tǒng)計學方法,進一步確定良惡性結(jié)節(jié)之間具有明顯區(qū)別的征象,有助于保證分類的速度;通過對結(jié)節(jié)進行圖像處理,采用計算圖像的特征頻率等來構(gòu)建完成多種分類器,通過比較各個分類器在鑒別結(jié)節(jié)良惡性方面的精度和覆蓋度,最終確定了Libsvm 分類器做為最優(yōu)分類器。
數(shù)學模型的不足:①本研究采集TN 圖像的方法是通過人工標記結(jié)節(jié)輪廓,這樣的采集方法對于操作人員具有比較高的要求,同時人工標記還會影響圖像的提取速度;②本研究中圖像提取方法只適用于獨立單個TN 的超聲圖像,對于多發(fā)融合狀結(jié)節(jié)超聲圖像的提取方法仍需進一步探討;③本研究雖然做到了能夠區(qū)分TN 的良惡性,但是目前還不能細分至亞型。在后續(xù)研究中,課題組將對TN 典型亞型進行分類提取,并設(shè)計智能提取圖像的軟件,進一步提高圖像提取質(zhì)量和速度,為進一步促進TN 的精準超聲影像學診斷、臨床治療提供更多有價值的建議。