胡雨舟,李佳偉,郭 翌,汪源源,余錦華,常 才
1.復(fù)旦大學(xué)電子工程系,上海 200433;
2.復(fù)旦大學(xué)附屬腫瘤醫(yī)院超聲科,復(fù)旦大學(xué)上海醫(yī)學(xué)院腫瘤學(xué)系,上海 200032
乳腺癌嚴(yán)重威脅女性健康,其發(fā)病率位居女性惡性腫瘤的首位,且發(fā)病年齡趨于年輕化[1]。術(shù)前明確診斷淋巴結(jié)轉(zhuǎn)移可輔助臨床醫(yī)師決定手術(shù)方式,因此早期檢查和診斷淋巴結(jié)是否轉(zhuǎn)移至關(guān)重要。本研究基于影像組學(xué)理念,從浸潤性乳腺癌患者的乳腺超聲圖像出發(fā),首先提取基于乳腺影像報告與數(shù)據(jù)系統(tǒng)(Breast Imaging Reporting and Data System,BI-RADS)[2]的高通量特征、基于尺度不變特征轉(zhuǎn)換(scale-invariant feature transform,SIFT)[3]的特征和基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的特征,并結(jié)合患者臨床信息,形成一套相應(yīng)的特征體系。其次,在特征篩選部分,利用十折法bootstrap 100次,先用t檢驗進行單因素分析,再用最小化絕對值收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)[4]回歸模型進行多因素分析,最后按特征出現(xiàn)頻次選擇最優(yōu)特征組合,使用基于十倍交叉驗證的線性核支持向量機(support vector machine,SVM)分類器[5]對乳腺腫瘤同側(cè)腋窩淋巴結(jié)轉(zhuǎn)移進行預(yù)測。
本研究主要包括2個數(shù)據(jù)集,記為數(shù)據(jù)集A和數(shù)據(jù)集B,均來自復(fù)旦大學(xué)附屬腫瘤醫(yī)院,且2個數(shù)據(jù)集中的數(shù)據(jù)不重復(fù)。數(shù)據(jù)集A是400幅乳腺超聲圖像,僅用來訓(xùn)練提取CNN特征所用的全卷積神經(jīng)網(wǎng)絡(luò)(fully convolutional neural network,F(xiàn)CN)。數(shù)據(jù)集B是380例女性乳腺癌患者的超聲圖像,用來研究乳腺超聲圖像特征與淋巴結(jié)轉(zhuǎn)移之間的相關(guān)性。數(shù)據(jù)集B的采集時間為2014年4月—2016年6月,患者年齡23~83歲(平均年齡52.03歲,方差11.06歲)。所有患者經(jīng)病理學(xué)檢查確診為浸潤性乳腺癌,均通過手術(shù)治療。每例患者都有若干幅乳腺超聲圖像,選擇其中最具代表性的1幅圖像進行分析。根據(jù)術(shù)中淋巴結(jié)冷凍切片檢查結(jié)果及術(shù)后石蠟包埋切片病理學(xué)檢查結(jié)果判斷淋巴結(jié)轉(zhuǎn)移:前哨淋巴結(jié)和腋窩淋巴結(jié)兩者之一發(fā)生轉(zhuǎn)移即視為腋窩淋巴結(jié)轉(zhuǎn)移。380例患者中,發(fā)生淋巴結(jié)轉(zhuǎn)移146例,未轉(zhuǎn)移234例。所有圖像均由經(jīng)驗豐富的超聲科醫(yī)師進行手動分割,后續(xù)特征所需要的腫瘤區(qū)域界定基于該手動分割結(jié)果。
1.2.1 基于BI-RADS的高通量特征
美國放射學(xué)會(American College of Radiology,ACR)開發(fā)了BI-RADS來標(biāo)準(zhǔn)化乳腺腫瘤的超聲描述。BI-RADS采用7個描述符來幫助分類,其中有5個描述符描述腫塊部分,分別是形狀、方向、邊緣、回聲特性和后方回聲特性[2]。
根據(jù)描述符設(shè)計460個基于BI-RADS的高通量特征,以量化和評估腫瘤,具體特征及其與BI-RADS描述符的對應(yīng)關(guān)系詳見文獻[6]。形態(tài)特征用于描述腫瘤的幾何特征,包括BI-RADS中的形狀、方向和邊緣,共15個。灰度特征反映原始乳腺超聲圖像中腫瘤區(qū)域的灰度級和直方圖分布,共16個。紋理特征反映圖像中詳細的、不可見的灰度變化和聯(lián)系。以下選擇6種紋理特征來顯示不同的腫瘤紋理特性:① 基于邊界的紋理特征表示腫瘤區(qū)域內(nèi)部與周圍區(qū)域灰度的區(qū)別,共15個。② 基于感興趣區(qū)(region of interest,ROI)的紋理特征描述整個ROI中灰度級的分布,共6個。 ③ 灰度共生矩陣(gray-level cooccurrence matrix,GLCM)紋理特征描述在一定范圍內(nèi)的兩個灰度級強度頻率之間的指定空間線性關(guān)系,共23個。④ 灰度游程矩陣(gray-level run-length matrix,GLRLM) 紋理特征計算在給定方向上具有相同灰度的1組連續(xù)的共線圖像點的游程來表征紋理的粗糙度,共13個。⑤ 灰度區(qū)域矩陣(gray-level size zone matrix,GLSZM)紋理特征反映小像素群的均勻性,共13個。⑥ 鄰域灰度差分矩陣(neighborhood gray-tone difference matrix,NGTDM)紋理特征衡量每個圖像像素的灰度與其鄰域灰度之間的差異,共5個。小波特征是應(yīng)用小波分解后的系數(shù)來表征不能被灰度和紋理特征直接反映的信息。離散小波變換將二維圖像分解成近似、水平、垂直和對角這4組分量,每組分量計算灰度和紋理特征。每組分量計算89個特征,共有356個小波特征。
1.2.2 基于SIFT的特征
SIFT算法是一種在尺度空間中尋找極值點,并提取其有關(guān)大小和方向描述子的方法[3]。SIFT特征是圖像的局部特征,與圖像大小和方向無關(guān),對噪聲的容忍度好,且信息量豐富,區(qū)分度好[3]。本研究中,SIFT特征是基于乳腺腫瘤超聲圖像中ROI提取的。
SIFT特征的數(shù)據(jù)量很大,對1個極值點使用常見的4×4個種子點來描述,1個極值點就可產(chǎn)生128維的SIFT特征向量,而1幅圖像中存在很多個極值點,這樣整個特征的數(shù)量將十分龐大。為解決SIFT特征數(shù)據(jù)量過大的問題,采用計算機視覺領(lǐng)域常用的特征壓縮的方法。先使用高斯混合模型(Gaussian mixture model,GMM)[7]將原始SIFT特征用8個高斯分布函數(shù)去近似估計,再使用費舍爾向量(Fisher vector)根據(jù)GMM中的參數(shù)對SIFT特征進行特征壓縮[7-8]。GMM對樣本的概率密度分布進行估計,而估計采用的模型是幾個高斯模型的加權(quán)和[8]。每個高斯模型代表1個類,對樣本中的數(shù)據(jù)分別在幾個高斯模型上進行投影,就分別得到在各個類上的概率,本研究采用了8個類。使用費舍爾向量壓縮后,每幅圖像的SIFT特征維度相同,為2 048維。
1.2.3 基于CNN的特征
近年來,CNN研究吸引了很多學(xué)者的關(guān)注。在醫(yī)學(xué)圖像研究領(lǐng)域,CNN被廣泛用于實現(xiàn)圖像的自動分割[9-10]。根據(jù)相關(guān)研究,CNN中的特征圖代表圖像中的有用信息,是一種新型的有效特征[11]。FCN[12]是CNN在圖像分割中的一種經(jīng)典運用,是一種端到端的網(wǎng)絡(luò)結(jié)構(gòu),可對每個像素點進行有效分割。
本研究基于經(jīng)典的VGG-16網(wǎng)絡(luò)設(shè)計了一個FCN來對數(shù)據(jù)集A中的圖像進行訓(xùn)練,網(wǎng)絡(luò)的輸入為乳腺超聲灰度圖像,標(biāo)簽為手動分割結(jié)果。網(wǎng)絡(luò)結(jié)構(gòu)見圖1,圖1B是圖1A中Block的具體結(jié)構(gòu)。Conv代表卷積層,M×N×H表示卷積層的卷積核為M×N,特征圖數(shù)為H。Deconv是反卷積層,K代表該反卷積實現(xiàn)了K倍上采樣。Max pooling代表最大池化層,該網(wǎng)絡(luò)中最大池化層的窗口大小為2×2,步長為2。BN為批量標(biāo)準(zhǔn)化(batch normalization)層,ReLU為修正線性單元(rectified linear unit),Sum是累加層,Dropout是隨機丟棄層。對該網(wǎng)絡(luò),隨機初始化各層的參數(shù),學(xué)習(xí)率0.000 1,衰減率0.000 1,批大小20,動量0.9,訓(xùn)練了1 000個循環(huán)。
對訓(xùn)練后的網(wǎng)絡(luò),將數(shù)據(jù)集B中380例患者的ROI圖像輸入FCN。根據(jù)文獻[11],較深卷積層的特征圖可提取更深層、更有效的信息。本研究選擇Block 13中卷積層的512個特征圖,使用類似2.2.2中的方法,將原始的512個特征圖采用8個高斯分布函數(shù)去近似估計,并使用費舍爾向量對GMM中的參數(shù)進行壓縮,最后每個圖像提取了8 192個CNN特征。
1.2.4 臨床信息
經(jīng)與醫(yī)師討論,加入3個重要的患者臨床信息,即年齡、腫瘤大小和腫瘤位置。腫瘤大小是將超聲圖像中的像素點數(shù)乘以采樣時顯示使用的圖像尺度。腫瘤位置根據(jù)實際超聲檢查時腫瘤是否在乳房的外上象限來判定。本研究將這些易獲取且重要的臨床信息也視為特征,來進行后續(xù)的特征篩選與分類預(yù)測。
提取完所有特征后,每例患者共得到10 703個特征,從不同方面描述乳腺腫瘤特性。但這個特征集的維度極其巨大,有些特征與淋巴結(jié)轉(zhuǎn)移的關(guān)系并不密切。為選擇相關(guān)性最大的特征來進行分類預(yù)測,特征篩選必不可少。為使特征篩選更具有普適性,篩選時使用十折bootstrap的方法。每次bootstrap將樣本隨機分成10等份,依次使用其中的9份進行特征篩選,因此每次bootstrap依次使用342例樣本進行10次特征篩選。本研究進行了100次bootstrap,共進行了1 000次特征篩選,記錄下每個特征出現(xiàn)的次數(shù)。
具體特征篩選包括單因素分析和多因素分析兩部分。首先,對特征集使用t檢驗方法進行單因素分析,計算每個特征與淋巴結(jié)轉(zhuǎn)移之間的相關(guān)性,篩選出其中P<0.05(差異有統(tǒng)計學(xué)意義)的特征[13]。其次,采用LASSO回歸模型對特征進行多因素分析[4]。LASSO回歸模型通過在最小化計算中加入1個L1范數(shù)作為懲罰項來調(diào)整復(fù)雜度,從而得到1個較為精煉的模型,使得某些系數(shù)收縮到零。復(fù)雜度調(diào)整程度由參數(shù)λ來控制,λ越大,對變量較多的線性模型的懲罰力度越大,最終模型中的變量就越少。本研究通過十倍交叉驗證法得到最優(yōu)λ值。最后,獲取最優(yōu)λ值對應(yīng)的權(quán)重,其中非零權(quán)重對應(yīng)的特征即為篩選出的最相關(guān)特征。
對篩選后的特征集,采用1個十倍交叉驗證的線性核SVM分類器來構(gòu)建預(yù)測系統(tǒng)[5]。每次將380例患者的數(shù)據(jù)分成10等份,342例用于訓(xùn)練,38例用于測試,進行十折遍歷。采用受試者工作特征(receiver operating characteristic,ROC)曲線的曲線下面積(area under curve,AUC)、準(zhǔn)確率、靈敏度和特異度來衡量模型的優(yōu)劣[14]。整個方法的流程圖如圖2所示。
圖2 整體流程圖
圖3A、3B分別是1幅已選取ROI的乳腺超聲圖像的醫(yī)師手動分割結(jié)果和計算機提取的SIFT特征的描述子分布,紅色線條表示SIFT描述子的位置、大小和方向。由圖3可見,腫瘤內(nèi)部的紅色線條數(shù)遠少于腫瘤外部,表明腫瘤內(nèi)部的SIFT描述子數(shù)量遠少于腫瘤外部。腫瘤內(nèi)部灰度不均勻區(qū)域也會出現(xiàn)大量SIFT描述子。同時,SIFT描述子的方向和大小對腫瘤周圍區(qū)域的灰度變化也很敏感。因此,SIFT描述子在表征腫瘤內(nèi)部均勻程度、腫瘤邊界位置、腫瘤周邊區(qū)域灰度分布等方面都有不錯的效果。
圖3 SIFT描述子的作用
圖4展示了bootstrap中某一次LASSO模型中不同 λ值下模型的均方誤差(mean squared er-ror,MSE),其中紅色的點為MSE均值,上下的灰色區(qū)域代表置信區(qū)間。置信區(qū)間越大,表明MSE可能值的范圍越大,MSE的結(jié)果越不穩(wěn)定。從圖4中可以看到,λ 較大(0.01< λ <0.1)時,即選取的特征較少時,模型的性能相近,MSE較低且較置信區(qū)間小,表明模型的效果較好且較穩(wěn)定。隨著 λ 值不斷變小,MSE的均值和置信區(qū)間隨之增大,表明隨著懲罰力度變小,相關(guān)性相對較小的特征降低了模型的性能。選取保證MSE最小所需特征時的 λ 值,在圖4中用實線標(biāo)出。
在數(shù)據(jù)集B中,對于100次使用十折法bootstrap的特征篩選結(jié)果,按特征出現(xiàn)次數(shù)將其進行排序,出現(xiàn)次數(shù)越多的特征對模型的作用越大,排序越靠前。表1展示了利用排序前N個特征建立的使用十折法線性核SVM分類器的分類結(jié)果。可以看到,使用特征數(shù)為50~150個時建立的分類器效果相近。特征數(shù)較少時,分類器的效果不佳,表明僅使用某幾個特征預(yù)測淋巴結(jié)轉(zhuǎn)移的效果并不理想。而特征數(shù)過多時,特征的冗余則降低了分類的準(zhǔn)確率。選取AUC最大時的特征數(shù),為100個。
圖4 不同 λ值下LASSO模型的MSE
表1 不同特征數(shù)下分類器的分類效果
表2 加入CNN特征與不加CNN特征的分類結(jié)果比較
表2比較了加入CNN特征與不加入CNN特征時最優(yōu)的分類結(jié)果。由表2可見,加入CNN特征后,使用100個特征構(gòu)成的預(yù)測結(jié)果比不加入CNN特征時有明顯提升。表明CNN特征的加入能有效地提高分類的準(zhǔn)確率,對淋巴結(jié)轉(zhuǎn)移的預(yù)測有幫助。
對于數(shù)據(jù)集B中的380例患者,圖5使用100個特征的十倍交叉驗證線性核SVM分類器模型的ROC曲線。該線性核SVM分類器的AUC為0.903,準(zhǔn)確率為82.6%,靈敏度為90.6%,特異度為69.9%。
乳腺癌嚴(yán)重危害女性健康。根據(jù)中國國家癌癥研究所統(tǒng)計,2015年確診患乳腺癌的中國女性約為268 600人,占全部女性新發(fā)癌癥人數(shù)的15.09%[15]。淋巴結(jié)是否轉(zhuǎn)移是影響乳腺癌預(yù)后的重要指標(biāo),無淋巴結(jié)轉(zhuǎn)移者5年生存率可達90.5%,反之僅為53.6%[16]。原發(fā)乳腺癌在局部生長擴散的同時,可通過淋巴系統(tǒng)轉(zhuǎn)移至腋窩淋巴結(jié)(axillary lymph node,ALN)。前哨淋巴結(jié)(sentinel lymph node,SLN)是原發(fā)腫瘤發(fā)生淋巴結(jié)轉(zhuǎn)移必經(jīng)的第一批淋巴結(jié)。如果前哨淋巴結(jié)發(fā)生轉(zhuǎn)移,腋窩淋巴結(jié)也極有可能發(fā)生轉(zhuǎn)移[17]。因此,術(shù)前明確淋巴結(jié)是否轉(zhuǎn)移非常重要。
超聲檢查由于非侵入性、無輻射性和實時性的優(yōu)點,是診斷乳腺癌最普遍和最有效的方法[18],不但能對乳腺癌原發(fā)灶進行定性和定位,還可檢測腋窩淋巴結(jié)狀態(tài)。但由于大部分腋窩淋巴結(jié)的超聲特征不典型,超聲檢查并不能明確診斷。此外,由于腋窩的結(jié)構(gòu)較深,某些較小的淋巴結(jié)易漏診。如果能根據(jù)乳腺癌原發(fā)灶的超聲圖像特征,找到其與淋巴結(jié)轉(zhuǎn)移之間的聯(lián)系,實現(xiàn)對淋巴結(jié)轉(zhuǎn)移的預(yù)測,從而對高風(fēng)險患者進行重點排查,這對提高腋窩淋巴結(jié)檢查的效率和準(zhǔn)確率均有一定意義。
利用乳腺癌病灶超聲圖像預(yù)測腋窩淋巴結(jié)轉(zhuǎn)移在臨床上引起了關(guān)注。李燕等[19]對95例浸潤性乳腺癌患者進行分析,利用肉眼觀察提取了乳腺腫瘤超聲圖像的5個定性特征,最后取得AUC為0.783 8、準(zhǔn)確率為70.79%、靈敏度為81.82%、特異度為64.29%的結(jié)果。時兆婷等[20]回顧性分析335例浸潤性乳腺癌患者的臨床病理及超聲資料,認為年齡、腫瘤大小、組織學(xué)分級和邊緣成角數(shù)為影響腋窩淋巴結(jié)轉(zhuǎn)移的危險因素。但以上研究均基于醫(yī)師觀察,特征不夠豐富,預(yù)測的準(zhǔn)確率也有待提高。
針對乳腺腫瘤超聲檢查時腋窩淋巴結(jié)體積小、特征不典型和容易漏診的情況,本研究提出基于乳腺超聲圖像特征預(yù)測乳腺腫瘤腋窩淋巴結(jié)轉(zhuǎn)移的方法。由表2結(jié)果可見,分類器的AUC為0.903,準(zhǔn)確率為82.6%,靈敏度為90.6%,特異度為69.9%。與文獻[19]相比,在更大量的數(shù)據(jù)上實現(xiàn)了更好的分類結(jié)果。同時,CNN特征的使用較好地提高了分類器的分類性能。最后使用的100個特征包括46個CNN特征、42個SIFT特征、10個BI-RADS特征和2個臨床信息。2個臨床信息是腫瘤位置和大小。10個BI-RADS特征分別為2個形態(tài)特征、1個紋理特征和7個小波特征,其中2個形態(tài)特征是描述腫瘤邊緣粗糙程度,1個紋理特征是描述腫瘤內(nèi)部回聲特性。從最后篩選的特征結(jié)果來看,腫瘤邊緣粗糙程度、內(nèi)部回聲特性、位置是否在外上象限及腫瘤大小都是臨床醫(yī)師在實際檢查中可關(guān)注的問題。分類器模型效果良好,經(jīng)過篩選后的特征對乳腺腫瘤腋窩淋巴結(jié)轉(zhuǎn)移有較好的區(qū)分作用,表明篩選出的乳腺腫瘤超聲圖像特征與腋窩淋巴結(jié)轉(zhuǎn)移之間有一定的關(guān)聯(lián)。本研究能為超聲科醫(yī)師在進行淋巴結(jié)超聲檢查時提供轉(zhuǎn)移可能性的參考,幫助他們對患者進行更準(zhǔn)確、更有針對性的檢查。
為實現(xiàn)基于乳腺超聲圖像特征預(yù)測乳腺腫瘤腋窩淋巴結(jié)轉(zhuǎn)移,本研究基于乳腺腫瘤超聲圖像特點和重要的患者信息設(shè)計了相應(yīng)的特征體系,并對特征進行基于單因素分析和多因素分析的特征篩選,將篩選后的特征集在1個使用十倍交叉驗證法的線性核分類器中實現(xiàn)了AUC=0.903的效果,表明該方法是有效的,能為臨床醫(yī)師進行乳腺腫瘤淋巴結(jié)檢查提供轉(zhuǎn)移可能性的參考。本研究的主要貢獻有4點:一是結(jié)合乳腺超聲圖像特征和臨床信息,設(shè)計了乳腺超聲圖像特征體系,且特征易獲取;二是提出了利用CNN特征描述乳腺腫瘤超聲圖像的方法,并證明了該特征對分類結(jié)果有較大幫助;三是在特征數(shù)量眾多的情況下,實現(xiàn)了嚴(yán)格而有效的特征篩選;四是在一定程度上實現(xiàn)了對乳腺腫瘤腋窩淋巴結(jié)轉(zhuǎn)移的預(yù)測。