李欣,梁森,黃正南,夏晨,張榮國,吳孝掌,賴原仲
乳腺癌是女性群體中發(fā)病率最高的一類腫瘤。乳腺癌的早診早篩有利于提升患者的5年生存率,具有重大的臨床意義[1]。目前《中國抗癌協(xié)會乳腺癌診治指南與規(guī)范(2017年版)》建議40~45歲的女性進(jìn)行一年一次的乳腺癌篩查,45~69歲的女性每1~2年進(jìn)行一次篩查,70歲以上每2年進(jìn)行一次篩查,并指定使用鉬靶作為主要的影像篩查手段,超聲和MRI作為輔助方式[2]。鉬靶X線對微鈣化敏感,對腫塊也具有良好的檢測效果,而且還具有性價(jià)比高的優(yōu)點(diǎn)。但就高致密乳腺而言,鉬靶影像的病灶檢出存在一定的局限[3]。上世紀(jì)80年代開始,研究者們陸續(xù)提出了一些計(jì)算機(jī)方法對鉬靶圖像進(jìn)行輔助診斷[4-6],此類算法大多基于傳統(tǒng)的CAD算法。2014年以來,基于深度學(xué)習(xí)人工智能逐漸成為計(jì)算機(jī)視覺的主流方法論,研究者們利用深度學(xué)習(xí)算法使用大規(guī)模數(shù)據(jù)訓(xùn)練預(yù)測模型,在無需手動干預(yù)的情況下在包括乳腺鉬靶影像[7-9]、眼底影像[10]、皮膚影像[11]、CT影像[12]、病理影像[13]等多個(gè)臨床場景下實(shí)現(xiàn)了疾病的準(zhǔn)確預(yù)測與分類。
本研究我們首先按照最新版BI-RADS(2013年)國際標(biāo)準(zhǔn)進(jìn)行人工數(shù)據(jù)標(biāo)記[14],主要標(biāo)記的病灶類型包括腫塊、乳腺內(nèi)淋巴結(jié)、圓形鈣化、粗糙鈣化、還有環(huán)形鈣化。本文采用最新的深度學(xué)習(xí)病灶檢測算法Faster R-CNN模型作為主要的算法結(jié)構(gòu)[15],訓(xùn)練并驗(yàn)證AI在乳腺X線影像的病灶檢測效果。實(shí)驗(yàn)結(jié)果顯示AI智能檢測系統(tǒng)對腫塊、乳腺內(nèi)淋巴結(jié)、圓形鈣化、環(huán)形鈣化、粗糙鈣化的檢測敏感度分別達(dá)到76.4%,83.1%,71.2%,75.0%和64.9%。
本文回顧性地分析了2016年6月-2017年6月1年內(nèi)行乳腺鉬靶檢查的5765例病例,病例納入條件:①女性;②影像報(bào)告發(fā)現(xiàn)病灶;③術(shù)前未經(jīng)放療或化療。共納入2292例病例,年齡24~85歲,中位年齡41歲。所有病例均行常規(guī)雙側(cè)乳腺軸面(craniocaudal,CC)和平行于胸大肌斜位(mediolateral oblique,MLO)攝影。
采用GE乳腺X線Senograph設(shè)備,型號為ADS 54.10,行常規(guī)軸面和斜側(cè)面攝像。設(shè)備電壓22~49 kV,電流:小焦點(diǎn)40 mA,大焦點(diǎn)100 mA,最大500 mA。本研究中智能檢測算法的開發(fā)與訓(xùn)練基于深度學(xué)習(xí)框架Mxnet 1.2版本開發(fā),所有代碼基于Python 2.7語言,并在 NVIDIA GPU上運(yùn)行,該AI智能病灶檢測系統(tǒng)在Windows/Linux/Mac等操作系統(tǒng)上均可使用。
2292例乳腺X線病例9168張DICOM影像。每一張影像依次按如下步驟進(jìn)行圖像預(yù)處理:①用自適應(yīng)的方法調(diào)整到適合閱片的窗寬窗位;②將圖像的像素值歸一化到0~255范圍內(nèi);③將醫(yī)學(xué)DICOM傳輸協(xié)議圖像格式轉(zhuǎn)換為適合計(jì)算機(jī)處理的JPEG圖像格式。為了讓AI可以智能檢測出X線影像中的病灶,由有經(jīng)驗(yàn)的影像科醫(yī)生對影像的病灶進(jìn)行人工標(biāo)注。通過用標(biāo)注好的數(shù)據(jù)訓(xùn)練AI智能病灶檢測模型,我們最終得到模型并進(jìn)行病灶檢測效果的驗(yàn)證。
本研究采用最新版的BI-RADS(2013年)標(biāo)準(zhǔn)對病例進(jìn)行人工標(biāo)注。每例病例的人工標(biāo)記流程:①3名放射科副高職稱醫(yī)生分別進(jìn)行標(biāo)記;②1名標(biāo)記質(zhì)量控制人員統(tǒng)計(jì)不一致的標(biāo)記數(shù)據(jù);③3名標(biāo)記人員一起討論不一致的標(biāo)記并達(dá)成共識。最后,2292例數(shù)據(jù)劃分為1892例訓(xùn)練數(shù)據(jù)集和400例測試數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集用來訓(xùn)練我們的AI智能病灶檢測模型,測試數(shù)據(jù)集用來評估我們AI模型的檢測效果。
本研究采用深度學(xué)習(xí)人工智能領(lǐng)域經(jīng)典的目標(biāo)檢測Faster R-CNN算法[15],相比其它的目標(biāo)檢測算法,它具有高精度的檢測優(yōu)勢,目前很多檢測算法都是基于該算法發(fā)展出來的,比如R-FCN檢測網(wǎng)絡(luò)算法[16]和DeformbleNet算法[17]等。Faster R-CNN是采用卷積神經(jīng)網(wǎng)絡(luò)為主體的兩階段目標(biāo)檢測算法(圖1)。首先對輸入的乳腺X線圖片進(jìn)行多層卷積層和池化層操作從而實(shí)現(xiàn)自動特征提取,得到特征圖(Feature Map)后將其輸入一個(gè)區(qū)域提出網(wǎng)絡(luò)(region proposal network,RPN)網(wǎng)絡(luò)實(shí)現(xiàn)感興趣病灶區(qū)域(ROI)自動提取,并將ROI區(qū)域映射到特征圖上(即ROIPooling操作),最后對映射后的特征圖進(jìn)行預(yù)測其病灶的類別和位置。算法流程分為訓(xùn)練階段和測試階段。訓(xùn)練階段使用訓(xùn)練數(shù)據(jù)集對該算法進(jìn)行訓(xùn)練,從而得到算法中的參數(shù),此時(shí)算法的輸入是乳腺X線圖片和對應(yīng)的人工標(biāo)注的病灶標(biāo)簽。在測試階段,我們使用測試數(shù)據(jù)集對算法的檢測性能進(jìn)行測試,將算法檢測出來的病灶結(jié)果與人工標(biāo)注的結(jié)果進(jìn)行對比,用來評估AI智能檢測病灶的性能。
本研究使用的敏感度和假陽率兩個(gè)指標(biāo)對檢測的性能進(jìn)行評價(jià)。假設(shè)影像中的病灶有N個(gè),算法檢測出了M個(gè)病灶,其中TP個(gè)病灶是真陽,F(xiàn)P個(gè)病灶是假陽,且TP+FP=M。那么敏感度(Sensitivity)和假陽率(False Positive Rate)的定義為,
Sensitivity=TP/N
(1)
False Positive Rate=FP/M
(2)
本研究對1892例訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,得到優(yōu)化后的AI智能病灶檢測模型,最后基于400例測試數(shù)據(jù)集進(jìn)行病灶檢測的效果驗(yàn)證,得到統(tǒng)計(jì)結(jié)果(表1)。
表1 測試集病灶檢測結(jié)果
400例測試集的實(shí)際病灶分布腫塊689個(gè),乳腺內(nèi)淋巴結(jié)1098個(gè),圓形鈣化73個(gè),環(huán)形鈣化692個(gè),粗糙鈣化544個(gè)。AI智能病灶檢測算法分別檢測出腫塊526個(gè),乳腺內(nèi)淋巴結(jié)912個(gè),圓形鈣化52個(gè),環(huán)形鈣化692個(gè),粗糙鈣化353個(gè)。AI智能病灶檢測算法敏感度分別為76.4%,83.1%,71.2%,75%,649%;假陽率分別為35.7%,38.6%,0.9%,0.6%,18.4%(圖2)。
圖1 算法的輸入為乳腺X線片,然后通過算法的預(yù)測,輸出病灶的位置(bbox_pred)和對應(yīng)的類別(cls_prob)。
圖2 AI智能病灶檢測結(jié)果。a~d) 分別為不同患者的乳腺X線影像的右乳MLO位,左乳CC位,右乳MLO位和右乳CC位。圖框表示病灶,綠框代表真實(shí)病灶,紅框代表AI智能檢測出的病灶。若綠色框和紅色框重合在一起表示真實(shí)的病灶被檢測出。圖中大部分病灶都被檢測出;若某個(gè)病灶僅有綠框,表示AI漏檢,c) 漏檢了3個(gè)病灶,d) 漏檢了1個(gè)病灶;若某個(gè)病灶僅有紅框表示病灶是一個(gè)假陽,或者是一個(gè)醫(yī)生漏標(biāo)記的病灶。
目前鉬靶X線檢查為乳腺癌篩查的首選方法。本文使用最新的人工智能方法對乳腺X線影像中的多類病灶進(jìn)行檢測,其中乳腺內(nèi)淋巴結(jié)的檢測效果最好,敏感度能達(dá)到83.1%,其次是腫塊76.4%,但兩者的假陽率比較高,分別為35.7%和38.6%。就鈣化的檢測而言,其整體效果沒有腫塊和乳腺內(nèi)淋巴結(jié)的效果好,最好的是環(huán)形鈣化敏感度為75%,最差的是粗糙鈣化,敏感度為64.9%,但鈣化的整體假陽率非常低,環(huán)形鈣化的假陽率僅為0.6%。
嘗試使用最新的人工智能算法對乳腺X線影像進(jìn)行智能檢測,可以同時(shí)對多類別病灶進(jìn)行檢出和類別預(yù)測,并且乳腺X線影像可以不需要做復(fù)雜的預(yù)處理便可以輸入模型中進(jìn)行預(yù)測。乳腺內(nèi)淋巴結(jié)檢測是本研究的一個(gè)亮點(diǎn),以往的研究基本上都是對鈣化或者腫塊的檢測,很少有對乳腺內(nèi)的淋巴結(jié)腫大情況進(jìn)行檢測。
本研究不足之處:①腫塊和乳腺內(nèi)淋巴結(jié)的假陽率較高;②需要大規(guī)模的人工標(biāo)注數(shù)據(jù),這需要耗費(fèi)很多醫(yī)生時(shí)間;③相對傳統(tǒng)的CAD系統(tǒng)檢測敏感度80%~90%而已。本研究整體的敏感度偏低,但值得注意的是本研究的敏感度評估是針對具體病灶的評估,而傳統(tǒng)的CAD評估是針對病例評估,本文研究病例量遠(yuǎn)遠(yuǎn)大于傳統(tǒng)的CAD方法。
本研究現(xiàn)階段僅僅只是用AI檢測了病灶,然而AI在乳腺鉬靶X線的作用遠(yuǎn)非如此。研究發(fā)現(xiàn)乳腺腺體的致密程度與患乳腺癌的風(fēng)險(xiǎn)成正比[18],且對于高致密性腺體,因?yàn)椴≡羁赡茉谥旅芟袤w下面,從乳腺鉬靶影像中往往很難發(fā)現(xiàn)病灶。然而對于人眼不易分辨的病灶,計(jì)算機(jī)可能具有比較好的分辨力。在未來,AI可能能在預(yù)測乳腺致密程度,以及高致密型腺體的病灶檢測上發(fā)揮出好的的檢測效果。
AI還可通過對病灶進(jìn)行良惡性鑒別以及識別癌癥是否轉(zhuǎn)移等來輔助醫(yī)生的臨床診斷。