張 俊,侯 聰,劉新疆 ,2
1濱州醫(yī)學院附屬醫(yī)院放射科,山東 濱州 256603;2上海市浦東醫(yī)院(復旦大學附屬浦東醫(yī)院)放射科,上海201399
肺癌是世界上發(fā)病率及死亡率最高的惡性腫瘤之一[1],全世界每年約有60萬的新發(fā)肺癌患者。降低肺癌死亡率,最關鍵的是早期發(fā)現(xiàn)及診斷,肺癌的早期多表現(xiàn)為肺內(nèi)小結節(jié),而CT尤其是薄層高分辨率CT使得肺結節(jié)的檢出率大大提高。但是薄層高分辨率CT會使影像圖像數(shù)量增加,從而增加了放射科醫(yī)師的工作量。由于診斷醫(yī)師的疲勞以及人為主觀性,有可能導致肺結節(jié)的漏診和誤診。近年來,人工智能(AI)發(fā)展迅速,為醫(yī)學圖像的自動分析和輔助醫(yī)生實現(xiàn)疾病的高精度診斷提供了良好的機遇。AI技術是隨著大數(shù)據(jù)的進步而興起的一門新興技術,在醫(yī)學領域中得到廣泛應用,尤其在肺結節(jié)的檢測方面具有較大進展[2]。
基于AI的計算機輔助診斷(CAD)系統(tǒng)可以提高放射科醫(yī)師的工作效率和肺結節(jié)診斷的準確性。當前,深度學習(DL)是AI技術的研究熱點,該技術可以有效地完成圖像檢測、識別和分類等任務。本文總結了DL的模型及其在肺結節(jié)領域中的研究進展。
“AI”這一概念最初于1956年提出。AI是計算機科學的一個分支,是一門用于研究模仿和拓展人類智能的理論及應用系統(tǒng)的新興技術類科學。AI技術能夠從圖像中獲得肉眼容易忽視和(或)無法提取的各種信息,從而提高對圖像的診斷效能,概括來說,AI代表了機器模仿人類認知功能的能力。
ML是用來定義計算機從數(shù)據(jù)積累中自動學習的AI領域。機器學習算法隨著數(shù)據(jù)的增加而進化,它們并不是完全基于規(guī)則,而是隨著經(jīng)驗的進步,學會通過評估大量數(shù)據(jù)給出具體的答案。在醫(yī)學中,機器學習指的是一種能夠改進和學習識別疾病特征模式的系統(tǒng)。
DL是ML的一個子集,實質(zhì)是通過構建含大量隱藏層的ML模型。它可以通過海量訓練集來學習有價值的特征,從而提升分類或診斷的準確性。DL意味著計算機擁有多層算法,這些算法相互連接,并按重要性分層。這些層從輸入中積累數(shù)據(jù),并提供輸出,一旦AI系統(tǒng)從數(shù)據(jù)中學習到新的特征,輸出就會逐步改變。
ML是AI的一個分支,而DL則是ML的一種。概括來說,AI是使計算機或軟件模仿人類學習和解決問題等功能的技術;ML是一種AI技術,在沒有明確編程的情況下自動學習與改進;DL是使用多層神經(jīng)網(wǎng)絡算法的ML技術。
DL模型通常分為監(jiān)督學習和非監(jiān)督學習兩種形式,其中監(jiān)督學習需要使用帶有分類標簽的數(shù)據(jù),此類模型包括卷積神經(jīng)網(wǎng)絡(CNN)和海量訓練人工神經(jīng)網(wǎng)絡(MTANN);非監(jiān)督學習則使用無標簽數(shù)據(jù),此類模型包括自編碼器(AE)和深度信念網(wǎng)絡(DBN),目前最常用的模型是CNN。
CNN是監(jiān)督學習下的代表性深度學習模型,是端到端機器學習中的一種類型。它的主要構成分為卷積層、池化層和全連接層。卷積層利用特定大小的卷積核對圖像卷積,從而學習和提取抽象的、深層次的特征。池化層常被放置在卷積層后,主要作用是對提取到的特征進行壓縮和降維,從而減少運算數(shù)據(jù)量。全連接層則主要將最終獲得的特征映射到輸出層。應用于肺結節(jié)領域的的CNN主要包括二維CNN(2D-CNN)和三維CNN(3D-CNN)以及多流、多尺度的CNN(MMCNN)等。
2D-CNN是最早應用于肺結節(jié)的深度網(wǎng)絡模型,其不受肺部CT圖像層厚的影響,且處理數(shù)據(jù)速度快,所需資源少。2D-CNN相比傳統(tǒng)神經(jīng)網(wǎng)絡,增加了卷積層和降采樣層,有利于減少肺結節(jié)圖像的特征維數(shù),但2DCNN提取的是單張圖像的特征,這樣容易造成模型過度擬合,進而導致診斷效能下降。而3D-CNN將單張的CT圖像堆積成連續(xù)的肺結節(jié)立方體,卷積核與每張圖像進行連接并運算,極大地提高了識別精度。因此,在使用相同網(wǎng)絡參數(shù)設置對相同的數(shù)據(jù)集進行分類識別時,3D-CNN比2D-CNN具有更高的準確率。
Hua等[3]在2015年將2D-CNN應用于肺結節(jié)的分類中,解決了傳統(tǒng)CAD性能穩(wěn)定性差、人工制定的診斷規(guī)則不全面和準確率較低等問題;但2D-CNN會丟失肺結節(jié)的空間立體信息。有研究提出將3D-CNN應用于肺結節(jié)分類的想法并設計了2個不同結構的3D-CNN在相同的數(shù)據(jù)集進行訓練和測試,通過對實驗結果所生成的受試者操作特征曲線進行評估[4],該實驗表明,3DCNN的效果較好,并且其不需要依靠特定的專業(yè)知識,通過不斷學習便有助于系統(tǒng)的進一步完善,從而提高了肺結節(jié)的診斷效率和準確性,但是3D-CNN存在特征較多、數(shù)據(jù)量較大和計算時間較長等問題。
有研究提出了一種基于MMCNN的肺結節(jié)檢測方法[5-6],此方法不需要進行分割等預處理操作,可以直接處理原始數(shù)據(jù),相比于只能提取單一尺度特征的卷積神經(jīng)網(wǎng)絡。MMCNN方法能夠提取到多尺度的特征,從而更加有利于肺結節(jié)的分類。
MTANN是另一種類型的端到端的機器學習,它包含多層人工神經(jīng)網(wǎng)絡,全連接網(wǎng)絡是其核心處理單元。它的特點是直接以候選肺結節(jié)CT圖像的灰度值作為輸入,但它的輸出是一幅圖像。在得到輸出圖像后,采用加權和的方式進行輸出圖像的量化。不同類型的肺結節(jié)有不同的分布特征,通過量化分析圖像像素的分布特征可將肺結節(jié)進行分類,達到了圖像處理與模式識別的目的。該模型減少了由于特征提取和分析導致的誤差,非常適合在小樣本數(shù)據(jù)應用[7]。有研究在肺結節(jié)檢測和分類方面,對MTANN和CNN的性能進行比較[8],結果表明在使用有限的訓練數(shù)據(jù)時,MTANN的性能優(yōu)于CNN,但是隨著數(shù)據(jù)量的增加,CNN的性能逐漸提高。因此,在有限的訓練樣本中,MTANN獲取的中、低等級的圖像特征可以滿足肺結節(jié)的檢測與分類。
AE是一種非監(jiān)督學習下的深度學習模型,包括輸入層、隱藏層和輸出層。輸入層壓縮圖像數(shù)據(jù),輸出層將其擴展,中間的隱藏層學習圖像內(nèi)像素的復雜關系[9],可以對目標特征進行提取和降維,這相對于傳統(tǒng)的人工標記提取更為客觀和可靠。為了實現(xiàn)分類,在AE的基礎上,相繼產(chǎn)生了稀疏自編碼(SAE)、去噪自編碼和堆棧去噪自編碼(SDAE)等深度模型。該類模型通過編碼與解碼過程,可以在較低維空間下對數(shù)據(jù)進行分類。
SAE由Bengio等[10]提出,它在自編碼的基礎上加入了稀疏性的限制,引入糾正激活函數(shù),提高了算法的魯棒性,進而有效提高了信息表達的準確率和全面性。DAE由Vincent等[11]提出,它在自編碼器的基礎上,對輸入的數(shù)據(jù)加入噪聲以防止過度擬合,使所學的編碼器具有較強的魯棒性,增強了模型的泛化能力。Hinton等[12]提出堆棧自編碼器,它是一種從無標簽數(shù)據(jù)中逐步多層地提取更抽象圖像特征的模型。當多個降噪自編碼器疊加起來時,也就是SDAE。SDAE將上層的隱層作為下層的輸入層,通過非監(jiān)督學習的逐層預訓練來初始化深度網(wǎng)絡的參數(shù),大大提高了表征能力。
有學者使用5層的DAE對肺結節(jié)進行診斷,得到的準確率為75.01%,靈敏度為83.35%[13]。Mao等[14]建立了一種結合局部和全局特征的肺結節(jié)圖像模型,他將圖像分割為局部補丁后,在深度AE中提取局部特征構建視覺詞匯袋,這樣可以獲取更詳細的特征信息。有研究提出一種改進的深度半監(jiān)督稀疏自編碼器(SSAE)模型對肺結節(jié)進行檢測,與其他模型(SAE、SSAE、RBM)相比,該模型獲得了較高的準確性、敏感性、特異性,更適用于肺結節(jié)的精準檢測[15]。
DBN是一種生成模型,這一概念由Hinton等[16]提出。它通過訓練神經(jīng)元間的權值,使整個神經(jīng)網(wǎng)絡按照最大概率生成訓練數(shù)據(jù),用于特征識別、數(shù)據(jù)分類和數(shù)據(jù)生成。經(jīng)典的DBN由受限玻爾茲曼機和一層反向傳播組成,受限玻爾茲曼機可分為顯性神經(jīng)元和隱性神經(jīng)元[17]。顯性神經(jīng)元用于接收輸入,隱性神經(jīng)元用于提取特征,層與層之間的神經(jīng)元存在連接,但層內(nèi)的神經(jīng)元間不存在連接[18],這種連接方式是其高效性的基礎。2015年,Hua等[3]首次將DBN應用在肺結節(jié)良惡性分類上,實驗獲得了73.4%的敏感度和82.2%的特異度,超過了傳統(tǒng)的機器學習方法。有研究將DBN與極限學習機相結合,不僅提高了肺結節(jié)的診斷準確率,而且大大縮短診斷時間[19]。
對于DL來說,高質(zhì)量標注圖像模型的構建很重要。當前由于標記肺結節(jié)圖像的不足,基于DL的網(wǎng)絡模型容易出現(xiàn)過擬合,準確率有待進一步提高。有學者將遷移學習應用到肺結節(jié)的分類中,有效地解決了肺結節(jié)樣本缺乏標注的問題,能夠大大提高分類的準確度[20-21]。由于醫(yī)學圖像的復雜性,如何更有效地將遷移學習應用于肺結節(jié)的分類中還需要進一步的研究。另外,DL本身存在一些缺陷,神經(jīng)網(wǎng)絡只是將圖像和最終的輸出結果聯(lián)系起來,其中的分類過程不可知,雖然已有多個網(wǎng)絡模型學習分葉和惡性腫瘤等特征[22],但絕大部分特征仍是未知的。對于醫(yī)療這種要求特別嚴格的行業(yè)來說,模型可解釋性是非常重要的。臨床醫(yī)生在看模型結果的時候,更關注模型所產(chǎn)生結果的邏輯過程,所以對于模型可解釋性的探索是未來發(fā)展的一個方向。此外,盡管目前基于DL的肺結節(jié)檢測與診斷模型有很多,小規(guī)模的驗證也可以達到較高的診斷性能,但缺乏統(tǒng)一的權威研究機構對過程進行評估和比較,也沒有統(tǒng)一的標準和大型的臨床試驗證明DL算法在臨床應用中的可靠性[23]。與此同時,AI的倫理和法律問題也應值得我們思考:在醫(yī)學應用中安全性尤為重要,如何最大限度避免AI系統(tǒng)出現(xiàn)差錯,怎樣控制出錯后的風險以及如何對此負責。
目前AI技術還處于深度研發(fā)階段,還不能作為直接的檢查診斷方法,結果還需要影像醫(yī)師進行判斷審核。因此影像科醫(yī)師必須具備處理AI的技能,充分了解AI在影像學診斷中的優(yōu)缺點。但不可否認的是,AI技術在病灶檢出率、縮短時間耗時等方面具有明顯優(yōu)勢。DL系統(tǒng)在進行肺結節(jié)的檢測時,也可以加入乳腺、胸膜、心臟和淋巴結等其他部位的檢測,這種全面的檢測可以有效避免漏診和誤診。
綜上所述,基于DL的AI對于肺結節(jié)檢測和診斷具有非常重要意義,它能夠降低影像醫(yī)師及臨床醫(yī)師工作量,提高工作效率。相信隨著AI進一步的深度學習、算法改進,對于病變識別的準確性也一定會得到顯著提升。在未來的醫(yī)學影像學乃至整個醫(yī)學領域中,基于DL的AI將發(fā)揮關鍵作用。