任家銀,郭際香
(1.四川大學(xué)華西口腔醫(yī)學(xué)院,成都610065;2.四川大學(xué)計算機學(xué)院,成都610065)
根據(jù)2017 年9 月衛(wèi)計委發(fā)布的第四次全國口腔健康流行病學(xué)調(diào)查結(jié)果[1],近年來我國口腔疾病的患病率呈明顯上升趨勢,口腔疾病患者數(shù)量龐大。2017 年口腔門診、急診人次達1.44 億,增長近10 個百分點,而且診療人數(shù)還不包括大量口腔診所等機構(gòu)。此外,一些口腔健康觀念的落后導(dǎo)致我國口腔患者的診療率偏低,而且隨著人口的逐漸老齡化,口腔醫(yī)療的需求將大幅增長。然而據(jù)統(tǒng)計,我國每百萬人口擁有的口腔醫(yī)生僅137 名,遠低于發(fā)達國家500-1000 名的水平,口腔醫(yī)療人員非常缺乏。
作為人工智能領(lǐng)域的主流技術(shù),深度學(xué)習(xí)在在醫(yī)療影像分割、病灶檢測、識別和診斷等領(lǐng)域取得了巨大的飛躍[2-3]。深度學(xué)習(xí)技術(shù)已逐步應(yīng)用于醫(yī)學(xué)的諸多領(lǐng)域,在肺結(jié)節(jié)檢測、乳腺癌識別、皮膚癌識別、眼底病識別、病理識別等領(lǐng)域取得了諸多成果。人工智能與醫(yī)學(xué)的結(jié)合,不僅獲得越來越多的計算機領(lǐng)域科研工作者的關(guān)注,在醫(yī)學(xué)界也掀起了一波智能醫(yī)學(xué)的研究熱潮。國內(nèi)外各大頂尖醫(yī)院都開始與人工智能公司合作,希望借助人工智能技術(shù),對疾病進行有效的診斷、治療、預(yù)測和管理。
頜骨疾病是口腔領(lǐng)域常見的多發(fā)疾病,口腔全景片是其檢查的主要手段。及時從全景片中檢測頜骨疾病,有助于減輕醫(yī)療人員工作量,提高工作效率,在一定程度上緩解日益緊張的口腔醫(yī)療資源。本文以深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),設(shè)計分類網(wǎng)絡(luò),以正確識別和分類正常全景片和三種常見的頜骨疾病,包括骨髓炎、囊腫、牙源性腫瘤。
近三十年來隨著醫(yī)學(xué)影像技術(shù)的迅猛發(fā)展和影像設(shè)備的日趨成熟及普及,核磁共振成像(Magnetic Resonance Image,MRI)、計算機斷層掃描(Computer Tomography,CT)、錐狀射束電腦斷層掃描(Cone Beam Computer Tomography,CBCT)、正電子發(fā)射斷層掃描(Positron Emission Tomography,PET)、超聲(Ultrasound)、X射線(X-ray)等醫(yī)學(xué)影像技術(shù),已成為開展臨床檢查、疾病診斷、手術(shù)方案制定、治療決策、預(yù)后評估和隨訪不可或缺的組成部分,且日益重要。全世界每天生成大量醫(yī)學(xué)影像數(shù)據(jù),如何利用當(dāng)前人工智能領(lǐng)域的主流技術(shù)深度學(xué)習(xí)方法處理分析醫(yī)學(xué)影像大數(shù)據(jù),為臨床醫(yī)學(xué)中各種重大疾病的篩查、診斷、治療提供行之有效的方法,是當(dāng)前醫(yī)學(xué)圖像處理領(lǐng)域的研究熱點和前沿問題。
在深度學(xué)習(xí)(Deep Learning,DL)中,深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Networks,DCNNs)由于其強大的特征表達和提取能力,先后在自然圖像和醫(yī)學(xué)圖像的處理上都獲得了巨大成功。它能夠從醫(yī)學(xué)影像大數(shù)據(jù)中自動學(xué)習(xí)、提取隱含的特征,近幾年已迅速成為醫(yī)學(xué)圖像分析的核心、關(guān)鍵技術(shù)?;谏疃葘W(xué)習(xí)的醫(yī)學(xué)圖像定位與檢測、分類與識別、分割、配準(zhǔn)是當(dāng)前醫(yī)學(xué)圖像分析的主要任務(wù),涵蓋醫(yī)學(xué)的諸多領(lǐng)域,如腦、眼科、肺癌、乳腺、心臟、腹腔等。
基于深度學(xué)習(xí)技術(shù)的醫(yī)學(xué)圖像的分類與識別可以自動輔助診斷病人病情的輕重程度,給出治療建議。2016 年,谷歌公司的科學(xué)家們在《JAMA》雜志上報道了利用深度卷積神經(jīng)網(wǎng)絡(luò)從10 萬余張視網(wǎng)膜眼底圖像中診斷糖尿病性視網(wǎng)膜病變及黃斑水腫[4],獲得了較好的敏感性和特異性。2017 年,斯坦福大學(xué)的研究者們在《Nature》雜志上報道了利用深度學(xué)習(xí)技術(shù)在皮膚癌診斷的三個關(guān)鍵性診斷任務(wù)[5],即角化細(xì)胞癌的分類、黑素瘤的分類和通過皮膚鏡檢查的黑素瘤分類中獲得了媲美皮膚科醫(yī)生的結(jié)果。同年,Golden 等人[6]在《JAMA》雜志發(fā)表了通過深度學(xué)習(xí),可以迅速地閱讀病理照片,從而診斷乳腺癌患者腋窩淋巴結(jié)有無癌細(xì)胞擴散,其結(jié)果要優(yōu)于病理醫(yī)師用顯微鏡的常規(guī)做法,且大大提高了診斷速度,減輕了病理學(xué)家的負(fù)擔(dān)。
病灶的定位是臨床診療中非常重要的步驟,醫(yī)學(xué)圖像的定位和檢測可以把圖像中所有的病變區(qū)域檢測出來并給出詳細(xì)的位置,在肺癌篩查中獲得成功應(yīng)用。2016 年,ISBI 組織的LUNA16 人工智能肺結(jié)節(jié)檢測競賽,吸引了一大批國內(nèi)外人工智能研究團隊的參與[7],基于深度學(xué)習(xí)的肺結(jié)節(jié)檢測技術(shù)極大地提高了肺癌篩查的效率,緩解了目前該領(lǐng)域醫(yī)生缺乏、工作量大、診斷時間長等一系列問題。此外,基于深度學(xué)習(xí)的醫(yī)學(xué)圖像分割和配準(zhǔn)更是緩解了傳統(tǒng)圖像分割和配準(zhǔn)算法中沉積多年的問題。醫(yī)學(xué)圖像分割的準(zhǔn)確率不斷上升,為醫(yī)學(xué)診斷提供了極大的幫助。在口腔領(lǐng)域,深度學(xué)習(xí)的應(yīng)用尚少,現(xiàn)有的研究主要集中在面部標(biāo)志點的檢測上[8],為正畸、整形方案的制定提供了準(zhǔn)確的指導(dǎo)。
綜上所述,深度學(xué)習(xí)技術(shù)在醫(yī)學(xué)圖像的分析中有極為重要的意義和臨床價值,本文研究探索深度卷積于網(wǎng)絡(luò)在口腔疾病診斷中的應(yīng)用,以期在一定程度上減輕醫(yī)生工作量,有助與緩解口腔醫(yī)療領(lǐng)域的不斷增長需求和日益緊張的醫(yī)療資源之間的問題。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種成功并廣泛應(yīng)用于醫(yī)學(xué)圖像分類的經(jīng)典深度學(xué)習(xí)模型,該模型主要包括卷積(Convolution)層、池化(Pooling)層以及全連接(Fully Connected)層,是一種具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)。CNN 在1988 年被LeCun 等人[9]提出并應(yīng)用于手寫體識別中。卷基層利用不同的卷積核來對圖像進行特征處理和抽象,提取不同層次的本質(zhì)特征。在卷積層之后,通添加池化層,通過不斷降低維數(shù),以減少網(wǎng)絡(luò)中的參數(shù)和計算次數(shù),縮短了訓(xùn)練時間并控制過度擬合。CNN 網(wǎng)絡(luò)通常包含不同層數(shù)個交叉相連的卷積層、池化層,以綜合利用提出的信息。對于分類而且,CNN 在卷積和池化之后,連著全連接層與分類器。全連接層通常為多層神經(jīng)網(wǎng)絡(luò),此外為了避免網(wǎng)絡(luò)在訓(xùn)練樣本不充足時出現(xiàn)過擬合情況,一般在全連接層中采用Dropout(隨機丟失技術(shù)),也使得網(wǎng)絡(luò)提出的圖像特征更具有魯棒性。目前對于各種卷積神經(jīng)網(wǎng)絡(luò)來說,激活函數(shù)多采用ReLU激活函數(shù),分類器通常采用Softmax 或支持向量機。本文以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),設(shè)計實現(xiàn)口腔全景片的四分類識別網(wǎng)絡(luò),用以正確把收集的口腔全景片分為正常、骨髓炎、囊腫、牙源性腫瘤共計四類。如圖1 所示,本文設(shè)計了一個9 層的卷積網(wǎng)絡(luò)分類模型,輸入為單張牙齒全景片,模型包含3 個卷基層,2 層全連接,及輸出層。該模型使用Adam 算法為損失函數(shù)計算梯度,以0.001 的學(xué)習(xí)率最小化交叉熵。
本文收集了來自四川大學(xué)華西口腔醫(yī)學(xué)院的近671 張全景片,并由專業(yè)醫(yī)生做了詳細(xì)標(biāo)注。如表1 所示,數(shù)據(jù)包括正常全景片和三種病變骨髓炎、囊腫、牙源性腫瘤的全景片,同時骨髓炎和牙源性腫瘤下又包含了亞分類標(biāo)注,但是由于各亞分類數(shù)據(jù)過少,有的僅有幾張或十幾張圖像,所以本文僅進行了四分類實驗。671 張圖像被分成訓(xùn)練集和測試集,其中訓(xùn)練集占80%用于訓(xùn)練分類網(wǎng)絡(luò)模型,測試集占20%用于進行模型測試。實驗在一臺帶GPU 1080 顯卡的PC 上完成。
圖1 牙齒全景片分類模型
表1 實驗數(shù)據(jù)描述
本采用的分類評價指標(biāo)為:精準(zhǔn)率Precision、召回率Recall、F1Score 和準(zhǔn)確率Accuracy。計算公式分別定義如下,其中TP(True Positive)表示分類正確的正樣本;TN(True Negative):表示分類正確的負(fù)樣本;FP(False Positive)表示分類錯誤的正樣本;FN(False Negative)表示分類錯誤的負(fù)樣本。
實驗結(jié)果如表2 所示,整體準(zhǔn)確率在80%。囊腫病變的精準(zhǔn)率和召回率最好,牙源性腫瘤的結(jié)果較差,其原因在于分類的數(shù)據(jù)不均衡。本僅是對牙齒全景片分類做一個初步的嘗試和驗證,未采用數(shù)據(jù)曾廣和非均衡樣本下的分類算法,后續(xù)將進一步豐富實驗過程。雖然本實驗結(jié)果應(yīng)用到實際臨床中還有所欠缺,但初步結(jié)果尚可,囊腫的精準(zhǔn)率達90%。
表2 四分類實驗結(jié)果
基于深度學(xué)習(xí)方法的醫(yī)學(xué)圖像分類是當(dāng)前計算機輔助醫(yī)學(xué)方面的研究熱點,深度學(xué)習(xí)算法在醫(yī)學(xué)圖像處理領(lǐng)域具有重要的理論意義和實際應(yīng)用價值。本文采用深度學(xué)習(xí)方法中經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)對牙齒全景片圖像的病變分類做了初步嘗試。通過輸入口腔全景片,由分類模型判斷其是否有病變,屬于哪一種病變。初步結(jié)果顯示,分類模型結(jié)果較好。在后續(xù)的研究工作,將進一步收集更多的數(shù)據(jù),豐富頜骨疾病類別;也將深入研究深度學(xué)習(xí)方法,從多方面提升頜骨疾病診斷效果,以期進一步實現(xiàn)臨床應(yīng)用。