陳勇濤,賈 軒,蔡建庭
(1 浙江大學(xué)醫(yī)學(xué)院附屬第二醫(yī)院消化內(nèi)科 浙江 杭州 310009)
(2 浙江大學(xué)醫(yī)學(xué)院 浙江 杭州 310011)
消化道惡性疾病在中國以及全世界癌癥相關(guān)發(fā)病率、病死率榜上居高不下。消化內(nèi)鏡是消化道疾病早期診斷、治療的重要手段。近年來,內(nèi)鏡技術(shù)如窄帶成像、放大內(nèi)鏡等迅速發(fā)展,內(nèi)鏡醫(yī)生可以在鏡下直觀地發(fā)現(xiàn)胃腸道黏膜的病變。但是,我國不同地區(qū)醫(yī)生資源分配不平衡,各種內(nèi)鏡醫(yī)生的臨床技術(shù)水平存在較大差距,消化道疾病檢出率相對較低。人工智能(artificial intelligence,AI)具有快速數(shù)據(jù)處理和強大的圖像特征提取能力,符合對圖像處理有高度需求的消化內(nèi)鏡領(lǐng)域的要求,借助AI 技術(shù)在消化領(lǐng)域的發(fā)展有望解決這些問題。
“AI”概念首次提出于1956 年的達特茅斯大會上,標志著現(xiàn)代AI 科技的出現(xiàn)。但AI 在之后的近半個世紀發(fā)展中幾經(jīng)曲折,直至2016 年,AlphaGo 打敗了韓國頂級圍棋高手,才標志著AI 時代的來臨。AI 屬于計算機技術(shù)學(xué)科中的一個分支,重點在于對語音識別、圖片辨別以及自然語言的處理。機器學(xué)習(xí)也是AI 系統(tǒng)中的一種,它可以通過對目標原始數(shù)據(jù)進行特征提取、篩選,并根據(jù)篩選出來的特征訓(xùn)練模型、驗證模型。傳統(tǒng)的機器學(xué)習(xí)需要通過人為地對研究對象進行特征提取,其算法效果受研究人員提取的特征質(zhì)量影響,存在一定主觀偏倚。以卷積神經(jīng)系統(tǒng)(convolutional neural networks,CNN)為代表的深度學(xué)習(xí)網(wǎng)絡(luò)可以通過自主學(xué)習(xí),自動提取圖像特征彌補這一缺陷,是目前研究的熱門。目前AI 技術(shù)已經(jīng)運用于部分的臨床實踐中。2016 年,Gulshan 等運用深度學(xué)習(xí)方法,創(chuàng)建了一種可以自動檢測糖尿病視網(wǎng)膜病變的算法模型。2017 年Esteva 等開發(fā)出了一套AI 皮膚癌診斷系統(tǒng),其功能可與皮膚病專家相媲美。未來,AI 可協(xié)助臨床工作者迅速鑒別、判斷臨床病情,提升治療準確性,降低錯誤治療、漏診發(fā)生率,實現(xiàn)醫(yī)療水平的大幅度提升。
Barrett 食管是食管腺癌的癌前病變,目前主要通過白光胃鏡與病理活檢對其進行確診,存在較高漏診率,De Groof 等構(gòu)建了一個深度學(xué)習(xí)模型,使用包含超過49 萬張內(nèi)鏡胃腸道靜態(tài)圖像的數(shù)據(jù)庫對該模型進行訓(xùn)練。通過與非專家級內(nèi)窺鏡醫(yī)生比較,發(fā)現(xiàn)該模型的病灶識別準確率更高,并且可以97%的患者中發(fā)現(xiàn)最佳活檢部位。
食管癌位居世界腫瘤發(fā)病率排行第8 位,腫瘤相關(guān)死亡數(shù)的第6 位。在我國,食管癌居腫瘤發(fā)病率的第6位,腫瘤相關(guān)死亡數(shù)的第4 位。目前診斷食管癌的方法主要包括白光內(nèi)鏡、NBI、碘染色等技術(shù),但漏診率高達40%。Horie 等構(gòu)建了AI 食管癌檢測系統(tǒng),并回顧性收集來源于384 例患者的8 428 張食管癌圖像對AI 系統(tǒng)進行訓(xùn)練,將來自47 位食管癌患者和50 例非食管癌患者共1 118 張圖像作為測試集,測試結(jié)果顯示,該系統(tǒng)檢測食管癌的靈敏度達到98%,同時可以98%的準確度區(qū)分早期和晚期癌癥。食管癌的浸潤深度評估對治療手段的選擇具有重大的參考意義。Nakagawa 等通過使用大量臨床數(shù)據(jù)構(gòu)建了基于AI 的食管癌浸潤深度評估系統(tǒng)并對其進行測試,測試結(jié)果顯示AI 系統(tǒng)對浸潤深度具有良好的判斷能力。
幽門螺桿菌(helicobacter pylori, Hp)的感染與多種消化系統(tǒng)疾病相關(guān),其早期發(fā)現(xiàn)根除可降低人們罹患萎縮性胃炎等疾病的風(fēng)險。Itoh 等開發(fā)了一套AI 系統(tǒng)用于Hp 檢測,測試結(jié)果顯示該系統(tǒng)對Hp 檢測的敏感性是86.7%,特異性是86.7%,受試者工作特征曲線下面積(area under curve, AUC)是0.956。Bang 等對AI 用于識別幽門螺桿菌的相關(guān)文獻進行了系統(tǒng)回顧,共納入8 篇文獻,包含1 719 名受試對象。分析結(jié)果顯示AI 預(yù)測Hp 的綜合敏感性、特異性和AUC 分別為0.87、0.86和0.92。張雅瓊等對AI 在慢性萎縮性胃炎方面進行了研究,其共回顧性收集5 470 張來自1 699 例患者的胃竇部圖像,包含3 042 張萎縮性胃炎,2 428 張非萎縮性胃炎,AI 慢性萎縮性胃炎識別系統(tǒng)測試結(jié)果顯示,該模型對慢性萎縮性胃炎檢測的準確度、敏感度、特異度分別是0.9424,0.9458,0.9401,優(yōu)于3 位內(nèi)鏡專家的識別能力。
胃癌居全球發(fā)病率的第5 位,病死率的第4 位,居我國發(fā)病率第3 位,病死率第3 位。胃癌發(fā)病率高、轉(zhuǎn)移早,早期治療預(yù)后好,中晚期預(yù)后均不佳。Ikenoyama 等使用2 940 張測試圖像構(gòu)建了自動識別胃早癌的AI 系統(tǒng),同67 位內(nèi)鏡醫(yī)生比較對胃早期癌的識別能力。結(jié)果顯示,相較于內(nèi)鏡醫(yī)生,CNN 可以在更短的時間內(nèi)發(fā)現(xiàn)更多的早期胃癌病灶。同時,有學(xué)者將AI 應(yīng)用于胃癌浸潤深度的評估。Hamada 等通過卷積神經(jīng)系統(tǒng)構(gòu)建了評估胃癌浸潤深度的AI 系統(tǒng),經(jīng)過大量數(shù)據(jù)的測試,其敏感性、特異性、準確度分別可達到84.9%,70.7%,78.9%。
小腸疾病診斷主要依靠膠囊內(nèi)鏡。膠囊內(nèi)鏡攝片量大,對閱片能力要求高。經(jīng)驗豐富的內(nèi)鏡醫(yī)生閱片時間可控制在20 min 內(nèi),而缺乏經(jīng)驗的醫(yī)生閱片時間可長達2 h,AI 的發(fā)展可有效提高閱片效率。Aoki 等使用5 360 張小腸鏡圖像構(gòu)建出AI 系統(tǒng)。使用10 440 張小腸鏡圖像作為測試集對系統(tǒng)進行測試,該系統(tǒng)對測試圖像分析總用時233 s,糜爛、潰瘍檢出的AUC 值為0.958,對病灶檢出的靈敏度、特異度、準確性分別為88.2%、90.9%和90.8%。
結(jié)腸腺瘤性息肉是結(jié)腸癌的癌前病變,其檢出率每增加1%,結(jié)直腸癌發(fā)病率減少3%~6%。不同年資內(nèi)鏡醫(yī)生結(jié)腸息肉的檢出率可波動7%~53%,提升結(jié)腸息肉的檢出率至關(guān)重要。Lui 等通過前瞻性試驗在52 例腸鏡檢查過程中應(yīng)用AI 系統(tǒng)實時探測息肉,實驗結(jié)果顯示AI 系統(tǒng)可以防止多達80%的腺瘤漏診,初步證明了AI 技術(shù)在臨床的實用性。
炎癥性腸病包括潰瘍性結(jié)腸炎、克羅恩病。AI 技術(shù)在該領(lǐng)域的研究主要集中于疾病的預(yù)測、診斷以及預(yù)后的評估。Maeda 等開發(fā)了用于預(yù)測組織學(xué)炎癥的CAD系統(tǒng),通過回顧性收集187 例潰瘍性結(jié)腸炎的患者的內(nèi)鏡圖像以及對應(yīng)部位的活檢樣本。將其中87 例患者圖像用于機器模型的訓(xùn)練,剩余100 位患者的圖像用于測試,結(jié)果顯示CAD 系統(tǒng)對潰瘍性結(jié)腸炎的診斷準確率達91.0%。Tong 等構(gòu)建深度學(xué)習(xí)系統(tǒng),通過測試發(fā)現(xiàn)其對潰瘍性結(jié)腸炎、克羅恩病具有良好的鑒別性能。
結(jié)直腸癌居全球發(fā)病率及癌癥相關(guān)病死率的第3位,是導(dǎo)致人類死亡的重要原因。Luo 等將AI 用于對結(jié)直腸癌浸潤深度的評估,通過將7 734 張普通白光內(nèi)鏡圖像對構(gòu)建的AI 系統(tǒng)進行測試,并將包含156 個病灶的1 634 張圖像作為測試集驗證AI 系統(tǒng)的識別能力,結(jié)果顯示,該系統(tǒng)在預(yù)測非浸潤性和淺表浸潤性腫瘤及區(qū)分淺表腫瘤和深度侵襲性早期結(jié)直腸癌中結(jié)果均良好。
AI 技術(shù)具備計算機強大的計算能力,可以更加高效地提取研究對象的臨床特征。同時,通過深度學(xué)習(xí)系統(tǒng),AI 可以實現(xiàn)自主學(xué)習(xí),診斷能力可以與專家相媲美。具備以上兩項優(yōu)勢,AI 可以在更短的時間更加高效地完成指令任務(wù)。但是,AI 技術(shù)仍然存在不少缺陷:(1)目前大部分研究為單中心研究,易導(dǎo)致研究結(jié)果過擬合,缺乏泛化能力。(2)大多數(shù)研究為回顧性研究,所構(gòu)建的AI 系統(tǒng)在臨床實踐應(yīng)用效果仍未知。(3)選圖多為靜息圖像,將AI 應(yīng)用于臨床要求其達到能在動態(tài)視頻中準確識別病灶。(4)選圖多為白光內(nèi)鏡圖像,但早期胃癌等病灶在放大內(nèi)鏡、染色內(nèi)鏡等特殊內(nèi)鏡下診斷準確率更高,AI 在特殊內(nèi)鏡中的應(yīng)用研究仍有待加強。綜上所述,目前大多數(shù)AI 技術(shù)相關(guān)研究仍處于探索階段,尚未推廣到實際臨床應(yīng)用中,未來需要開展更多的前瞻性、多中心研究來推動AI 技術(shù)在內(nèi)鏡領(lǐng)域的發(fā)展。