何佳雯,王莉菲,張如如,譚 玲,劉 毓,王晴川,陳正宇,范家偉,鄂海紅,宋美娜*
(1.北京郵電大學計算機學院,北京 100876;2.教育部信息網(wǎng)絡(luò)工程研究中心,北京 100876;3.河北省眼科醫(yī)院眼底外科,河北 邢臺 054001)
光學相干斷層掃描(optical coherence tomography, OCT)是無接觸、無創(chuàng)成像技術(shù),以較高分辨率快速對眼部結(jié)構(gòu)進行可視化,提供清晰的橫軸位成像[1],現(xiàn)已成為診斷老年性黃斑變性(age-related macular degeneration, AMD)和糖尿病黃斑水腫(diabetic macular edema, DME)等眼底疾病的金標準[2];但圖像中病變區(qū)域與正常區(qū)域之間的對比度較低,且成像過程受儀器噪聲及其他生物組織的干擾,分析圖像較為耗時,結(jié)果難以避免主觀性。近年來,深度學習(deep learning,DL)技術(shù)發(fā)展迅速,用于醫(yī)學圖像處理可快速、準確地捕捉病變特征并判斷疾病類型,提高工作效率和診斷精度及穩(wěn)定性[3]。本文對基于DL的OCT輔助診斷常見眼底疾病研究進展進行綜述。
基于干涉儀原理,不同深度的生物組織對于OCT設(shè)備發(fā)出光波的后向反射能力不同。以近紅外弱相干光照射待測組織,檢測不同深度層面生物組織的背向反射或數(shù)次散射信號,可得到眼部組織的二維或三維結(jié)構(gòu)圖像(圖1)。OCT具有出色的光學切片能力,能利用寬帶光源的低相干性實現(xiàn)對次表面的高分辨率層析成像而捕捉病變的精確信息[4],其探測深度遠超過傳統(tǒng)共焦顯微鏡。
圖1 視網(wǎng)膜黃斑區(qū)OCT INL為內(nèi)核層,IPL為內(nèi)部網(wǎng)狀層,ILM為內(nèi)限膜,GCL為神經(jīng)節(jié)細胞層,NFL為神經(jīng)纖維層,OPL為外叢狀層,ONL為外核層,ELM為外部限制膜,IS/OS為內(nèi)部和外部感光段的連接,RPE為視網(wǎng)膜色素上皮+布魯赫膜,OPR為光感受器外節(jié)/RPE復(fù)合體,Choroid為脈絡(luò)膜,Bruchs Membrane為布魯赫膜
2.1 DL概述 DL是機器學習最重要的分支之一,通過大量訓練樣本而學習樣本的內(nèi)在規(guī)律和表示層次,具有預(yù)測、分類及分割能力?;贒L的OCT輔助診斷眼底疾病主要包括OCT預(yù)處理、OCT分割和OCT分類各環(huán)節(jié)。預(yù)處理指對OCT圖像進行去噪、圖像增強及形態(tài)學處理,以去除散點噪聲、提高對比度,清晰顯示特征區(qū)域;提取ROI,后續(xù)僅針對其進行分割或分類。OCT分割可量化圖像中不同組織層的厚度及病變區(qū)域范圍,幫助臨床醫(yī)生或輔助診斷系統(tǒng)根據(jù)病變類型、位置、區(qū)域及數(shù)量判斷疾病嚴重程度。在分割基礎(chǔ)上進行分類,通過DL技術(shù)分析OCT圖像中病變區(qū)域特征與眼底疾病的關(guān)系,實現(xiàn)自動篩查眼底疾病,輔助眼科醫(yī)師提出進一步診療計劃及轉(zhuǎn)診建議等。
對于DL模型而言,足量訓練樣本非常重要。目前主要OCT開源數(shù)據(jù)集見表1,可根據(jù)不同需求適當選用。
表1 現(xiàn)有主要可用 OCT開源數(shù)據(jù)集
2.2 基于DL的OCT輔助診斷常見眼底疾病研究進展 視網(wǎng)膜內(nèi)液(intraretinal fluid, IRF)、視網(wǎng)膜下液(subretinal fluid, SRF)及色素上皮脫離(pigment epithelium detachment, PED)等是OCT診斷常見眼底疾病的重要依據(jù)。目前針對OCT的DL模型已可分割多種病變區(qū)域及對眼底病變進行分類,主要包括AMD、DME及青光眼等。
2.2.1 AMD AMD為黃斑區(qū)結(jié)構(gòu)衰老性改變,分為干性AMD和濕性AMD。干性AMD表現(xiàn)為黃斑區(qū)存在玻璃疣等;濕性AMD表現(xiàn)為CNV異常生長。2018年,SEEB?CK等[11]以正常人眼部OCT圖像訓練多尺度深度去噪自編碼器(deep denoising autoencoder, DDAE)用于提取正常OCT圖像中的特征,并訓練單類支持向量機模型用于識別OCT圖像中的AMD區(qū)域,根據(jù)聚類結(jié)果將OCT圖像分為正常及早期、晚期AMD,預(yù)測分類準確率達81.40%,使模型可解釋性趨于更好。2019年,HWANG等[12]以InceptionV3模型將583例AMD和174名正常人的35 900幅OCT圖像分類為正常、干性AMD、活躍性濕性AMD及非活躍性濕性AMD,降低了任務(wù)復(fù)雜度,準確率達92.67%。ASLAM等[13]基于OCT訓練前饋神經(jīng)網(wǎng)絡(luò)模型,以預(yù)測滲出性AMD患眼的視力,與實際視力相比,其均方根誤差為8.20個字母,并可用于監(jiān)測AMD患眼視力,有助于及時診斷和治療ADM復(fù)發(fā)?;贒L智能診斷AMD現(xiàn)已達到較高精度,有待進一步研究驗證并付諸臨床應(yīng)用。
2.2.2 DME DME是糖尿病眼部主要并發(fā)癥,為四大致盲眼病之一,在OCT圖像中主要表現(xiàn)為高反射點、視網(wǎng)膜內(nèi)囊樣積液及中心凹下脈絡(luò)膜厚度改變等。2018年,PERDOMO等[14]提出端到端的OCT-NET DL模型,實現(xiàn)DME與正常二分類,通過網(wǎng)格搜索方法篩選最優(yōu)的批量大小和學習率,其準確率、敏感度和特異度均達93.75%。VAHADANE等[15]提出兩階段DL網(wǎng)絡(luò)篩查DME,第一步使用圖像處理技術(shù)檢測硬滲出物和積液區(qū)域的候選補丁;第二步以卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)對候選補丁進行分類,判斷是否存在DME病理特征,以篩查DME;補丁可有效提高模型的聚焦特性、降低模型規(guī)模,使其精確率達96.43%。2019年,HASSAN等[16]提出基于雙模態(tài)數(shù)據(jù)的DL框架,通過CNN自彩色眼底圖像和OCT圖像中提取特征并加以融合,之后通過人工神經(jīng)網(wǎng)絡(luò)、支持向量機和樸素貝葉斯進行集成,以分類DME與正常,其準確率達94.33%。上述研究表明,OCT圖像中DME的病變特征相對明顯,對經(jīng)典DL模型進行遷移即可獲得較高的診斷精度。
2.2.3 青光眼 青光眼是視神經(jīng)受損所致,因早期癥狀不明顯而診斷困難,需綜合考慮眼壓、眼底形態(tài)、視野及視網(wǎng)膜神經(jīng)纖維層(retinal nerve fiber layer, RNFL)等多個因素。2018年,WANG等[17]提出了分割檢測聯(lián)合網(wǎng)絡(luò)(joint segmentation and diagnosis network, S-D Net),以模擬臨床醫(yī)師診斷青光眼:首先應(yīng)用分割網(wǎng)絡(luò)(segmentation network, S-Net)對OCT圖像進行視網(wǎng)膜層分割,之后以診斷網(wǎng)絡(luò)(diagnosis network, D-Net)依據(jù)RNFL厚度診斷青光眼,由于存在正常人RNFL變薄、而青光眼RNFL無變化的現(xiàn)象,該網(wǎng)絡(luò)的診斷準確率為85.40%。2019年,AN等[18]基于OCT和彩色眼底圖像開發(fā)了一種智能輔助診斷開角型青光眼的算法,通過OCT圖像分別獲取黃斑區(qū)、視盤區(qū)、RNFL和神經(jīng)節(jié)細胞覆蓋合體(ganglion cell complex, GCC)的厚度,結(jié)合視盤區(qū)域的彩色眼底圖像,使用5個基于VGG模型的預(yù)模型,并采用隨機森林算法分類青光眼與正常,其曲線下面積(area under the curve,AUC)達0.963;但該研究樣本量較少,且部分患者合并近視,導致結(jié)果可能存在偏差。RAN等[19]基于譜域OCT(spectral-domain OCT, SD-OCT)數(shù)據(jù)開發(fā)一種3D DL系統(tǒng),通過檢測RNFL厚度自動診斷青光眼視神經(jīng)病變,基于深度殘差網(wǎng)絡(luò)(deep residual network, ResNet)生成熱圖,顯示青光眼視神經(jīng)病變相關(guān)組織結(jié)構(gòu);經(jīng)香港中文大學眼科中心和香港眼科醫(yī)院收集的數(shù)據(jù)初步驗證其診斷效能優(yōu)于2D DL系統(tǒng),并基于香港威爾斯親王醫(yī)院、屯門眼科中心及美國斯坦福大學拜爾斯眼科研究數(shù)據(jù)進行了外部驗證,其表現(xiàn)良好,但仍需進一步研究評估其增量成本效益。現(xiàn)有多數(shù)DL模型基于RNFL及GCC厚度診斷青光眼,總體診療精度相對較低,結(jié)合視盤和黃斑區(qū)血管密度、黃斑全層厚度、視野及眼壓等綜合數(shù)據(jù)進行多模態(tài)[20-21]分析有助于準確診斷青光眼。
2.2.4 其他眼底疾病 隨著技術(shù)的迅速發(fā)展,現(xiàn)已實現(xiàn)同時分割多種病灶區(qū)域或同時分類多種眼底疾病。2018年,谷歌DeepMind團隊[22]提出一種兩階段DL模型,先以3D U-Net分割模型分割OCT圖像中眼部15種不同組織和病變區(qū)域,再利用CNN進行診斷和轉(zhuǎn)診推薦分類,可準確檢測50余種眼部疾病,且其遷移性在不同設(shè)備上均較好,準確率達94.5%,符合醫(yī)師診療流程,適用于臨床。KERMANY等[7]以Inception V3模型為基礎(chǔ)進行遷移學習,以篩查CNV、DME和玻璃疣,并根據(jù)檢測到的疾病類型提出轉(zhuǎn)診建議,分類準確率為96.60%,敏感度為97.80%,特異度為97.40%。FANG等[23]提出的病變感知CNN模型可用于分類玻璃疣、CNV、DME與正常,該模型模擬醫(yī)師診療習慣,首先以注意力機制生成病灶檢測軟注意力圖,并將之合并到分類模型中,根據(jù)注意力程度對局部卷積表示進行加權(quán),分類玻璃疣、CNV、DME與正常的準確率分別為94.9%、94.5%、97.1%及97.5%。2020年,ZHANG等[24]提出BMM-Net模型分割OCT圖像中的視網(wǎng)膜水腫、SRF和PED病變區(qū)域,以U-Net為基礎(chǔ),集成邊界提取模塊、多尺度信息感知模塊,以捕捉準確位置和語義特征,解決病變區(qū)域?qū)Ρ榷鹊图安≡畛叽绮痪獾膯栴},并在AI Challenger挑戰(zhàn)賽數(shù)據(jù)集上進行驗證,平均Dice系數(shù)達82.22%,性能佳。目前基于DL的OCT圖像已在分割多種病變區(qū)域及分類多種眼底疾病方面取得突出成果,且正朝向可解釋、多分類及泛化方向發(fā)展。
基于DL的OCT輔助診斷眼底疾病具有廣闊應(yīng)用前景,但仍面臨挑戰(zhàn):①由于隱私問題,可用于訓練模型的高質(zhì)量、標準化OCT圖像數(shù)據(jù)仍甚匱乏;②DL模型的機制缺乏可解釋性[25],這在很大程度影響輔助診斷系統(tǒng)用于臨床實踐。相信未來將會克服上述不足,獲得優(yōu)秀成果,推動該領(lǐng)域的發(fā)展。