亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多層次可選擇核卷積用于視網(wǎng)膜圖像分類

        2022-10-26 12:36:16納,李
        關鍵詞:視網(wǎng)膜卷積神經(jīng)網(wǎng)絡

        朱 納,李 明

        (重慶師范大學 計算機與信息科學學院,重慶 401331)

        0 引 言

        糖尿病性視網(wǎng)膜病變(diabetic retinopathy, DR)是糖尿病病人身上一種常見的致盲性疾病[1]。據(jù)國際糖尿病聯(lián)盟(international diabetes federation, IDF)研究表明,糖尿病病齡超過10年,視網(wǎng)膜病變幾率高達60%,可能導致病人短暫性失明或永久性失明[2]。如果對糖尿病病人進行定期檢查,早發(fā)現(xiàn)DR早治療可以避免病情進一步惡化。

        目前糖尿病視網(wǎng)膜病變主要有白內(nèi)障、青光眼、年齡相關性黃斑病變(age-related macular degeneration, AMD)以及糖尿病性黃斑水腫(diabetic macular edema, DME)[3]。AMD又可按照臨床表現(xiàn)和病理改變不同分為干性(DRUSEN)、濕性(CNV)兩型。衰老和退變是引起AMD的重要因素,隨著人口趨于老齡化,AMD已成為西方發(fā)達國家最主要的致盲疾病[4-5]。該病患者在前期并沒有表現(xiàn)出任何外在癥狀,但是隨著時間的推移,患者視力會逐漸退化,雖然不會導致視力完全喪失,但是會對患者的正常生活帶來一定的不便。因此,對眼底圖像DR的嚴重程度進行準確分類是當前研究重點。

        光學相干斷層掃描技術(optical coherence tomography, OCT)是近年來一種新型層析成像技術,它可以得到生物組織的結(jié)構(gòu)圖像。與傳統(tǒng)的眼底檢測技術相比,OCT更快捷、可進行活體眼組織顯微鏡結(jié)構(gòu)的非接觸式、非侵入性斷層成像,更容易檢測到眼底鏡檢查、熒光素眼底血管制影法無法檢測的糖尿病引起輕微黃斑水腫(DME)[6]。因此,本文采用OCT視網(wǎng)膜眼底檢測圖像數(shù)據(jù)集進行分類研究。

        隨著深度學習神經(jīng)網(wǎng)絡的發(fā)展,一些學者在對視網(wǎng)膜OCT圖像進行分類研究時使用深度學習對圖像進行預處理,用于解決視網(wǎng)膜OCT圖像的大小和質(zhì)量不統(tǒng)一等問題。以上基于圖像預處理的方法雖然取得不錯的實驗效果,但同時會導致圖像丟失部分有用原始信息,在增加實驗復雜性的同時也降低了模型魯棒性。

        為了使神經(jīng)元能夠自適應地調(diào)整其感受野大小,增加模型魯棒性,本文采用了可選擇卷積核(selective kernel, SK)在對多個尺度擴張率的卷積核之間進行自動選擇操作。具體來說,引入了一個SK卷積,它由3個階段組成:分割、融合和選擇。分割階段生成多條路徑,這些路徑具有相同的卷積核但不同的擴張率,對應不同的神經(jīng)元感受野大小。融合階段將多條路徑的信息進行組合和聚合,得到一個全局的、全面的選擇權(quán)重表示。選擇操作再根據(jù)2種權(quán)值自身相似性和相對相似性選擇權(quán)值對不同擴張率路徑上的特征映射進行聚合??紤]到不同的視網(wǎng)膜OCT數(shù)據(jù)集本身存在天然差異,為了證明模型性能比較的公平性及泛化性能,本文在2個公開數(shù)據(jù)集(OCT2017、SD-OCT)中進行模型對比[7],實驗表明,該算法具有良好的泛化性能,與以往的算法相比有一定優(yōu)勢。

        1 相關工作

        隨著機器學習的興起,越來越多的人開始研究機器學習算法和各種神經(jīng)網(wǎng)絡在醫(yī)學圖像分析中的應用。

        2014年,Srinivasan等[8]將機器學習應用到基于OCT圖像的AMD和DME疾病的診斷和分析。他們提取了OCT圖像的HOG特征,并使用支持向量機(SVM)進行分類和識別,還通過杜克大學,哈佛大學和密歇根大學創(chuàng)建了一個公共OCT數(shù)據(jù)集,以方便將來的研究。 在2016年,Wang等[9]使用了Srinivasan等提供的公共數(shù)據(jù)集,利用OCT圖像的線性配置模式(linear configuration pattern, LCP)特征和順序最小優(yōu)化(sequential minimal optimal, SMO)算法進行OCT圖像的分類分析并進行識別分類。 值得一提的是,在特征的提取中使用了多尺度方法,因此,可以在多個OCT尺度上計算LCP特征,這使得OCT圖像的局部信息和整體信息在提取的特征中互為補充。2017年,Rasti等[10]不僅使用Srinivasan等提供的公共數(shù)據(jù)集研究了OCT圖像的分類和識別,還通過德黑蘭的Noor Eye醫(yī)院建立了另一個公共OCT數(shù)據(jù)集。使用多尺度卷積神經(jīng)網(wǎng)絡對2個OCT數(shù)據(jù)集進行分類和識別,并對OCT圖像的局部和整體信息進行了組合,該方法可以有效地提高網(wǎng)絡的識別能力。

        2017年,Karri等[11]也使用了Srinivasan等提出的公共OCT數(shù)據(jù)集,對OCT圖像進行分類和識別,對預訓練卷積神經(jīng)網(wǎng)絡(CNN)GoogleLeNet進行了微調(diào),以及對OCT圖像進行訓練和分類,從而可以訓練神經(jīng)網(wǎng)絡,并通過使用有限的數(shù)據(jù)獲得良好的效果。2019年,F(xiàn)eng等[12]還使用轉(zhuǎn)移學習對OCT圖像進行分類,以減少對數(shù)據(jù)集大小的依賴,以及對預訓練的VGG16進行了微調(diào)和培訓。文獻[11-12]提出的遷移學習以減少神經(jīng)網(wǎng)絡的訓練參數(shù),從而減少了對數(shù)據(jù)集大小的依賴,但是這種方法對不同數(shù)據(jù)集之間的差異泛化性能較差。Juan等[13]通過彩色眼底圖像利用VGG19,GoogLeNet,ResNet50和DeNet神經(jīng)網(wǎng)絡對青光眼疾病的識別和診斷性能進行了全面的比較分析。文獻[14]提出了一種基于ResNet50的深度哈希算法來執(zhí)行圖像檢索和分類任務。

        文獻[15]提出了一種自動聚焦層,可以自動為每層特征圖分配相應系數(shù),以突出某一特征的重要性。FractalNets[16]和Multilevel ResNets[17]實現(xiàn)了遞歸地擴展多個路徑。InceptionNets[18-21]仔細地為每個分支配置了自定義的內(nèi)核過濾器,以聚合更多信息性和多樣化的功能。由于使用預訓練模型或者遷移學習對圖片進行識別和分類,僅在一定程度上可以改善實驗效果。受文獻[9]中提取圖片多尺度特征方法的啟發(fā),并根據(jù)現(xiàn)有數(shù)據(jù)集的實際情況,本文在文獻[22]上進行了改進。值得注意的是,本文提出的模型雖然遵循了InceptionNets 的思想,即為多個分支結(jié)構(gòu),但在至少3個重要方面有所不同:①本文提出的方法更簡單,泛化性能更強;②實現(xiàn)神經(jīng)元的自適應感受野大小;③將多條路徑的信息進行選擇時既考慮了樣本特征與各類別的相似性,又考慮了樣本特征間相對重要性,最終得到一個全局的、全面的選擇權(quán)重表示。

        2 網(wǎng)絡架構(gòu)

        為了實現(xiàn)神經(jīng)元自適應地調(diào)整其感受野大小,本文采用了SK在多個尺度的卷積核之間進行自動選擇操作。具體來說,本文通過3個階段:分割、融合和選擇來實現(xiàn)SK卷積,如圖1所示。其中,圖1展示了2個分支的情況。雖然在該結(jié)構(gòu)圖中只有2種尺度的卷積核(卷積核大小同為3×3,擴張率分別為1和2),但很容易擴展到更多路徑的情況。

        圖1 多層次可選擇核卷積網(wǎng)絡結(jié)構(gòu)圖Fig.1 Overview of multilevel selective kernel convolution network

        2.1 分 割

        2.2 融 合

        本文期望神經(jīng)元能夠根據(jù)刺激內(nèi)容自適應地調(diào)整其感受野大小。主要的思路是通過門控使得承載不同信息量的2個分支信息流進入下一層的神經(jīng)元。為了實現(xiàn)這一目標,各部門需要整合2個分支機構(gòu)的信息。本文首先通過元素求和將來自2個分支的結(jié)果融合在一起,表示為

        (1)

        然后,僅使用全局平均池來生成按通道的統(tǒng)計信息s∈C便可嵌入全局信息。具體來說,s中的第c個元素是由U縮小至空間維度H×W計算所得,表示為

        (2)

        此外,z∈d×1用于表示特征更精確和自適應選擇的結(jié)果。通過簡單的全連接層實現(xiàn),降低了維度,同時提升了效率。

        (3)

        (3)式中:δ表示激活函數(shù)ReLU[21],B表示批歸一化;W∈d×C。引入縮減比r來研究維度d對模型效率的影響,其中,L=32表示d的最小值。

        d=max(C/r,L)

        (4)

        2.3 選 擇

        通過壓縮后的特征表示z,跨通道的軟注意力用于自適應地選擇信息的不同空間比例。具體來說,分別將softmax,sigmoid運算符應用于通道數(shù)字,即

        (5)

        (5)式中:A,B∈C×d,a和b分別表示和的軟注意力向量。Ac∈1×d表示A的第c行,而ac表示a的c個元素,Bc和bc同理。然后將2個分支卷積核上的注意力加權(quán)求得各層次的特征圖,即

        (6)

        (6)式中,V=[V1,V2],Vc∈H×W。最終圖片的輸出表示O由V降維得到。值得注意的是,本文僅討論了為雙分支情況,可根據(jù)需求增加不同尺寸卷積核通過擴展至多分支。

        3 數(shù)據(jù)集及參數(shù)設置

        3.1 數(shù)據(jù)集描述

        本文采用了公開數(shù)據(jù)OCT2017和SD-OCT。第1個數(shù)據(jù)集OCT2017的原始訓練集為來自4 686名患者的83 484張OCT圖片,其中與年齡相關的濕性黃斑變性(CNV)有37 205張,與年齡相關的干性黃斑變性(DRUSEN)有8 616張,另外糖尿病性黃斑水腫(DME)有11 348張,正常圖像(NORNAL)有26 315張。測試集是來自于633名患者的CNV、DRUSEN、DME、NORMAL各250張圖片。本文對數(shù)據(jù)集OCT2017做了下采樣處理,以黃斑變性的數(shù)據(jù)量8 616為基準,對各個類別進行等樣本隨機采樣,然后按照訓練集測試集比例8∶2進行數(shù)據(jù)劃分。第2個數(shù)據(jù)集SD-OCT包含許多眼球圖像,而不僅僅是視網(wǎng)膜圖像,因此需要適當?shù)睾Y選。經(jīng)篩選后,該數(shù)據(jù)集中有5 084張圖片,其中,1 185張為DME,1 524張為AMD,2 375張為正常。表1顯示了本文2個數(shù)據(jù)集的主要統(tǒng)計數(shù)據(jù)。

        由于2個公共數(shù)據(jù)集的質(zhì)量和大小不同,因此將它們分開進行訓練和評估,這也可以驗證不同神經(jīng)網(wǎng)絡模型對數(shù)據(jù)集差異之間的差異泛化性。圖2、圖3分別展示了2個數(shù)據(jù)集的樣例。

        表1 數(shù)據(jù)集統(tǒng)計Tab.1 Dataset statistics

        圖2 OCT2017數(shù)據(jù)集圖片示例Fig.2 Sample demo of the dataset OCT2017

        圖3 SD-OCT數(shù)據(jù)集圖片示例Fig.3 Sample demo of the dataset SD-OCT

        3.2 實驗環(huán)境及模型參數(shù)配置

        本文實驗代碼基于Python3.6,pytorch版本為1.8,torchvision 版本0.7.0,Linux系統(tǒng)版本為16.04,GPU配置為Tesla V100-PCIE。在網(wǎng)絡訓練過程中,將學習率設置為0.001,損失函數(shù)為交叉熵損失,優(yōu)化方式為SGD梯度下降法,Batch size大小設為30。

        3.3 統(tǒng)計評價指標

        由于不同評價指標對實驗結(jié)果的評估意義不同,所以本文使用了常用的正確率、精準率、召回率3種評估指標對實驗結(jié)果進行評估。另外為了使實驗更加簡潔易懂,將使用混矩陣將每一類數(shù)據(jù)的分類結(jié)果展示出來。其中,正確率、精確率、召回率分別定義為

        (7)

        (8)

        (9)

        (7—9)式中:TP代表把正樣本預測為正樣本的樣本數(shù)量;TN代表把正樣本預測為負樣的樣本數(shù)量;FP代表把負樣本預測為正樣本的樣本數(shù)量;FN代表把負樣本預測為負樣本的樣本數(shù)量;TP+FP代表預測為正樣本的全部樣本數(shù)量;TP+FN代表正樣本的全部數(shù)量。

        4 實驗結(jié)果分析

        4.1 基線模型介紹

        VGG16卷積神經(jīng)網(wǎng)絡是牛津大學在2014年提出來的模型VGG[24]的變種。作為深度學習基礎網(wǎng)絡,它不僅簡潔且實用,VGG16在圖像分類和目標檢測任務中都表現(xiàn)出非常好的結(jié)果。

        RepVGG[25]用結(jié)構(gòu)重參數(shù)化(structural re-parameterization) 實現(xiàn)VGG式單路極簡架構(gòu),一路3×3卷到底,在速度和性能上達到先進水平。

        ResNet-50是殘差網(wǎng)絡 (residual network) 的典型網(wǎng)絡,該系列網(wǎng)絡廣泛用于目標分類等領域以及作為計算機視覺任務主干經(jīng)典神經(jīng)網(wǎng)絡的一部分。

        Res2Net-50[26]用一個較小的3×3過濾器取代了過濾器組,同時可以將不同的過濾器組以層級殘差式風格連接。模塊內(nèi)部的連接形式與殘差網(wǎng)絡類似。

        SENet[27]采用了聚合和權(quán)重分配(squeeze-and-excitation, SE)模塊主要為了提升模型對通道特征的敏感性。SKNet與SENet相似,SKNet主要是提升模型對感受野的自適應能力。

        MSKNet*為本文模型的變形,將MSKNet的2個分支改為同為擴張率為1的3×3卷積核。

        4.2 模型結(jié)果對比

        4.2.1 主要實驗結(jié)果

        表2為改進模型MSKNet與基線網(wǎng)絡在2個數(shù)據(jù)集上的主要實驗結(jié)果,其中帶下劃線數(shù)據(jù)為不同網(wǎng)絡在各類別中分類準確率最高的結(jié)果,而通過這些數(shù)據(jù)可以看出,本文改進模型不管與原模型SKNet相比,還是與其他基線網(wǎng)絡相比,都是最具優(yōu)勢的模型,在2個數(shù)據(jù)集上分別達到了95.39%和99.18%的分類效果。

        通過表2在2個不同數(shù)據(jù)集上的實驗結(jié)果顯示,本文模型MSKNet不僅相對于現(xiàn)有模型的實驗結(jié)果有一定提升,還證明了本文模型具有較強的泛化性能,能學習到圖像中視網(wǎng)膜病變區(qū)域的有效特征,從而正確識別視網(wǎng)膜疾病。此外,從數(shù)據(jù)集SD-OCT的3分類到OCT2017的4分類,分類難度增加,但實驗結(jié)果顯示出本文模型MSKNet提升更多。

        4.2.2 混淆矩陣

        為了更好地證明本文創(chuàng)新點的可行性,本文將以OCT2017數(shù)據(jù)集為例對7個模型的實驗結(jié)果通過混淆矩陣進行了進一步地展示,結(jié)果如圖4所示。

        圖4中,類別0.0,1.0,2.0,3.0分別代表CNV,DRUSEN,DME,NORMAL。從模型的角度來看,本文模型的混淆矩陣對角線上的正確分類中是5種模型中最多的,這證明了本文模型在視網(wǎng)膜疾病識別任務中有很好的效果。與VGG16的分類結(jié)果相比,本文模型的優(yōu)勢更加明顯,在4分類任務中分別多了130,116,188,86個正確預測樣本。這進一步說明本文創(chuàng)新點的可行性和有效性。從數(shù)據(jù)集的角度來看,無論是哪種模型,都容易將樣本2預測為樣本0,將樣本3預測為樣本2。對于這2種較難分類的情況,本文模型卻在5種模型中分類效果最好,即錯分的樣本數(shù)最少。

        4.2.3 準確率與訓練輪數(shù)關系

        隨著模型的訓練次數(shù)增加,模型的精確率會逐步趨于穩(wěn)定。無論在OCT2017數(shù)據(jù)集上還是SD-OCT數(shù)據(jù)集上,當模型訓練到達150輪左右時,測試集精確率都逐漸趨于穩(wěn)定,如圖5所示。不同數(shù)據(jù)集的測試結(jié)果顯示,本文提出的模型要顯著優(yōu)于已有的基線模型SENet及SKNet,這表明了本文模型的泛化性強,在疾病診斷中更具有實際價值。進一步比較可發(fā)現(xiàn),OCT2017數(shù)據(jù)集的準確率要低于SD-OCT數(shù)據(jù)集,這反映出數(shù)據(jù)集的復雜度更高,但本文提出的MSKNet的優(yōu)勢更加明顯,證明在復雜的環(huán)境下本文模型對視網(wǎng)膜病變區(qū)域識別效果更顯著。

        表2 實驗結(jié)果比較Tab.2 Experiment results

        圖4 數(shù)據(jù)集OCT2017中模型混淆矩陣Fig.4 Models confusion matrix in dataset OCT2017

        圖5 不同數(shù)據(jù)集下訓練準確率與訓練輪數(shù)關系Fig.5 Relationship between models and training step

        5 結(jié) 論

        本文采用可選擇卷積核自適應地調(diào)整神經(jīng)元感受野大小,并對來自不同擴張率卷積的特征進行選擇操作,既考慮了視網(wǎng)膜病變種類間的相對重要性,又保持了圖片特征與各類別獨立相似性。具體來說,本文引入了一個SK卷積,它由3個階段組成:分割、融合和選擇。分割階段生成多條路徑,這些路徑具有相同的卷積核但不同的擴張率,對應不同的神經(jīng)元感受野大小。融合階段將多條路徑的信息進行組合和聚合,得到一個全局的、全面的選擇權(quán)重表示。選擇操作再根據(jù)2種權(quán)值自身相似性和相對相似性選擇權(quán)值對不同擴張率路徑上的特征映射進行聚合。大量實驗結(jié)果表明,本文提出的多層次可選擇卷積核網(wǎng)絡較目前其他主流算法具有顯著優(yōu)勢。

        猜你喜歡
        視網(wǎng)膜卷積神經(jīng)網(wǎng)絡
        深度學習在糖尿病視網(wǎng)膜病變診療中的應用
        基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
        家族性滲出性玻璃體視網(wǎng)膜病變合并孔源性視網(wǎng)膜脫離1例
        高度近視視網(wǎng)膜微循環(huán)改變研究進展
        神經(jīng)網(wǎng)絡抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于傅里葉域卷積表示的目標跟蹤算法
        復明片治療糖尿病視網(wǎng)膜病變視網(wǎng)膜光凝術后臨床觀察
        基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
        重型機械(2016年1期)2016-03-01 03:42:04
        復數(shù)神經(jīng)網(wǎng)絡在基于WiFi的室內(nèi)LBS應用
        白浆高潮国产免费一区二区三区| 2019年92午夜视频福利| 欧美性久久| 中文少妇一区二区三区| 国产成人高清在线观看视频| 免费网站看av片| 99精品电影一区二区免费看| 国产伪娘人妖在线观看| 中文字幕乱码亚洲三区| 精品久久人妻av中文字幕| 最新亚洲人成无码网www电影| 国产AV无码无遮挡毛片| 国产一区二区三区最新地址| 欧美猛少妇色xxxxx猛交| 婷婷综合久久中文字幕蜜桃三电影| 亚洲在战AV极品无码| 日韩精品中文字幕一区二区| 女女女女女裸体处开bbb| 91av手机在线观看| 免费观看在线视频一区| 一区二区三区国产精品乱码| 国产精品ⅴ无码大片在线看 | 91久久国产自产拍夜夜嗨| 中文字幕亚洲高清精品一区在线| 日韩国产人妻一区二区三区| 无尽动漫性视频╳╳╳3d| 亚洲人成网站在线播放小说| 亚洲中文字幕日韩综合| 欧美乱妇高清无乱码在线观看| 521色香蕉网站在线观看| 精品午夜中文字幕熟女| 国产精品国产三级国产av剧情 | 午夜在线观看一区二区三区四区| 老熟妇乱子伦牲交视频| 国外精品视频在线观看免费| 久久er这里都是精品23| 日本美女在线一区二区| 亚洲国产午夜精品理论片在线播放 | 91桃色在线播放国产| 亚洲成av人片天堂网无码| 窝窝影院午夜看片|