亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自監(jiān)督聚類算法的小樣本醫(yī)學(xué)圖像分類

        2022-03-12 18:19:38馬修玉何良華
        電腦知識與技術(shù) 2022年3期
        關(guān)鍵詞:深度學(xué)習(xí)

        馬修玉 何良華

        摘要:基于深度學(xué)習(xí)的醫(yī)學(xué)圖像分析是智慧醫(yī)療的一個重要方向。但是通常情況下,醫(yī)學(xué)圖像數(shù)據(jù)集數(shù)據(jù)量很小,而且由于醫(yī)學(xué)圖像的標注困難,耗費大量人力物力,所以帶標簽的訓(xùn)練數(shù)據(jù)很難獲取。如何使用極少的帶標簽數(shù)據(jù)和無標簽的數(shù)據(jù)得到一個較好的網(wǎng)絡(luò)模型是本文的主要研究內(nèi)容。該文提出基于深度聚類的自監(jiān)督網(wǎng)絡(luò)模型作為特征提取器,并且使用標簽傳播算法對特征進行分類,解決了只有極少量標簽(例如1張,5張或者10張)即小樣本情況下的醫(yī)學(xué)圖像分類問題,在BreakHis數(shù)據(jù)集上取得了比傳統(tǒng)機器學(xué)習(xí)算法更好的效果,并且接近于全監(jiān)督學(xué)習(xí)方法。

        關(guān)鍵詞:深度學(xué)習(xí);深度聚類;自監(jiān)督學(xué)習(xí);小樣本學(xué)習(xí);標簽傳播算法;醫(yī)學(xué)圖像分類

        中圖分類號:TP311? ? ?文獻標識碼:A

        文章編號:1009-3044(2022)03-0078-03

        開放科學(xué)(資源服務(wù))標識碼(OSID):

        1 概述

        深度學(xué)習(xí)算法,尤其是卷積神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)圖像分析領(lǐng)域的廣泛使用使得診斷的準確性有了很大提升。雖然基于深度學(xué)習(xí)的方法能在這些任務(wù)上取得比傳統(tǒng)機器學(xué)習(xí)方法更好的效果,但是這些方法通常都需要大量已標注的數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)。因此如何在已標注樣本很少的情況下(即小樣本情況),利用僅有的已標注數(shù)據(jù)以及無標簽數(shù)據(jù)解決醫(yī)學(xué)圖像分類成為一個很重要的問題。

        最近,很多對標注數(shù)據(jù)需求量小或者不需要標注數(shù)據(jù)的方法受到人們關(guān)注,出現(xiàn)了很多無監(jiān)督學(xué)習(xí)的方法,自監(jiān)督學(xué)習(xí)就是其中最具代表性的一種。自監(jiān)督學(xué)習(xí)的思想非常簡單,就是輸入的是無標注的數(shù)據(jù),但是通過數(shù)據(jù)本身的結(jié)構(gòu)或者特性,人為構(gòu)造標簽出來。有了標簽之后,就可以類似監(jiān)督學(xué)習(xí)一樣進行訓(xùn)練。傳統(tǒng)機器學(xué)習(xí)算法中,聚類算法是一種涉及數(shù)據(jù)點分組的機器學(xué)習(xí)技術(shù),不需要數(shù)據(jù)標簽,屬于無監(jiān)督學(xué)習(xí)算法的一種。結(jié)合兩種思想本文主要做了以下工作:

        1)提出基于深度聚類的自監(jiān)督網(wǎng)絡(luò)模型,利用無標簽數(shù)據(jù)訓(xùn)練出較好的特征提取模型。

        2)提出改進的標簽傳播算法,利用上述特征提取模型和有限的帶標注樣本進行分類,在BreakHis數(shù)據(jù)集上取得了很好的分類效果。

        2 相關(guān)工作

        2.1 自監(jiān)督學(xué)習(xí)

        自監(jiān)督學(xué)習(xí)作為無監(jiān)督學(xué)習(xí)方法的一個子集,可以從大規(guī)模未標記數(shù)據(jù)中學(xué)習(xí)一般圖像和視頻特征,而不使用任何人為標注標簽。自監(jiān)督學(xué)習(xí)的方法通常是設(shè)置一些前置任務(wù)(如圖像上色、圖像修補、圖像拼接等),訓(xùn)練網(wǎng)絡(luò)去解決前置任務(wù),在完成這些任務(wù)的過程中,網(wǎng)絡(luò)就學(xué)習(xí)到了相應(yīng)的特征。

        何凱明在2019年提出了MoCo(Momentum Contrast)[1], 使用動量的方式更新encoder參數(shù),解決新舊候選樣本編碼不一致的問題;Chen Ting在2020年提出了SimCLR[2],在encoder之后增加了一個非線性映射

        [ghi=W* ReLU (W* hi)]

        效果直接比MoCo高出了7個點,并直逼監(jiān)督模型的結(jié)果;何凱明在改進自己的方法加入相同的非線性層后提出MoCov2,效果反超SimCLR;近些年來人們開始把自監(jiān)督學(xué)習(xí)用于醫(yī)學(xué)圖像分析,例如谷歌提出了大型自監(jiān)督模型改進醫(yī)學(xué)圖像分類[3]。

        2.2 深度聚類與標簽傳播

        聚類的目標就是根據(jù)某一相似性度量準則,將相似的數(shù)據(jù)分到同一類,盡管人們提出了很多的聚類算法,但是這些方法在高維數(shù)據(jù)上表現(xiàn)得很差。由于深度學(xué)習(xí)的發(fā)展,以及神經(jīng)網(wǎng)絡(luò)內(nèi)在的非線性變換的特點,深度神經(jīng)網(wǎng)絡(luò)可以將數(shù)據(jù)轉(zhuǎn)化成更易于分類的特征表示,通常把使用深度學(xué)習(xí)的聚類方法稱之為深度聚類(deep clustering)[4]。

        標簽傳播算法[5]是一種基于圖的半監(jiān)督學(xué)習(xí)算法,它以一種迭代的方法通過帶標注數(shù)據(jù)推測無標注數(shù)據(jù)的標簽,其基本思路是用已標記節(jié)點的標簽信息去預(yù)測未標記節(jié)點的標簽信息,經(jīng)常被用于社區(qū)發(fā)現(xiàn)。

        2.3小樣本學(xué)習(xí)

        機器學(xué)習(xí)在數(shù)據(jù)密集型的領(lǐng)域取得了巨大的成功,但是在數(shù)據(jù)集比較小的時候通常效果更不太理想,最近人們提出了小樣本學(xué)習(xí)來解決這個問題。基于度量學(xué)習(xí)的小樣本學(xué)習(xí)方法比如MathingNet[6],ProtoNet[7]等都取得了不錯的效果。

        3 自監(jiān)督聚類模型

        3.1 自監(jiān)督聚類模型

        傳統(tǒng)的自監(jiān)督學(xué)習(xí)算法通常以大量的自然圖像比如ImageNet,作為訓(xùn)練數(shù)據(jù)集,構(gòu)造前置任務(wù),模型能夠在訓(xùn)練過程中學(xué)到底層的圖像特征。自監(jiān)督模型能夠使用無標簽數(shù)據(jù)進行訓(xùn)練,從而得到很好的特征提取器。傳統(tǒng)的網(wǎng)絡(luò)自監(jiān)督訓(xùn)練以每一張圖為一類,進行實例區(qū)分來訓(xùn)練網(wǎng)絡(luò)。由于自然圖像分類通常類別數(shù)量很大,無法利用類別信息,而醫(yī)學(xué)圖像分類任務(wù)通常類別已知(比如乳腺癌可以分為良性和惡性),因此可以設(shè)計基于聚類的自監(jiān)督網(wǎng)絡(luò)模型。

        本文提出基于深度聚類算法的自監(jiān)督網(wǎng)絡(luò)模型,如圖1所示。設(shè)計一個聚類隊列,在模型訓(xùn)練的同時,以聚類算法更新隊列,使模型不僅能學(xué)習(xí)區(qū)分不同實例,而且能學(xué)習(xí)同類別的相似性。網(wǎng)絡(luò)采用兩個分支,其中一個分支以動量方式更新參數(shù),并且將輸出用來更新聚類隊列,同時設(shè)計一個隊列存儲C個類別的均值向量,在迭代訓(xùn)練過程中采用k-means算法不斷地更新均值向量,具體步驟見算法1。自監(jiān)督訓(xùn)練分支采用InfoNCE損失函數(shù)。

        [LossNCE=-logexp (q?k+ / T)i=0Kexp (q?ki / T)]

        [Loss=LossNCE+λ?Losssim]

        結(jié)合聚類損失函數(shù)得到最終損失函數(shù)([λ]為平衡因子):

        算法1: 自監(jiān)督聚類

        輸入:特征向量 [q,? k]

        輸出:聚類隊列[ q] ,? 訓(xùn)練損失 [Losssim]

        開始 :

        [for q,? k in DataLoaer : ]

        [j=argmax{ k ? avgi }Ni=1]

        [enqueuej,? k ]

        [avgj=? 1Kj i=1Kjkj, i]

        [d=q?avgj]

        [Losssim+=Id>thresold*d]

        [return Losssim]

        結(jié)束

        3.2 標簽傳播算法

        標簽傳播算法的基本理論是:每個節(jié)點根據(jù)相似度將自己的標簽傳播給相鄰的節(jié)點,對于傳播的一個節(jié)點,它通過計算與周圍節(jié)點的相似度,根據(jù)相似度大的節(jié)點的標簽來更新附近的標簽,最終相似度大的節(jié)點的標簽都會被分為同一標簽。本文先將輸入的特征向量進行正則化,映射到球面空間,再進行標簽傳播,詳細過程見算法2,其中[Xl= x1,? y1 …? xl,? yl] 為已標注數(shù)據(jù)集,[Yl=y1, … , yl ∈{1 … C}] 為類別標簽, 類別數(shù)量 [C] 已知,并且所有類別在已標注數(shù)據(jù)集中都有展示。[Xu= xl+1,? yl+1 …? xl+u,? yl+u] 為未標注數(shù)據(jù)集,[Yu=yl+1, … , yl+u ∈{1 … C}] 為待預(yù)測數(shù)據(jù),通常情況下,[l << u]。要解決的問題就是根據(jù) [Xl] ,[Yl] ,[Xu] 預(yù)測 [Yu] ,具體算法步驟見算法2。

        算法2:? 標簽傳播

        輸入:特征向量矩陣 [X],? 實標簽矩陣[ Yl∈l × C] , 軟標簽矩陣 [Yu∈u × C]? ,傳播矩陣 [ T∈l+u × (l+u)]。

        輸出 :? 標簽矩陣 [Y ]。

        步驟:

        1. 正則化輸入特征向量 :?; ? ? ? [xi= xixi]

        2. 計算相似度權(quán)重矩陣:? ? [wij=exp- dijσ2=exp (- d=1D(xdi - xdj) σ2)]

        3. 計算標簽[ j] 傳播到標簽 [i] 的概率 : [Tij=? Pj →i= wijk=1l+uwkj]

        4. 傳播:? ? ? [Y=cat(Yl, Yu)]? ? ? ? ? ? [Yt=? T × Yt-1]

        5. 重置? [Y ]中已標記樣本的標簽: [Fl=? Yl]

        6. 重復(fù)步驟 4 和 5 直至 [Y] 收斂。

        筆者將第一階段訓(xùn)練好的模型作為特征提取器,將支撐集(support set, 有標簽), 查詢集(query set,無標簽)同時送入模型作為輸入,得到其在特征空間的映射,然后再將其歸一化到球形特征空間,通過標簽傳播算法進行預(yù)測分類,整個流程如圖2所示。

        4 實驗與結(jié)果分析

        4.1 實驗數(shù)據(jù)集

        實驗主要在BreakHis數(shù)據(jù)集上進行,BreakHis (Breast Cancer Histopathological Image) 包括82個病人,一共7909張乳腺癌病理圖片。數(shù)據(jù)集包含了四種放大倍數(shù)(40x,100x,? 200x, 400x)的顯微圖片,分為良性腫瘤,惡性腫瘤兩個大類。

        4.2 實驗流程

        本文主要以ResNet50 和 MoCo作為基線模型和提出的自監(jiān)督聚類模型MoCo + simLoss 作為對比。本文實驗基于Python3.7環(huán)境和PyTorch1.0框架,使用2塊NVIDIA GEFORCE 2080Ti GPU進行訓(xùn)練和測試。所有實驗的輸入圖像長寬固定為224,batchsize 設(shè)置為64,訓(xùn)練50 epoch,采用分類準確率來衡量算法的效果,數(shù)據(jù)增強方面則使用了隨機水平翻轉(zhuǎn),隨機 HSV 變化,隨機縮放和隨機剪切。優(yōu)化算法采用動量為 0.9 隨機梯度下降(SGD)。

        4.3 實驗結(jié)果

        實驗結(jié)果表1表明,基于MoCo的自監(jiān)督網(wǎng)絡(luò)模型比ResNet50預(yù)訓(xùn)練模型有很大的性能提升,說明自監(jiān)督在醫(yī)學(xué)圖像特征提取任務(wù)上的有效性并且加入自監(jiān)督聚類simLoss模塊能有效提升模型的性能;表2 驗證了標簽傳播算法的有效性,實驗結(jié)果表明標簽傳播算法比基于歐式距離的ProtoNet 和基于余弦距離的MatchingNet效果要好很多。

        最后與傳統(tǒng)分類算法相比,實驗結(jié)果表3表明模型在 5-shot 以及 10-shot 的情況下已經(jīng)比傳統(tǒng)算法有更好的分類效果, 并且隨著每個類別的有標簽樣本的增多,模型分類效果越來越好。

        5 總結(jié)

        本文提出了基于自監(jiān)督聚類算法的醫(yī)學(xué)圖像分類模型,通過對比和消融實驗證明了本文提出的方法在小樣本情況下的醫(yī)學(xué)圖像分類問題上比傳統(tǒng)的機器學(xué)習(xí)算法和全監(jiān)督算法具有更好的效果。

        參考文獻:

        [1] He K, Fan H, Wu Y, et al. Momentum contrast for unsupervised visual representation learning[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 9729-9738.

        [2] Chen T, Kornblith S, Norouzi M, et al. A simple framework for contrastive learning of visual representations[C]//International conference on machine learning. PMLR, 2020:1597-1607.

        [3] Azizi S, Mustafa B, Ryan F, et al. Big self-supervised models advance medical image classification[J]. arXiv preprint arXiv:2101.05224, 2021.

        [4] Min E X,Guo X F,Liu Q,et al.A survey of clustering with deep learning:from the perspective of network architecture[J].IEEE Access,2018,6:39501-39514.

        [5] Zhu X.Learning from Labeled and Unlabeled Data with Label Propagation[J]. Tech Report, 2002.

        [6] Vinyals O, Blundell C, Lillicrap T, et al. Matching networks for one shot learning[J]. Advances in neural information processing systems, 2016,29: 3630-3638.

        [7] Snell J, Swersky K, Zemel R S. Prototypical networks for few-shot learning[J]. arXiv preprint arXiv:1703.05175, 2017.

        【通聯(lián)編輯:梁書】

        猜你喜歡
        深度學(xué)習(xí)
        從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
        面向大數(shù)據(jù)遠程開放實驗平臺構(gòu)建研究
        基于自動智能分類器的圖書館亂架圖書檢測
        搭建深度學(xué)習(xí)的三級階梯
        有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
        電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
        利用網(wǎng)絡(luò)技術(shù)促進學(xué)生深度學(xué)習(xí)的幾大策略
        考試周刊(2016年94期)2016-12-12 12:15:04
        MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        国模无码视频一区| 久久精品国产亚洲av麻豆瑜伽| 国产精品人人做人人爽| 欧美大黑帍在线播放| 国产在线视欧美亚综合| 激情视频在线播放一区二区三区| 激情亚洲一区国产精品久久| 亚洲精品美女久久久久久久| 亚洲中文无码久久精品1| 亚洲区福利视频免费看| 精品久久久少妇一区二区| 亚洲最大av在线精品国产| 97一期涩涩97片久久久久久久| 精品国产aⅴ无码一区二区 | 成人乱码一区二区三区av| 无码人妻精品一区二区三18禁 | 一本大道道久久综合av| 久久精品国产视频在热| 制服丝袜天堂国产日韩| 亚洲大片一区二区三区四区| 亚洲国产精品美女久久| 无码精品人妻一区二区三区影院| 狠狠爱无码一区二区三区| 免费人人av看| 日本一区二区三区四区高清不卡| 亚洲国产日韩精品一区二区三区| 亚洲精品456| 日本熟妇视频在线中出| 午夜无码一区二区三区在线观看| 日日猛噜噜狠狠扒开双腿小说| 亚洲无码视频一区:| 亚洲一区二区三区毛片| 日本一区二区三区亚洲| 中文字幕久久久人妻无码| 欧美精品久久久久久久久| 亚洲熟女一区二区三区不卡| 久久久久亚洲av成人人电影| 国产无遮挡又黄又爽又色| 亚洲一区二区精品久久岳| 久久久精品人妻一区二区三区游戏 | 丁香综合网|