亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度森林的CT圖像結(jié)直腸息肉檢測研究

        2022-04-05 10:03:42陳祎瓊范國華畢家澤
        關(guān)鍵詞:級聯(lián)決策樹息肉

        陳祎瓊, 劉 澳, 范國華, 畢家澤, 陳 滔

        (1.安徽農(nóng)業(yè)大學 信息與計算機學院, 安徽 合肥 230036; 2.安徽省北斗精準農(nóng)業(yè)信息工程實驗室, 安徽 合肥 230036;3.安徽農(nóng)業(yè)大學 工學院, 安徽 合肥 230036)

        最近幾年中,結(jié)直腸癌是最常見的惡性腫瘤之一。根據(jù)美國癌癥協(xié)會的報告[1],結(jié)直腸癌在美國的致死率與患病率在所有癌癥中排名第二。多數(shù)結(jié)直腸癌起于黏膜息肉,其產(chǎn)生與多種因素相關(guān)[2],起始于異常的腺窩,后逐漸演變成息肉,最終發(fā)展為結(jié)腸直腸癌,整個過程可持續(xù)多年。結(jié)直腸息肉的早期檢測是預(yù)防結(jié)直腸癌、降低發(fā)病率、死亡率的有效途徑,如何正確地判斷結(jié)直腸息肉的存在成為了一個值得思考的問題。

        針對CT圖像中結(jié)直腸息肉是否存在分類的問題,國內(nèi)外學者展開了深入地研究,并將演變成的息肉特征與智能算法結(jié)合,陳奕志等[3]研究出一種基于深度學習的結(jié)直腸息肉自動檢測,取得了可觀的判斷效果。左艷等[4]提出醫(yī)學影像處理智能化與人工智能手段結(jié)合。Rajpurkar等[5]使用改進的Dense Net[6]對X線胸片圖像進行分類。Shen等[7]使用卷積神經(jīng)網(wǎng)絡(luò)、隨機森林與支持向量機對肺部CT圖像進行肺結(jié)節(jié)良、惡性分類。秦喜文等[8]將深度森林算法與慢性腎病結(jié)合,眾多學者為防治結(jié)直腸息肉提供醫(yī)學依據(jù)。隨著各行業(yè)對人工智能(artificial intelligence)需求的增加,也伴隨著深度學習(Deep Learning)概念的提出,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)由于其強大的表征學習能力和擬合能力,成為醫(yī)學等領(lǐng)域的研究熱點之一。

        DNN也有著明顯的缺陷:(1)訓練通常需要大量的訓練數(shù)據(jù),即使是后來學者對于訓練數(shù)據(jù)采取一系列的方式進行數(shù)據(jù)增強,但深度神經(jīng)網(wǎng)絡(luò)依舊很難直接面對數(shù)據(jù)量較小的人物,即使身處于大數(shù)據(jù)時代,許多實際任務(wù)由于大量客觀因素,導(dǎo)致缺乏足夠的標記數(shù)據(jù)量,所以深度神經(jīng)網(wǎng)絡(luò)在這些任務(wù)中的性能較差。(2)訓練時間過長,在深度神經(jīng)網(wǎng)絡(luò)學習的過程中,深度神經(jīng)網(wǎng)絡(luò)是一個極為復(fù)雜的模型,在訓練過程中所需硬件與軟件設(shè)施的配備要求較高。

        深度森林(Deep Forest)[9]一種新的決策樹集成方法。此算法與深度神經(jīng)網(wǎng)絡(luò)的存在不同,該算法對訓練樣本數(shù)據(jù)要求不高,并且具有強大的表征學習能力,訓練速度可觀、參數(shù)魯棒性好等許多優(yōu)勢。

        人工智能技術(shù)的終極目標是讓學習到的模型具有與人類相當?shù)慕鉀Q問題的能力。國內(nèi)外學者對結(jié)直腸息肉研究主要集中于對結(jié)直腸息癌的診斷研究,以提高診斷成功率。本文提出利用深度森林方法對拍攝的CT圖像中是否含有結(jié)直腸息肉進行分類,并采用了7種方法進行建模比較研究,經(jīng)實驗研究發(fā)現(xiàn)使用深度森林方法在結(jié)直腸息肉CT圖像數(shù)據(jù)集中具有較好的分類效果。

        1 深度森林模型原理

        深度森林是以決策樹為基礎(chǔ)構(gòu)建的深層模型,是一個基于樹的新的集成學習方法,與深度神經(jīng)網(wǎng)絡(luò)不同,深度森林整體包括多粒度掃描(multi-grained scanning,MGS)和級聯(lián)森林(cascade forest,CF)兩個階段。在多粒度掃描階段進行醫(yī)學影像的特征學習,提取其樣本特征之后,再送入級聯(lián)森林進行分類預(yù)測。

        1.1 隨機森林

        隨機森林(Random Forests,RF)[10]是一種基于集成學習的算法,是一個包含多棵相互獨立決策樹的分類器,將多棵決策樹集成起來,其輸出的類別是由個別樹輸出的類別的眾數(shù)而決定。

        隨機森林預(yù)測模型最終輸出結(jié)果通過投票方式獲得:

        (1)

        其中:F(X)為組合預(yù)測模型;fi為單棵決策樹預(yù)測模型;R為預(yù)測結(jié)果;I(·)為示性函數(shù);n為RF中決策樹的數(shù)量。

        RF算法步驟:

        1)假設(shè)原始訓練集為D,利用自助采樣方法有放回地抽取k個樣本集,循環(huán)k次,生成k個樣本集D*={D1,D2,...,Dk}。

        2)設(shè)每個樣本有M個原始變量,則在M中隨機抽取mtry個變量(mtry≤M),當每個決策樹的節(jié)點進行分裂時,需要在mtry中選擇分類能力最優(yōu)的變量作為該節(jié)點的分裂屬性,重復(fù)該步驟,生成k棵決策樹;

        3)由上述步驟生成的k棵決策樹組成隨機森林,隨機森林的分類結(jié)果由公式(1)得出。

        隨機森林分類模型的實現(xiàn)過程如圖1所示。

        圖1 隨機森林算法流程

        1.2 多粒度掃描模塊

        多粒度掃描模塊是在深度森林模型中引入了類似卷積神經(jīng)網(wǎng)絡(luò)的多個滑動窗口。MGS通過使用不同大小的滑動窗口掃描原始輸入圖像,進行特征提取,生成多個維度的特征實例。將每個特征實例送入一個隨機森林和一個完全隨機森林進行訓練提取類概率向量,最后通過拼接各森林的類概率向量得到轉(zhuǎn)換特征向量。多粒度掃描模塊的實現(xiàn)過程如圖2所示。

        圖2 多粒度掃描模塊實現(xiàn)過程

        1.3 級聯(lián)森林模塊

        級聯(lián)森林為一個擁有自主生長結(jié)構(gòu)的深度樹集成方法,每個級聯(lián)層包含兩個隨機森林和兩個完全隨機森林,通過多個森林多層級聯(lián)得出分類預(yù)測結(jié)果。相比神經(jīng)網(wǎng)絡(luò),級聯(lián)森林具有訓練過程效率高、可擴展性強且對超參數(shù)不敏感等特性。

        級聯(lián)森林的輸入特征向量是由多粒度掃描模塊產(chǎn)生的樣本轉(zhuǎn)換特征向量,級聯(lián)層學習訓練過程中輸出的類概率向量結(jié)果與原始特征向量拼接作為下一層的輸入,每次擴展新的級聯(lián)層后,模型會評估當前級聯(lián)森林在驗證集上的性能,若無顯著性能增益,訓練過程將終止,有效減少模型的復(fù)雜度。在最后一層將級聯(lián)森林產(chǎn)生的所有類向量計平均值作為預(yù)測類別概率結(jié)果,其中最大值對應(yīng)的類別作為深度森林模型的分類結(jié)果。

        為了避免級聯(lián)森林在訓練過程中產(chǎn)生過擬合的現(xiàn)象,對每個森林的訓練都采用k折交叉驗證后產(chǎn)生的類向量。將數(shù)據(jù)分割成k份,其中一份作為驗證數(shù)據(jù),其他k-1份用于訓練,交叉驗證重復(fù)k次。每個實例將產(chǎn)生k-1個類向量,對其取平均值后得到下一個級聯(lián)層的輸入類向量。級聯(lián)森林模塊的實現(xiàn)過程如圖3所示。

        圖3 級聯(lián)森林模塊實現(xiàn)過程

        2 數(shù)據(jù)預(yù)處理

        實驗所使用的圖像數(shù)據(jù)均來自百度AI Studio公開的數(shù)據(jù)集,該數(shù)據(jù)集包含了1 500張結(jié)直腸CT圖像,其中857張存在息肉,數(shù)據(jù)按照8∶2的比例劃分為訓練集與測試集。由于數(shù)據(jù)集結(jié)直腸息肉CT圖像的病灶區(qū)域不同、圖像攝片時受到各種噪聲的干擾所以本文對圖像進行預(yù)處理操作[11]。預(yù)處理包含兩個階段,第一階段對每張圖片采用隨機旋轉(zhuǎn)90°倍數(shù)的方法進行數(shù)據(jù)增強,旋轉(zhuǎn)圖片不會造成CT圖像信息的損失,適合作為本實驗數(shù)據(jù)集擴充的手段,擴充后的數(shù)據(jù)集為2 700張。數(shù)據(jù)集擴充結(jié)果如表1所示。

        表1 數(shù)據(jù)集擴充結(jié)果

        第二階段對CT圖像進行灰度化、歸一化處理并使用中值濾波算法對CT圖像的噪聲進行過濾,提高圖像清晰度,圖像處理前后的對比如圖4所示。

        (a)原始圖像 (b)處理后圖像

        3 實驗結(jié)果及分析

        3.1 評估指標

        CT圖像中結(jié)直腸息肉檢測為二分類問題,有E和N兩個分類,分類模型中評估指標的混淆矩陣(Confusion Matrix)計算如表2所示。

        表2 二分類問題混淆矩陣

        由混淆矩陣計算出的模型評估指標包括分類精度(Accuracy)、召回率(Recall)、精確率(Precision)和F1值,各指標定義如下:

        分類精度(準確率)

        (2)

        召回率(查全率)

        (3)

        精確率(查準率)

        (4)

        F1值(F1Score)

        (5)

        其中:TP(True Positive)為真正例;FP(False Positive)為假正例;TN(True Negative)為真反例;FN(False Negative)為假反例[12];TP+TN+FP+FN=n,n為樣本容量。

        分類精度可以從總體上評價模型的性能,但在醫(yī)學領(lǐng)域并不能滿足模型評估需求。對于本文結(jié)直腸息肉的識別問題,分類精度表明有多少CT圖像被正確識別出是否存在息肉,在醫(yī)學模型評估中,被模型識別出患者中確實存在息肉的患者所占比例也是評價模型性能的重要指標[13],所以本文把F1值(精確率和召回率的調(diào)和均值)作為評估指標之一。

        3.2 深度森林模型調(diào)整

        深度森林中級聯(lián)森林模塊具有良好的自適應(yīng)能力,在訓練過程中可以根據(jù)模型性能自行確定級聯(lián)層數(shù)量[14],需要手動調(diào)整的參數(shù)較少且對參數(shù)的敏感性低。該模塊主要參數(shù)有級聯(lián)層的最大數(shù)量、級聯(lián)層中森林的數(shù)量(隨機森林與完全隨機森林)、單個森林中決策樹的數(shù)量、基本估計量的選擇等。級聯(lián)森林模塊中級聯(lián)層森林數(shù)量與單個森林中決策樹數(shù)量對結(jié)直腸息肉CT圖像的分類精度如圖5所示。

        (a)森林的數(shù)量對分類精度的影響 (b)森林中決策樹數(shù)量對分類精度的影響

        由圖5可以看出在本實驗數(shù)據(jù)集上,模型性能整體相對穩(wěn)定。在單個森林中決策樹的數(shù)量增加到120棵時,模型的分類精度只有98.33%,在決策樹的數(shù)量設(shè)置為20~60時,分類精度達到了99%,且此時模型擁有較少計算量與內(nèi)存需求。增加級聯(lián)層中森林的數(shù)量時,模型的性能也有所改變,當級聯(lián)層中設(shè)置10個森林(5個隨機森林與5個完全隨機森林)時,模型達到了99.33%的分類精度。

        綜合以上實驗結(jié)果以及模型實際運行效率,將級聯(lián)森林模型級聯(lián)層中森林的數(shù)量設(shè)置為10個(5個隨機森林與5個完全隨機森林)、每個森林中決策樹的數(shù)量設(shè)置為60,并添加XGBoost作為模型的基本估計量,同時對級聯(lián)層的最大層數(shù)不作要求。經(jīng)過參數(shù)調(diào)整后的級聯(lián)森林模型在測試集上的分類精度達到了99.67%。

        完整的深度森林模型包含多粒度掃描模塊與級聯(lián)森林模塊兩部分,在級聯(lián)森林模塊調(diào)整為上述參數(shù)后,添加多粒度掃描模塊進行實驗。實驗所使用CT圖片大小為512×512,采用兩種不同的窗口尺度集合與滑動步長進行實驗,每個尺度對應(yīng)1個隨機森林與1個完全隨機森林,森林中決策樹數(shù)量均設(shè)置為20,實驗結(jié)果如表3所示。

        表3 多粒度掃描模塊參數(shù)實驗

        由表3可以看出,加入多粒度掃描模塊后,深度森林模型分類精度最高達到了97.00%,并且隨著滑動窗口與滑動步長的減小,模型分類精度降低。取該實驗分類精度最高的模型與不使用多粒度掃描模塊的深度森林模型進行性能對比,結(jié)果如圖6所示。

        圖6 深度森林模塊選擇實驗結(jié)果

        由圖6可以看出,在本文數(shù)據(jù)集上,使用多粒度掃描模塊的模型相比只使用級聯(lián)森林的模型在測試集上A值與F1值分別下降了2.7%與2.4%。產(chǎn)生這種情況可能是因為多粒度掃描模塊會產(chǎn)生多個只包含噪聲的訓練樣本,對于結(jié)直腸息肉CT圖像來說,有意義的圖像僅在于息肉存在的部分,其他無意義的圖像部分作為訓練樣本反而會造成模型泛化性能的下降,所以本文只使用深度森林模型中的級聯(lián)森林模塊。

        3.3 不同分類模型比較

        本文使用深度森林算法對結(jié)直腸息肉CT圖像進行分類,為了比較模型的性能,采用K-最近鄰(KNN)、隨機森林(RF)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、支持向量機(SVM)、BP神經(jīng)網(wǎng)絡(luò)(BP)、樸素貝葉斯模型(NBM)與決策樹(CART)7種算法進行實驗比較,實驗均使用處理后的數(shù)據(jù)集。

        其中KNN、SVM與CART均采用基于十折交叉驗證的網(wǎng)格搜索方法選擇最優(yōu)建模參數(shù);對NBM中多項式模型、高斯模型與伯努利模型3種常見模型采用十折交叉驗證方式分別進行性能評估后,選擇多項式模型進行實驗;對于CNN中主流模型,本文使用VGG16進行實驗,其具有很好的CNN特征提取能力[15]。由于數(shù)據(jù)集規(guī)模大小對VGG16網(wǎng)絡(luò)訓練結(jié)果有較大影響,所以在圖像預(yù)處理第1階段的基礎(chǔ)上,采用翻轉(zhuǎn)、旋轉(zhuǎn)的手段進一步擴大數(shù)據(jù)集,且第2階段不進行灰度化處理。處理后數(shù)據(jù)集容量達到7 500張,將訓練集中五分之一的數(shù)據(jù)作為驗證集,總共進行了100次訓練。

        表4 不同實驗方法比較結(jié)果

        從表4可以看出,深度森林模型在分類精度、召回率、精確率、F1值均高于或等于其他7種分類算法。從分類精度上看,深度森林達到99.67%,其次為支持向量機與K-最近鄰模型達到了99.33%的精度;從召回率上看,深度森林、BP神經(jīng)網(wǎng)絡(luò)、支持向量機、與K-最近鄰模型均達到了100%,說明所有存在息肉的CT圖像均被識別出來。從精確率上看,深度森林識別出存在息肉的圖片中識別正確的圖片占比達到99.40%,最低的為樸素貝葉斯模型,僅僅只有74.03%。

        4 結(jié) 語

        基于深度森林算法對結(jié)腸息肉CT圖像進行識別分類,并與7種分類算法使用多項評估指標對比,結(jié)果表明該方法可提升結(jié)直腸息肉檢測分類的效果。此外,深度森林在模型魯棒性、可解釋性、訓練難易程度上具有優(yōu)勢,這使得本文提出的結(jié)直腸息肉CT圖像檢測方法在醫(yī)學影像領(lǐng)域具有良好的通用性。本文只對結(jié)直腸息肉CT圖像進行了分類檢測,如何對息肉存在位置進行標注并對檢測體系做進一步的優(yōu)化,提供更加全面精準的檢測報告,輔助醫(yī)生根據(jù)CT影像篩查存在疾病的患者并為臨床醫(yī)生提供理論指導(dǎo),將是下一步的研究重點。

        猜你喜歡
        級聯(lián)決策樹息肉
        息肉雖小,防病要早
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        你真的了解子宮內(nèi)膜息肉嗎
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        級聯(lián)LDPC碼的STBC-OFDM系統(tǒng)
        電子制作(2016年15期)2017-01-15 13:39:09
        基于決策樹的出租車乘客出行目的識別
        基于級聯(lián)MUSIC的面陣中的二維DOA估計算法
        ER、PR、Ki-67在絕經(jīng)后子宮內(nèi)膜息肉中的表達
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        息肉樣黑素瘤一例
        欧美在线成人午夜网站| 精品国际久久久久999波多野| 插b内射18免费视频| 国产精品video| 国产亚洲av手机在线观看| 91成人黄色蘑菇视频| 成人午夜特黄aaaaa片男男| 精品日韩亚洲av无码| 久久夜色精品国产噜噜av| 日韩秘 无码一区二区三区| 国产亚洲精品视频在线| 日本一区二区三区视频网站 | 在线观看精品国产福利片100| 色婷婷久色国产成人免费| 亚洲性色av一区二区三区| 欧美老熟妇欲乱高清视频| 亚洲欲色欲香天天综合网| 中文字幕乱码亚洲无线| 亚洲国产中文字幕精品| 又粗又黄又猛又爽大片免费| 亚洲AV永久无码制服河南实里| 国产亚洲一区二区三区成人 | 亚洲av第一区综合激情久久久| 日本一区二区在线高清观看| 97高清国语自产拍| 一级一级毛片无码免费视频 | 老熟妇仑乱视频一区二区| 国产精品18久久久久网站| 国产精品一品二区三区| 免费乱理伦片在线观看| 抽插丰满内射高潮视频| 国产三级在线看完整版| 日韩av一区二区网址| 天堂…在线最新版资源| 国产精品美女黄色av| 日本免费视频一区二区三区| 日韩av无码精品一二三区| 国产在线观看入口| 日韩av综合色区人妻| 精品人妻大屁股白浆无码| 四虎国产精品永久在线无码|