亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于影像組學和機器學習的腦部膠質(zhì)瘤分級模型研究

        2022-03-09 01:22:50王俊秀
        軟件工程 2022年2期
        關(guān)鍵詞:隨機森林機器學習

        文章編號:2096-1472(2022)-02-22-03

        DOI:10.19644/j.cnki.issn2096-1472.2022.002.006

        摘? 要:本文將影像組學的方法和機器學習算法結(jié)合起來,對腦部膠質(zhì)瘤進行分級預(yù)測。利用BraTS2019公開數(shù)據(jù)集,從多模態(tài)MRI圖像中分別提取腫瘤的448 維影像組學特征:腫瘤形態(tài)學特征、一階灰度特征、紋理特征等;然后通過最小絕對收縮和選擇算子(Lasso)算法篩選出15 個最佳的影像組學特征;最后根據(jù)篩選出的最佳特征集,利用隨機森林分類算法構(gòu)建腦部膠質(zhì)瘤的分級預(yù)測模型?;跈C器學習建立的模型在訓練組患者中預(yù)測膠質(zhì)瘤級別的準確率達到95.6%,ROC曲線下面積(AUC)達到0.99;在驗證組患者中預(yù)測膠質(zhì)瘤級別的準確率達到89.3%,AUC達到0.96。可見,基于機器學習算法,利用影像組學的方法可以對腦部腫瘤的高低級別進行準確的預(yù)測和分類。

        關(guān)鍵詞:腫瘤分級;影像組學;機器學習;隨機森林

        中圖分類號:TP39? ? ?文獻標識碼:A

        Research on Grading Model for Brain Glioma based on?Radiomics and Machine Learning

        WANG Junxiu

        (Taiyuan Institute of Technology, Taiyuan 030008, China)

        wangjx@tit.edu.cn

        Abstract: This paper proposes to combine radiomics and machine learning algorithm to classify and predict the brain glioma. Based on BraTS2019 public dataset, 448-dimensional radiomics features of tumors are extracted from multimodal MRI (Magnetic Resonance Imaging) images, including tumor morphological features, first-order grayscale features, and texture features, etc. Then 15 best radiomics features are screened through the least absolute shrinkage and selection operator (Lasso) algorithm. Finally, according to the best screened feature set, the random forest classification algorithm is used to construct the brain glioma grading prediction Model. The accuracy of machine learning-based model is 95.6% and the area under the ROC (AUC) is 0.99 in the training group, and 89.3% and 0.96 in the validation group, respectively. Application of machine learning algorithm and radiomics realizes accurate prediction and classification of brain glioma level.

        Keywords: brain glioma grading; radiomics; machine learning; random forest

        1? ?引言(Introduction)

        腦膠質(zhì)瘤是大腦內(nèi)部最常見的惡性腫瘤,按照世界衛(wèi)生組織的認定標準,根據(jù)膠質(zhì)瘤的嚴重和惡性程度可劃分為低級別膠質(zhì)瘤(Low Grade Glioma, LGG)和高級別膠質(zhì)瘤(High Grade Glioma, HGG)。低級別膠質(zhì)瘤為分化良好的膠質(zhì)瘤,預(yù)后效果比較好。高級別膠質(zhì)瘤為低分化膠質(zhì)瘤,這類腫瘤為惡性腫瘤,患者預(yù)后效果不佳。膠質(zhì)瘤的準確分級對患者的診斷、治療方案的設(shè)計及預(yù)后非常重要。影像組學研究是一個計算機和醫(yī)學交叉研究的技術(shù)信息領(lǐng)域,它是指從各種類型的醫(yī)學圖像如CT、MRI、PET中提取高通量的數(shù)據(jù)信息,然后進一步地挖掘、分析和預(yù)測,最終可以幫助醫(yī)生做出最準確的診斷與治療。影像組學包括獲取圖像、腫瘤區(qū)域分割、影像組學特征提取和分類預(yù)測模型構(gòu)建等步驟。利用機器學習方法實現(xiàn)的影像組學已經(jīng)很大程度上提高了醫(yī)學診斷鑒別及預(yù)后預(yù)測的準確性。

        本文主要采用影像組學的方法和機器學習算法來解決腦部膠質(zhì)瘤分級預(yù)測的問題。本研究使用了BraTS2019數(shù)據(jù)集中膠質(zhì)瘤患者的術(shù)前MRI影像,采用影像組學方法提取影像學特征;然后采用最小絕對收縮和選擇算子(Least absolute shrinkage and selection operator, Lasso)對高維特征進行降維,篩選出最佳的影像學特征集;最后根據(jù)所選出的最佳特征集,通過隨機森林(Random Forest, RF)算法建立膠質(zhì)瘤高低級別分類模型。用受試者工作特征曲線(Receiver Operating Characteristic Curve, ROC曲線)來評價分類器模型的預(yù)測效果。

        2? ?數(shù)據(jù)(Data)

        磁共振成像(Magnetic Resonance Imaging, MRI)是大腦疾病診斷和治療過程中的常規(guī)檢查方法,在軟組織檢查中具有敏感性和卓越的圖像對比度。常見的頭部MRI影像均包含T1加權(quán)成像、增強T1加權(quán)成像(T1ce)和T2加權(quán)成像,以及液體衰減反轉(zhuǎn)恢復(fù)(Flair)成像等序列。每個成像序列從不同的方面對腫瘤病灶進行描述,為腦膠質(zhì)瘤診斷研究提供多個互補信息。

        本文使用了BraTS2019數(shù)據(jù)集MRI影像進行研究,該數(shù)據(jù)集是2019 年腦部腫瘤分割競賽數(shù)據(jù)集(Brain Tumor Segmentation Challenge 2019, BraTS2019),包括76 例低級別膠質(zhì)瘤MRI影像和259 例高級別膠質(zhì)瘤MRI影像。數(shù)據(jù)集中包含T1加權(quán)像、增強T1加權(quán)像、T2加權(quán)像和液體衰減反轉(zhuǎn)恢復(fù)序列像四個模態(tài)的MRI影像,另外每例病人還包括醫(yī)學專家手工標記的腫瘤區(qū)域和腫瘤分級的情況。所有的影像數(shù)據(jù)都進行了圖像預(yù)處理,包括配準、圖像插值和重采樣等。圖1為BraTS2019數(shù)據(jù)集中一例患者的腦部MRI影像。

        數(shù)據(jù)集中每例患者的腫瘤區(qū)域都是由多個經(jīng)驗豐富的醫(yī)生按照相同的標注規(guī)范進行分割和驗證的。腫瘤區(qū)域按照病理一般分為四個區(qū)域:(1)增強腫瘤核心區(qū)(Enhanced Core);(2)腫瘤周圍水腫區(qū)(Edema);(3)非增強腫瘤核心區(qū)(Non-enhancing Solid Core);(4)壞死區(qū)/囊性核心區(qū)(Necrotic/Cystic Core)。其中(3)和(4)為真實的膠質(zhì)瘤組織,合并為一個區(qū)域,簡稱為NET區(qū)域;增強的腫瘤核心區(qū)域簡稱為ET區(qū)域;腫瘤周圍水腫區(qū)域簡稱為ED區(qū)域。圖2為一例患者病灶區(qū)域分割的圖像,其中淺灰色ED區(qū)域,深灰色為NET區(qū)域,白色為ET區(qū)域。

        3? ?方法(Methods)

        3.1? ?特征提取

        本文根據(jù)近幾年研究人員提出的對腦部膠質(zhì)瘤圖像提取的特征,從四種模態(tài)圖像(T1、T2、T1ce和Flair)的不同病灶區(qū)域中分別提取了腫瘤形態(tài)學特征、一階特征及紋理特征,共計448 個影像組學特征,每種類型的特征從不同的方面對圖像進行描述,解析了圖像的隱含特點。(1)腫瘤形態(tài)學特征:提取腫瘤原始空間的三維特征,可以量化腫瘤的形狀和大小。(2)一階灰度特征:由感興趣區(qū)域影像特征值直方圖計算而來,可以定量地描述圖像的信號強度分布。(3)紋理特征:可以對腦膠質(zhì)瘤內(nèi)異質(zhì)性進行定量刻畫。紋理特征包括:灰度共生矩陣紋理特征(GLCM)、灰度相關(guān)矩陣紋理特征(GLDM)、灰度游程矩陣紋理特征(GLRLM)、灰度區(qū)域大小矩陣紋理特征(GLSZM)、鄰域灰度差矩陣紋理特征(NGTDM)。

        3.2? ?特征選擇

        本文主要通過采用L1正則化Lasso回歸分析模型來進行最佳特征篩選。Lasso是一種用于變量壓縮和估計的方法,它可以有效地將高維變量降到十幾維甚至更少,同時不影響模型的預(yù)測能力。目前Lasso算法已經(jīng)被廣泛應(yīng)用在高維數(shù)據(jù)的降維和回歸分析中,特別是影像組學的特征工程領(lǐng)域。本文采用Lasso回歸模型選擇出和膠質(zhì)瘤高低級別最相關(guān)的影像組學特征。簡單線性回歸模型的定義如下:

        為了去掉冗余的特征,本文采用正則方法進行特征壓縮。當特征維度是2時,我們可以直接在平面上繪制出目標函數(shù)的等高線,而取值范圍是平面上半徑為的范數(shù)圓,等高線與范數(shù)圓的交點就是最優(yōu)解。而更高維的情況下,等高線與范數(shù)球的交點除了角點之外還可能在很多邊的輪廓線上,同樣具有稀疏性。

        3.3? ?分級預(yù)測模型的構(gòu)建

        基于篩選出的影像組學特征和隨機森林構(gòu)建模型。隨機森林算法是一種通過采用Bagging的算法將多個無關(guān)聯(lián)的決策樹組合在一起,以投票機制進行分類的有監(jiān)督學習算法。隨機森林算法的泛化能力強,分類性能比較好,廣泛應(yīng)用于各種分類任務(wù)中。

        決策樹是一種樹形結(jié)構(gòu)的分類器。在構(gòu)建決策樹時,樹中的每個節(jié)點都要選擇最優(yōu)的特征對當前樣本進行分類,直到?jīng)Q策樹能夠滿足所需要的建樹停止的條件。當把一個樣本輸入決策樹中時,可以自動確定一條從根節(jié)點開始到葉節(jié)點的唯一路徑,最后葉節(jié)點也就是這個樣本的類別。隨機森林中構(gòu)建的每一棵決策樹都可以是一個分類器,當把一個樣本輸入隨機森林中時,M 棵決策樹會得到M 個分類結(jié)果,根據(jù)所有決策樹的分類結(jié)果,把次數(shù)最高的類別作為最終分類結(jié)果。本文中隨機森林算法按照腦部膠質(zhì)瘤高低級別的分布情況進行隨機抽樣。模型訓練的過程中可采用并行方法,這樣使得模型訓練速度快。

        決策樹的深度直接影響隨機森林分類器模型的性能,如果決策樹的深度過大會導致分類模型過擬合,而決策樹的深度過小又會導致分類模型欠擬合。決策樹的數(shù)量也會影響隨機森林的分類準確率。在實現(xiàn)過程中,采用TPOT(Tree-based Pipeline Optimization Tool)框架實現(xiàn)隨機森林的自動機器學習,以確定最優(yōu)的決策樹個數(shù)和決策樹深度。TPOT框架是由美國賓夕法尼亞大學自主研究和設(shè)計開發(fā)的一個自動機器學習的技術(shù)框架。它是一種基于遺傳算法的Python自動機器學習工具。TPOT能夠進行自動算法選擇、自動參數(shù)優(yōu)化,為當前數(shù)據(jù)集找到最優(yōu)的算法及其參數(shù)。

        4? ?結(jié)果(Results)

        將BraTS2019數(shù)據(jù)集的335 例膠質(zhì)瘤患者隨機分為訓練集(75%)和驗證集(25%)。每個MRI模態(tài)提取112 個特征,包括19 個腫瘤形態(tài)學特征、18 個一階灰度特征及75 個紋理特征,四個模態(tài)共提取448 個影像組學特征。448 個影像組學特征的Lasso系數(shù)分布如圖3所示。

        使用Lasso回歸模型對448 個影像組學特征進行壓縮,通過交叉驗證和二項式偏差最小化確定Lasso回歸模型中懲罰系數(shù)λ的最優(yōu)值,如圖4所示。同時篩選出系數(shù)非零的最佳特征變量,如表1所示,共篩選出15 個最佳影像組學特征。

        本文采用TPOT框架實現(xiàn)隨機森林分類模型的自動機器學習,從而確定最優(yōu)的隨機森林分類器參數(shù):決策樹的最大深度(max_depth)為9,基學習器的個數(shù)(n_estimators)為100?;?5 個最優(yōu)的影像組學特征,通過TPOT構(gòu)建的隨機森林分類器來預(yù)測膠質(zhì)瘤高低級別,在訓練組患者中預(yù)測膠質(zhì)瘤級別的準確率達到95.6%,在驗證組患者中預(yù)測膠質(zhì)瘤級別的準確率達到89.3%。繪制ROC曲線來評價分級模型,訓練組的曲線下面積AUC為0.99,驗證組的AUC為0.96。ROC曲線如圖5所示。

        5? ?結(jié)論(Conclusion)

        本文采用影像組學的方法和機器學習算法對腦部膠質(zhì)瘤進行高低級別分級預(yù)測。從MRI影像的四個模態(tài)上提取了一系列膠質(zhì)瘤的影像組學特征,使用Lasso回歸模型進行篩選,得到和膠質(zhì)瘤級別密切相關(guān)的最佳影像組學特征集,并基于所選的特征建立了隨機森林分類器的預(yù)測模型。我們發(fā)現(xiàn),該模型在訓練組和驗證組中均實現(xiàn)了膠質(zhì)瘤高低級別的有效預(yù)測。

        參考文獻(References)

        [1] MORGAN L L. The epidemiology of glioma in adults: a "state of the science" review[J]. Neuro-Oncology, 2015, 17(4):623-624.

        [2] LOUIS D N, PERRY A, REIFENBERGER G, et al. The 2016 world health organization classification of tumors of the central nervous system: A summary[J]. Acta Neuropathologica, 2016, 131(6):803-820.

        [3] JANG K, RUSSO C, IEVA A D. Radiomics in gliomas: Clinical implications of computational modeling and fractal-based analysis[J]. Neuroradiology, 2020, 62(7):771-790.

        [4] LAMBIN P, RIOS-VELAZQUEZ E, LEIJENAAR R, et al. Radiomics: Extracting more information from medical images using advanced feature analysis[J]. European Journal of Cancer, 2012, 48(4):441-446.

        [5] YIP S S, AERTS H J. Applications and limitations of radiomics[J]. Physics in Medicine and Biology, 2016, 61(13):150-166.

        [6] FOUKE S J, BENZINGER T, GIBSON D, et al. The role of imaging in the management of adults with diffuse low grade glioma: A systematic review and evidence-based clinical practice guideline[J]. Journal of Neuro Oncology, 2015, 125(3):457-479.

        [7] 賈穎,杜學松,陳君輝,等.基于常規(guī)MRI的定量影像學特征用于膠質(zhì)瘤分級診斷[J].中國醫(yī)學影像技術(shù),2018,034(008):1137-1142.

        [8] MENZE B H, JAKAB A, BAUER S, et al. The multimodal brain tumor image segmentation benchmark (BRATS)[J]. IEEE Transactions on Medical Imaging, 2015, 34(10):1993-2024.

        [9] HARALICK R M, SHANMUGAM K, DINSTEIN I. Textural features for image classification[J]. Studies in Media and Communication, 1973, 3(6):610-621.

        [10] SUN C, WEE W G. Neighboring gray level dependence matrix for texture classification[J]. Computer Vision Graphics and Image Processing, 1983, 23(3):341-352.

        [11] GALLOWAY M. Texture analysis using gray level run lengths[J]. Computer Graphics and Image Processing, 1975, 4(2):172-179.

        [12] THIBAULT G, ANGULO J, MEYER F. Advanced statistical matrices for texture characterization: Application to cell classification[J]. IEEE Transactions on Biomedical Engineering, 2014, 61(3):630-637.

        [13] AMADASUN M, KING R. Textural features corresponding to textural properties[J]. IEEE Transactions Systems, Man, and Cybernetics, 1989, 19(5):1264-1274.

        [14] TIBSHIRANI R. Regression shrinkage and selection via the lasso: A retrospective[J]. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 2011, 73(3):267-288.

        [15] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1):5-32.

        [16] 王奕森,夏樹濤.集成學習之隨機森林算法綜述[J].信息通信技術(shù),2018(1):51-57.

        [17] OLSON R S, MOORE J H. TPOT: A tree-based pipeline optimization tool for automating machine learning[C]// HUTTER F, KOTTHOFF L, VANSCHOREN J. Automatic Machine Learning. Cham: Springer, 2016, 64:66-74.

        作者簡介:

        王俊秀(1987-),女,博士生,講師.研究領(lǐng)域:圖像處理,人工智能,醫(yī)學圖像.

        2789500520331

        猜你喜歡
        隨機森林機器學習
        隨機森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
        基于二次隨機森林的不平衡數(shù)據(jù)分類算法
        軟件(2016年7期)2017-02-07 15:54:01
        拱壩變形監(jiān)測預(yù)報的隨機森林模型及應(yīng)用
        基于詞典與機器學習的中文微博情感分析
        基于機器學習的圖像特征提取技術(shù)在圖像版權(quán)保護中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        科教導刊(2016年26期)2016-11-15 20:19:33
        基于隨機森林算法的飛機發(fā)動機故障診斷方法的研究
        基于支持向量機的金融數(shù)據(jù)分析研究
        機器學習理論在高中自主學習中的應(yīng)用
        久久久午夜毛片免费| 人人妻一区二区三区| 日本女优中文字幕在线播放| 色综合久久久久综合体桃花网| 亚洲av综合日韩| 亚洲中文字幕无码二区在线| 日韩亚洲午夜精品一区二区三区| 成人av在线久色播放| 国产精品久久久久aaaa| 国产欧美VA欧美VA香蕉在| 99久久精品国产亚洲av天| 国产主播性色av福利精品一区| 97色偷偷色噜噜狠狠爱网站| 乱人伦中文字幕成人网站在线| 国产精品久久久久久久y| 精品亚洲一区二区三洲| 欧美性猛交xxxx免费看蜜桃| 国产成人精品成人a在线观看| 最新在线观看精品国产福利片| 男男做h嗯啊高潮涩涩| 真实国产乱子伦精品视频| 亚洲日韩∨a无码中文字幕| AV熟妇导航网| 高潮精品熟妇一区二区三区| 影音先锋色小姐| 日韩视频第二页| 欧美精品aaa久久久影院| 亚洲免费福利视频网站| 日本成本人片视频免费| 人妻熟妇乱又伦精品视频app| 亚洲欧美成人久久综合中文网| 在线播放国产自拍av| 亚洲av日韩精品久久久久久久 | 18分钟处破好疼哭视频在线观看| 97精品国产91久久久久久久| 在线观看国产激情免费视频| 真实国产乱子伦精品视频| 99久久久无码国产精品9| 丰满少妇一区二区三区专区| 亚洲啪啪视频一区二区| 国产无遮挡又黄又爽在线视频|