亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學(xué)習(xí)的白細胞六分類研究

        2020-12-23 05:47:19孫凱姚旭峰黃鋼
        軟件 2020年10期
        關(guān)鍵詞:機器學(xué)習(xí)圖像處理白細胞

        孫凱 姚旭峰 黃鋼

        摘? 要: 鑒于現(xiàn)有機器學(xué)習(xí)白細胞分類方法難以驗證網(wǎng)絡(luò)泛化性與魯棒性,本研究提出了一種聯(lián)合多類型特征的白細胞分類方法。首先使用圖像剪裁與中心化及改進型顏色閾值分割完成11865張六種類別白細胞圖像的預(yù)處理與分割操作。隨后在特征提取部分篩選出細胞幾何、紋理、小波三部分共63個特征;通過主成分分析法實現(xiàn)了降維后得到8個主成分。最后使用支持向量機、多層感知機與決策樹分別進行分類工作,結(jié)果為高質(zhì)量圖像最高88.6%;噪聲圖像最高84.5%;低分辨率圖像最高87.6%的分類精度。實驗結(jié)果驗證了所提出方法的魯棒性和泛化性好,可實現(xiàn)白細胞的準(zhǔn)確分類。

        關(guān)鍵詞: 機器學(xué)習(xí);圖像處理;分類;白細胞

        中圖分類號: TP391.41? ? 文獻標(biāo)識碼: A? ? DOI:10.3969/j.issn.1003-6970.2020.10.024

        本文著錄格式:孫凱,姚旭峰,黃鋼. 基于機器學(xué)習(xí)的白細胞六分類研究[J]. 軟件,2020,41(10):98101+134

        【Abstract】: In view of the difficulty in verifying the generalization and robustness of existing machine learning leukocyte classification methods, this study proposes a white blood cell classification method that combines multiple types of features. First, use image cropping and centralization and improved color threshold segmentation to complete the preprocessing and segmentation of 11,865 six subtypes of white blood cell images. In the feature extraction part, 63 features including cell geometry, texture and wavelet were screened out; 8 principal components were obtained after dimensionality reduction was achieved by principal component analysis. Finally, support vector machines, multi-layer perception and decision trees were used for classification. The results were high-quality images up to 88.6%; noise images up to 84.5%; low-resolution images up to 87.6%. The experimental results verify that the proposed method has good robustness and generalization, and can achieve accurate classification of white blood cells.

        【Key words】: Machine learning; Image processing; Classification; White blood cells

        0? 引言

        血液白細胞通常可以劃分為五種類型,分別為嗜堿性粒細胞(Basophils,bas)、嗜中性粒細胞(Neutrophilic,neu)、單核細胞(Monocytes,mon)、淋巴細胞(Lymphocytes,lym)以及嗜酸性粒細胞(Eosinophils,eos),嗜中性粒細胞可分為嗜中性桿狀核粒細胞(Band Neutrophil,ban)以及嗜中性分葉核粒細胞(Segmented Neutrophil,seg)[1]。白細胞根據(jù)形態(tài)差異又可以分為顆粒和無顆粒兩類細胞,其中嗜酸性粒細胞、嗜堿性粒細胞及中性粒細胞屬于顆粒細胞,單核細胞及淋巴細胞屬于無顆粒細胞[2]。白細胞濃度異??赡艽砟承┭杭膊〉陌l(fā)病跡象[3]。因此,實現(xiàn)白細胞的精確分類有助于幫助醫(yī)生篩查白細胞相關(guān)病癥,在臨床應(yīng)用中具有重要研究意義[4-5]。

        白細胞分類方法包括人工鏡檢、流式細胞儀與圖像處理方法三種[1]。在圖像處理方法中,機器學(xué)習(xí)方法因其可靠性與魯棒性成為白細胞分類熱門研究領(lǐng)域。Ravikumar[6]在相關(guān)向量機(Relevance Vector Machine,RVM)基礎(chǔ)上使用改進型的fast-RVM分類器,不僅分類精度較RVM有所提高,同時分類速度大大超過RVM分類器。Roy等[7]首次證明細胞的形態(tài)學(xué)特征對分類結(jié)果有重要影響,Agaian等[8]結(jié)合形態(tài)學(xué)特征提出Cell Energy特征,在ALL-IDB數(shù)據(jù)集上對急性白血?。ˋcute Leukaemia)的分類精確度超過94%;Duan等[9]結(jié)合紋理、空間與光譜特征,利用支持向量機(Support Vector Machine,SVM)對五類高光譜白細胞圖像實現(xiàn)了98.3%的分類精度。可見,使用新型特征或改進型分類器可實現(xiàn)白細胞高精度分類。

        然而,目前白細胞分類研究依舊存在以下三大問題:第一以往研究大多只進行白細胞5分類研究,沒有對白細胞實現(xiàn)更多分類;第二,以往研究大多只針對一種白細胞數(shù)據(jù)集,對網(wǎng)絡(luò)泛化性與魯棒性驗證效果欠佳。為解決上述問題,本研究采用六分類白細胞數(shù)據(jù)集,并提取出紋理、小波與形態(tài)特征,使用支持向量機、多層感知機(Multilayer Perceptron,MLP)與決策樹(Decision Tree,DT)三種分類器分類。在此基礎(chǔ)上,使用高質(zhì)量、噪聲與低分辨率數(shù)據(jù)集,驗證本研究方法的泛化性與魯棒性好。

        1? 方法

        1.1? 實驗數(shù)據(jù)

        本研究與北昂生物科技公司合作,采集到六類共11865張白細胞圖像,分別為2000張嗜中性桿狀核粒細胞、2126張嗜中性分葉核粒細胞、1854張嗜酸性粒細胞、2000張淋巴細胞、2144張單核細胞以及1741張嗜堿性粒細胞圖像,大小均為224×224像素,每張圖像只含有一個白細胞,全部白細胞圖像由富有經(jīng)驗的醫(yī)生標(biāo)注完畢。圖1展示了原始數(shù)據(jù)庫六種類別的白細胞圖像。

        為了驗證對低質(zhì)量細胞圖像的分類精度,本研究在原始數(shù)據(jù)庫基礎(chǔ)上加入噪聲與降低分辨率圖像兩類低質(zhì)量圖像驗證網(wǎng)絡(luò)魯棒性,低質(zhì)量圖像在已分割圖像基礎(chǔ)上制作而成。如圖2(a)所示為原始已分割圖像;圖2(b)所示為加入了均值為0,標(biāo)準(zhǔn)差為0.02的高斯噪聲之后的噪聲圖像;圖2(c)所示為112×112的低分辨率圖像。

        1.2? 細胞圖像預(yù)處理與分割

        本研究預(yù)處理方法包含細胞圖像裁剪、圖像插值處理兩部分。原始圖像含有大量紅細胞及背景區(qū)域,無法直接用于機器學(xué)習(xí)訓(xùn)練,因此需要對圖片進行裁剪,并統(tǒng)一使用對圖像質(zhì)量損失較小的雙三次差值將細胞圖像轉(zhuǎn)成網(wǎng)絡(luò)訓(xùn)練所需要的224×224像素[10]。

        細胞圖像分割對機器學(xué)習(xí)的特征提取步驟有極大影響[11]。本研究采用改進型顏色閾值自動分割方法,此方法結(jié)合顏色閾值與區(qū)域生長法原理,可對細胞圖像實現(xiàn)高通量快速細胞分割。在分割前,首先對輸入圖像勾畫感興趣區(qū)域,避免冗余信息影響,對待分割白細胞進行更為精確地閾值提取。隨后,采用與區(qū)域生長法相似的原理,先確定初始區(qū)域生長點,然后與初始區(qū)域生長點相似的鄰域像素點被加入到生長區(qū)域中,直至鄰域沒有符合生長規(guī)則的像素點。完成區(qū)域生長后,將區(qū)域內(nèi)彩色閾值輸出,以備后續(xù)處理。

        本課題白細胞圖像均使用蘇木精—伊紅染色法(Hematoxylin-eosin Staining,HS),這使得白細胞核內(nèi)的染色質(zhì)與細胞質(zhì)內(nèi)的核酸為紫藍色,與紅細胞的紅色及背景的白色區(qū)別較大,因此使用顏色閾值作為主要分割手段,通過設(shè)置合適的閾值區(qū)間分離白細胞與圖像中其他區(qū)域。

        本方法會選取同一類別部分細胞圖像,根據(jù)此類細胞的閾值特點選擇合適閾值區(qū)間。對于本研究細胞數(shù)據(jù)集,紫藍色的色彩數(shù)值更低,因此在閾值選擇時會調(diào)低閾值下限,同時抑制閾值上限,這樣避免分割到紅細胞區(qū)域。在完成閾值設(shè)置后,批量導(dǎo)入圖片實現(xiàn)閾值分割與輸出,對于不同類別的細胞采用不同的閾值設(shè)置,使分割效果更好。圖3為本課題所使用的改進型顏色閾值分割效果。

        1.3? 白細胞圖像特征提取與篩選

        特征提取能夠顯著影響白細胞分類效果,因此正確選擇適合本課題數(shù)據(jù)集的特征非常重要[12]。前人的研究顯示多類型的特征相比單一類型特征更能提高分類精度[13],因此本課題從幾何特征、紋理特征、小波特征三個方面實現(xiàn)特征的提取。

        1.3.1? 幾何特征

        提取到幾何特征包括基于尺度不變特征變換(Scale-invariant feature transform,SIFT)的細胞角點數(shù)目[14]、面積(Area)及周長(Perimeter)[15],共3個輪廓與區(qū)域特征。

        1.3.2? 紋理特征

        紋理特征以灰度圖像為基礎(chǔ),反映了圖像中物體表面的某些變化情況。提取的紋理特征包括方差(Variance)、逆差矩(Inverse Difference Moment,IDM)、對比度(Contrast)、熵(Entropy)、角二階矩(Angular Second Moment,ASM)、相關(guān)性(Correlation)、差分熵(DifferenceEntropy)、差分方差(DifferenceVariance)、度量信息1(InfoMeas1)、度量信息2(InfoMeas2)、平均和(SumAverage)、平均熵(SumEntropy)、平均方差(SumVariance)分別從0度、45度、90度及135度提取,共計52個特征;均值(Mean)、等價局部二進制模式(Uniform Pattern LBP,UPLBP)[16]共計2個特征;Granularity1- Granularity7共7個細胞粒度特征,合計61個特征。

        1.3.3? 小波特征

        小波特征通過時域頻域變換實現(xiàn)紋理特征的提取。本研究提取出Gabor小波特征。

        1.3.4? 特征篩選與降維

        本研究共提取出65個白細胞特征。為降低計算復(fù)雜度,本研究使用主成分分析(Principal Component Analysis,PCA)進行特征篩選與降維。主成分分析就是將數(shù)據(jù)不同屬性的特征變量轉(zhuǎn)化為較少的綜合變量,這些綜合變量即為主成分。主成分由變化之前的特征變量線性組合而成,可以代表大部分特征變量所含有的屬性信息[17-18]。根據(jù)公因子方差與旋轉(zhuǎn)后成分矩陣發(fā)現(xiàn)Granularity4與Granularity5兩個特征在成分1到成分4的因子載荷系數(shù)絕對值均在0.4以下,信息貢獻少且貢獻分散在不同特征中,特征信息難以被利用,因此將Granularity4與Granularity5特征刪除,保留63個特征。隨后進行主成分分析得到8個主成分。

        1.4? 分類器選擇

        傳統(tǒng)機器學(xué)習(xí)分類器是傳統(tǒng)機器學(xué)習(xí)過程的關(guān)鍵性環(huán)節(jié),其原理是將已知類別的數(shù)據(jù)輸入分類器,通過訓(xùn)練迭代分類器參數(shù),從而達到預(yù)期訓(xùn)練結(jié)果的過程[19]。本課題選用支持向量機、多層感知機以及決策樹三種分類器互為對照,驗證分類結(jié)果。

        1.4.1? 支持向量機

        SVM的基本原理是求解能夠正確劃分數(shù)據(jù)集且具有最大幾何區(qū)間的分割超平面。SVM最初用于二分類,經(jīng)過核函數(shù)的改進,能夠很好地支持多分類任務(wù)的需求。

        1.4.2? 多層感知機

        MLP包括輸入層、隱藏層和輸出層。相鄰層神經(jīng)元為全連接狀態(tài),即相鄰層神經(jīng)元相互連接,同層神經(jīng)元之間不存在同層連接和跨層連接。輸入層負責(zé)輸入數(shù)據(jù),隱含層負責(zé)處理數(shù)據(jù),輸出層最終負責(zé)輸出結(jié)果。

        1.4.3? 決策樹

        決策樹屬于監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)的一種,通過網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)部的節(jié)點判斷屬性,通過不同的節(jié)點分支判斷輸出結(jié)果,最后使用葉節(jié)點輸出分類結(jié)果,因此決策樹算法復(fù)雜度與樹深度相關(guān)[20-21]。

        1.5? 模型驗證與評估

        實驗結(jié)果評價采用準(zhǔn)確度(Accuracy)、召回率(Recall)、精確度(Precision)、F1值與受試者工作特征曲線(Receiver Operating Characteristic,ROC)來評價結(jié)果的質(zhì)量。如式1可見,準(zhǔn)確度定義為真陽性率(True Positive Rate,TPR)與真陰性率(True Negative Rate,TNR)之和與總樣本數(shù)之比。如公式2可見,召回率定義為真陽性率與真陽性率及假陰性率和之比。如公式3可見,精確度定義為真陽性率與真陽性率及假陽性率和之比。TP代表真陽性,TN代表真陰性,F(xiàn)P代表假陽性,F(xiàn)N代表假陰性。如公式4可見,F(xiàn)1值為精確度與召回率的加權(quán)調(diào)和平均,其中P代表精確度,R代表召回率。ROC曲線使用真陽性率為縱坐標(biāo),假陽性率(False Positive Rate,F(xiàn)PR)為橫坐標(biāo),如式5與式6所示。

        2? 實驗結(jié)果與分析

        實驗使用原始數(shù)據(jù)庫、噪聲數(shù)據(jù)庫與低分辨率數(shù)據(jù)庫進行,每種數(shù)據(jù)庫均包含11865張已分割圖像。實驗采用十折交叉驗證方法進行模型訓(xùn)練和模型驗證。支持向量機實驗均設(shè)置使用徑向基函數(shù)作為核函數(shù);多層感知機隱藏層數(shù)為1,隱藏層1中單元數(shù)為6,隱藏層采用雙曲正切函數(shù)作為激活函數(shù),輸出層采用SoftMax作為激活函數(shù)及交叉熵損失函數(shù);決策樹模型采用卡方自動交叉檢驗(Chi-squared Automatic Interaction Detector,CHAID)生長法,樹深度為3,父節(jié)點中最小個案數(shù)為100,子節(jié)點中最小個案數(shù)為50,最中含有20個節(jié)點,14個終端節(jié)點。

        支持向量機六分類結(jié)果如表1所示,總分類精度為88.6%。六分類ROC曲線如圖4所示,標(biāo)簽0-5分別代表嗜中性桿狀核粒細胞、嗜中性分葉核粒細胞、嗜酸性粒細胞、嗜堿性粒細胞、淋巴細胞及單核細胞。嗜酸性粒細胞、嗜堿性粒細胞、淋巴細胞與單核細胞的ROC曲線最為靠近左上角坐標(biāo)軸,曲線下面積也較大,說明這四類細胞分類精度較高;嗜中性桿狀核細胞與嗜中性分葉核細胞曲線下面積較小,說明分類精度較低,這與表1反映的分類結(jié)果是一一對應(yīng)的。

        為驗證本研究所用方法的魯棒性與泛化性,使用三種分類器對三種數(shù)據(jù)庫分別進行分類實驗,結(jié)果如表2所示。由表可以得知,支持向量機的分類性能略優(yōu)于多層感知機,大幅領(lǐng)先決策樹;噪聲數(shù)據(jù)庫的分類精度最低,說明加入噪聲會影響分類精度[22];三種分類器低質(zhì)量圖像的分類結(jié)果均低于高質(zhì)量圖像,高質(zhì)量與低質(zhì)量精度差距在1%-6%之間。

        產(chǎn)生這種現(xiàn)象的原因可能有四點:第一,嗜中性桿狀核粒細胞和嗜中性分葉核粒細胞均屬于嗜中性粒細胞,這兩種細胞的形態(tài)差異較小,形成的特征差異較小,導(dǎo)致這兩類細胞分類精度較差;第二,本課題數(shù)據(jù)集較大,大批量分割細胞時存在少量白細胞未完全分割或白細胞過分割等情況,影響分類精度;第三,加入噪聲后影響紋理及小波特征提取的準(zhǔn)確性,造成分類精度下降;第四,低分辨率數(shù)據(jù)庫分類精度略低于高質(zhì)量數(shù)據(jù)庫分類精度,說明分辨率對分類結(jié)果的影響較小。

        3? 結(jié)論

        本研究聯(lián)合多類型特征實現(xiàn)基于機器學(xué)習(xí)的白細胞分類方法。為了解決以往研究白細胞類別少、網(wǎng)絡(luò)泛化性與魯棒性驗證困難的問題,本研究首先收集到11865張六種類別的白細胞圖像,并處理為高質(zhì)量、噪聲與低分辨率數(shù)據(jù)庫,隨后通過預(yù)處理與顏色閾值分割去除圖像中無關(guān)信息,然后提取并篩選出63個幾何、小波與紋理特征。經(jīng)過主成分分析降維處理后,選擇支持向量機、多層感知機與決策樹進行六分類實驗,并得到了高質(zhì)量圖像最高88.6%;噪聲圖像最高84.5%;低分辨率圖像最高87.6%的六分類精度。實驗結(jié)果說明所提出方法具有很好的分類效果,并且泛化性與魯棒性好。

        參考文獻

        [1]孫凱, 姚旭峰, 馬風(fēng)玲, 等. 基于機器學(xué)習(xí)的血細胞分類研究進展[J]. 中國醫(yī)學(xué)物理學(xué)雜志, 2020, 37(01): 127-132.

        [2]SAPNA S, RENUKA A. Techniques for Segmentation and Classification of Leukocytes in Blood Smear Images-A Review[C]//2017 IEEE International Conference on Computational Intelligence and Computing Research (ICCIC). IEEE, 2017: 1-5.

        [3]趙子豪. 基于卷積神經(jīng)網(wǎng)絡(luò)的白細胞圖像檢測及分類技術(shù)[D]. 西北大學(xué), 2019.

        [4]QIN F, GAO N, PENG Y, et al. Fine-grained leukocyte classification with deep residual learning for microscopic images[J]. Computer methods and programs in biomedicine, 2018, 162: 243-252.

        [5]RAWAT J, BHADAURIA H S, Singh A, et al. Review of leukocyte classification techniques for microscopic blood images[C]//2015 2nd International Conference on Computing for Sustainable Global Development (INDIACom). IEEE, 2015: 1948-1954.

        [6]RAVIKUMAR S. Image segmentation and classification of white blood cells with the extreme learning machine and the fast relevance vector machine[J]. Artificial cells, nanomedicine, and biotechnology, 2016, 44(3): 985-989.

        [7]ROY R, SASI S. Classification of WBC Using Deep Learning for Diagnosing Diseases[C]//2018 Second International Conference on Inventive Communication and Computational Technologies (ICICCT). IEEE, 2018: 1634-1638.

        [8]AGAIAN S, MADHUKAR M, Chronopoulos A T. A new acute leukaemia-automated classification system[J]. Computer Methods in Biomechanics and Biomedical Engineering: Imaging & Visualization, 2018, 6(3): 303-314.

        [9]DUAN Y, WANG J, HU M, et al. Leukocyte classification based on spatial and spectral features of microscopic hyperspectral images[J]. Optics & Laser Technology, 2019, 112: 530-538.

        [10]EGMONT-PETERSEN M, DE RIDDER D, HANDELS H. Image processing with neural networks—a review[J]. Pattern recognition, 2002, 35(10): 2279-2301.

        [11]王秋萍, 張志祥, 朱旭芳. 圖像分割方法綜述[J]. 信息記錄材料, 2019, 20(7): 12-14.

        [12]袁滿. 血細胞圖像白細胞的自動檢測與識別[D]. 南京: 東南大學(xué), 2017.

        [13]金松. 基于機器學(xué)習(xí)的尿沉渣圖像有形成分檢測算法的研究[D]. 電子科技大學(xué), 2019.

        [14]朱思聰, 周德龍. 角點檢測技術(shù)綜述[J]. 計算機系統(tǒng)應(yīng)用 , 2020, 29(01): 22-28.

        [15]臧啟元, 黃鋼, 徐磊, 等. 基于機器學(xué)習(xí)與細胞形態(tài)學(xué)對癌細胞分類[J]. 軟件, 2019, 40(9): 81-83.

        [16]劉麗, 謝毓湘 , 魏迎梅, 等. 局部二進制模式方法綜述[J]. 中國圖象圖形學(xué)報, 2014, 19(12): 1696-1720.

        [17]聶敬云, 李春青, 李威威, 等. 關(guān)于遺傳算法優(yōu)化的最小二乘支持向量機在MBR仿真預(yù)測中的研究[J]. 軟件, 2015, 36(5): 40-44+48.

        [18]DUNTEMAN G H. Principal components analysis[M]. Sage, 1989.

        [19]ALPAYDIN E. Introduction to machine learning[M]. MIT press, 2020.

        [20]趙力衡. 基于決策樹的手寫數(shù)字識別的應(yīng)用研究[J]. 軟件, 2018, 39(03): 90-94.

        [21]周捷, 朱建文. 機器學(xué)習(xí)分類問題及算法研究[J]. 軟件, 2019, 40(7): 205-208.

        [22]GHOSH S, BHATTACHARYA S. Classification of RBC and WBC in Noisy Microscopic Images of Blood Smear[M]//? Information, Photonics and Communication. Springer, Singapore, 2020: 195-200.

        猜你喜歡
        機器學(xué)習(xí)圖像處理白細胞
        白細胞
        中國寶玉石(2021年5期)2021-11-18 07:34:50
        機器學(xué)習(xí)在圖像處理中的應(yīng)用
        電子制作(2018年18期)2018-11-14 01:48:20
        白細胞降到多少應(yīng)停止放療
        人人健康(2017年19期)2017-10-20 14:38:31
        模糊圖像處理,刑事偵查利器
        圖像處理技術(shù)的實戰(zhàn)應(yīng)用
        基于機器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        基于支持向量機的金融數(shù)據(jù)分析研究
        雞住白細胞蟲病防治體會
        一区二区三区日韩亚洲中文视频 | 日本高清色一区二区三区| 伊人久久大香线蕉av最新午夜| 在线视频观看国产色网| 手机福利视频| 最好看的最新高清中文视频| 天堂av一区二区在线观看| 国产精品亚洲精品日韩动图| 日韩精品乱码中文字幕| 国产精品 亚洲 无码 在线| 水蜜桃亚洲一二三四在线| 中文字幕人成人乱码亚洲| av天堂一区二区三区精品| 亚洲国产色婷婷久久精品| 国产不卡视频一区二区三区| 深夜福利小视频在线观看| 亚洲一区二区欧美色妞影院| 久久精品av一区二区免费| 一本色道久在线综合色| 午夜爽爽爽男女污污污网站| 国产成人亚洲精品无码h在线| 亚洲色拍拍噜噜噜最新网站| 久久婷婷国产色一区二区三区| 国产毛片黄片一区二区三区| 日韩放荡少妇无码视频| 1000部拍拍拍18勿入免费视频下载| 日韩午夜在线视频观看| 中文字幕综合一区二区| 亚洲av成人无码一二三在线观看 | 噜噜噜色97| 日本高清一区二区不卡| 乱子轮熟睡1区| 又湿又黄裸乳漫画无遮挡网站| 99精品国产闺蜜国产在线闺蜜| 日本一区人妻蜜桃臀中文字幕| 99噜噜噜在线播放 | 在教室伦流澡到高潮hgl视频 | 日韩亚洲制服丝袜中文字幕| 午夜一区二区在线视频| 人妻少妇中文字幕在线观看| 精品日产卡一卡二卡国色天香 |