亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于分布先驗的半監(jiān)督FCM的肺結節(jié)分類

        2017-12-05 11:16:14姜婷襲肖明岳厚光
        智能系統學報 2017年5期
        關鍵詞:分類監(jiān)督

        姜婷,襲肖明,岳厚光

        (山東財經大學 計算機科學與技術學院,山東 濟南 250014)

        基于分布先驗的半監(jiān)督FCM的肺結節(jié)分類

        姜婷,襲肖明,岳厚光

        (山東財經大學 計算機科學與技術學院,山東 濟南 250014)

        肺結節(jié)的良惡性分類對于肺癌的早期發(fā)現及診斷具有重要意義。然而實際應用中,標記的圖像數量較少,且獲取標記將耗費大量的人力,在這種情況下,使用半監(jiān)督學習算法是有效提高分類性能的一個思路。作為一種經典的半監(jiān)督學習算法,傳統的半監(jiān)督FCM在未標記樣本與標記樣本分布不平衡情況下不能充分利用標記信息。針對此問題,本文提出了一種基于分布先驗的半監(jiān)督FCM算法。首先計算樣本的先驗分布概率,基于獲得的先驗概率,給樣本賦予權重,并將其融入到半監(jiān)督FCM聚類中,從而強化少量的標記樣本在聚類過程中的指導作用。文中在LIDC數據庫上進行了相應的實驗,實驗結果證明,相比較傳統的半監(jiān)督FCM算法,提出的算法能夠取得更好的肺結節(jié)分類性能。

        肺結節(jié)分類;半監(jiān)督FCM;先驗分布信息;圖像處理;LIDC數據庫

        根據世界衛(wèi)生組織2016年公布的數據,肺癌在全球的發(fā)病率和死亡率均為最高[1]。肺癌的早期發(fā)現及治療對于挽救患者的生命具有重要意義[2]。肺癌早期通常表現為肺結節(jié)[3-4]。在臨床上,醫(yī)生通常結合肺部醫(yī)學影像來對肺部結節(jié)進行分析與診斷。CT是一種常用的輔助檢查肺結節(jié)醫(yī)學成像模態(tài)的手段。然而,由于醫(yī)生個人經驗等主觀因素的影響,不同的醫(yī)生可能對于同一個患者的CT圖像產生不同的診斷結果。因此,使用計算機輔助診斷系統(computer-aided diagnosis, CAD)[5]對肺部CT圖像進行自動分析,提供一個客觀的肺結節(jié)診斷結果具有重要的意義。

        一般情況下,肺部CT圖像的數據標注較少,大量的數據是未標記的。受限于臨床專業(yè)知識,人工對所有的數據進行標注將耗費大量的人力。半監(jiān)督學習思想是利用少量的標記樣本和大量的未標記樣本訓練分類器,通過未標記數據的信息輔助提升分類器的性能。因此,本文使用半監(jiān)督學習方法對肺結節(jié)進行分類。

        半監(jiān)督聚類是一種常用的半監(jiān)督學習方法[6],通過利用少量標記樣本輔助提高聚類的準確率。半監(jiān)督FCM算法是半監(jiān)督聚類算法的經典算法之一。Bensaid等[7]針對傳統FCM中簇數的選擇以及訓練樣本數量較少等問題提出了一種部分監(jiān)督聚類FCM算法;張慧哲等[8]針對傳統FCM算法聚類結果受初始聚類中心的影響,提出了一種簡潔快速的初始聚類中心選取規(guī)則,并根據聚類中心的分離特性改進了目標函數,從而使聚類結果達到最優(yōu);李春芳等[9]針對傳統的半監(jiān)督FCM算法的目標函數在α=1,0時退化為經典的FCM算法,提出了一種基于改進目標函數的半監(jiān)督模糊聚類算法SS-FCM,提高了聚類的準確性和收斂速度;K.L. Wu[10]針對傳統半監(jiān)督FCM的模糊因子參數m的選擇進行了詳細的分析,提出在數據集包含噪聲和離群值的情況下m=4有更強的健壯性和聚類效果;侯薇等[11]針對計算FCM隸屬度導致算法執(zhí)行率低這一問題,提出了一種抽樣初始化產生較好的初始聚類中心,對較大隸屬度的數據點,通過k-means操作更新模糊聚類中心,同時僅更新小隸屬度來達到提高FCM算法聚類的效率;李斌等[12]針對傳統的核模糊C均值中只考慮類內關系忽略了類間關系,從而使邊界對噪聲敏感等問題,提出了一種改進核FCM類間極大化聚類算法MKFCM,使邊界處樣本得到很好的劃分。

        現有的半監(jiān)督FCM雖然能夠在一定程度上取得了較好的聚類效果,但標記樣本與未標記樣本的分布不平衡問題將會影響半監(jiān)督聚類的性能[13]。傳統半監(jiān)督FCM算法的思想是基于類內加權平方誤差最小化準則,聚類中心是通過標記樣本的隸屬度來控制的[14],樣本通常歸屬于最近的聚類中心所代表的類。當標記樣本與未標記樣本數量差異較大時,將會弱化標記樣本的監(jiān)督信息在聚類中的作用,導致聚類結果產生錯誤,進而影響肺結節(jié)分類的準確率。本文針對這一問題,提出了一種基于先驗分布的半監(jiān)督FCM算法,通過引入標記樣本的先驗分布信息,賦予標記樣本更大的權重,并將其融入到FCM聚類過程中,使得監(jiān)督信息在最后聚類中發(fā)揮更重要的作用,從而更好地指導聚類。在LIDC數據庫進行了實驗,實驗結果證明了本文提出的算法能夠取得更高的分類準確率。

        1 特征提取

        肺結節(jié)的診斷過程主要分為肺結節(jié)的分割、特征提取、肺結節(jié)良惡性分類。圖1為一幅肺部CT圖像,圖2為分割出的肺結節(jié)。基于分割的肺結節(jié),進行特征提取。在臨床上,肺結節(jié)的形狀及邊緣的粗糙程度等信息是判斷良惡性的重要依據,為了獲取這些重要信息,本文主要提取以下特征[15]:灰度特征[16](灰度方差、灰度直方圖熵),形態(tài)特征[17](似圓度、緊湊度、徑向均值、徑向方差,邊界粗糙度、形狀不變矩H0,H1,H2,H3)等11維特征,并對每一維特征進行歸一化。

        圖1 LIDC中肺部CT圖像Fig.1 Lung CT image in LIDC

        圖2 肺結節(jié)分割Fig.2 Segmentation of pulmonary nodules

        2 肺結節(jié)的良惡性分類

        2.1 經典FCM算法

        FCM算法[18]主要思想是在每個樣本進行聚類時,引入一個類簇的隸屬度計算樣本屬于某個類簇的可能性。聚類的過程可形式化為目標函數的優(yōu)化過程,如式(1)所示。其中k的取值為式(2)所示。FCM算法通過不斷迭代求解模糊隸屬度函數uk和聚類中心vi,使得目標函數最小化,迭代停止,即完成聚類。

        式中:C為聚類個數;N為樣本個數;uik為FCM中的模糊隸屬度,表示第k個樣本點屬于第i個聚類中心的隸屬度,其取值范圍為[0,1];vi表示第i類的聚類中心;‖xk-vi‖2表示第k個樣本點相對于第i個聚類中心的歐式距離;P為模糊因子,它決定樣本在不同類中的模糊程度。

        通過不斷地更新迭代公式(3)、(4),直到式(1)中目標函數的值小于特定的值ε時或者相對于上次的目標函數值的改變量小于特定的值時,停止迭代。

        2.2 部分監(jiān)督的FCM算法

        Bensaid在經典的FCM算法的基礎上,提出了一種部分監(jiān)督聚類算法。他提出的算法加強了標記信息在聚類過程中的指導作用。通過給標記樣本賦予較大的權重,使標記樣本在聚類中心的形成過程中發(fā)揮更重要的作用,提高了聚類的精度。其目標函數為

        其聚類中心為

        模糊隸屬度為

        A是任何的正定矩陣。

        2.3 基于樣本分布先驗的半監(jiān)督FCM算法

        基于樣本分布先驗的半監(jiān)督FCM的目標函數[19]如下:

        式中:標記樣本的隸屬度F=[fik],i=1,2,…,C;N=1,2,…,n;dik表示第k個樣本點相對于第i個聚類中心間的歐式距離;通常情況下模糊因子取經驗值p=2;α是使監(jiān)督和無監(jiān)督樣本之間保持相對平衡的因子,其中α本文選取的是傳統的半監(jiān)督FCM算法中α的取值,即總樣本和標記樣本數量之比。為區(qū)分標記樣本和未標記樣本,引入了二值向量b=bk,其中k=1,2,…,n,標記樣本時bk=1,相反未標記樣本時bk=0。

        為了增強標記樣本的監(jiān)督作用,在計算模糊隸屬度和聚類中心時分別引入了樣本的分布信息。本文通過在式(15)、(16)、(17)中引入兩個權重θ和β,其中θ表示標記樣本的權重,β表示未標記樣本的權重。通過θ和β來指導實現聚類的過程。

        式中:q表示標記樣本的先驗概率;M表示標記樣本的數量;N表示總樣本的數量;r表示未標記樣本的先驗概率;(N-M)表示未標記樣本的數量。通過優(yōu)化目標函數,標記樣本的模糊隸屬度為

        未標記樣本的模糊隸屬度為

        聚類中心為

        由于未標記樣本數量會遠遠大于標記樣本的數量,基于上述公式,權重θ的值一般要大于β。通過在聚類中心中引入權重θ和β,聚類中心以及樣本的聚類結果可以根據樣本的先驗分布進行自動的調整,θ可以強化標記信息對聚類的指導。

        綜上所述,基于先驗分布的半監(jiān)督FCM算法的流程大致如下所示。

        輸入肺結節(jié)圖像。

        輸出肺結節(jié)的分類結果和肺結節(jié)分類準確率。

        算法流程:

        1)計算輸入圖像中肺結節(jié)的特征,并組成一個矩陣;

        2)確定樣本個數C,平衡因子α,閾值ε,標記樣本的先驗概率q,未標記樣本的先驗概率r,以及標記樣本的個數M;

        4)按照式(15)、(16)更新模糊隸屬度uik;

        5)按照式(17)更新聚類中心;

        6)重復循環(huán)步驟3),當兩次迭代矩陣模糊隸屬度的差小于ε閾值時停止迭代;

        7)根據計算得到的模糊隸屬度uik結果進行分類。

        3 實驗結果及分析

        本文的實驗圖像來自美國的LIDC[20](美國癌癥研究),本文選擇了188個病例,一共451個結節(jié),其中包括了147個惡性結點,155個假陽性結點,149個良性結點。同時,本文實驗中選取144例監(jiān)督樣本,即47個惡性、42個良性及55個假陽性結點,剩余的樣本作為測試樣本。實驗中,采用肺結節(jié)分類識別準確率作為評估算法性能準則。圖3為部分分類后的結節(jié),大部分樣本都能分類正確,只有少量樣本存在分類錯誤,這是因為在特征提取方面這些肺結節(jié)的灰度特征不夠明顯,導致分類錯誤。本實驗為了證明提出算法的有效性,在不同未標記樣本和標記樣本之間的比例下(分別為7倍、6倍、5倍、4倍、3倍、2倍),對比提出的算法與其他算法的分類正確率。未標記樣本和標記樣本比例為7倍、6倍、5倍時分類結果準確率變化不是十分明顯,所以本文只給出了比例為7倍的分類準確率。表1給出了傳統FCM部分監(jiān)督FCM算法、SS-FCM、改進的半監(jiān)督FCM算法[21]以及本文提出的基于樣本先驗概率的半監(jiān)督聚類算法準確率的比較結果。

        (a)部分惡性肺結節(jié)分類結果

        (b)部分良性肺結節(jié)分類結果

        (c)部分假陽性肺結點分類結果圖3 部分結節(jié)分類后的結果Fig. 3 Nodules classification results

        Table1 Comparison of the accuracy of different methods %

        由表1可知,隨著標記樣本數量的增加,半監(jiān)督FCM框架下的肺結節(jié)分類的準確率大致是逐漸提高的。與其他的半監(jiān)督FCM方法相比較,本文提出的算法效果更好。因為本文引入了樣本的先驗分布信息,能夠強化標記信息對聚類的指導作用,從而能夠提高分類效果。但是根據表1中數據我們可以看出,標記樣本為90時的分類準確率要比標記樣本為144時的分類準確率高,這是因為隨著標記樣本的增加,當標記樣本和未標記樣本的數量越來越接近時,公式中引入的標記樣本和未標記樣本的權重也就越來越相近,那么式(17)中的系數就可以約掉,本文的算法退化為傳統的半監(jiān)督模糊C均值算法,從而使得準確率降低。這也是下一步工作的重點。

        4 結束語

        為了解決半監(jiān)督聚類算法中標記樣本數量少導致標記信息在聚類過程中作用弱化的問題,本文提出了一種基于先驗分布的半監(jiān)督FCM算法。引入樣本的分布先驗信息,自適應調節(jié)樣本的權重,強化標記樣本在聚類過程中的指導作用,提高半監(jiān)督FCM算法在少量標記樣本情況下的性能。在本文的實驗中,通過與傳統的半監(jiān)督聚類算法對比,證明提出的方法能夠取得更高的聚類正確率。

        但是當標記樣本數量非常小的時候,給其賦以過大的權重會出現分類結果偏離實際的情況。這也是在未來的工作中進一步研究的問題。

        [1]MCGUIRE S. World Cancer Report 2014. Geneva,Switzerland: World Health Organization, International Agency for Research on Cancer, WHO Press, 2015[R]. Advances in nutrition, 2016, 7(2): 418-419.

        [2]伍長榮, 接標, 葉明全. CT圖像肺結節(jié)計算機輔助檢測與診斷技術研究綜述[J]. 數據采集與處理, 2016, 31(5): 868-881.

        WU Changrong, JIE Biao, YE Mingquan. Reviews on computer-aided detection and diagnosis of pulmonary nodules in CT images[J]. Journal of data acquisition and processing, 2016, 31(5): 868-881.

        [3]LEE S L A, KOUZANI A Z, HU E J. Automated detection of lung nodules in computed tomography images: a review[J]. Machine vision and applications, 2012, 23(1):151-163.

        [4]VALENTE I R S, CORTEZ P C, NETO E C, et al. Automatic 3D pulmonary nodule detection in CT images: A survey[J]. Computer methods and programs in biomedicine, 2016, 124(C): 91-107.

        [5]HAN F, WANG H, ZHANG G, et al. Texture feature analysis for computer-aided diagnosis on pulmonary nodules[J]. Journal of digital imaging, 2015, 28(1): 99.

        [6]HADY M F A, SCHWENKER F. Semi-supervised learning[J]. Intelligent systems reference library, 2010, 49(2): 215-239.

        [7]BENSAID A M, HALL L O, BEZDEK J C, et al. Partially supervised clustering for image segmentation[J]. Pattern recognition, 1996, 29(5): 859-871.

        [8]張慧哲, 王堅. 基于初始聚類中心選取的改進FCM聚類算法[J]. 計算機科學, 2009, 36(6): 206-209.

        ZHANG Huizhe, WANG Jian. Improved fuzzy C means clustering algorithm based on selecting initial clustering centers[J]. Computer science, 2009, 36(6): 206-209.

        [9]李春芳, 龐雅靜, 錢麗璞,等. 半監(jiān)督FCM聚類算法目標函數研究[J]. 計算機工程與應用, 2009, 45(14): 128-132.

        LI Chunfang, PANG Yajing, QIAN Lipu, et al. Objective function of semi-supervised FCM clustering algorithm[J]. Computer engineering and application, 2009, 45(14): 128-132.

        [10]WU K L. Analysis of parameter selections for fuzzyC-means[J]. Pattern recognition, 2012, 45(1): 407-415.

        [11]侯薇, 董紅斌, 印桂生. 一種基于隸屬度優(yōu)化的演化聚類算法[J]. 計算機研究與發(fā)展, 2013, 50(3): 548-558.

        HOU Wei, DONG Hongbin, YIN Guisheng. A membership degree refinement-based evolutionary clustering algorithm[J]. Journal of computer research and development, 2013, 50(3): 548-558.

        [12]李斌, 狄嵐, 王少華,等. 基于改進核模糊C均值類間極大化聚類算法[J]. 計算機應用, 2016, 36(7): 1981-1987.

        LI Bin, DI Lan, WANG Shaohua, et al. Clustering algorithm with maximum distance between clusters based on improved kernel fuzzyC-means[J]. Journal of computer applications, 2016, 36(7): 1981-1987.

        [13]文傳軍, 汪慶淼, 詹永照. 均衡模糊C均值聚類算法[J]. 計算機科學, 2014, 41(8): 250-253.

        WEN Chuanjun, WANG Qingmiao, ZHAN Yongzhao, et al. Equalization fuzzyC-means clustering algorithm[J]. Computer science, 2014, 41(8): 250-253.

        [14]蔡加欣, 楊豐, 馮國燦. 改進退化的半監(jiān)督模糊聚類應用于MR圖像分割[J]. 中國圖象圖形學報, 2011, 16(5): 784-791.

        CAI Jiaxin, YANG Feng, FENG Guocan, et al. Degeneracy-improved semi-supervised fuzzy clustering with application in MR image segmentation[J]. Journal of image and graphics, 2011, 16(5): 784-791.

        [15]蘇志遠, 劉慧, 尹義龍. 基于弱監(jiān)督ECOC算法的肺結節(jié)輔助檢測[J]. 數據采集與處理, 2015, 30(5): 1003-1010.

        SU Zhiyuan, LIU Hui, YIN Yilong, et al. Pulmonary nodule aided detection based on weakly-supervised ECOC algorithm[J]. Jornal of data acqusition and processing, 2015, 30(5): 1003-1010.

        [16]MURRAY P, MARSHALL S. A new design tool for feature extraction in noisy images based on grayscale hit-or-miss transforms[J]. IEEE transactions on image processing a publication of the ieee signal processing society, 2011, 20(7): 1938-48.

        [17]BAE H J, KANG E Y, YONG H S, et al. Paratracheal air cysts on thoracic multidetector CT: incidence, morphological characteristics and relevance to pulmonary emphysema[J]. British journal of radiology, 2013, 86(1021): 20120218.

        [18]BEZDEK J C, EHRLICH R, FULL W. FCM: the fuzzyC-means clustering algorithm[J]. Computers and geosciences, 1984, 10(2/3): 191-203.

        [19]PEDRYCZ W, WEMBER J, WALETZKY J. Fuzzy clusteringwith partial supervision [J]. IEEE transaction on system, man, and cybernetics, part B: cybernetics,1997, 27(5): 787-795.

        [20]MCNITT-GRAY M F, MEYER C R, REEVES A P, et al. The lung image database consortium (LIDC) data collection process for nodule detection and annotation[J]. Academic radiology, 2008, 14(12): 1464-1474.

        [21]李秋萍, 劉慧, 蘇志遠. 基于改進的半監(jiān)督FCM聚類算法的肺結節(jié)分類與識別[J]. 圖學學報, 2015, 36(2): 244-250.

        LI Qiuping, LIU Hui, SU Zhiyuan. Modified fuzzy clustering with partial supervision algorithm in classification and recognition of pulmonary nodules[J]. Journal of graphics, 2015, 36(2): 244-250.

        姜婷,女, 1991年生,碩士研究生,主要研究方向為數據挖掘、機器學習。參與多項國家自然科學基金等科研項目。

        襲肖明,男, 1987年生,博士,主要研究方向為生物識別、機器學習。主持國家自然科學基金、省自然科學基金等多項科學研究項目。

        岳厚光,男, 1971年生,副教授,主要研究方面為數據挖掘、機器學習。

        Classificationofpulmonarynodulesbysemi-supervisedFCMbasedonpriordistribution

        JIANG Ting, XI Xiaoming, YUE Houguang

        (School of Computer Science and Technology, Shandong University of Finance and Economics, Ji’nan 250014, China)

        The classification of pulmonary nodules is significant for the early detection and treatment of lung cancer. However, in real clinical applications, few medical images are labeled and it is difficult to obtain these labels. Semi-supervised learning methods that utilize supervised information to label images may be employed to improve the classification performance of pulmonary nodules. Traditional semi-supervised methods ignore the use of label information when the distribution between labeled and unlabeled specimens is imbalanced. To solve this problem, we propose a semi-supervised fuzzy c-means (FCM) algorithm based on prior distribution for classifying pulmonary nodules. This algorithm first calculates the prior probability of the specimens. Based on the obtained probability, a weight is assigned to each specimen for clustering to intensify the instruction role of a few labeled specimens in the clustering process. We conducted a corresponding test for Lung Image Database Consortium (LIDC) database. The result shows that, compared with the traditional semi-supervised FCM algorithm, the proposed algorithm can obtain better classification performances of pulmonary nodules.

        classification of pulmonary nodules; semi-supervised FCM; prior distribution; image processing; LIDC database

        10.11992/tis.201706018

        http://kns.cnki.net/kcms/detail/23.1538.TP.20170831.1058.014.html

        TP399

        A

        1673-4785(2017)05-0729-06

        中文引用格式:姜婷,襲肖明,岳厚光.基于分布先驗的半監(jiān)督FCM的肺結節(jié)分類J.智能系統學報, 2017, 12(5): 729-734.

        英文引用格式:JIANGTing,XIXiaoming,YUEHouguang.Classificationofpulmonarynodulesbysemi-supervisedFCMbasedonpriordistributionJ.CAAItransactionsonintelligentsystems, 2017, 12(5): 729-734.

        2017-06-07. < class="emphasis_bold">網絡出版日期

        日期:2017-08-31.

        國家自然科學基金項目(61573219,61671274);山東省自然科學基金項目(ZR2016FQ18 , ZR2014HM065);醫(yī)藥衛(wèi)生科技發(fā)展計劃項目(2014ws0109).

        襲肖明. E-mail: fyzq10@126.com.

        猜你喜歡
        分類監(jiān)督
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        突出“四個注重” 預算監(jiān)督顯實效
        人大建設(2020年4期)2020-09-21 03:39:12
        分類討論求坐標
        數據分析中的分類討論
        教你一招:數的分類
        監(jiān)督見成效 舊貌換新顏
        人大建設(2017年2期)2017-07-21 10:59:25
        夯實監(jiān)督之基
        人大建設(2017年9期)2017-02-03 02:53:31
        給塑料分分類吧
        績效監(jiān)督:從“管住”到“管好”
        浙江人大(2014年5期)2014-03-20 16:20:28
        99re6在线视频精品免费| 伊人色综合九久久天天蜜桃| 日韩精品大片在线观看| 91麻豆精品激情在线观看最新 | 久久国产亚洲中文字幕| 水蜜桃网站视频在线观看| 18禁在线永久免费观看| 亚洲av成人一区二区三区| 精品久久久久久久无码| 欧美日韩色| 大屁股流白浆一区二区| 自拍偷区亚洲综合激情| 亚洲av毛片在线免费观看| 精品av熟女一区二区偷窥海滩 | 亚洲中文字幕剧情类别| 妺妺窝人体色777777| 婷婷久久久亚洲欧洲日产国码av| 久久亚洲伊人| 亚洲熟女少妇精品久久| 国产精品永久久久久久久久久| 人妻哺乳奶头奶水| 四虎4545www国产精品| 亚洲中文久久久久无码| 精品精品国产一区二区性色av| 蜜臀av在线播放一区二区三区| 亚洲日本一区二区一本一道| 一本色道久久综合亚洲精品小说| 蜜臀av一区二区三区精品 | 国产亚洲精品久久久久久国模美| 欧美成a人片在线观看久| 丰满熟妇人妻无码区| 国产一级黄色片在线播放| 亚洲精品视频在线一区二区| 日韩一卡2卡3卡4卡新区亚洲| 玖玖资源站无码专区| 国内自拍第一区二区三区| 日韩精品免费一区二区三区观看| 疯狂撞击丝袜人妻| 国产精品久久中文字幕第一页 | 久久婷婷综合激情亚洲狠狠 | 人妻少妇猛烈井进入中文字幕 |