亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于貝葉斯粗糙集的肺部腫瘤CT圖像高維特征選擇算法*

        2019-01-23 09:30:34張飛飛周濤陸惠玲梁蒙蒙楊健
        生物醫(yī)學(xué)工程研究 2018年4期
        關(guān)鍵詞:高維約簡粗糙集

        張飛飛,周濤,,3△,陸惠玲,梁蒙蒙,楊健

        (1.寧夏醫(yī)科大學(xué)公共衛(wèi)生與管理學(xué)院,銀川 750000;2.寧夏醫(yī)科大學(xué)理學(xué)院,銀川 750000;3.寧夏智能信息與大數(shù)據(jù)處理重點實驗室,銀川 750021)

        1 引 言

        粗糙集(rough set,RS)是一種刻畫不完整性和不確定性的數(shù)學(xué)工具,能有效分析各種不完備的信息,通過對數(shù)據(jù)進行分析和推理,從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律[1]。RS在醫(yī)學(xué)圖像處理領(lǐng)域的應(yīng)用主要包括圖像的增強[2]、分類[3]、特征選擇[4]和分割[1]等。但大多數(shù)決策信息數(shù)據(jù)存在模糊性、不完整性及噪聲[5],此時RS已經(jīng)不能滿足數(shù)據(jù)處理的要求。為了克服RS只能處理完全確定數(shù)據(jù)的局限性,提出了其擴展模型-變精度粗糙集(variable precision rough set,VPRS),通過引入分類錯誤率β([0,0.5])將RS的下近似由“完全包含”放松為“部分包含”,反映了數(shù)據(jù)集中存在的誤分類數(shù)據(jù)的魯棒性和噪聲數(shù)據(jù)。近年來,對β選取問題的研究主要有以下幾個方面:一是不考慮β選取的細節(jié),提出可擴展的VPRS模型,如:變精度模糊粗糙集[6]、廣義變精度粗糙集[7]、變精度軟粗糙集等;二是通過不同的方式計算β的取值,如文獻[5]中將平均包含度作為選取上下近似的閾值;三是研究RS的概率泛化模型如:VPRS、博弈粗糙集、決策粗糙集[8]、貝葉斯粗糙集(bayesian rough set,BRS)[9]、0.5概率粗糙集等,這些方法彼此相關(guān),不同的是概率近似公式和參數(shù)設(shè)計方式不同。其中BRS是VPRS的一種無參數(shù)化推廣,利用先驗概率來計算VPRS中閾值β,但是目前很多研究還處于理論階段,缺乏成熟的應(yīng)用模型。

        本研究結(jié)合BRS、遺傳算法(genetic algorithm,GA)和支持向量機(support vector machine,SVM),提出一種基于BRS的肺部腫瘤CT圖像高維特征選擇算法。首先提取3 000幅肺部腫瘤CT圖像ROI區(qū)域104維特征構(gòu)造決策信息表;其次從全局相對增益函數(shù)的角度分析屬性重要度,結(jié)合屬性約簡長度和基因編碼權(quán)值函數(shù)三者的加權(quán)和構(gòu)造適應(yīng)度函數(shù)框架;最后利用支持向量機分類識別。

        2 基礎(chǔ)知識

        2.1 遺傳算法

        GA算法借用了生物遺傳學(xué)的觀點,通過自然選擇、交叉、變異等操作,實現(xiàn)個體適應(yīng)性的提高。它是模擬自然界遺傳機制和生物進化理論而形成的一種過程搜索最優(yōu)解的算法。相比傳統(tǒng)優(yōu)化算法,遺傳算法具有其獨特的特點:理論基礎(chǔ)扎實、魯棒性強、適用于并行處理[10],已廣泛應(yīng)用于計算機科學(xué)、圖形圖像處理、數(shù)據(jù)挖掘等領(lǐng)域,也被廣泛應(yīng)用于特征選擇,并取得了較好的結(jié)果[11]。

        2.2 貝葉斯粗糙集

        分類錯誤率β的選取制約著VPRS發(fā)展,目前尚無系統(tǒng)的閾值選取體系。為了進一步擴展概率粗糙集的應(yīng)用,Slezak[12]等在貝葉斯理論的基礎(chǔ)上,提出了一種修正的VPRS模型,用事件發(fā)生的先驗概率代替VPRS中分類錯誤率β,無需任何參數(shù)來控制模型派生,既克服了經(jīng)典RS對下近似的完全精確劃分,又避免了變精度粗糙集中參數(shù)β對上下近似的影響?;靖拍钊缦拢?/p>

        (1)

        (2)

        (3)

        定義3:設(shè)X與E為等價關(guān)系,a∈E,如果RE-{a}(X)=RE(X),稱a為E中X不必要的,否則a為E中X必要的。E中所有X必要的集合稱為E的X核。

        定義4:信息系統(tǒng)S中,對于?X?U,子集B?C,則B為X的R約簡,且滿足:

        (1)RB(X)=RC(X);

        (2)去掉B中任一屬性均使得式(1)不成立。

        3 算法介紹

        3.1 算法思想

        基于BRS的肺部腫瘤CT圖像高維特征選擇算法流程見圖1。

        3.2 算法步驟

        3.2.1實驗獲取及預(yù)處理 本研究選用寧夏某三甲醫(yī)院帶有醫(yī)囑的3 000例肺部腫瘤CT圖像。從原始圖像中獲取對肺部腫瘤有較強區(qū)分能力的子圖作為ROI區(qū)域,并將ROI圖像歸一化為50×50像素。

        圖1 基于BRS的肺部腫瘤CT圖像高維特征選擇算法流程圖

        Fig1FlowchartofalgorithmforhighdimensionfeatureselectionoflungtumorCTimagebasedonBRS

        3.2.2圖像分割 為準(zhǔn)確測量腫瘤的形狀、紋理和灰度等特征,選用OTSU算法分割預(yù)處理的ROI區(qū)域。OTSU是閾值自動選取最有效、最穩(wěn)定的方法之一,在一定條件下不受圖像對比度與亮度影響[13]。圖2給出本研究分割前后的5組實例。

        圖2 OTSU算法分割前后的實例

        Fig2ExamplesofROIregionbeforeandaftersegmentationbasedonOTSUalgorithm

        3.2.3特征提取 對分割后的ROI區(qū)域提取104維特征,包括形狀特征、紋理特征和灰度特征,具體特征見表1。提取特征后構(gòu)建決策信息表:每個樣本包括104維條件屬性和1維決策屬性。

        3.2.4離散化 為了提高算法的運行效率,簡化數(shù)據(jù)結(jié)構(gòu),采用模糊C均值聚類算法簡化構(gòu)建決策信息表。

        表1 肺部腫瘤CT圖像特征集合

        3.2.5基于BRS的屬性約簡 本研究結(jié)合BRS和GA算法進行屬性約簡,降低分類器時間和空間復(fù)雜度,提高分類性能。步驟如下:

        (1)參數(shù)設(shè)定:染色體為0,1組成的序列,其長度等于條件屬性數(shù)目N,交叉概率Pc,變異概率Pm,最大迭代次數(shù)K=150,初始種群M=20,適應(yīng)度函數(shù)為F(x);

        (2)編碼:采用二進制編碼方式,長度等于條件屬性的個數(shù),二進制中0,1分別表示特征未選中和選中;

        (3)初始種群:隨機產(chǎn)生M個染色體串構(gòu)成初始種群;

        (4)遺傳算子:根據(jù)前期研究,遺傳算子組合為無回放隨機余數(shù)選擇、均勻交叉和高斯變異;

        (5)適應(yīng)度函數(shù):適應(yīng)度函數(shù)的有效性決定GA算法的搜索方向和進化結(jié)果,其值是判斷個體性能的主要指標(biāo)。本研究從全局相對增益函數(shù)、屬性約簡長度和基因編碼權(quán)值函數(shù)三個方面考慮,通過加權(quán)和構(gòu)造適應(yīng)度函數(shù),進行遺傳算法尋優(yōu),找到最具區(qū)分能力的特征子集。適應(yīng)度目標(biāo)函數(shù)為:

        因此本研究構(gòu)造適應(yīng)度函數(shù)為:

        F(x)=-ω1×target1-ω2×target2+ω3×target3

        3.2.6基于SVM的分類識別 首先采用網(wǎng)格尋優(yōu)算法優(yōu)化SVM的懲罰參數(shù)和核函數(shù)參數(shù),得到最佳參數(shù)的SVM分類模型,將約簡子集作為輸入,采用五折交叉訓(xùn)練和預(yù)測。

        4 實驗結(jié)果及分析

        4.1 分類器評價標(biāo)準(zhǔn)

        本研究約簡模型評價指標(biāo)包括長度,屬性重要度,算法耗時,分類模型評價指標(biāo)包括:準(zhǔn)確率(Accuracy)、敏感性(Sensitivity)、特異性(Specificity)、F值、馬修斯相關(guān)性系數(shù)(matthews correlation coefficient, MCC)、平衡F分數(shù)(balanced F score,F1Score)、約登指數(shù)(youden index,YI)和算法耗時(Time),計算公式如下:

        (4)

        (5)

        (6)

        (7)

        (8)

        (9)

        YI=Sensitivity+Specificity-1

        (10)

        其中,TP表示被正確分類的惡性腫瘤數(shù);FP表示被分錯的良性腫瘤數(shù);TN表示被正確分類的良性腫瘤數(shù);FN表示被分錯的惡性腫瘤數(shù)。

        4.2 實驗思路

        為了驗證本研究算法的性能,分割原始ROI區(qū)域并提取特征構(gòu)造決策信息表,采用模糊C均值聚類算法對屬性值進行離散化;然后使用提出的算法求取屬性約簡集合,每個參數(shù)組合約簡5次,求這五次約簡結(jié)果的平均值作為該組實驗的結(jié)果。對于約簡后的特征子集采用LIBSVM五折交叉分類識別,得到五組識別結(jié)果,通過各指標(biāo)的平均值作為此次分類結(jié)果。

        4.3 實驗結(jié)果分析

        將本研究基于BRS的高維特征選擇算法和基于VPRS(β分別為0.1、0.2、0.3和0.4)的高維特征選擇算法進行屬性約簡和分類識別的比較,約簡和分類結(jié)果見表2、圖3—圖7、表3。

        表2 不同算法約簡結(jié)果比較Table 2 Comparison of different algorithms reduction results

        圖3BRS某次約簡結(jié)果

        Fig3AreductionresultofBRSalgorithm

        圖4 VPRS( β=0.1)情況下某次約簡結(jié)果Fig 4 A reduction result in the case of VPRS (β=0.1)

        從表2可見,基于BRS的肺部腫瘤CT圖像高維特征選擇算法在參數(shù)β無需人工設(shè)置時,約簡長度為7.8維,相比β=0.1的VPRS模型約簡長度降低顯著。屬性重要度略低于β=0.4的VPRS模型,高于其他參數(shù)值。約簡時間高于β=0.2的VPRS模型,低于其他參數(shù)值,其中相比β=0.1,時間縮短2.7倍。

        圖5 VPRS( β=0.2) 情況下某次約簡結(jié)果Fig 5 A reduction result in the case of VPRS (β=0.2)

        從圖3至圖7可見,基于BRS的CT圖像高維特征選擇算法相比不同β值情況下VPRS算法,約簡過程沒有出現(xiàn)早熟現(xiàn)象,收斂速度較快。從約簡結(jié)果可見,BRS模型在不需要人工設(shè)置參數(shù)的情況下仍能取得較為理想的效果。

        由表3可見,基于BRS的肺部腫瘤CT圖像高維特征選擇算法相比參數(shù)β=0.1的VPRS算法精確度、特異性、MCC、F1Score、YI分別降低0.07%、0.43%、0.0015、0.0006和0.0013,但敏感性提高0.3%,分類時間β=0.1的VPRS算法是BRS算法的3.4倍。雖然BRS算法在可以接受的范圍之內(nèi)降低了精確度,但在很大程度上減少了時間消耗,綜合考慮,BRS算法整體性能優(yōu)于β=0.1的VPRS算法;BRS算法相比參數(shù)β=0.2、0.3和0.4的VPRS算法時間降低,其余各項指標(biāo)均有提高,相比β=0.2的VPRS算法各指標(biāo)提高顯著。從分類結(jié)果可見,BRS的模型與VPRS模型相比,既擺脫了參數(shù)的束縛,也提高了模型的分類性能。

        圖6 VPRS( β=0.3) 情況下某次約簡結(jié)果Fig 6 A reduction result in the case of VPRS (β=0.3)

        圖7 VPRS( β=0.4)情況下某次約簡結(jié)果Fig 7 A reduction result in the case of VPRS (β=0.4) 表3 不同算法SVM分類結(jié)果比較 Table 3 Comparison the classification results of different algorithms based on SVM

        算法參數(shù)β精確度%敏感性%特異性%F值MCCF1ScoreYI時間(s)BRS與參數(shù)β無關(guān)94.2893.1995.370.94210.88610.94280.885616.3293VPRSβ=0.194.3592.8995.800.94000.88760.94340.886955.9115β=0.291.9691.0492.880.91900.84010.91960.839218.1967β=0.394.2193.0795.350.94150.88480.94200.884116.9991β=0.492.2391.4792.990.92180.84560.92220.844517.7542

        5 結(jié)語

        本研究提出一種基于BRS的高維特征選擇算法,該算法針對VPRS在特征選擇過程中對分類錯誤率β的過分依賴問題,結(jié)合貝葉斯理論,使用先驗概率代替分類錯誤率β。首先利用GA算法對初始特征空間進行尋優(yōu),降低特征矢量的維數(shù),在適應(yīng)度函數(shù)構(gòu)造過程中考慮全局相對增益函數(shù)的屬性重要度、約簡長度和基因編碼權(quán)值函數(shù),使用SVM分類識別,最后以3 000幅肺部腫瘤CT圖像為原始數(shù)據(jù)進行輔助診斷。實驗結(jié)果表明,BRS算法在約簡過程中各指標(biāo)介于不同β值情況下VPRS算法,未出現(xiàn)早熟現(xiàn)象。在分類階段,BRS算法的精確度高于多數(shù)參數(shù)情況下的VPRS算法,時間復(fù)雜度最低。因此,BRS的算法相對VPRS放松了對參數(shù)的要求,并在很大程度上提高模型的性能,對肺部腫瘤的CAD具有應(yīng)用價值。

        猜你喜歡
        高維約簡粗糙集
        基于Pawlak粗糙集模型的集合運算關(guān)系
        基于二進制鏈表的粗糙集屬性約簡
        一種改進的GP-CLIQUE自適應(yīng)高維子空間聚類算法
        實值多變量維數(shù)約簡:綜述
        基于模糊貼近度的屬性約簡
        基于加權(quán)自學(xué)習(xí)散列的高維數(shù)據(jù)最近鄰查詢算法
        多?;植诩再|(zhì)的幾個充分條件
        雙論域粗糙集在故障診斷中的應(yīng)用
        一般非齊次非線性擴散方程的等價變換和高維不變子空間
        兩個域上的覆蓋變精度粗糙集模型
        久久久久波多野结衣高潮| 成人性生交大片免费看激情玛丽莎| av一区二区三区观看| 一区二区三区视频在线观看免费| 97se亚洲国产综合自在线观看 | 日本xxxx色视频在线播放| 国产成人乱色伦区小说| 台湾佬中文偷拍亚洲综合| 亚洲男同免费视频网站| 精品国产精品三级精品av网址| 痉挛高潮喷水av无码免费| 久久精品无码一区二区三区不| 人妻丝袜中文字幕久久| 亚洲精品一区二区三区四区久久| 久久久久久自慰出白浆| 中文字幕一区二区三区乱码| 亚洲综合五月天欧美| 国产精品三级国产精品高| av网站在线观看亚洲国产| 久久综合亚洲色一区二区三区| 四川丰满少妇被弄到高潮 | 偷拍韩国美女洗澡一区二区三区| 亚洲av中文无码乱人伦在线视色| 久久精品人人做人人综合| 欧美xxxx新一区二区三区| 美女偷拍一区二区三区| 最好看的亚洲中文字幕| 狠狠色综合7777久夜色撩人ⅰ| 色窝窝免费播放视频在线| 精品人妻av一区二区三区不卡| 国产69精品麻豆久久| 极品少妇hdxx麻豆hdxx| 久久久久国产精品熟女影院| 日本嗯啊在线观看| 精品人妻一区二区三区狼人| 精品人妻大屁股白浆无码| 久无码久无码av无码| 国产女主播强伦视频网站| 日本成人午夜一区二区三区 | 在线日本国产成人免费精品| 人妻少妇乱子伦无码视频专区|