亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于FSVM算法的TCD醫(yī)療數(shù)據(jù)分類

        2018-10-22 11:51:12王志遠(yuǎn)吳成浩張亞峰
        關(guān)鍵詞:分類

        王志遠(yuǎn),吳成浩,王 正,張亞峰,王 佳

        (北京送變電有限公司,北京 102401)

        0 引言

        經(jīng)顱多普勒超聲(TCD)是一種無創(chuàng)性檢查腦血管疾病的方法,廣泛用于早期篩查和診斷腦卒中患者的顱內(nèi)動(dòng)脈疾病[1]。通過對(duì)TCD數(shù)據(jù)的研究和分析,可以有效幫助臨床醫(yī)生診斷疾病,提高診斷質(zhì)量和效率。支持向量機(jī)(Support Vector Machine,SVM)是一種基于統(tǒng)計(jì)理論的機(jī)器學(xué)習(xí)方法。它具有很好的泛化能力,在面對(duì)非線性、小樣本和高維數(shù)據(jù)時(shí)具有很好的實(shí)用性。在這種情況下,它表現(xiàn)出良好的分類效果,被廣泛用于各種醫(yī)療數(shù)據(jù)的處理。然而,SVM的固有機(jī)制決定了它對(duì)訓(xùn)練樣本的噪聲點(diǎn)特別敏感。這些噪聲和異常都會(huì)導(dǎo)致SVM的分類不佳。同時(shí),大部分TCD醫(yī)學(xué)數(shù)據(jù)在分類過程中都是正面和負(fù)面的。在不平衡的情況下,少數(shù)類(正類)通常包含大量的信息,但支持向量機(jī)對(duì)少數(shù)類的識(shí)別較差,導(dǎo)致分類性能差。其次支持向量機(jī)對(duì)噪聲和孤立點(diǎn)敏感的特性,也大大影響最終的分類結(jié)果。

        針對(duì)以上問題,文獻(xiàn)[2]首先提出用模糊支持向量機(jī)(Fuzzy Support Vector Machine,F(xiàn)SVM)為訓(xùn)練樣本提供不同的權(quán)重。文獻(xiàn)[3]根據(jù)正負(fù)樣本數(shù)目的比值來對(duì)懲罰因子進(jìn)行設(shè)置,有效解決了樣本分布不均勻的問題。文獻(xiàn)[4]設(shè)置參數(shù),動(dòng)態(tài)調(diào)整選取訓(xùn)練樣本的范圍,同時(shí)對(duì)樣本進(jìn)行預(yù)處理,有效地避免了孤立點(diǎn)對(duì)最優(yōu)的分類超平面所造成的影響。文獻(xiàn)[5]提出了一種基于不同懲罰因子的方法(Different Error Costs,DEC),該算法以正負(fù)樣本數(shù)目的比值作為平衡因子,并據(jù)此調(diào)整數(shù)據(jù)集的不平衡性。這種方法沒有考慮到樣本點(diǎn)周圍的疏密性對(duì)分類超平面的影響。文獻(xiàn)[6]提出了一個(gè)雙邊加權(quán)模糊支持向量機(jī),并應(yīng)用到信用評(píng)分領(lǐng)域。文獻(xiàn)[7]通過預(yù)選有效候選支持向量縮減訓(xùn)練樣本集規(guī)模,提高訓(xùn)練效率。文獻(xiàn)[8]提出了模糊支持向量機(jī)模式分類改進(jìn)算法并用于動(dòng)脈硬化病分類。本文提出一種新的FSVM算法,考慮到每個(gè)樣本鄰近區(qū)域的樣本分布狀況以及樣本集的不平衡程度,設(shè)定控制值靈活的控制樣本集的范圍,減弱野值點(diǎn)的影響并有效突出支持向量的作用,提高了識(shí)別準(zhǔn)確率。

        1 模糊支持向量機(jī)

        s.t.yi[w·φ(xi)+b]-1+ξi≥0,

        ξi≥0,i=1,2,3,…,n

        (1)

        式中C+,C-為常數(shù),分別代表正負(fù)類樣本的懲罰因子。為求解式(1),通過拉格朗日函數(shù),得出其對(duì)偶規(guī)劃為:

        maxw(α)=

        (2)

        約束條件為:

        (3)

        式(2)中k(xi,xj)=φ(xi)φ(xi)T為核函數(shù)。傳統(tǒng)支持向量機(jī)分類方法如圖1所示,模糊支持向量機(jī)相比于傳統(tǒng)SVM的優(yōu)勢(shì)在于能夠根據(jù)樣本點(diǎn)對(duì)分類超平面貢獻(xiàn)程度給樣本賦予不同權(quán)重,實(shí)現(xiàn)分類超平面的優(yōu)化。

        圖1 SVM分類表示圖

        2 面向TCD醫(yī)療數(shù)據(jù)集的FSVM隸屬度設(shè)計(jì)

        2.1 傳統(tǒng)隸屬度函數(shù)設(shè)計(jì)方法

        傳統(tǒng)的隸屬函數(shù)旨在減少異常值和噪聲點(diǎn)對(duì)最優(yōu)分類器超平面的影響,它們中的大多數(shù)都是根據(jù)樣本到類內(nèi)中心的距離來設(shè)計(jì)的?;镜脑O(shè)計(jì)思想是根據(jù)樣本到類中心距離的遠(yuǎn)近來進(jìn)行權(quán)值賦予。隨著距離的增加,賦予的權(quán)重值變小,這種對(duì)樣本賦予權(quán)重的方法是不準(zhǔn)確的,因?yàn)樗雎粤诉h(yuǎn)離類中心的支持向量的影響,如圖2所示,支持向量(圖中粗體部分)由于距類別中心的距離較遠(yuǎn)而被賦予較小的權(quán)重,使得分類超平面偏離最優(yōu)超平面,并且由于距類內(nèi)中心的距離不同,這些對(duì)分類超平面貢獻(xiàn)一樣的支持向量卻被賦予了不一樣的權(quán)重,所以傳統(tǒng)的隸屬函數(shù)設(shè)計(jì)有其不足之處。

        圖2 根據(jù)樣本到類中心的距離進(jìn)行隸屬度函數(shù)設(shè)計(jì)

        2.2 改進(jìn)的模糊隸屬度函數(shù)設(shè)計(jì)方法

        首先對(duì)支持向量進(jìn)行預(yù)選,根據(jù)決策中起決定性作用的支持向量通常位于類邊界的原則,相對(duì)于同類樣本,其距離類中心是相對(duì)比較遠(yuǎn)的。其次通過對(duì)過兩類中心的且與兩類類中心連線垂直的平面做平移,平移距離為本類樣本點(diǎn)到類中心的最遠(yuǎn)距離,也就是最大半徑值,設(shè)置靈活控制因子進(jìn)行調(diào)整,排除野值和噪聲點(diǎn),最后達(dá)到有效對(duì)樣本權(quán)值實(shí)現(xiàn)精確賦予優(yōu)化分類超平面的作用。

        記正負(fù)類訓(xùn)練樣本類中心分別為c1、c2。以w=c1-c2為法向量,分別求解過c1、c2的兩個(gè)類內(nèi)超平面:

        (4)

        (5)

        此時(shí),正負(fù)類中樣本點(diǎn)到另一類類內(nèi)超平面距離為:

        (6)

        正負(fù)類中樣本點(diǎn)到平移過后的類內(nèi)超平面距離:

        (7)

        計(jì)算兩類類中心的距離:

        (8)

        基于樣本到過樣本類中心超平面隸屬度函數(shù)計(jì)算公式為:

        (9)

        (10)

        圖3 隸屬度函數(shù)設(shè)計(jì)方法示意圖

        由以上分析可以看出,本文所提出的模糊隸屬度函數(shù)設(shè)計(jì)方法具有如下優(yōu)勢(shì):

        (1)通過靈活設(shè)置半徑控制因子可將樣本進(jìn)行預(yù)處理,優(yōu)化樣本集,給噪聲點(diǎn)賦予較小的隸屬度值,使其不影響分類結(jié)果。

        (2)將正類樣本點(diǎn)到過平移后的負(fù)類中心超平面的距離bi+與T值進(jìn)行比較,可以將實(shí)線圓以內(nèi)的樣本點(diǎn)分為兩部分,能夠?qū)γ總€(gè)樣本點(diǎn)進(jìn)行精確賦值,使得支持向量被賦予更大的權(quán)值,減弱非支持向量的作用,突出支持向量對(duì)分類超平面的貢獻(xiàn)。

        (3)通過求樣本到過類中心超平面的距離對(duì)其進(jìn)行權(quán)值賦予的方式大大解決了傳統(tǒng)樣本到類中心距離設(shè)計(jì)方法導(dǎo)致的樣本賦值不準(zhǔn)確的問題。

        3 實(shí)驗(yàn)與結(jié)果分析

        3.1 評(píng)價(jià)指標(biāo)

        對(duì)于非平衡情感數(shù)據(jù)集,本文采用不平衡數(shù)據(jù)學(xué)習(xí)中的Se、Sp、Gm來評(píng)價(jià)分類效果[10],其定義為:

        (11)

        其中,TP、FN、TN、FP分別代表分類正確的正樣本、分類錯(cuò)誤的負(fù)類樣本、分類正確的負(fù)類樣本以及分類錯(cuò)誤的正類樣本的個(gè)數(shù),Se、Sp分別代表分類器正確預(yù)測(cè)正負(fù)類樣本的比率,但很多時(shí)候具有高Se的分類器不一定有高的Sp,故引入幾何均值Gm來評(píng)價(jià)分類器性能,Gm越大,分類效果越好。

        3.2 TCD數(shù)據(jù)集實(shí)驗(yàn)

        本實(shí)驗(yàn)運(yùn)行在單機(jī)Windows 7系統(tǒng)上,機(jī)器配置為:Intel(R) Core(TM) i5-3570CPU @ 3.40 GHz。算法采用MATLAB軟件進(jìn)行測(cè)試。先將數(shù)據(jù)做歸一化處理,然后選擇2/3的數(shù)據(jù)作為訓(xùn)練樣本,剩下的1/3數(shù)據(jù)用作測(cè)試樣本。

        本文采用高斯徑向基核函數(shù)作為分類器核函數(shù),并將本文隸屬度設(shè)計(jì)方法RFSVM與文獻(xiàn)[7]中的OFSVM算法以及文獻(xiàn)[8]中ZFSVM隸屬度設(shè)計(jì)方法做比較,將其應(yīng)用于TCD醫(yī)療數(shù)據(jù)。收集和整理1 572例來自人民醫(yī)院的經(jīng)顱多普勒超聲數(shù)據(jù),其中包括1 226 例正常人,91例斑塊患者以及255例狹窄患者,很顯然患者數(shù)據(jù)與正常人數(shù)據(jù)之間存在著不平衡關(guān)系,其原始數(shù)據(jù)波形如圖4~圖6所示。

        圖4 正常人TCD信號(hào)

        圖5 斑塊患者TCD信號(hào)

        圖6 狹窄患者TCD信號(hào)

        通過與醫(yī)學(xué)專家的磋商,在左側(cè)頸內(nèi)動(dòng)脈、右側(cè)頸內(nèi)動(dòng)脈、左側(cè)椎動(dòng)脈和右側(cè)椎動(dòng)脈4個(gè)部位采樣以獲得PSV(最大收縮速度)、EDV(舒張末期流速)、RI(阻力指數(shù))、深淺程度和年齡情況等18個(gè)特征值,然后歸一化提取特征值。將斑塊和狹窄患者數(shù)據(jù)作為正類樣本,正常數(shù)據(jù)被認(rèn)為是負(fù)類樣本。分別比較本文隸屬度設(shè)計(jì)方法RFSVM、文獻(xiàn)[7]中的OFSVM算法以及文獻(xiàn)[8]中ZFSVM隸屬度設(shè)計(jì)方法的Gm值。

        根據(jù)文獻(xiàn)[5]的結(jié)果,當(dāng)C-/C+的值等于n+/n-時(shí)(n+、n-分別表示正負(fù)樣本的個(gè)數(shù)),DEC算法效果最優(yōu),文中將正類懲罰因子C+設(shè)置為C,負(fù)類懲罰因子C-設(shè)置為C×n+/n-。

        表1給出了對(duì)狹窄患者與正常人、斑塊患者與正常人做分類的實(shí)驗(yàn)結(jié)果比較。

        表1 三種算法的TCD數(shù)據(jù)集比較

        為能更加直觀地反映本文算法與另外兩類算法的對(duì)比結(jié)果,將表1顯示為圖表形式,如圖7和圖8所示。

        圖7 狹窄與正常人分類比較結(jié)果

        圖8 斑塊與正常人分類比較結(jié)果

        從圖7和圖8中可以看出,本文提出的RFSVM算法在對(duì)TCD醫(yī)療數(shù)據(jù)做分類時(shí)具有較好的性能,特別是在改善正類(少類樣本)識(shí)別結(jié)果方面。當(dāng)不平衡程度比為4.8時(shí),相比較ZFSVM算法和OFSVM算法,本文算法對(duì)少類樣本的識(shí)別結(jié)果分別提升了11.27%和5.48%,整體性能Gm值提升了4.82%和2.57%。隨著不平衡率的增加,當(dāng)不平衡程度比為13.47時(shí),相比較ZFSVM算法和OFSVM算法,其對(duì)少類樣本的識(shí)別結(jié)果分別提升了7.25%和2.63%,整體性能Gm值分別提升了3.58%和0.5%。

        4 結(jié)束語

        為解決傳統(tǒng)模糊支持向量機(jī)存在分類敏感和對(duì)支持向量賦予隸屬度值不夠精確等問題,本文提出了一種改進(jìn)的模糊支持向量機(jī)算法,通過靈活設(shè)置半徑控制因子優(yōu)化訓(xùn)練樣本范圍,預(yù)選支持向量,將正類樣本點(diǎn)到過平移后的負(fù)類中心超平面的距離和正負(fù)樣本類中心距離值進(jìn)行比較,將實(shí)線圓以內(nèi)的樣本點(diǎn)分為兩部分,并對(duì)每一部分樣本點(diǎn)精確賦值,同時(shí)剔除野值和噪聲點(diǎn),使得支持向量被賦予更大的權(quán)值,突出其對(duì)分類超平面的貢獻(xiàn)。實(shí)驗(yàn)表明,本文提出的RFSVM算法在對(duì)TCD醫(yī)療數(shù)據(jù)的識(shí)別性能上有著顯著的提高。但本文方法需要人工設(shè)置半徑控制因子參數(shù),設(shè)置參數(shù)時(shí)可能會(huì)把部分有效樣本也剔除出去。下一步的工作是更加系統(tǒng)地研究參數(shù)與隸屬度函數(shù)的關(guān)系,找到更為便捷的參數(shù)設(shè)置方法。

        猜你喜歡
        分類
        2021年本刊分類總目錄
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        星星的分類
        我給資源分分類
        垃圾分類,你準(zhǔn)備好了嗎
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        按需分類
        教你一招:數(shù)的分類
        国产系列丝袜熟女精品视频| 男人女人做爽爽18禁网站| 无码不卡av东京热毛片| 亚洲无毛片| 精品日本韩国一区二区三区| 风韵人妻丰满熟妇老熟| 亚洲一区二区三区ay| 精品国产一区二区三区18p| 无码av一区二区大桥久未| 国产欧美日产久久| 国产美女久久久亚洲综合| 中文字幕一区在线直播| 18禁无遮拦无码国产在线播放| 爽妇网国产精品| 女同国产日韩精品在线| av影片在线免费观看| 中国农村妇女hdxxxx| 99国产精品丝袜久久久久| 亚洲国产中文字幕九色| 亚洲国产精品无码久久一线| 国产99久久久久久免费看| av少妇偷窃癖在线观看| 日韩有码中文字幕在线视频| 婷婷四虎东京热无码群交双飞视频 | 色视频不卡一区二区三区| 亚洲av国产av综合av卡| 久久99精品国产99久久| 成人国产在线播放自拍| 日本一区二区三区亚洲| 欧美性猛交xxxx富婆| 97色偷偷色噜噜狠狠爱网站97| 白嫩少妇在线喷水18禁| 美女扒开屁股让男人桶| 亚洲综合无码一区二区三区| 亚洲国产免费公开在线视频| 亚洲97成人在线视频| 亚洲欧洲精品无码av| 久久亚洲伊人| 蜜桃久久综合一区二区| 亚洲精品无码高潮喷水a片软| 国产美女白浆|