亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種新的直覺(jué)模糊最小二乘支持向量機(jī)

        2022-12-01 13:24:24周水生張文夢(mèng)

        張 丹,周水生,張文夢(mèng)

        (西安電子科技大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,陜西 西安 710126)

        支持向量機(jī)(Support Vector Machines,SVM)作為處理二分類問(wèn)題的一種重要方法,已被廣泛應(yīng)用于各個(gè)領(lǐng)域[1-4]。不同于傳統(tǒng)的支持向量機(jī),最小二乘支持向量機(jī)(Least Squares Support Vector Machines,LSSVM)是基于一組等式約束提出的,只需通過(guò)求解一個(gè)線性方程組即可得到閉式解,而不是求解一個(gè)對(duì)偶的二次規(guī)劃問(wèn)題[5],從而加快了訓(xùn)練速度。目前,LSSVM已廣泛應(yīng)用于模式識(shí)別[6]、故障診斷[7]、圖像分類[8]和偏微分方程求解[9]等領(lǐng)域。然而,LSSVM易受離群點(diǎn)和噪聲的影響。為了解決離群點(diǎn)和噪聲對(duì)LSSVM的影響,SUYKENS等[10]提出了加權(quán)最小二乘支持向量機(jī)(Weighted Least Squares Support Vector Machines,WLSSVM),通過(guò)為每個(gè)樣本點(diǎn)分配不同的權(quán)值來(lái)降低影響,提高模型的魯棒性。YANG等[11]提出了一種魯棒的最小二乘支持向量回歸機(jī)(Robust Least Squares Support Vector Machines,RLSSVM),該方法同時(shí)最小化全局模型誤差的方差和均值,實(shí)驗(yàn)表明可以有效降低噪聲對(duì)模型的影響。MA等[12]提出了一種新的魯棒最小二乘支持向量分類器(Robust Least Squares Support Vector Classifier,RLSSVC),通過(guò)最小化各類模型誤差的均值和方差來(lái)提高分類器的魯棒性。CHEN等[13]將最小二乘損失函數(shù)換成截?cái)鄵p失函數(shù),提出稀疏的魯棒最小二乘支持向量機(jī)(Sparse Robust Least Squares Support Vector Machines,SRLSSVM)降低了噪聲的影響,提高了模型的魯棒性。此外,LIN等[14]首次提出了模糊支持向量機(jī)(Fuzzy Support Vector Machines,F(xiàn)SVM),為每個(gè)樣本點(diǎn)賦予不同的隸屬度值,使不同的樣本點(diǎn)對(duì)最優(yōu)分離超平面有不同的貢獻(xiàn)。通過(guò)對(duì)離群點(diǎn)和噪聲賦予低的隸屬度,降低了離群點(diǎn)和噪聲對(duì)分離超平面的影響。對(duì)于FSVM算法,其關(guān)鍵問(wèn)題是如何設(shè)計(jì)隸屬度函數(shù)。對(duì)于隸屬度的確定,TANG[15]提出了一種新的模糊函數(shù),通過(guò)計(jì)算一類的樣本點(diǎn)到另一類樣本點(diǎn)邊界的距離,有效地區(qū)分支持向量和噪聲。BATUWITA等[16]提出基于三種距離的線性和指數(shù)模糊函數(shù),并將其用于不平衡數(shù)據(jù)的分類。LIU[17]在此基礎(chǔ)上提出了新的高斯模糊函數(shù),實(shí)驗(yàn)表明,其分類效果良好。TAO等[18]基于空間一致性原則提出了基于親和力和類概率的模糊支持向量機(jī),可以有效減小離群點(diǎn)和噪聲對(duì)模型的影響。FAN等[19]通過(guò)計(jì)算樣本的高階類概率提出了基于熵的模糊支持向量機(jī),利用樣本點(diǎn)熵的信息來(lái)確定樣本點(diǎn)的隸屬度。然而,上述模糊值的提出,均基于樣本點(diǎn)對(duì)其所在類的隸屬程度,未考慮樣本點(diǎn)與另一類的關(guān)系。

        為了更加細(xì)致地刻畫(huà)樣本點(diǎn)的不確定程度,ATANASSOV[20]提出了直覺(jué)模糊集,包含了樣本點(diǎn)的隸屬度、非隸屬度及猶豫度三方面信息。哈明虎等[21]基于直覺(jué)模糊集提出了直覺(jué)模糊支持向量機(jī),通過(guò)樣本的分布特征確定樣本的隸屬度和非隸屬度,將樣本直覺(jué)模糊化,再利用支持向量機(jī)對(duì)直覺(jué)模糊化的樣本進(jìn)行分類。在直覺(jué)模糊支持向量機(jī)中,樣本點(diǎn)對(duì)最優(yōu)分離超平面的貢獻(xiàn)由直覺(jué)模糊集的兩個(gè)參數(shù)(隸屬度和非隸屬度)給出,從而在一定程度上減少了噪聲和離群點(diǎn)的影響。HA等[22]提出了一種新的基于直覺(jué)模糊集和核函數(shù)的模糊支持向量機(jī)(Intuitionistic Fuzzy Support Vector Machines,IFSVM),對(duì)處理離群點(diǎn)和噪聲問(wèn)題表現(xiàn)優(yōu)越。REZVANI等[23]將直覺(jué)模糊數(shù)引入雙支持向量機(jī)模型,得到直覺(jué)模糊雙支持向量機(jī)。該方法根據(jù)樣本點(diǎn)的得分函數(shù)來(lái)評(píng)價(jià)樣本點(diǎn)對(duì)分離超平面的貢獻(xiàn),這種方法可以區(qū)分支持向量和噪聲,改進(jìn)了傳統(tǒng)的基于樣本點(diǎn)類中心的模糊支持向量機(jī)將支持向量賦予低的模糊值的缺點(diǎn)。上述直覺(jué)模糊數(shù)的給出方式可以很好地減少噪聲和離群值的影響,但是也有其不足之處。計(jì)算隸屬度時(shí),類中心是基于所有樣本點(diǎn)計(jì)算的,而離群點(diǎn)可能會(huì)導(dǎo)致類中心偏移;非隸屬度的計(jì)算依賴參數(shù)的選取,對(duì)于分布稀疏的樣本點(diǎn),若半徑選取不合適,則會(huì)造成計(jì)算不準(zhǔn)確。

        針對(duì)上述問(wèn)題,基于直覺(jué)模糊集,筆者提出了新的隸屬度函數(shù)和非隸屬度函數(shù)來(lái)確定樣本點(diǎn)的直覺(jué)模糊數(shù)。通過(guò)更新樣本點(diǎn)的類中心與球面減少離群點(diǎn)的影響,使得隸屬度更加準(zhǔn)確,同時(shí)采用核k近鄰方法計(jì)算非隸屬度函數(shù),避免了鄰域內(nèi)樣本點(diǎn)稀疏導(dǎo)致樣本點(diǎn)非隸屬度不準(zhǔn)確的問(wèn)題。然后根據(jù)隸屬度與非隸屬度計(jì)算得分函數(shù)來(lái)為樣本點(diǎn)分配模糊值,通過(guò)對(duì)離群點(diǎn)和噪聲賦予很低的模糊值來(lái)降低其對(duì)分類模型的影響。進(jìn)一步將提出的新的模糊值用于LSSVM模型,用來(lái)減少離群點(diǎn)和噪聲對(duì)LSSVM的影響,從而提升模型的魯棒性。

        1 相關(guān)知識(shí)

        1.1 最小二乘支持向量機(jī)

        (1)

        其中,ξi是第i個(gè)樣本的誤差,φ(xi)是一個(gè)將xi映射到高維特征空間的非線性函數(shù),C是懲罰因子。

        通過(guò)求解Karush-Kuhn-Tucker(KKT)條件可以得到如下線性方程組:

        (2)

        其中,I∈Rl×l是單位陣,e=(1,1,…,1)T是分量為1的矩陣,Y=(y1,y2,…,yl)T表示標(biāo)簽向量,Z=[φ(x1)Ty1,…,φ(xl)Tyl]T表示特征矩陣與標(biāo)簽的乘積,α=(α1,α2,…,αl)T是拉格朗日乘子。通過(guò)求解式(2)可以得到問(wèn)題的解:

        (3)

        1.2 直覺(jué)模糊支持向量機(jī)

        1.2.1 直覺(jué)模糊集

        定義1設(shè)X是一個(gè)非空集合,則稱下式為模糊集[20]:

        (4)

        定義2設(shè)χ是一個(gè)給定論域,則χ的一個(gè)直覺(jué)模糊集[20]定義為

        A={(x,μA(x),νA(x))|x∈X} ,

        (5)

        其中,μA(x)和νA(x)分別為x∈X的隸屬度函數(shù)和非隸屬度函數(shù),其中μA∶X→[0,1],νA∶X→[0,1]且有0≤μA(x)+νA(x)≤1成立。x∈X的得分函數(shù)[22]可以定義為

        (6)

        隸屬度函數(shù)體現(xiàn)了x對(duì)集合X的隸屬程度,隸屬程度越高,隸屬度越大;非隸屬度函數(shù)體現(xiàn)了x不屬于集合X的程度。在處理分類問(wèn)題時(shí),隸屬度通常指樣本點(diǎn)對(duì)其所在類的隸屬程度,體現(xiàn)了樣本點(diǎn)與所在類的關(guān)系;非隸屬度通常用樣本點(diǎn)與其他類的關(guān)系來(lái)體現(xiàn)樣本點(diǎn)不屬于其所在類的程度。得分函數(shù)利用樣本點(diǎn)的隸屬度與非隸屬度值給出了樣本點(diǎn)的分?jǐn)?shù)值,可以用來(lái)比較同一類中不同樣本點(diǎn)的隸屬程度。

        1.2.2 直覺(jué)模糊支持向量機(jī)

        (1) 隸屬度函數(shù)定義為

        (7)

        其中,δ>0為參數(shù),r+、r-和C+、C-是正負(fù)類點(diǎn)的半徑和類中心。

        (2) 非隸屬度函數(shù)衡量了樣本點(diǎn)鄰域內(nèi)異類樣本點(diǎn)與鄰域內(nèi)所有樣本點(diǎn)的關(guān)系,其定義為

        ν(xi)=(1-μ(xi))ρ(xi) ,

        (8)

        并滿足0≤μ(xi)+ν(xi)≤1,且ρ(x)定義為

        (9)

        其中,τ>0是參數(shù)。

        根據(jù)樣本點(diǎn)的隸屬度和非隸屬度函數(shù),定義其得分函數(shù)為

        (10)

        基于上述直覺(jué)模糊值的支持向量機(jī)模型為

        (11)

        其中,ξi是第i個(gè)樣本的誤差,φ(xi)是一個(gè)將xi映射到高維特征空間的非線性函數(shù),C是懲罰因子。

        在上述隸屬度的定義中,樣本點(diǎn)的類中心是基于所有樣本點(diǎn)來(lái)計(jì)算的,受離群點(diǎn)的影響,得到的類中心可能是不準(zhǔn)確的。在計(jì)算大多數(shù)樣本點(diǎn)的類中心時(shí),應(yīng)考慮離群點(diǎn)的影響。計(jì)算樣本點(diǎn)的非隸屬度時(shí),對(duì)于分布稀疏的樣本點(diǎn),若鄰域半徑τ選取過(guò)小,則會(huì)導(dǎo)致鄰域內(nèi)樣本點(diǎn)數(shù)量較少,計(jì)算得到的非隸屬度不準(zhǔn)確。

        1.3 現(xiàn)有的模糊函數(shù)及其局限性

        在已有的研究中,定義了很多經(jīng)典的模糊函數(shù),如文獻(xiàn)[16-17]中提出的3種模糊函數(shù):

        (12)

        (13)

        (14)

        對(duì)于距離也有不同的定義方式,如在文獻(xiàn)[16]中介紹了3種距離:① 樣本點(diǎn)到自己類中心的距離,記為dcen;② 樣本點(diǎn)到預(yù)估分離超平面的距離,記為dsph,預(yù)估的分離超平面是所有樣本點(diǎn)的中心;③ 樣本點(diǎn)到分離超平面的距離,記為dhyp,該距離先訓(xùn)練一次傳統(tǒng)的支持向量機(jī),再計(jì)算樣本點(diǎn)到分離超平面的距離。

        這些模糊函數(shù)的提出有一定的局限性:

        (1) 上述模糊值是基于距離給出的,但是相同距離的訓(xùn)練樣本點(diǎn)對(duì)分離超平面的貢獻(xiàn)不一定相同,因此僅基于距離提出的模糊值不能準(zhǔn)確描述訓(xùn)練樣本點(diǎn)對(duì)其所在類的隸屬度。

        (2) 基于到樣本點(diǎn)類中心的距離得到的模糊值可能是不準(zhǔn)確。樣本點(diǎn)的類中心是基于該類所有的樣本點(diǎn)計(jì)算的,受離群點(diǎn)的影響,得到的類中心不一定是準(zhǔn)確的,因此用該類中心的距離計(jì)算的模糊值也可能是不準(zhǔn)確的。在計(jì)算類中心時(shí),應(yīng)盡可能避免離群點(diǎn)的影響。

        (3) 上述模糊值的給出都是在樣本點(diǎn)的輸入空間,模糊值描述了樣本點(diǎn)在輸入空間中的數(shù)據(jù)特征,而分類時(shí)往往是在高維空間中進(jìn)行,將輸入空間中得到的模糊值用于高維空間分類是不合理的。根據(jù)空間的一致性原則,應(yīng)利用樣本點(diǎn)在高維空間中的數(shù)據(jù)特征給出模糊值,再在高維空間中進(jìn)行分類。

        由上述分析可知,已有的模糊值函數(shù)并不能很好地描述樣本點(diǎn)的分布信息。為此筆者提出一種新的直覺(jué)模糊最小二乘支持向量機(jī),結(jié)合樣本點(diǎn)隸屬度與非隸屬度信息,賦予樣本點(diǎn)更為合理的模糊值,從而提高分類準(zhǔn)確率。

        2 一種新的直覺(jué)模糊最小二乘支持向量機(jī)

        給出了樣本點(diǎn)的隸屬度函數(shù)與非隸屬度函數(shù),再根據(jù)其得分函數(shù)給出最終模糊值,并將其用于改進(jìn)LSSVM模型,得到一種新的直覺(jué)模糊最小二乘支持向量機(jī)(New Intuitionistic Fuzzy Least Squares Support Vector Machines, NIFLSSVM)。

        2.1 直覺(jué)模糊數(shù)

        為了減少離群值和噪聲對(duì)模型的影響,選擇合適的模糊函數(shù)是至關(guān)重要的?,F(xiàn)有的模糊值大多是基于樣本點(diǎn)的隸屬度函數(shù)給出的,未考慮樣本點(diǎn)的非隸屬度?;谥庇X(jué)模糊集給出了描述樣本點(diǎn)與所在類的關(guān)系隸屬度函數(shù)和樣本點(diǎn)與其他類的關(guān)系非隸屬度函數(shù),根據(jù)其得分函數(shù)得到最終直覺(jué)模糊數(shù)。此外,基于空間一致性原則,在高維空間中給出樣本點(diǎn)的直覺(jué)模糊數(shù)。

        2.1.1 隸屬度函數(shù)

        隸屬度函數(shù)通常用于衡量樣本點(diǎn)對(duì)其所在類的隸屬程度,隸屬程度越高,隸屬度的值越大。隸屬度函數(shù)的計(jì)算往往需要利用樣本點(diǎn)到其類中心的距離及其所在類的半徑。目前,對(duì)于類中心和類半徑的計(jì)算大多是基于所有樣本點(diǎn)的,得到的球面包含了所有樣本點(diǎn)。但是受離群點(diǎn)和噪聲的影響,類中心和類半徑的值可能是不準(zhǔn)確的,從而計(jì)算得到的隸屬度也可能不準(zhǔn)確。因此在計(jì)算類中心和類半徑時(shí),可以考慮大部分樣本點(diǎn)的類中心和類半徑,以減少影響。因此通過(guò)更新樣本點(diǎn)的類中心和類半徑,可以得到包含大部分樣本點(diǎn)的球面,來(lái)降低離群點(diǎn)和噪聲的影響。具體方法如下。

        首先計(jì)算高維空間中所有樣本點(diǎn)到各自類中心的距離:

        (15)

        根據(jù)文獻(xiàn)[24]中對(duì)離群值的定義,找出可能的離群點(diǎn)和噪聲,這些可能的離群點(diǎn)和噪聲滿足以下條件:

        d≥Q3+1.5Q,

        (16)

        Q=Q3-Q1,

        (17)

        其中,Q1為d0的第1位四分位數(shù),Q3為d0的第3位四分位數(shù)。

        去掉滿足式(16)和式(17)的離群點(diǎn)和噪聲,重新計(jì)算類中心和距離:

        (18)

        d±=‖φ(x)-C±‖ ,

        (19)

        此時(shí)得到的類中心是基于大多數(shù)樣本點(diǎn)的。

        然后計(jì)算隸屬度為

        (20)

        其中,r±=max(d±)為樣本點(diǎn)到類中心距離的最大值,表示正負(fù)類的半徑。

        為了體現(xiàn)更新類中心和類半徑對(duì)去除離群點(diǎn)和噪聲的作用,隨機(jī)生成一組數(shù)量為160的人工數(shù)據(jù)。首先找到正類樣本點(diǎn)的類中心和類半徑,得到包含所有樣本點(diǎn)的球面,再對(duì)類中心和類半徑進(jìn)行更新,得到包含大部分樣本點(diǎn)的球面,結(jié)果如圖1所示。圖1(a)中的類半徑是基于所有樣本點(diǎn)的,可以看出,受離群點(diǎn)的影響,初始的類半徑很大,這可能導(dǎo)致計(jì)算得到的隸屬度不準(zhǔn)確。圖1(b)中,通過(guò)計(jì)算樣本點(diǎn)到原始類中心的距離識(shí)別出離群點(diǎn),得到更新后基于大多數(shù)樣本點(diǎn)的類半徑和類中心,使得計(jì)算得到的模糊值更準(zhǔn)確。

        (a) IFSVM

        2.1.2 非隸屬度函數(shù)

        衡量樣本點(diǎn)的某個(gè)鄰域內(nèi)異類樣本點(diǎn)與鄰域內(nèi)所有樣本點(diǎn)關(guān)系的非隸屬度函數(shù),很大程度上依賴于鄰域半徑的選取。對(duì)于樣本點(diǎn)稀疏的情況,若半徑選取不當(dāng),就會(huì)造成非隸屬度不準(zhǔn)確。而核k近鄰方法不會(huì)受到樣本點(diǎn)分布稀疏的影響,能夠保證非隸屬度的準(zhǔn)確性。因此,采用核k近鄰的方法來(lái)計(jì)算樣本點(diǎn)的非隸屬度函數(shù)。具體做法如下:

        對(duì)于樣本點(diǎn)xi,先找到其在核空間中的k近鄰{xi1,xi2,…,xik},核空間中樣本點(diǎn)之間的距離計(jì)算公式為

        (21)

        計(jì)算非隸屬度函數(shù):

        ν(xi)=(1-μ(xi))ρ(xi) ,

        (22)

        采用核k近鄰方法計(jì)算樣本點(diǎn)的非隸屬度,可以避免樣本點(diǎn)分布稀疏,且非隸屬度函數(shù)鄰域因子選取不恰當(dāng)時(shí),造成樣本點(diǎn)非隸屬度的不準(zhǔn)確。在圖1所示的人工數(shù)據(jù)上,分別找出正類樣本中的邊界樣本點(diǎn)A,噪聲B以及正常樣本點(diǎn)C的鄰域與k近鄰,具體見(jiàn)圖2。

        (a) IFSVM

        根據(jù)隸屬度與非隸屬度函數(shù),得到如下直覺(jué)模糊集:

        T={(x1,y1,μ1,ν1),…,(xm,ym,μm,νm)} ,

        (23)

        其中,μi,vi分別表示樣本點(diǎn)xi的隸屬度與非隸屬度。定義其得分函數(shù)如下:

        (24)

        式(24)中將隸屬度小于非隸屬度(μi

        2.2 新的直覺(jué)模糊最小二乘支持向量機(jī)

        LSSVM模型易受離群點(diǎn)和噪聲的影響,結(jié)合模糊支持向量機(jī)的思想,通過(guò)給離群點(diǎn)和噪聲賦予更小的模糊值,可以減少離群點(diǎn)和噪聲對(duì)模型的影響。因此,筆者將提出的模糊值用于改進(jìn)LSSVM模型,得到新的直覺(jué)模糊最小二乘支持向量機(jī)(NIFLSSVM),其模型被表示為

        (25)

        其中,si為樣本點(diǎn)xi的模糊值。

        通過(guò)求解KKT條件可以得到如下線性方程組:

        (26)

        (27)

        綜上所述,把訓(xùn)練過(guò)程總結(jié)到算法1。

        算法1NIFLSSVM算法。

        輸入:訓(xùn)練樣本S={(x1,y1),…,(xm,ym)},yi={+1,-1},罰參數(shù)C,核參數(shù)δ及近鄰數(shù)k。

        輸出:w。

        ② 根據(jù)式(16)剔除樣本點(diǎn)中的離群點(diǎn),重新計(jì)算樣本點(diǎn)的類中心C±和距離d±。

        ③ 利用式(20)計(jì)算樣本點(diǎn)的隸屬度μ(xi)。

        ④ 找出樣本點(diǎn)的k個(gè)近鄰里異類樣本點(diǎn)的數(shù)量,利用式(22)計(jì)算樣本點(diǎn)的非隸屬度v(xi)。

        ⑤ 根據(jù)μ(xi)與v(xi),利用式(24)計(jì)算樣本點(diǎn)最終的模糊值s(xi)。

        ⑥ 如式(25)所示,訓(xùn)練NIFLSSVM模型得到w。

        筆者提出的NIFLSSVM算法在計(jì)算隸屬度時(shí),為了避免離群點(diǎn)的影響,采用了更新類中心和類半徑的方法,相比已有的隸屬度計(jì)算方法,用文中算法計(jì)算的隸屬度更準(zhǔn)確;計(jì)算非隸屬度時(shí),采用核k近鄰的方法,可以自適應(yīng)地選取半徑計(jì)算非隸屬度值,相比已有的非隸屬度函數(shù)的計(jì)算方法,文中算法計(jì)算得到的非隸屬度充分利用樣本點(diǎn)分布特征,防止樣本點(diǎn)被誤判為噪聲或離群點(diǎn),得到的非隸屬度值更合理。在計(jì)算模糊值時(shí),采用得分函數(shù)結(jié)合樣本點(diǎn)的隸屬度與非隸屬度給出最終的模糊值,充分利用樣本點(diǎn)信息,提高了分類模型的準(zhǔn)確性。進(jìn)而將新的直覺(jué)模糊值與LSSVM模型相結(jié)合,得到了比FSVM模型訓(xùn)練速度更快的NIFLSSVM算法。

        3 實(shí)驗(yàn)結(jié)果分析

        為了驗(yàn)證筆者提出算法的有效性,選取了1組人工數(shù)據(jù)和12個(gè)真實(shí)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)環(huán)境為Windows 7系統(tǒng),8 GB內(nèi)存,Intel(R)Core(TM)i7 4790 CPU的電腦,編程環(huán)境為Matlab R2018b。

        3.1 人工數(shù)據(jù)集

        為了直觀地檢驗(yàn)算法有效性,在人工數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。隨機(jī)生成300個(gè)人工數(shù)據(jù),選取200個(gè)數(shù)據(jù)進(jìn)行訓(xùn)練,其余數(shù)據(jù)用作測(cè)試集。對(duì)訓(xùn)練集中的正類樣本點(diǎn)采用標(biāo)簽反轉(zhuǎn)的方式隨機(jī)添加10%的噪聲,得到帶有噪聲的人工數(shù)據(jù)集。將文獻(xiàn)[23]中提出的直覺(jué)模糊數(shù)用于改進(jìn)LSSVM模型,得到IFLSSVM算法,與筆者提出的NIFLSSVM算法進(jìn)行對(duì)比。先在原始的人工數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到未加噪聲的分離超平面,再在帶有噪聲的數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到新的分離超平面,分別比較兩種算法的性能。兩種算法在訓(xùn)練集上的分類結(jié)果見(jiàn)圖3。可以看出,添加10%的噪聲后,IFLSSVM的分離超平面的偏移較大,而NIFLSSVM的分離超平面幾乎保持不變,說(shuō)明NIFLSSVM可以有效減少離群點(diǎn)和噪聲對(duì)分離超平面的影響。此外,IFLSSVM和NIFLSSVM在未添加噪聲的測(cè)試集上的準(zhǔn)確率均為98%,在添加噪聲的測(cè)試集上的準(zhǔn)確率分別為97.5%和98%。NIFLSSVM的測(cè)試準(zhǔn)確率更高,可以更好地識(shí)別出噪聲和離群點(diǎn)。

        (a) IFLSSVM

        3.2 UCI數(shù)據(jù)集

        使用UCI數(shù)據(jù)集來(lái)評(píng)估NIFLSSVM的性能。從UCI數(shù)據(jù)庫(kù)選取12個(gè)數(shù)據(jù)集,相關(guān)數(shù)據(jù)集的詳細(xì)信息見(jiàn)表1。對(duì)于所有的數(shù)據(jù)集,隨機(jī)選取80%的樣本作為訓(xùn)練集,剩余20%用于測(cè)試。所有的實(shí)驗(yàn)數(shù)據(jù)均進(jìn)行歸一化處理。實(shí)驗(yàn)分為兩部分,節(jié)3.2.1中將文中算法與現(xiàn)有的魯棒性算法進(jìn)行對(duì)比,通過(guò)添加不同比值的噪聲來(lái)對(duì)比模型的魯棒性;節(jié)3.2.2中,將筆者提出的直覺(jué)模糊數(shù)與現(xiàn)有的模糊值進(jìn)行對(duì)比,通過(guò)給LSSVM模型設(shè)置不同的模糊值來(lái)比較不同模糊值的優(yōu)劣。

        表1 數(shù)據(jù)集基本信息

        在所有實(shí)驗(yàn)中,采用高斯核函數(shù)K(x1,x2)=exp(-σ‖x1-x2‖2),選取核參數(shù)σ∈{2-5,2-4,…,24,25},懲罰參數(shù)C∈{10-5,10-4,…,104,105}。同時(shí)采用五折交叉驗(yàn)證和網(wǎng)格參數(shù)尋優(yōu)選取最優(yōu)參數(shù),所有實(shí)驗(yàn)在同一條件下重復(fù)10次求平均值統(tǒng)計(jì)結(jié)果。

        3.2.1 與魯棒性算法對(duì)比

        為了驗(yàn)證筆者提出算法的魯棒性,將NIFLSSVM與LSSVM、WLSSVM[10]、RLSSVC[12]、SRLSSVM[13]算法進(jìn)行比較。對(duì)于RLSSVC,其正則化參數(shù)λ1、λ2的取值范圍為{10-6,10-5,…,10-1,100}。在SRLSSVM中,設(shè)置平滑參數(shù)為p=104,停止標(biāo)準(zhǔn)ε=10-2,λ∈{10-1,100,…,104,105},核參數(shù)σ∈{2-8,2-7,…,23,24}。對(duì)于NIFLSSVM,參數(shù)k的取值范圍為k∈{5,7,9,11,13}。

        實(shí)驗(yàn)分為兩部分:第1部分在真實(shí)數(shù)據(jù)集上對(duì)比5種算法的測(cè)試準(zhǔn)確率,具體結(jié)果見(jiàn)表2;第2部分,為了進(jìn)一步分析算法的魯棒性,在數(shù)據(jù)集上分別添加5%、10%、15%、20%的噪聲進(jìn)行實(shí)驗(yàn),計(jì)算上述5種算法在測(cè)試集上的準(zhǔn)確率,實(shí)驗(yàn)結(jié)果見(jiàn)圖4。

        表2 在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果對(duì)比 %

        從表2可以看出,在大部分?jǐn)?shù)據(jù)集上,WLSSVM、SRLSSVM、RLSSVC及NIFLSSVM算法的分類結(jié)果要優(yōu)于LSSVM。同時(shí)相比于WLSSVM、SRLSSVM和RLSSVC,NIFLSSVM算法在大部分?jǐn)?shù)據(jù)集上分類性能更好。就平均精度而言,NIFLSSVM要優(yōu)于其余算法。實(shí)驗(yàn)結(jié)果表明,筆者提出的NIFLSSVM算法,通過(guò)給離群點(diǎn)和噪聲賦予低的模糊值,可以有效減少離群值和噪聲的影響,進(jìn)而提高分類準(zhǔn)確率。

        由圖4可以看出,隨著噪聲所占比值的增大,所有算法的性能均有所下降。SRLSSVM算法在大部分?jǐn)?shù)據(jù)集上,隨著噪聲占比的增大,準(zhǔn)確率變化不大,說(shuō)明該算法更穩(wěn)定,但其在數(shù)據(jù)集上整體的分類效果不佳。RLSSVC和WLSSVM算法隨著噪聲比值增加,準(zhǔn)確率下降的趨勢(shì)明顯。在Sonar數(shù)據(jù)集上,RLSSVC的分類結(jié)果比LSSVM、WLSSVM及SRLSSVM更好,與NIFLSSVM相差不大。而NIFLSSVM在Tictactoe及Satimage兩個(gè)數(shù)據(jù)集上分類性能一般,在其余數(shù)據(jù)集上測(cè)試準(zhǔn)確率則要優(yōu)于其余算法。實(shí)驗(yàn)表明,NIFLSSVM在添加了不同比值噪聲的數(shù)據(jù)集上表現(xiàn)良好,可以有效減少離群點(diǎn)和噪聲的影響。

        圖4 真實(shí)數(shù)據(jù)集上添加不同比值噪聲的實(shí)驗(yàn)結(jié)果對(duì)比

        3.2.2 與模糊支持向量機(jī)算法對(duì)比

        將筆者所提模糊值與已有的模糊值進(jìn)行比較。將文獻(xiàn)[23]中提出的直覺(jué)模糊數(shù)結(jié)合LSSVM模型,得到IFLSSVM算法。將文獻(xiàn)[17]中提出的模糊函數(shù)用于LSSVM模型,得到FLSSVM算法。在如表1所述的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),驗(yàn)證算法的有效性。分別對(duì)比FLSSVM,IFLSSVM與NIFLSSVM的測(cè)試準(zhǔn)確率與訓(xùn)練時(shí)間,實(shí)驗(yàn)結(jié)果見(jiàn)表3。

        表3 與模糊支持向量機(jī)算法對(duì)比的實(shí)驗(yàn)結(jié)果

        從表3可以看到,NIFLSSVM算法的分類結(jié)果要優(yōu)于FLSSVM和IFLSSVM算法,而IFLSSVM在大部分?jǐn)?shù)據(jù)集上的分類效果要優(yōu)于FLSSVM。這是因?yàn)橹庇X(jué)模糊數(shù)既考慮了樣本點(diǎn)對(duì)其所在類的隸屬度,又考慮了樣本點(diǎn)的非隸屬度,得到的模糊值更為準(zhǔn)確。而筆者提出的直覺(jué)模糊數(shù),可以得到更為準(zhǔn)確的隸屬度與非隸屬度,進(jìn)而可以更加準(zhǔn)確地識(shí)別出離群點(diǎn)和噪聲。就訓(xùn)練時(shí)間而言,F(xiàn)LSSVM訓(xùn)練時(shí)間更長(zhǎng),這是因?yàn)镕LSSVM需要提前訓(xùn)練一次LSSVM。而相比于IFLSSVM,NIFLSSVM訓(xùn)練時(shí)間稍長(zhǎng),這是因?yàn)镹IFLSSVM需要更新類中心。

        3.2.3k值對(duì)性能的影響

        為了研究k值對(duì)NIFLSSVM算法分類性能的影響,在表1所述的12個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),研究當(dāng)k取不同值時(shí)測(cè)試準(zhǔn)確率的變化。設(shè)置k的取值范圍為k∈{5,7,9,11,13},其余參數(shù)設(shè)置為由交叉驗(yàn)證得到的最優(yōu)參數(shù),實(shí)驗(yàn)結(jié)果見(jiàn)圖5。

        從圖5可以看出,k值的變化對(duì)大部分?jǐn)?shù)據(jù)集的測(cè)試準(zhǔn)確率影響不大,主要原因是用k值計(jì)算樣本點(diǎn)的非隸屬度時(shí),對(duì)正常樣本點(diǎn)而言,非隸屬度值很小或者為0,因此在最后計(jì)算模糊值時(shí)由隸屬度起主導(dǎo)作用;對(duì)于噪聲點(diǎn),計(jì)算出的非隸屬度大于隸屬度,模糊值會(huì)被賦為0。由于非隸屬度對(duì)樣本點(diǎn)模糊值的影響較小,因此k值對(duì)最終的測(cè)試準(zhǔn)確率影響較小。但是k值對(duì)于Haberman數(shù)據(jù)集的影響較大,這可能是數(shù)據(jù)集的數(shù)據(jù)分布導(dǎo)致的。此外還可以看出,大部分?jǐn)?shù)據(jù)集在k=7時(shí),測(cè)試準(zhǔn)確率較高。

        圖5 測(cè)試準(zhǔn)確率隨k值變化結(jié)果圖

        4 結(jié)束語(yǔ)

        筆者提出了一種新的直覺(jué)模糊最小二乘支持向量機(jī)(NIFLSSVM),充分利用樣本點(diǎn)的隸屬度與非隸屬度信息為其分配直覺(jué)模糊數(shù),通過(guò)對(duì)離群點(diǎn)和噪聲分配低的模糊值來(lái)降低其對(duì)分類模型的影響,提高模型的魯棒性。在人工數(shù)據(jù)集和UCI數(shù)據(jù)集上的實(shí)驗(yàn)表明,NIFLSSVM相比于其他魯棒性算法有更好的性能,與不同的模糊值相比,筆者提出的直覺(jué)模糊數(shù)表現(xiàn)更好。但是在計(jì)算直覺(jué)模糊數(shù)時(shí),耗時(shí)較長(zhǎng),需要改進(jìn)。

        国产欧美日韩专区| 美国少妇性xxxx另类| 国产亚洲欧美精品久久久| 欧美丰满熟妇bbbbbb百度| 特一级熟女毛片免费观看| 国产91极品身材白皙| 国产精品h片在线播放| 亚洲av无码一区二区三区性色| 国产一区二区三区爆白浆| 在线观看一区二区三区视频| 国产在线第一区二区三区| 欧美亚洲国产片在线播放| 国产在线不卡免费播放| 亚洲一区域二区域三区域四| 亚洲 日韩 激情 无码 中出| 精品亚洲成a人在线观看青青| 98国产精品永久在线观看| 少妇太爽高潮在线播放| 色婷婷五月综合激情中文字幕| 国产福利姬喷水福利在线观看| 欧美日韩高清一本大道免费| 丰满少妇被爽的高潮喷水呻吟| 日本又色又爽又黄的a片18禁| 毛茸茸性xxxx毛茸茸毛茸茸| 人妻少妇av中文字幕乱码免费| 两人前一后地插着她丰满| 97精品超碰一区二区三区| 午夜毛片午夜女人喷潮视频| 国产视频一区二区三区在线看| 综合亚洲伊人午夜网| 亚洲欧美另类激情综合区| 亚洲成AV人久久| 亚洲av迷人一区二区三区| 久激情内射婷内射蜜桃| 亚洲VA不卡一区| 青青久久精品一本一区人人| 久久久久亚洲av无码专区喷水| 久久久精品久久波多野结衣av| 少妇久久高潮不断免费视频| 一本到在线观看视频| 久久日本三级韩国三级|