亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種改進的魯棒模糊孿生支持向量機算法

        2023-01-13 11:57:48周裕群張德生
        計算機工程與應(yīng)用 2023年1期
        關(guān)鍵詞:超平面線性損失

        周裕群,張德生,張 曉

        西安理工大學(xué) 理學(xué)院,西安 710054

        支持向量機(support vector machine,SVM)是由Cortes等人[1]提出的一種有效的機器學(xué)習(xí)算法,該算法被廣泛應(yīng)用于模式識別和數(shù)據(jù)分割等領(lǐng)域。SVM算法通過引入核函數(shù),將非線性分類問題轉(zhuǎn)化為某個高維特征空間中的線性分類問題,進而解決了小樣本、非線性和維數(shù)災(zāi)難等問題。但是,SVM算法也存在以下幾點不足:SVM算法在構(gòu)建模型時,采用的是鉸鏈損失函數(shù),導(dǎo)致SVM算法對訓(xùn)練集中的噪聲比較敏感;SVM算法在求解對偶問題時,計算成本較高;SVM算法使用平行平面來區(qū)分兩類樣本,而平行平面不一定符合數(shù)據(jù)的分布趨勢。

        針對SVM算法存在的不足,學(xué)者們提出了以下改進方法:文獻[2]提出了廣義特征值近端支持向量機算法(generalized eigenvalue proximal support vector machine,GEPSVM),該算法通過求解兩個廣義特征值問題來構(gòu)建兩個非平行超平面?;贕EPSVM算法的思想,文獻[3]提出了孿生支持向量機算法(TWSVM),在運行速度上,TWSVM算法比SVM算法大約快4倍。但是,GEPSVM算法和TWSVM算法都沒有考慮不同輸入樣本點對最優(yōu)超平面的影響,為此,文獻[4]提出了模糊支持向量機算法(fuzzy support vector machine,F(xiàn)SVM),文獻[5]將TWSVM算法和FSVM算法結(jié)合,提出了模糊孿生支持向量機算法(fuzzy twin support vector machine,F(xiàn)TSVM),F(xiàn)TSVM算法在一定程度上降低了異常值對分類性能的影響。為了實現(xiàn)結(jié)構(gòu)風(fēng)險最小化,文獻[6]在TWSVM算法中引入正則化項,進而提出了孿生有界支持向量機算法(twin bounded support vector machine,TBSVM)。文獻[7-8]提出了基于pinball損失的支持向量機算法和孿生支持向量機算法,這兩種算法在一定程度上降低了噪聲對分類性能的影響。文獻[9]提出了大規(guī)模最小二乘孿生支持向量機算法(large-scale least squares twin SVM,LS-LSTSVM),實驗結(jié)果表明,該方法能夠有效處理大規(guī)模數(shù)據(jù)集。文獻[10]提出了一種密度加權(quán)的模糊孿生支持向量機算法,從而減小了不平衡數(shù)據(jù)的影響。文獻[11]提出了一種新的模糊孿生支持向量機算法(NFTSVM),NFTSVM算法在一定程度上提高了算法的分類性能,然而,此方法需要計算復(fù)雜的逆矩陣,使其在一些應(yīng)用上存在一定的局限性。文獻[12]通過對TWSVM算法進行改進,提出了模糊簡約孿生支持向量機算法,從而避免了逆矩陣運算。為了降低模型對樣本集幾何形狀的依賴,文獻[13]提出了基于類內(nèi)超平面的模糊支持向量機算法。文獻[14]將文獻[13]應(yīng)用到語音情感識別問題,提出了基于類內(nèi)超平面距離度量模糊支持向量機的語音情感識別。

        通過對FTSVM算法的改進,F(xiàn)TSVM算法已經(jīng)成為了一種較為常用的分類算法,然而,F(xiàn)TSVM算法仍存在以下不足:(1)在FTSVM算法中,單純基于樣本點到類中心的距離確定的模糊隸屬度函數(shù)不能有效區(qū)分異常值和有效樣本點;(2)FTSVM算法只考慮了經(jīng)驗風(fēng)險最小化,容易過擬合;(3)基于鉸鏈損失的FTSVM算法考慮的是類間的最短距離,使得算法對噪聲仍然敏感。

        為了進一步提高FTSVM算法的分類性能,本文提出了一種改進的魯棒模糊孿生支持向量機算法(IRFTSVM)。首先,確定了一種新的混合隸屬度函數(shù),降低了噪聲或異常值對最優(yōu)超平面的影響;其次,對FTSVM算法的目標函數(shù)做了一些改進,并通過構(gòu)造新的拉格朗日函數(shù)的方式來避免逆矩陣運算;最后,用pinball損失函數(shù)代替鉸鏈損失函數(shù),在一定程度上達到了抗噪的效果。

        1 預(yù)備知識

        1.1 FTSVM算法

        FTSVM算法[5]的兩個非平行超平面分別為wT

        1 x+b1=0和wT2x+b2=0,其中w1,w2,b1,b2∈Rn。在非線性情況下,引入核矩陣K(xT,CT)=φ(xT)·φ(CT),其中CT=[A·B]T,K(x,y)為任意的核函數(shù)。同時,在取線性核函數(shù)時,令w1=CTu1,w2=CTu2,則FTSVM算法的優(yōu)化問題為:

        式(1)和式(2)的對偶問題分別如下:

        其中H=[K(A,CT)e1],G=[K(B,CT)e2],α和β是由拉格朗日乘子所構(gòu)成的列向量,m1和m2分別表示正類樣本數(shù)和負類樣本數(shù)。通過求解對偶問題(3)和(4),從而確定非平行超平面。

        1.2 損失函數(shù)

        FTSVM算法主要通過使用鉸鏈損失函數(shù)來構(gòu)建模型,其中鉸鏈損失函數(shù)的定義[15]為:

        其中y為理想值,f(x)為預(yù)測值。

        鉸鏈損失函數(shù)考慮的是類間的最短距離,導(dǎo)致模型中存在噪聲敏感性以及數(shù)據(jù)重采樣不穩(wěn)定性等缺點。因此,學(xué)者們對不同的損失函數(shù)進行了深入研究,其中研究較為廣泛的是pinball損失函數(shù),pinball損失函數(shù)考慮的是分位數(shù)距離,在一定程度上降低了噪聲敏感性。pinball損失函數(shù)的定義如下:

        其中參數(shù)τ∈[0,1]。

        2 IRFTSVM算法

        2.1 隸屬度函數(shù)的設(shè)計

        經(jīng)典的FTSVM算法[5]的隸屬度函數(shù)的表達式如下:

        其中di+和di-分別表示正類樣本點和負類樣本點到類中心的距離,ω表示一個很小的正數(shù),r+=max{di+},r-=max{di-}。

        FTSVM算法在構(gòu)造隸屬度函數(shù)時,是通過式(7)來確定的,而該方法降低了接近超平面而遠離類中心的樣本點的影響。如圖1給出了樣本點的分類情況。

        圖1 樣本點的分類情況Fig.1 Classification of sample points

        在圖1中,用黑色線表示樣本點的分類面,圖1(a)中的樣本點A,B,C,D在分類面附近,而樣本點C和樣本點D距離類中心較遠,若依據(jù)式(7)來確定隸屬度,則會降低樣本點C和樣本點D的隸屬度。圖1(b)中的樣本點A,B,C,D,E對于分類面的作用幾乎相同,而到類中心的距離不同,從而被賦予了不同的隸屬度值,其中E點更有可能被誤判為異常值,若對于非球形分布的樣本數(shù)據(jù),誤判率會更高。基于此,文獻[13]提出了一種基于類內(nèi)超平面的隸屬度函數(shù),即將樣本點到類中心的距離替換為樣本點到類內(nèi)超平面的距離。具體表達式如下:

        其中δ是一個足夠小的正數(shù),使得qi滿足qi∈(0,1],di+和di-分別表示正類樣本點和負類樣本點到類內(nèi)超平面的距離,

        雖然基于類內(nèi)超平面的FTSVM算法減少了模型對樣本集幾何形狀的依賴。但不足的是,基于樣本點到類內(nèi)超平面的距離來確定隸屬度函數(shù)忽略了樣本的緊密程度,從而影響了分類性能。為了更加直觀地體現(xiàn)這一問題,圖2給出了兩個不同類別樣本點間的緊密度差別,并對其進行了解釋。

        圖2 樣本間緊密度的差別Fig.2 Difference of sample affinity

        在圖2(a)和圖2(b)中,假設(shè)H1和H2分別表示圖2(a)和圖2(b)中的超平面。從圖2可以發(fā)現(xiàn):樣本點x到超平面H1的距離大于樣本點x到超平面H2的距離,若單純地通過式(8)來確定隸屬度,則圖2(a)中的樣本點x的隸屬度比圖2(b)中的樣本點x的隸屬度小。但是,圖2(a)中的樣本點x到其他樣本點的距離比圖2(b)中的樣本點x到其他樣本點的距離近,即圖2(a)中的樣本點x與其附近樣本點的緊密度比圖2(b)中的樣本點x與其附近樣本點的緊密度高,圖2(a)中的樣本點x比圖2(b)中的樣本點x更有可能成為有效樣本點,則圖2(a)中的樣本點x應(yīng)被賦予更大的隸屬度才更加合理。

        因此,為了能夠更好地反映樣本點的不確定性,本文在基于類內(nèi)超平面的隸屬度函數(shù)的基礎(chǔ)上進一步引入了k近鄰隸屬度函數(shù),并對k近鄰隸屬度函數(shù)做了改進,從而構(gòu)造了一種新的混合隸屬度函數(shù)。下面對改進的k近鄰隸屬度函數(shù)和混合隸屬度函數(shù)的定義進行描述,具體如下:

        取樣本點xi以及與它距離最近的k個樣本,并將這k個樣本記為xj(j=1,2,…,k),xi與這k個樣本點的距離分別為di1,di2,…,dik。若用1/(dij+ε)表示第j個近鄰對該樣本點所產(chǎn)生的類別影響因子,則樣本緊密度ti的表達式[16]為:

        其中ε是一個足夠小的正數(shù),在線性情形下dij=‖xi-xj‖,在非線性情形下

        標準化后的ti為=ti Ti,其中Ti=max{t1,t2,…,tm},m表示總樣本數(shù),從式(9)可以看出:k近鄰只體現(xiàn)了樣本間的距離關(guān)系,并未考慮樣本點和其k個近鄰所屬類別的不同。因此,本文對k近鄰隸屬度函數(shù)進行了適當調(diào)整,具體分為以下三種情況:(1)如果樣本點與其k個近鄰樣本在同一類別,沒有混淆時,則-ti保持不變;(2)如果樣本點與其k個近鄰樣本均在不同類別時,則認為該樣本點是噪聲,將樣本點的隸屬度賦值為0;(3)如果樣本點與其k個近鄰樣本有一部分在同一類別,而其余部分存在混淆時,則應(yīng)該適當減少-ti的值。綜上,改進后的k近鄰隸屬度函數(shù)為:

        其中l(wèi)表示樣本點xi的k個近鄰中與xi不同類別的標簽個數(shù),且有0≤l≤k。

        結(jié)合式(8)和式(10),確定了一種新的混合隸屬度函數(shù),該函數(shù)的表達式為:

        新隸屬度函數(shù)不僅考慮了樣本集的幾何形狀,還分析了k個近鄰樣本點的所屬類別。由混合隸屬度函數(shù)可知:當k近鄰確定的樣本緊密度一定時,則基于類內(nèi)超平面隸屬度函數(shù)qi與隸屬度si的值成反比;當qi一定時,如果樣本緊密度越高以及混淆程度越低時,則隸屬度si的值越大。

        2.2 改進的線性IRFTSVM算法

        集合T={(xi,yi,si),i=1,2,…,m1,m1+1,m1+2,…,m1+m2},其中xi∈Rn表示輸入的特征向量,yi∈表示相應(yīng)的類標簽,隸屬度si∈[0,1]。在n維數(shù)據(jù)集中,將正類樣本用矩陣Am1×n=(x1,x2,…,xm1)T以及負類樣本用矩陣Bm2×n=(xm1+1,xm1+2,…,xm1+m2)T表示,則IRFTSVM算法的優(yōu)化問題為:

        其中ci(i=1,2,3,4)為懲罰參數(shù),ξ1和ξ2為松弛變量,e1和e2表示全為1的列向量,η1和η2為合適維度的向量,sA和sB表示正類樣本和負類樣本權(quán)重值所組成的向量。約束條件使用了pinball損失函數(shù),且參數(shù)τ∈[0,1]。

        通過拉格朗日乘子法對問題(12)和(13)求解,式(12)的拉格朗日函數(shù)如下:

        其 中α=(α1,α2,…,αm2)T, α≥0, β=(β1,β2,…,βm1)T,β≥0以及γ=(γ1,γ2,…,γm2)T, γ≥0。根據(jù)KKT條件,對式(14)中的w1,b1,η1和ξ2求偏導(dǎo)數(shù),并令其為零,得到以下等式:

        由式(15)和(16)化簡可得:

        令α-γ=μ,且γ≥0,因此,式(18)被重新寫為μ+γ(1+1 τ)=c1sAe2,將式(22)和(23)代入拉格朗日函數(shù)(14),并根據(jù)以上等式,求得式(12)的對偶問題:

        其中I表示m1階的單位矩陣,矩陣E表示所有元素全為1的m1+m2階方陣。

        通過對偶問題(24)和(25)求得拉格朗日乘子向量α、β和γ的最優(yōu)解,將其代入式(22)和(23),進一步求得w1和b1的值,即可確定非平行超平面wT1x+b1=0。按照同樣的方法,求解優(yōu)化問題(13)中的w2和b2以及對偶問題,具體表達式如下:

        其中λ-ρ=ψ,ρ≥0,其中I表示m2階的單位矩陣,矩陣E是所有元素全為1的m1+m2階方陣。

        在線性情況下,IRFTSVM算法的具體步驟如算法1所示:

        算法1線性IRFTSVM算法

        輸入:訓(xùn)練樣本集T,隸屬度函數(shù)中的參數(shù)ε,δ和k以及預(yù)測樣本點x。

        輸出:測試樣本y的類別。

        1.利用網(wǎng)格搜索法,選取懲罰參數(shù)ci(i=1,2,3,4),pinball損失參數(shù)τ;

        2.根據(jù)公式(11)計算隸屬度;

        3.根據(jù)式(24),(25),(28)和(29)求得向量(α,γ,β)和(θ,λ,ρ)的最優(yōu)解;

        4.根據(jù)式(22),(23),(26)和(27)求得原始問題w1, b1和w2, b2的解,確定非平行超平面wT1x+b1=0和wT2x+b2=0;

        5.計算新樣本點x到超平面wT1x+b1和wT2 x+b2的垂直距離,分別記為dist+1和dist-1;

        6.若dist+1>dist-1,則認為樣本點x為-1類,否則x為+1類。

        2.3 改進的非線性IRFTSVM算法

        與經(jīng)典的FTSVM算法不同的是:IRFTSVM算法不用考慮核生成的曲面,而是引入核函數(shù)K(xi,xj)=(φ(xi) · φ(xj)),直接將其運用到式(24)、(25)、(28)以及(29)中。

        對x進行相應(yīng)的變換,即X=φ(x) ,其中X∈H,H為希爾伯特空間,則訓(xùn)練樣本集T~={(Xi,yi,si) , i=1,2,…,m1,m1+1,m1+2,…,m1+m2},因此,分類超平面的優(yōu)化問題為:

        在非線性情況下,IRFTSVM算法與SVM算法的形式類似,通過使用核技巧,式(29)和(30)的對偶問題可以直接從線性情形演變而來,使得模型變得簡單易行。具體表達式為:

        每個類對應(yīng)的非平行超平面為:

        若求得拉格朗日乘子向量(α,γ,β)和(θ,λ,ρ),非平行超平面(36)和(37)即可被確定。

        在非線性情況下,IRFTSVM算法的具體步驟如算法2所示:

        算法2非線性IRFTSVM算法

        輸入:訓(xùn)練樣本集T,隸屬度函數(shù)中的參數(shù)ε,δ和k以及預(yù)測樣本點x。

        輸出:測試樣本y的類別。

        1.選擇核函數(shù)K,利用網(wǎng)格搜索法,選取懲罰參數(shù)ci(i=1,2,3,4),pinball損失參數(shù)τ以及高斯核參數(shù)σ;

        2.根據(jù)公式(11)計算隸屬度;

        3.根據(jù)式(32),(33),(34)和(35)求解(α,γ,β)和(θ,λ,ρ)的最優(yōu)解;

        4.根據(jù)式(36)和(37)構(gòu)造非平行超平面;

        5.計算新樣本點x到超平面(36)和(37)的垂直距離,分別記為dist+1和dist-1;

        6.若dist+1>dist-1,則認為樣本點x為-1類,否則x為+1類。

        2.4 IRFTSVM時間復(fù)雜度分析和算法描述

        在本節(jié)中,對FTSVM算法和IRFTSVM算法的時間復(fù)雜度進行了分析與比較。

        假設(shè)訓(xùn)練樣本的總數(shù)為m,且正類樣本數(shù)和負類樣本數(shù)相等,即約為m/2。在FTSVM算法中,F(xiàn)TSVM算法的時間復(fù)雜度[5]約為O(2×(m/2)2),即O(m3)/4;在IRFTSVM算法中,求解隸屬度所花費的時間復(fù)雜度約為O(m),IRFTSVM算法在求解對偶問題時,由于矩陣規(guī)模較大,使得時間復(fù)雜度較高,即求解兩個二次規(guī)劃問題所需要花費的時間復(fù)雜度約為O(m3)。則IRFTSVM算法的總時間復(fù)雜度約為O(m+m3),即約為O(m3),IRFTSVM算法的時間復(fù)雜度比FTSVM算法高了4倍左右。

        盡管IRFTSVM算法的時間復(fù)雜度高于FTSVM算法,但是IRFTSVM算法不需要像FTSVM算法一樣計算復(fù)雜的逆矩陣,且模擬實驗結(jié)果表明,本文算法的平均準確率均高于FTSVM算法。

        為了能夠更加直觀體現(xiàn)本文算法的思想,如圖3給出了IRKFTSVM算法的流程圖。

        圖3 IRFTSVM算法流程圖Fig.3 Flow chart of IRFTSVM algorithm

        3 仿真實驗與分析

        3.1 數(shù)據(jù)集

        選用人工數(shù)據(jù)集Ripley[17]和UCI中的12個常用數(shù)據(jù)集進行實驗。Ripley數(shù)據(jù)集包含250個訓(xùn)練樣本點,1 000個測試樣本點,特征維數(shù)為2。表1和表2列出了UCI數(shù)據(jù)集的相關(guān)信息。

        表1 UCI數(shù)據(jù)集Table 1 UCI datasets

        表2 含有不同噪聲比例的數(shù)據(jù)集Table 2 Datasets with different noise ratios

        3.2 實驗設(shè)計和參數(shù)設(shè)置

        所有實驗均在Matlab 2016a中完成,用十折交叉驗證法評估本文算法與SVM、TWSVM、FTSVM、TBSVM以及PTSVM算法的平均準確率,實驗中采用的核函數(shù)為線性核函數(shù)K(x,xi)=x·xi和高斯核函數(shù)K(x,xi)=exp(-‖x-xi‖22σ2)。

        令模糊隸屬度函數(shù)中的參數(shù)k=10,δ和ε均取值為0.05。為了簡化參數(shù)調(diào)節(jié),令c1=c2,c3=c4。采用網(wǎng)格搜索法[18]對高斯核參數(shù)σ、懲罰參數(shù)ci(i=1,2,3,4)和pinball損失函數(shù)中參數(shù)τ進行篩選,其中參數(shù)σ和ci(i=1,2,3,4)均在{2i|i=-8,-7,…,8}范圍內(nèi)確定,參數(shù)τ在{ }0.01,0.2,0.5,1.0范圍內(nèi)搜索。

        3.3 實驗結(jié)果與分析

        下面通過4個實驗來驗證IRFTSVM算法的有效性。用準確率(ACC)作為分類性能的評價標準,準確率的計算公式如下:

        其中TP、FP、TN、FN分別表示正確分類的正類樣本數(shù)、錯誤分類的正類樣本數(shù)、正確分類的負類樣本數(shù)以及錯誤分類的負類樣本數(shù)。

        3.3.1 人工數(shù)據(jù)集實驗結(jié)果及分析

        實驗1為了驗證本文算法的分類性能,在人工數(shù)據(jù)集Ripley上進行實驗。在等效條件下,如圖4和圖5展示了這6種算法在線性情形下和非線性情形下Ripley數(shù)據(jù)集上的最優(yōu)超平面。表3給出了本文算法與SVM、TWSVM、FTSVM、TBSVM以及PTSVM算法在線性核和高斯核下的平均準確率。

        表3 IRFTSVM算法與其他5種算法的平均準確率Table 3 Average accuracy of IRFTSVM and other five algorithms 單位:%

        在圖4和圖5中,SVM算法中的黑色曲線為最佳決策超平面,藍色曲線和紅色曲線分別表示正類樣本點和負類樣本點的決策邊界,而其余5種分類算法中的黑色曲線為分類線,紅色曲線和藍色曲線表示相應(yīng)算法的最佳決策超平面。則可以得出:SVM算法只有一個決策超平面,其余5種算法有兩個決策超平面,進而通過樣本點到這兩個超平面的距離來確定該樣本的類別。

        圖5 在非線性情況下6種算法的模擬結(jié)果Fig.5 Simulation results of six algorithms in nonlinear case

        從表3的結(jié)果可以看出:在線性情況下,IRFTSVM算法相對于TWSVM、TBSVM、FTSVM和PTSVM算法,它的平均準確率分別提高了0.27、0.18、0.26和0.32個百分點,而僅對于SVM算法,IRFTSVM算法的平均準確率降低了0.21個百分點;在非線性情況下,本文算法的分類性能均高于其他5種對比算法,其中相對于TWSVM算法,IRFTSVM算法的平均準確率提高了3.02個百分點,說明了本文算法在一定程度上提高了模型的泛化能力。

        3.3.2 UCI數(shù)據(jù)集實驗結(jié)果及分析

        實驗2為了驗證本文所構(gòu)造的混合隸屬度函數(shù)的有效性,將本文算法與基于樣本點到類內(nèi)超平面計算隸屬度的IRFTSVM算法(命名為IRFTSVM_H)以及式(10)計算隸屬度的IRFTSVM算法(命名為IRFTSVM_K)進行比較,運用表2中的Vote、Breast和Splice這3個數(shù)據(jù)集。圖6和圖7分別是這3種算法在線性核和高斯核下的平均準確率。

        圖6和圖7的結(jié)果表明:在線性核下,對于數(shù)據(jù)集Vote和Splice,本文提出的IRFTSVM算法的平均準確率是最高的,僅在數(shù)據(jù)集Breast不含噪聲的情況下,本文算法的平均準確率相對于IRFTSVM_H算法略有下降;在高斯核下,在Vote、Breast和Splice這3個數(shù)據(jù)集中,本文算法的平均準度率均高于其他兩種對比算法,當含噪量為10%時,表現(xiàn)結(jié)果較為明顯。說明了將基于樣本點到類內(nèi)超平面的隸屬度函數(shù)和改進的k近鄰隸屬度結(jié)合是有效的。

        圖6 3種算法在線性核下不同噪聲比例的模擬結(jié)果Fig.6 Simulation results of three algorithms with different noise ratios using linear kernel

        圖7 3種算法在高斯核下不同噪聲比例的模擬結(jié)果Fig.7 Simulation results of three algorithms with different noise ratios using Gaussian kernel

        實驗3為了驗證本文所引入的pinball損失函數(shù)在噪聲影響下的有效性,將基于鉸鏈損失函數(shù)的IRFTSVM算法(命名為Hinge-IRFTSVM)和基于pinball損失函數(shù)的IRFTSVM算法(命名為Pin-IRFTSVM)分別在不含噪聲、含5%的噪聲以及含10%的噪聲的數(shù)據(jù)集中進行測試,選取表2中的Diabetes、Liverdisorder、Haberman和Blood這4個數(shù)據(jù)集進行實驗。圖8和圖9分別是這兩種算法在線性核和高斯核下的平均準確率,其中橫坐標表示數(shù)據(jù)集,縱坐標表示在不同數(shù)據(jù)集上對應(yīng)的平均準確率。

        實驗4為了進一步驗證IRFTSVM算法的有效性,將IRFTSVM算法與SVM、TWSVM、FTSVM、TBSVM以及PTSVM算法進行對比。運用表1中的UCI數(shù)據(jù)集進行實驗,表4和表5給出了本文算法與其他5種對比算法分別在線性核和高斯核下的平均準確率。

        表4 在線性核下IRFTSVM與對比算法的平均準確率Table 4 Average accuracy of IRFTSVM and comparison algorithms with linear kernel 單位:%

        表5 在高斯核下IRFTSVM與對比算法的平均準確率Table 5 Average accuracy of IRFTSVM and comparison algorithms with Gaussian kernel 單位:%

        從圖8和圖9的結(jié)果可以看出:在線性核函數(shù)下,當含噪量為5%和10%時,基于pinball損失的IRFTSVM算法在所有數(shù)據(jù)集中的平均準確率均高于基于鉸鏈損失的IRFTSVM算法,然而,僅在不含噪聲時,pinball損失的IRFTSVM算法在數(shù)據(jù)集Diabetes中的準確率略低于基于鉸鏈損失的IRFTSVM算法;在非線性核函數(shù)下,當含噪量為5%和10%時,基于pinball損失的IRFTSVM算法在所有數(shù)據(jù)集中的平均準確率均高于基于鉸鏈損失的IRFTSVM算法,而當不含噪聲時,pinball損失的IRFTSVM算法在Diabetes和Liverdisorder兩個數(shù)據(jù)集中的準確率低于基于鉸鏈損失的IRFTSVM算法,體現(xiàn)了將鉸鏈損失函數(shù)替換為pinball損失函數(shù),可以降低算法對噪聲的敏感性。

        圖8 兩種算法在線性核下不同噪聲比例的模擬結(jié)果Fig.8 Simulation results of two algorithms with different noise ratios using linear kernel

        圖9 兩種算法在高斯核下不同噪聲比例的模擬結(jié)果Fig.9 Simulation results of two algorithms with different noise ratios using Gaussian kernel

        從表4和表5的結(jié)果可以看出:在線性核下,IRFTSVM算法在Pima、Heart、Hepatitis、Australian、German、WDBC和WPBC數(shù)據(jù)集中的分類性能最佳,而在Ionosphere數(shù)據(jù)集中,IRFTSVM算法的平均準確率相對TBSVM算法僅降低了0.06個百分點,在Sonar數(shù)據(jù)集中,IRFTSVM算法的平均準確率比SVM算法降低了0.50個百分點;在高斯核下,相對于其他5種對比算法,IRFTSVM算法在9個數(shù)據(jù)集上的平均準確率均有所提高,說明了本文所改進的算法是有效的。

        4 結(jié)束語

        針對FTSVM算法存在的一些問題,本文對其進行了改進,提出了一種改進的魯棒模糊孿生支持向量機算法(IRFTSVM)。IRFTSVM算法通過引入新的混合隸屬度函數(shù),提高了算法的分類性能,此外,構(gòu)造了與以往不同的拉格朗日函數(shù),從而避免了逆矩陣運算,而且可以直接使用核技巧將線性問題擴展到非線性問題,不需要像FTSVM算法一樣重新構(gòu)造非線性問題。實驗結(jié)果表明,IRFTSVM算法能夠較好地解決分類問題,并且在分類性能上取得了令人滿意的結(jié)果。由于IRFTSVM算法存在計算時間復(fù)雜度高以及只涉及到二分類等問題,因此,降低時間復(fù)雜度和將二分類問題擴展到多分類問題將是下一步的主要研究方向。

        猜你喜歡
        超平面線性損失
        漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
        少問一句,損失千金
        全純曲線的例外超平面
        涉及分擔(dān)超平面的正規(guī)定則
        胖胖損失了多少元
        線性回歸方程的求解與應(yīng)用
        以較低截斷重數(shù)分擔(dān)超平面的亞純映射的唯一性問題
        玉米抽穗前倒伏怎么辦?怎么減少損失?
        二階線性微分方程的解法
        一般自由碰撞的最大動能損失
        中文字幕乱码熟妇五十中出| 视频一区欧美| 日本精品视频一视频高清| 日本中文字幕av网址| 一区二区国产视频在线| 亚洲国产一区二区中文字幕| 国产黄污网站在线观看| 无码国产精品一区二区av| 青青草97国产精品免费观看| 精品国产福利久久久| 色综合久久五十路人妻| 精品久久中文字幕系列| 图片小说视频一区二区| 精品无码久久久久成人漫画| 丝袜美女污污免费观看的网站| 亚洲精品美女久久久久网站| 偷拍韩国美女洗澡一区二区三区| 久久综合狠狠综合久久综合88| av人摸人人人澡人人超碰妓女| 亚洲成色在线综合网站| 人妻系列无码专区久久五月天 | 人妻中文字幕在线网站| 99国产精品自在自在久久| 久久久久久久人妻无码中文字幕爆 | 人人澡人人妻人人爽人人蜜桃麻豆| 性生交大全免费看| 精品福利一区| 日本道免费一区日韩精品| 日韩精品国产精品亚洲毛片| 国产做无码视频在线观看| 国产成人av一区二区三区在线| 欧美国产伦久久久久久久| 性感的小蜜桃在线观看| 国产99一区二区三区四区| 99精品国产一区二区三区a片| 精品久久久久久国产| 亚洲先锋影院一区二区| 久久蜜桃一区二区三区| 激情在线一区二区三区视频| 国产人妻熟女高跟丝袜图片| 日本a天堂|