亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Gauss誘導核模糊c均值聚類算法

        2017-08-12 12:22:05文傳軍詹永照
        計算機應用與軟件 2017年8期
        關鍵詞:方法

        文傳軍 詹永照

        1(常州工學院數(shù)理與化工學院 江蘇 常州 213002) 2(江蘇大學計算機科學與通信工程學院 江蘇 鎮(zhèn)江 212013)

        ?

        Gauss誘導核模糊c均值聚類算法

        文傳軍1詹永照2

        1(常州工學院數(shù)理與化工學院 江蘇 常州 213002)2(江蘇大學計算機科學與通信工程學院 江蘇 鎮(zhèn)江 212013)

        針對核模糊聚類算法優(yōu)異的非線性表達能力,提出一種Gauss誘導核模糊c均值聚類算法(GIKFCMs)。首先,基于核目標函數(shù)和梯度法,得到特征空間聚類中心表達式,并通過內積運算得到聚類中心與樣本的核矩陣表達式。其次,取核目標函數(shù)中的核函數(shù)為Gauss核函數(shù),并利用梯度法得到輸入空間聚類中心表達式。最后將聚類中心與樣本的核矩陣代入輸入空間聚類中心表達式中,從而得到GIKFCMs核聚類中心計算方法,同時得到相應的GIKFCMs核聚類算法。研究GIKFCMs算法的相關性質,分析算法的收斂性和初始化約束。GIKFCMs算法克服了原有核聚類算法在收斂性與初始化約束方面的缺陷。通過仿真實驗驗證了該算法的有效性。

        核方法 模糊聚類 非線性映射 核聚類中心 算法等價性證明

        0 引 言

        自核方法被成功地應用于分類器支持向量機(SVM)[1]以來,即受到機器學習和模式分類領域研究者的廣泛關注和研究,并進一步將其推廣應用到特征提取[2]、模糊聚類[3]等領域。

        核方法將輸入空間的非線性關系通過非線性映射轉換為高維特征空間的線性關系,增大了模式間的差異性刻畫。且利用核函數(shù)表示高維特征空間中的內積運算,無需明確知道具體的非線性映射形式,克服了機器學習的維數(shù)災難問題,所以在模糊聚類領域有著廣泛而成功的應用。

        由于核方法利用核函數(shù)表達特征空間中的內積運算,且特征空間中的空間距離可轉換為內積運算形式。所以核方法適合于在特征空間中僅存在內積和距離運算的算法。聚類中心是模糊聚類算法[4]的重要組成部分,由于核方法中非線性映射的無具體形式給出,因此在模糊聚類算法中應用核方法時,一個關鍵性的問題是如何表示核聚類中心。

        自文獻[5-6]提出硬核聚類算法以來,將核方法應用于聚類算法的各種核模糊聚類算法應運而生[7-9]。通過對比研究可以發(fā)現(xiàn),這些核模糊聚類算法的根本原理都是相同的,即在各種模糊聚類算法中結合應用核方法。這些核模糊聚類算法的聚類目標函數(shù)和模糊隸屬度公式在形式上是一致的,不同之處在于核聚類中心的推導原理及表現(xiàn)形式的不同。

        本文在上述研究工作的基礎上,以核聚類中心推導原理為分類標準,歸納總結了現(xiàn)有的三種基本核模糊聚類算法。在此基礎上推導得到一種新的核聚類中心計算方法,稱所對應的核聚類算法為Guass誘導核模糊c均值聚類算法(GIKFCMs)。GIKFCMs首先基于高斯核函數(shù)和核聚類目標函數(shù),并利用梯度法分別得到特征空間和輸入空間的聚類中心表示式。然后借助核方法和內積運算得到樣本與特征空間聚類中心的核矩陣。最后通過該核矩陣將特征空間和輸入空間的聚類中心表示式結合起來,從而得到了GIKFCMs算法的核聚類中心計算方法。GIKFCMs算法的核聚類中心與一般核模糊聚類目標函數(shù)及核模糊隸屬度組成了GIKFCMs核模糊聚類算法。所提出的GIKFCMs算法克服了原有聚類算法在收斂性和初始化方面的缺陷,仿真實驗驗證了所提出算法的有效性。

        對于已知的三種核模糊聚類算法,它們的推導原理和算法實現(xiàn)機制是不同的,但目前沒有文獻研究對它們的原理和實現(xiàn)進行歸納比較分析。

        1 模糊c均值聚類算法及核模糊c均值聚類算法

        模糊c均值聚類算法(FCM)是一種典型的并成功應用的模糊聚類算法。眾多模糊或核模糊聚類算法都是在其基礎之上改進得到的,基于FCM算法可直觀簡潔地闡述核模糊聚類算法的原理和性質,核模糊c均值聚類算法(KFCM)相應結論可平行推廣到其他核模糊聚類算法。

        1.1 模糊c均值聚類(FCM)

        設X={x1,x2,…,xn}為樣本空間Rd中的一個有限數(shù)據(jù)集,xj為該樣本空間中的一個樣本向量。 FCM采用模糊劃分的方法,用值在0到1之間的隸屬度確定每個樣本屬于各組聚簇的程度,并將數(shù)據(jù)集X劃分為c個模糊聚簇。FCM最優(yōu)化準則即為最小化目標函數(shù),可表示為:

        (1)

        (2)

        其中V=[vi]c×d為聚類中心矩陣,dij=‖xj-vi‖表示xj與vi在樣本輸入空間中的距離,一般采用歐氏距離(Euclid)表示。U=[uij]c×n表示模糊隸屬度矩陣,uij(0≤uij≤1)表示樣本xj屬于第i組聚簇的隸屬程度;m(m>1)稱為模糊指標。通過梯度法得到FCM模糊隸屬度及聚類中心迭代公式,如式(3)、式(4)所示:

        (3)

        ?i=1,…,c?j=1,…,n

        (4)

        ?i=1,…,c

        由于FCM算法在輸入空間中采用歐氏距離,所以僅可對在輸入空間中具有超球體結構的可分數(shù)據(jù)集作有效聚類,而對蘊含非線性可分關系的數(shù)據(jù)集不能作有效聚類[7]。

        1.2 核方法(NM)

        對于X={x1,x2,…,xn},xj∈Rd,函數(shù)K:X×X→R在滿足對稱正定的條件下稱為Mercer核函數(shù),任一核函數(shù)總可以表示為:

        K(xi,xj)=Φ(xi)·Φ(xj)

        (5)

        其中Φ為從低維輸入空間X到高維特征空間F的非線性映射,即有:

        Φ:X→F

        (6)

        非線性映射Φ的形式并不需要明確給出,數(shù)據(jù)集X通過Φ映射到空間F,可表示為Φ(X)={Φ(x1),Φ(x2),…,Φ(xn)},由式(5)知可利用核函數(shù)表示高維特征空間中向量間的歐氏距離。

        ‖Φ(xi)-Φ(xj)‖2=

        (Φ(xi)-Φ(xj))·(Φ(xi)-Φ(xj))=

        Φ(xi)·Φ(xi)+Φ(xj)·Φ(xj)-2Φ(xi)·Φ(xj)=

        K(xi,xi)+K(xj,xj)-2K(xi,xj)

        (7)

        利用核函數(shù)表示高維特征空間中向量間距離關系,即稱之為核方法。核方法適合于在高維特征空間中僅存在點積運算和距離關系的算法。

        常用的核函數(shù)包括:

        (1) 多項式核函數(shù):KP(xi,xj)=(xi·xj+b)d,b>0,d∈N。當b=0,d=1時,得到線性核函數(shù),即有KL(xi,xj)=xi·xj。

        (2) Sigmoid核函數(shù):KS(xi,xj)=tanh(α(xi·xj)+β),α,β>0。

        1.3 核模糊c均值聚類算法(KFCM)

        核模糊c均值聚類算法(KFCM)即是將核方法應用于模糊c均值聚類算法。模糊聚類算法主要由目標函數(shù)、模糊隸屬度和聚類中心三部分構成,由式(1)、式(3)可知,目標函數(shù)和模糊隸屬度僅含有距離運算,滿足應用核方法的要求。由式(4)可知,聚類中心并不滿足應用核方法的條件,因此不能直接使用核方法處理聚類中心。目前主要有三種不同的聚類中心表現(xiàn)方法,將在第2節(jié)中進行介紹,這里主要給出核方法在聚類目標函數(shù)和模糊隸屬度中的應用。

        由式(1)、式(7)可知,KFCM算法目標函數(shù)可表達為:

        (8)

        其中dKij=‖Φ(xj)-Φ(vi)‖表示特征空間中向量Φ(xj)與聚類中心Φ(vi)的歐氏距離,且可利用核函數(shù)表達出來。即有:

        (9)

        由式(3)、式(7)可知,KFCM算法模糊隸屬度可表達為:

        (10)

        ?i=1,…,c?j=1,…,n

        對比式(1)、式(8)、式(3)和式(10)可知,F(xiàn)CM與KFCM算法的目標函數(shù)和模糊隸屬度表達形式基本一致。

        2 核聚類算法分類

        核聚類中心的表示是FCM算法與核方法結合生成KFCM算法的關鍵,現(xiàn)有研究文獻主要包含了三種不同的核聚類中心表現(xiàn)方法。本文根據(jù)其推理原理的不同分別做了這三種核聚類中心的命名和分類。由于這些核聚類算法的目標函數(shù)和模糊隸屬度是相同的,所以以核聚類中心命名相應的核模糊聚類算法,并在2.1至2.3節(jié)中進行了闡述。

        2.1 隱核模糊c均值聚類算法(HKFCMs)

        文獻[7]在硬核聚類算法的基礎上提出了一種核模糊聚類算法。在這種核聚類算法中,核聚類中心Φ(vi)利用梯度法以隱式形式表現(xiàn)在核矩陣中,因此將該算法核聚類中心命名為隱核聚類中心,相應的核聚類算法為隱核模糊c均值聚類算法(HKFCMs)。

        令式(8)對特征空間聚類中心Φ(vi)求偏導,并令求導結果等于0,則有:

        (11)

        由于非線性映射Φ具體形式不可知,所以不能顯式計算Φ(vi),將Φ(vi)與Φ(vi)、Φ(xh)分別作內積運算并利用核函數(shù)表示出來,得到:

        (12)

        (13)

        類似FCM算法參數(shù)迭代估計流程,利用式(8)、式(10)與式(12)、式(13)及AO交替迭代算法,可對數(shù)據(jù)集X給出模糊聚類劃分。在式(12)、式(13)中,特征空間聚類中心Φ(vi)并沒有顯式給出,但特征空間聚類中心信息已蘊藏在K(vi,vi)及K(xh,vi)中。在最小化目標函數(shù)的過程中,HKFCMs算法利用了核聚類目標函數(shù)對Φ(vi)的梯度信息,且該算法由式(8)、式(10)、式(12)及式(13)確定。HKFCMs算法沒有聚類中心的顯示計算公式,所以在算法迭代時只能對模糊隸屬度做初始化,從而由式(10)、式(12)及式(13)生成交替迭代序列。

        2.2 Gauss核模糊c均值聚類算法(GKFCMs)

        文獻[8]利用Gauss核函數(shù)提出了一種模糊聚類算法,其聚類中心依賴于Gauss核函數(shù)計算得到,所以稱其為Gauss核聚類中心,稱相應的核聚類算法為Gauss核模糊c均值聚類算法(GKFCMs)。

        根據(jù)Gauss核函數(shù)的定義,可以得到式(14):

        (14)

        其中KG表示高斯核函數(shù)。

        對于KFCM目標函數(shù)式(8),取核函數(shù)為高斯核函數(shù),由式(8)及式(14)可得到:

        (15)

        令式(10)中核函數(shù)K取為高斯核函數(shù)KG,可得到:

        (16)

        令式(15)對輸入空間聚類中心vi求偏導,并令求導結果等于0,則有:

        (17)

        GKFCMs算法由式(15)-式(17)構成。GKFCMs算法給出了核聚類算法在輸入空間中原始聚類中心vi的顯式表達。在最小化目標函數(shù)的過程中,GKFCMs算法利用了核聚類目標函數(shù)對vi的梯度信息。由于GKFCMs算法聚類中心式(17)的右端含有聚類中心vi本身,所以該聚類算法不滿足一般聚類算法收斂性證明的基本條件,即要求聚類中心僅為模糊隸屬度的函數(shù)。因為GKFCMs算法聚類中心式(17)右端既有vi且有uij,初始化uij無法計算聚類中心vi,所以在算法迭代時只能對聚類中心vi作初始化。

        2.3 PSO核模糊c均值聚類算法(PSO-KFCMs)

        生物進化算法越來越多的被引入到模糊聚類算法中,用于模型的參數(shù)估計和目標函數(shù)求解。此類算法的優(yōu)勢在于全局優(yōu)解搜索性能和不依賴于梯度信息,適合于非線性、不可微和多峰值復雜問題的優(yōu)化。由于粒子群(PSO)算法是基于實數(shù)域編碼并在輸入解空間全局搜索優(yōu)解的,適合于對模糊聚類算法聚類中心估計尋優(yōu)。文獻[10-11]利用PSO算法對聚類中心進行編碼尋優(yōu)求解,文獻[9]進一步將其與核方法結合起來,稱這樣的聚類中心為PSO核聚類中心,相應的核聚類算法為PSO核模糊c均值聚類算法(PSO-KFCMs)?;綪SO在每次迭代中粒子根據(jù)自身pbest和全局gbest來修正自身飛行速度。

        粒子的速度及位置更新公式分別為:

        vij(t+1)=wvij(t)+c1r1[pij(t)-xij(t)]+

        c2r2[gij(t)-xij(t)]

        (18)

        xij(t+1)=xij(t)+vij(t+1)

        (19)

        其中c1、c2為加速因子,取為正的常數(shù);r1、r2為[0,1]之間的隨機數(shù),w稱為慣性因子。

        模糊聚類算法一般定義式(20)為PSO適應度函數(shù)。

        (20)

        PSO-KFCMs算法在輸入空間中對聚類中心vi尋優(yōu),沒有利用核目標函數(shù)對于Φ(vi)或vi的梯度信息,而僅是在適應度函數(shù)的指引下修正迭代尋優(yōu)路徑和速度。PSO-KFCMs算法利用PSO算法對聚類中心尋優(yōu),其模糊隸屬度和目標函數(shù)由式(8)和式(10)確定。PSO-KFCMs算法沒有聚類中心的計算公式,其聚類中心取值依賴于PSO算法在解空間中的搜索,所以在算法迭代時只能對聚類中心做初始化。

        3 Gauss誘導核模糊聚類算法(GIKFCMs)

        3.1 Gauss誘導核模糊聚類算法

        GKFCMs算法由于其聚類中心公式的右端含有聚類中心本身,所以不滿足聚類算法收斂性條件,且HKFCMs算法和GKFCMs算法在迭代初始化上存在缺陷。在2.1節(jié)隱核聚類中心和2.2節(jié)Gauss核聚類中心的基礎上,推導出了一種新的核聚類中心計算方法,并稱所得到的聚類中心為Gauss誘導核聚類中心,相應的核聚類算法為Gauss誘導核模糊c均值聚類算法(GIKFCMs)。

        類似HKFCMs算法,令核目標函數(shù)式(8)對特征空間聚類中心Φ(vi)求偏導,并令求導結果等于0,則有:

        (21)

        對式(21)兩邊乘以Φ(xj),得到:

        (22)

        令式(22)中核函數(shù)取為Gauss核函數(shù),得到:

        (23)

        類似GKFCMs算法,令核目標函數(shù)式(8)中的核函數(shù)為Gauss核函數(shù),得到:

        (24)

        令式(24)對輸入空間聚類中心vi求偏導,并令求導結果等于0,則有:

        (25)

        再將式(23)代入式(25)右端,即有:

        (26)

        根據(jù)GIKFCMs算法聚類中心推導過程可知,該聚類中心既利用了隱核聚類中心對Φ(vi)的梯度信息,又使用了GKFCMs聚類中心對vi的梯度信息,且聚類中心vi在輸入空間顯式表示,所以是一種新的核聚類中心確定方法。特別強調的是,如式(26)所示,GIKFCMs聚類中心vi的顯式表達式右端并不包含聚類中心vi,這是與GKFCMs算法聚類中心式(17)所截然不同的,從而使得GIKFCMs算法滿足聚類算法收斂性證明的要求。同時也使得GIKFCMs算法可類似FCM算法,不僅可以對聚類中心作初始化,而且可以對模糊隸屬度作初始化。

        很顯然,GIKFCMs算法的目標函數(shù)和模糊隸屬度與GKFCMs算法相同,所以該算法由式(16)、式(24)和式(26)構成。

        3.2 Gauss誘導核模糊聚類算法迭代流程

        GIKFCMs用下列步驟確定聚類中心vi和隸屬矩陣U=(uij)c×n:

        步驟2用式(26)計算c個聚類中心vi,i=1,…,c。

        步驟3根據(jù)式(24)計算代價函數(shù)。如果它小于某個確定的閾值,或它相對上次價值函數(shù)值的改變量小于某個閾值,則算法停止。

        步驟4用式(16)計算新的U矩陣。返回步驟2。

        上述迭代算法也可以先初始化聚類中心,然后再執(zhí)行迭代過程。

        為了避免分母為0不可運算,若某樣本xj與某聚類中心vi重合,則規(guī)定該樣本歸于該類的隸屬度為1,歸于其他類的隸屬度為0即可。

        4 各核模糊聚類算法性質分析

        4.1 各核聚類算法聚類中心確定方法的性質

        四種推導原理不同的核聚類中心計算方法,引出了四種不同的核模糊聚類算法。這些核模糊聚類算法的目標函數(shù)和模糊隸屬度表現(xiàn)形式是一致的。

        HKFCMs算法將核目標函數(shù)JKFCM(U,V)對特征空間聚類中心Φ(vi)求偏導計算極值點,得到Φ(vi)的顯式表達式,但由于非線性變換Φ的映射形式不可知,使得算法不能直接利用Φ(vi)的顯式信息。因此,將Φ(vi)與Φ(vi)及Φ(xj)作點積運算,并利用核函數(shù)得到Φ(vi)的隱示表達式。隱核聚類中心聚類算法利用的是目標函數(shù)關于Φ(vi)對梯度信息進行參數(shù)優(yōu)化估計,該算法的核函數(shù)具有一般性,能夠選擇任意核函數(shù)。

        GKFCMs算法令核函數(shù)為Gauss核函數(shù),利用Gauss核函數(shù)中蘊藏‖x-y‖2的特殊性,將核目標函數(shù)對輸入空間聚類中心vi求導,得到vi的顯示表達式。因此GKFCMs算法聚類中心方法只能選取Gauss核函數(shù)。在Gauss核聚類中心公式的右端,還包含了聚類中心vi本身,不滿足聚類算法收斂性證明的條件,因此不能仿照FCM算法證明其算法收斂性[4]。

        PSO-KFCMs算法聚類中心確定方法與PSO-FCMs聚類中心確定原理和計算流程相同,即利用PSO生物進化算法在輸入空間中依適應度函數(shù)值迭代尋優(yōu)聚類中心。該算法和HKFCMs算法一樣,可以選擇任意核函數(shù)。

        GIKFCMs算法首先利用Gauss核函數(shù)及隱核聚類中心式(11),得到式(23)的結論,然后將其與Gauss核聚類中心表達式(25)相結合,得到Gauss核誘導聚類中心式(26)。在Gauss核誘導聚類中心的推導過程中,既利用了隱核聚類中心關于Φ(vi)對梯度信息,又結合了Gauss核聚類中心關于vi對梯度信息,且在輸入空間中顯式表達vi,所以是一種與前述三種方法所不同的核聚類中心計算方法。很顯然,GIKFCMs算法和GKFCMs算法一樣,也只能選取Gauss核函數(shù),但GIKFCMs算法聚類中心公式右端不包含聚類中心vi,僅為模糊隸屬度uij的函數(shù),這與GKFCMs算法聚類中心截然不同,從而滿足了一般模糊聚類算法收斂性證明的要求,進而保證了算法的收斂性[4]。

        另外HKFCMs算法和PSO-KFCMs算法的目標函數(shù)和模糊隸屬度公式是一致的,即采用一般核函數(shù)所定義距離生成的目標函數(shù)和模糊隸屬度。而GKFCMs算法與GIKFCMs算法的目標函數(shù)及模糊隸屬度公式是相同的,即取核函數(shù)為Gauss核函數(shù)的特殊情況。

        4.2 各核聚類算法的收斂性分析

        傳統(tǒng)FCM算法是利用梯度算法推導出來的,文獻[4]給出了FCM算法收斂性的嚴謹證明,F(xiàn)CM算法及其改進算法均可以類似得到聚類算法的收斂性。因此可直接根據(jù)文獻[4]所提供方法證明隱核及Gauss核誘導聚類中心聚類算法的收斂性,這兩種核模糊聚類算法所產生的迭代序列將收斂于核目標函數(shù)的極小值點或鞍點。對于PSO核模糊聚類中心聚類算法而言,由于核模糊聚類目標函數(shù)轉換為PSO算法的適應度函數(shù),所以聚類算法的收斂性由PSO算法的收斂性決定。

        對于GKFCMs算法,并不能夠運用文獻[4]的方法判定聚類算法的迭代收斂性,因為文獻[4]收斂性證明方法要求聚類中心僅為模糊隸屬度的函數(shù)。而GKFCMs算法聚類中心公式右端包含聚類中心本身,并不滿足聚類算法迭代收斂條件,其算法收斂性的理論證明需要作進一步研究。

        4.3 各核聚類算法迭代初始化的要求

        GKFCMs算法由式(15)-式(17)確定,其聚類中心式(17)右端含有聚類中心vi,因此不能利用模糊隸屬度的初始化計算GKFCMs算法聚類中心。所以GKFCMs算法只能先對聚類中心進行初始化,否則無法進行算法的迭代計算。HKFCMs算法由式(12)、式(13)、式(15)和(16)確定,對于HKFCMs算法而言,由于其在核映射空間中以核矩陣形式隱式表達聚類中心,沒有顯示的聚類中心表示和計算公式,所以HKFCMs算法只能對模糊隸屬度作初始化。而GIKFCMs算法由式(16)、式(24)和式(26)確定,其迭代方式和FCM算法類似,既可以對聚類中心進行初始化,也可以對模糊隸屬度進行初始化,反映了該算法的迭代通用性。對于PSO-KFCMs算法而言,它在輸入空間中利用PSO算法搜索聚類中心優(yōu)解,不能利用模糊隸屬度求解聚類中心。因此該算法僅能對聚類中心作初始化并根據(jù)適應函數(shù)取值進行迭代更新。

        5 仿真實驗

        為了驗證本文所提出的GIKFCMs 算法的有效性,將GIKFCMs算法與在第2節(jié)中所歸納的核聚類算法做對比測試。在第2節(jié)中,GIKFCMs算法和HKFCMs 、GKFCMs算法的推導原理相似,都是利用梯度法得到聚類算法參數(shù)計算公式,并通過AO交替迭代流程進行參數(shù)估計。這三種算法進行對比測試具有可比性,因此選用HKFCMs 、GKFCMs算法與GIKFCMs算法做對比測試。

        5.1 公共測試數(shù)據(jù)集

        基于UCI機器學習數(shù)據(jù)庫中的公共數(shù)據(jù)集進行算法比對測試,所選數(shù)據(jù)集為Iris數(shù)據(jù)集,數(shù)據(jù)集的信息如表1所示。

        表1 iris實驗數(shù)據(jù)集

        5.2 仿真實驗說明

        在測試時,三種核聚類算法都選用Gauss核函數(shù),Gauss核函數(shù)需要對Gauss核參數(shù)σ賦值,取核參數(shù)σ取值范圍為[21,22,23,24],聚類算法模糊指標m取值為[2,3,4]。在取核函數(shù)為Gauss核函數(shù)的情況下,HKFCMs算法由式(13)、式(15)、式(16)作聚類運算,GKFCMs算法由式(15)-式(17)作聚類運算,而GIKFCMs算法由式(16)、式(24)、式(26)作聚類運算。每種聚類算法根據(jù)參數(shù)和數(shù)據(jù)集進行10次測試,計算各類聚類平均精度。很顯然這三種核聚類算法的核模糊隸屬度及聚類目標函數(shù)是相同的,區(qū)別在于聚類中心的表達上,其中GKFCMs和GIKFCMs算法在輸入空間中尋找聚類中心,而HKFCMs算法在核映射空間中隱式表現(xiàn)了聚類中心。在算法迭代的初始化方面,如4.3節(jié)分析所述,GKFCMs、GIKFCMs算法選擇對聚類中心做初始化,HKFCMs算法選擇對模糊隸屬度做初始化。

        5.3 實驗結果及分析

        由于三種核聚類算法中存在參數(shù)σ和m的設置,且這兩個參數(shù)的取值對聚類結果有著重要的影響,所以依參數(shù)不同取值表現(xiàn)算法聚類結果,三模型聚類結果分別如表2-表4所示。

        表2 GIKFCMs算法基于Iris數(shù)據(jù)集的分類精度 %

        表3 GKFCMs算法基于Iris數(shù)據(jù)集的測試結果 %

        表4 HKFCMs算法基于Iris數(shù)據(jù)集的分類精度 %

        GIKFCMs算法基于數(shù)據(jù)集iris的最高平均分類精度為92.67%,在參數(shù)σ=2,m=4時取得;最低平均分類精度為89.33%,分別在參數(shù)σ=8,m=2和σ=16,m=2。在聚類平均精度的基礎上,再取聚類平均精度的平均為90.422 5%。

        GKFCMs算法基于數(shù)據(jù)集iris的最高平均分類精度為92.53%,在參數(shù)σ=2,m=4時取得;最低平均分類精度為89.33%,分別在參數(shù)σ=8,m=2和σ=16,m=2。在聚類平均精度的基礎上,再取聚類平均精度的平均為90.39%。

        HKFCMs算法基于數(shù)據(jù)集iris的最高平均分類精度為90.00%,在參數(shù)σ=16,m=3時取得,最低平均分類精度為66.67%,分別在參數(shù)σ=2,m=3和σ=2,m=4。在聚類平均精度的基礎上,再取聚類平均精度的平均為80.51%。

        由表2和表3可知,GIKFCMs和GKFCMs算法對于iris數(shù)據(jù)集都能取得較好的聚類結果,在不同的參數(shù)取值情況下,GIKFCMs和GKFCMs算法聚類結果之間各有高低。如當σ=2,m=4時,GIKFCMs平均聚類精度92.67%高于GKFCMs平均聚類精度92.53%;而在σ=4,m=4時,GIKFCMs平均聚類精度90.80%低于GKFCMs平均聚類精度90.93%。但在最高平均分類精度上和聚類平均精度的平均上,GIKFCMs算法是高于GKFCMs算法的,體現(xiàn)了GIKFCMs算法的有效性。由表4可知,HKFCMs算法基于數(shù)據(jù)集iris的測試結果并不理想,體現(xiàn)在該算法對模糊指標m異常敏感,隨著參數(shù)m的變化,HKFCMs算法聚類結果波動較大,且聚類結果表現(xiàn)不好。

        6 線性KFCM與FCM算法等價性證明的修正

        6.1 原等價性證明存在的問題

        文獻[7]提出命題:對于核模糊c均值聚類算法,若取核函數(shù)為線性核函數(shù),即KL(xi,xj)=xi·xj時,KFCM算法等價于FCM算法。雖然這個命題并沒有錯誤,但文中在證明聚類中心等價性時存在錯誤,因此其證明過程并不能嚴謹推導出KFCM算法與FCM算法等價的結論。

        文獻[7]利用線性核函數(shù),得到了:

        Φ(xj)·Φ(vi)=K(xj,vi)=xj·vi

        (27)

        文獻[7]由式(27)認為特征空間聚類中心Φ(vi)與輸入空間聚類中心vi等價,由核函數(shù)性質可知[12],核函數(shù)對應特征空間和特征映射Φ并不唯一,所以由式(27)并不能證明Φ(vi)與vi等價,即不能證明Φ(vi)=vi。

        一個簡單的反例,設xj=(xj1,xj2,…,xjd)T,取Φ1(xj)=(xj1,xj2,…,xjd,0)T,Φ2(xj)=(0,xj1,xj2,…xjd)T,Φ3(xj)=(xj1,0,xj2,…,xjd)T,很顯然特征映射Φ1、Φ2及Φ3皆滿足式(27)式約束,但并不能證明Φ1(vi)=Φ2(vi)=Φ3(vi)=vi。

        6.2 FCM與線性KFCM算法等價的證明

        由于文獻[7]所提出的核聚類算法是隱核聚類中心聚類算法,特征空間聚類中心Φ(vi)隱式給出,直接證明Φ(vi)與vi的等價性是非常困難的。因此在證明FCM及KFCM算法等價性時應回避Φ(vi)與vi等價性討論。

        類似隱核聚類中心展開FCM算法,由式(1)、式(3)、式(4)得到式(28)-式(31):

        (28)

        (29)

        (30)

        (31)

        即可用式(27)-式(31)表示FCM算法,在此種表示中聚類中心vi被隱藏起來。當KFCM算法取為線性核函數(shù)式(27)時,KFCM算法表示式(8)、式(10)、式(12)及式(13)轉換為FCM算法式(28)-式(31),從而證明了在線性核函數(shù)條件下,F(xiàn)CM算法與KFCM算法是等價的。

        7 結 語

        核方法具有良好的非線性區(qū)分性能,并在機器學習領域應用廣泛。模糊聚類算法[13-14]在運用核方法時,核聚類中心的有效表示是運用核方法的關鍵。所提出的GIKFCMs核模糊聚類算法首先基于Gauss核目標函數(shù)和梯度法,分別得到輸入空間和特征空間聚類中心表示式。然后借助核方法和內積運算得到樣本與特征空間聚類中心的核矩陣。最后應用該核矩陣將特征空間和輸入空間的聚類中心表示式結合起來,從而得到了GIKFCMs算法的核聚類中心計算方法及相應的GIKFCMs算法。GIKFCMs算法和HKFCMs、GKFCMs算法相比,不僅能對聚類中心初始化,也能對模糊隸屬度作初始化,且滿足聚類算法收斂性條件,仿真實驗驗證了所提出算法的聚類有效性。同時,對線性核KFCM算法與FCM算法聚類中心等價性證明提出反例,并對線性核KFCM算法與FCM算法等價性作了重新證明。由于Gauss核參數(shù)對于聚類算法的影響較大,下一步工作將對Guass核參數(shù)的恰當選取問題進行研究。

        [1] Cortes C,Vapnik V.Support vector networks[J].Machine Learning,1995,20(3):273-297.

        [2] Scholkopf B,Smola A J,Muller K R.Nonlinear component analysis as a kernel eigenvalue problem[J].Neural Computation,1998,10(5):1299-1319.

        [3] Filippone M,Camastra F,Masulli F,et al.A Survey of Kernel and Spectral M ethods for Clustering[J].Pattern Recognition,2008,41(1):176-190.

        [4] 文傳軍,汪慶淼,詹永照.隱隸屬度模糊C均值聚類算法[J].計算機應用與軟件,2015,32(12),245-248.

        [5] Girolami M.Mercer kernel based clustering in feature space[J].IEEE Trans on Neural Networks,2002,13(3):780-784.

        [6] 張莉,周偉達,焦李成.核聚類算法[J].計算機學報,2002,25(6):587-590.

        [7] 伍忠東,高新波,謝維信.基于核方法的模糊聚類算法[J].西安電子科技大學學報(自然科學版),2004,31(4):533-537.

        [8] Zhang D Q,Chen S C.Fuzzy clustering using kernel method[C]//International Conference on Control and Automation,2002.Icca.Final Program and Book of.IEEE,2002:162-163.

        [9] 于德亮,唐海燕,丁寶,等.基于粒子群優(yōu)化模糊核聚類的電梯群交通模式識別[J].哈爾濱工業(yè)大學學報,2012,44(10):84-88.

        [10] Niu Q,Huang X J.An improved fuzzy C-means clustering algorithm based on PSO[J].Journal of Software,2011,6(5):873-879.

        [11] Kumar S,Singh S K.Hybrid BFO and PSO swarm intelligence spproach for niometric geature optimization[J].International Journal of Swarm Intelligence Research,2016,7(2):36-62.

        [12] 王國勝.核函數(shù)的性質及其構造方法[J].計算機科學,2006,33(6):172-178.

        [13] Verma H,Agrawal R K,Sharan A.An improved intuitionistic fuzzy c-means clustering algorithm incorporating local information for brain image segmentation[J].Applied Soft Computing,2016,46(C):543-557.

        [14] Parastar H,Bazrafshan A.Fuzzy C-means clustering for chromatographic fingerprints analysis:A gas chromatography-mass spectrometry case study[J].Journal of Chromatography A,2016,1438:236-243.

        GAUSS-INDUCEDKERNELFUZZYC-MEANSCLUSTERINGALGORITHM

        Wen Chuanjun1Zhan Yongzhao2
        1(SchoolofMathematicalSciencesandChemicalEngineering,ChangzhouInstituteofTechnology,Changzhou213002,Jiangsu,China)2(SchoolofComputerScienceandCommunicationEngineering,JiangsuUniversity,Zhenjiang212013,Jiangsu,China)

        Aiming at the excellent nonlinear expression ability of the kernel fuzzy clustering algorithm, this paper proposes a Gauss-induced kernel fuzzy c-means clustering algorithm. Firstly, based on the kernel objective function and the gradient method, the central expression of the feature space clustering is obtained, and the kernel matrix expression of the cluster center and the sample is obtained by the inner product operation. Secondly, the kernel function in the kernel objective function is Gauss kernel function, and the input spatial clustering center expression is obtained by using the gradient method. Finally, the kernel matrix of the clustering center and the sample is substituted into the input space clustering center expression to get the new clustering center calculation method of GIKFCMs, and the corresponding GIKFCMs kernel clustering algorithm is obtained. In this paper, we studied the properties of GIKFCMs and analyzed the convergence and initialization constraints of the algorithm. The algorithm overcomes the shortcomings of the original kernel clustering algorithm in convergence and initialization constraints. The effectiveness of the proposed algorithm is verified by simulation experiments. In addition, this paper also corrects the error of linear kernel FCM and FCM algorithm equivalence.

        Kernel method Fuzzy clustering Non-linear mapping Kernel clustering center Algorithm equivalence proof

        2016-10-28。國家自然科學基金項目(61170126);常州工學院校級課題(YN1305)。文傳軍,博士,主研領域:數(shù)據(jù)挖掘,模式識別,模糊聚類。詹永照,教授。

        TP391.41

        A

        10.3969/j.issn.1000-386x.2017.08.046

        猜你喜歡
        方法
        中醫(yī)特有的急救方法
        中老年保健(2021年9期)2021-08-24 03:52:04
        高中數(shù)學教學改革的方法
        河北畫報(2021年2期)2021-05-25 02:07:46
        化學反應多變幻 “虛擬”方法幫大忙
        變快的方法
        兒童繪本(2020年5期)2020-04-07 17:46:30
        學習方法
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        最有效的簡單方法
        山東青年(2016年1期)2016-02-28 14:25:23
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        日本中文字幕一区二区在线观看| 无码毛片视频一区二区本码| 国产精品.xx视频.xxtv| 男人天堂av在线成人av| 色综合久久人妻精品日韩| 在线麻豆精东9制片厂av影现网| 亚洲毛片αv无线播放一区| 国产成人精品三级麻豆 | 国产成人自拍高清在线| 精品少妇人妻av无码专区| 日韩中文网| av二区三区在线观看| 国产精品一区二区三区专区| 最近中文字幕大全在线电影视频| 欧美在线播放一区二区| 成人偷拍自拍在线视频| 国产精华液一区二区三区| 国产精品_国产精品_k频道w| 国产一区二区三区啪| 日韩伦理av一区二区三区| 日韩在线 | 中文| 黑人玩弄人妻中文在线| 欧洲国产精品无码专区影院| av在线播放免费观看| 日本阿v片在线播放免费| 久久AⅤ无码精品为人妻系列 | 91精品国产闺蜜国产在线| 一本色道久久88加勒比| 少妇被粗大的猛烈进出69影院一 | 狠狠色噜噜狠狠狠97影音先锋| 青青草免费在线视频导航| 又黄又刺激的网站久久| 波多野结衣av手机在线观看| 在线天堂中文一区二区三区| 国产精品一区二区夜色不卡| 麻豆婷婷狠狠色18禁久久| 久久国产精品不只是精品| 午夜少妇高潮免费视频| 亚洲精品国产精品乱码视色| 亚洲av无码片在线观看| 亚洲日韩AV无码美腿丝袜|