亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于屬性差異的產(chǎn)品缺陷數(shù)據(jù)關(guān)聯(lián)規(guī)則模糊分類

        2017-01-19 08:49:12孔建益王興東劉軍偉
        關(guān)鍵詞:權(quán)值關(guān)聯(lián)聚類

        李 怡,孔建益,王興東,劉軍偉

        (武漢科技大學(xué)機(jī)械自動(dòng)化學(xué)院,湖北 武漢,430081)

        基于屬性差異的產(chǎn)品缺陷數(shù)據(jù)關(guān)聯(lián)規(guī)則模糊分類

        李 怡,孔建益,王興東,劉軍偉

        (武漢科技大學(xué)機(jī)械自動(dòng)化學(xué)院,湖北 武漢,430081)

        針對(duì)工業(yè)生產(chǎn)過(guò)程中所產(chǎn)生的產(chǎn)品缺陷數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)挖掘后關(guān)聯(lián)規(guī)則存在不能有效組織的問(wèn)題,提出一種基于項(xiàng)目屬性差異的產(chǎn)品缺陷數(shù)據(jù)關(guān)聯(lián)規(guī)則模糊分類方法,在建立模糊分類樹的基礎(chǔ)上,計(jì)算出關(guān)聯(lián)規(guī)則間距離,并采用自組織神經(jīng)網(wǎng)絡(luò)聚類的方法對(duì)挖掘結(jié)果進(jìn)行聚類分析。將該方法應(yīng)用于冷軋帶鋼表面缺陷數(shù)據(jù)挖掘后處理,結(jié)果表明,該方法不僅能夠得出兩種不同屬性項(xiàng)目間的關(guān)聯(lián)性,還可以求出缺陷關(guān)聯(lián)規(guī)則間的距離,距離越近的關(guān)聯(lián)規(guī)則被聚為一類,其相似性越大。

        冷軋帶鋼;產(chǎn)品缺陷;屬性;關(guān)聯(lián)規(guī)則;模糊分類;距離;聚類分析;可視化

        產(chǎn)品表面缺陷數(shù)據(jù)經(jīng)過(guò)挖掘后,往往會(huì)出現(xiàn)大量的關(guān)聯(lián)規(guī)則,若直接對(duì)這些規(guī)則進(jìn)行數(shù)據(jù)可視化,所體現(xiàn)出的有效信息會(huì)大大減弱,給決策者的判斷帶來(lái)困難,因此,有必要對(duì)關(guān)聯(lián)規(guī)則的挖掘結(jié)果進(jìn)行再處理。目前關(guān)聯(lián)規(guī)則挖掘結(jié)果的處理方法主要有聚類法、分組法與剔除法等,其中聚類法是一種通過(guò)挖掘數(shù)據(jù)分布情況來(lái)發(fā)現(xiàn)數(shù)據(jù)中隱含模式的一種處理方法,其將大量數(shù)據(jù)在某種算法下分成多類,使得每一類數(shù)據(jù)內(nèi)部存在相似性,而類與類數(shù)據(jù)之間又存在一定的差異性[1]。關(guān)聯(lián)規(guī)則聚類則將挖掘后“親近”的結(jié)果放在一起提供給決策者,便于決策者分析。Toivonen等[2]提出聚類組織關(guān)聯(lián)規(guī)則,并根據(jù)規(guī)則交易數(shù)的重合率來(lái)得出規(guī)則間距離,Strehl等[3]在其基礎(chǔ)上作了一些改進(jìn),使得距離值控制在區(qū)間[0,1]內(nèi),但以上方法在計(jì)算規(guī)則間距離時(shí)均須掃描初始數(shù)據(jù),不僅耗時(shí),還會(huì)形成固定數(shù)目的簇而影響對(duì)挖掘結(jié)果可視化的效果。Chen等[4]提出了模糊分類樹的概念,阮備軍等[5]在其基礎(chǔ)上針對(duì)商品分類信息提出一種基于度量關(guān)聯(lián)規(guī)則間距離的聚類方法,沈斌等[6]又引入了語(yǔ)義差別,進(jìn)一步驗(yàn)證了規(guī)則聚類的有效性。但是,工業(yè)生產(chǎn)中產(chǎn)品缺陷數(shù)據(jù)與產(chǎn)生缺陷的原因兩者不是建立在語(yǔ)義上面的差別,而是屬于不同屬性類別,因此基于語(yǔ)義差別的聚類方法并不適用。在文獻(xiàn)[4]的基礎(chǔ)上,劉軍偉[7]將兩種不同屬性項(xiàng)目應(yīng)用到了模糊分類樹中,并且以冷軋帶鋼表面缺陷為研究對(duì)象,挖掘出大量缺陷關(guān)聯(lián)規(guī)則,但沒有進(jìn)一步計(jì)算關(guān)聯(lián)規(guī)則的相似性?;谏鲜銮闆r,本文提出一種基于屬性差異的產(chǎn)品缺陷數(shù)據(jù)關(guān)聯(lián)規(guī)則模糊分類方法,并采用自組織神經(jīng)網(wǎng)絡(luò)聚類法(self-organizing map clustering,SOMC)[8]對(duì)計(jì)算出的缺陷距離矩陣進(jìn)行總體聚類。

        1 關(guān)聯(lián)規(guī)則模糊分類方法

        1.1 模糊分類樹的建立及其屬性權(quán)值的確定

        在模糊分類樹中,每個(gè)分支可以看作是一類分類樹,可以描述為一個(gè)有向無(wú)環(huán)圖H=〈I,E,W〉,其中I={i1,…,im}為m個(gè)項(xiàng)的集合,E、W分別為有向邊和模糊隸屬度權(quán)值的集合。

        圖1所示為兩種有向無(wú)環(huán)圖,圖中項(xiàng)目均屬于I集合。若從分類樹的結(jié)點(diǎn)X到結(jié)點(diǎn)Y存在有向邊,則稱X是Y的祖先,X、Y之間存在祖孫關(guān)系,且該關(guān)系間具有傳遞性。連接存在祖孫關(guān)系的結(jié)點(diǎn)X和結(jié)點(diǎn)Y的邊序列稱為X與Y之間的有向路徑,記為l(X,Y)=(e1,e2,…,en) ,其中有向邊ei的終點(diǎn)與ei+1的起點(diǎn)一致。

        (a)H1

        為了便于對(duì)分類樹中多類屬性項(xiàng)目的相似度進(jìn)行比較,需要將多個(gè)有向無(wú)環(huán)圖通過(guò)ROOT合并成一個(gè)有向無(wú)環(huán)圖。由于項(xiàng)目之間存在一定的屬性差異,故需要建立帶項(xiàng)目屬性差異信息的模糊分類樹,具體步驟如下:

        第一步,根據(jù)項(xiàng)目屬性找出分類樹中各個(gè)項(xiàng)目所在層次。在結(jié)構(gòu)樹中,同一層次的項(xiàng)其屬性是相同的,因此可根據(jù)項(xiàng)目屬性找出分類樹中各個(gè)項(xiàng)目所在的層次,具體過(guò)程需遵循以下幾點(diǎn):①合并有向無(wú)環(huán)圖;②根結(jié)點(diǎn)ROOT所在層次為1;③有向邊起點(diǎn)層次應(yīng)小于末層次;④不能存在某一層次中不含任何項(xiàng)目的情況;⑤在同一模糊結(jié)構(gòu)樹中,處于同一層次的結(jié)點(diǎn)項(xiàng)目之間要保證其屬性的相似性;⑥模糊結(jié)構(gòu)樹中層次間的項(xiàng)目屬性級(jí)別從大到小依次向下。

        將有向無(wú)環(huán)圖H1與H2通過(guò)ROOT合并成一個(gè)有向無(wú)環(huán)圖,根據(jù)以上6項(xiàng)原則得到模糊分類樹的結(jié)構(gòu)如圖2所示,圖中γ為權(quán)值。合并后模糊分類樹項(xiàng)與項(xiàng)之間有可能存在多個(gè)有向邊序列,如圖2中項(xiàng)目Y2與X1之間就存在兩條有向路徑:l1={e(X1,x1),e(x1,Y2)},l2={e(X1,x2),e(x2,Y2)}。l1和l2中任意一條有向路徑都可以作為具有祖孫關(guān)系的X和Y之間的屬性相似性通路。

        圖2 模糊分類樹結(jié)構(gòu)

        對(duì)于同一結(jié)構(gòu)樹上兩個(gè)相鄰層次間的項(xiàng)目屬性差異,提出如下假設(shè)及定義:

        假設(shè)1設(shè)在模糊分類樹中,有相鄰的兩個(gè)層次d和d+1(d∈),那么層次d越深,則層次d和d+1之間的項(xiàng)目屬性差異就越小。

        定義1對(duì)于相鄰兩個(gè)層次d和d+1,項(xiàng)目屬性差異函數(shù)ly(d,d+1)是關(guān)于d的函數(shù),即ly(d,d+1)=f(d),并且對(duì)于兩組相鄰層次d1、d1+1和d2、d2+1,當(dāng)且僅當(dāng)d1≤d2成立時(shí),ly(d1, d1+1)≥ ly(d2,d2+1)成立。

        對(duì)于同一結(jié)構(gòu)樹上兩個(gè)不相鄰層次間的項(xiàng)目屬性差異,有如下假設(shè)及定義:

        假設(shè)2在模糊分類樹中,有兩組不相鄰的層次d、d+n和d′、d′+n′(n、n′、d′∈),若d′≥d,d′+ n′≤ d+n,則ly(d,d+n)≥ly(d′,d′+n′)。

        第三步,給模糊結(jié)構(gòu)樹中的每個(gè)有向邊賦予相應(yīng)的屬性差異權(quán)值。給出如下定義:

        定義3如果給出模糊分類樹為H=〈I,E,W〉,則項(xiàng)目屬性差異信息的模糊分類樹可表示為H=〈I,E,W,W′〉。其中,項(xiàng)目屬性權(quán)值集合W′是從有向邊集合E到正實(shí)數(shù)集合的映射函數(shù),項(xiàng)目屬性差異權(quán)值w′(k(x,y))反映了有向邊起點(diǎn)項(xiàng)x和終點(diǎn)項(xiàng)y之間的屬性差異,它可以由下式得到:

        (1)

        其中,w(e(x,y))為有向邊e的模糊隸屬度權(quán)值,由W集合給出。一般情況下,有向邊的模糊隸屬度權(quán)值不應(yīng)取得過(guò)小,一般可設(shè)置在 [0.5,1]內(nèi)。

        有向邊的項(xiàng)目屬性差異權(quán)值主要由以下兩方面的因素決定:其一,ly(d(x),d(y))越大,則有向邊的屬性差異權(quán)值越大,項(xiàng)目屬性差異權(quán)值w′(k(x,y))也越大;其二,有向邊的模糊隸屬度權(quán)值w(e(x,y))體現(xiàn)了項(xiàng)目屬性間相似性度量,即邊的模糊隸屬度越大,則相似性越高,屬性之間差別越小。

        設(shè)圖2所示模糊結(jié)構(gòu)樹為4層,如果將相鄰的兩個(gè)不同層次設(shè)置為d和d+1,則d的最大取值為3,那么項(xiàng)目屬性層次差別函數(shù)可以設(shè)置為ly(d,d+1)=(3-d+1)/10,該函數(shù)的設(shè)置是符合定義1的條件的;對(duì)于不相鄰的兩個(gè)層次d和d+n,可以將其分解成多個(gè)相鄰層次,設(shè)置項(xiàng)目屬性差異函數(shù)如定義2中所示。

        1.2 基于模糊分類樹的距離計(jì)算及聚類分析

        1.2.1 項(xiàng)間距離

        定義4如果x,y∈I,且x與y具有祖孫關(guān)系,那么x和y之間的項(xiàng)目屬性通路lr(x,y)是x和y之間全部有向路徑中所經(jīng)過(guò)邊的屬性差異權(quán)值,即最小的有向路徑lmin(x,y),具體可表示為:

        (2)

        式中:w′(e)為有向邊e的兩個(gè)結(jié)點(diǎn)項(xiàng)目之間的屬性差異權(quán)值。

        定義5對(duì)于不具備祖孫關(guān)系的結(jié)點(diǎn)間的屬性通路,若項(xiàng)目屬性差異信息模糊分類樹H=〈I,E,W,W′〉有兩條相同起點(diǎn)的有效路徑l(x,y)=(e11,e12,…,e1n),l(x,z)=(e21,e22,…,e2m) (x,y,z∈I),那么可以對(duì)這兩條有向路徑進(jìn)行連接操作,結(jié)果記作l(x,y)l(x,z)=(e11,e12,…,e1n, e21,e22,…,e2m)。

        定義6對(duì)于項(xiàng)目屬性差異信息的模糊分類樹H=〈I,E,W,W′〉,如果x、y∈I,則項(xiàng)x和y之間的屬性通路是邊的序列,記為lr(x,y ),可由如下方式得到:

        情況1:如果x、y之間存在祖孫關(guān)系,設(shè)x是y的祖先,那么存在l(x,y),使得lr(x,y)=lmin(x,y)。

        定義7對(duì)于模糊分類樹H=〈I,E,W,W′〉,若x、y∈I,則項(xiàng)x和y之間的距離定義為

        (3)

        根據(jù)圖2中的模糊分類樹以及定義5和定義6可得兩種情況下項(xiàng)目間的距離值為:

        情況1:Ditem(X1,Y2)=lr(X1,Y2)={l1[e(X1,x1);e(x1,Y2)];l2[e(X1,x2);e(x2,Y2)]}min=∑w′(e)。

        情況2:Ditem(X1,X2)={lr(ROOT,X1);lr(ROOT,X2)}=w′[e(ROOT,X1)]+w′[e(ROOT,X2)]。

        1.2.2 項(xiàng)集間距離

        關(guān)于項(xiàng)集間距離的定義方法有多種,如最近距離法、最遠(yuǎn)距離法、平均距離法等,本文采用平均距離法。

        定義8存在項(xiàng)集I1={x1,x2,…,xm}和項(xiàng)集I2={y1,y2,…,yn},關(guān)于I1和I2之間的項(xiàng)集距離定義為

        (4)

        如果把項(xiàng)看成網(wǎng)格的結(jié)點(diǎn),項(xiàng)目I的數(shù)量看成流量,項(xiàng)目間的差別Ditem的值作為單位費(fèi)用,那么求項(xiàng)集的最佳匹配實(shí)際上是一個(gè)最小網(wǎng)絡(luò)費(fèi)用流問(wèn)題,可采用CS2算法進(jìn)行最小費(fèi)用流解答[9]。

        1.2.3 關(guān)聯(lián)規(guī)則間距離

        在進(jìn)行關(guān)聯(lián)規(guī)則距離度量的時(shí)候,需要考慮結(jié)構(gòu)差別和規(guī)則度量差別兩個(gè)因素,關(guān)于其結(jié)構(gòu)距離、度量距離作如下定義:

        定義9模糊分類樹H=〈I,E,W,W′〉中,如果有關(guān)聯(lián)規(guī)則1:X1?Y1, 關(guān)聯(lián)規(guī)則2: X2?Y2, 所有關(guān)聯(lián)規(guī)則都為非空子集,且存在非負(fù)實(shí)數(shù)δ1、δ2、δ3,則規(guī)則1和2之間的規(guī)則結(jié)構(gòu)距離定義如下:

        Drule(R1,R2)=δ1Dset(X1∪Y1,X2∪Y2)+

        δ2Dset(X1,X2)+δ3Dset(Y1,Y2)

        (5)

        從定義9中可以看出,關(guān)聯(lián)規(guī)則結(jié)構(gòu)差別分為3個(gè)部分:前項(xiàng)、后項(xiàng)和并集。其中δ1、δ2、δ3需要根據(jù)興趣愛好進(jìn)行設(shè)定,例如設(shè)定δ1=0、δ2=1、δ3=1/3,則表示強(qiáng)調(diào)關(guān)聯(lián)規(guī)則前項(xiàng)的相似性。從上述公式可以看出,Drule是關(guān)于Dset的一個(gè)線性組合。

        在關(guān)聯(lián)規(guī)則距離計(jì)算的基礎(chǔ)上,采用SOMC法進(jìn)行可視化分析。

        2 實(shí)例驗(yàn)證與分析

        本文從武漢鋼鐵(集團(tuán))公司二冷軋連退機(jī)組鋼卷表面質(zhì)量判定信息數(shù)據(jù)庫(kù)中隨機(jī)抽取15組缺陷數(shù)據(jù)集合,結(jié)合文獻(xiàn)[7]數(shù)據(jù)挖掘結(jié)果,采用本文方法對(duì)其關(guān)聯(lián)規(guī)則進(jìn)行分類,以驗(yàn)證本文方法的有效性。

        2.1 模糊分類樹的建立

        為方便表述,將不同的鋼卷表面缺陷原因及缺陷均用代號(hào)表示如下:①缺陷原因:酸洗為S、過(guò)酸洗為GS、欠酸洗為QS、乳化液為R;②缺陷:停車斑為TC、銹蝕為XS、氧化皮壓入為YH、夾雜為JZ、油斑為YB、黏結(jié)為NJ、碳化邊為TH、色差為SC、異物壓入為YW。以上缺陷主要來(lái)自兩種不同原因,因此可以建立包含兩種有向無(wú)環(huán)圖的模糊分類樹,其結(jié)構(gòu)如圖3所示。

        圖3 缺陷及缺陷原因數(shù)據(jù)模糊分類樹

        2.2 計(jì)算缺陷與缺陷原因?qū)傩圆町悪?quán)值

        冷軋帶鋼表面缺陷和缺陷原因各項(xiàng)目之間存在一定的屬性差異,故需要建立帶屬性差異信息的模糊分類樹,根據(jù)1.1節(jié)中描述的步驟建立圖4所示帶模糊隸屬度權(quán)值的分類樹。

        圖4 帶權(quán)值的缺陷及缺陷原因數(shù)據(jù)模糊分類樹

        根據(jù)1.1節(jié)中相關(guān)假設(shè)及定義,結(jié)合文獻(xiàn)[7]冷軋帶鋼表面缺陷相關(guān)數(shù)據(jù),在此設(shè)項(xiàng)目屬性差異函數(shù)為ly(d,d+1)=(3-d+1)/10,計(jì)算可得模糊分類樹中有向邊的屬性差異權(quán)值如表1、表2所示。

        表1 由酸洗產(chǎn)生的缺陷間屬性差異權(quán)值表

        表2 由乳化液產(chǎn)生的缺陷間屬性差異權(quán)值表

        2.3 確定關(guān)聯(lián)規(guī)則之間距離

        2.3.1 項(xiàng)間距離

        根據(jù)項(xiàng)間距離中的相關(guān)定義,結(jié)合表1和表2中的屬性差異權(quán)值表,分別計(jì)算兩種情況下的距離值:

        情況1:Ditem(S,XS)=lse-r(S,XS)={l1[e(S,GS);e(GS,XS)];l2[e(S,QS);e(QS,XS)]}min=∑w′(e)。

        其中,l1[e(S,GS);e(GS,XS)]=0.2+0.17=0.37;l2[e(S,QS);e(QS,XS)=0.2+0.14=0.34;Ditem(S,XS)=0.34。

        情況2:Ditem(S,R)={lse-r(ROOT,S);lse-r(ROOT,R)}=w′[e(ROOT,S)]+w′[e(ROOT,R)]=0.3+0.3=0.6。

        2.3.2 項(xiàng)集間距離

        項(xiàng)集間距離采用CS2算法中計(jì)算最小費(fèi)用流的方法來(lái)計(jì)算。結(jié)合定義8,設(shè)有集合I1={TC,XS,YB}和I2={YH,JZ},通過(guò)圖5所示方法計(jì)算可得:Dset(I1,I2)=(0.67+0.6+0.31+0.24+1.47+1.4)/(2×3)=0.782。

        圖5 最小費(fèi)用流解答項(xiàng)集間距離求法

        用同樣的方法計(jì)算出多對(duì)項(xiàng)集間的距離值如表3所示。由表3可以觀察具有祖孫關(guān)系的缺陷與不具有祖孫關(guān)系的缺陷集合間的距離大小與相似性。

        從表3中總體可以看出項(xiàng)集間的距離大小是由兩方面決定的,其一,項(xiàng)集間是否具有相同項(xiàng)目;其二,項(xiàng)集間的項(xiàng)目是否屬于同一祖先。

        表3 多對(duì)項(xiàng)集間距離的值

        2.3.3 關(guān)聯(lián)規(guī)則距離

        本文采用文獻(xiàn)[7]中的冷軋帶鋼相關(guān)數(shù)據(jù)進(jìn)行數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘,將加權(quán)置信度和加權(quán)支持度分別設(shè)置為0.25和0.0125,采用文獻(xiàn)[7]中加權(quán)模糊層次關(guān)聯(lián)規(guī)則挖掘算法得到關(guān)聯(lián)規(guī)則頻繁項(xiàng)集有102條,其中缺陷之間二元頻繁項(xiàng)集有52條,符合條件的有15條,將得到的關(guān)聯(lián)規(guī)則按照產(chǎn)生原因次序排列,根據(jù)定義9,將δ1、δ2、δ3分別設(shè)置為0、1、1,主要強(qiáng)調(diào)前項(xiàng)與后項(xiàng)的作用,最后得到15階對(duì)稱矩陣D(15×15)。

        為測(cè)試本文關(guān)聯(lián)規(guī)則距離計(jì)算方法的效率,將其與文獻(xiàn)[3]、文獻(xiàn)[5]和文獻(xiàn)[6]中的距離計(jì)算方法所需的運(yùn)行時(shí)間進(jìn)行對(duì)比,結(jié)果如圖6所示。由圖6中可見,采用本文方法計(jì)算所需的運(yùn)行時(shí)間最短,且隨著規(guī)則數(shù)不斷增加,運(yùn)行時(shí)間的變化率呈先慢后快的趨勢(shì)。

        本文方法的優(yōu)勢(shì)在于采用文獻(xiàn)[7]中加權(quán)模糊層次挖掘算法得到缺陷關(guān)聯(lián)規(guī)則后,在計(jì)算距離時(shí)弱化了置信度和支持度之間距離的計(jì)算,只強(qiáng)調(diào)前項(xiàng)和后項(xiàng)的作用,直接在模糊分類樹分層時(shí)就賦予各項(xiàng)目的權(quán)重值,因此在計(jì)算關(guān)聯(lián)規(guī)則距離時(shí)會(huì)比其他方法快一些。

        圖6 規(guī)則距離矩陣計(jì)算時(shí)間對(duì)比

        2.4 聚類可視化

        在缺陷關(guān)聯(lián)規(guī)則距離計(jì)算的基礎(chǔ)上,采用自組織神經(jīng)網(wǎng)絡(luò)聚類法(SOMC)對(duì)冷軋帶鋼缺陷數(shù)據(jù)挖掘后的關(guān)聯(lián)規(guī)則進(jìn)行聚類分析,整體實(shí)施步驟如下:

        (1)采用加權(quán)模糊層次關(guān)聯(lián)規(guī)則挖掘算法對(duì)缺陷原因數(shù)據(jù)進(jìn)行關(guān)聯(lián)關(guān)系數(shù)據(jù)挖掘,設(shè)置好相關(guān)參數(shù),剔除原因與原因間的規(guī)則以及原因與缺陷間的規(guī)則,保留缺陷與缺陷間的規(guī)則。

        (2)計(jì)算關(guān)聯(lián)規(guī)則間距離,得到距離矩陣D。

        (3)將已經(jīng)計(jì)算好的關(guān)聯(lián)規(guī)則距離輸入到SOMC工具箱。

        (4)分析比較SOMC可視化的結(jié)果。實(shí)驗(yàn)過(guò)程采用SOMC工具箱進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,經(jīng)過(guò)200次Batch算法迭代得到基于關(guān)聯(lián)規(guī)則距離的聚類可視化圖,如圖7所示。圖7 (a)中灰色六邊形代表神經(jīng)元(15*15),為距離矩陣訓(xùn)練前狀態(tài),圖7(b)中紅色線連接相鄰的神經(jīng)元(包含有紅色線的顏色區(qū)域)表示神經(jīng)元之間的權(quán)值距離,即實(shí)現(xiàn)這一路徑的概率大小,顏色越深代表距離越大,反之則距離越小。圖7(b)中以顏色較深處為分界線可將缺陷關(guān)聯(lián)規(guī)則距離數(shù)據(jù)大致劃分為8類,表明本文提出的規(guī)則聚類方法在組織大量關(guān)聯(lián)規(guī)則方面是實(shí)用有效的。相比其他的聚類可視化,本文方法更為直觀,方便決策者瀏覽和分析挖掘結(jié)果,從而發(fā)現(xiàn)其感興趣的關(guān)聯(lián)規(guī)則。

        (a)訓(xùn)練前

        (b)訓(xùn)練后

        3 結(jié)語(yǔ)

        本文提出一種基于屬性差異的產(chǎn)品缺陷數(shù)據(jù)關(guān)聯(lián)規(guī)則模糊分類方法,通過(guò)缺陷關(guān)聯(lián)規(guī)則距離計(jì)算和聚類達(dá)到關(guān)聯(lián)規(guī)則分類的目的。相比以往的研究不同之處在于,該方法通過(guò)建立模糊結(jié)構(gòu)分類樹提前對(duì)關(guān)聯(lián)規(guī)則距離進(jìn)行了求解,進(jìn)一步縮短了數(shù)據(jù)掃描的耗時(shí);在進(jìn)行規(guī)則距離計(jì)算時(shí),通過(guò)給模糊結(jié)構(gòu)分類樹層次間添加模糊隸屬度,能夠更有效建立不同屬性項(xiàng)目之間的屬性差異;采用SOMC聚類的方法,把高維數(shù)據(jù)映射到低維輸出空間,使得關(guān)聯(lián)規(guī)則距離數(shù)據(jù)更加集中,分類的準(zhǔn)確度更高。以冷軋帶鋼表面缺陷數(shù)據(jù)為例進(jìn)行驗(yàn)證,結(jié)果表明該方法在處理大量數(shù)據(jù)關(guān)聯(lián)規(guī)則分類問(wèn)題上是可行的。

        [1] Xu R, Wunsch D. Survey of clustering algorithms[J]. IEEE Transaction on Neural Networks, 2005, 16(3): 645-678.

        [2] Toivonen H, Klemettinen M, Ronkainen P, et al. Pruning and grouping discovered association rules[J]. Anesthesiology, 2008, 73(3A):971-975.

        [3] Strehl A,Gupta G K,Ghosh J. Distance based clustering of association rules[C]. St Louis, Missouri:Proc of Intelligent Engineering Systems Through Artificial Neural Networks, 1999:759-764.

        [4] Chen G Q, Wei Q. Fuzzy association rules and the extended mining algorithms[J].Information Sciences, 2002,147:201-228.

        [5] 阮備軍,朱揚(yáng)勇.基于商品分類信息的關(guān)聯(lián)規(guī)則聚類[J].計(jì)算機(jī)研究與發(fā)展,2004,41(2):352-360.

        [6] 沈斌,姚敏,劉艷彬.基于帶語(yǔ)義差別的模糊Taxonomy的交易數(shù)據(jù)庫(kù)關(guān)聯(lián)規(guī)則聚類[J].情報(bào)學(xué)報(bào),2010,29(2):246-253.

        [7] 劉軍偉.鋼鐵工業(yè)泛在信息匹配推送服務(wù)體系及其實(shí)現(xiàn)方法研究[D]. 武漢:武漢科技大學(xué),2015.

        [8] 陳安,陳寧,周龍?bào)J,等.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M].北京:科學(xué)出版社,2006:203,221.

        [9] Goldberg A V. An efficient implementation of a scaling minimum-cost flow algorithm[J]. Journal of Algorithms, 1997, 22:1-29.

        [責(zé)任編輯 鄭淑芳]

        Fuzzy classification of defect data association rules based on attribute differences

        LiYi,KongJianyi,WangXingdong,LiuJunwei

        (College of Machinery and Automation, Wuhan University of Science and Technology, Wuhan 430081,China)

        In light of the fact that the association rules for defect data produced in the industrial process cannot be effectively organized after data mining, this paper proposes a fuzzy method for classification of defect data association rules on the basis of project attribute differences. Based on the fuzzy structure tree, the distance between the association rules is calculated, and the result is analyzed by the method of self-organizing neural network clustering. The proposed method is applied to the clustering analysis of data mining on the surface defects of cold rolled strip. The results show that the proposed method can not only obtain the correlation between two different attribute items but also find the distance between the defect association rules. The closer the distance association rules that are grouped into one class, the more similar they are.

        cold rolled strip; product defect; attribute; association rule; fuzzy classification; distance; cluster analysis; visualization

        2016-09-06

        國(guó)家自然科學(xué)基金面上項(xiàng)目(51174151);湖北省重大科技創(chuàng)新計(jì)劃項(xiàng)目(2013AAA011);湖北省自然科學(xué)基金資助項(xiàng)目(2013CFA131).

        李 怡(1991-),男,武漢科技大學(xué)碩士生.E-mail:yilee1991@qq.com

        孔建益(1961-),男,武漢科技大學(xué)教授,博士生導(dǎo)師.E-mail:kongjianyi@wust.edu.cn

        10.3969/j.issn.1674-3644.2017.01.010

        TH164

        A

        1674-3644(2017)01-0049-06

        猜你喜歡
        權(quán)值關(guān)聯(lián)聚類
        一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
        CONTENTS
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        奇趣搭配
        基于DBSACN聚類算法的XML文檔聚類
        基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
        亚洲无码图| 日本a级片免费网站观看| 国产乱人伦av在线麻豆a| 国产欧美成人一区二区a片| 亚洲中文字幕在线观看| 国产精品福利视频一区| 亚洲女同精品一区二区久久 | 少妇饥渴xxhd麻豆xxhd骆驼| 久久中文字幕日韩无码视频| 国产精品av免费网站| 99久久国产免费观看精品| 国产成人无码一区二区三区| 欧美狠狠入鲁的视频777色| 中文字幕人妻丝袜乱一区三区| 久久免费精品国产72精品剧情| 久久国产精品懂色av| 国产三级视频不卡在线观看 | 欧美xxxxx在线观看| 国产高清一区二区三区视频| 99国产精品丝袜久久久久| 日韩成人精品一区二区三区| 人妻少妇被粗大爽视频| 护士的小嫩嫩好紧好爽| 久久夜色精品国产噜噜av| 亚洲熟女av超清一区二区三区| 日韩精品有码中文字幕| 亚洲av高清天堂网站在线观看| www婷婷av久久久影片| 人妻丰满熟妇av无码区hd| 中文字幕在线久热精品| 中文字幕精品乱码一区| 久久人妻一区二区三区免费| 色爱av综合网站| 亚洲精品毛片一区二区三区| 日韩精品精品一区二区三区| 精品亚洲国产亚洲国产| 草草影院发布页| 久久久久亚洲精品无码网址色欲| 亚洲国产cao| 久久精品久久精品中文字幕| 少妇一级淫片中文字幕|