崔世婷,郭 宇,汪偉麗,梁睿君
(南京航空航天大學(xué)機(jī)電學(xué)院,江蘇南京 210016)
在面向訂單生產(chǎn)的多品種、變批量離散制造車間中,生產(chǎn)異常時(shí)有發(fā)生,影響著訂單產(chǎn)品的質(zhì)量和完成時(shí)間。準(zhǔn)確的生產(chǎn)異常檢測(cè)為生產(chǎn)計(jì)劃的及時(shí)調(diào)整提供依據(jù),對(duì)提高產(chǎn)品質(zhì)量和生產(chǎn)效率具有重要的指導(dǎo)意義。制造物聯(lián)感知技術(shù)實(shí)時(shí)采集車間制造要素的狀態(tài)數(shù)據(jù)[1],為生產(chǎn)異常檢測(cè)提供了全面的制造數(shù)據(jù),保證從全局特征挖掘車間狀態(tài)信息,例如入緩存區(qū)缺料事件不僅與當(dāng)前入緩存區(qū)狀態(tài)有關(guān),設(shè)備加工狀態(tài)和物料轉(zhuǎn)運(yùn)狀態(tài)也直接影響生產(chǎn)是否按計(jì)劃進(jìn)行,所以基于強(qiáng)關(guān)聯(lián)性的多維度數(shù)據(jù)集,能實(shí)現(xiàn)生產(chǎn)異常的精準(zhǔn)檢測(cè)。同時(shí)離散制造車間存在訂單計(jì)劃難以預(yù)測(cè)、產(chǎn)品工藝流程復(fù)雜等特點(diǎn),增加了生產(chǎn)過(guò)程的不確定性和動(dòng)態(tài)性,使生產(chǎn)數(shù)據(jù)的分布規(guī)律隨時(shí)間推移發(fā)生變化,導(dǎo)致離線模型的準(zhǔn)確率降低。因此有必要提出一種數(shù)據(jù)驅(qū)動(dòng)的增量式異常檢測(cè)方法,在檢測(cè)異常的同時(shí)學(xué)習(xí)新數(shù)據(jù)并更新模型,以適應(yīng)當(dāng)前數(shù)據(jù)分布,保證異常檢測(cè)的速度和準(zhǔn)確度。
在車間生產(chǎn)過(guò)程中,異常事件的發(fā)生伴隨著制造數(shù)據(jù)中某些特征的變化,通過(guò)挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,能夠?qū)崿F(xiàn)生產(chǎn)異常的精準(zhǔn)檢測(cè)。文獻(xiàn)[2]總結(jié)飛機(jī)裝配車間異常事件的類別與原因,使用BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)車間異常的分類預(yù)警;文獻(xiàn)[3]針對(duì)質(zhì)量異常和交付期異常,分析量化車間異常影響因素,提出基于時(shí)序型的多深度神經(jīng)網(wǎng)絡(luò)模型;文獻(xiàn)[4]為檢測(cè)粉末床激光熔化時(shí)的產(chǎn)品異?;蛟O(shè)備異常,建立多尺度卷積神經(jīng)網(wǎng)絡(luò),對(duì)粉末床圖像進(jìn)行分類。上述有監(jiān)督學(xué)習(xí)方法通過(guò)標(biāo)簽數(shù)據(jù)與預(yù)測(cè)值之間的差值迭代優(yōu)化模型參數(shù),獲得高準(zhǔn)確率的異常檢測(cè)結(jié)果,但標(biāo)簽數(shù)據(jù)需要專業(yè)人員進(jìn)行標(biāo)記,對(duì)于海量制造數(shù)據(jù)而言,標(biāo)記困難,成本較高。而無(wú)監(jiān)督學(xué)習(xí)模型不依賴標(biāo)簽信息,直接挖掘特征數(shù)據(jù)間的內(nèi)在關(guān)聯(lián),發(fā)現(xiàn)車間生產(chǎn)異常。文獻(xiàn)[5]使用基于聚類的無(wú)監(jiān)督學(xué)習(xí)方法,分析熱軋帶鋼的生產(chǎn)工藝過(guò)程數(shù)據(jù),發(fā)現(xiàn)離群樣本,提高質(zhì)量檢測(cè)的針對(duì)性。文獻(xiàn)[6]選擇K?Means算法對(duì)車間的工序制造過(guò)程數(shù)據(jù)進(jìn)行聚類,標(biāo)記離群點(diǎn)為制造系統(tǒng)的可靠性分析提供依據(jù)。文獻(xiàn)[7]針對(duì)離散制造中未經(jīng)標(biāo)記的高維時(shí)間序列數(shù)據(jù),結(jié)合K?Means聚類與滑動(dòng)窗口技術(shù),發(fā)現(xiàn)異常數(shù)據(jù)。上述異常檢測(cè)方法通過(guò)無(wú)標(biāo)簽數(shù)據(jù)發(fā)現(xiàn)制造過(guò)程中的異常事件,但研究對(duì)象是靜態(tài)數(shù)據(jù)集,當(dāng)新數(shù)據(jù)抵達(dá)時(shí),為保證檢測(cè)精度需重新訓(xùn)練模型,對(duì)全部數(shù)據(jù)進(jìn)行批處理操作,未利用原模型獲得的知識(shí),導(dǎo)致訓(xùn)練時(shí)間長(zhǎng),檢測(cè)效率低。
與面向靜態(tài)數(shù)據(jù)集的批處理模式相比,增量式學(xué)習(xí)算法處理新數(shù)據(jù)時(shí)無(wú)需重建模型,僅更新原模型使其適應(yīng)當(dāng)前數(shù)據(jù)分布。目前增量學(xué)習(xí)在車間異常檢測(cè)的應(yīng)用并不多,但在其他領(lǐng)域上已有相關(guān)研究。文獻(xiàn)[8]針對(duì)因配電網(wǎng)運(yùn)行條件變化導(dǎo)致的概念漂移現(xiàn)象,提出一種基于優(yōu)選樣本集的增量聚類方法,提高了孤島檢測(cè)的準(zhǔn)確性和自適應(yīng)性。文獻(xiàn)[9]為了快速檢測(cè)網(wǎng)絡(luò)入侵事件,提出一種增量SVM算法,保留有可能成為支持向量的樣本,減輕學(xué)習(xí)過(guò)程中的波動(dòng),節(jié)省訓(xùn)練和預(yù)測(cè)時(shí)間。文獻(xiàn)[10]提出了一種基于增量聚類的晶圓故障在線檢測(cè)算法,快速識(shí)別晶圓的工藝漂移并修正模型。在檢測(cè)事件中引入增量機(jī)制使模型的精準(zhǔn)度更高、適應(yīng)性更強(qiáng),但增量學(xué)習(xí)算法面臨“穩(wěn)定性?可塑性困境”,需避免模型在自適應(yīng)學(xué)習(xí)新數(shù)據(jù)的同時(shí)遺忘已學(xué)習(xí)到的知識(shí)。
增強(qiáng)自組織增量神經(jīng)網(wǎng)絡(luò)(Enhanced Self?Organizing Incre?mental Neural Network,ESOINN)是一種增量式聚類算法,通過(guò)神經(jīng)元對(duì)輸入數(shù)據(jù)進(jìn)行競(jìng)爭(zhēng),獲得調(diào)整神經(jīng)元權(quán)值的機(jī)會(huì),拉近獲勝神經(jīng)元與輸入數(shù)據(jù)間的距離,保證下次出現(xiàn)同類數(shù)據(jù)時(shí)擁有更高的勝率。該過(guò)程每次學(xué)習(xí)只更新模型局部區(qū)域,滿足了模型增量學(xué)習(xí)新知識(shí)的要求,也保留了歷史學(xué)習(xí)結(jié)果,從而實(shí)現(xiàn)拓?fù)浣Y(jié)構(gòu)對(duì)輸入數(shù)據(jù)的精確表征?;谝陨戏治觯褂迷隽渴剿惴‥SOINN檢測(cè)離散制造車間中的生產(chǎn)異常,在保存歷史學(xué)習(xí)結(jié)果的基礎(chǔ)上使用當(dāng)前數(shù)據(jù)修正模型,分離不同類別的簇,實(shí)現(xiàn)異常事件的實(shí)時(shí)檢測(cè)。最后結(jié)合某航天離散制造車間提供的11487條具有102 個(gè)特征的生產(chǎn)數(shù)據(jù),進(jìn)行算法的實(shí)例驗(yàn)證和對(duì)比分析,并在離散制造車間生產(chǎn)異常檢測(cè)系統(tǒng)中搭建基于ESOINN的生產(chǎn)異常檢測(cè)環(huán)境對(duì)車間狀態(tài)進(jìn)行監(jiān)控,證明了所提方法在離散制造車間生產(chǎn)異常實(shí)時(shí)檢測(cè)上的有效性。
以某擁有12臺(tái)設(shè)備的航天產(chǎn)品機(jī)加車間為例,對(duì)生產(chǎn)異常檢測(cè)問(wèn)題進(jìn)行研究,車間中每個(gè)工位包括一臺(tái)機(jī)床、一個(gè)入緩存區(qū)和一個(gè)出緩存區(qū),在制品或物料通過(guò)AGV從上個(gè)工位或倉(cāng)庫(kù)轉(zhuǎn)運(yùn)到本工位進(jìn)入緩存區(qū)等待加工,其加工順序遵循先進(jìn)先出規(guī)則。在制品在某工位的生產(chǎn)過(guò)程分為以下4個(gè)步驟:(1)在制品或物料通過(guò)AGV轉(zhuǎn)運(yùn)到該工位入緩存區(qū)等待加工;(2)在設(shè)備上進(jìn)行加工;(3)加工完進(jìn)入出緩存區(qū)等待轉(zhuǎn)運(yùn);(4)轉(zhuǎn)運(yùn)至下個(gè)工位等待加工。因此,基于在制品在車間的生產(chǎn)流轉(zhuǎn)過(guò)程,將制造車間中的生產(chǎn)異常事件概括為以下五種:入緩存區(qū)在制品堆積、入緩存區(qū)物料短缺、出緩存區(qū)在制品堆積、在制品加工時(shí)間延時(shí)、物料轉(zhuǎn)運(yùn)狀態(tài)異常。
基于制造車間加工流程,將描述上述五類異常的制造數(shù)據(jù)分為入緩存區(qū)狀態(tài)、出緩存區(qū)狀態(tài)、機(jī)器狀態(tài)、轉(zhuǎn)運(yùn)狀態(tài)數(shù)據(jù)。入緩存區(qū)狀態(tài)數(shù)據(jù)包括入緩存區(qū)的在制品排隊(duì)隊(duì)列、在制品等待加工時(shí)間,為保證每一時(shí)刻的特征數(shù)量一致,空缺位置用0填充;出緩存區(qū)狀態(tài)數(shù)據(jù)包括在制品排隊(duì)隊(duì)列、在制品等待轉(zhuǎn)運(yùn)時(shí)間;機(jī)器狀態(tài)包括機(jī)器的工作狀態(tài)(“正在加工”,“等待”,“故障”)、加工在制品種類、設(shè)備持續(xù)運(yùn)行時(shí)間、上次故障至今的時(shí)間;轉(zhuǎn)運(yùn)狀態(tài)包括配送的在制品種類、在制品數(shù)量、AGV位置與持續(xù)配送時(shí)間。
基于2.1節(jié)定義的五種車間生產(chǎn)異常事件,提出一個(gè)多模塊的生產(chǎn)異常檢測(cè)體系架構(gòu),包括車間數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理和基于ESOINN模型的離線訓(xùn)練和在線檢測(cè),總體架構(gòu),如圖1所示。
圖1 離散制造車間生產(chǎn)異常檢測(cè)框架Fig.1 A framework for Production Anomaly Detection in Discrete Manufacturing Workshops
RFID、UWB 等物聯(lián)感知設(shè)備在離散制造車間的部署,采集到各類制造要素的實(shí)時(shí)狀態(tài)信息,為生產(chǎn)異常分析提供了數(shù)據(jù)基礎(chǔ),由于數(shù)據(jù)來(lái)源眾多,不同特征之間的數(shù)量級(jí)差別大,為消除因量綱不同帶來(lái)的影響,使用式(1)的z?score標(biāo)準(zhǔn)化方法,實(shí)現(xiàn)將所有特征轉(zhuǎn)換為均值為0,方差為1的縮放。
式中:μ—特征的平均值;σ—特征的方差。
數(shù)據(jù)預(yù)處理為異常檢測(cè)模型提供高質(zhì)量數(shù)據(jù)集,異常檢測(cè)分為離線訓(xùn)練和在線檢測(cè)兩個(gè)階段:離線階段訓(xùn)練歷史生產(chǎn)數(shù)據(jù)獲得初始檢測(cè)模型;在線階段實(shí)現(xiàn)生產(chǎn)數(shù)據(jù)的實(shí)時(shí)檢測(cè),同時(shí)學(xué)習(xí)新數(shù)據(jù)更新模型的拓?fù)浣Y(jié)構(gòu),保證模型隨數(shù)據(jù)分布而更新。
ESOINN 是一種對(duì)輸入數(shù)據(jù)進(jìn)行拓?fù)浔硎镜母?jìng)爭(zhēng)性神經(jīng)網(wǎng)絡(luò)[11],其中每個(gè)神經(jīng)元節(jié)點(diǎn)代表與輸入數(shù)據(jù)同緯度的向量,節(jié)點(diǎn)之間的連接構(gòu)成了多個(gè)子圖,每個(gè)子圖可近似地表達(dá)同類型數(shù)據(jù)的分布情況。ESOINN的實(shí)現(xiàn)主要包括新節(jié)點(diǎn)的建立、節(jié)點(diǎn)權(quán)值的更新、重疊類的分離、同類的合并等步驟。
ESOINN 算法開始時(shí)隨機(jī)選擇兩條輸入數(shù)據(jù)建立初始神經(jīng)元節(jié)點(diǎn),在后續(xù)數(shù)據(jù)的輸入中,選擇增加新節(jié)點(diǎn)或改變獲勝節(jié)點(diǎn)權(quán)值兩種更新方法,更新規(guī)則如下:新數(shù)據(jù)x到達(dá)時(shí)尋找歐式距離最近的兩個(gè)節(jié)點(diǎn)n1和n2,若x與n1之間的距離大于相似度閾值Tn1或者x與n2之間的距離大于相似度閾值Tn2,則將x作為新節(jié)點(diǎn)插入網(wǎng)絡(luò)中,反之說(shuō)明已存在能夠表達(dá)x的拓?fù)渥訄D,無(wú)需建立新節(jié)點(diǎn),更新獲勝節(jié)點(diǎn)權(quán)值即可。其中,相似度閾值Tn1和Tn2使用式(2)或式(3)計(jì)算獲得:若節(jié)點(diǎn)n擁有鄰居節(jié)點(diǎn),使用式(2)計(jì)算它與鄰居節(jié)點(diǎn)的最大距離作為相似度閾值,若節(jié)點(diǎn)n無(wú)鄰居節(jié)點(diǎn),使用式(3)計(jì)算它與其他所有節(jié)點(diǎn)的最小距離作為相似度閾值。
式中:Vn—節(jié)點(diǎn)n的鄰居節(jié)點(diǎn)集合;Wn—節(jié)點(diǎn)n的權(quán)值;V—所有節(jié)點(diǎn)集合。
可以看出,式(2)和式(3)的計(jì)算與節(jié)點(diǎn)分布有關(guān),相似度閾值會(huì)隨著數(shù)據(jù)分布的變化自適應(yīng)改變。
若新數(shù)據(jù)根據(jù)相似度閾值判斷屬于獲勝節(jié)點(diǎn),ESOINN使用式(4)和式(5)更新第一優(yōu)勝節(jié)點(diǎn)n1和其鄰居節(jié)點(diǎn)的權(quán)值,并將n1與所有鄰居節(jié)點(diǎn)之間的連接邊次數(shù)加1,實(shí)現(xiàn)新數(shù)據(jù)的學(xué)習(xí)過(guò)程。
式中:Mn1—節(jié)點(diǎn)n1成為第一優(yōu)勝節(jié)點(diǎn)的次數(shù);
Wi—節(jié)點(diǎn)n1鄰居節(jié)點(diǎn)的權(quán)值。
ESOINN 在學(xué)習(xí)過(guò)程中可能出現(xiàn)類別重疊現(xiàn)象,即處于重疊區(qū)域的節(jié)點(diǎn)與多個(gè)類別的節(jié)點(diǎn)有連接。重疊區(qū)的節(jié)點(diǎn)密度明顯低于聚類中心的節(jié)點(diǎn)密度,所以ESOINN 在分離重疊區(qū)域時(shí),首先找到局部最高密度的節(jié)點(diǎn)們給與不同標(biāo)簽,再分別標(biāo)記與這些節(jié)點(diǎn)相連接的其他節(jié)點(diǎn),若一個(gè)節(jié)點(diǎn)具有多個(gè)標(biāo)記說(shuō)明該節(jié)點(diǎn)位于重疊區(qū)域內(nèi)。ESOINN 使用平均累計(jì)密度hn描述節(jié)點(diǎn)密度,hn的計(jì)算如式(6)~式(8)所示,使用節(jié)點(diǎn)與鄰居節(jié)點(diǎn)的距離衡量密度值。
式中:λ—一個(gè)學(xué)習(xí)周期中樣本個(gè)數(shù);k—學(xué)習(xí)周期個(gè)數(shù);T—在所有k個(gè)學(xué)習(xí)周期中節(jié)點(diǎn)n獲勝過(guò)的次數(shù);pn—節(jié)點(diǎn)n在每一次樣本學(xué)習(xí)中的單次密度值;dˉn—節(jié)點(diǎn)n與其所有鄰居節(jié)點(diǎn)的平均距離;m—節(jié)點(diǎn)n的鄰居節(jié)點(diǎn)個(gè)數(shù),若n是獲勝節(jié)點(diǎn),與n相鄰節(jié)點(diǎn)越多,平均距離越小,節(jié)點(diǎn)密度越大。
若某類數(shù)據(jù)被誤分為多個(gè)子類,ESOINN 在分離重疊區(qū)時(shí),局部最高密度節(jié)點(diǎn)增多,會(huì)檢測(cè)到許多重疊區(qū)。所以ESOINN為不同子類提供了合并的機(jī)會(huì):若兩個(gè)獲勝節(jié)點(diǎn)屬于同一子類或存在新節(jié)點(diǎn)的情況下,連接兩個(gè)節(jié)點(diǎn)并設(shè)置連接邊的數(shù)量為0;若兩個(gè)節(jié)點(diǎn)分屬不同子類,但滿足式(9)或式(10),連接兩個(gè)獲勝節(jié)點(diǎn),合并兩個(gè)子類。
式中,hn1、hn2—第一和第二優(yōu)勝節(jié)點(diǎn)的密度;Amax、Bmax—A類和B類的頂點(diǎn)密度,其中,αA使用式(11)中的閾值函數(shù)自動(dòng)計(jì)算,meansA代表A類中所有節(jié)點(diǎn)的平均密度。
隨著輸入樣本的增多,若兩個(gè)連接節(jié)點(diǎn)長(zhǎng)時(shí)間未被同一樣本激活,連接邊次數(shù)逐漸增大到預(yù)定值agemax,則刪除節(jié)點(diǎn)間的連接。針對(duì)噪聲引起的節(jié)點(diǎn),ESOINN根據(jù)以下規(guī)則進(jìn)行周期性刪除:(1)節(jié)點(diǎn)沒有鄰居節(jié)點(diǎn);(2)節(jié)點(diǎn)擁有一個(gè)鄰居節(jié)點(diǎn)滿足公式(12);(3)節(jié)點(diǎn)擁有兩個(gè)鄰居節(jié)點(diǎn)滿足式(13)。
其中,由自定義參數(shù)c1和c2的設(shè)定值控制刪除節(jié)點(diǎn)的頻率,一般情況下c1取0.001,c2取1[11]。算法結(jié)束時(shí),將所有能通過(guò)一系列邊連接的節(jié)點(diǎn)標(biāo)記為同一類別,劃分出多個(gè)子圖構(gòu)成的拓?fù)浣Y(jié)構(gòu),得到最后的聚類結(jié)果。
選擇某航天機(jī)加車間中為研究對(duì)象,當(dāng)前車間從事8種工件加工,采集連續(xù)生產(chǎn)過(guò)程中的制造數(shù)據(jù),每條數(shù)據(jù)具有102個(gè)特征描述生產(chǎn)狀態(tài)。ESOINN算法增量式的學(xué)習(xí)新數(shù)據(jù),以滿足模型對(duì)實(shí)時(shí)生產(chǎn)狀態(tài)的準(zhǔn)確表達(dá),本實(shí)驗(yàn)的驗(yàn)證過(guò)程分為兩階段:(1)第一階段選擇8847條連續(xù)生產(chǎn)過(guò)程中的無(wú)標(biāo)簽數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集1,篩選和標(biāo)注600條數(shù)據(jù)作為測(cè)試集1,其中正常生產(chǎn)狀態(tài)數(shù)據(jù)、入緩存區(qū)在制品堆積數(shù)據(jù)、入緩存區(qū)物料短缺數(shù)據(jù)、出緩存區(qū)在制品堆積數(shù)據(jù)、在制品加工時(shí)間延時(shí)數(shù)據(jù)、物料轉(zhuǎn)運(yùn)狀態(tài)異常數(shù)據(jù)各100 條,且每條數(shù)據(jù)只屬于一種異常類型。使用ESOINN算法對(duì)訓(xùn)練集1進(jìn)行聚類獲得穩(wěn)定的初始拓?fù)浣Y(jié)構(gòu)后,輸入測(cè)試集1 中有標(biāo)簽數(shù)據(jù)進(jìn)行在線檢測(cè),得到每條數(shù)據(jù)的檢測(cè)類別;(2)第二階段繼續(xù)按實(shí)際生產(chǎn)順序選擇1440 條無(wú)標(biāo)簽數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集2,再次篩選和標(biāo)注600條數(shù)據(jù)作為測(cè)試集2,其中各類別數(shù)據(jù)各100 條。在第一階段獲得的模型基礎(chǔ)上,對(duì)訓(xùn)練集2繼續(xù)進(jìn)行增量式的學(xué)習(xí),動(dòng)態(tài)更新模型后,輸入測(cè)試數(shù)據(jù)集2進(jìn)行在線檢測(cè)。分別記錄訓(xùn)練集和測(cè)試集的聚類結(jié)果,如表1所示。
表1 ESOINN聚類結(jié)果Tab.1 Clustering Results of ESOINN
對(duì)上述實(shí)驗(yàn)獲得的聚類結(jié)果進(jìn)行統(tǒng)計(jì),兩個(gè)測(cè)試集中各600條有標(biāo)簽數(shù)據(jù)的分布結(jié)果,如表2所示。
表2 有標(biāo)簽數(shù)據(jù)在各類簇中的分布Tab.2 Distribution of Labeled Data in Clusters
分別定義入緩存區(qū)在制品堆積、入緩存區(qū)物料短缺、出緩存區(qū)在制品堆積、在制品加工時(shí)間延時(shí)、物料轉(zhuǎn)運(yùn)狀態(tài)異常為異常1?5,通過(guò)分析階段1和階段2中測(cè)試集數(shù)據(jù)的分布結(jié)果可以總結(jié)如下:(1)正常數(shù)據(jù)主要分布在簇1,4,5,將此三類定義為正常數(shù)據(jù);(2)異常1主要分布在簇8,將該類定義為入緩存區(qū)在制品堆積;(3)異常2主要分布在簇3,將該類定義為入緩存區(qū)物料短缺;(4)異常3主要分布在簇2,將該類定義為出緩存區(qū)在制品堆積;(5)異常4主要分布在簇6,將該類定義為在制品加工時(shí)間延時(shí);(6)異常5主要分布在簇7,將該類定義為物料轉(zhuǎn)運(yùn)狀態(tài)異常。
基于以上分析,計(jì)算兩個(gè)測(cè)試集的聚類準(zhǔn)確率,得到以下結(jié)論:測(cè)試集1的聚類準(zhǔn)確率為97.17%,測(cè)試集2的聚類準(zhǔn)確率為98.33%,模型的檢測(cè)精度隨生產(chǎn)狀態(tài)改變并未降低,且提高了1.16個(gè)百分點(diǎn),可知ESOINN 能學(xué)習(xí)實(shí)時(shí)數(shù)據(jù)修正模型,提高模型對(duì)車間生產(chǎn)規(guī)律變化的適應(yīng)性。
使用T?SNE[12]算法對(duì)測(cè)試集2 中5 種異常數(shù)據(jù)的檢測(cè)結(jié)果進(jìn)行可視化展示,將500條異常數(shù)據(jù)映射到三維空間,異常1和異常2在三維空間的分布,如圖2(a)所示。異常3、異常4和異常5在三維空間的分布,如圖2(b)所示??梢钥闯鐾愋彤惓1粍澐值酵痪垲愔行闹車?,五種生產(chǎn)異常數(shù)據(jù)具有明顯邊界,僅存在少部分?jǐn)?shù)據(jù)遠(yuǎn)離簇中心的情況,原因可能是T?SNE算法傾向于保存局部特征,難以完整地映射高維數(shù)據(jù)到三維空間,或是部分異常數(shù)據(jù)未能準(zhǔn)確劃分類別。但從整體結(jié)果看,ESOINN算法具有較好的生產(chǎn)異常檢測(cè)效果。
圖2 異常1與異常2聚類結(jié)果、異常3、異常4與異常5聚類結(jié)果示意圖Fig.2 Schematic Diagram of Clustering Results of Anomaly 1 and Anomaly 2,and Clustering Results of Anomaly 3,Anomaly 4 and Anomaly 5
為了驗(yàn)證ESOINN在生產(chǎn)異常檢測(cè)上的有效性,選擇非增量式聚類算法Kmeans 和HC、增量式聚類算法InKmeans 和InDB?SCAN進(jìn)行聚類實(shí)驗(yàn),與ESOINN算法進(jìn)行對(duì)比分析。兩種增量式聚類算法與ESOINN算法的驗(yàn)證過(guò)程相同,Kmeans和HC算法不具備增量學(xué)習(xí)能力,僅面向靜態(tài)數(shù)據(jù)集建立模型,為驗(yàn)證該靜態(tài)模型對(duì)動(dòng)態(tài)變化數(shù)據(jù)的適應(yīng)性,使用階段1獲得的模型對(duì)測(cè)試集1和測(cè)試集2中數(shù)據(jù)進(jìn)行檢測(cè)。聚類算法的評(píng)價(jià)指標(biāo)包括檢測(cè)準(zhǔn)確率、檢測(cè)時(shí)間、Calinski?Harabaz 指數(shù)(Calinski?Harabaz In?dex,CH)和輪廓系數(shù)(Silhouette?Coefficient,SC),CH指數(shù)和輪廓系數(shù)為聚類性能指標(biāo)。CH指數(shù)的表示,如式(14)~式(16)所示:
式中:y—樣本數(shù);k—類別數(shù);Bc—類別之間的協(xié)方差矩陣;Wc—類別內(nèi)部數(shù)據(jù)的協(xié)方差矩陣;tr—矩陣的跡;Xˉi—第i個(gè)簇的聚類中心;Xˉ—所有數(shù)據(jù)樣本的聚類中心;Fi—第i個(gè)簇的所有數(shù)據(jù)樣本集合。數(shù)據(jù)類內(nèi)的協(xié)方差越小,類間協(xié)方差越大,CH 指數(shù)越高,代表聚類效果越好。輪廓系數(shù)SC 的表示,如式(17)所示:
式中:y—樣本數(shù);a(j)—樣本j到同類別其他樣本的平均距離,稱為樣本j的簇內(nèi)不相似度;b(j)—樣本j與不同類別中其他樣本的平均距離,稱為樣本j的簇間不相似度,SC分布在[?1,1]之間,數(shù)值越接近1,說(shuō)明同類樣本距離越近,不同類樣本距離越遠(yuǎn),聚類效果越好。
ESOINN算法與四種對(duì)比算法InDBSCAN、InKmeans、Kmeans和HC的實(shí)驗(yàn)結(jié)果,包括測(cè)試集1和測(cè)試集2的檢測(cè)準(zhǔn)確率、兩個(gè)測(cè)試集共計(jì)1200條數(shù)據(jù)的累計(jì)耗時(shí)、兩個(gè)測(cè)試集的聚類性能度量值CH和SC,如表3所示。
表3 不同聚類方法的性能對(duì)比Tab.3 Performance Comparison of Cluster Methods
從本實(shí)驗(yàn)中可以得到以下幾個(gè)結(jié)論:(1)從聚類結(jié)果來(lái)看,兩種非增量式聚類Kmeans和HC在測(cè)試集2上的準(zhǔn)確率相較于測(cè)試集1 都有所下降,而三種增量式算法ESOINN、InDBSCAN 和InKmeans隨新增數(shù)據(jù)的流入準(zhǔn)確率有所提高,因?yàn)樵隽渴剿惴ㄔ谟?xùn)練集2上也保持對(duì)數(shù)據(jù)的學(xué)習(xí)能力,調(diào)整了模型以適應(yīng)新數(shù)據(jù)分布,其中ESOINN通過(guò)神經(jīng)元之間的持續(xù)競(jìng)爭(zhēng)提高拓?fù)浣Y(jié)構(gòu)對(duì)數(shù)據(jù)的表達(dá)能力,在所有增量式聚類算法中檢測(cè)準(zhǔn)確率最高;(2)通過(guò)比較五種算法對(duì)兩次在線階段共計(jì)1200條數(shù)據(jù)進(jìn)行檢測(cè)的累計(jì)耗時(shí),可以發(fā)現(xiàn)三種增量式算法較兩種非增量式算法所需時(shí)間較長(zhǎng),因?yàn)樵隽渴骄垲惒粌H需要判斷數(shù)據(jù)類別,還要根據(jù)新數(shù)據(jù)調(diào)整模型參數(shù),其中InKmeans累計(jì)耗時(shí)最短,ESOINN次之,InDBSCAN最高;(3)根據(jù)測(cè)試集1和測(cè)試集2的聚類結(jié)果,對(duì)1200條有標(biāo)簽數(shù)據(jù)的檢測(cè)結(jié)果進(jìn)行計(jì)算,可知ESOINN在聚類的性能指標(biāo)CH和SC值上均優(yōu)于其他四種,因?yàn)镋SOINN重新定義了神經(jīng)元節(jié)點(diǎn)密度概念,為錯(cuò)分子類提供了合并或分離的機(jī)會(huì),有效提高了聚類效果。以上分析可知,ESOINN算法的增量學(xué)習(xí)能力能夠適應(yīng)車間生產(chǎn)數(shù)據(jù)的分布變化,實(shí)現(xiàn)在線檢測(cè)過(guò)程中對(duì)模型的動(dòng)態(tài)更新,從而構(gòu)建精準(zhǔn)的生產(chǎn)異常檢測(cè)模型。
以某航天產(chǎn)品機(jī)加車間為案例,設(shè)計(jì)離散制造車間生產(chǎn)異常檢測(cè)原型系統(tǒng),在系統(tǒng)中搭建基于ESOINN 的生產(chǎn)異常檢測(cè)環(huán)境,并開展應(yīng)用驗(yàn)證。首先完成車間物聯(lián)感知環(huán)境的硬件部署:在車間整體部署UWB基站和RFID天線,覆蓋車間所有加工工位,AGV與物料等制造要素帶有RFID和UWB標(biāo)簽,實(shí)時(shí)采集生產(chǎn)狀態(tài)數(shù)據(jù)。為減輕系統(tǒng)維護(hù)壓力、方便后期功能擴(kuò)展,生產(chǎn)異常檢測(cè)系統(tǒng)基于Eclipse 和Node.js開發(fā)平臺(tái),采用B/S架構(gòu)搭建,以Java作為開發(fā)語(yǔ)言,后臺(tái)調(diào)用Python程序?qū)崿F(xiàn)生產(chǎn)異常檢測(cè)功能。
為驗(yàn)證生產(chǎn)異常檢測(cè)系統(tǒng)的可行性,以車間某時(shí)刻的生產(chǎn)狀態(tài)為例進(jìn)行分析,物聯(lián)設(shè)備采集到實(shí)時(shí)車間生產(chǎn)狀態(tài)數(shù)據(jù),系統(tǒng)調(diào)用后臺(tái)ESOINN算法檢測(cè)異常事件是否發(fā)生,并將結(jié)果以彈窗形式推送給用戶,如圖3所示。再點(diǎn)擊查看,用戶可了解與當(dāng)前異常事件有關(guān)的各類制造要素狀態(tài)信息,如圖所示,為及時(shí)的生產(chǎn)調(diào)控提供依據(jù)。
圖3 生產(chǎn)異常消息推送Fig.3 Production Anomaly Message Push
圖4 生產(chǎn)異常實(shí)時(shí)狀態(tài)信息Fig.4 Production Anomaly Real?Time Status Information
在離散制造車間應(yīng)用生產(chǎn)異常檢測(cè)系統(tǒng),解決了因車間生產(chǎn)要素管理混亂難以實(shí)時(shí)檢測(cè)生產(chǎn)異常問(wèn)題,在系統(tǒng)中實(shí)時(shí)監(jiān)控在制品加工狀態(tài)、設(shè)備運(yùn)行狀態(tài)、物料轉(zhuǎn)運(yùn)狀態(tài)等生產(chǎn)過(guò)程信息,通過(guò)搭建的增量式異常檢測(cè)環(huán)境實(shí)現(xiàn)車間生產(chǎn)數(shù)據(jù)的檢測(cè)和在線學(xué)習(xí),準(zhǔn)確識(shí)別異常事件的發(fā)生,提高了車間制造過(guò)程的動(dòng)態(tài)響應(yīng)能力和異常檢測(cè)效率。
針對(duì)離散制造車間存在的異常,基于制造物聯(lián)系統(tǒng)采集多維度生產(chǎn)數(shù)據(jù),使用ESOINN增量聚類算法實(shí)現(xiàn)異常實(shí)時(shí)檢測(cè)的同時(shí)進(jìn)行增量式學(xué)習(xí),保持模型隨數(shù)據(jù)分布動(dòng)態(tài)更新。通過(guò)分析5種聚類算法的檢測(cè)準(zhǔn)確率、數(shù)據(jù)處理耗時(shí)和聚類結(jié)果的評(píng)價(jià)指標(biāo),驗(yàn)證了ESOINN在異常檢測(cè)問(wèn)題上的適用性,并在航天機(jī)加車間應(yīng)用生產(chǎn)異常檢測(cè)系統(tǒng),實(shí)際解決離散車間環(huán)境下的異常事件。在后續(xù)研究中可以對(duì)車間采集數(shù)據(jù)進(jìn)行特征降維,篩選出重要特征集合,降低后續(xù)檢測(cè)模型的復(fù)雜度、提高模型精度。其次可研究異常發(fā)生時(shí)采用何種決策保證生產(chǎn)的正常進(jìn)行,降低因生產(chǎn)異常造成的影響。