亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于高斯受限玻爾茲曼機(jī)的工業(yè)產(chǎn)品質(zhì)量智能異常檢測(cè)

        2023-01-06 08:25:44農(nóng)英雄
        工業(yè)工程 2022年6期
        關(guān)鍵詞:高斯分布神經(jīng)元能量

        黃 聰,農(nóng)英雄,張 毅

        (1.廣西中煙信息中心,廣西 南寧 530001;2.清華大學(xué) 自動(dòng)化系,北京 100018)

        工業(yè)4.0時(shí)代,制造過(guò)程具有生產(chǎn)工藝復(fù)雜、成本管控精細(xì)、產(chǎn)品質(zhì)量嚴(yán)格等特點(diǎn),通過(guò)技術(shù)手段確保并有效提升產(chǎn)品良率具有重要意義且需求迫切。產(chǎn)品質(zhì)量檢測(cè)是對(duì)產(chǎn)品或生產(chǎn)過(guò)程的一個(gè)或多個(gè)特征進(jìn)行測(cè)量、檢驗(yàn)、試驗(yàn)或估計(jì),并將結(jié)果與工藝要求進(jìn)行比較[1]。質(zhì)量檢測(cè)的特征參數(shù)由生產(chǎn)線上配備的傳感器或?qū)iT定制的檢測(cè)裝置測(cè)量得到。傳統(tǒng)上,質(zhì)量檢測(cè)的標(biāo)準(zhǔn)主要依賴于以往經(jīng)驗(yàn)所制定的規(guī)則。但是,現(xiàn)代工業(yè)產(chǎn)品多樣化,生產(chǎn)工藝更新較快,而且生產(chǎn)過(guò)程數(shù)據(jù)容易受到生產(chǎn)環(huán)境的影響,規(guī)則的準(zhǔn)確度均會(huì)大幅降低。另外,當(dāng)數(shù)據(jù)空間快速增長(zhǎng)時(shí),很難通過(guò)確定的規(guī)則對(duì)產(chǎn)品質(zhì)量進(jìn)行描述。

        隨著物理計(jì)算傳感技術(shù)以及人工智能技術(shù)的飛速發(fā)展,基于機(jī)器學(xué)習(xí)的智能異常檢測(cè)技術(shù)應(yīng)運(yùn)而生,由于其在應(yīng)對(duì)復(fù)雜工藝過(guò)程具有大大超越傳統(tǒng)方法的獨(dú)特優(yōu)勢(shì),得到學(xué)界和產(chǎn)業(yè)界的普遍關(guān)注,發(fā)展迅猛[2-4]。產(chǎn)品質(zhì)量的智能異常檢測(cè)成為確保產(chǎn)品高質(zhì)量穩(wěn)產(chǎn)出的重要保障手段,是工業(yè)智能運(yùn)維服務(wù)的重要環(huán)節(jié)之一。

        無(wú)監(jiān)督智能異常檢測(cè)技術(shù)的原理是獲取正常產(chǎn)品特征數(shù)據(jù)的分布范圍,一旦測(cè)量數(shù)據(jù)超過(guò)正常分布范圍,則視為異常數(shù)據(jù)。目前,用于解決無(wú)監(jiān)督異常檢測(cè)問(wèn)題的機(jī)器學(xué)習(xí)方法主要有單類支持向量機(jī)(one-class support vector machine,OCSVM)[5]、局部異常因子(local outlier factor,LOF)[6]、獨(dú)立森林(isolation forest,IF)[7]等,這些方法雖然具有一定的穩(wěn)健性并已取得一些較好的應(yīng)用,但是在應(yīng)對(duì)大規(guī)模數(shù)據(jù)時(shí),計(jì)算復(fù)雜度會(huì)大幅提高,尤其是在線檢測(cè)時(shí)異常檢測(cè)性能退化嚴(yán)重,并且擴(kuò)展性較差[8]。

        深度學(xué)習(xí)方法在高維大規(guī)模數(shù)據(jù)的非線性建模方面具有顯著優(yōu)勢(shì)。受限玻爾茲曼機(jī)(restricted Boltzmann machine,RBM) 模型是一種無(wú)向二分圖的神經(jīng)網(wǎng)絡(luò)模型,相對(duì)于深層神經(jīng)網(wǎng)絡(luò)模型,能夠以較少的計(jì)算消耗表征數(shù)據(jù)復(fù)雜關(guān)系。RBM不僅可以作為一個(gè)生成模型,基于隱變量對(duì)一組輸入變量的聯(lián)合分布進(jìn)行建模,還可以作為判別模型實(shí)施無(wú)監(jiān)督分類[9-10]。

        考慮到實(shí)際工業(yè)生產(chǎn)中產(chǎn)品參數(shù)的高斯特性,本文選取高斯RBM(GRBM) 用于建模,即可見(jiàn)層各神經(jīng)元是服從高斯分布的。與傳統(tǒng)基于GRBM異常檢測(cè)方法不同,本文研究聚焦用于描述網(wǎng)絡(luò)狀態(tài)的自由能量函數(shù)。文獻(xiàn)[11]與[12]同樣使用能量函數(shù)值作為異常控制標(biāo)準(zhǔn),但對(duì)自由能量函數(shù)的研究?jī)H限于此,且應(yīng)用領(lǐng)域與本文不同。本文將自由能量函數(shù)整合到目標(biāo)函數(shù)中。在不同的階段進(jìn)行不同的梯度補(bǔ)償,使訓(xùn)練過(guò)程易于處理。本文將FE-GRBM與3種常用的異常檢測(cè)方法OCSVM、LOF、IF以及兩種分別以重建誤差和能量得分為決策準(zhǔn)則的常規(guī)GRBM模型,在卷煙產(chǎn)品檢測(cè)的實(shí)際應(yīng)用案例中進(jìn)行比較分析,驗(yàn)證FE-GRBM的有效性和優(yōu)越性。

        1 受限玻爾茲曼機(jī)

        1.1 基本模型

        受限玻爾茲曼機(jī)(restricted Boltzmann machine,RBM) 是一種可用隨機(jī)神經(jīng)網(wǎng)絡(luò)(stochastic neural network,SNN) 解釋的概率圖模型(probabilistic graphical model,PGM) 。它由Smolensky于1986年在玻爾茲曼機(jī)(BM) 的基礎(chǔ)上提出。RBM采用兩層網(wǎng)絡(luò)來(lái)描述一組隨機(jī)變量之間的依賴關(guān)系,一層為隱藏層,另一層為可見(jiàn)層。相較于BM,RBM的層與層之間相互連接,但同一層內(nèi)各神經(jīng)元間沒(méi)有連接。RBM 具有如下性質(zhì)。

        性質(zhì)1當(dāng)給定可見(jiàn)層各單元狀態(tài)時(shí),隱藏層各單元的激活條件獨(dú)立;反之當(dāng)給定隱藏層各單元的狀態(tài)時(shí),可見(jiàn)層各單元的激活也條件獨(dú)立。

        RBM的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,n、m分別表示可見(jiàn)層和隱藏層神經(jīng)元個(gè)數(shù)??梢?jiàn)層狀態(tài)向量x=(x1,x2,···,xn)與隱藏層狀態(tài)向量h=(h1,h2,···,hm)相連接。a=(a1,a2,···,an)表示可見(jiàn)層的偏置向量,其中,ai是可見(jiàn)層第i個(gè)神經(jīng)元的偏置。b=(b1,b2,···,bm)表示隱藏層的偏置向量,其中,bj是可見(jiàn)層第j個(gè)神經(jīng)元的偏置。W=(wij∈Rm*n)表示可見(jiàn)層與隱藏層各神經(jīng)元之間的權(quán)重矩陣,其中,wij是可見(jiàn)層第i個(gè)神經(jīng)元和隱藏層第j個(gè)神經(jīng)元的連接權(quán)重。

        圖1 RBM模型結(jié)構(gòu)圖Figure 1 The RBM Model structure diagram

        RBM模型是一個(gè)基于能量的模型(energy based model,EBM),對(duì)于一組給定的狀態(tài)(x,h)能量函數(shù)定義為

        根據(jù)能量函數(shù),可以得到關(guān)于狀態(tài)的(x,h)聯(lián)合概率分布為

        為歸一化因子,又稱為配分函數(shù)(partition function) 。對(duì)于一個(gè)實(shí)際問(wèn)題,更關(guān)心關(guān)于觀測(cè)數(shù)據(jù)x的概率分布Pθ(x),即Pθ(x,h)的邊緣分布,也稱為似然函數(shù)(likelihood function),通過(guò)對(duì)所有可能的隱藏層狀態(tài)向量求和得到

        類似地,關(guān)于隱藏層狀態(tài)向量h的概率分布Pθ(h)的似然函數(shù)定義為

        給定訓(xùn)練數(shù)據(jù)后,訓(xùn)練一個(gè)RBM意味著調(diào)整參數(shù)θ,以擬合給定的訓(xùn)練樣本,使得該參數(shù)下RBM表示的概率分布盡可能地與訓(xùn)練數(shù)據(jù)相符合。假定訓(xùn)練數(shù)據(jù)X=(x1,x2,···,xl),l為訓(xùn)練數(shù)據(jù)數(shù)量,各數(shù)據(jù)滿足獨(dú)立同分布。這樣,訓(xùn)練RBM的目標(biāo)為最大化似然。為了簡(jiǎn)化計(jì)算,對(duì)似然的最大化等價(jià)于對(duì)似然對(duì)數(shù)的最大化。

        采用梯度上升法最大化式(6),通過(guò)迭代的方式逼近最大值,迭代公式為

        其中,η>0為學(xué)習(xí)率。

        由于式(3) 計(jì)算復(fù)雜度大,很難直接求得,對(duì)比散度(contrastive divergence,CD)[13]一般被用于訓(xùn)練。CD算法執(zhí)行k次吉布斯采樣,其具體步驟如下。對(duì)?x∈X,取初始值x(0):=X,經(jīng)過(guò)k步吉布斯采樣生成樣本x(k)。其中,第s步(s=1,2,···,k) 先后執(zhí)行從P(h|x(s-1))采樣出h(s-1)及從P(x|h(s-1))采樣出x(s)。利用k步吉布斯采樣后得到的x(k)近似計(jì)算梯度如下。

        一般設(shè)置k為1,即只進(jìn)行一次吉布斯采樣,就能達(dá)到較好的擬合效果[14]。

        1.2 變種模型

        傳統(tǒng)的RBM假設(shè)x∈{0,1},h∈{0,1},這種情況下RBM又稱為伯努利-伯努利RBM(Bernoulli -Bernoulli RBM,BRBM) 。相關(guān)公式如下。

        BRBM假設(shè)每個(gè)可見(jiàn)層神經(jīng)元和隱藏層神經(jīng)元的狀態(tài)都是二進(jìn)制的,而現(xiàn)實(shí)世界中很多數(shù)據(jù)參數(shù)的取值范圍都是不固定的且分布各異,這就大大限制了BRBM的應(yīng)用。雖然也可以通過(guò)一些方法改進(jìn)實(shí)現(xiàn)BRBM對(duì)其他分布的建模,但是效果較差。為了更好地對(duì)連續(xù)分布建模,提出通過(guò)修改能量函數(shù)的模型改進(jìn),使用高斯可見(jiàn)層神經(jīng)元替代伯努利可見(jiàn)層神經(jīng)元,即高斯-伯努利RBM(Gaussian-Bernoulli RBM,GRBM)[15]。GRBM的能量函數(shù)定義為

        其中,σi定義為第i個(gè)可見(jiàn)單元高斯噪音的標(biāo)準(zhǔn)差。

        2 方法描述

        本文提出一種基于自由能量函數(shù)的GRBM故障檢測(cè)方法,即自由能量函數(shù)GRBM(free energy GRBM,FE-GRBM) 。該方法采用GRBM作為數(shù)據(jù)模型框架,利用自由能量與邊緣概率自然對(duì)數(shù)的線性關(guān)系,提出基于能量分值的模型訓(xùn)練策略和故障檢測(cè)方案。

        2.1 訓(xùn)練方法

        模型的訓(xùn)練算法一般通過(guò)參數(shù)的對(duì)數(shù)似然函數(shù)(log-likelihood,LL)(式(6)) 最大化實(shí)現(xiàn)參數(shù)更新。但是由于配分函數(shù)計(jì)算復(fù)雜度大,很難直接在訓(xùn)練時(shí)計(jì)算得到,采用CD算法作為訓(xùn)練算法執(zhí)行梯度上升操作。CD算法利用k(一般取k=1) 步吉布斯采樣近似計(jì)算梯度,而重構(gòu)誤差被直接用于訓(xùn)練的性能度量。重構(gòu)誤差為吉布斯采樣生成樣本與原始訓(xùn)練數(shù)據(jù)的均方差距離,雖然計(jì)算方便,但是對(duì)模型訓(xùn)練而言是一種非常差的度量[16]。

        GRBM模型中,每個(gè)可見(jiàn)層神經(jīng)元都服從高斯分布。可見(jiàn)層神經(jīng)元的邊界分布P(x)是每一個(gè)可見(jiàn)層神經(jīng)元的聯(lián)合概率密度。每個(gè)神經(jīng)元的高斯程度可以使用邊界分布來(lái)表示。數(shù)據(jù)的聯(lián)合概率密度越高則每個(gè)神經(jīng)元的概率越高,數(shù)據(jù)更有可能正常。相反,聯(lián)合概率密度越低,數(shù)據(jù)更可能異常,即異常程度與P(x)成反比。

        其中,F(xiàn)是自由能量函數(shù)。

        由于配分函數(shù)(式(3)) 不可計(jì)算,可見(jiàn)層神經(jīng)元的邊界分布也很難得到。但是每個(gè)數(shù)據(jù)的配分函數(shù)值相等??梢酝ㄟ^(guò)抵消配分函數(shù),并對(duì)P(x) 求對(duì)數(shù),得到式(13) 。同時(shí),由于異常程度是與P(x)成反比的,因此可以使用自由能量值作為數(shù)據(jù)分類的決策指標(biāo)。

        為了簡(jiǎn)化計(jì)算,設(shè)置可見(jiàn)層神經(jīng)元的邊緣分布方差為1,得到

        將自由能量作為模型學(xué)習(xí)的目標(biāo)函數(shù),得到新的對(duì)數(shù)似然函數(shù)為

        其中,x是原始數(shù)據(jù);是重構(gòu)數(shù)據(jù)。

        根據(jù)式(15) 得到梯度如下。

        2.2 異常檢測(cè)

        在線檢測(cè)階段,需要建立一個(gè)監(jiān)控統(tǒng)計(jì)量對(duì)新進(jìn)數(shù)據(jù)進(jìn)行實(shí)時(shí)檢測(cè)。最直接的方法是采用SPE統(tǒng)計(jì)量作為監(jiān)控指標(biāo),當(dāng)重構(gòu)誤差超過(guò)檢測(cè)控制限后,即可視為故障數(shù)據(jù)。但是這個(gè)檢測(cè)控制限難于確定,因?yàn)殡m然原始數(shù)據(jù)及其重構(gòu)數(shù)據(jù)遵循多元高斯分布,但它們之間是相互依賴的,兩個(gè)相互依賴的多元高斯分布之間的差異不一定是高斯分布。因此,直接選用SPE統(tǒng)計(jì)量作為監(jiān)控指標(biāo)是不合適的。

        2.1 節(jié)分析確定了自由能量與邊緣分布自然對(duì)數(shù)的負(fù)線性關(guān)系,考慮到故障檢測(cè)主要目標(biāo)是進(jìn)行正確的判別,尤其是有效識(shí)別出真正的故障,而不是非要構(gòu)建一個(gè)精確的數(shù)據(jù)模型,因此可以將-F(x)作為監(jiān)控統(tǒng)計(jì)量。新進(jìn)數(shù)據(jù)的自由能量可以直接通過(guò)式(15) 計(jì)算得到,式中的ai、bj及wij皆可在離線建模階段求得。另外,可見(jiàn)層神經(jīng)元通過(guò)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)高斯分布且相互獨(dú)立,獨(dú)立高斯分布的積仍是高斯分布,那么可見(jiàn)層神經(jīng)元的邊緣分布P(x)也服從標(biāo)準(zhǔn)高斯分布。

        根據(jù)式(13),得到

        可以看到,F(xiàn)(x)與x2是成正比關(guān)系的,而x服從標(biāo)準(zhǔn)正態(tài)分布,則x2服從標(biāo)準(zhǔn)正態(tài)分布,相應(yīng)地,x也應(yīng)服從標(biāo)準(zhǔn)正態(tài)分布。因此,本文采用高斯核密度估計(jì)技術(shù)(kernel density estimation,KDE) 來(lái)確定F(x)統(tǒng)計(jì)量的控制限。

        KDE通過(guò)非參數(shù)方式估計(jì)隨機(jī)變量概率密度函數(shù)[17]。概率密度函數(shù)(probability density function,PDF) 的基本估算公式為

        其中,xi是觀測(cè)數(shù)據(jù)點(diǎn);t是窗口寬度;n是觀測(cè)值數(shù)量;K是核函數(shù)。核函數(shù)滿足

        核函數(shù)有幾種類型,如高斯核、不平滑核和余弦核等。考慮到F(x)統(tǒng)計(jì)量的高斯分布特征,選用高斯核函數(shù)。高斯核函數(shù)的數(shù)學(xué)形式為

        另一個(gè)關(guān)鍵問(wèn)題是需要提前明確窗口寬度t。通常通過(guò)平均積分平方誤差(mean integrated squared error,MISE) 計(jì)算得到

        首先,計(jì)算正常訓(xùn)練數(shù)據(jù)的-F(x)值。其次,使用KDE估計(jì)-F(x)統(tǒng)計(jì)量的PDF。最后,通過(guò)逆累積分布函數(shù)(inverse cumulative distribution function,ICDF) 求得PDF的相應(yīng)分位數(shù),并將其作為置信限,當(dāng)新進(jìn)數(shù)據(jù)的-F(x)統(tǒng)計(jì)值小于控制限,則為故障數(shù)據(jù)。

        2.3 算法實(shí)現(xiàn)

        FE-GRBM方法的整體流程見(jiàn)算法1。整個(gè)數(shù)據(jù)集包括訓(xùn)練集、驗(yàn)證集及測(cè)試集需要首先經(jīng)過(guò)統(tǒng)一的預(yù)處理實(shí)現(xiàn)度量一致。

        數(shù)據(jù)預(yù)處理采用零相位成分分析(zero-phase component analysis,ZCA) 白化技術(shù)。該技術(shù)(式(24))源于PCA,區(qū)別在于沒(méi)有減少原始數(shù)據(jù)的維度。

        其中,xi是原輸入向量;x(PCA)是對(duì)x進(jìn)行PCA處理;λi是第i個(gè)特征值;ε是一個(gè)很小的常量用于避免公式分母為0,通常設(shè)置為10-5。ZCA模型是通過(guò)正常數(shù)據(jù)訓(xùn)練特征向量ui和特征值λi計(jì)算得到的。所有的原始數(shù)據(jù)都需要通過(guò)ZCA模型預(yù)處理,以得到最小相關(guān)度且具有相同方差的一組特征量。

        模型初始需要對(duì)超參數(shù)Γ進(jìn)行初始化,包括W、b、a、動(dòng)量標(biāo)量m、小批次樣本量、隱單元數(shù)、學(xué)習(xí)率及稀疏度等。這些超參在訓(xùn)練過(guò)程不是固定值,而是在一個(gè)值域中波動(dòng)。通常,調(diào)節(jié)前5個(gè)參數(shù)就足夠了。在每個(gè)迭代周期結(jié)束,通過(guò)計(jì)算驗(yàn)證集的分類性能度量,取最高值的相應(yīng)參數(shù)值。

        整個(gè)FE-GRBM異常檢測(cè)框架如圖2所示。離線建模階段通過(guò)正常歷史數(shù)據(jù)建立ZCA數(shù)據(jù)預(yù)處理模型及GRBM模型,并使用KDE方法求解確定-F(x) 的控制限。在線檢測(cè)階段,新進(jìn)數(shù)據(jù)首先通過(guò)ZCA模型進(jìn)行白化預(yù)處理,然后根據(jù)GRBM模型計(jì)算求得監(jiān)控統(tǒng)計(jì)量-F(x) 值,將該值與控制限比較,若小于控制限則該樣本為異常樣本,否則繼續(xù)檢測(cè)下一個(gè)樣本。

        圖2 FE-GRBM異常檢測(cè)框架Figure 2 The framework of FE-GRBM

        3 煙支成品異常檢測(cè)

        煙支成品檢測(cè)是卷煙質(zhì)量檢驗(yàn)的一個(gè)重要組成部分[18]。本文對(duì)廣西南寧卷煙廠煙支成品實(shí)際檢測(cè)數(shù)據(jù)開(kāi)展案例分析,驗(yàn)證FE-GRBM的應(yīng)用效果。廣西南寧卷煙廠煙支成品重要物理指標(biāo)的檢測(cè)數(shù)據(jù)是由煙支/濾棒綜合測(cè)試臺(tái)采集得到的。本案例所使用的數(shù)據(jù)集由22 640個(gè)煙支檢測(cè)實(shí)例組成,每個(gè)實(shí)例包含6個(gè)參數(shù),分別為重量、圓周、吸入阻力、通風(fēng)度、硬度和長(zhǎng)度。這些實(shí)例的質(zhì)量異常情況均是結(jié)合專家根據(jù)自己的經(jīng)驗(yàn)和知識(shí)進(jìn)行綜合感官驗(yàn)證后得到的標(biāo)注,其中66個(gè)實(shí)例為異常樣本,占總樣本的不到0.3%。

        實(shí)驗(yàn)將FE-GRBM與3個(gè)通用的異常檢測(cè)方法OCSVM、IF和LOF性能比較,用于驗(yàn)證FE-GRBM在無(wú)監(jiān)督分類方面的優(yōu)越性。另外,還將FE-GRBM與傳統(tǒng)GRBM、采用重構(gòu)誤差作為監(jiān)控統(tǒng)計(jì)量的RE-GRBM方法比較,用于驗(yàn)證基于自由能量的學(xué)習(xí)和監(jiān)控策略的優(yōu)勢(shì)和必要性。所有用于比較的方法均直接利用scikit-learn工具箱編程[19]實(shí)現(xiàn),各方法的超參數(shù)則通過(guò)交叉驗(yàn)證與網(wǎng)格搜索相結(jié)合的方法選擇最優(yōu)值。表1中列出了所有比較方法主要超參數(shù)的搜索空間。實(shí)驗(yàn)所有的結(jié)果都是用50個(gè)獨(dú)立實(shí)驗(yàn)的測(cè)試平均值計(jì)算得到的。

        表1 實(shí)驗(yàn)比較方法主要超參的搜索空間Table 1 The search-space list of the main super-parameters from the comparison methods

        分類方法性能通過(guò)受試者工作特征曲線下面積(receiver operating characteristic-area under curve,ROC-AUC) 和平均精度(average precision,AP) 作為評(píng)價(jià)指標(biāo)。實(shí)驗(yàn)采取交叉驗(yàn)證方法開(kāi)展。隨機(jī)選取80%的正常樣本用于訓(xùn)練,80%的異常樣本以及相等數(shù)量的正常數(shù)據(jù)用于測(cè)試,剩下的正常數(shù)據(jù)以及20%的異常樣本用于驗(yàn)證。所有的數(shù)據(jù)集包括訓(xùn)練集、驗(yàn)證集及測(cè)試集均需統(tǒng)一的標(biāo)準(zhǔn)化預(yù)處理。OCSVM、LOF和IF實(shí)施標(biāo)準(zhǔn)化預(yù)處理。其他方法使用ZCA白化預(yù)處理。在OCSVM,選擇rbf為核函數(shù),通過(guò)調(diào)節(jié)核系數(shù)來(lái)選擇最好的結(jié)果。在LOF和IF中,異常點(diǎn)比例設(shè)置為0.05。

        實(shí)驗(yàn)首先采用熱力圖技術(shù)對(duì)正常數(shù)據(jù)的相關(guān)性進(jìn)行分析,圖3為正常數(shù)據(jù)6個(gè)變量的相關(guān)系數(shù)熱力圖??梢钥吹?,變量間具有顯著的線性不相關(guān)性。

        圖3 正常數(shù)據(jù)變量相關(guān)系數(shù)熱力圖Figure 3 The heat map of correlation coefficient of normal data

        實(shí)驗(yàn)中,F(xiàn)E-GRBM的隱藏層神經(jīng)元個(gè)數(shù)設(shè)置為20。為了避免權(quán)重爆炸,設(shè)定學(xué)習(xí)率為0.000 5,動(dòng)量參數(shù)設(shè)置為0.95,以提高學(xué)習(xí)速度??傊芷跀?shù)為1 000,每個(gè)學(xué)習(xí)周期設(shè)置學(xué)習(xí)樣本個(gè)數(shù)為200。在建立好GRBM模型后,分別計(jì)算每個(gè)正常樣本點(diǎn)的-F(x) 統(tǒng)計(jì)量。然后使用KDE來(lái)確定-F(x) 統(tǒng)計(jì)量的上限作為監(jiān)控限。圖4為通過(guò)KDE方法確定控制限的效果展示。圖中虛線與x軸的交點(diǎn)是PDF的5%分位點(diǎn),作為-F(x) 統(tǒng)計(jì)量的監(jiān)控限。當(dāng)新進(jìn)樣本點(diǎn)xi的統(tǒng)計(jì)值-F(x) 小于監(jiān)控限時(shí),則被檢測(cè)為異常樣本。

        圖4 KDE方法效果展示Figure 4 The illustration of KDE

        實(shí)驗(yàn)結(jié)果見(jiàn)圖5和表2。在ROC-AUC空間,ROC-AUC得分表示ROC曲線下的面積,而ROC曲線通過(guò)計(jì)算5種異常檢測(cè)方法在不同閾值下的異常預(yù)測(cè)假陽(yáng)性率和真陽(yáng)性率(見(jiàn)式(25)) 的對(duì)應(yīng)情況來(lái)反映檢測(cè)效果。式(25) 中,TP是真質(zhì)量異常樣本數(shù);TN是真質(zhì)量正常樣本數(shù);FP是假質(zhì)量異常樣本數(shù);FN是假質(zhì)量正常樣本數(shù)。因此,ROC-AUC得分是對(duì)異常檢測(cè)效果的無(wú)差別評(píng)估,不偏向于多數(shù)類或少數(shù)類。比較5種方法的ROC-AUC得分,LOF表現(xiàn)最差,IF其次,OCSVM、RE-GRBM與FE-GRBM均表現(xiàn)很好,取得了最高分值。

        表2 實(shí)驗(yàn)比較結(jié)果Table 2 The experimental comparison results

        圖5 實(shí)驗(yàn)比較結(jié)果散點(diǎn)圖Figure 5 The scatter diagram of experimental comparison results

        在PR空間,AP得分(式(26)) 是對(duì)PR曲線(precision-recall,PR) 精準(zhǔn)率取均值。式中,Pn和Rn分別是第n個(gè)閾值的精準(zhǔn)率和召回率。AP得分展示了5種異常檢測(cè)方法在不同概率閾值條件下精準(zhǔn)率與召回率的配對(duì)。精準(zhǔn)率和召回率(式(27)) 都是在不考慮假質(zhì)量正常樣本的情況下計(jì)算得到的真質(zhì)量異常樣本數(shù)量的指標(biāo)。因此,AP分值更關(guān)注于少數(shù)類,是一個(gè)針對(duì)非平衡分類問(wèn)題的有效評(píng)估指標(biāo)。比較5種方法的AP得分,傳統(tǒng)方法OCSVM、IF和LOF均表現(xiàn)很差,LOF得到了最高分0.50,基于GRBM的方法明顯高于傳統(tǒng)方法,其中FE-GRBM取得最高分值0.84,比LOF高出0.34。這表明OCSVM、IF和LOF針對(duì)異常樣本的漏檢率很高,而FE-GRBM檢測(cè)出異常樣本的效果最好。

        很顯然,基于GRBM的方法比其他3種經(jīng)典異常檢測(cè)方法(OCSVM、IF和LOF) 在高非線性異常檢測(cè)方面具有較大的優(yōu)勢(shì),F(xiàn)E-GRBM在本實(shí)驗(yàn)5種方法中體現(xiàn)了絕對(duì)的優(yōu)勢(shì)。3個(gè)經(jīng)典異常檢測(cè)方法平均性能得分最高是LOF,為0.63,F(xiàn)E-GRBM高于LOF,為0.92。這說(shuō)明OCSVM、IF和LOF在處理高非線性多維度異常檢測(cè)問(wèn)題方面具有劣勢(shì),基于GRBM的方法能夠很好地解決這個(gè)問(wèn)題。FE-GRBM平均得分高于RE-GRBM 0.04,這驗(yàn)證了使用基于自由能量函數(shù)的學(xué)習(xí)策略和監(jiān)控策略的優(yōu)越性。

        4 結(jié)論

        本文針對(duì)傳統(tǒng)多元統(tǒng)計(jì)分析方法在處理非平衡非線性異常檢測(cè)問(wèn)題上的缺陷,利用淺層深度神經(jīng)網(wǎng)絡(luò)在非線性建模和算法復(fù)雜性上的綜合優(yōu)勢(shì),提出基于自由能量高斯玻爾茲曼機(jī)的故障檢測(cè)方法FE-GRBM。利用自由能量函數(shù)與概率密度函數(shù)的反向線性關(guān)系,設(shè)計(jì)基于自由能量函數(shù)的學(xué)習(xí)策略,有效解決使用重構(gòu)誤差訓(xùn)練效果差的問(wèn)題;并在此基礎(chǔ)上提出改進(jìn)的監(jiān)控策略。通過(guò)煙支成品異常檢測(cè)的實(shí)際工業(yè)案例,驗(yàn)證FE-GRBM的優(yōu)越性。下一步將繼續(xù)對(duì)不同的實(shí)際工業(yè)應(yīng)用場(chǎng)景進(jìn)行應(yīng)用研究。

        猜你喜歡
        高斯分布神經(jīng)元能量
        《從光子到神經(jīng)元》書評(píng)
        自然雜志(2021年6期)2021-12-23 08:24:46
        利用Box-Cox變換對(duì)移動(dòng)通信中小區(qū)級(jí)業(yè)務(wù)流量分布的研究
        2種非對(duì)稱廣義高斯分布模型的構(gòu)造
        能量之源
        躍動(dòng)的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
        詩(shī)無(wú)邪傳遞正能量
        一種基于改進(jìn)混合高斯模型的前景檢測(cè)
        基于二次型單神經(jīng)元PID的MPPT控制
        開(kāi)年就要正能量
        都市麗人(2015年2期)2015-03-20 13:32:31
        毫米波導(dǎo)引頭預(yù)定回路改進(jìn)單神經(jīng)元控制
        国产欧美日韩图片一区二区| 国产xxx69麻豆国语对白| 夜先锋av资源网站| 久久久精品3d动漫一区二区三区| 亚洲AV无码久久久久调教| av新型国产在线资源| 中文字幕人成乱码熟女| 久久久久久人妻一区二区三区| 国产乱人伦偷精品视频免| 国产午夜在线观看视频| 高黄暴h日本在线观看| 亚洲欧美激情精品一区二区| 欧美综合区| 亚洲不卡高清av在线| 国产无套内射又大又猛又粗又爽| 亚洲av无码av男人的天堂| 国产爆乳无码一区二区在线| 精品久久一区二区av| 国产精品日日做人人爱| 免费看泡妞视频app| 免费国产一级片内射老| 中文字幕乱码人妻在线| 欧美最猛黑人xxxx| 窝窝影院午夜看片| 日韩极品视频在线观看免费| 日韩精品视频在线观看无| 亚洲一区二区三区av无码| 国内精品大秀视频日韩精品| 精品久久日产国产一区| 在线播放av不卡国产日韩| 男女爱爱好爽视频免费看| 综合91在线精品| 激情五月六月婷婷俺来也| 国产精品爽爽ⅴa在线观看| 亚洲av有码在线天堂| 亚洲青涩在线不卡av| 日本一区二区三区人妻| 一区二区三区在线 | 欧| 中文字幕精品一二三区| 久久精品国产亚洲av四区| 亚洲欧美日韩中文字幕一区二区三区|