楊波,崔澤昊,彭程,孫恪成,陳俊鋒
(中海油能源發(fā)展股份有限公司采油服務(wù)分公司,天津 300452)
壓縮系統(tǒng)內(nèi)包含三類設(shè)備,洗滌器、壓縮機、后冷卻器,壓縮機主要有雙螺桿式和往復(fù)式兩種類型[1-2]。在設(shè)備運行的過程中獲取的數(shù)據(jù)信息對設(shè)備運行狀態(tài)潛在的故障及運行趨勢進(jìn)行準(zhǔn)確的分析是必不可少的環(huán)節(jié)[3]。而當(dāng)前國內(nèi)大多數(shù)工廠采集數(shù)據(jù)方式落后,導(dǎo)致對機組產(chǎn)生故障原因的分析不夠全面有效。近幾年人工智能發(fā)展迅速,機器學(xué)習(xí)、深度學(xué)習(xí)等得到了迅速發(fā)展。現(xiàn)有的基于深度學(xué)習(xí)的診斷模型包括深度自動編碼器、深度信念網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)四大主流診斷模型[4]。
運用深度學(xué)習(xí)的方法能夠?qū)?shù)據(jù)進(jìn)行自動提取并進(jìn)行組合輸入特征,這種方式避免了人工判別造成的主觀性問題,降低了傳統(tǒng)故障判別法的不確定性因素[5]。本文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的閃蒸汽壓縮機故障分析和診斷的研究方法,希望通過數(shù)據(jù)的深度挖掘與分析,能夠?qū)㈤W蒸汽壓縮機的各項監(jiān)測數(shù)據(jù)更加直觀簡明的呈現(xiàn),且能正確的映射各級設(shè)備之間健康狀況的關(guān)系,以提升系統(tǒng)監(jiān)測數(shù)據(jù)的能力。并且,通過卷積神經(jīng)網(wǎng)絡(luò)中自有的分類器實現(xiàn)在監(jiān)測系統(tǒng)中自主提取數(shù)據(jù)中的特征參數(shù),提取之后進(jìn)行識別和儲存。通過模型訓(xùn)練之后,能夠有效對數(shù)據(jù)進(jìn)行預(yù)測。
提出的故障分析過程有四個部分:①數(shù)據(jù)收集與預(yù)處理:對數(shù)據(jù)進(jìn)行收集整理,對存在缺陷的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;②故障分析:對壓縮機常見的故障進(jìn)行分析;③模型建立:對數(shù)據(jù)進(jìn)行分析,建立模型并預(yù)測未來工作狀態(tài)的模型;④可視化:分析的數(shù)據(jù)以圖表和表格的形式呈現(xiàn)給工作人員,以便進(jìn)行實時管理。閃蒸汽壓縮機組故障分析框架圖見圖1。
圖1 閃蒸汽壓縮機組故障分析框架
所采用的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)最初是由多層感知機(MLP)演變而來[6],其能夠?qū)崿F(xiàn)局部連接和共享權(quán)值,權(quán)值共享可以減少權(quán)值數(shù)量達(dá)到降低卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜的效果,可簡化數(shù)據(jù)在時間上和空間上的維數(shù),局部連接使得過度擬合的程度降低。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)由權(quán)重和偏置常量構(gòu)成。其優(yōu)點是能夠共享權(quán)值和進(jìn)行局部連接,在處理高維數(shù)據(jù)時可以減少數(shù)據(jù)量,縮短運行時間。主要由輸入層、全連接層、激活函數(shù)、卷積層和池化層組成。通過卷積神經(jīng)網(wǎng)絡(luò)能夠完成監(jiān)測數(shù)據(jù)的特征提取、降維和分類的全過程,可避免數(shù)據(jù)的丟失,也減少了計算量[7]。卷積神經(jīng)網(wǎng)絡(luò)工作原理見圖2。
圖2 卷積神經(jīng)網(wǎng)絡(luò)原理示意
壓縮機組工作環(huán)境較為嘈雜,采集到的數(shù)據(jù)量較多且復(fù)雜,因而需要對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,重點是對原始數(shù)據(jù)中的缺失值進(jìn)行處理,故考慮采用樣條插值對數(shù)據(jù)進(jìn)行補全[8]。樣條插值是將原始長序列分割成若干段并構(gòu)造多個n次函數(shù),使得分段的銜接處具有n-1階導(dǎo)數(shù)連續(xù)的性質(zhì)即平滑連接,設(shè)在區(qū)間a=x0 f(xi)=yi(i=0,1,…,n) (1) 將壓縮機原始數(shù)據(jù)進(jìn)行處理后,輸入神經(jīng)網(wǎng)絡(luò)模型中,進(jìn)入到卷積層對輸入信號進(jìn)行卷積計算從而提取特征。根據(jù)壓縮機數(shù)據(jù)特點,采用下式替代卷積運算。 (2) 卷積層進(jìn)行特征提取后,輸出的特征通過池化層(Pooling Layer)完成特征選擇和信號過濾。這里采用的池化操作為最大池化,最大池化操作可以在周期性信號中剔除與信號位置無關(guān)的特征,均值化與最大值池化原理見圖3。 圖3 均值化與最大值化示意 在神經(jīng)網(wǎng)絡(luò)中添加激活層是為了將輸出信號添加一些非線性因素,使得神經(jīng)網(wǎng)絡(luò)能夠較好的解決復(fù)雜問題。激活函數(shù)分為雙曲正切函數(shù)、S型函數(shù)和修正線性單元函數(shù)。 采用修正線性單元ReLU(Rectified Linear Unit)函數(shù)的計算公式如下,其函數(shù)圖見圖4。 圖4 ReLU(Rectified Linear Unit)函數(shù) al(i,j)=f(yl(i,j))=max{0,yl(i,j)} (3) 在經(jīng)過卷積層、激活層和池化層提取到的特征,在全連接層將在濾波級提取出的數(shù)據(jù)特征來分類,見圖5,采用ReLU函數(shù)、Softmax函數(shù)有便于目標(biāo)函數(shù)的分析和對比[9]。 圖5 全連接層展開示意 (4) 根據(jù)閃蒸汽壓縮機的數(shù)據(jù)特點,建立一維卷積神經(jīng)網(wǎng)絡(luò)模型(簡稱:1DCNN),對監(jiān)測到的數(shù)據(jù)分別進(jìn)行訓(xùn)練和測試[10]。 3.1.1 數(shù)據(jù)整合與劃分 閃蒸汽壓縮機數(shù)據(jù)主要由壓縮機、洗滌器、后冷卻器、調(diào)節(jié)閥四個功能點相對應(yīng)的傳感器收集的數(shù)據(jù)作為數(shù)據(jù)集。采集一個周期內(nèi)閃蒸汽壓縮機的運行數(shù)據(jù),對收集到的數(shù)據(jù)進(jìn)行劃分,數(shù)據(jù)樣本由原始數(shù)據(jù)和數(shù)據(jù)標(biāo)簽(標(biāo)簽為各點位數(shù)據(jù)增大、減小、正常三個標(biāo)簽組成,記為X0、X1、X2)組成,壓縮機監(jiān)測數(shù)據(jù)能夠用于本卷積神經(jīng)網(wǎng)絡(luò)模型的測試和訓(xùn)練,選取1 000個訓(xùn)練樣本,按20%作為測試集、80%作為訓(xùn)練集。訓(xùn)練集作為CNN模型訓(xùn)練,測試集用于訓(xùn)練的CNN模型的測試。數(shù)據(jù)劃分見表1。 表1中X0、X1、X2分別代表各點位數(shù)據(jù)X0為增大、X1為減小、X2為正常,Y0、Y1、Y2、Y3分別代表Y0為壓縮機、Y1為洗滌器、Y2為后冷卻器、Y3為調(diào)節(jié)閥。 表1 數(shù)據(jù)劃分表 3.1.2 CNN模型訓(xùn)練 根據(jù)前述神經(jīng)網(wǎng)絡(luò)層數(shù)組成方法,針對壓縮機組數(shù)據(jù)的故障特性,設(shè)計一維卷積神經(jīng)網(wǎng)絡(luò)模型,其具體組成見圖6。 圖6 一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 建立的CNN模型由2個卷積層,2個池化層,1個全連接層及1個Softmax層組成,數(shù)據(jù)通過第1個卷積層和激活函數(shù)ReLU層,形成第一組特征數(shù)據(jù),輸入最大池化層進(jìn)行降采樣。重復(fù)上述操作后將全連接層通過激活函數(shù)傳遞到Softmax層。第一層卷積核大小設(shè)置為12×1,步長設(shè)置為8×1,第一層池化大小設(shè)置為2×1,第二層卷積核大小為3×x1,池化大小設(shè)置為2×1,步長為2×1,全連接層的神經(jīng)元個數(shù)設(shè)置為600。 該模型第一卷積層的卷積核設(shè)置為12×1,第二層的卷積核設(shè)置為3×1,其一大一小的設(shè)置主要目的在于:將第一層設(shè)置為大卷積核可以有效提取輸入信號的最大特征,并自動學(xué)習(xí)面向故障診斷的特征,自動去除與故障無關(guān)的特征。大卷積核的設(shè)置將輸入信號最大化利用,有助于后續(xù)的分析。將第二層的卷積核設(shè)置為小卷積核能夠有效防止神經(jīng)網(wǎng)絡(luò)的過度擬合。設(shè)置CNN各項參數(shù)見表2。 表2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù) 通過Python在Tensorflow環(huán)境下設(shè)計本實驗所需要的CNN模型。經(jīng)過設(shè)計的模型訓(xùn)練監(jiān)測數(shù)據(jù)后可得出本次實驗所需的目標(biāo)函數(shù)值,通過更新訓(xùn)練模塊中模型的權(quán)值可以在測試階段更好的對輸入數(shù)據(jù)進(jìn)行識別和診斷。所建立的一維卷積神經(jīng)網(wǎng)絡(luò)故障診斷流程見圖7。 圖7 一維卷積神經(jīng)網(wǎng)絡(luò)故障診斷流程 閃蒸汽壓縮機組的故障通常在壓縮機、洗滌器、后冷卻器、調(diào)節(jié)閥這4個功能點上,因此分別取來自4個功能點的數(shù)據(jù)組成4個數(shù)據(jù)集,通過數(shù)據(jù)集來判斷具體的故障點和故障類型。分別取4個功能點的1 000組數(shù)據(jù)組成A、B、C、D 4個數(shù)據(jù)集,每組數(shù)據(jù)點為1 000個傳感器采集的數(shù)據(jù),周期為2 min內(nèi)產(chǎn)生的數(shù)據(jù)。訓(xùn)練數(shù)據(jù)集隨機選擇800組,余下的200組作為測試數(shù)據(jù)集。用搭建的模型對4個數(shù)據(jù)集A、B、C、D進(jìn)行訓(xùn)練,為保證訓(xùn)練的可靠性,對于A、B、C、D數(shù)據(jù)集,每個數(shù)據(jù)集訓(xùn)練20次,訓(xùn)練后的結(jié)果見圖8。 圖8 迭代20次結(jié)果 從圖8中可得出:所設(shè)計的卷積神經(jīng)網(wǎng)絡(luò)模型在4個數(shù)據(jù)集上的識別率都達(dá)到了99.7%以上,經(jīng)全連接層識別之后,輸出的結(jié)果可以用于故障診斷,確切的識別故障產(chǎn)生的原因。 由于卷積神經(jīng)網(wǎng)絡(luò)初始權(quán)值具有隨機性,為了驗證訓(xùn)練結(jié)果的可靠性,對于4個數(shù)據(jù)集分別進(jìn)行迭代50、500、1 000次模型的故障識別準(zhǔn)確率分析,其結(jié)果見圖9、10。從3項迭代結(jié)果可知,隨著迭代次數(shù)的增加故障準(zhǔn)確率率也更準(zhǔn)確,當(dāng)訓(xùn)練次數(shù)達(dá)到1 000次時,故障識別準(zhǔn)確率升到了99%左右。由此可知,該神經(jīng)網(wǎng)絡(luò)模型相對于傳統(tǒng)的故障診斷方法,其故障識別率更準(zhǔn)確。 圖9 迭代500次結(jié)果 圖10 迭代1 000次結(jié)果 不同方法應(yīng)用于閃蒸汽壓縮機故障的準(zhǔn)確率不一致,比如傳統(tǒng)的人工判斷的方法相較于本文所使用的方法,其準(zhǔn)確率遠(yuǎn)低于本文所使用的方法。相關(guān)學(xué)者對于壓縮機故障診斷方法的研究表明,基于卷積神經(jīng)網(wǎng)絡(luò)的故障診斷方法其準(zhǔn)確率優(yōu)于其他方法。具體方法及其準(zhǔn)確率比較見表3。 表3 不同方法對比表 1)收集的原始監(jiān)測數(shù)據(jù)作為CNN模型的輸入,通過卷積層對數(shù)據(jù)進(jìn)行特征提取,可避免因人工選取特征而導(dǎo)致故障分析出現(xiàn)誤差。 2)提出的基于卷積神經(jīng)網(wǎng)絡(luò)故障分析和診斷的方法與傳統(tǒng)故障診斷方法相比,識別和診斷故障的準(zhǔn)確率更高。 3)通過訓(xùn)練和測試后的一維卷積神經(jīng)網(wǎng)絡(luò)模型具備自我學(xué)習(xí)能力,能夠較好地實現(xiàn)故障識別和診斷。3 CNN模型的建立與訓(xùn)練
3.1 一維CNN模型
3.2 結(jié)果分析
3.3 實驗對比分析
4 結(jié)論