司志梅,段志剛,趙慶婕
(中國(guó)石化江蘇油田分公司石油工程技術(shù)研究院,江蘇揚(yáng)州 225009)
游梁式抽油機(jī)是石油開采中關(guān)鍵的機(jī)械設(shè)備之一,掌握抽油機(jī)設(shè)備運(yùn)行狀態(tài)是原油安全生產(chǎn)的重要工作。
目前應(yīng)用的抽油機(jī)故障診斷技術(shù)總體可分為兩類:第一類是人工巡檢,依靠技術(shù)人員的豐富經(jīng)驗(yàn)通過“看聽摸查聞”,分析抽油機(jī)的運(yùn)行情況,判斷抽油機(jī)是否存在故障,這種方法人為因素影響大,識(shí)別準(zhǔn)確率低,且人工工作量大,不能滿足抽油機(jī)工況實(shí)時(shí)診斷和油田信息化、智能化管理的要求;第二類是人工智能診斷技術(shù),利用計(jì)算機(jī)自動(dòng)識(shí)別技術(shù)實(shí)時(shí)檢測(cè)抽油機(jī)運(yùn)行數(shù)據(jù),通過振動(dòng)信號(hào)分析和神經(jīng)網(wǎng)絡(luò)故障診斷等手段進(jìn)行分析、推測(cè),有效實(shí)現(xiàn)抽油機(jī)故障分類及預(yù)警[1-3]。人工智能診斷技術(shù)主要檢測(cè)電動(dòng)機(jī)、減速器等設(shè)備的振動(dòng)信號(hào)或是懸點(diǎn)示功圖的形態(tài)變化特征,并未對(duì)抽油機(jī)運(yùn)行的音頻信號(hào)進(jìn)行診斷。
當(dāng)抽油機(jī)運(yùn)行狀態(tài)發(fā)生變化,音頻信號(hào)的特性也會(huì)隨之變化,對(duì)音頻信號(hào)進(jìn)行分析與處理,也是實(shí)現(xiàn)抽油機(jī)故障診斷的一種有效的方法[4]。因此,提出了一種基于大數(shù)據(jù)分析的抽油機(jī)故障音頻智能診斷方法,利用抽油機(jī)音頻智能采集器采集抽油機(jī)的音頻數(shù)字信號(hào),把音頻信號(hào)轉(zhuǎn)換為特征圖像(語(yǔ)譜圖),利用深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像進(jìn)行分類識(shí)別,實(shí)現(xiàn)抽油機(jī)故障分類和故障報(bào)警。
抽油機(jī)故障音頻智能診斷原理是將音頻數(shù)據(jù)分幀、加窗,轉(zhuǎn)換為特征語(yǔ)譜圖,利用深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像進(jìn)行識(shí)別分類。
音頻信號(hào)在10~30 ms 內(nèi)可以認(rèn)為是平穩(wěn)的,短時(shí)特性不變。首先是將采樣音頻分成每份20 ms 長(zhǎng)的音頻塊,然后對(duì)每個(gè)音頻塊進(jìn)行特征提取。以傅里葉變換為例,提取頻譜特征的過程,就是將聲波分解成一個(gè)個(gè)組成部分,分離低音部分,再分離下一個(gè)最低音的部分,以此類推。然后將(從低到高)每個(gè)頻段中的能量相加,就為各個(gè)類別的音頻片段創(chuàng)建了一個(gè)指紋。本文分析了音頻傳統(tǒng)特征包括:音頻圖、短時(shí)能量、能量譜、Mel 頻率倒譜系數(shù)MFCC、相位譜等,綜合比較各種特征在訓(xùn)練模型上的表現(xiàn),語(yǔ)譜圖效果最好。語(yǔ)譜圖的生成過程包括:①音頻信號(hào)分幀;②加窗處理(漢明窗);③對(duì)每一幀信號(hào)做傅里葉變換,得到頻譜;④多幀處理,生成MFCC 圖,再進(jìn)行對(duì)數(shù)處理后得到語(yǔ)譜圖[5-6]。語(yǔ)譜圖將音頻信號(hào)轉(zhuǎn)換成數(shù)字圖像,其橫軸、縱軸分別為時(shí)間和頻率,顏色的深淺則表示對(duì)應(yīng)頻率的強(qiáng)弱。根據(jù)錄取的抽油機(jī)音頻數(shù)據(jù)對(duì)應(yīng)提取的特征圖像如圖1所示。
圖1 部分正常音頻和故障音頻特征語(yǔ)譜圖
近些年隨著深度學(xué)習(xí)的發(fā)展,深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別處理中表現(xiàn)出了越來越高的準(zhǔn)確度[7]。本文以此為基礎(chǔ),把音頻數(shù)據(jù)轉(zhuǎn)換為特征圖像(語(yǔ)譜圖),利用深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)音頻特征圖像進(jìn)行分類識(shí)別。典型的卷積網(wǎng)絡(luò)是由卷積層、池化層、全連接層組成。其中卷積層與池化層配合,組成多個(gè)卷積組,逐層提取特征,最終通過若干個(gè)全連接層完成分類[8-9]。深度卷積神經(jīng)網(wǎng)絡(luò)通過卷積來模擬特征區(qū)分,并且通過卷積的權(quán)值共享及池化,來降低網(wǎng)絡(luò)參數(shù)的數(shù)量級(jí),最后通過傳統(tǒng)神經(jīng)網(wǎng)絡(luò)完成分類任務(wù),有效降低反饋神經(jīng)網(wǎng)絡(luò)(傳統(tǒng)神經(jīng)網(wǎng)絡(luò))的復(fù)雜性,共享卷積核,對(duì)高維數(shù)據(jù)處理無壓力,無需手動(dòng)選取特征,訓(xùn)練好權(quán)重,即得特征,分類效果好(見圖2)。
圖2 深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
抽油機(jī)故障音頻智能診斷系統(tǒng)由前端音頻智能采集器與后端系統(tǒng)軟件組成。前端音頻智能采集器負(fù)責(zé)采集、處理井場(chǎng)音頻并傳輸至遠(yuǎn)程服務(wù)器,后端系統(tǒng)軟件進(jìn)行故障音頻的分析識(shí)別。
音頻智能采集器包括拾音模塊、采音模塊以及電源模塊,如圖3所示。
圖3 音頻智能采集器結(jié)構(gòu)
拾音模塊接收外部的聲音,進(jìn)行降噪等處理后,傳輸至采音模塊,采音模塊通過以太網(wǎng)將處理后的音頻數(shù)據(jù)傳輸至遠(yuǎn)程服務(wù)器。
音頻智能采集體系的拾音模塊主要有雙路麥克風(fēng)、降噪電路、雙運(yùn)放電路組成。雙路麥克風(fēng)設(shè)備可靠性高,抗干擾能力強(qiáng),靈敏度高,且具有較為合適的常數(shù)增益以及線性相位,能夠在環(huán)境溫度、濕度、振動(dòng)沖擊發(fā)生變化時(shí)避開干擾,獲取真實(shí)的音頻信號(hào),可將被測(cè)音頻有效地轉(zhuǎn)換為電信號(hào)。
采樣的數(shù)據(jù)集應(yīng)具有代表性并能包含大多數(shù)聲音信息,通過分析選用8 kHz 采樣率的采樣模塊。為保證存儲(chǔ)的有效性,要對(duì)在計(jì)算機(jī)中以幅度值進(jìn)行存儲(chǔ)的樣本數(shù)據(jù)進(jìn)行量化使其成為整數(shù),通過分析選擇可以表示-32 768~32 767 之間整數(shù)值的16位采樣位數(shù),將采樣幅度值量化為最近的整數(shù)值,從而確定選用的AD 采集模塊,采集模塊工作流程如圖4所示。
圖4 AD采音模塊
抽油機(jī)音頻的采集可通過在油井井場(chǎng)定點(diǎn)安裝固定式音頻采集器采集不同抽油機(jī)機(jī)型、不同工作制度、不同液量液性下的抽油機(jī)音頻數(shù)據(jù),包括正常生產(chǎn)音頻及日常隨機(jī)出現(xiàn)的抽油機(jī)故障音頻;同時(shí)可利用移動(dòng)式音頻采集器采集人為模擬的抽油機(jī)不常出現(xiàn)的故障音頻,包括十字頭松、中軸松、尾軸松、曲柄銷松(左右)、平衡塊松(左右)等人工模擬故障聲音。為實(shí)現(xiàn)抽油機(jī)音頻數(shù)據(jù)的多渠道采集,更精準(zhǔn)地采集到故障音頻數(shù)據(jù),開發(fā)了“油井故障音頻采集”手機(jī)小程序,現(xiàn)場(chǎng)技術(shù)人員可通過油井故障音頻采集小程序,錄入不同抽油機(jī)的故障音頻,通過移動(dòng)式音頻采集器、固定式音頻采集器以及手機(jī)小程序采集抽油機(jī)音頻,建立抽油機(jī)音頻庫(kù);充分結(jié)合抽油機(jī)領(lǐng)域?qū)<抑R(shí),分析抽油機(jī)各部件異常響聲關(guān)聯(lián)的故障類型,形成電機(jī)缺相運(yùn)行、電機(jī)軸承干磨、皮帶打滑、減速箱齒輪異響、平衡塊松(左、右)、曲柄銷松(左、右)、十字頭松、支架松、中軸松、尾軸松、壓杠松、光桿碰驢頭、驢頭銷子松、毛辮子磨驢頭等24 類故障音頻庫(kù),所有采集到的音頻數(shù)據(jù)除去故障音頻后歸檔到正常音頻庫(kù)。
抽油機(jī)故障音頻智能診斷系統(tǒng)架構(gòu)模型由后臺(tái)模型分析模塊、實(shí)時(shí)識(shí)別模塊和音頻管理模塊組成,如圖5所示。后臺(tái)分析模塊根據(jù)帶標(biāo)簽的音頻,提取聲學(xué)特征,訓(xùn)練模型,生成實(shí)時(shí)識(shí)別模塊需要的參數(shù),實(shí)時(shí)識(shí)別模塊和音頻管理模塊聯(lián)動(dòng),對(duì)多路采集來的音頻數(shù)據(jù)進(jìn)行分析,輸出故障類型。
圖5 診斷系統(tǒng)架構(gòu)模型
抽油機(jī)音頻數(shù)據(jù)轉(zhuǎn)化為特征圖像,應(yīng)用深度卷積神經(jīng)網(wǎng)絡(luò)圖形識(shí)別方法進(jìn)行診斷識(shí)別,直接應(yīng)用的效果是不理想和不穩(wěn)定的,其中主要的原因在于訓(xùn)練數(shù)據(jù)的組織方式和特征提取,雖然能夠在有限的故障音頻訓(xùn)練集上達(dá)到95%的精度,但是模型穩(wěn)定程度還有待使用更多的實(shí)際數(shù)據(jù)進(jìn)行驗(yàn)證。
綜合運(yùn)用遷移學(xué)習(xí)方法,改進(jìn)了模型的穩(wěn)定性,減少了誤報(bào)率。遷移學(xué)習(xí)是一種基于以前學(xué)習(xí)的基礎(chǔ)上繼續(xù)學(xué)習(xí)的方式,遷移學(xué)習(xí)是將已有問題的解決模型(如圖像識(shí)別)用在其他不同但相關(guān)問題上?;谶w移學(xué)習(xí),在少量標(biāo)簽數(shù)據(jù)上也實(shí)現(xiàn)了高分類精度。由于有些故障較難區(qū)分,導(dǎo)致標(biāo)簽存在一些不準(zhǔn)確的情況,給訓(xùn)練增加了一定的難度,模型很可能被不準(zhǔn)確的標(biāo)簽誤導(dǎo)。針對(duì)這種情況,采用自蒸餾的方式來解決,即給每個(gè)軟化前的標(biāo)簽賦予一定的概率,從而降低模型訓(xùn)練的難度。
基于大數(shù)據(jù)分析的抽油機(jī)故障音頻智能診斷技術(shù)在江蘇油田231 井次錄取6 000 余條特征音頻數(shù)據(jù),在112口油井安裝了音頻智能采集器,在音頻診斷服務(wù)器上安裝了抽油機(jī)音頻故障診斷及報(bào)警軟件,發(fā)現(xiàn)故障58井次,經(jīng)現(xiàn)場(chǎng)核驗(yàn),53井次故障診斷正確,故障診斷準(zhǔn)確率達(dá)91.4%,故障響應(yīng)時(shí)間平均縮短4 小時(shí),避免故障的復(fù)雜化,提高了管理水平,提高了設(shè)備完好率。
(1)抽油機(jī)故障音頻智能診斷技術(shù)兩大特點(diǎn):一是提出了利用音頻特征圖像提取、圖像分類識(shí)別,智能診斷抽油機(jī)故障的方法,實(shí)時(shí)診斷,提高了抽油機(jī)管理水平;二是依據(jù)構(gòu)建的大數(shù)據(jù)音頻分析平臺(tái),待數(shù)據(jù)量積累到十萬(wàn)、百萬(wàn)以上級(jí)別后,可以自動(dòng)學(xué)習(xí)出故障變化的規(guī)律。
(2)抽油機(jī)故障音頻智能診斷技術(shù)在江蘇油田112口油井現(xiàn)場(chǎng)應(yīng)用,發(fā)現(xiàn)故障58井次,經(jīng)現(xiàn)場(chǎng)核實(shí)53 井次診斷正確,故障診斷準(zhǔn)確率達(dá)91.4%。系統(tǒng)故障診斷準(zhǔn)確率的提高還需進(jìn)一步深化研究,在推廣過程中逐步驗(yàn)證并完善。
(3)抽油機(jī)音頻故障智能診斷技術(shù)彌補(bǔ)了現(xiàn)有信息化系統(tǒng)無抽油機(jī)音頻分析的不足,推動(dòng)了油田信息化智能化建設(shè)。