趙長軍
[摘 要]文章通過將油氣生產(chǎn)設(shè)備的故障數(shù)據(jù)、配套物聯(lián)網(wǎng)采集的故障期工況數(shù)據(jù)、設(shè)備維修保養(yǎng)記錄數(shù)據(jù)等進行多維組合,通過Hadoop大數(shù)據(jù)分析技術(shù),對設(shè)備的故障率進行分析,生成全面的設(shè)備質(zhì)量參考數(shù)據(jù);并依據(jù)故障率分析結(jié)果與實時工況數(shù)據(jù)進行大數(shù)據(jù)模型比對分析,實現(xiàn)設(shè)備的實時故障預(yù)測。通過對輸入的多維數(shù)據(jù)進行整合,結(jié)合大數(shù)據(jù)技術(shù)在海量數(shù)據(jù)分析的優(yōu)勢,實現(xiàn)了對油氣生產(chǎn)領(lǐng)域設(shè)備全方位的質(zhì)量信息評估,并可據(jù)此采取針對性的質(zhì)量改進與預(yù)防性措施,提升油氣生產(chǎn)的安全性和經(jīng)營效益。
[關(guān)鍵詞]多維分析;故障預(yù)測;大數(shù)據(jù);油氣生產(chǎn)設(shè)備
[DOI]10.13939/j.cnki.zgsc.2017.12.243
1 引 言
油氣生產(chǎn)行業(yè)所采用的各類數(shù)字化設(shè)備較多,隨著行業(yè)的競爭加劇,如何減少設(shè)備故障引起的停產(chǎn)時間,如何優(yōu)化采購降低設(shè)備故障率,如何提前對故障做出預(yù)測以提前應(yīng)對,是石油企業(yè)所亟須思考和解決的問題。
隨著工業(yè)自動化技術(shù)、物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)在油氣生產(chǎn)行業(yè)的開始應(yīng)用,為解決上述問題提供了全新的思路。運用大數(shù)據(jù)技術(shù),可高速有效分析多維度的設(shè)備實時運行數(shù)據(jù),并結(jié)合其他靜態(tài)和動態(tài)信息,對設(shè)備的故障進行分析和預(yù)測,分析結(jié)果為生產(chǎn)、經(jīng)營和QHSE服務(wù),實現(xiàn)技術(shù)手段和管理模式的革新,實現(xiàn)科學(xué)決策、卓越運營與安全生產(chǎn),最終達到可持續(xù)的業(yè)務(wù)增長。例如茂名石化探索如何在不改變已知原料屬性下,實現(xiàn)在重整裝置上提高汽油收率最高和汽油辛烷值最高的生產(chǎn)目標(biāo)。為解決這個問題,采用大數(shù)據(jù)分析技術(shù),收集了重整裝置近三年的MES、HSE、實時數(shù)據(jù)庫、腐蝕數(shù)據(jù)、ITCC、機泵監(jiān)測數(shù)據(jù)、氣象信息等數(shù)據(jù),通過Hadoop建模,對重整原料歷史數(shù)據(jù)進行主成分聚類分析,形成了典型的原料操作樣本庫,并據(jù)此快速確定每種原料類別下的最優(yōu)操作方案。技術(shù)人員對近4600個批次的石油原料進行了分析建模,組成了操作樣本庫。通過該方法計算優(yōu)化工藝操作參數(shù),可使汽油收率從89.88%提高到90.10%,是大數(shù)據(jù)在油氣生產(chǎn)行業(yè)應(yīng)用的成功例子。
本文擬通過將油氣生產(chǎn)設(shè)備故障數(shù)據(jù)、配套物聯(lián)網(wǎng)采集的工況數(shù)據(jù)、維修保養(yǎng)記錄數(shù)據(jù)及工業(yè)自動化數(shù)據(jù)組合應(yīng)用于設(shè)備故障大數(shù)據(jù)分析,實現(xiàn)對設(shè)備的綜合故障率分析與故障預(yù)測,從而為設(shè)備采購的最高性價比提供數(shù)據(jù)支撐,也為預(yù)防性維修維護提供決策支持,提升生產(chǎn)運行的安全性和企業(yè)經(jīng)營效益。
2 大數(shù)據(jù)分析技術(shù)的運用
油氣生產(chǎn)行業(yè)設(shè)備數(shù)據(jù)數(shù)量大,并發(fā)處理要求較高,對數(shù)據(jù)存儲、處理、分析的巨大壓力,要解決海量數(shù)據(jù)處理的問題就需要引入大數(shù)據(jù)技術(shù)。
Hadoop是目前最流行和功能最強大的一個軟件計算平臺,可以很容易地開發(fā)和運行處理油氣生產(chǎn)過程中的海量數(shù)據(jù)的分析模型。其核心部分主要包括—HDFS(Hadoop Distributed File System)和基于MapReduce機制的并行算法實現(xiàn)。Hadoop提供的分布式文件系統(tǒng)HDFS是建立在大型集群上可靠存儲大數(shù)據(jù)集的文件系統(tǒng),具有強容錯性、流式數(shù)據(jù)訪問與大數(shù)據(jù)集、硬件和操作系統(tǒng)的異構(gòu)性的優(yōu)勢。而MapReduce是一種簡化的分布式程序設(shè)計模型,用于處理和生成大量數(shù)據(jù)集。通過該模型,程序自動分布到一個由普通機器組成的超大機群上并發(fā)執(zhí)行。MapReduce通過把對數(shù)據(jù)集的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的每個節(jié)點來實現(xiàn)可靠性,每個節(jié)點會周期性地把完成的工作和狀態(tài)信息返回給主節(jié)點,實現(xiàn)大數(shù)據(jù)的并發(fā)處理。
Hadoop的上述優(yōu)點尤其適合于油氣生產(chǎn)行業(yè)的海量數(shù)據(jù)分析應(yīng)用。
3 設(shè)備故障率多維分析
設(shè)備故障率是評估設(shè)備性能優(yōu)劣的一個重要指標(biāo)。顧名思義,是設(shè)備故障運行與正常運行的比率。通過統(tǒng)計的方法可以計算特定個體、特定型號、特定類型或特定廠商的設(shè)備的故障信息,對設(shè)備時間質(zhì)量進行評估和橫縱向?qū)Ρ取?/p>
在油氣生產(chǎn)中,設(shè)備的故障記錄信息是故障率分析的依據(jù),但因為實際運行中各個井站、礦區(qū)的運行情況不同也影響了設(shè)備發(fā)生故障的情況,因此還需要引入配套物聯(lián)網(wǎng)采集的工況數(shù)據(jù),以及日常的維修保養(yǎng)情況記錄數(shù)據(jù),將這些信息進行進一步組合,在Hadoop大數(shù)據(jù)分析中建模挖掘,得出更精確的設(shè)備綜合故障率結(jié)果。
本文采用的多維故障率分析,基于3個大類的數(shù)據(jù):
(1)設(shè)備故障信息:包括設(shè)備廠商信息、設(shè)備類型、設(shè)備型號、設(shè)備壽命、運行時間、故障類型、故障次數(shù)、故障時長、故障恢復(fù)時長等;
(2)物聯(lián)網(wǎng)采集的工況數(shù)據(jù):油氣生產(chǎn)設(shè)備產(chǎn)量、流量、振動、位移,以及運行環(huán)境溫度、濕度、處理物質(zhì)腐蝕性等;
(3)維修保養(yǎng)記錄數(shù)據(jù):保養(yǎng)級別、保養(yǎng)時間、更換配件比、維修時間、維修級別等數(shù)據(jù)。
在Hadoop中,根據(jù)3類數(shù)據(jù)的權(quán)重、優(yōu)先級,以及每個數(shù)據(jù)項的占比等,進行大數(shù)據(jù)分析建模。進而將各個維度的數(shù)據(jù)輸入到Hadoop的MapReduce框架中,在計算模型中進行分析計算,最后得到分析結(jié)果。多維分析過程如圖1所示。
如上表所示,基于大數(shù)據(jù)分析的油氣生產(chǎn)設(shè)備故障分析統(tǒng)計過程是從油氣生產(chǎn)中產(chǎn)生的多維數(shù)據(jù)(故障相關(guān)、設(shè)備相關(guān)、環(huán)境相關(guān)、操作相關(guān))中獲取在任意時間間隔內(nèi)的某項故障相關(guān)的統(tǒng)計結(jié)果。其統(tǒng)計數(shù)據(jù)源是多維數(shù)據(jù)按一定規(guī)則的組合,同時獲得相應(yīng)的不同維度的統(tǒng)計結(jié)果。
下面以例子說明分析全過程。
向MapReduce庫輸入單個設(shè)備編號參數(shù)、時間區(qū)段參數(shù),向Job Tracker提交統(tǒng)計任務(wù),MapReduce庫將設(shè)備故障記錄庫中的數(shù)據(jù)分為m個分塊。Map Tracker讀取分塊中的設(shè)備故障記錄,作為map函數(shù)輸入,map函數(shù)按設(shè)備編號和時間區(qū)段參數(shù),將該分塊內(nèi)符合條件的設(shè)備故障記錄統(tǒng)計出來,結(jié)果保存在中間鍵值對中。Reduce Tracker讀取所有Map Tracker產(chǎn)生的中間鍵值對,將其歸并為一組統(tǒng)計記錄,從而得到單位時間內(nèi)指定設(shè)備的故障率,或指定時間范圍內(nèi)該設(shè)備故障次數(shù)變化趨勢等信息。
進一步,當(dāng)輸入?yún)?shù)為設(shè)備型號、時間區(qū)段時,Map Tracker調(diào)用map函數(shù),將分塊文件中的屬于該設(shè)備型號的所有設(shè)備列出,結(jié)果保存為中間鍵值對,作為下一級MapReduce過程的map函數(shù)輸入,在下一級的MapReduce過程中,再使用上例中的過程,過濾不同編號設(shè)備在指定時間段內(nèi)的故障記錄并歸并出相關(guān)統(tǒng)計信息。整個過程如圖2所示。
多維分析數(shù)據(jù)來源正是應(yīng)用上述MapReduce過程或多次MapReduce過程的迭代,得到最終分析結(jié)果。多維數(shù)據(jù)的故障率分析方法,解決了傳統(tǒng)單一數(shù)據(jù)對比未考慮實際運行環(huán)境、運行負(fù)荷、日常維護頻度等方面的因素,通過組合計算達到分析結(jié)果更全面完整的目的,為設(shè)備管理、設(shè)備采購、巡檢維修等日常管理工作提供更準(zhǔn)確的決策輔助。
4 設(shè)備故障預(yù)測分析
獲得設(shè)備綜合故障率結(jié)果后,可進一步實現(xiàn)設(shè)備的故障預(yù)測。對于井口裝置、閥門等控制設(shè)備的常規(guī)維護手段多為定期檢修或故障后維修,存在“過修”和“失修”現(xiàn)象,造成生產(chǎn)設(shè)備損耗和停產(chǎn)減產(chǎn)風(fēng)險。通過設(shè)備的故障預(yù)測預(yù)警,在設(shè)備正常運轉(zhuǎn)條件下,能夠分析出潛在故障及原因、實現(xiàn)預(yù)知性維修,將能有效減少維修成本、降低非計劃停工風(fēng)險。
對設(shè)備的故障預(yù)測預(yù)警,通過現(xiàn)場數(shù)據(jù)采集→數(shù)據(jù)傳輸→HDFS的數(shù)據(jù)存儲→對運行狀態(tài)與故障模型進行并行計算大數(shù)據(jù)分析→設(shè)備的故障預(yù)測幾個步驟實現(xiàn),如圖3所示。
通過現(xiàn)場的各類傳感器,將重點設(shè)備的關(guān)鍵參數(shù)進行實時采集和傳輸,通過RTU或者DCS等設(shè)備,傳輸?shù)紿adoop的HDFS分布式文件系統(tǒng)中,按照流文件格式進行存儲。
設(shè)計MapReduce的設(shè)備故障預(yù)測模型,將幾個采集上來的維度數(shù)據(jù)進行并行計算分析,分析算法可以Java程序方式實現(xiàn)基本的Map函數(shù)和Reduce函數(shù)。
(1)MapReduce庫先把預(yù)測算法程序的輸入文件劃分為M份(M為用戶定義),每一份通常有16MB到64MB;然后使用fork將用戶進程拷貝到集群內(nèi)其他機器上。
(2)被分配了Map作業(yè)的Task Tracker,開始讀取對應(yīng)分片的輸入數(shù)據(jù),包括此重點設(shè)備的振動、位移、溫度等各個維度的數(shù)據(jù)。
(3)接著進行Reduce作業(yè)。
(4)當(dāng)所有的Map和Reduce作業(yè)都完成了,MapReduce函數(shù)調(diào)用返回預(yù)測模型程序的代碼。
通過以上方式,實時獲取設(shè)備的振動、溫度、壓力、流量等數(shù)據(jù),同時將數(shù)據(jù)輸入到Hadoop故障預(yù)測模型進行實時分析比對,一旦比對類似,則可預(yù)測故障的近似發(fā)生時間,從而合理安排預(yù)防性維護,從而保證了設(shè)備維護更有針對性。
5 結(jié) 論
本文通過將與油氣生產(chǎn)設(shè)備故障相關(guān)的工況數(shù)據(jù)、故障數(shù)據(jù)、維修保養(yǎng)等操作數(shù)據(jù),作為多維數(shù)據(jù)源進行組合,輸入到Hadoop大數(shù)據(jù)分析模型中,利用Hadoop的并行處理優(yōu)勢解決油氣生產(chǎn)設(shè)備運行環(huán)境復(fù)雜、實時數(shù)據(jù)量大、影響因素眾多的故障分析難點,為設(shè)備的優(yōu)化采購提供依據(jù);同時將故障分析結(jié)果進一步導(dǎo)入到故障預(yù)測中,也為預(yù)防性維修維護提供決策參考,提升油氣生產(chǎn)運行安全和綜合運營效益。
參考文獻:
[1]趙慶周,李勇,田世明.基于智能配電網(wǎng)大數(shù)據(jù)分析的狀態(tài)監(jiān)測與故障處理方法[J].電網(wǎng)技術(shù),2016(3):774-780.
[2]檀朝東,陳見成,劉志海.大數(shù)據(jù)挖掘技術(shù)在石油工程的應(yīng)用前景展望[J].中國石油和化工,2015(1):49-51.
[3]李金諾.淺談石油行業(yè)大數(shù)據(jù)的發(fā)展趨勢[J].價值工程,2013(29):172-174.
[4]張春生,郭長杰,尹兆濤.大數(shù)據(jù)分析在油氣行業(yè)的應(yīng)用研究[J].微型電腦應(yīng)用,2016,32(7):64-67.
[5]劉剛.Hadoop應(yīng)用開發(fā)技術(shù)詳解[M].北京:機械工業(yè)出版社,2014.