潘軍明 陳小泉
摘? 要:數(shù)據(jù)分析對(duì)企業(yè)的生產(chǎn)運(yùn)營具有至關(guān)重要的作用。該文以油氣田吊機(jī)設(shè)備數(shù)據(jù)為基礎(chǔ),利用生產(chǎn)過程中所產(chǎn)生的各種歷史數(shù)據(jù),采用多種分析模型,從不同角度有針對(duì)性地對(duì)數(shù)據(jù)進(jìn)行分析,得到科學(xué)直觀的相關(guān)性分析結(jié)果,并對(duì)設(shè)備故障進(jìn)行大概預(yù)測(cè)?;谶@些分析預(yù)測(cè)結(jié)果,現(xiàn)場(chǎng)人員能夠及時(shí)制訂設(shè)備預(yù)防性維護(hù)計(jì)劃,降低設(shè)備的故障率,為生產(chǎn)決策提供數(shù)據(jù)支持。
關(guān)鍵詞:吊機(jī)? 相關(guān)性分析? Pandas? Sklearn? 故障預(yù)測(cè)
中圖分類號(hào):TH215? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào):1672-3791(2019)04(c)-0051-03
隨著中海油信息化的不斷發(fā)展,已經(jīng)建成了資產(chǎn)管理系統(tǒng)、采辦系統(tǒng)、設(shè)備運(yùn)行管理系統(tǒng)、物流配送等系統(tǒng),積累了數(shù)以千萬計(jì)的基礎(chǔ)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)。而油氣田現(xiàn)場(chǎng)部署著各種各樣的設(shè)備,如何通過數(shù)據(jù)分析挖掘,給設(shè)備管理工作提供指導(dǎo)建議,降低維護(hù)成本,提高設(shè)備使用價(jià)值,已成為公司面臨的一個(gè)重大問題。
1? 問題與現(xiàn)狀
在石油勘探開發(fā)過程中需要使用到各種機(jī)電儀設(shè)備,這些設(shè)備如果發(fā)生故障,需要管理人員進(jìn)行維護(hù)。目前現(xiàn)場(chǎng)只能根據(jù)設(shè)備的運(yùn)行時(shí)長制訂維護(hù)計(jì)劃,不能很好的根據(jù)設(shè)備運(yùn)行狀態(tài)、故障原因,故障次數(shù),維修費(fèi)用等情況綜合起來預(yù)測(cè)設(shè)備故障趨勢(shì),以便在下一次故障出現(xiàn)前進(jìn)行提前維護(hù),減少設(shè)備關(guān)停的次數(shù),增加設(shè)備持續(xù)運(yùn)行時(shí)間。因此,該次研究有針對(duì)性的選擇了吊機(jī)為分析對(duì)象,梳理出與該設(shè)備相關(guān)的各類數(shù)據(jù),結(jié)合實(shí)際業(yè)務(wù)建立數(shù)據(jù)模型,以大量各種相關(guān)數(shù)據(jù)為基礎(chǔ),對(duì)該設(shè)備進(jìn)行深入分析,驗(yàn)證算法的有效性和準(zhǔn)確性,從而確定設(shè)備的總體故障趨勢(shì)。
2? 分析過程描述
從工單、物料、服務(wù)接收單、運(yùn)行管理、檢修工時(shí)、故障填報(bào)等基礎(chǔ)信息中提取5年以來的數(shù)據(jù),并進(jìn)行指標(biāo)量化(故障次數(shù)、維修費(fèi)用、檢修次數(shù)、檢修時(shí)長、運(yùn)行時(shí)長)。
Pandas是一個(gè)開放源碼的Python庫,它使用強(qiáng)大的數(shù)據(jù)結(jié)構(gòu)提供高性能的數(shù)據(jù)操作和分析工具。利用Pandas可以完成數(shù)據(jù)處理和分析的五個(gè)典型步驟,加載,準(zhǔn)備,操作,模型和分析。利用pandas及作圖工具對(duì)故障次數(shù)與其他屬性(指標(biāo))進(jìn)行探尋獲得如下圖形。
通過數(shù)據(jù)初探發(fā)現(xiàn)圖1~圖3與圖4(線形回歸)比較接近,尤其是故障次數(shù)/檢修次數(shù)與圖4(線形回歸)最擬合。
3? 分析與預(yù)測(cè)
3.1 相關(guān)分析
相關(guān)系數(shù)是用來刻畫二維隨機(jī)變量兩個(gè)分量間相互關(guān)聯(lián)程度。利用python 數(shù)據(jù)分析包pandas 中求相關(guān)系數(shù)方法Corr()進(jìn)行分析。
通過相關(guān)分析得出如圖5所示結(jié)果,故障次數(shù)與自身相關(guān)系數(shù)為1,與隱患次數(shù)相關(guān)系為0.39,與檢查次數(shù)相關(guān)系為0.97,與檢查時(shí)長相關(guān)系0.81,與維修費(fèi)用相關(guān)系數(shù)為:0.73。當(dāng)?shù)弥鱾€(gè)屬性(指標(biāo))與故障次數(shù)的相關(guān)系數(shù)后,可通過關(guān)聯(lián)度較高的檢查次數(shù)、檢查時(shí)長、維修費(fèi)用來側(cè)面觀察設(shè)備的故障發(fā)生次數(shù)。
3.2 預(yù)測(cè)分析
sklearn和pandas一樣是一個(gè)開放源碼的Python庫,支持回歸,分類、聚類等強(qiáng)大的機(jī)器學(xué)習(xí)庫。該次將利用sklearn內(nèi)置的回歸模型進(jìn)行吊機(jī)設(shè)備的分析和預(yù)測(cè)。
進(jìn)行回歸分析(線形回歸),需要將數(shù)據(jù)劃分為兩份數(shù)據(jù)集,一份用于訓(xùn)練,一份用于對(duì)訓(xùn)練結(jié)果的檢測(cè)(測(cè)試數(shù)據(jù)),各自占數(shù)據(jù)總體比例分別為75%、25%,其數(shù)據(jù)集劃分如圖6所示。
從構(gòu)造數(shù)據(jù)集和創(chuàng)建預(yù)測(cè)模型,輸出預(yù)測(cè)結(jié)果完整代碼如圖7所示。根據(jù)圖7輸出結(jié)果:預(yù)測(cè)故障次數(shù)為2,與實(shí)際故障次數(shù)3比較接近。
對(duì)于預(yù)測(cè)模型的好壞,以均方誤差作為評(píng)價(jià)標(biāo)準(zhǔn):其值越接近0模型越優(yōu)良。模型評(píng)測(cè)效果:如圖8 輸出的均方誤差1.733表示該模型很優(yōu)秀。
4? 結(jié)語
通過吊機(jī)設(shè)備的分析后發(fā)現(xiàn),故障次數(shù)和查次數(shù)、檢查時(shí)長、維修費(fèi)相關(guān)性較強(qiáng)尤其是與檢修次數(shù)相關(guān)性較為接近,基本上都是線形相關(guān)。通過檢查次數(shù)和隱患次數(shù)可對(duì)故障次數(shù)進(jìn)行線形回歸預(yù)測(cè),其模型均方誤差值較小,預(yù)測(cè)的故障次數(shù)與實(shí)際故障次數(shù)比較接近,基本達(dá)到對(duì)吊機(jī)故障的分析預(yù)測(cè)。
參考文獻(xiàn)
[1] 萬倩,謝峰,趙明. 基于大數(shù)據(jù)的設(shè)備故障預(yù)測(cè)[J].廣播電視信息,2016(11):71-73.
[2] 續(xù)媛君,潘宏俠.設(shè)備故障趨勢(shì)預(yù)測(cè)的分析與應(yīng)用[J]. 振動(dòng)、測(cè)試與診斷,2006(4):305-308,333.
[3] 王致杰,王耀才,李冬.現(xiàn)代大型設(shè)備故障智能診斷技術(shù)的現(xiàn)狀與展望[J].煤礦機(jī)械,2003(7):102-104.
[4] 何春燕,王超宇.基于python+pandas的數(shù)據(jù)分析處理應(yīng)用[J].數(shù)碼世界,2018(7):386.