孫曉萍,張小龍
(長慶油田分公司第九采油廠,銀川 750006)
伴隨社會的不斷發(fā)展,“互聯(lián)網(wǎng)+”的理念也變得日益深化。如今越來越多的行業(yè)參與到了信息化建設(shè)中來,意圖讓企業(yè)逐漸朝著信息化方向發(fā)展,借此實現(xiàn)企業(yè)經(jīng)營管理效益的有效提升,在確保企業(yè)生產(chǎn)效益的同時,還可以為其經(jīng)營發(fā)展提供重要的技術(shù)支持。對于石油企業(yè)而言,要想提高經(jīng)營管理的有效性和科學(xué)性,也應(yīng)當積極探索信息化建設(shè)之路[1]。而數(shù)據(jù)挖掘技術(shù)作為一種能夠從海量數(shù)據(jù)信息中挖掘到企業(yè)想要的有用數(shù)據(jù)信息的技術(shù),自然需要石油企業(yè)引起重視。因此研究分析油田信息化建設(shè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用具有尤為重要的意義和作用,有利于推進其信息化建設(shè)的進程。
所謂數(shù)據(jù)挖掘,主要是指從眾多隨機、模糊的數(shù)據(jù)中將具有一定使用價值的數(shù)據(jù)信息提取出來的過程[2]。在這個過程中,需要借助諸多前沿的技術(shù),比如統(tǒng)計學(xué)技術(shù)、大數(shù)據(jù)技術(shù)等。通過應(yīng)用這些前沿的技術(shù),能夠從海量的數(shù)據(jù)信息中將具有一定價值的或是想要的數(shù)據(jù)信息篩選出來,從而使所篩選出來的數(shù)據(jù)信息被賦予更強的針對性。數(shù)據(jù)挖掘技術(shù)可以算得上是由于信息技術(shù)發(fā)展進步所誕生的諸多研究成果中最為重要的技術(shù)之一。從最初的數(shù)據(jù)收集逐漸發(fā)展成為如今的數(shù)據(jù)挖掘,也直接揭示了數(shù)據(jù)技術(shù)的整個發(fā)展過程。
通常,數(shù)據(jù)挖掘技術(shù)的應(yīng)用會遵循以下流程:第一步,確定研究對象。在進行數(shù)據(jù)挖掘之前,首先需要明確研究對象,要將數(shù)據(jù)挖掘的最終目的弄清楚,然后才能圍繞其進行數(shù)據(jù)挖掘。第二步,數(shù)據(jù)信息準備。借助相關(guān)程序從數(shù)據(jù)庫中將大致的數(shù)據(jù)信息篩選出來,然后從中將適當?shù)男畔⑦x擇出來作為數(shù)據(jù)挖掘信息,借此來使得數(shù)據(jù)挖掘算法模型得以成功構(gòu)建,從而為后續(xù)數(shù)據(jù)挖掘工作的開展做好前期準備工作。第三步,找尋規(guī)律。結(jié)合需求數(shù)據(jù)信息的相關(guān)特征,從前期篩選數(shù)據(jù)信息中將有用的數(shù)據(jù)信息挖掘出來,該環(huán)節(jié)是數(shù)據(jù)信息是否能夠?qū)崿F(xiàn)成功挖掘的關(guān)鍵所在。最后一步,數(shù)據(jù)表達。把挖掘出來的數(shù)據(jù)信息加以整理和分析,然后以更加直觀的方式將整理結(jié)果和分析結(jié)果呈現(xiàn)給用戶,為用戶的數(shù)據(jù)信息使用提供相應(yīng)的數(shù)據(jù)信息支持。
通過前文介紹的數(shù)據(jù)挖掘技術(shù)流程可以知道,石油企業(yè)在油田信息化建設(shè)中應(yīng)用該技術(shù)的時候,首先需要明確數(shù)據(jù)挖掘的對象;其次,將相關(guān)數(shù)據(jù)準備工作做好;再次,借助數(shù)據(jù)挖掘技術(shù)從海量的數(shù)據(jù)信息中將所需要的數(shù)據(jù)信息挖掘出來;最后,還需要對已經(jīng)挖掘出來的相關(guān)數(shù)據(jù)信息加以整理和分析并呈現(xiàn)給使用者。必須嚴格按照這個流程來進行數(shù)據(jù)挖掘,缺少任何一個環(huán)節(jié)都是不行的,否則將直接影響到數(shù)據(jù)挖掘結(jié)果。
應(yīng)用該技術(shù)的最終目的,是為企業(yè)的相關(guān)經(jīng)營決策提供數(shù)據(jù)信息支持。為了使所提供的數(shù)據(jù)信息服務(wù)能夠變得更加優(yōu)質(zhì)和便利,那么在應(yīng)用該技術(shù)的時候還需要遵循可視操作這一原則。可視操作除了要求最終數(shù)據(jù)挖掘結(jié)果要可視化之外,數(shù)據(jù)挖掘算法模型、數(shù)據(jù)挖掘過程等都需要做到可視化[3]。這主要是由于石油企業(yè)在推進油田信息化建設(shè)的過程中,需要對各個方面的數(shù)據(jù)信息實現(xiàn)全面掌控,在處理這些數(shù)據(jù)信息的時候也需要擁有更高的主動性。比如,借助可視化的數(shù)據(jù)挖掘,可以實現(xiàn)對所需的多維數(shù)據(jù)信息的處理,使其可以可視化的圖形形態(tài)呈現(xiàn)出來,揭示數(shù)據(jù)信息的潛在規(guī)律和內(nèi)在本質(zhì),展現(xiàn)數(shù)據(jù)信息的實際狀況,為石油企業(yè)油田信息化建設(shè)工作提供非常直觀的數(shù)據(jù)信息支持。
石油企業(yè)當前所需要的信息面事實上是比較廣的,尤其是客戶的實際情況往往還存在著諸多差異,其相關(guān)數(shù)據(jù)信息自然也有著比較大的區(qū)別,從而顯得較為復(fù)雜,那么就非常有必要借助數(shù)據(jù)挖掘技術(shù)遵循綜合信息原則[4],來對客戶的數(shù)據(jù)信息加以綜合處理,并展開對具體特征的深入研究,然后專門以表格形式呈現(xiàn)出來。為了確保數(shù)據(jù)挖掘的準確性和綜合性,在不同層次上加以分析和處理也是可以的。從時間維度的角度來分析,結(jié)合石油需求時間來對石油的分布情況展開研究,同時實現(xiàn)對石油集中趨勢的有效掌握。從部門維度來分析,借助綜合信息的挖掘來對具體的分布情況加以研究,通過對綜合信息的挖掘,來幫助石油企業(yè)各個部門將相關(guān)規(guī)劃工作做好,甚至直接給企業(yè)油田信息化建設(shè)工作的重要決策提供可靠的數(shù)據(jù)信息依據(jù)。如此一來就能夠確保石油企業(yè)更加精準地掌握客戶需求,不斷提升自身的服務(wù)質(zhì)量。
在進行油田開采的過程中,石油企業(yè)相關(guān)工作的開展往往需要在比較深的地面進行,從而使得油氣勘探開采工作在實際推進過程中可能會面臨諸多不穩(wěn)定因素,增大了勘探開采難度和危險性。所以對于石油企業(yè)而言,在進行正式的勘探開采工作之前,非常重要的一項工作就是要盡可能地獲取準確的信息數(shù)據(jù),通過對開采所在區(qū)域地下數(shù)據(jù)信息的盡可能全面收集,綜合多個方面的影響因素加以分析,然后對地下不穩(wěn)定因素加以綜合性評估,以便企業(yè)能夠事先將相關(guān)準備工作和防范措施做好,從而確保勘探開采的有效性和安全性,進而確保油氣開采能夠得以順利完成。石油企業(yè)需要首先對地下不穩(wěn)定因素的相關(guān)數(shù)據(jù)信息加以廣泛收集,然后對所收集到的數(shù)據(jù)信息進行分門別類,結(jié)合勘探過程中收集到的相關(guān)地質(zhì)信息一并存入數(shù)據(jù)信息庫,然后以所收集到的相關(guān)數(shù)據(jù)信息為基礎(chǔ),對導(dǎo)致不穩(wěn)定的原因進行深入的挖掘,以便能夠找到導(dǎo)致不穩(wěn)定的因素,從而在這些數(shù)據(jù)信息的支持下,制定出科學(xué)的油氣開采防護措施,為整個油田勘探開采工作的順利進行奠定堅實可靠的基礎(chǔ)。而在此過程中所產(chǎn)生的相關(guān)數(shù)據(jù)信息也可以存儲下來,以便為今后類似油田的勘探開采提供相應(yīng)的數(shù)據(jù)信息支持。
普通的數(shù)據(jù)信息與數(shù)據(jù)挖掘平臺之間存在著比較大的區(qū)別,倘若系統(tǒng)之中發(fā)現(xiàn)了異常數(shù)據(jù),就能夠立即對其進行深入的挖掘和分析。所以在油田信息建設(shè)進程中,將數(shù)據(jù)挖掘技術(shù)應(yīng)用起來,能夠更好地實現(xiàn)對油田開采信息的掌握,因此數(shù)據(jù)挖掘平臺的構(gòu)建是非常有必要的。利用平臺來對數(shù)據(jù)挖掘技術(shù)的應(yīng)用目標加以明確,將數(shù)據(jù)挖掘技術(shù)原本具有的價值充分發(fā)揮出來。首先,一旦數(shù)據(jù)信息表現(xiàn)出異常情況,需要注意并進一步挖掘異常數(shù)據(jù)。一般情況下,在油田開采過程中主要可能出現(xiàn)超注、欠注、水異常變化等異常,那么此時就需要借助聚類分析這樣一種方式,通過分析將異常的真正原因找出來,然后及時對其做相關(guān)處理,并對相應(yīng)的數(shù)據(jù)信息進行觀察,主要是觀察其是否恢復(fù)了正常。其次,在油田開采過程中勢必會產(chǎn)生諸多數(shù)據(jù)信息,而這些又存在著諸多變量,某個點一旦出現(xiàn)異常,相關(guān)變量數(shù)據(jù)往往都會發(fā)生比較大的變化,而借助搜索構(gòu)建的數(shù)據(jù)挖掘平臺,就能夠快速且直觀地將這些變化呈現(xiàn)出來,以便相關(guān)人員能夠做到及時監(jiān)控。最后,該平臺還能夠歸類以及整理過去所產(chǎn)生的諸多數(shù)據(jù)信息,尤其是一些故障數(shù)據(jù)信息,通過深入分析這部分信息,將故障發(fā)生前的一些預(yù)兆提前排查出來,從而提前做出預(yù)判,確保油田開采的安全性。
在進行物資采購的時候,其間很可能會遭遇各種突發(fā)狀況,那么做好物資價格信息的分析工作就變得尤為重要。石油企業(yè)在采購各種物資的過程中,物資價格信息既多又復(fù)雜,而此時借助數(shù)據(jù)挖掘技術(shù)就能夠?qū)崿F(xiàn)對有用信息的快速準確提取和分析,從而使得相關(guān)數(shù)據(jù)信息的處理效率大大提升,可以為物資采購工作的有序開展打下非常堅實的基礎(chǔ)。通常數(shù)據(jù)挖掘技術(shù)會使用模式識別、回歸分析等技術(shù),在這些技術(shù)的共同作用下,相關(guān)人員能夠快速準確地掌握有價值的物資價格數(shù)據(jù)信息,為其采購工作的高效開展帶來諸多便利。
應(yīng)用該技術(shù)還能夠幫助石油企業(yè)實現(xiàn)信息交流管理平臺[5]的構(gòu)建,使得企業(yè)各個部門彼此之間的交流溝通得以加強,增強各個部門之間的數(shù)據(jù)共享,將數(shù)據(jù)信息原本具有的價值充分發(fā)揮出來,這對于各個部門工作效率的提升是極為有利的。此外,在油田信息化建設(shè)中,借助數(shù)據(jù)挖掘技術(shù)所獲取的相關(guān)數(shù)據(jù)信息都存儲在內(nèi)部數(shù)據(jù)庫之中,這些都能夠成為寶貴的數(shù)據(jù)信息財富,幫助相關(guān)人員在油田信息化建設(shè)工作中快速獲取自己想要的重要數(shù)據(jù)信息,從而為這些人員的學(xué)習(xí)、成長以及相關(guān)工作的開展提供很大的數(shù)據(jù)信息支持,這對于油田信息化建設(shè)是極為有利的。
總而言之,伴隨科學(xué)技術(shù)的快速發(fā)展,石油企業(yè)進行油田開采的相關(guān)技術(shù)也因此而變得更加具有先進性,特別是許多高新技術(shù)油氣設(shè)備的引入和應(yīng)用,使得油田開采工作變得相對簡單方便,但是在這個工作中所產(chǎn)生的相關(guān)數(shù)據(jù)信息卻并沒有因此而減少。為了確保油田開采工作的順利進行,各個石油企業(yè)有必要在現(xiàn)有的基礎(chǔ)上通過對數(shù)據(jù)挖掘技術(shù)的應(yīng)用,助推油田信息化建設(shè)進程,這對于石油企業(yè)的健康有序發(fā)展而言能夠起到非常積極的促進作用。