馬華鋒,馬 榮,高 鵬,衣博茹
(1.延長(zhǎng)油田股份有限公司吳起采油廠,陜西延安 717600;2.大慶油田有限責(zé)任公司第四采油廠,黑龍江大慶 163000)
數(shù)據(jù)是石油公司最重要的資產(chǎn)之一。隨著石油企業(yè)的發(fā)展,油田在勘探開發(fā)過程中積累了大量的數(shù)據(jù),為石油企業(yè)的生產(chǎn)和科研提供了大量的數(shù)據(jù)支持。但是,它也給石油企業(yè)的發(fā)展帶來了很多問題,即數(shù)據(jù)資源分散,數(shù)據(jù)共享困難。為了更好地適應(yīng)石油企業(yè)的業(yè)務(wù)發(fā)展,迫切需要開展大規(guī)模的數(shù)據(jù)治理,使數(shù)據(jù)更加標(biāo)準(zhǔn)、統(tǒng)一。
隨著經(jīng)濟(jì)的快速發(fā)展,科學(xué)技術(shù)水平也不斷提高,經(jīng)過多年的數(shù)據(jù)開發(fā),石油企業(yè)積累了一定的數(shù)據(jù),但在數(shù)據(jù)管理的過程中還存在一些不足,亟待解決。數(shù)據(jù)治理是解決這些問題的數(shù)字轉(zhuǎn)換的方式,需要以多種方式來解決數(shù)據(jù)管理的問題,如組織職責(zé)、工作流程和系統(tǒng)規(guī)范,解決數(shù)據(jù)的不一致,最終建立標(biāo)準(zhǔn)化的數(shù)據(jù)應(yīng)用標(biāo)準(zhǔn),提高組織內(nèi)數(shù)據(jù)質(zhì)量,實(shí)現(xiàn)數(shù)據(jù)共享,充分發(fā)揮數(shù)據(jù)資產(chǎn)的價(jià)值[1]。
石油企業(yè)數(shù)據(jù)治理的內(nèi)容主要包括5 個(gè)方面,以下就針對(duì)這5 個(gè)方面做詳細(xì)分析。
(1)建立數(shù)據(jù)模型:數(shù)據(jù)模型包括企業(yè)整個(gè)業(yè)務(wù)范圍,建立起具有穩(wěn)定、容易使用等特點(diǎn)的全域統(tǒng)一模型,這也為針對(duì)不同應(yīng)用展開分析打下了良好的基礎(chǔ),在保障機(jī)構(gòu)中也是具有靈活性和擴(kuò)展性,打破了信息孤島帶來的限制,讓數(shù)據(jù)做到相互連接。
(2)數(shù)據(jù)質(zhì)量管控體系:建立起企業(yè)級(jí)的數(shù)據(jù)質(zhì)量管理,可以保證做到對(duì)數(shù)據(jù)質(zhì)量問題進(jìn)行全程的追蹤、監(jiān)控,支撐了整個(gè)數(shù)據(jù)質(zhì)量管理流程,建立起企業(yè)中統(tǒng)一數(shù)據(jù)質(zhì)量檢查機(jī)制,為數(shù)據(jù)質(zhì)量考核起到輔助作用,保證整個(gè)數(shù)據(jù)更加真實(shí)有效。
(3)元數(shù)據(jù)管理:判斷企業(yè)中業(yè)務(wù)領(lǐng)域中的數(shù)據(jù)資產(chǎn),做到對(duì)企業(yè)數(shù)據(jù)資源做到統(tǒng)一盤查,通過科學(xué)有效的機(jī)制管理元數(shù)據(jù),向開發(fā)人員和終端用戶提供元數(shù)據(jù)服務(wù),保證滿足用戶在業(yè)務(wù)方面的需求,為企業(yè)業(yè)務(wù)系統(tǒng)、開發(fā)和維護(hù)數(shù)據(jù)平臺(tái)提供支撐。
(4)數(shù)據(jù)標(biāo)準(zhǔn):該標(biāo)準(zhǔn)中涉及到多方面的內(nèi)容,分別是元數(shù)據(jù)、主數(shù)據(jù)、參照數(shù)據(jù)、數(shù)據(jù)指標(biāo)標(biāo)準(zhǔn)等。通過建立起數(shù)據(jù)標(biāo)準(zhǔn)體系,可以保證數(shù)據(jù)更加標(biāo)準(zhǔn),管控能力也能得到很大程度的提高,使得數(shù)據(jù)在應(yīng)用過程中更加具有一致性。建立標(biāo)準(zhǔn)的控制更新機(jī)制,使數(shù)據(jù)得到不斷的補(bǔ)充、完善,更好地支撐業(yè)務(wù)的開發(fā)。
(5)數(shù)據(jù)共享交換:在統(tǒng)一規(guī)則下,在元數(shù)據(jù)、統(tǒng)一工具下,實(shí)現(xiàn)數(shù)據(jù)的交換、整合、復(fù)制以及共享,讓不同客戶可以享受到在不同項(xiàng)目中的數(shù)據(jù)需求。不斷推進(jìn)“互聯(lián)網(wǎng)+油田業(yè)務(wù)”,為了管理現(xiàn)場(chǎng)的數(shù)據(jù),探索出新的技術(shù)應(yīng)用,如區(qū)塊鏈技術(shù),保證數(shù)據(jù)更加的安全可靠,并有序地共享數(shù)據(jù)。
本次研究中以某石油企業(yè)為例。該企業(yè)在前兩年處理數(shù)據(jù)中還存在著很多不足之處,然而在信息技術(shù)的快速發(fā)展下,治理的理念也發(fā)生了變化,提出了可以使石油企業(yè)發(fā)展的有效對(duì)策,具體的解決方案是:第一,數(shù)據(jù)治理以前,要做到整體性分析工程的技術(shù)框架,其中涉及到了治理工具、應(yīng)用的技術(shù)、數(shù)據(jù)池;第二,要給予一定的技術(shù)支持,通過這種方式主要是因?yàn)閿?shù)據(jù)治理過程中技術(shù)的作用是非常關(guān)鍵的。
該企業(yè)處理數(shù)據(jù)中采用的技術(shù)是Datist,此技術(shù)具有的優(yōu)點(diǎn)是讀寫所有數(shù)據(jù),在讀寫能力方面是非常強(qiáng)的。處理相關(guān)數(shù)據(jù)中,借助于Datist 技術(shù),處理的整個(gè)過程都能觀看到。同時(shí)企業(yè)對(duì)數(shù)據(jù)處理的方法也是非常多,處理也是非常的優(yōu)質(zhì)。例如,在提取數(shù)據(jù)核心內(nèi)容的過程中,首先要對(duì)數(shù)據(jù)進(jìn)行過濾、排序和推送。在Datist 技術(shù)處理數(shù)據(jù)過程中,也可以和GIS 分析功能進(jìn)行結(jié)合,保證數(shù)據(jù)可以及時(shí)、準(zhǔn)確地呈現(xiàn)。一體化體系結(jié)構(gòu)中,核心部位就是數(shù)據(jù)池,整個(gè)實(shí)施中需要合理地使用虛擬數(shù)據(jù)庫進(jìn)行處理。數(shù)據(jù)庫越來越多地存儲(chǔ)在云端,在云端中的內(nèi)容非常豐富。常見的數(shù)據(jù)庫是屬于一種關(guān)系性數(shù)據(jù)庫,包含的格式種類也是多種多樣,其中最常用的是Oracle、My SQL。數(shù)據(jù)池中有存儲(chǔ)著多種多樣格式的數(shù)據(jù),也可以存放一些和數(shù)據(jù)沒有任何關(guān)系的文件。在這種體系結(jié)構(gòu)中,不僅是包括了大量的數(shù)據(jù)池,而且這些數(shù)據(jù)池都是獨(dú)立的,相互之間不會(huì)產(chǎn)生影響,具有相對(duì)強(qiáng)勁的擴(kuò)張性[3]。
案例選取的是某石油企業(yè)開/關(guān)日數(shù)據(jù)總賬,該總賬在井動(dòng)態(tài)分析中起著非常重要的作用,工作中涉及的數(shù)據(jù)也非常廣泛。例如,開/關(guān)井日數(shù)據(jù)表、油井生產(chǎn)數(shù)據(jù)表等。這些表基本上集中在系統(tǒng)庫A 中,庫的數(shù)量很大,查詢相關(guān)數(shù)據(jù)和記錄需要花費(fèi)大量的時(shí)間,從幾分鐘到幾十分鐘不等。查詢相關(guān)數(shù)據(jù)后,需要擴(kuò)展各表數(shù)據(jù)的有效關(guān)聯(lián),使關(guān)井前的生產(chǎn)計(jì)算更加合理。在使用這種方式的過程中,會(huì)消耗大量的人力和時(shí)間,導(dǎo)致工作效率下降,工作的整體質(zhì)量也會(huì)下降。在本研究的過程中,希望能夠開展數(shù)據(jù)治理,更好地保證數(shù)據(jù)的有效性和真實(shí)性。
為了保證數(shù)據(jù)可以在最短的時(shí)間里計(jì)算出來,讓數(shù)據(jù)實(shí)現(xiàn)實(shí)用性,本次研究過程中就需要針對(duì)實(shí)施中存在的問題進(jìn)行及時(shí)的解決。首先,提高查詢速度。如圖1 所示,借助于制定出完善的管理制度,通過大數(shù)據(jù)庫中的技術(shù),定期檢查報(bào)表中涉及到的數(shù)據(jù),在網(wǎng)絡(luò)的幫助下,將所有重要數(shù)據(jù)合理地同步到數(shù)據(jù)池中,通過這種方式可以有效提高查詢數(shù)據(jù)的速度,保證在幾分鐘的時(shí)間基礎(chǔ)上提高幾秒鐘。其次,加強(qiáng)對(duì)數(shù)據(jù)自動(dòng)統(tǒng)計(jì)。根據(jù)標(biāo)準(zhǔn)化的技術(shù)體系,根據(jù)Datist 技術(shù),制作完整的數(shù)據(jù)流(圖2)。Datist 技術(shù)不僅可以大大提高數(shù)據(jù)驅(qū)動(dòng)能力,而且整個(gè)過程可視化,在過去完成更復(fù)雜的項(xiàng)目,需要大量的開發(fā)人員和程序員掌握復(fù)雜的數(shù)據(jù)庫知識(shí),但隨著信息技術(shù)的快速發(fā)展,使用Datist 數(shù)據(jù)專家軟件盡可能快地設(shè)計(jì)。最后,呈現(xiàn)準(zhǔn)確報(bào)表。對(duì)數(shù)據(jù)組織完成以后,Datist 技術(shù)就能直接計(jì)算出較為準(zhǔn)確的報(bào)表[4]。
圖1 數(shù)據(jù)模型系統(tǒng)總體框架
圖2 使用Datist 技術(shù)對(duì)石油企業(yè)數(shù)據(jù)進(jìn)行處理的功能分解
經(jīng)過多次實(shí)踐和研究,該石油企業(yè)借助以往的數(shù)據(jù)管理項(xiàng)目建立了完善的數(shù)據(jù)池,使一定范圍內(nèi)的問題能夠及時(shí)得到解決,主要問題是數(shù)據(jù)共享和集成。針對(duì)這種情況,將操作下的數(shù)據(jù)錄入,進(jìn)行準(zhǔn)確的交換和存儲(chǔ),數(shù)據(jù)錄入和查詢同步進(jìn)行,可以有效地提高工作效率,保證數(shù)據(jù)更加準(zhǔn)確有效,也更有利于適應(yīng)現(xiàn)代石油企業(yè)發(fā)展的需要。如果建立了完善的組織、管理、技術(shù)和治理體系,并開發(fā)出了獨(dú)特的解決方案,那么該解決方案的應(yīng)用就應(yīng)該以數(shù)據(jù)治理工具和數(shù)據(jù)池為中心。實(shí)現(xiàn)數(shù)據(jù)治理后,可以改變現(xiàn)狀,在很大程度上解決數(shù)據(jù)查詢的時(shí)間和速度。面對(duì)當(dāng)前的發(fā)展形勢(shì),借助這種新的治理模式和理念,可以有效開展石油企業(yè)的建設(shè),實(shí)現(xiàn)大數(shù)據(jù)在企業(yè)中的合理應(yīng)用,促進(jìn)石油企業(yè)的健康可持續(xù)發(fā)展。通過設(shè)計(jì)出符合石油企業(yè)發(fā)展的數(shù)據(jù)治理總體框架,并對(duì)其中核心內(nèi)容進(jìn)行明確,分析數(shù)據(jù)治理過程中的現(xiàn)狀,借鑒國內(nèi)外企業(yè)中針對(duì)數(shù)據(jù)治理的解決方案,最終構(gòu)建出符合石油企業(yè)發(fā)展的數(shù)據(jù)治理體系方案,保證企業(yè)數(shù)據(jù)利用的效率,讓企業(yè)得到不斷的發(fā)展[5]。
通過將新技術(shù)引入石油企業(yè)信息化建設(shè)中,可以在很大程度上提高石油企業(yè)建設(shè)和發(fā)展的質(zhì)量,將數(shù)據(jù)和業(yè)務(wù)緊密聯(lián)系起來。然而這樣的背景對(duì)石油企業(yè)的數(shù)據(jù)質(zhì)量也提出了更高的要求,因此企業(yè)有必要借助數(shù)據(jù)管理技術(shù)對(duì)油田數(shù)據(jù)進(jìn)行全生命周期管理,從而有效滿足石油企業(yè)在信息技術(shù)下的發(fā)展。數(shù)據(jù)管理工程及相關(guān)信息技術(shù)能夠在很大程度上促進(jìn)石油企業(yè)的發(fā)展,使石油企業(yè)的經(jīng)濟(jì)效益和社會(huì)效益實(shí)現(xiàn)統(tǒng)一。