郭以東 馬建國 余 洋 何曉梅 李 峻
(1 中國石油勘探開發(fā)研究院西北分院;2 中國石油勘探與生產(chǎn)分公司)
中國石油作為國家特大型能源央企單位,一直以來都高度重視信息技術(shù)發(fā)展對(duì)各業(yè)務(wù)的積極促進(jìn)作用。針對(duì)各類業(yè)務(wù)管理模式和業(yè)務(wù)范疇,構(gòu)建了服務(wù)于各層級(jí)的較為完整的信息服務(wù)支撐體系,相繼建成了勘探與生產(chǎn)技術(shù)數(shù)據(jù)管理系統(tǒng)(A1)、油氣水井生產(chǎn)數(shù)據(jù)管理系統(tǒng)(A2)、采油與地面工程運(yùn)行管理系統(tǒng)(A5)、勘探開發(fā)一體化協(xié)同研究及應(yīng)用平臺(tái)(A6)、勘探與生產(chǎn)調(diào)度指揮系統(tǒng)(A8)、油氣生產(chǎn)物聯(lián)網(wǎng)系統(tǒng)(A11)、勘探與生產(chǎn)ERP 系統(tǒng)(D2)[1-3]、公共數(shù)據(jù)編碼平臺(tái)(D15)、健康安全環(huán)保系統(tǒng)(E1)、節(jié)能節(jié)水管理系統(tǒng)(E7)、信息安全運(yùn)行中心(F14)等信息系統(tǒng),各信息系統(tǒng)的建設(shè)對(duì)企業(yè)開展能效對(duì)標(biāo)、挖掘節(jié)能降耗潛力、提高能源管理效率等發(fā)揮了積極作用,極大地促進(jìn)了能源科學(xué)化和管理精細(xì)化。
但是,各系統(tǒng)在建設(shè)初期由于所服務(wù)的業(yè)務(wù)部門不同、業(yè)務(wù)管理邊界存在交叉重疊,同類數(shù)據(jù)在統(tǒng)計(jì)口徑、粒度、精度、時(shí)效性及元數(shù)據(jù)定義標(biāo)準(zhǔn)上均表現(xiàn)出不同的差異,導(dǎo)致系統(tǒng)運(yùn)行過程中出現(xiàn)同類數(shù)據(jù)來源不統(tǒng)一、標(biāo)準(zhǔn)不統(tǒng)一、精度不一致等諸多問題,給業(yè)務(wù)管理和上層決策造成一定困擾。如果能夠合理地利用多源數(shù)據(jù)對(duì)元數(shù)據(jù)進(jìn)行數(shù)據(jù)源確權(quán)和相關(guān)性匯集融合,打通業(yè)務(wù)部門和系統(tǒng)之間的管理壁壘,建立業(yè)務(wù)所需的專業(yè)數(shù)據(jù)庫,解決好數(shù)據(jù)準(zhǔn)確性、完整性、一致性和業(yè)務(wù)滿足度的校驗(yàn)及數(shù)據(jù)二次加工豐度的擴(kuò)展[4-6]等問題,那么就能夠?qū)崿F(xiàn)數(shù)據(jù)整體質(zhì)量的顯著提升和有效管理,促進(jìn)各管理部門、多學(xué)科專業(yè)人員的協(xié)同工作與高效決策。本文以油氣田企業(yè)能效數(shù)據(jù)融合為切入點(diǎn),展開多源能效元數(shù)據(jù)融合研究工作,形成相應(yīng)的研究方法并具體應(yīng)用。
油氣田能效元數(shù)據(jù)是企業(yè)在勘探、開發(fā)、生產(chǎn)與集輸過程中的各類生產(chǎn)管理源頭上采集的數(shù)據(jù)。各系統(tǒng)所采集的同類數(shù)據(jù)理論上應(yīng)該保持一致,但由于各系統(tǒng)所采用的數(shù)據(jù)標(biāo)準(zhǔn)、統(tǒng)計(jì)口徑和數(shù)據(jù)獲取渠道的差異性,導(dǎo)致各系統(tǒng)間同類數(shù)據(jù)難以吻合。以能效管理的核心數(shù)據(jù)——油氣產(chǎn)量為例,來自A11 的單井實(shí)時(shí)數(shù)據(jù)累計(jì)加和、A2 的統(tǒng)計(jì)上報(bào)審核數(shù)據(jù)、A5 的集輸/站庫計(jì)量數(shù)據(jù)和來自E7 的統(tǒng)計(jì)上報(bào)數(shù)據(jù)均存在一定程度的差異,這種差異性由統(tǒng)計(jì)口徑、計(jì)量誤差、損耗、測算方式、精度累計(jì)誤差和統(tǒng)計(jì)周期不同等多種原因引起。各系統(tǒng)在多年運(yùn)行中對(duì)單一業(yè)務(wù)領(lǐng)域的信息支撐作用均能滿足且適應(yīng)其所服務(wù)的業(yè)務(wù)管理需求,均具有其合理性。但不同系統(tǒng)之間存在關(guān)聯(lián)數(shù)據(jù)但數(shù)據(jù)不統(tǒng)一的現(xiàn)狀,給能效管理業(yè)務(wù)整合、能效對(duì)標(biāo)和基于數(shù)據(jù)資產(chǎn)的業(yè)務(wù)高效化等管理帶來很多難題。
能效數(shù)據(jù)具有多源采集方式與多學(xué)科、多領(lǐng)域、多技術(shù)構(gòu)成的復(fù)雜多源性特征。不同業(yè)務(wù)部門主導(dǎo)建設(shè)的信息系統(tǒng)采用了建設(shè)之初滿足當(dāng)時(shí)設(shè)計(jì)需求的數(shù)據(jù)庫類型、數(shù)據(jù)格式和標(biāo)準(zhǔn),系統(tǒng)數(shù)據(jù)僅僅適用于其內(nèi)部流轉(zhuǎn),無法有效支持其他系統(tǒng)的業(yè)務(wù)應(yīng)用[7]。在系統(tǒng)間進(jìn)行數(shù)據(jù)集成共享時(shí),數(shù)據(jù)的權(quán)威出處、準(zhǔn)確性和完整性驗(yàn)證需要花費(fèi)較大精力,一旦同類數(shù)據(jù)存在于多個(gè)不同業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)確權(quán)就存在較大的難度。
各系統(tǒng)依照業(yè)務(wù)管理需求進(jìn)行功能設(shè)計(jì),采集了大量支撐系統(tǒng)獨(dú)立運(yùn)行的數(shù)據(jù)。以機(jī)采系統(tǒng)工藝環(huán)節(jié)為例,能效管理需要的指標(biāo)數(shù)據(jù)在A2、A5、A11 和E7 系統(tǒng)中均有包含(圖1),這些逐漸云化存儲(chǔ)的數(shù)據(jù)中存在大量的冗余數(shù)據(jù),且冗余數(shù)據(jù)之間又存在一定差異[8],既浪費(fèi)大量的存儲(chǔ)資源,又不能明確哪個(gè)數(shù)據(jù)更權(quán)威。對(duì)這些多源數(shù)據(jù)進(jìn)行融合,能夠降低數(shù)據(jù)冗余,減少數(shù)據(jù)存儲(chǔ)和傳輸過程中不必要的資源浪費(fèi)。
多系統(tǒng)間的數(shù)據(jù)種類繁多、來源廣泛,涉及不同的技術(shù)標(biāo)準(zhǔn),給信息融合和資源共享的實(shí)現(xiàn)帶來諸多挑戰(zhàn),隨著業(yè)務(wù)的精細(xì)化管理和信息系統(tǒng)的快速同步建設(shè),系統(tǒng)功能也隨之不斷拓展和變化。如果基于傳統(tǒng)的數(shù)據(jù)集成共享方式,后期建設(shè)的每一個(gè)系統(tǒng)需要分別與多個(gè)先期建設(shè)的關(guān)聯(lián)系統(tǒng)建立數(shù)據(jù)交換接口、數(shù)據(jù)映射轉(zhuǎn)換、數(shù)據(jù)抽取推送和數(shù)據(jù)安全傳輸防護(hù)關(guān)系;隨著各系統(tǒng)版本的更新迭代和功能的改造提升,已建立好的數(shù)據(jù)交換方式和策略也要同步進(jìn)行更替;各系統(tǒng)建設(shè)的時(shí)間差異又進(jìn)一步給多數(shù)據(jù)接口、多數(shù)據(jù)同步的傳統(tǒng)數(shù)據(jù)集成共享方式帶來了額外的工作量。
信息系統(tǒng)的建設(shè)均有特定的服務(wù)群體和受眾對(duì)象,系統(tǒng)管理內(nèi)容均具備其業(yè)務(wù)的專一性和局限性,在特定業(yè)務(wù)場景尤其是業(yè)務(wù)交叉管理的特定需求下,獨(dú)立運(yùn)轉(zhuǎn)的系統(tǒng)往往存在額外的數(shù)據(jù)指標(biāo)有待增補(bǔ),而這些數(shù)據(jù)在其他已建信息系統(tǒng)中已經(jīng)采集存儲(chǔ),各系統(tǒng)間數(shù)據(jù)具有很強(qiáng)的業(yè)務(wù)數(shù)據(jù)互補(bǔ)性[8-12],自身重新采集或建設(shè)會(huì)浪費(fèi)不必要的資源和精力。打通各獨(dú)立系統(tǒng)數(shù)據(jù)之間的壁壘,建立集成共享關(guān)系,既能節(jié)約系統(tǒng)開發(fā)成本,又能保障同類數(shù)據(jù)的一致性。
中國石油信息化建設(shè)經(jīng)歷了從分散到集中、從集中到集成應(yīng)用、從集成應(yīng)用到“共享中國石油”的融合更新迭代,形成了覆蓋整個(gè)集團(tuán)公司的信息基礎(chǔ)設(shè)施統(tǒng)一規(guī)劃建設(shè)、“三地四中心”的數(shù)據(jù)中心、信息安全防護(hù)全域部署、云化技術(shù)架構(gòu)全面應(yīng)用的大好局面;打破了業(yè)務(wù)系統(tǒng)獨(dú)立建設(shè)、信息孤島帶來的管理壁壘。為進(jìn)一步減少數(shù)據(jù)重復(fù)填報(bào)給基層單位帶來的額外工作壓力和因之造成的數(shù)據(jù)不一致問題,將信息化建設(shè)已積累的大量的、基礎(chǔ)的、權(quán)威的生產(chǎn)能效數(shù)據(jù)進(jìn)行有效的集成融合,建立具備全面深入的大數(shù)據(jù)分析能力的數(shù)字化集成共享應(yīng)用勢在必行。
數(shù)據(jù)融合是一種在某種意義的控制結(jié)構(gòu)和模型下,運(yùn)用數(shù)學(xué)方法和技術(shù)工具,整合多源(同類或異類)表示一致的知識(shí),以最終獲取高品質(zhì)信息為目的的統(tǒng)一表示框架。研究能效數(shù)據(jù)融合的目的是在洞察數(shù)據(jù)多源性的基礎(chǔ)上,從能效數(shù)據(jù)應(yīng)用的本質(zhì)中以特定的組合規(guī)則關(guān)聯(lián)組織數(shù)據(jù)、迭代優(yōu)化,從而產(chǎn)生新的數(shù)據(jù)體以獲取更多有效信息[13-17],并在能效統(tǒng)計(jì)分析、能效對(duì)標(biāo)、能源管控中通過建立復(fù)用數(shù)據(jù)模型,解決能效管理的應(yīng)用實(shí)效。但數(shù)據(jù)融合并不是為了徹底消除數(shù)據(jù)之間相對(duì)的差異,而是要清晰地了解和把控導(dǎo)致這些差異的緣由,對(duì)每條數(shù)據(jù)從產(chǎn)出、流轉(zhuǎn)到加工應(yīng)用全生命周期的科學(xué)詮釋,找出有效的管理手段來控制這些不合理的數(shù)據(jù)差異,并將原本看似不相關(guān)的各類數(shù)據(jù)通過大數(shù)據(jù)多維分析挖掘,構(gòu)建數(shù)據(jù)之間內(nèi)在邏輯聯(lián)系和相互作用機(jī)制,進(jìn)而從不同的業(yè)務(wù)管理角度豐富數(shù)據(jù)廣度,增強(qiáng)業(yè)務(wù)之間的協(xié)同管理。
油氣田企業(yè)能效數(shù)據(jù)融合研究以涉及油氣田企業(yè)生產(chǎn)全業(yè)務(wù)流程管理的相關(guān)信息系統(tǒng)能效數(shù)據(jù)為融合對(duì)象,采用“統(tǒng)一云平臺(tái)架構(gòu)、統(tǒng)一數(shù)據(jù)湖歸集為核心、數(shù)據(jù)融合共享為手段、應(yīng)用為目標(biāo)”的思路,用“一個(gè)平臺(tái)、一套數(shù)據(jù)”規(guī)范能效數(shù)據(jù)的標(biāo)準(zhǔn)化采集與應(yīng)用,圍繞油氣生產(chǎn)經(jīng)營數(shù)據(jù)、地面公用工程基礎(chǔ)數(shù)據(jù)、物聯(lián)網(wǎng)實(shí)時(shí)采集數(shù)據(jù)和能效綜合統(tǒng)計(jì)數(shù)據(jù)的融合銜接作為融合目標(biāo)。能效數(shù)據(jù)融合按照3 個(gè)步驟開展,首先搭建數(shù)據(jù)融合研究有利環(huán)境,其次確定能效數(shù)據(jù)集成融合方式,最后明確數(shù)據(jù)融合策略并進(jìn)行數(shù)據(jù)確權(quán)。
中國石油上游業(yè)務(wù)板塊為適應(yīng)業(yè)務(wù)需求變化和信息技術(shù)的快速發(fā)展,以推進(jìn)集約化建設(shè)、信息共享和業(yè)務(wù)協(xié)同為著力點(diǎn),制定了上游業(yè)務(wù)信息與應(yīng)用共享平臺(tái)規(guī)劃藍(lán)圖。通過勘探開發(fā)一體化協(xié)同研究與應(yīng)用平臺(tái)(A6)項(xiàng)目建設(shè),同時(shí)以云計(jì)算、微服務(wù)架構(gòu)并融合企業(yè)數(shù)據(jù)治理理念構(gòu)建了“平臺(tái)+能力+應(yīng)用”生態(tài)、“數(shù)據(jù)+技術(shù)+應(yīng)用”的上游“勘探開發(fā)夢(mèng)想云平臺(tái)和數(shù)據(jù)湖”開放共享環(huán)境,為上游業(yè)務(wù)信息化建設(shè)由豎井式系統(tǒng)開發(fā)向數(shù)字化、智能化、平臺(tái)化發(fā)展轉(zhuǎn)型,以及信息資源共享、軟件開發(fā)快速迭代、業(yè)務(wù)需求敏捷響應(yīng)的全面平臺(tái)化發(fā)展創(chuàng)建了良好的基礎(chǔ)條件[18-20]。
充分利用基于Docker +Kubernetes +DevOps、微服務(wù)、中間件等開源技術(shù)集成研發(fā)的夢(mèng)想云平臺(tái)優(yōu)勢和數(shù)據(jù)湖強(qiáng)大的數(shù)據(jù)整合能力,既滿足了數(shù)據(jù)融合魯棒性、容錯(cuò)性、廣適性、高效性和實(shí)時(shí)性的要求[11],又同步享受到了前者所帶來的高效敏捷迭代開發(fā)、快速應(yīng)用部署、異構(gòu)數(shù)據(jù)互聯(lián)互通、資源彈性拓展、服務(wù)統(tǒng)一運(yùn)營、整體安全防護(hù)等平臺(tái)技術(shù)便利。因此,本文以夢(mèng)想云平臺(tái)和數(shù)據(jù)湖為基礎(chǔ),采用SpringCloud 微服務(wù)架構(gòu)、DevOps 軟件工程自動(dòng)化工具和Docker 容器技術(shù)開展相關(guān)工作。能效信息融合構(gòu)建架構(gòu)如圖2 所示。
圖2 油氣田企業(yè)能效信息融合總體架構(gòu)Fig.2 Overall architecture of energy efficiency information fusion of oil and gas enterprises
勘探開發(fā)一體化數(shù)據(jù)庫作為業(yè)務(wù)資源的匯聚與應(yīng)用服務(wù)中心,通過數(shù)據(jù)抽取(ETL)、數(shù)據(jù)同步(Data Sync.)、虛擬數(shù)據(jù)庫(Virtual Database)、數(shù)據(jù)聯(lián)邦(Data Federation)等技術(shù),邏輯上集成了統(tǒng)建系統(tǒng)數(shù)據(jù)庫及油氣田自建系統(tǒng)數(shù)據(jù)庫,形成了基于上游勘探開發(fā)全業(yè)務(wù)鏈主數(shù)據(jù)、元數(shù)據(jù)的統(tǒng)一數(shù)據(jù)管理平臺(tái)與質(zhì)量管理體系,實(shí)現(xiàn)了與各類異構(gòu)數(shù)據(jù)庫間跨專業(yè)、跨機(jī)構(gòu)、跨區(qū)域的數(shù)據(jù)互聯(lián)互通、跨域共享[21-24]。利用這一優(yōu)勢特性,本文在數(shù)據(jù)集成共享基礎(chǔ)上,棄用了與多個(gè)相關(guān)系統(tǒng)直接點(diǎn)對(duì)點(diǎn)接口集成的傳統(tǒng)數(shù)據(jù)獲取方式,而是依照與數(shù)據(jù)湖專業(yè)領(lǐng)域數(shù)據(jù)集比對(duì)結(jié)果,直接從數(shù)據(jù)湖中獲取。無法獲取的數(shù)據(jù)通過油氣田能效管理系統(tǒng)進(jìn)行補(bǔ)充采集,并將加工處理后的數(shù)據(jù)回推入湖(圖3)。該方法進(jìn)一步消除了傳統(tǒng)系統(tǒng)數(shù)據(jù)集成方式所帶來的多接口、多數(shù)據(jù)映射轉(zhuǎn)換、多數(shù)據(jù)同步策略的煩瑣和不易同步運(yùn)維的痼疾,實(shí)現(xiàn)了能效數(shù)據(jù)從數(shù)據(jù)湖的“源頭抓取,雙向存儲(chǔ)”,增強(qiáng)了能效數(shù)據(jù)的一致性、權(quán)威性和互補(bǔ)性。
圖3 能效數(shù)據(jù)集成融合機(jī)理Fig.3 Operation mechanism of energy efficiency data integration and fusion
油氣田業(yè)務(wù)能效數(shù)據(jù)具有大數(shù)據(jù)的異構(gòu)性屬性,而異構(gòu)性不可避免會(huì)導(dǎo)致數(shù)據(jù)特征存在差異。如何完成對(duì)異構(gòu)數(shù)據(jù)的關(guān)聯(lián)、交叉,最終獲得數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,是異構(gòu)數(shù)據(jù)融合研究的重點(diǎn)[22]。與此同時(shí),同類異構(gòu)數(shù)據(jù)的采集源頭、跨學(xué)科/跨業(yè)務(wù)加工處理、存儲(chǔ)格式和精度等多源性特征,在融合應(yīng)用之際的權(quán)威性認(rèn)定上(多源性數(shù)據(jù)在特定業(yè)務(wù)領(lǐng)域應(yīng)用時(shí)引用哪個(gè)數(shù)據(jù)更準(zhǔn)確、更權(quán)威、更適合)是另一個(gè)不可忽視的問題。
勘探開發(fā)一體化數(shù)據(jù)庫(數(shù)據(jù)湖)早期對(duì)上游油氣勘探、井筒工程、采油氣工程、地面工程與生產(chǎn)、油氣藏研究與評(píng)價(jià)、經(jīng)營管理與決策等全業(yè)務(wù)鏈數(shù)據(jù)進(jìn)行規(guī)范性定義、梳理、清洗,形成了1.7PB 數(shù)據(jù)資產(chǎn)的入庫統(tǒng)一管理[18]。本文應(yīng)用概率隨機(jī)統(tǒng)計(jì)模型——統(tǒng)計(jì)決策理論,以油氣田企業(yè)能效指標(biāo)體系和集團(tuán)公司上報(bào)國務(wù)院國有資產(chǎn)監(jiān)督管理委員會(huì)數(shù)據(jù)報(bào)表的指標(biāo)、維度為對(duì)比參照物,針對(duì)入湖130 多個(gè)數(shù)據(jù)集、2000 多個(gè)指標(biāo)項(xiàng)的主數(shù)據(jù)、元數(shù)據(jù)的能效相關(guān)數(shù)據(jù)進(jìn)行認(rèn)真比對(duì)梳理,初步確定了相關(guān)指標(biāo)數(shù)據(jù)來源,以及未納入數(shù)據(jù)湖管理的能效指標(biāo)內(nèi)容(圖4)。其中包括:描述企業(yè)和各層級(jí)用能單位整體生產(chǎn)、能耗、用水情況的宏觀綜合指標(biāo),涉及生產(chǎn)類、能耗類、用水類、單耗類、財(cái)務(wù)類和節(jié)能節(jié)水類六大類;描述各用能單元主要生產(chǎn)系統(tǒng)生產(chǎn)狀況和能效情況信息的工藝過程指標(biāo),涉及機(jī)采系統(tǒng)、集油系統(tǒng)、注水系統(tǒng)、注蒸汽系統(tǒng)、原油脫水系統(tǒng)、原油穩(wěn)定系統(tǒng)、污水處理系統(tǒng)、集氣系統(tǒng)、氣處理系統(tǒng)和煤層氣系統(tǒng)十大類;描述各用能單元主要耗能設(shè)備基本信息和運(yùn)行能效信息的終端設(shè)備指標(biāo),涉及抽油機(jī)、螺桿泵、潛油泵、加熱爐、鍋爐、變壓器、壓縮機(jī)、風(fēng)機(jī)和機(jī)泵九大類。經(jīng)過比對(duì),用戶、組織機(jī)構(gòu)、井、站庫、設(shè)備等基礎(chǔ)元數(shù)據(jù)可直接引用數(shù)據(jù)湖數(shù)據(jù);開發(fā)生產(chǎn)指標(biāo)中70%可從已入湖的A2 相關(guān)數(shù)據(jù)集中獲得;油藏類型、工藝類型等生產(chǎn)系統(tǒng)基礎(chǔ)信息、地質(zhì)工藝過程指標(biāo)中38%可以從數(shù)據(jù)湖中獲取。同時(shí),還發(fā)現(xiàn)數(shù)據(jù)湖中相關(guān)用水?dāng)?shù)據(jù)較為零散,能耗用水?dāng)?shù)據(jù)只涉及生產(chǎn)單位,輔助非生產(chǎn)單位缺乏相關(guān)數(shù)據(jù)采集;數(shù)據(jù)湖缺少單耗、財(cái)務(wù)(能源單價(jià))、節(jié)能節(jié)水量等能效相關(guān)指標(biāo),而相應(yīng)數(shù)據(jù)在暫未入湖的E7 系統(tǒng)中已經(jīng)采集,可以入湖補(bǔ)充。
圖4 數(shù)據(jù)湖能效指標(biāo)梳理及融合機(jī)理Fig.4 Energy efficiency index management and data fusion mechanism in data lake
針對(duì)數(shù)據(jù)湖存在的數(shù)據(jù)冗余和冗余數(shù)據(jù)差異性問題,在數(shù)據(jù)確權(quán)方面,除跟進(jìn)A6系統(tǒng)數(shù)據(jù)治理的同時(shí),本文通過專家評(píng)價(jià)法確定能效宏觀綜合指標(biāo)和能效評(píng)價(jià)關(guān)鍵性指標(biāo),制定了“針對(duì)源頭采集原始數(shù)據(jù)進(jìn)行梳理融合,計(jì)算加工處理數(shù)據(jù)不融合;依據(jù)能效管理自身業(yè)務(wù)特性、管理需求和節(jié)能計(jì)算評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行后續(xù)數(shù)據(jù)加工”的融合策略。通過規(guī)范參數(shù)定義,對(duì)數(shù)據(jù)篩選、匯總、去重、增補(bǔ)、異常值/偏離值判定和剔除等多項(xiàng)融合處置,應(yīng)用標(biāo)準(zhǔn)數(shù)據(jù)采集流程和數(shù)據(jù)同步策略,保障源頭數(shù)據(jù)持續(xù)入湖、同步共享更新。同時(shí),擴(kuò)展數(shù)據(jù)湖缺少的能效相關(guān)財(cái)務(wù)數(shù)據(jù)(能源介質(zhì)不同地域的即時(shí)單價(jià)等數(shù)據(jù))、綜合能耗數(shù)據(jù)、單耗等業(yè)務(wù)數(shù)據(jù),實(shí)現(xiàn)能效數(shù)據(jù)及時(shí)性、準(zhǔn)確性、完整性、標(biāo)準(zhǔn)性和唯一性(權(quán)威性)的存儲(chǔ)、管理與共享[25-27],形成了基于夢(mèng)想云平臺(tái)統(tǒng)一的油氣田企業(yè)能效信息管理平臺(tái)與能效數(shù)據(jù)質(zhì)量管理體系。
通過油氣田企業(yè)能效數(shù)據(jù)融合方法的研究和平臺(tái)搭建應(yīng)用,打通了上游業(yè)務(wù)能效管理相關(guān)統(tǒng)建系統(tǒng)的數(shù)據(jù)融合、集成共享通道。研發(fā)的能效融合數(shù)據(jù)共享服務(wù)、業(yè)務(wù)協(xié)同管理支撐平臺(tái),改變了傳統(tǒng)能效管理模式數(shù)出多門的現(xiàn)狀,實(shí)現(xiàn)了油氣田企業(yè)的能效一體化統(tǒng)一平臺(tái)管理。
通過對(duì)數(shù)據(jù)湖中各類數(shù)據(jù)集的指標(biāo)項(xiàng)比對(duì)校驗(yàn),結(jié)合相關(guān)能效統(tǒng)建系統(tǒng)的數(shù)據(jù)特性、油氣田企業(yè)自建系統(tǒng)實(shí)際應(yīng)用情況等多種數(shù)據(jù)確權(quán)方法,確定了能效相關(guān)指標(biāo)數(shù)據(jù)集來源、能效宏觀綜合指標(biāo)和能效關(guān)鍵性評(píng)價(jià)指標(biāo)內(nèi)容。以機(jī)采系統(tǒng)能效對(duì)標(biāo)體系為例,建立相應(yīng)數(shù)據(jù)融合模型(表1)。
表1 機(jī)采系統(tǒng)能效對(duì)標(biāo)數(shù)據(jù)融合模型實(shí)例Table 1 Data fusion model for energy efficiency benchmarking of machine mining system
續(xù)表
按照油氣田企業(yè)能效數(shù)據(jù)融合方法,分別完成各類能效數(shù)據(jù)融合模型的構(gòu)建,通過細(xì)化能效對(duì)標(biāo)指標(biāo)定義、指標(biāo)描述、極值判定、后臺(tái)運(yùn)算邏輯配置和數(shù)據(jù)人工逐層復(fù)核等方式,制定數(shù)據(jù)抽取過濾策略,確保數(shù)據(jù)的質(zhì)量,完成數(shù)據(jù)融合抽取工作(表2)。
表2 能效對(duì)標(biāo)數(shù)據(jù)融合抽取情況一覽表Table 2 Summary of energy efficiency benchmarking data fusion and extraction
續(xù)表
基于確權(quán)的能效數(shù)據(jù)構(gòu)建相應(yīng)的能效指標(biāo)可視化對(duì)比分析模型,根據(jù)油氣田類型、地質(zhì)油藏類型、工藝類型、指標(biāo)區(qū)間篩選、關(guān)鍵指標(biāo)排序等多條件篩選機(jī)制,快速定位同質(zhì)、同類工況條件對(duì)標(biāo)數(shù)據(jù),提高能效對(duì)標(biāo)的準(zhǔn)確度、吻合度和可對(duì)比性。能效對(duì)標(biāo)分析應(yīng)用如圖5、圖6 所示。
圖5 能效對(duì)標(biāo)分析數(shù)據(jù)篩選截圖Fig.5 Screenshot of data filtering for energy efficiency benchmarking analysis
圖6 能效對(duì)標(biāo)分析數(shù)據(jù)對(duì)比截圖Fig.6 Screenshot of data comparison for energy efficiency benchmarking analysis
通過油氣田企業(yè)能效數(shù)據(jù)融合方法的研究和平臺(tái)搭建應(yīng)用,進(jìn)一步明確了能效相關(guān)數(shù)據(jù)源權(quán)威出處,規(guī)范了能效數(shù)據(jù)標(biāo)準(zhǔn),大幅提高了數(shù)據(jù)采集質(zhì)量和效率,規(guī)避了傳統(tǒng)低效數(shù)據(jù)集成共享模式。能效數(shù)據(jù)的融合和數(shù)據(jù)自動(dòng)抽取、推送,有效縮減了基層單位數(shù)據(jù)重復(fù)采集錄入、反復(fù)審核的工作量,顯著提高了工作效率;全面的能效融合數(shù)據(jù)服務(wù)、共享的科研管理支撐平臺(tái),改變了傳統(tǒng)能效管理模式數(shù)出多門的現(xiàn)狀,實(shí)現(xiàn)了油氣田企業(yè)的能效一體化統(tǒng)一平臺(tái)管理。通過建立跨系統(tǒng)、跨學(xué)科、跨業(yè)務(wù)、跨部門的協(xié)同研究環(huán)境,促進(jìn)了能效數(shù)據(jù)的全生命周期科學(xué)化管理和決策方式的轉(zhuǎn)變。
油氣田企業(yè)能效數(shù)據(jù)融合研究充分借助中國石油勘探開發(fā)夢(mèng)想云、數(shù)據(jù)湖的平臺(tái)優(yōu)勢和數(shù)據(jù)優(yōu)勢,優(yōu)化了傳統(tǒng)信息系統(tǒng)數(shù)據(jù)集成共享的數(shù)據(jù)接口模式,大大簡化了數(shù)據(jù)交互的中間環(huán)節(jié),提高了能效數(shù)據(jù)資源復(fù)用效率和服務(wù)應(yīng)對(duì)能力,輔助并促進(jìn)了相關(guān)部門開展業(yè)務(wù)協(xié)同工作。既實(shí)現(xiàn)了油田開發(fā)全生命周期能效數(shù)據(jù)的集成與綜合應(yīng)用,又進(jìn)一步促進(jìn)了能效管理業(yè)務(wù)流程的優(yōu)化,是提升能效管理工作效率的一個(gè)重要發(fā)展和進(jìn)步,對(duì)今后持續(xù)有效支撐多學(xué)科專業(yè)人員的協(xié)同工作與高效決策具有重要意義。
從長遠(yuǎn)意義來看,油氣田企業(yè)能效數(shù)據(jù)融合作為信息資源聚集融合的一次有益嘗試與實(shí)戰(zhàn)應(yīng)用,開啟了信息整合、內(nèi)容整合、服務(wù)整合、流程整合、業(yè)務(wù)協(xié)同等多方面更大的研究空間。隨著上游板塊建設(shè)數(shù)據(jù)統(tǒng)一采集平臺(tái)的構(gòu)想被越來越多的有識(shí)之士認(rèn)同,啟動(dòng)統(tǒng)一數(shù)據(jù)錄入系統(tǒng)的研究建設(shè)將進(jìn)一步從根本上解決數(shù)據(jù)重復(fù)采集錄入問題,有效保障數(shù)據(jù)的唯一性、準(zhǔn)確性、權(quán)威性和快速可溯源特性,數(shù)據(jù)治理和資源整合的大環(huán)境有望得到進(jìn)一步優(yōu)化完善。