胡敏清
(中國石油青海油田公司信息服務(wù)中心,敦煌 736202)
在油田采集范圍不斷擴大的過程中,企業(yè)數(shù)據(jù)庫容量在此過程中得到了較大的增加,容量從GB級已經(jīng)向著TB級發(fā)展。在此過程當中,其在數(shù)據(jù)的存儲、查詢、提取以及管理方面也發(fā)生了一定的變化。在該種情況下,即可以通過大數(shù)據(jù)技術(shù)的應(yīng)用對海量的數(shù)據(jù)集進行訪問,在從中對具有價值信息進行抽取的基礎(chǔ)上分析未來趨勢,具有較好的應(yīng)用價值。
對于油田大數(shù)據(jù)處理,即是在油田的數(shù)據(jù)范圍以內(nèi)對非結(jié)構(gòu)、結(jié)構(gòu)化數(shù)據(jù)的混合處理。具體處理過程有離線數(shù)據(jù)以及在線數(shù)據(jù)這兩種處理方式。在具體處理技術(shù)方面,在統(tǒng)一管理計算模型的基礎(chǔ)上實現(xiàn)迭代、批處理以及流計算模型管理,在支持應(yīng)用的基礎(chǔ)上使其能夠?qū)哂写┩?、跨越特征的?jīng)營、成果、人力資源以及天氣數(shù)據(jù)等進行采集,以此對油田大數(shù)據(jù)的應(yīng)用模式進行實現(xiàn)。
在線數(shù)據(jù)處理方式來說,其能夠以實時的方式對油田的生產(chǎn)情況進行處理、預(yù)測以及感知,如油區(qū)當中不同接口、業(yè)務(wù)以及設(shè)備的運行狀態(tài),以此對秒級監(jiān)控告警目標進行實現(xiàn)。同批量處理方式不同,流處理方式具有著全內(nèi)存計算的特點,能夠?qū)φ麄€過程當中的速度問題進行有效的解決與處理,在對實時數(shù)據(jù)流等進行處理時,在可靠、靈活性以及性能方面具有較好的體現(xiàn)。對此,該模型則是實際大數(shù)據(jù)處理當中的有效方式。
離線處理方面,其較多的應(yīng)用在OLAP分析工作當中,在具體多維分析工作當中,需要具有大量的表間關(guān)聯(lián)以及數(shù)據(jù)分組工作,并因此對維度多性能產(chǎn)生影響。通過Spark并行化處理能力方式的應(yīng)用,無論其中具有多少維度的增加,在實際開銷方面卻并沒有增長。通過其應(yīng)用,即能夠?qū)崿F(xiàn)巨大Cube的支持,具有著較多的維度。且在每一次多維分析當中,都能夠?qū)Ω嗟木S度提供支持,并不會因此對分析性能產(chǎn)生影響。
在油田數(shù)據(jù)當中,具有著地質(zhì)對象發(fā)展規(guī)律、趨勢以及動態(tài)變化等情況,根據(jù)油田行業(yè)知識以及大數(shù)據(jù)技術(shù)對這部分動態(tài)變化、趨勢情況進行揭示,則可以說是建設(shè)智能油田的一項重點工作內(nèi)容。
對于傳統(tǒng)數(shù)據(jù)查詢方式來說,其通常通過事物數(shù)據(jù)庫現(xiàn)場數(shù)據(jù)的采集對目標進行實現(xiàn),在實際處理當中,需要以逐層的方式查詢分析,在具體查詢路線方面具有較為固定的特點,并因此出現(xiàn)查詢維度較少且多表查詢較弱的情況。在該方式具體應(yīng)用當中,無法對復(fù)雜的綜合查詢目標進行實現(xiàn),需要在以逐層方式查詢分級之后再進行整理下載。通過傳統(tǒng)數(shù)據(jù)查詢實現(xiàn)對倉庫多維數(shù)據(jù)模型的轉(zhuǎn)換,則能夠幫助決策人員在實際工作當中具有能夠?qū)崿F(xiàn)數(shù)據(jù)源跨越的整合視圖,對任意維度組合的查詢提供支持。
通過大數(shù)據(jù)技術(shù)的應(yīng)用,則能夠在不同數(shù)據(jù)類型當中交叉分析的基礎(chǔ)上對數(shù)據(jù)價值進行獲得,以此對智能油田的建設(shè)進行推進。在具體建設(shè)智能油田的過程中,對靈活、具有多角度特征的數(shù)據(jù)分析能力具有較高的要求。從決策角度來看,決策者所希望的即是對多角度分析結(jié)果進行獲得。從開發(fā)形勢情況變化來看,其不僅需要掌握不同開發(fā)單位、油田的開發(fā)形勢變化,且需要獲得具有不同采出程度以及不同類型油藏情況的變化分析,且同時包括有自然因素以及社會因素的影響因素分析。
在大數(shù)據(jù)技術(shù)具體應(yīng)用當中,數(shù)據(jù)挖掘算法是其中的核心內(nèi)容,對于不同算法來說,其以不同的格式與數(shù)據(jù)類型為基礎(chǔ),以此才能夠以更為科學(xué)的方式對數(shù)據(jù)本身特點進行呈現(xiàn)。對于該種情況,則需要積極做好適合油田勘探開發(fā)的數(shù)據(jù)挖掘算法研究,如從全局角度對含水、耗電以及采油量的統(tǒng)計,對耗電同產(chǎn)量、季節(jié)同生產(chǎn)用電等關(guān)系進行評估,即以分析方式的應(yīng)用提前對一個時間段的用電量進行估計,在此基礎(chǔ)上實現(xiàn)生產(chǎn)的安排。此外,需要對不同因素導(dǎo)致的停產(chǎn)損失進行統(tǒng)計,并針對可控停產(chǎn)做好預(yù)防與針對性的治理。
在建設(shè)智能油田當中,需要以實時的方式做好變化數(shù)據(jù)預(yù)測。在具體工作中,油田需要由發(fā)生后預(yù)警實現(xiàn)對超前預(yù)警方式的改變,在對未來勘探開發(fā)工作提供指導(dǎo)的基礎(chǔ)上使數(shù)據(jù)能夠充分實現(xiàn)自身價值的發(fā)揮。在此過程中,通過大數(shù)據(jù)挖掘技術(shù)的應(yīng)用,即能夠以多種方式對開發(fā)規(guī)律進行分析,在對多維度儲量評價模型進行建立的基礎(chǔ)上實現(xiàn)油田整體預(yù)警能力的提升,在對產(chǎn)量波動風(fēng)險有效降低的基礎(chǔ)上提升生產(chǎn)效率、控制管理成本,以此為油田在新市場環(huán)境下穩(wěn)定持續(xù)發(fā)現(xiàn)提供重要的動力。
在現(xiàn)今油田發(fā)展當中,對于數(shù)據(jù)的處理已經(jīng)成為了非常重要的一項工作內(nèi)容。對此,即需要油田管理者能夠?qū)υ擁椆ぷ饕鹬匾暎ㄟ^對大數(shù)據(jù)技術(shù)的科學(xué)運用為油田的穩(wěn)定持續(xù)發(fā)展提供動力。
[1] 王世杰.大數(shù)據(jù)環(huán)境下石油企業(yè)信息化的建設(shè)[J].信息系統(tǒng)工程.2017(07).
[2] 江南.建立廣東供銷合作經(jīng)濟信息大數(shù)據(jù)應(yīng)用平臺探討[J].廣東合作經(jīng)濟.2013(04).
[3] 朱正德.大數(shù)據(jù)時代檢測技術(shù)功能的拓展和演化及其對現(xiàn)代制造業(yè)的深遠影響[J].四川工程職業(yè)技術(shù)學(xué)院學(xué)報.2016(01).