朱治國 苗彥平 王軍 凌帥 薛李強(qiáng) 杜航
(中國石油華北油田分公司第三采油廠)
大數(shù)據(jù)分析是指對海量多類型、快增長且內(nèi)容真實(shí)的數(shù)據(jù)進(jìn)行分析,從中找出可以幫助決策的隱藏模式、未知的相關(guān)關(guān)系或其他有用信息的過程[1-2]。目前,隨著油田自動(dòng)化程度的提高,數(shù)據(jù)的采集密度及頻次較油田開發(fā)初期有了質(zhì)的飛躍,數(shù)據(jù)量的增加,加之?dāng)?shù)據(jù)的結(jié)構(gòu)復(fù)雜,存在結(jié)構(gòu)化、非結(jié)構(gòu)化及半結(jié)構(gòu)化數(shù)據(jù),這使工程技人員在處理數(shù)據(jù)時(shí)顯得力不從心。
與傳統(tǒng)的分析方法相比,數(shù)據(jù)挖掘技術(shù)可以實(shí)現(xiàn)從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際數(shù)據(jù)中,提取隱含其中的、不為人知但又有潛在應(yīng)用價(jià)值的信息和知識[3]。綜合考慮各種因素對生產(chǎn)動(dòng)態(tài)的影響,從而更準(zhǔn)確地制定降低抽油機(jī)井噸液百米耗電的措施,有必要將大數(shù)據(jù)分析技術(shù)應(yīng)用到能耗評價(jià)系統(tǒng)中,建立“以降低采油系統(tǒng)能耗”為目標(biāo)的數(shù)據(jù)庫,并配置以數(shù)據(jù)回歸分析、聚類分析、人工神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘算法,建立挖掘模型。
通過建設(shè)以降低采油系統(tǒng)能耗為主題的專業(yè)數(shù)據(jù),從與采油相關(guān)的數(shù)據(jù)庫中獲取數(shù)據(jù),并配置以數(shù)據(jù)回歸分析、聚類分析、人工神經(jīng)網(wǎng)絡(luò)分析等數(shù)據(jù)挖掘算法,建立挖掘模型,形成數(shù)據(jù)挖掘平臺,對生產(chǎn)過程采集到的數(shù)據(jù)進(jìn)行挖掘分析,并以圖表、曲線等方式進(jìn)行可視化展示(圖1)。
圖1 大數(shù)據(jù)專業(yè)數(shù)據(jù)庫總體設(shè)計(jì)
由于生產(chǎn)數(shù)據(jù)來源多樣,存在結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),并且測試工作量的增大伴隨著儀器、人員造成的錯(cuò)誤數(shù)據(jù),因此針對此次“以降低采油系統(tǒng)能耗”為目標(biāo)的數(shù)據(jù)庫建設(shè),涉及到的數(shù)據(jù)分析分為五個(gè)步驟。第一步是數(shù)據(jù)收集:采用全體取樣的方式抽取與分析相關(guān)的所有結(jié)構(gòu)化、非結(jié)構(gòu)化及半結(jié)構(gòu)化數(shù)據(jù)。第二步是數(shù)據(jù)質(zhì)量分析:評估數(shù)據(jù)的正確性和有效性,此次數(shù)據(jù)質(zhì)量分析用到的主要有值分析方法、統(tǒng)計(jì)分析方法、頻次與直方圖分析方法等。第三步是數(shù)據(jù)預(yù)處理:主要進(jìn)行數(shù)據(jù)清理工作,通過填寫缺失的值、光滑噪聲數(shù)據(jù)、識別或刪除離散點(diǎn),并以解決不一致性的方式來“清理”數(shù)據(jù)。第四步是數(shù)據(jù)挖掘:對已進(jìn)行過預(yù)處理的數(shù)據(jù),通過制圖、制表、方程擬合、計(jì)算特征量等手段探索數(shù)據(jù)的結(jié)構(gòu)和規(guī)律,此次挖掘用到的主要有數(shù)據(jù)回歸分析、聚類分析、人工神經(jīng)網(wǎng)絡(luò)等。第五步是現(xiàn)場應(yīng)用:針對數(shù)據(jù)挖掘出的規(guī)律進(jìn)行現(xiàn)場試驗(yàn)應(yīng)用,并進(jìn)行效果跟蹤。數(shù)據(jù)分析流程設(shè)計(jì)見圖2。
圖2 數(shù)據(jù)分析流程設(shè)計(jì)
抽油機(jī)井噸液百米耗電是指原油在開采過程中把1 t液體從井下提升100 m所消耗的電能。單井噸液百米耗電的計(jì)算公式[4]為
式中:X為單井噸液百米耗電,kWh/(102·t);W為單井日耗電量,kWh;Q為單井日產(chǎn)液量,t;H為有效揚(yáng)程,m。
在油田生產(chǎn)過程中,抽油機(jī)井噸液百米舉升耗電是評價(jià)油井能耗狀況的重要指標(biāo)之一,是井下、地面等參數(shù)綜合的結(jié)果。據(jù)現(xiàn)場經(jīng)驗(yàn)可知,一般產(chǎn)液量、下泵深度、沉沒度、含水率、抽汲液體黏度、沖程沖速、抽油機(jī)平衡率等諸多因素都可以影響噸液百米耗電,難以評價(jià)的因素還有熱洗化防次數(shù)、對應(yīng)注水井注水情況、抽油機(jī)型號、電動(dòng)機(jī)功率等。雖然目前對影響抽油機(jī)井噸液百米耗電的因素有了一定了解,但還需要應(yīng)用大數(shù)據(jù)分析技術(shù)找出各種因素之間的相關(guān)性。
在大數(shù)據(jù)專業(yè)數(shù)據(jù)庫設(shè)計(jì)的基礎(chǔ)上,配套嵌入數(shù)據(jù)回歸分析、聚類分析、人工神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘算法,建立挖掘模型,對大量數(shù)據(jù)進(jìn)行分析與預(yù)測。
1.4.1 數(shù)據(jù)回歸分析
回歸方法是處理變量之間的相關(guān)關(guān)系的一種數(shù)學(xué)方法。根據(jù)回歸方法中變量的個(gè)數(shù)和回歸函數(shù)的類型(線性或非線性)可以將回歸方法分為一元線性、一元非線性、多元線性、多元非線性。另外,還有兩種特殊的回歸方式,一種在回歸的過程中可以調(diào)整變量數(shù)的回歸方法,稱為逐步回歸;另一種是以指數(shù)結(jié)構(gòu)函數(shù)作為回歸模型的方法,稱為Logistic回歸[5]。
通過分析噸液百米耗電與各因素之間的關(guān)系,主要應(yīng)用一元線性進(jìn)行權(quán)重分析,確定影響噸液百米耗電的主要因素;應(yīng)用一元非線性進(jìn)行合理沉沒度的優(yōu)選,系統(tǒng)效率與噸液百米耗電的分析等。
1.4.2 聚類分析
將物理或抽象對象的集合分為由類似的對象組成的多個(gè)類或者簇的過程稱為聚類,由聚類所生成的簇是一組數(shù)據(jù)對象的集合,這些對象與同一簇中的對象相似度較高,與其他簇的相似度較低[6]。
通過研究噸液百米耗電在所要分析區(qū)塊的分布,能夠?qū)?shù)量較多的油井進(jìn)行分類,發(fā)現(xiàn)高耗能油井,進(jìn)而方便對噸液百米耗電指標(biāo)的再評價(jià),以及依據(jù)現(xiàn)場實(shí)際生產(chǎn)情況制定相應(yīng)的措施。
1.4.3 人工神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是分類技術(shù)中的重要方法之一。人工神經(jīng)網(wǎng)絡(luò)是一種應(yīng)用類似于大腦神經(jīng)突觸連接的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型。在這種模型中,大量的節(jié)點(diǎn)(或稱為“神經(jīng)元”,或“單元”)之間相互聯(lián)接構(gòu)成網(wǎng)絡(luò),即“神經(jīng)網(wǎng)絡(luò)”,以達(dá)到處理信息的目的[7]。
神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的信息處理及并行計(jì)算的能力,每個(gè)神經(jīng)元對下一個(gè)神經(jīng)元都有抑制或者興奮的作用。從數(shù)學(xué)角度分析,這種關(guān)系可以用非線性映射函數(shù)來表示。人工神經(jīng)網(wǎng)絡(luò)的方法在分析油井噸液百米耗電中可以實(shí)現(xiàn)對歷史數(shù)據(jù)進(jìn)行訓(xùn)練形成記憶,并優(yōu)化已建立的數(shù)學(xué)模型,使網(wǎng)絡(luò)具有很好的容錯(cuò)性,以實(shí)現(xiàn)對后期數(shù)據(jù)的預(yù)測。
此次大數(shù)據(jù)分析案例以華北油田采油三廠971口油井?dāng)?shù)據(jù)為基礎(chǔ),結(jié)合抽油機(jī)井基礎(chǔ)數(shù)據(jù)、功圖數(shù)據(jù)、自動(dòng)檢測實(shí)時(shí)數(shù)據(jù)及系統(tǒng)效率等近150萬條數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、分類等工作,建立了針對抽油機(jī)井噸液百米耗電的主題數(shù)據(jù)庫,并通過配套嵌入的相關(guān)數(shù)據(jù)挖掘算法,發(fā)現(xiàn)隱藏其中的相關(guān)規(guī)律,制定以降低抽油機(jī)井噸液百米耗電為目標(biāo)的措施。
抽油機(jī)井噸液百米耗電是衡量抽油機(jī)能耗水平的重要指標(biāo)。2017年,華北油田采油三廠平均單井噸液百米耗電為0.99 kWh/(102·t),系統(tǒng)效率為30.21%,抽油機(jī)電費(fèi)占全廠總成本的6.54%。在含水上升、液量增加,國際油價(jià)持續(xù)低位徘徊的大環(huán)境下,提高抽油機(jī)系統(tǒng)效率、降低能耗具有重要意義。
通過對采集到的數(shù)據(jù)進(jìn)行正態(tài)分布圖、曲線圖、柱狀圖、散點(diǎn)圖等方式進(jìn)行直觀展示。以某采油工區(qū)為例,統(tǒng)計(jì)分析近期測量的160余口油井噸液百米耗電數(shù)據(jù),繪制正態(tài)分布圖;應(yīng)用3σ準(zhǔn)則劃分邊界條件進(jìn)行質(zhì)量控制,發(fā)現(xiàn)6口井嚴(yán)重偏離平均值,現(xiàn)場重新測量之后,發(fā)現(xiàn)是測試儀器故障。經(jīng)過初步分析,可以實(shí)現(xiàn)對錯(cuò)誤數(shù)據(jù)的檢測及淺顯規(guī)律的發(fā)現(xiàn)。
通過分析電動(dòng)機(jī)、抽油機(jī)等因素與噸液百米耗電的關(guān)系,發(fā)現(xiàn)抽油機(jī)平衡率與能耗分布無明顯規(guī)律。認(rèn)為:目前利用峰值電流評價(jià)平衡率的方法值得商榷,若采用功率法能更準(zhǔn)確地反應(yīng)抽油機(jī)平衡情況。分析抽油機(jī)井噸液百米耗電與系統(tǒng)效率的關(guān)系發(fā)現(xiàn),兩者之間存在擬合度良好的冪函數(shù)關(guān)系曲線。
2.3.1 系統(tǒng)效率分析
選取所屬某區(qū)塊所有油井的噸液百米耗電數(shù)據(jù)及系統(tǒng)效率數(shù)據(jù),做出兩者之間的散點(diǎn)圖,擬合出的冪函數(shù)關(guān)系曲線為y=23.99x-0.96,表明二者存在明顯的冪函數(shù)曲線關(guān)系。進(jìn)而按噸液百米耗電的不同對數(shù)據(jù)進(jìn)行分類,做出各自區(qū)間的線性關(guān)系,分析發(fā)現(xiàn)直線1與直線2的斜率之比為10.4倍,相交點(diǎn)系統(tǒng)效率為9.7%;直線2與直線3斜率之比為5.6倍,相交點(diǎn)的系統(tǒng)效率為28.9%。這表明:當(dāng)系統(tǒng)效率值小于9.7%時(shí),能耗水平降低空間巨大,是重點(diǎn)治理區(qū)域;系統(tǒng)效率值在9.7%與28.9%的油井是普通治理區(qū)間;系統(tǒng)效率值大于28.9%的區(qū)域?yàn)楦咝^(qū)域。某區(qū)塊油井系統(tǒng)效率與噸液百米耗電關(guān)系見圖3。
圖3 某區(qū)塊油井系統(tǒng)效率與噸液百米耗電關(guān)系
2.3.2 沉沒度分析
選取所屬某區(qū)塊所有油井的數(shù)據(jù),以抽油機(jī)井噸液百米耗電及系統(tǒng)效率為研究對象,進(jìn)行合理沉沒度的確定。應(yīng)用聚類的方法以50 m為間隔進(jìn)行劃分,求出每個(gè)區(qū)間內(nèi)的平均沉沒度、平均系統(tǒng)效率、平均噸液百米耗電;應(yīng)用回歸分析擬合出2條二次函數(shù)曲線(圖4)。隨著沉沒度的增加,平均噸液百米耗電先減少、后增加,沉沒度在300~700 m時(shí)平均噸液百米耗電最低;而系統(tǒng)效率隨著沉沒度的增加先增加、后減小,沉沒度在300~900 m時(shí)平均系統(tǒng)效率最高。采用數(shù)學(xué)求導(dǎo)確定極值的方法,確定出所屬區(qū)域合理沉沒度為375~617 m。
圖4 某區(qū)塊油井沉沒度與噸液百米耗電、系統(tǒng)效率聚類分析
2.4 高級數(shù)據(jù)挖掘
選取某區(qū)塊所屬油井的14個(gè)與噸液百米耗電相關(guān)的因素,建立如下數(shù)學(xué)模型:
式中:xn(i=1,2,3…n)為噸液百米耗電的影響因素。
式中:γ為噸液百米耗電對任意變量xi的偏導(dǎo)數(shù)。
γ絕對值的大小反映了變量xi對噸液百米耗電的影響程度。值越大,變量xi對噸液百米耗電的影響越顯著,同時(shí)γ的正負(fù)值反映了該變量xi對噸液百米耗電的影響方向。值為正表明噸液百米耗電隨變量xi值增加而增加。反之噸液百米耗電降低。
用單因素量xi下的偏導(dǎo)數(shù)的絕對值與所有因素偏導(dǎo)數(shù)絕對值之和的比值,表示噸液百米耗電敏感性程度的權(quán)重系數(shù)ω,即
進(jìn)而進(jìn)行權(quán)重分析,尋找影響噸液百米耗電的主要因素,并為后期制定措施指明方向。由表1可知,影響抽油機(jī)井泵效的因素敏感性程度大小排序?yàn)椋寒a(chǎn)液量>泵效>沖速>泵徑>沖程>原油黏度>含水率>懸點(diǎn)最小載荷>抽油機(jī)平衡度>泵深>抽油機(jī)載荷利用率>電動(dòng)機(jī)載荷利用率>沉沒度>懸點(diǎn)最大載荷。后續(xù)在制定降低噸液百米耗電的措施時(shí)應(yīng)按所分析的次序優(yōu)先進(jìn)行調(diào)整。
表1 某區(qū)塊油井噸液百米耗電影響因素排序
結(jié)合大數(shù)據(jù)分析成果,編制詳細(xì)的節(jié)能措施方案,針對不同井況、不同生產(chǎn)情況制定措施。
1)針對產(chǎn)液量低、泵效低的問題,采取壓裂、酸化、地質(zhì)補(bǔ)孔等措施,提高產(chǎn)液量;對地層挖潛潛力不大的油井進(jìn)行間開或安裝抽油機(jī)變速運(yùn)行智能控制裝置,降低噸液百米耗電,節(jié)電率達(dá)21.66%。
2)針對沖程、沖速、泵徑、泵深匹配關(guān)系不好的問題,在數(shù)據(jù)庫建設(shè)的基礎(chǔ)上,對歷史數(shù)據(jù)應(yīng)用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,并結(jié)合桿柱等強(qiáng)度理論,開發(fā)了井下完井桿柱組合方式軟件,系統(tǒng)調(diào)節(jié)沖程、沖速及井下桿柱配比。分析應(yīng)用以來,調(diào)整沖程139次、調(diào)整沖速162次,優(yōu)化泵徑及桿柱組合581井次,年節(jié)電92.65×104kWh。
3)針對抽油機(jī)不平衡的問題,通過調(diào)整平衡度、皮帶松緊程度、驢頭對中、中軸尾軸的潤滑等方式以提高地面效率,目前調(diào)整平衡167井次,調(diào)整皮帶93井次、中軸尾軸潤滑4000余次,年節(jié)電113.53×104kWh。
1)通過對抽油機(jī)井噸液百米耗電大數(shù)據(jù)的分析,為油井能耗挖潛提供了一定的借鑒依據(jù)。
2)以降低抽油機(jī)井噸液百米耗電為目標(biāo)的大數(shù)據(jù)分析應(yīng)用,配套嵌入數(shù)據(jù)回歸分析、聚類分析、人工神經(jīng)網(wǎng)絡(luò)等各種數(shù)據(jù)算法,為油田大數(shù)據(jù)分析工作的應(yīng)用,以及油田由工業(yè)化向信息化融合提供了新的思路。
3)現(xiàn)場應(yīng)用證明,依據(jù)大數(shù)據(jù)分析結(jié)構(gòu),具體結(jié)合各單井實(shí)際情況而制定的節(jié)能措施,其效果顯著,具有持續(xù)推廣的意義。