范振鐸
摘 要:在了解油水井生產(chǎn)狀況的基礎(chǔ)上,以集中式和數(shù)據(jù)流挖掘體系結(jié)構(gòu)為依據(jù),采用趨勢分析技術(shù)對油水井工況數(shù)據(jù)進行實時分析預(yù)測,實現(xiàn)分割點和異常點的檢驗。利用油田采集的數(shù)據(jù)模擬形成數(shù)據(jù)流,通過實驗驗證,基于數(shù)據(jù)流的油水井工況分析系統(tǒng)總體框架可通用,VSW-PAA算法和趨勢分析方法很實用,進行模式異常檢測,檢測效果良好,能發(fā)現(xiàn)設(shè)備異常情況,為設(shè)備管理者提供決策依據(jù)。
關(guān)鍵詞:數(shù)據(jù)流;數(shù)據(jù)流聚類;模式異常;油水井工況
1 引言
油水井監(jiān)測系統(tǒng)在運行的過程中會產(chǎn)生大量的實時監(jiān)測數(shù)據(jù),如何高效準(zhǔn)確的處理和利用這些數(shù)據(jù)完成油水井工況分析是油田的一大難題。示功圖可對油水井工況進行分析,從而診斷設(shè)備是否正常運行和分析故障產(chǎn)生的因素,為油水井正常生產(chǎn)提供技術(shù)保障。隨著通訊技術(shù)和檢測技術(shù)的發(fā)展,數(shù)據(jù)采集手段不斷豐富,數(shù)據(jù)流技術(shù)[1]已大范圍的推廣使用。在了解油水井工況分析技術(shù)的基礎(chǔ)上,利用相應(yīng)算法和數(shù)據(jù)流技術(shù),設(shè)計基于數(shù)據(jù)流技術(shù)的油水井工況分析系統(tǒng),實現(xiàn)油水井設(shè)備的實時監(jiān)測、異常診斷和故障診斷,同時,為管理者提供決策依據(jù),為油水井管理提供了巨大的幫助。
2 油水工況分析系統(tǒng)的設(shè)計
數(shù)據(jù)挖掘[2]是從大量的數(shù)據(jù)中發(fā)現(xiàn)和搜尋有價值、可靠性和實用性的規(guī)律,這些規(guī)律是隱藏在數(shù)據(jù)中,充分的利用這些規(guī)律有利于生產(chǎn)分析。數(shù)據(jù)流現(xiàn)在沒有明確的定義,數(shù)據(jù)流的特性包括有序性、實時性、無限性、概要性和及時性,這些特性決定了數(shù)據(jù)處理的特點,數(shù)據(jù)流結(jié)構(gòu)如圖1所示。數(shù)據(jù)流挖掘體系的對象是數(shù)據(jù)流,針對油水井工況分析的特殊情況,安裝相應(yīng)組件實現(xiàn)數(shù)據(jù)挖掘。油水井監(jiān)測系統(tǒng)在運行的過程中會產(chǎn)生大量的實時監(jiān)測數(shù)據(jù),如何高效準(zhǔn)確的處理和利用這些數(shù)據(jù)完成油水井工況分析是油田的一大難題?,F(xiàn)在的數(shù)據(jù)處理模式不適用于動態(tài)高速的數(shù)據(jù)處理,在分析現(xiàn)有技術(shù)弊端的基礎(chǔ)上,設(shè)計一種滿足油田需求的數(shù)據(jù)挖掘系統(tǒng)。針對動態(tài)變化流速的數(shù)據(jù)流,我們提出可變滑動窗口的數(shù)據(jù)流聚類算法[3],分為在線階段和離線階段,可進行不同階段的數(shù)據(jù)流處理。數(shù)據(jù)挖掘常用技術(shù)有人工神經(jīng)網(wǎng)絡(luò)、決策樹、遺傳算法、近鄰算法和規(guī)則推導(dǎo)技術(shù)。數(shù)據(jù)挖掘是一種決策支持過程,關(guān)聯(lián)規(guī)則挖掘[4]必須先從資料集合中找出所有的高頻項目組,再由這些高頻項目組中產(chǎn)生關(guān)聯(lián)規(guī)則。數(shù)據(jù)流趨勢分析是建立在時間序列[5]的基礎(chǔ)上,研究現(xiàn)有數(shù)據(jù)流的規(guī)律,預(yù)測未來數(shù)據(jù)流的變化趨勢。數(shù)據(jù)流存在實時提取的困難,引入可變滑動窗口調(diào)整現(xiàn)行回歸模型,實現(xiàn)基于分割點的最小二乘多元回歸趨勢分析方法[6]。采用趨勢分析技術(shù)對油水井工況數(shù)據(jù)進行實時分析預(yù)測,實現(xiàn)分割點和異常點的檢驗。
3 油水工況分析系統(tǒng)的應(yīng)用
采用數(shù)據(jù)趨勢分析手段檢測數(shù)據(jù)流是否異常,設(shè)計數(shù)據(jù)流挖掘總體框架。采用時間序列數(shù)據(jù)流,提出分段聚類算法進行去噪和壓縮處理,為數(shù)據(jù)趨勢分析打下良好基礎(chǔ)。在分析SW算法和OSD算法[7]優(yōu)缺點的基礎(chǔ)上,有針對性的結(jié)合并改進相關(guān)算法,優(yōu)選最小二乘多元回歸趨勢分析算法,準(zhǔn)確提取數(shù)據(jù)流的相關(guān)趨勢特征和合理定位分割點,實現(xiàn)趨勢準(zhǔn)確分析。在確定趨勢之后,進行預(yù)測結(jié)果分析和異常檢測。由于很難做到數(shù)據(jù)流的實時提取,在分析數(shù)據(jù)分割算法和滑動窗口算法優(yōu)缺點的基礎(chǔ)上,提出利用可變滑動窗口調(diào)整線性回歸模型。數(shù)據(jù)流趨勢分析是根據(jù)數(shù)據(jù)流的特點進行選擇模型,例如,周期性的動態(tài)數(shù)據(jù)選擇線性回歸模型。故障趨勢分析技術(shù)主要是針對靜態(tài)數(shù)據(jù)進行分析,對于實時動態(tài)數(shù)據(jù),已不適用,需要設(shè)計新的數(shù)據(jù)建模方法和數(shù)據(jù)處理技術(shù)。油水井工況分析系統(tǒng)主要有數(shù)據(jù)采集與傳輸、數(shù)據(jù)流監(jiān)測與表示和趨勢分析預(yù)測三大模塊。在設(shè)計完該系統(tǒng)之后,進行系統(tǒng)調(diào)試和實驗驗證,效果良好。以油田采集到的數(shù)據(jù)為基礎(chǔ),模擬形成載荷數(shù)據(jù)流,利用該系統(tǒng)進行數(shù)據(jù)流趨勢分析和異常檢測,監(jiān)測效果良好,可提前發(fā)現(xiàn)油水井設(shè)備故障異常,為油田管理者提供決策依據(jù),可在其他油田進行大范圍的推廣應(yīng)用。
4 結(jié)論
為實現(xiàn)油水井工況的實時監(jiān)測和故障診斷,結(jié)合數(shù)據(jù)流挖掘和集中式體系結(jié)構(gòu),搭建基于數(shù)據(jù)流技術(shù)的油水井工況分析框架。在分析數(shù)據(jù)流模式表示方法和趨勢分析方法優(yōu)缺點的基礎(chǔ)上,優(yōu)選能進行去噪和壓縮的模式表示方法和趨勢分析方法。采集相關(guān)工況數(shù)據(jù)模擬形成數(shù)據(jù)流,了解數(shù)據(jù)流的挖掘方法,利用數(shù)據(jù)流分段聚類算法表示數(shù)據(jù)流模式。結(jié)合SW算法和OSD算法,采用最小二乘數(shù)據(jù)流趨勢分析方法,實現(xiàn)異常點與分割點的檢測。通過實驗驗證,不斷進行算法修改,總體框架可通用,趨勢分析方法實用性好,異常檢測效果良好,達(dá)到工況分析和節(jié)能減耗的目的。在某油田的應(yīng)用可知,油水井工況監(jiān)測效果良好,可提前發(fā)現(xiàn)油水井設(shè)備故障異常,為油田管理者提供決策依據(jù),可在其他油田進行大范圍的推廣應(yīng)用。
參考文獻(xiàn):
[1]周曉云,張凈,孫志揮.高Turnstile型數(shù)據(jù)流聚類算法[J].計算機科學(xué),2006.
[2]張忠平,王浩,薛偉.動態(tài)滑動窗口的數(shù)據(jù)流聚類方法[J].計算機工程與應(yīng)用,2011.
[3]朱蔚恒,印鑒,謝益煌.基于數(shù)據(jù)流的任意形狀聚類算法[J].軟件學(xué)報,2006.
[4]常建龍,曹鋒,周傲英.基于滑動窗口的進化數(shù)據(jù)流聚類[J].軟件學(xué)報,2007.
[5]宋寶燕.基于滑動窗口的支持泛在應(yīng)用的流聚類挖掘算法[J].小型微型計算機系統(tǒng),2008.
[6]李國徽,向軍,陳剛.基于概率模型的數(shù)據(jù)流預(yù)測查詢算法[J].計算機科學(xué),2008.
[7]汪成亮,陸志堅.一種數(shù)據(jù)流趨勢分析方法的研究與應(yīng)用[J].計算機系統(tǒng)應(yīng)用,2010.