于 鏑, 宋盛瑤, 任偉建, 康朝海, 劉玉敏
( 東北石油大學(xué) 電氣信息工程學(xué)院,黑龍江 大慶 163318 )
?
油田開采智能評(píng)價(jià)有用規(guī)則提取方法
于鏑, 宋盛瑤, 任偉建, 康朝海, 劉玉敏
( 東北石油大學(xué) 電氣信息工程學(xué)院,黑龍江 大慶163318 )
基于油田開采智能評(píng)價(jià)的有用規(guī)則是通過專家問卷調(diào)查產(chǎn)生的,受專家選擇和實(shí)踐檢驗(yàn)的難度,以及某些專家經(jīng)驗(yàn)規(guī)則可能與實(shí)際數(shù)據(jù)不一致影響而具有明顯的局限性。采用基于區(qū)間Ⅱ型模糊集合的語言摘要方法,從油田開采數(shù)據(jù)庫中產(chǎn)生IF-THEN規(guī)則,并根據(jù)真實(shí)度、覆蓋度、可靠度和離群度等4個(gè)質(zhì)量測(cè)度提取油田開采評(píng)價(jià)有用規(guī)則;進(jìn)而基于平行坐標(biāo)法及GUI界面建立可視化邏輯規(guī)則群。應(yīng)用結(jié)果表明:該方法節(jié)省專家的時(shí)間,有助于在經(jīng)驗(yàn)與實(shí)際數(shù)據(jù)不一致基礎(chǔ)上完善專家經(jīng)驗(yàn)規(guī)則。
區(qū)間Ⅱ型模糊集合; 語言摘要; 規(guī)則提??; 智能評(píng)價(jià); 可視化; 邏輯規(guī)則群; 油田開采
通過油田開采效果評(píng)價(jià),確定影響油田開采效果的規(guī)律和主控因素、制訂合理的油田開發(fā)調(diào)整措施,是提高油田采收率的核心內(nèi)容。對(duì)于復(fù)雜的非均質(zhì)油藏動(dòng)態(tài)系統(tǒng),采用理論、實(shí)驗(yàn)和數(shù)值模擬等方法,研究油田開采效果并通過現(xiàn)場(chǎng)實(shí)踐驗(yàn)證,存在很大局限性。專家經(jīng)驗(yàn)分析是一種重要和廣泛使用的油田開采效果評(píng)價(jià)方法,它將油藏視為一個(gè)連續(xù)脈沖響應(yīng)的系統(tǒng),將油田生產(chǎn)動(dòng)態(tài)近似看成由輸入信號(hào)(注水量)產(chǎn)生輸出信號(hào)(產(chǎn)量)的過程,由基于采出井產(chǎn)量和注入井注水量之間的相關(guān)性可以估計(jì)注采關(guān)系[1-2]。
在油田開采智能評(píng)價(jià)時(shí),需將一些油田專家經(jīng)驗(yàn)包含在評(píng)價(jià)規(guī)則中,規(guī)則可從專家調(diào)查問卷中挖掘。由于存在專家選擇和實(shí)踐檢驗(yàn)的難度,以及某些專家經(jīng)驗(yàn)規(guī)則可能與實(shí)際數(shù)據(jù)不一致問題,專家調(diào)查問卷產(chǎn)生有用規(guī)則的方法具有明顯的局限性,如評(píng)價(jià)油田開采效果的核心指標(biāo)是原油采收率,而原油采收率取決于波及系數(shù)和洗油效率。其中,波及系數(shù)的影響因素包括油層非均質(zhì)性、流度比、原油黏度及注采關(guān)系等;洗油效率的影響因素是巖石滲透率、原油黏度、巖石潤(rùn)濕性和毛管數(shù)[3-5]。這些影響因素受油田地質(zhì)條件、層系井網(wǎng)部署和開采方式影響,即不同油田、不同層系影響開采效果的規(guī)律不同、主控因素也有差異。另外,這些影響因素之間還存在不同程度的相互作用問題,專家難以從中提煉有用規(guī)則。在油田開采效果評(píng)價(jià)時(shí),涉及大量注采井的地質(zhì)信息、注采信息和開發(fā)調(diào)整信息,油藏非均質(zhì)性及開采過程中油水分布和壓力不斷變化使油藏動(dòng)態(tài)系統(tǒng)開采規(guī)律變得非常復(fù)雜,而流度比、原油黏度和毛管數(shù)等因素之間還存在相互作用,采用傳統(tǒng)專家經(jīng)驗(yàn)方法進(jìn)行油田開采效果評(píng)價(jià)時(shí),面臨“海量油田數(shù)據(jù)和微量有用信息”的問題[6-8]。同時(shí),專家調(diào)查詞語的意思存在不確定性,油田采集的產(chǎn)量等數(shù)據(jù)存在測(cè)量噪聲,語言和數(shù)據(jù)的不確定性導(dǎo)致隸屬度函數(shù)的不確定性[9]。
Ⅱ型模糊集合[10]是傳統(tǒng)Ⅰ型模糊集合的擴(kuò)展,其本質(zhì)是模糊集合中隸屬度的再次模糊化表示,可更好地解決語言歧義和數(shù)據(jù)噪聲問題。詞計(jì)算方法是從自然語言中抽取詞和命題并進(jìn)行計(jì)算的一種方法[11],與模糊集合理論有緊密聯(lián)系。Zadeh L A提出詞計(jì)算概念,指出不同人對(duì)詞的含義的理解具有差異性[12];Mendel J M認(rèn)為詞計(jì)算需要采用Ⅱ型模糊集合[13],并在詞計(jì)算基礎(chǔ)上提出感知計(jì)算機(jī)的概念[14];王飛躍應(yīng)用詞計(jì)算進(jìn)行語言動(dòng)力學(xué)研究,通過詞計(jì)算有效地利用語言層次的動(dòng)態(tài)信息,解決復(fù)雜系統(tǒng)的建模、分析、控制和評(píng)估問題[15];莫紅運(yùn)用區(qū)間Ⅱ型模糊集擴(kuò)展原理,將常規(guī)數(shù)值函數(shù)轉(zhuǎn)化為對(duì)應(yīng)的區(qū)間Ⅱ型模糊函數(shù),并給出相應(yīng)的詞計(jì)算方法與算法[16]。
筆者提出油田開采智能評(píng)價(jià)方案,利用基于區(qū)間Ⅱ型模糊集合的語言摘要方法[17-18],從油田開采評(píng)價(jià)數(shù)據(jù)中提取有用規(guī)則信息,應(yīng)用數(shù)據(jù)可視化技術(shù)建立可視化邏輯規(guī)則群,提供更豐富和易理解的規(guī)則信息。
1.1Ⅱ型模糊集合
(1)
圖1 區(qū)間Ⅱ型模糊集合示意Fig.1 Schematic diagram of IT2-FS
(2)
(3)
1.2詞計(jì)算
Mendel J M提出感知計(jì)算機(jī)包括編碼器、詞計(jì)算引擎和解碼器三個(gè)要素,其輸入和輸出為詞語[13],其結(jié)構(gòu)見圖2。由圖2可知,首先由編碼器把詞編碼成IT2-FS,然后用詞計(jì)算引擎得到推理輸出IT2-FS,最后由解碼器把IT2-FS還原為“詞”的形式。其中詞計(jì)算引擎的主要思想是首先采用語言摘要方法提煉有用規(guī)則,然后采用基于激活區(qū)間的感知推理方法進(jìn)行近似感知推理計(jì)算。
圖2 感知計(jì)算機(jī)結(jié)構(gòu)Fig.2 The structure of appreciable computer
受復(fù)雜的油藏環(huán)境和海量的油田數(shù)據(jù)影響,現(xiàn)有地質(zhì)研究與動(dòng)態(tài)分析方法難度大、效率低。將油田開采評(píng)價(jià)數(shù)據(jù)與油藏工程師的專家經(jīng)驗(yàn)結(jié)合,并根據(jù)基于Ⅱ型模糊集合的詞計(jì)算思想構(gòu)建油田開采評(píng)價(jià)方法。首先,采用區(qū)間法把與油層非均質(zhì)性、注采關(guān)系、原油黏度、巖石滲透率、巖石潤(rùn)濕性、毛管數(shù)和采收率相關(guān)的“描述詞語”編碼成IT2-FS集合;然后,基于語言摘要方法和專家驗(yàn)證提取有用的規(guī)則庫,設(shè)計(jì)感知推理機(jī)并得到推理輸出IT2-FS;第三,通過解碼將IT2-FS還原為“詞”的形式,并給出建議輸出;最后,經(jīng)過專家驗(yàn)證得到有用規(guī)則,并用于油田開采評(píng)價(jià)。油田開采智能評(píng)價(jià)整體方案見圖3,其重點(diǎn)是要解決油田開采智能評(píng)價(jià)過程中基于油田開采數(shù)據(jù)的有用規(guī)則提取問題。
圖3 油田開發(fā)智能評(píng)價(jià)方案示意Fig.3 Intelligent evaluation program of oilfield development
3.1數(shù)據(jù)描述
(4)
如某一水驅(qū)油田開采評(píng)價(jià)數(shù)據(jù)庫有392個(gè)區(qū)塊的自動(dòng)模型(M=392),即Y={模型1,模型2,…模型392}。每個(gè)模型都有7個(gè)屬性(N=7),并且V={油層非均質(zhì)性,注采關(guān)系,原油黏度,巖石滲透率,巖石潤(rùn)濕性,毛管數(shù),采收率}。油層非均質(zhì)性的范圍是0~1,其定義域?yàn)閄1=(0,1]。
3.2提煉方法
給定油田開采評(píng)價(jià)數(shù)據(jù)庫,可以確定規(guī)則前件描述的變量為影響采收率的6個(gè)因素,規(guī)則后件描述的變量為采收率。考慮與之相關(guān)的5個(gè)描述詞語:“很強(qiáng)”、“強(qiáng)”、“中等”、“弱”和“很弱”,應(yīng)用區(qū)間法[19]得到與之對(duì)應(yīng)的區(qū)間Ⅱ型模糊集合,這些詞與其不確定域組成一個(gè)編碼簿,便于詞計(jì)算中的語言摘要、感知推理和解碼操作,可以構(gòu)造所有可能的規(guī)則組合。
對(duì)于多規(guī)則前件和單規(guī)則后件的IF-THEN規(guī)則形式為
(5)
(6)
定義平均聯(lián)合基數(shù)為
(7)
為了方便計(jì)算,用平均聯(lián)合基數(shù)定義真實(shí)度T:
(8)
(2)覆蓋度C表示規(guī)則的廣泛性。它描述是否有足夠的數(shù)據(jù)支撐某條規(guī)則。覆蓋度與真實(shí)度相互獨(dú)立,因?yàn)榫哂懈吒采w度的規(guī)則并不代表具有高的真實(shí)度。覆蓋度表示為
(9)
(3)可靠度R表示規(guī)則的可靠程度。當(dāng)且僅當(dāng)一條規(guī)則具有很高的真實(shí)度時(shí),該規(guī)則才是可靠的,即大多數(shù)的數(shù)據(jù)既滿足規(guī)則前件又具有規(guī)則后件描述的行為,同時(shí)又具有充分的覆蓋度,即該規(guī)則有足夠的數(shù)據(jù)描述??煽慷缺硎緸?/p>
R=min(T,C)。
(10)
(4)離群度O表示規(guī)則的獨(dú)特性。獨(dú)特性意味一條規(guī)則只描述異常情況且未所預(yù)料。一條異常規(guī)則的充分覆蓋度必須非常小,即該規(guī)則只描述非常少的數(shù)據(jù);然而,覆蓋度并不足以確定離群規(guī)則,同時(shí)應(yīng)該考慮其真實(shí)度。一個(gè)離群規(guī)則必須滿足準(zhǔn)則:1)真實(shí)度必須是很小或很大;2)充分覆蓋程度必須很小。找出一個(gè)離群規(guī)則的目的是幫助人們確定并研究可能的離群數(shù)據(jù),所以需要從離群規(guī)則中排除真實(shí)度T=0的規(guī)則,因?yàn)樵撘?guī)則不描述任何數(shù)據(jù)。離群度表示為
(11)
由離群規(guī)則的第一個(gè)準(zhǔn)則要求,max(T,1-T)將接近0的小T或者接近1的大T變換成[0,1]的大數(shù);并且由離群規(guī)則的第二個(gè)準(zhǔn)則限制C必須小,所以由min(max(T,1-T),1-C)進(jìn)一步限制。某條規(guī)則的離群度O越接近1,它為離群規(guī)則的可能性越大。
應(yīng)用平行坐標(biāo)法,基于油田開采評(píng)價(jià)數(shù)據(jù)庫,通過MATLAB軟件的GUI界面建立可視化模糊邏輯規(guī)則群。GUI界面由4部分組成,右上部分顯示規(guī)則的真實(shí)度、覆蓋度、可靠度和離群度的值,根據(jù)質(zhì)量測(cè)度的等級(jí)排序可以判斷受關(guān)注規(guī)則的真實(shí)性、普遍性、可靠性和獨(dú)特性。左上部分顯示4個(gè)質(zhì)量測(cè)度進(jìn)行優(yōu)先等級(jí)排序時(shí)對(duì)應(yīng)的規(guī)則。中間區(qū)域顯示當(dāng)前選中的規(guī)則中各個(gè)變量對(duì)應(yīng)的區(qū)間,以及與規(guī)則相關(guān)或不相關(guān)的規(guī)則邏輯,藍(lán)色代表支持當(dāng)前規(guī)則,綠色區(qū)域代表當(dāng)前規(guī)則覆蓋的區(qū)域,紅色代表違背當(dāng)前規(guī)則,黑色代表與當(dāng)前規(guī)則不相關(guān)。界面下方顯示規(guī)則前件和后件變量對(duì)應(yīng)的不確定域。
4.1兩規(guī)則前件和單規(guī)則后件情況
當(dāng)考慮與采收率相關(guān)的兩個(gè)影響因素對(duì)采收率的影響時(shí),共產(chǎn)生1.875×103條規(guī)則。選取其中最具代表性的4組界面進(jìn)行描述(見圖4)。
以真實(shí)度為主時(shí)的界面見圖4(a),當(dāng)前規(guī)則為“當(dāng)注采關(guān)系強(qiáng)且滲透率高時(shí),則采收率低”,只有一種情況符合規(guī)則,并且當(dāng)前規(guī)則不符合油田生產(chǎn)實(shí)際,規(guī)則只描述很少的離群情況,不能單純應(yīng)用真實(shí)度質(zhì)量測(cè)度衡量規(guī)則是否有用。
以覆蓋度為主時(shí)的界面見圖4(b),當(dāng)前規(guī)則為“當(dāng)注采關(guān)系弱且非均質(zhì)性弱時(shí),則采收率很低”,有些情況符合規(guī)則,但也有些情況與之相悖,并且當(dāng)前規(guī)則不符合油田生產(chǎn)實(shí)際,所以也不能單純應(yīng)用覆蓋度質(zhì)量測(cè)度衡量規(guī)則是否有用。
以可靠度為主的界面見圖4(c),當(dāng)前規(guī)則為“若滲透率小且毛管數(shù)小,則采收率很低”。當(dāng)前規(guī)則具有高的真實(shí)度和充分的覆蓋度,并且符合油田生產(chǎn)實(shí)際,因此可由可靠度質(zhì)量測(cè)度評(píng)價(jià)當(dāng)前規(guī)則有用。
以離群度為主的界面見圖4(d),當(dāng)前規(guī)則為“若注采關(guān)系適中且滲透率適中,則采收率很低”,只有一種情況符合規(guī)則,可視當(dāng)前規(guī)則為離群規(guī)則。
圖4 兩規(guī)則前件和單規(guī)則后件可視化邏輯規(guī)則群應(yīng)用界面Fig.4 Interface visual logic rules groups application of two former rule members and one after rule members
綜上所述,不能單純地通過真實(shí)度或覆蓋度評(píng)價(jià)一個(gè)規(guī)則是否實(shí)用,而通過可靠度可以判斷最可靠、最具有代表性的規(guī)則,且通過離群度可以分析和確定離群規(guī)則和離群數(shù)據(jù)。
4.2三規(guī)則前件和單規(guī)則后件情況
當(dāng)考慮與采收率相關(guān)的兩個(gè)影響因素對(duì)采收率的影響時(shí),共產(chǎn)生12.500×103條規(guī)則。借助4個(gè)質(zhì)量測(cè)度和可視化邏輯規(guī)則群,通過專家驗(yàn)證形成感知推理初始規(guī)則庫。選取其中最具代表性的4組界面(見圖5),采用4個(gè)質(zhì)量測(cè)度衡量規(guī)則的不同特性。此外,可以改變規(guī)則前件的個(gè)數(shù),得到更復(fù)雜的規(guī)則;然后通過質(zhì)量測(cè)度衡量和專家驗(yàn)證,得到相應(yīng)的有用規(guī)則。
圖5 三規(guī)則前件和單規(guī)則后件可視化邏輯規(guī)則群應(yīng)用界面Fig.5 Interface of visual logic rules groups application three former rule members and one after rule members
(1)應(yīng)用基于Ⅱ型模糊集合的語言摘要方法,得到油田開采智能評(píng)價(jià)中有用規(guī)則信息。首先,從油田開采評(píng)價(jià)數(shù)據(jù)庫中提取多前件、單后件的IF-THEN規(guī)則,并基于4個(gè)質(zhì)量測(cè)度進(jìn)行規(guī)則評(píng)價(jià);然后,基于平行坐標(biāo)方法和MATLAB軟件的GUI界面,建立可視化模糊邏輯規(guī)則群;最后,通過專家驗(yàn)證得到有用規(guī)則。
(2)該油田開采智能評(píng)價(jià)有用規(guī)則提取方法可以考慮任意的多規(guī)則前件規(guī)則問題,也可以通過改變規(guī)則前件變量的個(gè)數(shù),得到所有可能的規(guī)則,再根據(jù)質(zhì)量測(cè)度進(jìn)行計(jì)算,進(jìn)而給出有用規(guī)則。
(3)經(jīng)過專家驗(yàn)證的有用規(guī)則構(gòu)成評(píng)價(jià)感知推理的初始規(guī)則庫,為油田開采智能評(píng)價(jià)奠定評(píng)價(jià)基礎(chǔ)。
[1]Liu F, Mendal J M, Nejad A M. Forecasting injector producer relationships from production and injection rates using an extended Kalman filter [J]. SPE Journal, 2009,14(4):653-644.
[2]于鏑,霍鳳財(cái),張?chǎng)?等.多注多采條件下水驅(qū)油藏區(qū)域影響估計(jì)方法[J].東北石油大學(xué)學(xué)報(bào),2015,39(2):102-107.
Yu Di, Huo Fengcai, Zhang Wen, et al. Estimation of the regional impact on multi-injectors and multi-producers of water-flooded reserviors [J]. Journal of Northeast Petroleum University, 2015,39(2):102-107.
[3]岳湘安,王尤富,王克亮.提高石油采收率基礎(chǔ)[M].北京: 石油工業(yè)出版社,2007:88-90.
Yue Xiangan, Wang Youfu, Wang Keliang. Fundamentals on enhanced oil recovery [M]. Beijing: Petroleum Industry Press, 2007:88-90.
[4]鐘立國(guó),張守軍,魯?shù)?等.空氣輔助蒸汽吞吐采油機(jī)理[J].東北石油大學(xué)學(xué)報(bào),2015,39(2):108-115.
Zhong Liguo, Zhang Shoujun, Lu Di, et al. Research on EOR principles of air-assisted CSS [J]. Journal of Northeast Petroleum University, 2015,39(2):108-115.
[5]苑登御,侯吉瑞,宋兆杰,等.塔河油田縫洞型碳酸鹽巖油藏注水方式優(yōu)選及注氣提高采收率實(shí)驗(yàn)[J].東北石油大學(xué)學(xué)報(bào),2015,39(6):102-110.
Yuan Dengyu, Hou Jirui, Song Zhaojie, et al. Optimization of water injection methods and flooding for EOR in Tahe fractures-vuggy carbonate reservoir [J]. Journal of Northeast Petroleum University, 2015,39(6):102-110.
[6]陳德春,李靜,顏曉.基于數(shù)據(jù)挖掘的油氣開采決策支持技術(shù)[J].油氣地質(zhì)與采收率,2009,16(2):67-69.
Chen Dechun, Li Jing, Yan Xiao. Support technology of oil and gas development strategic decision based on data mining methods [J]. Petroleum Geology and Recovery Efficiency, 2009,16(2):67-69.
[7]張繼風(fēng).水驅(qū)油田開發(fā)效果評(píng)價(jià)方法綜述及發(fā)展趨勢(shì)[J].巖石油氣藏,2012,24(3):118-122.
Zhang Jifeng. Evaluation methods of development effect for water drive oilfield and development trend [J]. Lithologic Reserviors, 2012,24(3):118-122.
[8]趙金海,楊傳書.專家決策支持系統(tǒng)在石油工業(yè)中的應(yīng)用與發(fā)展展望[J].中外能源,2010,15(11):40-45.
Zhao Jinhai, Yang Chuanshu. The application and prospect of IDSS in petroleum industry [J]. Sinoglobal Energy, 2010,15(11):40-45.
[9]Mendel J M. Type-2 Fuzzy Sets: Some questions and answers [C]. IEEE Neural Networks Society Newsletter, 2003:10-13.
[10]Zadeh L A. The concept of a linguistic variable and its application to approximate reasoning [J]. Information Sciences, 1975,8(1):199-249.
[11]Zadeh L A. From computing with numbers to computing with words from manipulation of measurements to manipulation of perceptions [J]. IEEE Transactions on Circuits and Systems Ⅰ: Fundamental Theory and Applications, 1999,46(1):105-119.
[12]Mendel J M. Computing with words, when words can mean different things to different people [C]. Rochester: Proceedings of the International ICSC Symposium on Fuzzy Logic and Applications, 1999:158-164.
[13]Mendel J M. The perceptual computer: An architecture for computing with words [C]. Melbourne: Proceedings of the IEEE International Conference on Fuzzy Systems, 2001:35-38.
[14]Mendel J M. Perceptual reasoning for perceptual computing [J]. IEEE Transactions on Fuzzy Systems, 2008,16(6):1550-1564.
[15]王飛躍.詞計(jì)算和語言動(dòng)力學(xué)系統(tǒng)的基本問題和研究[J].自動(dòng)化學(xué)報(bào),2005,31(6):844-852.
Wang Feiyue. Fundamental issues in research of computing with words and linguistic dynamic system[J]. Acta Automatica Sinica,2005,31(6):844-852.
[16]莫紅,王飛躍,肖志權(quán),等.基于區(qū)間二型模糊集合的語言動(dòng)力系統(tǒng)穩(wěn)定性[J].自動(dòng)化學(xué)報(bào), 2011, 37(8):1018-1024.
Mo Hong, Wang Feiyue, Xiao Zhiquan, et al. Stabilities of linguistic dynamic system based on interval type-2 fuzzy sets [J]. Acta Automatica Sinica, 2011,37(8):1018-1024.
[17]Wu Dongrui, Mendel J M. Linguistic summarization using IF-THEN rules and interval type-2 fuzzy sets [J]. IEEE Transactions on Fuzzy Systems, 2011,19(1):136-151.
[18]Kacprzyk J, Zadrozny S. Linguistic summarization of the contents of web server logs via the orderd weighted averaging(OWA) operators [J]. Fuzzy Sets and Systems, 2016,285:182-198.
[19]Yu Di, Liu Furui, Ren Weijian. Encoding words for intelligent evaluation of injection-production wells pattern based on enhanced interval approach [C]. Guilin: Proceedings of 12th World Congress on Intelligent Control and Automation, 2016.
2016-01-26;編輯:張兆虹
國(guó)家青年科學(xué)基金項(xiàng)目(51404074);中國(guó)石油科技創(chuàng)新基金研究項(xiàng)目(2012D-5006-0205)
于鏑(1977-),女,博士,副教授,主要從事模糊控制和智能評(píng)價(jià)方面的研究。
10.3969/j.issn.2095-4107.2016.03.014
TP391
A
2095-4107(2016)03-0111-07