張漫,嚴(yán)胡勇,翟興然
(1.東北石油大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,大慶 163318;2.中國科學(xué)院重慶綠色智能技術(shù)研究院;3.中國科學(xué)院大學(xué);4.大慶油田有限責(zé)任公司)
粗糙集在優(yōu)化油田開發(fā)效果綜合評價(jià)指標(biāo)中的應(yīng)用
張漫1,嚴(yán)胡勇2,3,翟興然4
(1.東北石油大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,大慶 163318;2.中國科學(xué)院重慶綠色智能技術(shù)研究院;3.中國科學(xué)院大學(xué);4.大慶油田有限責(zé)任公司)
為滿足當(dāng)前油田開發(fā)項(xiàng)目的需求,改變過去油田開發(fā)效果評價(jià)采用單一評價(jià)法的傳統(tǒng)手段,因此有必要對油田開發(fā)效果進(jìn)行綜合評價(jià)。綜合評價(jià)的前提是指標(biāo)優(yōu)選,它關(guān)系到評價(jià)結(jié)果的可信度與可靠性。以油田開發(fā)效果綜合評價(jià)指標(biāo)體系為研究對象,基于粗糙集理論提出了一種優(yōu)化與約簡的方法,對指標(biāo)體系進(jìn)行了優(yōu)化,從而有效降低了計(jì)算量、提高了效率。通過對比實(shí)驗(yàn)驗(yàn)證了方法的有效性,為油田開發(fā)效果綜合評價(jià)體系的構(gòu)建提供了一種思路。
粗糙集;油田;知識約簡;綜合評價(jià)
對從事油田開發(fā)的工作者來說,油田開發(fā)效果是需要進(jìn)行評估或評價(jià)的,其研究成果能為油田進(jìn)一步的調(diào)整與決策提供依據(jù)[1]。然而,在評價(jià)過程中,評價(jià)項(xiàng)目往往是單項(xiàng)的,有的側(cè)重于經(jīng)濟(jì)評價(jià),有的側(cè)重開發(fā)管理,有的側(cè)重鉆采工程等,并且這些評價(jià)往往在規(guī)劃計(jì)劃與油藏動態(tài)分析中,很少從整體出發(fā)對油田開發(fā)效果進(jìn)行綜合評價(jià)。
近年來,許多專家、學(xué)者致力于油田開發(fā)效果的綜合評價(jià)研究。劉秀婷等[2]在建立系統(tǒng)、全面的指標(biāo)評價(jià)體系基礎(chǔ)上,以綜合賦權(quán)法為依據(jù),有效地將層次分析法與相似權(quán)結(jié)合起來,采用未確知的測度模型對油藏進(jìn)行評價(jià)與排序,并在遼河油區(qū)特殊巖性注水油藏評價(jià)中取得了不錯(cuò)的效果。李斌等[3]針對油田開發(fā)項(xiàng)目的綜合評價(jià)問題,提出了一種目標(biāo)差異程度法,通過油田開發(fā)項(xiàng)目實(shí)例進(jìn)行了計(jì)算,取得了較好的效果。劉永愛等[4]將模糊綜合評價(jià)法對我國8個(gè)低滲透油田的評價(jià)指標(biāo)體系進(jìn)行分析與測算,從而合理地確定了油田的勘探開發(fā)順序。李斌等[5]針對油田開發(fā)效果單一評價(jià)以及確定評價(jià)指標(biāo)憑經(jīng)驗(yàn)的不足,在進(jìn)行了常規(guī)篩選方法的利弊后,建立了一種簡化的聚類分析法、比重法和專家一次打分法的組合方法。經(jīng)實(shí)例分析,此方法避免了評價(jià)指標(biāo)因量綱不同所造成的初選指標(biāo)需一致化處理,降低了計(jì)算量,提高了效率。
粗糙集理論[6]是Pawlak提出的一種用來處理不確定、不完整信息與適應(yīng)的數(shù)學(xué)工具,它可以用來解決知識提取、數(shù)據(jù)約簡、規(guī)則提取與基于數(shù)據(jù)的推理等問題[7]。粗糙集最初的原型來自于比較簡單的信息模型,其基本思想可以總結(jié)為兩點(diǎn):首先是通過關(guān)系數(shù)據(jù)庫分類形成概念與規(guī)則,其次是通過對等價(jià)關(guān)系的分類和分類對目標(biāo)的近似來實(shí)現(xiàn)知識發(fā)現(xiàn)[8]。
1.1 信息系統(tǒng)
定義1四元組S=(U,A,V,f)是一個(gè)信息系統(tǒng),其中U為論域,即對象的非空有限元素集合;A為屬性的非空有限集合,A=C∪D,C∩D≠?,C為條件屬性,D為決策屬性;V為值域,表示屬性值的范圍;f表示信息函數(shù)。
定義2對于屬性子集R?A可以決定一個(gè)二元的不可區(qū)分關(guān)系IND(R),即:
IND(R)是對U的一個(gè)劃分,其中的任意元素為等價(jià)類。
1.2 上近似與下近似
定義3為了定義知識的近似程度,這里引用兩個(gè)精確集概念:上近似集與下近似集:
1.3 知識約簡
信息系統(tǒng)中,不同屬性的作用也不盡相同,有些屬性是多余的。知識約簡就是在保持知識庫分類能力不變的前提下,刪除其中不重要或不相關(guān)的知識。知識約簡主要有屬性值約簡與屬性約簡兩種,由于屬性值約簡較為簡單,通常情況下的知識約簡理解為屬性約簡。
定義4若IND(R)=IND(R-{r}),稱r在R中是可以被約去的知識;若P=R-{r}是獨(dú)立的,那么P為R的一個(gè)知識約簡。
2.1 優(yōu)化問題描述
油田開發(fā)是一個(gè)開放性的、灰色的復(fù)雜巨型系統(tǒng)。它受很多因素影響、制約。因此,在設(shè)計(jì)綜合評價(jià)系統(tǒng)時(shí),需要從系統(tǒng)性、整體性、綜合性來考慮。影響開發(fā)效果的因素有多方面,不僅有經(jīng)濟(jì)的、管理的、技術(shù)的,還有開發(fā)經(jīng)濟(jì)、開發(fā)管理、開發(fā)地質(zhì)、鉆采工程、油藏工程等,它們可以細(xì)分為更多低層次的因素,充分體現(xiàn)開發(fā)系統(tǒng)的開放性、動態(tài)性、層次性與系統(tǒng)性。這些因素都是相系影響、相互制約的,其中一些因素如圖1所示。
油田開發(fā)效果綜合評價(jià)指標(biāo)體系是由一系列指標(biāo)集合組成,這個(gè)集合可以表示為U={ui,(i=1,2…,n)},任意一個(gè)油田都是其中的一個(gè)ui。通過綜合指標(biāo)上的取值可以得到最終評價(jià)值D={1,2,3,4}表示其開發(fā)效果評價(jià)值從高到低。
指標(biāo)集合中指標(biāo)個(gè)數(shù)較多,彼此也會存在一定相似性、相關(guān)性,它們不可能都能反映油田開發(fā)效果評價(jià),這就沒必要全選為評價(jià)指標(biāo)。以往的指標(biāo)篩選都是憑經(jīng)驗(yàn)來定,很少采用科學(xué)的數(shù)學(xué)方法進(jìn)行篩選。因此,對指標(biāo)集合進(jìn)行優(yōu)化是一項(xiàng)不可或缺的環(huán)節(jié)[9]。
對油田開發(fā)效果評價(jià)指標(biāo)集合的優(yōu)化,就是在保留原有指標(biāo)集合分類能力不變的情況下,找到一個(gè)最小子集P,用這個(gè)子集能夠代替原有指標(biāo)個(gè)數(shù)過多的指標(biāo)體系集合,并且這個(gè)最小子集能得出同樣精度的效果。
2.2 建立信息系統(tǒng)
以國內(nèi)10個(gè)油田2008年的開發(fā)效果綜合評價(jià)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),其中評價(jià)指標(biāo)集C={c1,c2,…,c41} 共41個(gè)指標(biāo)。指標(biāo)體系的目標(biāo)層為“油田開發(fā)效果綜合評價(jià)指標(biāo)體系”。準(zhǔn)則層有五個(gè)方面:開發(fā)經(jīng)濟(jì)類、開發(fā)管理類、鉆采工程類、油藏工程類與開發(fā)地質(zhì)類。
圖1 油田開發(fā)效果綜合評價(jià)影響因素圖Fig.1Factors figure of comprehensive evaluation for oilfield development effect
開發(fā)經(jīng)濟(jì)類下轄指標(biāo)有:凈現(xiàn)值x1、采油成本x2、百萬噸產(chǎn)能投資x3、投資回收期x4、產(chǎn)出投入比x5、內(nèi)部收益率x6。開發(fā)管理類下轄指標(biāo)有:油水井綜合時(shí)率x7、健康安全環(huán)保x8、開發(fā)管理方法與政策x9、儲量替換率x10、儲采比x11、月平均產(chǎn)量x12、累積產(chǎn)油量x13、井網(wǎng)形式x14、井網(wǎng)密度x15、水平井與直井井?dāng)?shù)比x16、注采比x17、自然遞減率x18、綜合遞減率x19、含水上升率x20、最終采收率x21、地質(zhì)儲量采出程度x22、剩余可采儲量采出程度x23。鉆采工程類下轄指標(biāo)有:措施有效率x24、完井方式x25、機(jī)采系統(tǒng)效率x26、鉆井成功率x27。油藏工程類下轄指標(biāo)有:地層能量保持水平x28、地質(zhì)儲量采油速度x29、剩余可采儲量采油速度x30、剩余可采儲量變化率x31、油水分布或剩余油分布x32、水驅(qū)油狀況x33、儲量動用程度x34、儲量控制程度x35。開發(fā)地質(zhì)類下轄指標(biāo)有:油藏物性x36、油藏類型x37、流體性質(zhì)x38、儲量豐度x39、構(gòu)造復(fù)雜程度x40、綜合含水x41。
2.3 屬性離散化與屬性約簡
由于所獲取的數(shù)據(jù)是連續(xù)型的,而粗糙集所使用的數(shù)據(jù)是離散數(shù)據(jù)。因此需要對數(shù)據(jù)進(jìn)行離散化處理[10]。離散化算法很多,有等距離、等頻率的離散,NaiveScaler算法,SemiNaiveScaler算法,布爾邏輯與粗集理論相結(jié)合的離散算法等[11]。同時(shí)還考慮到這些指標(biāo)間有的是定性指標(biāo)、有的是定量指標(biāo),而定量指標(biāo)中有的是極大型指標(biāo),有的是極小型指標(biāo),有的是區(qū)間型指標(biāo)。因此,我們采用專家評分法對數(shù)據(jù)離散化,得到離散化后的決策表,以開發(fā)管理類為例,見表1。
表1 開發(fā)管理類離散化決策表Table 1The discretized decision table of development and management
得到離散化的決策表后,利用Rosetta軟件[12],應(yīng)用動態(tài)約簡中的exhaustive calculation算法對離散決策表進(jìn)行屬性約簡,其最小子表大小為50%,最大子表大小設(shè)為90%,獲得支持?jǐn)?shù)大于50%的約簡,即:{x20,x22,x18,x9}={含水上升率,地質(zhì)儲量采出程度,自然遞減率,開發(fā)管理方法與政策}。同理可以得到開發(fā)經(jīng)濟(jì)類的約簡:{內(nèi)部收益率,投資回收期};鉆采工程類的約簡:{鉆井成功率,完井方式};油藏工程類的約簡:{儲量動用程度,地質(zhì)儲量采油速度、剩余可采儲量采油速度};開發(fā)地質(zhì)類的約簡:{構(gòu)造復(fù)雜程度,油藏類型}。綜上,可得油田開發(fā)效果綜合評價(jià)的優(yōu)化后集合P,見圖2。
圖2 優(yōu)化后的油田開發(fā)效果綜合評價(jià)指標(biāo)體系圖Fig.2The optimized comprehensive evaluation index figure of oilfield development effect
2.4 實(shí)驗(yàn)分析
為了說明經(jīng)約簡方法處理后的指標(biāo)是優(yōu)化的指標(biāo),以開發(fā)管理類指標(biāo)為例進(jìn)行對比實(shí)驗(yàn)、分析。表2為開發(fā)管理類優(yōu)化后的離散決策表。
表2 開發(fā)管理類優(yōu)化后的決策表Table 2The optimized decision table of development and management
對比實(shí)驗(yàn)采用了六種不同的指標(biāo)策略:第一種策略是未經(jīng)任何約簡處理的23個(gè)指標(biāo)屬性,即全指標(biāo)策略;第二種策略是優(yōu)化后的指標(biāo)集合{x9,x18,x20,x22},總共4個(gè)指標(biāo);第三種策略是在優(yōu)化后的指標(biāo)集合里隨機(jī)增加了兩個(gè)指標(biāo){x7,x23},即{x7,x9,x18,x20,x22,x23},總共6個(gè)指標(biāo);第四種策略是在優(yōu)化后的指標(biāo)集合里隨機(jī)增加了一個(gè)指標(biāo){x23},即{x9,x18,x20,x22,x23},總共5個(gè)指標(biāo);第五種策略是在優(yōu)化后的指標(biāo)集合里隨機(jī)刪除了兩個(gè)指標(biāo){x20,x22},即{x9,x18},總共2個(gè)指標(biāo);第四種策略是在優(yōu)化后的指標(biāo)集合里隨機(jī)刪除了一個(gè)指標(biāo){x20},即{x9,x18,x22},總共3個(gè)指標(biāo)。同時(shí)選擇拉普拉斯修正的樸素貝葉斯分類器(NB)、神經(jīng)網(wǎng)絡(luò)算法(NN)兩種主流分類算法,通過rapidminer軟件對表2進(jìn)行10折交叉驗(yàn)證,采樣方式為線性采樣。交叉驗(yàn)證后的結(jié)果見圖3所示。
圖3 不同指標(biāo)策略在兩種算法下的10折交叉驗(yàn)證精度Fig.310-fold cross-validation accuracy of different index strategies in the two algorithms
從圖3中可以看出采用優(yōu)化后的指標(biāo)在NB算法中平均精度雖然沒有全指標(biāo)的高,但是優(yōu)化指標(biāo)所需要的指標(biāo)量相比全指標(biāo)策略所需指標(biāo)量要少很多。而在NN算法中平均精度卻明顯高于其他指標(biāo)策略的平均精度,相比平均精度稍差的全指標(biāo)策略高出了20個(gè)百分點(diǎn)??梢钥闯鰞?yōu)化后的指標(biāo)相比其他指標(biāo)最能代表開發(fā)管理類指標(biāo)體系中的關(guān)鍵特征,這四項(xiàng)指標(biāo)是開發(fā)管理類中的核心指標(biāo)。
油田開發(fā)效果的評價(jià),需改變傳統(tǒng)意義上對油田開發(fā)效果單一評價(jià)以及指標(biāo)篩選憑經(jīng)驗(yàn)的情況,而應(yīng)從系統(tǒng)的整體性出發(fā)進(jìn)行綜合評價(jià)。油田開發(fā)效果綜合評價(jià)體系包含了開發(fā)管理類、開發(fā)經(jīng)濟(jì)類、鉆采工程類、油藏工程類、開發(fā)地質(zhì)類等,它們的組合構(gòu)成了一個(gè)綜合評價(jià)系統(tǒng)。評價(jià)指標(biāo)的確定是綜合評價(jià)的前提與基礎(chǔ),指標(biāo)選取的合理性關(guān)系到評價(jià)結(jié)果的可信度與可靠程度。通過粗糙集方法將油田開發(fā)效果綜合評價(jià)指標(biāo)進(jìn)行了優(yōu)選,使指標(biāo)體系由原來的41個(gè)指標(biāo)約簡為13個(gè)指標(biāo),指標(biāo)數(shù)量減少了68.29%,大幅度減少了后期評價(jià)與決策的工作量。同時(shí),相比其他指標(biāo)策略,具有較高的精度。粗糙集的優(yōu)化、約簡為油田開發(fā)效果的綜合評價(jià)體系的優(yōu)化提供了一種新的思路。
[1]嚴(yán)少權(quán),鄒俊,代鵬波.油田開發(fā)效果三大指標(biāo)綜述[J].管理學(xué)家,2014,613:4-7.
[2]劉秀婷,程仲平,楊純東,等.油田開發(fā)效果綜合評價(jià)方法新探[J].中外能源,2006,11(5):37-41.
[3]李斌,高正原.一種油田開發(fā)項(xiàng)目綜合評價(jià)新方法[J].石油科技論壇,2013,32(6):35-38.
[4]劉永愛,陳偉.模糊綜合評價(jià)法在低滲透油田開發(fā)決策中的應(yīng)用[J].西安石油大學(xué)學(xué)報(bào):自然科學(xué)版,2010,25 (4):45-49.
[5]李斌,畢永斌,潘歡,等.油田開發(fā)效果綜合評價(jià)指標(biāo)篩選的組合方法[J].石油科技論壇,2012,31(3):38-41.
[6]Pawlak Z.Rough Sets[J].International Journal of Computer &Information Sciences,1982,11(5):341-356.
[7]王學(xué)恩,韓崇昭,韓德強(qiáng),等.粗糙集研究綜述[J].控制工程,2013,20(1):1-8.
[8]王國胤,姚一豫,于洪.粗糙集理論與應(yīng)用研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2009,32(7):1229-1246.
[9]尹志紅,方彬,鹿強(qiáng).油田科技實(shí)力灰色綜合評價(jià)[J].黑龍江八一農(nóng)墾大學(xué)學(xué)報(bào),2007,19(1):103-108.
[10]Pawlak Z,Skowron A.Rudiments of rough sets[J].Information Sciences,2007,177(1):3-27.
[11]侯利娟,王國胤.粗糙集理論中的離散化問題[J].計(jì)算機(jī)科學(xué),2000,27(12):89-94.
[12]Shen L,Chen S.Research of customer classification based on rough set using rosetta software[C]//.GERMANY:SPRINGER-VERLAG BERLIN,2013,837-843.
Application of Aough Set to Optimize Comprehensive Evaluation Index of Oil Field Development
Zhang Man1,Yan Huyong2,3,Zhai Xingran4
(1.School of Computer and Information Technology,Northeast Petroleum University,Daqing 163318;2.Chongqing Institute of Green and Intelligent Technology,Chinese Academy of Sciences;3.University of Chinese Academy of Sciences;4.Company Ltd.of Daqing Oil Field)
In order to meet the needs of the current oilfield development project,it is necessary to make a comprehensive evaluation of oilfield development effect by transforming the traditional method of single evaluation in the past.The prerequisite for comprehensive evaluation was the index optimization,it related to the credibility and reliability of the evaluation results.Taken the comprehensive evaluation index system of oilfield development as a research object,a method of optimization and reduction based on the rough set theory was proposed,which optimized the index system to reduce the computational effort and improve efficiency effectively.It provided a way for the construction of oilfield development effect comprehensive evaluation system according to the effectiveness of the method validated by contrast experiments.
rough sets;oilfield;knowledge reduction;comprehensive assessment
TE19
A
1002-2090(2017)03-0096-05
10.3969/j.issn.1002-2090.2017.03.022
2016-12-10
國家自然科學(xué)基金(61502094)。
張漫(1967-),女,副教授,東北石油大學(xué)畢業(yè),現(xiàn)主要從事分布式并行技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò),數(shù)據(jù)挖掘等教學(xué)與科研工作。