盧愛(ài)平, 李建平, 李盼池, 范友貴
(1. 東北石油大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院, 黑龍江 大慶 163318; 2. 中國(guó)石油吉林油田公司, 吉林 松原 138000)
水淹層識(shí)別是油田開(kāi)發(fā)中后期油藏測(cè)井解釋的一個(gè)主要問(wèn)題, 目前常用的方法有兩類(lèi): 傳統(tǒng)的地質(zhì)、 化學(xué)和物理測(cè)井分析方法和人工智能分析方法. 由于受實(shí)驗(yàn)室設(shè)備、 地域和樣品數(shù)量的限制, 第一種方法存在較大的局限性. 采用智能計(jì)算技術(shù)解決水淹層識(shí)別方法很多, 其中基于神經(jīng)網(wǎng)絡(luò)的方法主要包括經(jīng)典神經(jīng)網(wǎng)絡(luò)方法[1-3]、 模糊神經(jīng)網(wǎng)絡(luò)方法[4-5]、 支持向量機(jī)方法[6-7]和過(guò)程神經(jīng)網(wǎng)絡(luò)方法[8-9]. 但這些方法都不同程度地存在缺陷, 如神經(jīng)網(wǎng)絡(luò)易陷入局部極小值, 支持向量機(jī)的核函數(shù)參數(shù)不易確定等. 因此探索新的計(jì)算方式, 采用新的網(wǎng)絡(luò)模型解決水淹層識(shí)別問(wèn)題有一定的應(yīng)用價(jià)值.
量子計(jì)算[10-11]、 量子信息處理[12]、 量子機(jī)器學(xué)習(xí)[13-17]已成為目前該領(lǐng)域的研究熱點(diǎn). 盡管這些量子新模型借助量子計(jì)算的并行性可顯著提高計(jì)算效率, 但其都是面向量子計(jì)算機(jī)的, 在傳統(tǒng)計(jì)算機(jī)上無(wú)法執(zhí)行. 量子衍生計(jì)算通過(guò)借鑒量子計(jì)算的某些機(jī)制改進(jìn)經(jīng)典算法的性能, 已獲得了成功應(yīng)用[18-20], 但對(duì)量子衍生神經(jīng)網(wǎng)絡(luò)應(yīng)用于水淹層識(shí)別問(wèn)題的量子衍生模型研究目前報(bào)道較少.
量子自組織網(wǎng)絡(luò)(quantum self-organizing network, QSON)是量子計(jì)算和自組織網(wǎng)絡(luò)相融合的新模型[21], 其采用量子計(jì)算機(jī)制構(gòu)造競(jìng)爭(zhēng)獲勝規(guī)則, 設(shè)計(jì)理念面向傳統(tǒng)計(jì)算機(jī), 本質(zhì)上是借助量子計(jì)算的某些機(jī)制(量子比特的球面描述、 繞軸旋轉(zhuǎn)、 測(cè)量等)提升經(jīng)典方法的性能. 本文提出一種基于QSON的水淹層識(shí)別方法, 并對(duì)遼河油田某區(qū)塊的實(shí)際測(cè)井資料數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn), 利用QSON對(duì)數(shù)據(jù)處理后的結(jié)果進(jìn)行分析. 結(jié)果表明, 該方法的水淹層識(shí)別精度明顯高于同類(lèi)對(duì)比方法.
本文采用基于Bloch球面旋轉(zhuǎn)的量子自組織網(wǎng)絡(luò)模型[21], 其輸入和競(jìng)爭(zhēng)層權(quán)值均采用Bloch球面描述的量子比特. 以競(jìng)爭(zhēng)層C=m2個(gè)節(jié)點(diǎn)為例, 網(wǎng)絡(luò)模型如圖1所示.
圖1 量子自組織網(wǎng)絡(luò)模型
根據(jù)量子計(jì)算原理, 量子比特|φ〉的Bloch球面坐標(biāo)(x,y,z)可通過(guò)投影測(cè)量獲得, 測(cè)量方法采用Pauli矩陣實(shí)現(xiàn), 表示為
(1)
令輸入為|X〉=(|x1〉,…,|xn〉)T, 競(jìng)爭(zhēng)層第j個(gè)節(jié)點(diǎn)權(quán)值為|Wj〉=(|wj1〉,…,|wjn〉)T. |xi〉和|wji〉經(jīng)測(cè)量后的Bloch坐標(biāo)分別為|xi〉=(xix,xiy,xiz)T和|wji〉=(wjix,wjiy,wjiz)T. 根據(jù)文獻(xiàn)[21], 樣本|X〉與權(quán)值|Wj〉間的距離, 即競(jìng)爭(zhēng)層第j個(gè)節(jié)點(diǎn)的輸出為
(2)
(3)
將樣本歸一化處理為Xl=(xl1,xl2,…,xln)T. 利用
θl=(πxl1,πxl2,…,πxln)T=(θl1,θl2,…,θln)T,
(4)
φl(shuí)=(2πxl1,2πxl2,…,2πxln)T=(φl(shuí)1,φl(shuí)2,…,φl(shuí)n)T
(5)
|Xl〉=(|xl1〉,|xl2〉,…,|xln〉)T,
(6)
其中
令競(jìng)爭(zhēng)層第j(j=1,2,…,C)個(gè)節(jié)點(diǎn)的權(quán)值量子比特|Wj〉為
|Wj〉=(|wj1〉,|wj2〉,…,|wjn〉)T,
(7)
對(duì)第l個(gè)樣本|Xl〉=(|xl1〉,|xl2〉,…,|xln〉)T, 由式(1),(2)可知, 其與|Wj〉之間的距離為
(8)
令競(jìng)爭(zhēng)規(guī)則為具有最小距離的節(jié)點(diǎn)獲勝, 則獲勝節(jié)點(diǎn)j*滿(mǎn)足
(9)
其中C為競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù).
與經(jīng)典自組織網(wǎng)絡(luò)相同, 量子自組織網(wǎng)絡(luò)也屬于無(wú)監(jiān)督聚類(lèi)模型, 用于解決預(yù)先未知類(lèi)數(shù)的聚類(lèi). 聚類(lèi)算法完全采用無(wú)監(jiān)督方式進(jìn)行, 聚類(lèi)過(guò)程描述如下.
步驟1) 樣本量子態(tài). 按式(3)~(6)完成樣本量子態(tài)描述, 按式(1)進(jìn)行樣本量子態(tài)的投影測(cè)量, 以獲得每個(gè)樣本每維數(shù)據(jù)對(duì)應(yīng)的3個(gè)Bloch坐標(biāo)值.
步驟2) 網(wǎng)絡(luò)權(quán)值初始化. 權(quán)值初始化為
(10)
其中θji=π·rnd,φji=2π·rnd,j=1,2,…,C, rnd為(0,1)內(nèi)均勻分布的隨機(jī)數(shù).
步驟3) 網(wǎng)絡(luò)參數(shù)初始化. 包括最大步數(shù)G、 初始速率β0、 終止速率βf、 初始鄰域半徑r0、 終止鄰域半徑rf、 初始方差σ0、 終止方差σf和當(dāng)前步數(shù)t=0.
步驟4) 按下式計(jì)算當(dāng)前速率、 鄰域半徑和方差:
(11)
(12)
(13)
(14)
(15)
(16)
式中j∈ψ(j*,r(t)),i=1,2,…,n,l=1,2,…,L.
步驟7) 若t≥G或t 當(dāng)油層被水淹后, 儲(chǔ)層的物理性質(zhì)將發(fā)生變化, 如電阻率、 自然電位、 聲學(xué)性質(zhì)及核物理性質(zhì)等, 這些物理性質(zhì)將反應(yīng)在測(cè)井資料上, 根據(jù)水淹層作為注水或辺底水驅(qū)油油藏油層分級(jí)評(píng)價(jià)標(biāo)準(zhǔn), 對(duì)水淹的級(jí)別進(jìn)行劃分. 以遼河油田某區(qū)塊為例, 水淹級(jí)別可劃分為未水淹、 弱水淹、 中水淹、 強(qiáng)水淹和特強(qiáng)水淹5種, 這5種水淹級(jí)別可作為模型的水淹級(jí)別集合, 該集合中每個(gè)元素將作為訓(xùn)練樣本的類(lèi)別標(biāo)簽. 由于水淹導(dǎo)致儲(chǔ)層的巖性、 物性和含油特征等發(fā)生變化, 因此在構(gòu)造水淹層識(shí)別特征指標(biāo)集時(shí)要充分考慮這些因素. 構(gòu)造方法: 為尋求水淹層測(cè)井響應(yīng)特征與水淹層級(jí)別之間的映射關(guān)系, 根據(jù)專(zhuān)家對(duì)密閉取心井已有取心資料的解釋分析并進(jìn)行綜合測(cè)試, 從而選取對(duì)水淹層識(shí)別反應(yīng)好的測(cè)井資料響應(yīng)特征構(gòu)造特征指標(biāo)參數(shù)樣本. 以遼河油田某區(qū)塊為例, 通過(guò)綜合測(cè)試和分析對(duì)比, 確定自然電位(SP)、 自然伽馬(GR)、 聲波時(shí)差(AC)、 微梯度(RML)、 深側(cè)向電阻率(RT)、 淺側(cè)向電阻率(RS)、 微電位(RMN)、 孔隙度、 含油飽和度作為水淹層特征指標(biāo)參數(shù). 對(duì)每個(gè)儲(chǔ)層, 前7個(gè)特征為測(cè)井曲線(xiàn)數(shù)據(jù), 后2個(gè)特征為單個(gè)數(shù)值. 原始測(cè)井曲線(xiàn)數(shù)據(jù)存在的噪聲(主要表現(xiàn)為異常高的突變值), 會(huì)影響聚類(lèi)及識(shí)別效果, 所以需要執(zhí)行濾波處理. 本文采用經(jīng)典的Walsh濾波方法. 該方法的原理: 首先對(duì)測(cè)井曲線(xiàn)進(jìn)行離散Walsh變換, 忽略某些高頻分量后, 再執(zhí)行反變換重構(gòu)原曲線(xiàn). 該過(guò)程的本質(zhì)是對(duì)原始曲線(xiàn)執(zhí)行“削尖”和“平滑”處理. 令離散數(shù)據(jù)序列的長(zhǎng)度L=2P, 若不滿(mǎn)足可在后面補(bǔ)零, 離散Walsh變換可表示為 (17) 離散Walsh濾波即為在采用W(k)合成x(n)時(shí), 只采用前2P-M個(gè)W(k), 表示為 (18) 此時(shí)合成的x(n)即可達(dá)到“削尖”和“平滑”的目的. 每個(gè)儲(chǔ)層采用9個(gè)特征描述, 其中前7個(gè)特征均來(lái)自測(cè)井曲線(xiàn)的離散數(shù)據(jù)序列, 對(duì)這些序列實(shí)施離散Walsh濾波后, 取這些序列的均值, 可得7個(gè)特征值, 再與孔隙度及含油飽和度合在一起, 即可得到描述單個(gè)儲(chǔ)層樣本的9維特征向量. 由于不同特征的數(shù)量級(jí)不同, 為消除不同量級(jí)數(shù)據(jù)間的相互影響, 還需對(duì)所有樣本逐維進(jìn)行歸一化處理. 為驗(yàn)證QSON的有效性, 將本文方法與傳統(tǒng)自組織網(wǎng)絡(luò)(classical self-organization network, CSON)[22]、K-均值聚類(lèi)(K-mean)[23]、 最鄰近聚類(lèi)(nearest neighbor clustering, NNC)[24]3種算法進(jìn)行對(duì)比. 為使對(duì)比結(jié)果更客觀(guān)公正, 對(duì)于CSON, 本文采用與QSON相同的結(jié)構(gòu)和參數(shù). 設(shè)置QSON和CSON模型的參數(shù): 輸入節(jié)點(diǎn)個(gè)數(shù)等于儲(chǔ)層特征參數(shù)個(gè)數(shù)(9個(gè)), 競(jìng)爭(zhēng)層節(jié)點(diǎn)C=256, 且排成16×16方陣; 最大步數(shù)G=1 000. 經(jīng)過(guò)多次實(shí)驗(yàn), 本文最終確定最佳參數(shù)組合為: 初始速率β0=0.8, 終止速率βf=0.1, 初始半徑r0=8, 終止半徑rf=1, 初始方差σ0=8, 終止方差σf=0.5. 對(duì)于K-mean算法, 指定類(lèi)數(shù)K=5, 聚類(lèi)精度ε=10-5, 若連續(xù)兩代所有類(lèi)中心變化量均小于ε則算法終止. 對(duì)于NNC算法, 經(jīng)過(guò)多次實(shí)驗(yàn), 最終確定最佳聚類(lèi)閾值為λ=0.9, 若某樣本與某類(lèi)中心的歐氏距離小于λ, 則視為該樣本屬于該類(lèi). 將預(yù)處理后的水淹層數(shù)據(jù)提交上述4種模型訓(xùn)練, 收斂后的模型即可用于水淹級(jí)別自動(dòng)分類(lèi). 仿真實(shí)驗(yàn)采用MATLAB工具, 編程實(shí)現(xiàn)QSON算法, 對(duì)遼河油田某區(qū)塊23口井共258個(gè)儲(chǔ)層進(jìn)行水淹級(jí)別聚類(lèi)仿真, 其中超強(qiáng)水淹15個(gè)、 強(qiáng)水淹89個(gè)、 中水淹83個(gè)、 弱水淹59個(gè)、 未水淹12個(gè). 這些小層的測(cè)井曲線(xiàn)共包含35 424個(gè)離散數(shù)據(jù)點(diǎn), 數(shù)據(jù)點(diǎn)的空間分布形態(tài)如圖2所示. 圖2 258個(gè)儲(chǔ)層的7條測(cè)井曲線(xiàn) 根據(jù)油藏開(kāi)發(fā)實(shí)際情形劃分小層的水淹級(jí)別共為5種類(lèi)型: 特強(qiáng)水淹(編碼為0)、 強(qiáng)水淹(編碼為1)、 中水淹(編碼為2)、 弱水淹(編碼為3)、 未水淹(編碼為4). 該區(qū)塊某井部分原始樣本數(shù)據(jù)列于表1. 該井共有7個(gè)小層, 其中第2~8列為測(cè)井曲線(xiàn)數(shù)據(jù), 第9,10兩列為單個(gè)數(shù)值. 為簡(jiǎn)便, 表1中每個(gè)小層分3行顯示, 第一行和第三行分別表示該小層各測(cè)井曲線(xiàn)的頂深和底深數(shù)據(jù), 第二行用省略號(hào)表示該小層的其他數(shù)據(jù). 對(duì)所有258個(gè)小層的7條測(cè)井曲線(xiàn)分別執(zhí)行Walsh濾波, 去除部分高列率成分后, 再反變換回原曲線(xiàn). 先將每小層濾波后的數(shù)據(jù)取均值, 即可構(gòu)造儲(chǔ)層樣本, 再將所有樣本按維歸一化即可得到訓(xùn)練樣本, 歸一化方法為: 首先獲取所有樣本每維的絕對(duì)值最大值, 然后將各維數(shù)據(jù)除以相應(yīng)維最大值即可. 以表1中原始數(shù)據(jù)為例, 7個(gè)小層的歸一化結(jié)果列于表2. 表1 遼河油田某區(qū)塊某井水淹層部分原始特征數(shù)據(jù) 表2 遼河油田某區(qū)塊某井水淹層聚類(lèi)樣本數(shù)據(jù) 首先將258個(gè)儲(chǔ)層分為訓(xùn)練樣本和測(cè)試樣本, 其中訓(xùn)練樣本210個(gè)(超強(qiáng)水淹10個(gè)、 強(qiáng)水淹70個(gè)、 中水淹70個(gè)、 弱水淹50個(gè)、 未水淹10個(gè)), 測(cè)試樣本48個(gè)(超強(qiáng)水淹5個(gè)、 強(qiáng)水淹19個(gè)、 中水淹13個(gè)、 弱水淹9個(gè)、 未水淹2個(gè)); 然后將訓(xùn)練樣本提交網(wǎng)絡(luò). QSON和CSON的訓(xùn)練結(jié)果分別如圖3和圖4所示. 由圖3(A)可見(jiàn), 僅經(jīng)過(guò)310步迭代, 所有訓(xùn)練樣本即聚為5類(lèi), 各類(lèi)樣本的獲勝節(jié)點(diǎn)分別為: 節(jié)點(diǎn)28, 弱水淹; 節(jié)點(diǎn)55, 超強(qiáng)水淹; 節(jié)點(diǎn)76, 強(qiáng)水淹; 節(jié)點(diǎn)90, 未水淹; 節(jié)點(diǎn)170, 中水淹. 而且各類(lèi)之間沒(méi)有交叉誤判, 聚類(lèi)結(jié)果完全正確. 由圖3(B)可見(jiàn), 5個(gè)獲勝節(jié)點(diǎn)的空間分布為: 弱水淹(2,12), 超強(qiáng)水淹(4,7), 強(qiáng)水淹(5,12), 未水淹(6,10), 中水淹(11,10), 這些節(jié)點(diǎn)在空間分布上相對(duì)分散, 可使網(wǎng)絡(luò)有較強(qiáng)的泛化能力. 由圖4(A)可見(jiàn), 經(jīng)過(guò)1 000步迭代后, 網(wǎng)絡(luò)未收斂, 所有訓(xùn)練樣本聚為59類(lèi), 其中: 第2,27,50類(lèi)均有2個(gè)儲(chǔ)層; 第10類(lèi)有58個(gè)儲(chǔ)層, 屬于中水淹, 獲勝節(jié)點(diǎn)序號(hào)為39; 第12類(lèi)有6個(gè)儲(chǔ)層, 屬于超強(qiáng)水淹, 獲勝節(jié)點(diǎn)序號(hào)為49; 第31類(lèi)有48個(gè)儲(chǔ)層, 屬于強(qiáng)水淹, 獲勝節(jié)點(diǎn)序號(hào)為129; 第49類(lèi)有7個(gè)儲(chǔ)層, 屬于未水淹, 獲勝節(jié)點(diǎn)序號(hào)為208; 第53類(lèi)有34個(gè)儲(chǔ)層, 屬于弱水淹, 獲勝節(jié)點(diǎn)序號(hào)為234; 其他51類(lèi)均只有1個(gè)儲(chǔ)層. 由圖4(B)可見(jiàn), 5個(gè)大類(lèi)獲勝節(jié)點(diǎn)的空間分布為: 第10類(lèi)中水淹(3,7), 第12類(lèi)超強(qiáng)水淹(4,1), 第31類(lèi)強(qiáng)水淹(9,1), 第49類(lèi)未水淹(13,16), 第53類(lèi)弱水淹(15,10). 盡管這5個(gè)節(jié)點(diǎn)在空間分布上分散度較好, 但其他54類(lèi)對(duì)應(yīng)的54個(gè)點(diǎn)形成了類(lèi)似噪聲的干擾項(xiàng), 從而在一定程度上影響了網(wǎng)絡(luò)的泛化能力. 圖3 QSON的訓(xùn)練結(jié)果 圖4 CSON的訓(xùn)練結(jié)果 圖5 K-mean和CNN的聚類(lèi)結(jié)果 對(duì)于K-mean和NNC方法, 聚類(lèi)結(jié)果如圖5所示. 由圖5可見(jiàn): 對(duì)于K-mean聚類(lèi)結(jié)果, 5類(lèi)樣本數(shù)分別為14(超強(qiáng)水淹), 72(強(qiáng)水淹), 48(中水淹), 40(弱水淹), 36(未水淹); 對(duì)于48個(gè)測(cè)試樣本, 通過(guò)計(jì)算每個(gè)測(cè)試樣本與各類(lèi)中心的距離, 確定該測(cè)試樣本的水淹級(jí)別, 正確識(shí)別數(shù)僅為15個(gè), 正確識(shí)別率為31.25%; 對(duì)于NNC聚類(lèi)結(jié)果, 5類(lèi)樣本數(shù)分別為121(超強(qiáng)水淹), 24(強(qiáng)水淹), 37(中水淹), 13(弱水淹), 15(未水淹); 對(duì)于48個(gè)測(cè)試樣本, 正確識(shí)別數(shù)僅為14個(gè), 正確識(shí)別率為29.166 7%. 由實(shí)驗(yàn)結(jié)果可見(jiàn): QSON對(duì)測(cè)試集識(shí)別的正確率高于CSON, 尤其明顯高于K-mean和NNC. 這主要因?yàn)? 首先, 在QSON中采用了新的距離度量方式. 現(xiàn)有的各種聚類(lèi)算法大都采用基于兩點(diǎn)各維坐標(biāo)的歐氏距離; 而在QSON中, 采用Bloch坐標(biāo)計(jì)算兩點(diǎn)之間的球面距離. 從而使得QSON比其他3種對(duì)比算法對(duì)待識(shí)別樣本具有更好的區(qū)分能力, 使其具有更優(yōu)良的聚類(lèi)性能; 其次, QSON采用量子比特繞軸旋轉(zhuǎn)調(diào)整權(quán)值, 調(diào)整過(guò)程在三維Bloch球面上進(jìn)行, 從而使調(diào)整過(guò)程更精細(xì); CSON直接采用樣本和權(quán)值的向量差調(diào)整權(quán)值, 該方法對(duì)學(xué)習(xí)速率較敏感, 但調(diào)整過(guò)程不易控制. 此外, 由于引入較多的矩陣計(jì)算(投影測(cè)量、 繞軸旋轉(zhuǎn)等), 導(dǎo)致QSON的計(jì)算效率較低, 但正是由于增加了這些輔助操作, 才有效提高了QSON的聚類(lèi)能力. 綜上所述, 為解決油田測(cè)井解釋中的水淹層識(shí)別問(wèn)題, 本文提出了一種基于量子自組織網(wǎng)絡(luò)的水淹層識(shí)別方法. 該方法輸入和權(quán)值均采用量子比特描述, 權(quán)值調(diào)整采用量子比特在Bloch球面上的繞軸旋轉(zhuǎn)實(shí)現(xiàn). 實(shí)驗(yàn)結(jié)果表明, 該方法聚類(lèi)能力不僅高于傳統(tǒng)自組織網(wǎng)絡(luò), 而且大幅度高于K-均值聚類(lèi)和最鄰近聚類(lèi)方法. 但由于采用了較多的矩陣計(jì)算, 導(dǎo)致本文方法計(jì)算效率較低.2 水淹層特征參數(shù)的選擇
2.1 劃分水淹級(jí)別
2.2 構(gòu)造水淹層特征指標(biāo)集
3 基于QSON的水淹層識(shí)別
3.1 原始數(shù)據(jù)的濾波去噪
3.2 構(gòu)造樣本數(shù)據(jù)
3.3 基于QSON的水淹層聚類(lèi)
4 實(shí)際應(yīng)用
4.1 數(shù)據(jù)預(yù)處理
4.2 訓(xùn)練結(jié)果對(duì)比
4.3 測(cè)試結(jié)果對(duì)比
4.4 實(shí)驗(yàn)結(jié)果分析