李智文, 王 偉
(1.河北煤炭科學(xué)研究院, 邢臺(tái) 054000; 2.中國(guó)科學(xué)院地理科學(xué)與資源研究所,資源與環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100101)
在油田的開(kāi)發(fā)過(guò)程中,測(cè)井曲線的應(yīng)用不僅涉及到地震資料的解釋與反演,提供井位的關(guān)鍵參數(shù),也是評(píng)價(jià)油井優(yōu)劣的重要依據(jù),因此測(cè)井曲線具有重要應(yīng)用價(jià)值[1]。在早期的測(cè)井工作,其結(jié)果保存在圖紙中,由于圖紙保存時(shí)間長(zhǎng)、使用頻繁,導(dǎo)致圖紙出現(xiàn)折痕、褪色、破損、變形等問(wèn)題,嚴(yán)重?fù)p失了測(cè)井曲線有效信息,不利于今后保存與使用[2-3]。測(cè)井圖紙資料以數(shù)字矢量化的方式保存為電子文件,能夠有效保護(hù)測(cè)井曲線數(shù)據(jù),有利于后期的存儲(chǔ)、管理、再利用、網(wǎng)絡(luò)傳輸與資源共享。因此對(duì)老圖紙數(shù)字化處理從上世紀(jì)90年代起,一直是油田急需解決的重點(diǎn)工作之一[4],也是地學(xué)與計(jì)算機(jī)技術(shù)研究的重要核心課題之一[5]。早期測(cè)井曲線矢量化通常采有數(shù)字化儀或國(guó)外矢量化軟件來(lái)完成這一工作,但是速度較慢、耗時(shí)長(zhǎng)、效率較低,且在圖紙移動(dòng)過(guò)程中經(jīng)常出現(xiàn)拼接不連續(xù)、錯(cuò)位和失真等問(wèn)題,甚至重新對(duì)曲線掃描[6]。隨著計(jì)算技術(shù)與圖像識(shí)別技術(shù)的不斷進(jìn)步,圖紙測(cè)井曲線矢量化方法正向更快、更準(zhǔn)確、智能化方向快速發(fā)展。測(cè)井曲線矢量化方法必須能夠解決此類圖紙圖像存在的問(wèn)題[7-9]:①圖像灰度背景隨時(shí)間褪色不均勻、圖紙斷裂造成曲線間斷斷裂問(wèn)題多;②各類目標(biāo)測(cè)井曲線橫坐標(biāo)不一致出現(xiàn)相互交叉、重疊現(xiàn)象;③圖像柵格線類型多樣;④目標(biāo)測(cè)井曲線有點(diǎn)線、實(shí)線、劃線、點(diǎn)劃線等多種類型并存;⑤圖像中目標(biāo)測(cè)井曲線與刻度坐標(biāo)功能的網(wǎng)格線相互交叉重疊;⑥曲線縱向、橫向刻度標(biāo)準(zhǔn)不一致,縱向像素多,橫向像素少;⑦目標(biāo)曲線的峰值信息價(jià)值大,中間部分信息價(jià)值小。測(cè)井曲線矢量化具體實(shí)現(xiàn)過(guò)程一般分為兩步:①去除圖紙背景噪音與網(wǎng)格線;②追蹤各種測(cè)井曲線,并完成數(shù)字化[10]。頻率域?yàn)V波和空間域?yàn)V波方法可以消除背景噪音。頻率域去噪方法的優(yōu)點(diǎn)是不過(guò)度依賴于網(wǎng)格線的強(qiáng)弱、連續(xù)性信息,對(duì)測(cè)井曲線信息損失小,其缺點(diǎn)是在二維變換中引入一些混迭效應(yīng),反變換后恢復(fù)的圖像含有灰色區(qū)域塊,且運(yùn)算量大,要求像素長(zhǎng)與寬度是2的整數(shù)次冪,不適合計(jì)算機(jī)優(yōu)化算法[11-12]。空間域去噪方法直觀、簡(jiǎn)單,且易于實(shí)現(xiàn),因此當(dāng)前的柵格圖像背景識(shí)別算法多在空間域?qū)崿F(xiàn)(如對(duì)網(wǎng)格先進(jìn)行縱橫向投影以消除灰度值為零的高值區(qū)域的投影法方法、針對(duì)網(wǎng)格線的直線特征進(jìn)行識(shí)別的線性Hough變換法和基于擊中/擊不中原理的十字模板匹配法等[13-16])。筆者根據(jù)測(cè)井曲線圖紙資料特點(diǎn),介紹一種這類測(cè)井曲線矢量化的實(shí)現(xiàn)算法,從而為油田降低管理成本、延長(zhǎng)保存期限,提高測(cè)井成果的利用效率,推進(jìn)測(cè)井?dāng)?shù)據(jù)庫(kù)建設(shè),實(shí)現(xiàn)資源共享,推動(dòng)油田數(shù)字化健康發(fā)展。
在測(cè)井曲線圖紙信息分析與處理中,首先對(duì)背景噪音進(jìn)行壓制,保留有效的測(cè)井曲線信息,然后對(duì)測(cè)井曲線進(jìn)行矢量化。背景噪音有兩類:①圖紙上的具有刻度的橫縱等間隔的網(wǎng)格線;②圖紙的灰度及褪色、破損噪音。
為了方便清繪測(cè)井曲線,測(cè)井圖紙印有表示坐標(biāo)的橫縱網(wǎng)格線,兩兩相交形成樣式相同的十字形圖案,因此可以根據(jù)基于十字模板的擊中/擊不中變換(Hit/Miss Translation)原理,在圖形區(qū)域內(nèi)識(shí)別并搜索十字形網(wǎng)格,并消除其影響。設(shè)定閥值,當(dāng)相關(guān)性大于閥值時(shí),認(rèn)為搜索到交叉點(diǎn),區(qū)域就是交叉點(diǎn)所在的區(qū)域。
數(shù)學(xué)形態(tài)學(xué)中的“擊中/擊不中變換”又叫塞拉變換,該變換方法將圖像分為目標(biāo)內(nèi)部區(qū)與目標(biāo)外部區(qū),并能同時(shí)進(jìn)行識(shí)別。因此在目標(biāo)圖像識(shí)別和模式識(shí)別等領(lǐng)域,利用HMT原理從背景噪音中提取目標(biāo)圖像,取得很好的效果,并得到廣泛應(yīng)用。如果對(duì)圖像按照結(jié)構(gòu)單元?jiǎng)澐郑總€(gè)結(jié)構(gòu)單元屬于目標(biāo)單元或者非目標(biāo)單元,具體到圖紙網(wǎng)格線圖像中,由十字形單元和非十字形單元構(gòu)成,檢測(cè)到十字形區(qū)域?yàn)閾糁惺录?,未檢測(cè)到十字形為未擊中事件,其數(shù)學(xué)描述為: 給定圖像M,不相交集合對(duì)S(S1,S2),即:
S=S1∪S2,S1∩S2=Φ
(1)
則擊中/擊不中變換定義為:
(2)
圖1 十字形模板Fig.1 Cross template
圖2 去除十字形背景噪音Fig.2 Remove cross background noise(a)去噪前;(b)去噪后
利用基于十字形模板的擊中/擊不中方法,消除測(cè)井曲線中的網(wǎng)格線背景,其效果對(duì)比如圖2所示,從去噪前、后對(duì)比可以看出,圖像中網(wǎng)格線組成的十字形干擾得到有效壓制。
二值化處理就是在[0 255]區(qū)間內(nèi)根據(jù)閾值選擇函數(shù)確定一個(gè)閾值,超過(guò)閾值則判斷該像素為選擇目標(biāo),且設(shè)置為255。將圖像的圖灰度值設(shè)置為1~m級(jí),灰度值i的像素個(gè)數(shù)為ni。則總的像素?cái)?shù):
(3)
各灰度值的概率為:
Pi=ni/N
(4)
用k將其分為兩組,C0={1-k},C1={k+1~m},則C0、C1產(chǎn)生的概率及其平均值分別為:
(5)
(6)
(7)
(8)
其中:μ是柵格圖像的灰度平均值;μ(k)是閾值為k的灰度平均值,其表達(dá)式分別為:
(9)
(10)
全部采樣的灰度平均值為μ=ω0μ0+ω1μ1。 其方差為:
σ2(k)=ω0(μ0-μ)2+ω1((μ1-μ)2)=
(11)
σ2(k)被稱為閾值選擇函數(shù),k在1~m之間改變,利用最小二乘法可獲得極值時(shí)的k閾值。
為達(dá)到優(yōu)化處理,通過(guò)采取設(shè)置靈活參數(shù)的方法,使得每一幅圖像都能獲得一個(gè)比較理想的效果。去噪效果如圖3所示,有效壓制了圖紙中的灰色背景噪音。
圖3 去除灰色背景噪音Fig.3 Remove gray background noise(a)去噪前;(b)去噪后
圖4 搜索圖N-1一點(diǎn)相鄰Fig.4 Search graph N-1
圖5 搜索圖N-1多點(diǎn)相鄰Fig.5 Search graph N-1
圖6 搜索圖N-2Fig.6 Search graph N-2
圖7 基本跟蹤算法流程圖Fig.7 Basic trace algorithm flow chart
曲線跟蹤包括手動(dòng)跟蹤和自動(dòng)跟蹤兩部分,手動(dòng)跟蹤即只記錄鼠標(biāo)點(diǎn)擊的位置,這種方式的優(yōu)點(diǎn)是可靠性好,人工識(shí)別的準(zhǔn)確度高,一般不會(huì)出現(xiàn)誤判現(xiàn)象,但是缺點(diǎn)也很明顯,需要手工點(diǎn)擊幾乎所有曲線上的點(diǎn),工作量大;自動(dòng)跟蹤就是在手動(dòng)跟蹤的基礎(chǔ)上,加上了計(jì)算機(jī)的自動(dòng)識(shí)別,達(dá)到大大減小矢量化工作量的目的。
鼠標(biāo)點(diǎn)擊目標(biāo)曲線,以鼠標(biāo)點(diǎn)擊點(diǎn)為中心,探測(cè)一定的矩形區(qū)域內(nèi)各點(diǎn)的深度值,以深度值較大的點(diǎn)作為探測(cè)起點(diǎn),并把該深度設(shè)為目標(biāo)曲線的深度。然后把矩形區(qū)域內(nèi)與起始點(diǎn)相鄰的深度最大的點(diǎn)(線的中點(diǎn)centre)作為下一個(gè)點(diǎn)。如果有多個(gè)最大值點(diǎn),則應(yīng)該根據(jù)曲線的走向來(lái)判斷取哪個(gè)點(diǎn),判斷不出就停止跟蹤。這在曲線粗細(xì)均勻(nlen)或者由細(xì)變粗的時(shí)候是可以很好地識(shí)別。
曲線由粗變細(xì)的情況比較復(fù)雜,設(shè)該點(diǎn)的深度值為N,從距離該點(diǎn)2像素的矩形框上找深度值為N-1的點(diǎn),若僅有一個(gè)則該點(diǎn)為下一個(gè)點(diǎn),若有多個(gè)相鄰任取一個(gè)點(diǎn)作為下一點(diǎn)(圖4、圖5),不相鄰則表示是交叉點(diǎn),應(yīng)該根據(jù)曲線的走向來(lái)判斷取哪個(gè)點(diǎn),判斷不出停止跟蹤;如距離原點(diǎn)2像素的矩形框上找不到深度值為N-1的點(diǎn),則在距離原點(diǎn)3個(gè)像素的矩形框上找深度值為N-2的點(diǎn)(圖6),若僅有一個(gè)則該點(diǎn)為下一個(gè)點(diǎn),若有多個(gè),繼續(xù)判斷是否相鄰;如果沒(méi)有找到,則探測(cè)4個(gè)像素范圍內(nèi)深度值為N-3的點(diǎn),再進(jìn)行判斷,直到N-m=0為止。如果都沒(méi)有找到滿足條件的點(diǎn),跟蹤結(jié)束。
圖8 設(shè)計(jì)流程圖Fig.8 Design flow chart
圖9 測(cè)井曲線矢量化結(jié)果Fig.9 Vectorizing oilfield well logging curves result
探測(cè)過(guò)程中如果遇到矩形區(qū)域的邊界,則以最后一個(gè)加入頂點(diǎn)數(shù)組的點(diǎn)為中心,進(jìn)行下一個(gè)矩形區(qū)域探測(cè),探測(cè)時(shí)要排除已經(jīng)探測(cè)過(guò)的點(diǎn)。
圖7是實(shí)現(xiàn)基本跟蹤算法的流程圖,圖8是系統(tǒng)整體設(shè)計(jì)流程圖。
通過(guò)對(duì)大慶油田的多種測(cè)井圖紙進(jìn)行了自動(dòng)跟蹤識(shí)別,有效提取了測(cè)井曲線,并進(jìn)行了矢量化處理。圖9是對(duì)大慶油田北-1-362-622井的試驗(yàn)跟蹤結(jié)果。矢量化處理的結(jié)果,不同網(wǎng)格線清晰,測(cè)井曲線連續(xù)光滑,達(dá)到了預(yù)期目的。
早期測(cè)井資料的矢量化是非常有實(shí)用價(jià)值意義的一項(xiàng)工作,不僅方便地保持相應(yīng)資料,同時(shí)便于用戶使用。筆者通過(guò)研究此類測(cè)井資料特點(diǎn)并進(jìn)行歸類,有針對(duì)性的消除背景噪音,實(shí)現(xiàn)了對(duì)曲線的識(shí)別與自動(dòng)追蹤,可以快速地對(duì)這些資料進(jìn)行矢量化,方便使用,利用資料維護(hù)。本系統(tǒng)在背景復(fù)雜的條件下存在對(duì)搜索到的斷口后的曲線和當(dāng)前跟蹤曲線特征高吻合度的判斷問(wèn)題,可能引起誤判現(xiàn)象,這是我們下一步工作的研究重點(diǎn)。