錢昱沛,陳向東,丁 星,李 皋,陳一健,夏文鶴
(1.西南交通大學 信息科學與技術(shù)學院,四川 成都 611756;2.西南石油大學 油氣藏地質(zhì)及開發(fā)工程國家重點實驗室,四川 成都 610500;3.西南石油大學 石油與天然氣工程學院,四川 成都 610500;4.西南石油大學 電氣信息學院,四川 成都 610500)
氣體鉆井技術(shù)是油氣資源勘探開發(fā)的一種重要技術(shù)手段,在提高機械鉆井效率等方面具有獨特的優(yōu)勢;但是在氣體鉆井過程中遇到地層出水后,井下容易發(fā)生環(huán)空堵塞、鉆頭卡鉆、井壁坍塌等復雜事故[1]。因此,在鉆井過程中需要快速檢測掘進過程中返出巖屑的濕度水平來預警地層出水狀況。目前,巖土濕度的測量方式以烘干法最為準確,但是無法達到快速檢測的目的;而常用的快速檢測方法中,最常見的為探針法,但無法實現(xiàn)大面積檢測。文獻[2-3]研究了通過近紅外光譜來分析土壤濕度的方法,能夠達到較高的檢測精度,但并未涉及有干擾物影響的復雜環(huán)境檢測。文獻[4]采用基于圖像處理的方法來檢測巖土濕度,通過圖像處理算法有效解決干擾物的影響,但其檢測靈敏度不高,而且受環(huán)境可見光影響較大,無法適應野外鉆井的應用場景。
針對上述問題,本文設計了一種基于近紅外圖像的巖土濕度快速檢測系統(tǒng)。
巖土濕度快速檢測的總體方案為:利用樹莓派控制USB攝像頭采集850 nm波段近紅外巖土圖像數(shù)據(jù),并通過WiFi實時發(fā)送至上位機。在上位機中,首先將圖像從RGB顏色空間變換到Lab顏色空間;然后通過混合高斯模型的建立分割出巖土區(qū)域,將分割后的只包含巖土區(qū)域的圖像轉(zhuǎn)換為灰度空間,采用一種基于小波變換的算法降低散斑噪聲干擾,通過DBSCAN聚類算法找到只包含巖土類的像素點并計算其灰度中心值,并將其作為分段回歸模型的輸入,輸出巖土的預測濕度值。圖1為所述系統(tǒng)框架。
圖1 系統(tǒng)框架
本系統(tǒng)主要利用便攜式嵌入式設備樹莓派控制攝像頭采集圖像,并將采集的圖像發(fā)送至上位機。采用基于TCP傳輸協(xié)議的Socket技術(shù)實現(xiàn)樹莓派與上位機之間的通信[5]。樹莓派作為硬件控制端,首先初始化Socket模塊,綁定一個IP端口并監(jiān)聽,等待上位機的連接請求。上位機為PC機,同樣初始化Socket模塊,通過connect()函數(shù)給硬件控制端發(fā)送連接請求來建立起與遠程硬件之間的通信橋梁。如果連接成功,上位機可以控制樹莓派實時拍攝圖像并接收樹莓派連續(xù)發(fā)送的圖像數(shù)據(jù)流,實現(xiàn)系統(tǒng)的快速檢測功能。上位機和下位機通信流程如圖2所示。
圖2 上位機和下位機通信
3.1.1 Lab顏色空間模型的轉(zhuǎn)換
巖土圖像容易受背景復雜性、光照多變性等環(huán)境因素干擾,在Lab顏色空間下建立混合高斯模型可以根據(jù)巖土的亮度特征和顏色特征來區(qū)分巖土中的干擾物。Lab顏色空間是一種基于人的視覺感應并使其均勻化的顏色系統(tǒng),其中包含L、a、b三個特征值,L值表示亮度特征,a和b表示顏色的對立維度特征[6]。CMOS近紅外攝像頭采集到的近紅外圖像為RGB顏色空間下的圖像,首先需要映射到XYZ顏色空間[7],其關(guān)系為:
然后通過XYZ顏色空間進一步轉(zhuǎn)換為Lab顏色空間,轉(zhuǎn)換公式為:
其中:
式中,m=0.008 856。
經(jīng)過轉(zhuǎn)換后,Lab顏色空間下的近紅外巖土圖像可以表示為X={x1,x2,...,xi,...,xN},其中xi=(xL,xa,xb)表示該圖像的每個像素點,是一個3維向量,xL、xa、xb分別表示該像素點的L、a、b值。
3.1.2 混合高斯模型的建立
混合高斯模型是根據(jù)事物的正態(tài)分布特性采用多個高斯模型的加權(quán)和來表征數(shù)據(jù)的一個混合模型[8]。在巖土的近紅外圖像中其像素點存在聚集性分布,因此可以利用混合高斯模型對其進行建模,從而分割出檢測區(qū)域中較大干擾物,降低復雜環(huán)境下誤檢測的概率。近紅外圖像的概率密度為:
3.1.3 基于EM算法的參數(shù)學習
EM(Expectation-Maximization)算法是混合高斯模型的常用參數(shù)學習算法[9],通過對參數(shù)θ設定初值使其變?yōu)橐阎P?,根?jù)該模型進行E步的計算得到每個像素點的概率密度;然后再通過整幅圖像的概率分布進行M步計算,采用極大似然估計法求取高斯模型的參數(shù)θ,更新E步的假設參數(shù)并重復上述過程,使其達到最終的最優(yōu)化收斂。
首先假定圖像中的高斯分布模型是已知的,給定初值θ0。通過如下公式進行E步計算:
其中,ωik表示圖像中像素點xi在第k個高斯分布下的概率,且1≤k≤K,1≤m≤K,1≤i≤N。
通過E步計算出概率后進行M步計算,并更新該模型的參數(shù),具體表達式如下:
重復以上E步和M步,直至參數(shù)達到最優(yōu)的收斂。
3.1.4 通過先驗知識確定巖土的高斯分布
通過混合高斯模型可以將采集到的圖像分為K個高斯分布,這個過程屬于無監(jiān)督學習,不需要先驗知識。這K個高斯分布模型中就包括了本文需要的巖土區(qū)域的高斯模型。問題的關(guān)鍵在于并不能事先知道哪個高斯模型是該巖土的高斯模型,需要通過多次實驗來確定。
本文經(jīng)過多次實驗后確定近紅外圖像中所含K個高斯模型,均值為μk=(Lk,ak,bk),其中,Lk為第k個高斯分布圖像像素區(qū)域的亮度值,ak、bk為其顏色值,將其作為該巖土區(qū)域高斯分布的先驗知識。
圖3(a)是含干擾物原始近紅外圖像,對其分別采用基于RGB顏色空間和基于Lab顏色空間的混合高斯模型進行圖像分割處理,得到分割后的圖像分別見圖3(b)、圖3(c)。從圖3的對比效果可以看出,基于Lab顏色空間的混合高斯模型可以有效將巖土像素點從圖像的背景以及干擾中分割出來;同時相較于RGB顏色空間的建模能夠較好地分割出巖土區(qū)域中的陰影部分,提高檢測精度。
圖3 圖像分割效果對比
3.2.1 圖像顏色空間轉(zhuǎn)換
單色灰度空間直觀地反映了巖土的亮度特征,能夠較好地分析不同濕度下的巖土對于光照的吸收反射程度。經(jīng)過圖像分割后的灰度圖像可表示為f(x,y),其中f(x,y)可由2個分量來表征,分別是入射分量和反射分量[10],如公式(11)所示:
式中:i(x,y)的性質(zhì)取決于近紅外光源的光照強度;r(x,y)的性質(zhì)取決于待測巖土混合物成分,主要影響變量為濕度。因濕度不同的巖土對近紅外光的吸收不同,因此反射分量的變化會引起數(shù)字圖像函數(shù)值的變化。
在數(shù)字圖像處理過程中,對攝像頭傳感器接收的電壓波形進行了取樣和量化[11],單色圖像在任意坐標(x0,y0)處的強度(灰度)表示為:
l的取值范圍為lmin≤l≤lmax,其中區(qū)間[lmin,lmax]為灰度級,范圍為[0,255]。
3.2.2 基于小波變換的圖像去噪
近紅外圖像中通常存在散斑噪聲,其中既包含加性噪聲的成分,也包含乘性噪聲的成分,表達式為:
其中:f(x,y)為原始圖像信號;nm為乘性噪聲信號;na為加性噪聲信號;(x,y)為含噪信號。因此,本文采用一種基于小波變換的近紅外圖像去噪方法來解決噪聲[12]。
信號中的加性噪聲采用閾值去噪的方法濾除,濾除之后信號表達式(13)變?yōu)椋?/p>
通過對公式兩邊取對數(shù)可將乘性噪聲變?yōu)榧有栽肼?,公式如下?/p>
對log4(x,y)進行離散小波變換,然后通過硬閾值規(guī)則,消除加性噪聲log4nm。
首先選擇近似于巖土頻率信號的小波基函數(shù),對該信號進行等間隔抽樣,經(jīng)過抽樣后得到信號樣本序列為CJ+1[k],然后對該序列進行N級離散小波變換。目的是為了得到圖像中每個像素點的頻率特征,并將該像素點的噪聲信號分離出來[13]。通過以上過程得到了N級不同尺度的離散小波展開系數(shù)dJ[k],dJ-1[k],...,dJ-N+1[k]以及一級近似展開系數(shù)CJ-N+1[k]。
對于小波變換的各級展開系數(shù),首先給定每級系數(shù)的閾值界限,將低于該閾值界限的系數(shù)設置為零,高于該閾值的系數(shù)保持不變,公式為:
巖土是復雜的混合物,雖然混合高斯模型算法能夠從近紅外圖像中分割出較大干擾物,但復雜環(huán)境下的巖土包含的一些較小的干擾物也會影響檢測的準確性,如石塊以及溝壑陰影。除此之外,圖像檢測屬于大面積的區(qū)域性檢測,而巖土區(qū)域中還存在著水分分布不均的情況。
針對以上問題,本文采用了密度聚類算法中的DBSCAN算法來實現(xiàn)聚類。該算法是一種基于密度的聚類算法,通過將高密度區(qū)域內(nèi)具有相同特征的點劃分為同一類實現(xiàn)聚類[14]??梢愿鶕?jù)區(qū)域的不同性質(zhì)和形狀聚類出具有同一特征的類別,并且可以很好地識別出噪聲點、排除干擾。
DBSCAN算法需要2個參數(shù):以每個核心點為中心構(gòu)成鄰域的半徑ε、構(gòu)成一個聚類簇的區(qū)域內(nèi)至少包含的關(guān)聯(lián)點個數(shù)minPts[15]。通過設置以上參數(shù)進行多次迭代直至最終收斂,該算法能夠找到巖土類別在灰度圖像中的簇。本文通過大量實驗發(fā)現(xiàn),當取ε=4、minPts=(w×h)/5時可以得到最優(yōu)化的聚類效果,其中w為近紅外巖土圖像區(qū)域的橫向像素點個數(shù),h為圖像區(qū)域的縱向像素點個數(shù)。使用DBSCAN算法能夠分割出類似于巖土的巖石塊以及巖土圖像中溝壑造成的陰影,找出巖土的像素點。前后的對比如圖4所示,噪聲點統(tǒng)一用白色點代替。聚類后的巖土區(qū)域可能存在水分分布不均的情況,因此需要計算該區(qū)域的灰度中心點并將其作為該區(qū)域濕度代表。
圖4 巖土聚類前后效果對比
本系統(tǒng)主要采集了不同產(chǎn)地下不同類型的三種巖土做對比實驗,樣本分別為碳酸鹽巖屑、天然農(nóng)田土和綠化帶黏土。對3種巖土分別隨機采集30組不同濕度的樣本,將每組樣本隨機抽樣分為訓練集和測試集。
測量巖土的實際濕度值采用的是傳統(tǒng)的烘干稱重法,可以準確地測得巖土樣本的實際濕度值。其中所用到的烘干稱重儀器有:質(zhì)量精度為0.1 g的天平、盛土所用的不銹鋼容器、50 mL的量杯、ZK-82B型電熱真空干燥箱。
采集近紅外圖像數(shù)據(jù)用的是800萬像素的索尼IMX317系列的415 USB攝像頭模組,鏡頭上貼了850 nm的窄帶濾光片防止攝像頭采集到其他波段的信息,近紅外主動光源選用850 nm的40 W廣角近紅外補光燈。硬件控制平臺采用Raspberry Pi 3 Model B。
采集數(shù)據(jù)參數(shù)設置包括攝像頭模組的鏡頭和近紅外補光燈與巖土樣品的距離,為48 cm。通過USB攝像頭的SDK控制攝像頭的白平衡、曝光等參數(shù)保持不變。
取完全干燥條件下質(zhì)量為M1的巖土,將其放在質(zhì)量為M0的不銹鋼容器里。用量杯盛取一定質(zhì)量的清水加入該巖土中使其過飽和,然后攪拌均勻使巖土充分吸收水分,再將其放入真空干燥箱中進行烘干。平均每烘干5 min后對盛有巖土的容器稱得一次質(zhì)量并放在實驗箱內(nèi)的平臺上拍攝一次該濕度下的圖像數(shù)據(jù)。每次烘干后稱得的質(zhì)量為M2,重復該實驗過程直至巖土完全干燥,對其他2種巖土重復上述實驗過程。
巖土的濕度公式為:
在模擬實驗環(huán)境下通過上述方法采集到的數(shù)據(jù)見表1所列。
表1 巖土濕度與巖土圖像的灰度中心值
4.3.1 灰度特征曲線
不同類別巖土的圖像灰度中心值隨其對應的濕度變化曲線如圖5所示。通過圖5可以看出,圖像灰度中心值隨濕度的變化趨勢近似線性;但是不同類別巖土在每個濕度下對應的灰度中心值不同,且灰度值隨濕度變化的斜率不同,反映了不同類別巖土的近紅外特性不同。產(chǎn)生這種差異的影響因素比較多,如化學成分的組成和含量不同、對水分的吸收能力不同等。
圖5 巖土像素點的灰度中心值隨其濕度的變化曲線
根據(jù)巖土濕度與灰度中心值的對應關(guān)系,本文建立了巖土濕度與拍攝圖像中巖土的灰度中心值之間的分段線性回歸模型。除此之外,為了對低濕度進行及時且準確的檢測,將巖土濕度分為2個類別來提升低濕度下的預測準確率,其模型為:
式中,t0代表劃分高濕度與低濕度臨界點的灰度值。在t處于不同的灰度值時,Y的期望值分別為:
該模型的損失函數(shù)定義為:
模型的參數(shù)估計值為:
式中,β={β0,β1,β2}。
4.3.2 分段線性回歸
實驗中將采集的不同類別巖土在不同濕度下的30組數(shù)據(jù),以13%的濕度為分界線分為高濕度和低濕度2類,其中每類分為4個子集進行4折交叉驗證,得到如圖6所示的對比圖。
圖6 不同類別巖土在交叉驗證下的濕度實測值與預測值對比
本文使用濕度的平均絕對誤差來衡量系統(tǒng)的準確性,平均絕對誤差MAD表示為:
式中:N為訓練樣本的個數(shù);Tp(i)表示樣本的預測濕度值;Tf(i)表示樣本的實測濕度值。
由式(25)計算出巖土濕度模型的誤差見表2所列。
表2 巖土濕度模型的誤差
通過對比實驗,得到了表2所列的不同類型巖土的識別結(jié)果,可以看出3種巖土在低濕度下的預測結(jié)果比高濕度下的預測結(jié)果更為準確。對比碳酸鹽巖屑、天然農(nóng)田土和綠化帶黏土的實驗結(jié)果,本系統(tǒng)對于不同產(chǎn)地不同類型的巖土同樣具有很高的檢測準確率。在實際應用過程中應該首先針對不同的巖土進行分類,然后通過建立對應巖土類別的數(shù)據(jù)庫實現(xiàn)不同巖土濕度的預測。
4.3.3 系統(tǒng)測試
本系統(tǒng)進行快速檢測測試時采用Intel i5-1135G7 CPU、Win10操作系統(tǒng)的PC機作為上位機,其運行效果如圖7所示。
圖7 系統(tǒng)測試上位機運行效果
通過多次的實驗驗證,檢測得到一幅規(guī)格為800×600的圖像時,各功能運行大致時間見表3所列。由表3可知,系統(tǒng)需要花費的總體時間約為50 s,基本滿足巖土濕度快速檢測的需求。
表3 系統(tǒng)各部分運行時間
本文針對巖土濕度快速檢測提出了基于近紅外圖像的處理方法,在不同光照環(huán)境和復雜背景下具有很強的魯棒性,針對不同類別的巖土還有很強的適應性;同時搭建了模擬環(huán)境驗證了該方法的可行性,針對巖土的濕度實現(xiàn)了高精度測量,對于氣體鉆井地層出水的快速檢測具有一定的參考價值。