趙澤賓,孫 卓
(中國礦業(yè)大學(xué)(北京)機電與信息工程學(xué)院,北京 100083)
煤巖圖像識別作為世界難題一直引起眾多學(xué)者的關(guān)注,雖然現(xiàn)已提出多種煤巖圖像識別方法,例如在計算機視覺技術(shù)方面,煤巖圖像的紋理特征提取有小波變換法[1],字典學(xué)習(xí)[2],最大池化稀疏編碼[3]等,但是這些方法都比較成熟而且已經(jīng)發(fā)展到瓶頸。
目前煤巖識別技術(shù)主要分為物理探測技術(shù)和基于圖像識別的多信息融合技術(shù)。近年來,最初作為機器學(xué)習(xí)算法的稀疏貝葉斯學(xué)習(xí)不僅繼承了貝葉斯模型完善的理論基礎(chǔ),而且克服了其計算復(fù)雜度較高的不足,成為了眾多學(xué)者的研究對象。由于稀疏貝葉斯學(xué)習(xí)能夠充分的挖掘和利用數(shù)據(jù)的先驗信息,并且可以得到信號和圖像的稀疏表示,成功的被引用到信號處理和壓縮感知領(lǐng)域[4,5]。為了將稀疏貝葉斯學(xué)習(xí)算法運用到煤巖圖像識別領(lǐng)域,筆者采用該算法提取煤巖圖像的紋理特征,通過迭代更新并趨于收斂的相關(guān)參數(shù)和最優(yōu)權(quán)重對測試樣本進(jìn)行分類識別,來解決煤巖圖像識別問題。
稀疏貝葉斯學(xué)習(xí)是稀疏信號重構(gòu)的方法之一,其性能相當(dāng)于重加權(quán)的范數(shù)恢復(fù)方法,并且不需要設(shè)置正則化參數(shù)[6]。稀疏貝葉斯學(xué)習(xí)的主要思想可以分為三步,首先獲得先驗概率和條件概率密度參數(shù)表達(dá)式,然后結(jié)合總體和樣本,利用貝葉斯公式求得后驗概率表達(dá)式,最后通過后驗概率的大小進(jìn)行統(tǒng)計決策。
首先通過壓縮感知的基本模型觀測一個向量:
其中:為N×M的感知矩陣,它的列向量對應(yīng)M個基向量;為N×1維壓縮信號;為M×1維解向量,為未知的噪聲向量。因為對于概率模型的訓(xùn)練過程實際上就是參數(shù)估計的過程,故:
式(3)反映了從先驗分布到后驗分布的轉(zhuǎn)化。其中p(x)為先驗分布,表示觀測之前的概率;p(y)表示“證據(jù)”因子;是解向量x相對于其壓縮信號的似然分布,在求最大似然估計的時候就是用該概率形式;被稱為后驗密度函數(shù)。然而在現(xiàn)實應(yīng)用中,后驗分布很難直接算出,但是通過貝葉斯定理可以將估計后驗分布的問題轉(zhuǎn)換為基于數(shù)據(jù)集來估計先驗分布和似然。
通常在SBL算法中,把噪聲v假設(shè)為高斯白噪聲向量來處理,即v服從均值為0,σ2I方差為的高斯分布:
大部分情況下,σ2參數(shù)需要通過數(shù)據(jù)訓(xùn)練而得出。SBL要解決的問題是根據(jù)已知的A和y估算出未知解向量x,其實就是稀疏信號重構(gòu)的過程。
SBL算法在先驗參數(shù)的結(jié)構(gòu)下,采用了神經(jīng)網(wǎng)絡(luò)中常用的自動相關(guān)決策理論移除不相關(guān)的點來獲取稀疏解。假設(shè)解向量的先驗分布服從參數(shù)化的均值為0方差為α的高斯分布:
其中,解向量 x 的參數(shù)向量 α=(α1,α2,…αM) 是由超參數(shù)組成的向量。根據(jù)ARD可進(jìn)一步表示,x的每個元素xi都服從一個參數(shù)化的且均值為0方差為αi-1的高斯分布[7]。因為假設(shè)噪聲向量V符合均值為0,方差為σ2I的高斯分布,故可以得出壓縮信號y符合均值為Ax,方差為σ2I的高斯分布,即似然分布為:
在貝葉斯框架下對參數(shù)加以先驗分布,起到很好的約束作用,從而避免了模型中參數(shù)的數(shù)量和樣本的數(shù)量一樣多所造成的嚴(yán)重過匹配的問題,故假設(shè)模型中參數(shù)向量α和噪聲參數(shù)σ2服從Gamma先驗概率分布:
其中β=σ-2,再一次的說明稀疏貝葉斯學(xué)習(xí)對數(shù)據(jù)有著優(yōu)秀的數(shù)據(jù)挖掘能力。
利用全概率公式對權(quán)值進(jìn)行積分即可得出第二類似然函數(shù)表達(dá)式:
將式(5)和(6)代入到(9)可得:
其中,Γ=diag(α)。通過進(jìn)一步計算可以得出:
其中:C是一個常數(shù)。此式我們可以得出p(x,α)是一個均值為0,協(xié)方差矩陣為Σv=σ2I+AΓ-1AT的高斯分布。
根據(jù)貝葉斯定理可以得出解向量的后驗分布為:
上式分子部分是兩個高斯函數(shù)的乘積,根據(jù)高斯函數(shù)的相關(guān)性質(zhì)可知,其乘積結(jié)果當(dāng)然也是高斯函數(shù),再結(jié)合分母部分也是服從高斯分布的,所以解向量的后驗分布服從高斯分布,故將公式(5)、(6)和(9)代入(12)可得出:
其中 μ=A(ATA+σ2Γ)-1ATy,Σ=(σ-2ATA+Γ)-1。μ 表示此高斯分布的均值,通過指數(shù)部分對x的一階導(dǎo)數(shù)零點求得,協(xié)方差矩陣Σ為指數(shù)部分對x的二階導(dǎo)數(shù)的逆。故解向量x的最大后0驗估計由這個高斯分布的均值μ給出。而筆者要做的事情就是通過該模型尋找煤巖圖像識別的新方法,提高煤巖識別率從而應(yīng)用于實際的生產(chǎn)過程中。
貝葉斯線性回歸是經(jīng)典的線性回歸方法之一,對數(shù)據(jù)有自適應(yīng)能力,可以重復(fù)的利用一定數(shù)量的實驗數(shù)據(jù),并防止過擬合。對于本模型對應(yīng)的似然函數(shù)可表示為:
回歸的目的就是根據(jù)上式對x和σ2作出最大似然估計,從而找到解向量x=(x1,x2,…xM)中少量的非零元素。對式(12)中第二類最大似然函數(shù)求關(guān)于參數(shù)α和σ2的偏導(dǎo)并令其等于0進(jìn)行求解,可以得出本模型的參數(shù)更新公式為:
其中:γi=1-αiΣii。在該算法的學(xué)習(xí)過程中,每次運算都會更新統(tǒng)計量μ和Σ,并代入式(16)和式(17),通過不斷重復(fù)的計算使超參數(shù)α和σ2達(dá)到最大的迭代次數(shù)或者滿足收斂條件[8-10]。
實驗選擇110張頁巖和砂巖圖片作為巖石樣本圖片,再選擇110張煙煤和無煙煤圖片作為煤層樣本圖片,每類各55張,共計220張。每張圖片的大小為48×48,格式為jpg,灰度級為256。
從四類圖片中各隨機選出42張圖片,共計168張作為訓(xùn)練樣本,剩下的52張作為測試樣本。并且各類圖片均來自礦井下不同時段不同光照強度的現(xiàn)場圖片,window環(huán)境下在MATLAB R2013b軟件上進(jìn)行實驗。
煤巖圖像的特征提取過程,其實就是該模型解向量的求解過程,說到底還是參數(shù)和迭代更新的過程。首先對樣本圖片進(jìn)行預(yù)處理,其目的就是為了減少訓(xùn)練樣本中的冗余信息,達(dá)到降維效果;然后利用稀疏貝葉斯學(xué)習(xí)算法進(jìn)行模型的參數(shù)訓(xùn)練;最后根據(jù)稀疏貝葉斯分類模型對測試樣本的分類識別。表1展示了使用和不使用SBL算法的識別率對比。
表1 稀疏貝葉斯學(xué)習(xí)對識別率的影響Table1 Impact of sparse Bayesian learning on recognition rate
1)基于稀疏貝葉斯學(xué)習(xí)的煤巖圖像識別方法大大增加了煤巖圖像的可區(qū)分性,錯誤樣本數(shù)從19個降低到2個;
2)該SBL算法將噪聲干擾考慮在內(nèi),可以很好的解決礦塵等對煤巖圖像的干擾;
3)該SBL算法可以為煤巖自動識別技術(shù)提供新的解決思路;