, , ,運(yùn)杰
(山東科技大學(xué) 電子通信與物理學(xué)院,山東 青島 266590)
我國礦產(chǎn)資源豐富,煤炭作為最重要的戰(zhàn)略資源在經(jīng)濟(jì)發(fā)展中有著舉足輕重的作用。煤炭開采過程中矸石的混入極大地影響了煤的使用效率,煤與矸石的分選是煤炭利用過程中不可或缺的環(huán)節(jié)[1]。機(jī)器視覺技術(shù)[2]具有通用性強(qiáng)且易于實(shí)施的特點(diǎn),可以實(shí)現(xiàn)非接觸式的檢測,利于環(huán)境保護(hù),適用于煤炭開采這種重復(fù)性的工業(yè)生產(chǎn),煤與矸石識別的關(guān)鍵在于如何有效地表達(dá)煤與矸石圖像特征,特征提取的好壞將會直接影響分類識別的結(jié)果。于國防等[3]提出了利用灰度值進(jìn)行煤和矸石圖像識別的方法,但需要一定輔助條件,并且過程比較復(fù)雜;王祥瑞[4]提出的煤與矸石圖像特征提取方法較為簡單,但基于灰度值的特征提取方式單一,在煤礦特定環(huán)境下影響識別的準(zhǔn)確度,不能滿足實(shí)際需求;何敏等[5]采用了灰度共生矩陣的特征提取方法,由于提取到的特征參數(shù)比較少,容易影響識別的結(jié)果;廖陽陽等[6]采用BP網(wǎng)絡(luò)的識別方法,因受到實(shí)驗(yàn)樣本差異的影響,其識別精度不高。而且上述特征提取方法難以適應(yīng)在實(shí)際環(huán)境情況下的分類識別,準(zhǔn)確率也有待提高,因此需要研究可以精確描述煤與矸石圖像的特征提取方法。
近年來,字典學(xué)習(xí)算法[7-8]在圖像去噪、面部識別、圖像修復(fù)、圖像超分辨率以及圖像分類等領(lǐng)域有著廣泛的應(yīng)用。字典學(xué)習(xí)算法因其稀疏的表示方式使學(xué)習(xí)得到的字典原子數(shù)量增加、形態(tài)豐富,可以與信號或者圖像本身的結(jié)構(gòu)進(jìn)行更好的匹配。本文將采用字典學(xué)習(xí)中的K-SVD算法提取煤與矸石的圖像特征,隨機(jī)選擇煤與矸石的樣本圖像作為字典原子后,將學(xué)習(xí)字典按列的順序隨機(jī)進(jìn)行更新,以最大限度地將煤與矸石的圖像特征有效表達(dá)出來,提高識別的效率。
隨著稀疏表示理論的不斷成熟,字典學(xué)習(xí)理論被提出并應(yīng)用于信號處理和圖像信息領(lǐng)域,其中信號的“簡單性”是目前研究的熱點(diǎn),尤其是信號的稀疏性表示,即稀疏表示。字典學(xué)習(xí)方法通過優(yōu)化相應(yīng)的字典學(xué)習(xí)代價(jià)函數(shù),獲得對信號進(jìn)行稀疏表示的字典[9]。稀疏表示的模型為:給定字典D=d1,d2,…,dq∈Rp×q,字典D中的每一列dq∈Rp表示為一個(gè)原子,信號Y=y1,y2,…,ys∈Rp×s表示為字典D中若干原子的線性組合:Y≈DX,其中X=x1,x2,…,xs∈Rq×s為信號Y在字典D下的表示系數(shù),由于X矩陣內(nèi)有大量的零元素向量導(dǎo)致每個(gè)列向量都是稀疏的,因此X為稀疏矩陣。本文使用的是K-SVD字典學(xué)習(xí)算法[10-11],與其他字典學(xué)習(xí)算法相比,該算法時(shí)間復(fù)雜度較低,計(jì)算量小,適用性強(qiáng),并且已經(jīng)趨于成熟。
為了將字典學(xué)習(xí)算法融于煤與矸石的圖像特征提取與識別中,把信號Y看作是煤與矸石的圖像信號,字典D通過煤與矸石的樣本圖像學(xué)習(xí)得到,X為煤與矸石的圖像信號Y在學(xué)習(xí)字典D下的表示系數(shù)。求解Y≈DX式中的D和X的過程便為字典學(xué)習(xí)的過程,所對應(yīng)字典學(xué)習(xí)的優(yōu)化問題可表示為:
(1)
式中:Y為煤與矸石的圖像信號矩陣;xi為稀疏矩陣X中某一列向量;‖·‖F(xiàn)為F范數(shù);‖·‖0為L0范數(shù);T0為設(shè)定的初始值,與稀疏度相關(guān)。為求解學(xué)習(xí)過程中的優(yōu)化問題,K-SVD字典學(xué)習(xí)利用稀疏編碼和字典更新兩步的迭代學(xué)習(xí)算法求解固定字典D和稀疏矩陣X,直到所求變量收斂或者達(dá)到設(shè)定的迭代次數(shù)。在稀疏編碼階段,稀疏矩陣X用OMP追蹤算法[12-13]進(jìn)行求解,具體運(yùn)算過程如圖1所示,其中步驟(3)表示的是求殘差r的最相關(guān)列標(biāo)號,步驟(4)是通過最小二乘法獲得關(guān)于每個(gè)樣本圖像的稀疏系數(shù)X,步驟(5)更新殘差r,步驟(6)表示達(dá)到了設(shè)定的迭代次數(shù),迭代終止。第二步是字典更新階段,利用求解到的稀疏矩陣X對字典D進(jìn)行逐列更新,若需要更新字典中的第kk=1,2,…,K列dk,目標(biāo)方程可表示為:
(2)
為提高煤與矸石的識別率,本文在字典初始化時(shí)從煤與矸石圖像的訓(xùn)練樣本中隨機(jī)選擇不同的樣本作為字典原子,與順序選擇樣本相比可以降低運(yùn)算復(fù)雜度,提高算法收斂的速度。然后按照列的順序隨機(jī)進(jìn)行字典原子的更新,最后經(jīng)過多次迭代來選擇最優(yōu)的字典D。
輸入:樣本矩陣Y=[y1,y2,…,ys]∈RP×S,字典D=[d1,d2,…,dq]∈Rp×q
輸出:稀疏矩陣X=[x1,x2,…,xs]∈Rq×s
(1)i=1;
(2)r0=yi,Ω0=?,k=1;
(3)jk=arg max|〈rk-1,dj〉|,j=1,2,…,q,Ωk=Ωk-1∪{jk};
(5)rk=yi-DΩkxk;
圖1稀疏編碼的算法流程
Fig.1 Process of sparse coding algorithm
選取來自山西大同煤礦的大小形狀各異的煤與矸石樣本圖像800幅,其中煤與矸石兩類各400幅,每幅圖像的像素大小均為100×100,灰度級為256,格式為jpg。圖像經(jīng)過預(yù)處理后,隨機(jī)從每類抽取340幅圖像放入訓(xùn)練集,剩下的60幅圖像作為測試集。由于煤與矸石的開采處在地下,采集到的圖像容易受到周圍環(huán)境的影響,本研究只考慮了在相同光照強(qiáng)度因素下的煤與矸石圖像識別,如圖2所示。
圖2 同一光照強(qiáng)度下的煤與矸石樣本圖像Fig.2 Coal and gangue sample images under different illumination conditions
本文的實(shí)驗(yàn)數(shù)據(jù)是在Matlab 7.14.0(R2012a)上測試得到。
為了更好地對煤與矸石的圖像進(jìn)行特征提取,將拍攝到的含有大量干擾信息的彩色圖像轉(zhuǎn)換為灰度圖像,利用PCA算法降維[14-15]。PCA算法是一種常用的數(shù)據(jù)降維方法,是在盡可能代表原始數(shù)據(jù)的前提下,通過線性變換將高維空間中的樣本數(shù)據(jù)投影到低維空間,以去掉圖像中大量的冗余信息,從而提高K-SVD算法的特征提取效率。首先將放入訓(xùn)練集的每一幅樣本圖像隨機(jī)相連形成訓(xùn)練樣本矩陣,經(jīng)PCA算法進(jìn)行降維處理后,對降維后的樣本圖像進(jìn)行歸一化處理,使訓(xùn)練樣本矩陣中每一個(gè)列向量的模都為1。降維處理的投影公式為
B=ETA-M,M=m,m,……,m。
(3)
式中,A為所需要處理的樣本矩陣,E為特征空間,m為樣本圖像的均值向量,將矩陣B進(jìn)行歸一化處理得到的矩陣Y便是所求的煤與矸石的圖像信號矩陣。
預(yù)處理后,利用K-SVD字典學(xué)習(xí)算法將歸一化后的信號矩陣Y進(jìn)行學(xué)習(xí),經(jīng)過兩步的迭代學(xué)習(xí)算法求解出字典D與稀疏矩陣X。字典D實(shí)質(zhì)為經(jīng)過不斷的學(xué)習(xí)與優(yōu)化找到合適的變換空間,而稀疏矩陣X則是信號矩陣Y在變換空間D下的投影。于是信號矩陣Y的每一列向量對應(yīng)著稀疏矩陣X的每一列向量,稀疏矩陣X便作為樣本圖像的特征向量對應(yīng)著訓(xùn)練集的每一幅樣本圖像,故求解稀疏矩陣X的過程即為煤與矸石的圖像特征提取過程。
支持向量機(jī)(SVM)[16]兼顧訓(xùn)練誤差與測試誤差的最小化,具有良好的適應(yīng)性和泛化能力,是識別率最好的二分類器,所以本研究選用SVM對煤與矸石的圖像進(jìn)行二分類。
經(jīng)測試,影響煤與矸石識別率的因素主要有兩個(gè):字典D和分類器的選擇。將著重研究字典D對識別率的影響,通過調(diào)整參數(shù)選擇最優(yōu)的字典D來提高煤與矸石的識別率。
在字典D的列數(shù)為45,稀疏誤差ε=0.045,稀疏度α=0.45情況下,首先進(jìn)行不同字典初始化,在更新方法下經(jīng)過連續(xù)10次測試得到煤與矸石的識別率(圖3)??煽闯?,第6次的識別率最高,選擇這次的識別率作為該參數(shù)條件下煤與矸石圖像的識別率,同時(shí)圖中表現(xiàn)出的識別率波動差距較大,表明字典的初始化與更新對識別效率有較大影響。
圖4則表示在ε=0.039,α=0.27情況下,不同字典列數(shù)對煤與矸石的識別率影響曲線。從圖中可以看出,在字典列數(shù)大于50以后,煤與矸石的識別率隨著字典列數(shù)的不斷增加逐漸下降,而在小于50時(shí)識別率是不斷提高的。同時(shí)隨著字典列數(shù)的增加,程序運(yùn)行時(shí)間也會越長,相應(yīng)地也增大了識別時(shí)間,空間代價(jià)也越大。
圖5給出了字典列數(shù)為40,稀疏度為0.33的條件下,不同稀疏誤差對煤與矸石識別率的影響曲線??煽闯?,煤與矸石的識別率在稀疏誤差為0.035之前一直呈上升趨勢,之后不斷下降,表明稀疏誤差在0.035時(shí)識別效率最高。
圖3 不同字典初始化與更新下的識別率Fig.3 Recognition rate under different dictionary initialization and update
圖4 不同字典列數(shù)下的識別率Fig.4 Recognition rate under different number of dictionaries
圖5 不同稀疏誤差下的識別率Fig.5 Recognition rate under different sparse error
圖6 不同稀疏度下的識別率Fig.6 Recognition rate under different sparsity
圖6給出了在字典列數(shù)為41和稀疏誤差為0.035的情況下,稀疏度對煤與矸石識別率的影響曲線。從圖中可知在稀疏范圍內(nèi),識別率在0.2~0.4間保持平穩(wěn)狀態(tài),在0.35左右達(dá)到峰值,在0.4以后不斷下降。
為了判斷字典參數(shù)的優(yōu)劣對煤與矸石識別率的影響,本文通過調(diào)節(jié)字典參數(shù)測得煤與矸石的樣本識別率以及識別時(shí)間(表1)可以看出,實(shí)驗(yàn)測試的樣本識別率最高可達(dá)97.5%,錯(cuò)誤樣本僅為3,其中識別時(shí)間為2.9 s,字典的初始化與更新、字典列、稀疏誤差和稀疏度對識別率都有較大的影響。表2給出使用字典學(xué)習(xí)和不使用字典學(xué)習(xí)對煤與矸石識別率的影響情況對比,可知使用字典學(xué)習(xí)將煤與矸石的識別率從81.6%提高到97.5%,有效地提取出煤與矸石的圖像特征,達(dá)到更佳的分類識別效果。
為了驗(yàn)證本論文所提方法的效果,在相同樣本情況下與已有幾種方法的最高識別率進(jìn)行了對比測試,基于灰度值的特征提取方式、基于小波變換的特征提取方式和基于灰度共生矩陣的特征提取方式的最高識別率分別為92.5%、94.1%和95.8%,而本文識別方法的最高識別率為97.5%。此外,煤礦中采煤機(jī)平均切割線速度一般約為7 cm/s,2.6 s的識別反應(yīng)時(shí)間滿足實(shí)際煤與矸石的自動分選要求。
表1 不同字典參數(shù)影響下的識別率Tab.1 Recognition rate under different dictionary parameters
表2 是否使用字典學(xué)習(xí)對識別率的影響Tab.2 The effect of dictionary learning on recognition rate
研究了基于字典學(xué)習(xí)的煤與矸石圖像特征識別方法,得到結(jié)論如下:
1) 基于K-SVD字典學(xué)習(xí)算法可以有效地表達(dá)煤與矸石的圖像特征,具有較好的稀疏性,可適用于規(guī)模較大的圖像信息采集;
2) 字典學(xué)習(xí)算法中的字典初始化與更新、字典的列數(shù)、稀疏誤差和稀疏度均會影響煤與矸石的識別率,調(diào)節(jié)好字典中的最優(yōu)參數(shù)可有效提高煤與矸石的識別率;
3) 與其他煤與矸石的圖像特征提取方法相比,基于字典學(xué)習(xí)的紋理特征提取方法有著特征維數(shù)較少,計(jì)算量小的優(yōu)勢,時(shí)間和空間代價(jià)較小,為煤與矸石的自動識別分選提供了一種新的思路和方式,為后續(xù)的分類識別打下良好基礎(chǔ)。
由于條件有限,本文只考慮了同一光照強(qiáng)度對識別效果的影響,下一步將著重研究在實(shí)際開采過程中,受到更多噪聲影響下的煤與矸石識別率提高的問題。
參考文獻(xiàn):
[1]石煥,程宏志,劉萬超.我國選煤技術(shù)現(xiàn)狀及發(fā)展趨勢[J].煤炭科學(xué)技術(shù), 2016,44(6):169-174.
SHI Huan,CHENG Hongzhi,LIU Wanchao.Present status and development trend of China’s coal preparation technology[J].Coal Science and Technology,2016,44(6):169-174.
[2]田原.淺談機(jī)器視覺技術(shù)在煤礦中的應(yīng)用前景[J].工礦自動化,2010,36(5):30-33.
TIAN Yuan.Brief discussion of application prospect of technology of machine vision in coal mine[J].Industry and Mine Automation,2010,36(5):30-33.
[3]于國防,鄒士威,秦聰.圖像灰度信息在煤矸石自動分選中的應(yīng)用研究[J].工礦自動化,2012,38(2):36-39.
YU Guofang,ZOU Shiwei,QIN Cong.Application research of image gray information in automatic separation of coal and tangue[J].Industry and Mine Automation,2012,38(2):36-39.
[4]王祥瑞.煤礦矸石自動分選中圖像處理與識別技術(shù)的應(yīng)用[J].煤炭技術(shù),2012,31(8):120-121.
WANG Xiangrui.Application of image processing and recognition technology in waste automatic separation of coal mine[J].Coal Technology,2012,31(8):120-121.
[5]何敏,王培培,蔣慧慧.基于SVM和紋理的煤和煤矸石自動識別[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33(3):1117-1121.
HE Min,WANG Peipei,JIANG Huihui.Recognition of coal and stone based on SVM and texture[J].Computer Engineering and Design,2012,33(3):1117-1121.
[6]廖陽陽.基于BP網(wǎng)絡(luò)和圖像處理的煤矸石的動態(tài)識別[J].工業(yè)控制計(jì)算機(jī),2015(7):119-122.
LIAO Yangyang.Recognition of coal and stone based on BP[J].Industrial Control Computer,2015(7):119-122.
[7]WEI C,MIGUEL R D R.Dictionary learning with optimized projection design for compressive sensing applications[J].IEEE Signal Processing Letters,2013,20(10):992-995.
[8]SHI J,WANG X H.Image super-resolution reconstruction based on improved K-SVD dictionary-learning[J]. Acta Electronica Sinica,2013,41(5):997-1000.
[9]練秋生,石保順,陳書貞.字典學(xué)習(xí)模型、算法及其應(yīng)用研究進(jìn)展[J].自動化學(xué)報(bào),2015,41(2):240-260.
LIAN Qiusheng,SHI Baoshun,CHEN Shunzhen.Research advances on dictionary learning models,algorithms and applications[J]. Acta Auto matica Sinica,2015,41(2):240-260.
[10]JIANG Z L,LIN Z,DAVIS L S.Label consistent K-SVD:Learning a discriminative dictionary for recognition[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2013,35(11):2651-2664.
[11]劉雅莉,馬杰,王曉云,等.一種改進(jìn)的K-SVD字典學(xué)習(xí)算法[J].河北工業(yè)大學(xué)學(xué)報(bào),2016,45(2):1-8.
LIU Yali,MA Jie,WANG Xiaoyun,et al.An improved K-SVD dictionary learning algorithm[J].Journal of Hebei University of Technology,2016,45(2):1-8.
[12]LI J,WANG Q,SHEN Y.Near optimal condition of OMP algorithm in recovering sparse signal from noisy measurement[J].Journal of Systems Engineering and Electronics,2014,25(4):547-553.
[13]李少東,裴文炯,楊軍,等.貝葉斯模型下的OMP重構(gòu)算法及應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2015,37(2):246-252.
LI Shaodong,PEI Wenjiong,YANG Jun,et al.OMP reconstruction algorithm via Bayesian model and its application[J].Systems Engineering and Electronics,2015,37(2):246-252.
[14]FOUZI H,MOHAMED N N,HAZEM N N. Enhanced monitoring using PCA-based GLR fault detection and multiscale filtering[C]//IEEE Symposium on Computational Intelligence in Control and Automation.2013:1-8.
[15]胡嘉良,高玉超,余繼峰, 等.基于PCA-BP神經(jīng)網(wǎng)絡(luò)的非常規(guī)儲層巖性識別研究[J].山東科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,35(5):9-16.
HU Jialiang,GAO Yuchao,YU Jifeng,et al.Lithology identification of unconventional reservoirs based on PCA-BP neural network[J].Journal of Shandong University of Science and Technology(Natural Science),2016,35(5):9-16.
[16]丁世飛,齊丙娟,譚紅艷.支持向量機(jī)理論與算法研究綜述[J].電子科技大學(xué)學(xué)報(bào),2011,40(1):2-10.
DING Shifei,QI Bingjuan,TAN Hongyan.An overview on theory and algorithm of support vector machines[J].Journal of University of Electronic Science and Technology of China,2011,40(1):2-10.