何 敏,王培培,蔣慧慧
(上海海事大學 電氣自動化系,上海200135)
煤炭是我國的主要能源,資源極為豐富,對國民經濟的發(fā)展起著非常重要的作用。但是開采結果中除了煤還伴隨有大量的煤矸石。煤矸石的主要成分是巖石,其密度大、灰分高、發(fā)熱量小,如果工業(yè)生產用煤中混合煤矸石,將嚴重影響燃燒質量及效率。因此,煤矸石分選是煤生產過程中不可缺少的環(huán)節(jié)[1]。
傳統的煤和煤矸石分選主要有人工和機械分選法。人工手選由工人將煤矸石從煤塊中挑選出來,該方法效率低下,且工人勞動強度比較大,工作環(huán)境惡劣。機械選擇則一般采用重介法,跳汰等方法,但缺點是設備龐大,復雜,環(huán)境污染嚴重[2]。國內外都對煤矸石分選做了大量研究工作,如人工γ射線、機械振動、無線電探測、紅外反射等方法,盡管這些方法可靠,但需要專業(yè)知識和設備,不易實現。
計算機和高性能成像設備的普及使基于圖像的分選方法變得簡單易實現。通常煤塊的顏色比較黑,而矸石的顏色比較淡,因此煤和矸石的灰度分布和峰值也有所不同。可見,煤和煤矸石的灰度和紋理分析將有助于它們的識別,例如,可將樣品煤和煤矸石的灰度和紋理值作為標準存在計算機中,識別時將實際值與之比較,就可以將煤和矸石區(qū)分出來。但灰度和紋理分析能提供多個特征參數,哪些特征參數有助于提高識別成功率,以及如何整合這些特征參數以完成圖像的自動識別過程,正是作者的研究重點。
實驗樣本來自山西,包括兩種煤 (分別稱之為有光澤煤和無光澤煤)和一種煤矸石樣本,如圖1所示。圖像采集在自然光照條件下使用DH-HN2000FC獲取。
圖1 煤和矸石原始圖像
彩色圖像分別包含了圖像的R,G,B顏色的信息,因此,在圖像處理之前需要將原始圖像轉化成灰度圖像。
本文采用Otsu法獲自動獲取圖像的閾值,實現圖像的分割和二值化。由于二值圖像中有小顆粒雜質以及一些孔洞存在,因此還需要對二值圖像進行數學形態(tài)運算。通過膨脹、腐蝕、開啟,閉合等運算,可以把圖像的小缺口,孔填上,把比結構元素小的突刺濾掉。圖2(a)為煤矸石的原始圖像,圖 (b)為運用Otus法獲得的二值圖像,圖(c)為處理后的二值圖像,圖 (d)為將原圖與二值圖像匹配后的圖像。下文中的圖像灰度分析和紋理分析主要是基于圖 (d)來進行的。
圖2 圖像預處理
灰度直方圖反映圖像中各灰度級與各灰度級像素出現頻率之間的關系。它是圖像的重要特征之一,能給出該幅圖像的概貌描述。在實際獲取的圖像中,無光澤煤看起來比較黑,灰度值比較低,有光澤煤塊由于在光的照射下會反光,圖像中會有發(fā)光點,而發(fā)光點的灰度值比較高,而煤矸石的灰度值一般比較高。因此煤和煤矸石的灰度直方圖可以直觀的反映它們的灰度范圍和頻率分布。其中,均值和方差是兩個常用的與灰度有關的特征參數。假設煤或煤矸石圖像為L級灰度圖,灰度為b的像素點有hb個,圖像區(qū)域包含的總像素,則煤或矸石圖像的均值μ和方差σ2為:
均值
方差
紋理是一種反映一個區(qū)域中像素灰度級的空間分布的屬性。分析過程主要采用由Haralick定義的灰度共生矩陣(CM),它是描述紋理的一種常用的統計方法?;叶裙采仃嘝(i,j,δ,θ)包含了圖像關于方向、相鄰間隔、變化幅度的綜合信息。由煤和矸石的灰度共生矩陣,可以提取出二階矩、對比度、相關、熵、逆矩差等特征參數值來定量描述圖像紋理特性[12-14]。如:二階矩反映了圖像灰度分布均勻程度和紋理粗細程度,對比度可以理解為圖像的清晰度。相關是用來衡量灰度共生矩陣在行或列方向上的相似度。熵反映圖像中紋理的復雜程度和非均勻度。其計算公式如下:
二階矩
對比度
相關
熵
逆矩差
其中
由于灰度共生矩陣反映的是灰度概率,因此圖2(d)所示的圖像中煤矸石周圍的背景圖像會對灰度共生矩陣產生影響。為了減小影響,直接截取圖2(d)中的煤或煤矸石圖像進行灰度共生矩陣分析。對一幅圖像可以計算出0°、45°、90°、135°的灰度共生矩陣,因此,也可以計算出來4個方向的二階矩、對比度等特性。此外,為消除方向的影響,作者將計算出的各個方向下的同一特征的平均值作為這幅圖像此特性的值。
如圖3所示分別為無光澤煤、有光澤煤和煤矸石的灰度直方圖。從圖中可以看出無光澤煤的灰度全部集中在20-50之間,煤矸石集中在40-100之間,而有光澤的煤灰度分布在40-255之間,并在灰度為90時達到峰值。由此可見,我們可以通過觀察灰度直方圖直接對兩種煤和煤矸石識別,但這種識別方法還不能被稱為自動識別。
圖3 煤和矸石直方圖
圖4 為兩種煤和矸石灰度平均值和均方差的分布圖。從圖中可以看出,有光澤煤的灰度均值范圍為80-110,無光澤煤為40-60,煤矸石為:60-80。而有光澤煤的灰色均方差范圍為38-50,無光澤煤為30-40,矸石為20-30??梢娒汉晚肥幕叶染档牟罹喾秶然叶确讲畲?。所以灰度均值更能反映出煤和兩種煤矸石的灰度特性。
圖4 圖像灰度均值和均方差
圖5為圖像的灰度共生矩陣最大值、特征能量、逆矩差的對比圖。圖6為特征相關、熵、慣性矩的對比圖。從圖中可以看出,有光澤的煤的逆矩差近似0.83,而無光澤煤和煤矸石的逆矩差近似0.97,差距范圍很小,不能反映煤和兩種煤矸石的不同點。而圖中其它5種特征值均范圍區(qū)分較大。如:有光澤煤的相關的范圍為0.05-0.15,無光澤煤的范圍為3.5-5.5,煤矸石為1.0-2.0。
因此,灰度均值、灰度共生矩陣的最大值、能量、相關、熵和慣性矩的范圍差距較大,可以利用這些特征值之間的顯著差異可以識別出有光澤煤、無光澤煤和煤矸石。而無光澤煤和煤矸石的灰度均方差、逆矩差的值差距較小,所以利用逆矩差識別將會引起誤差。
灰度均值、灰度共生矩陣的最大值等特征值雖然能被用來識別出煤或矸石,但考慮到實際情況中煤以及煤矸石往往種類眾多,不同種類圖像的特征值也有較大的差別,如果在識別過程中僅僅采用一個特征參數,往往識別成功率不高,而如果采用上文中的某幾個特征參數,識別成功率提高了,但同時識別所需時間增加了,且需要較多的人為操作和判斷。
因此為了在實際生產過程中為提高識別率以及實現自動識別,有必要采取新的方法融合有效特征參數。
支持向量機 (support vector machine,SVM)是Cortes和Vapnik與1995年首先提出的。它是建立在統計學習理論的VC維理論和結構風險最小原理基礎上的,根據有限的樣本信息在模型的復雜性 (即對待定訓練樣本的學習精度)和學習能力 (即無錯誤的識別任意樣本的能力)之間尋求最佳折中,以期獲得最好的推廣能力[17-18]。由于支持向量機主要是正對有限樣本,且本文中的實驗樣本種類較少,所以作者選擇利用支持向量機來完成圖像分類,以期得到在有限的圖像樣本條件下實現煤和矸石自動識別的目的。支持向量機分類器的實現利用了LIBSVM工具包,數據處理和訓練方法如下。
在本文的第二部分中,經過灰度和紋理分析,作者已發(fā)現煤和矸石的灰度平均值、灰度共生矩陣最大值、能量、相關、熵和慣性矩值可以作為煤和矸石識別的特征參數,因此這里也就被選擇作為訓練的參數。由于各特征值的范圍不同,為不免大數值引起的計算問題,訓練SVM前首先須將特征數據映射到0-1范圍內。
訓練時將煤矸石、無光澤煤、有光澤煤的標號設定為[0,1,2]。訓練時最重要的就是確定核函數,核函數選擇直接關系到分類的效果。RBF核能非線性地將樣本數據映射到高維空間,且參數少,復雜度低,計算容易,因此本文選用RBF核。
實驗中選擇兩種煤和矸石共36張圖像作為樣本來訓練SVM,用30張圖像作為測試樣本,訓練結果顯示支持向量機能正確識別29張圖片,識別正確率為96.7%。由此可見,作者選取的6個特征參數以及在這些參數基礎上建立起來的支持向量機能較好地完成實驗樣本圖像的自動識別。
近年來,基于視覺的物體識別需求急劇增長,并能夠提高效率,保護環(huán)境。本文以煤矸石識別為應用背景,首先在通過對獲取的圖像進行一定順序的圖像預處理后,研究出能有效識別的各種特征,最后利用SVM和有效的特征實現了煤矸石圖像的快速準確識別。但同時也因注意到,本文所取的實驗樣本種類及數量均有限,故作者的實驗結果未必適用于所有的煤和矸石識別情況。增加樣本圖像的數量和樣本來源的種類,以此來提高支持向量機自動識別的準確率以及普遍性,這也將是作者今后的工作方向之一。
[1]ZHOU Shaolei,SHAN Zhongjian,DENG Xiaoyang.Status of coal preparation in China and trend of development [J].China Coal,2006,32 (11):11-14 (in Chinese). [周少雷,單忠健,鄧曉陽.中國選煤業(yè)現狀與發(fā)展趨勢 [J].中國煤炭,2006,32 (11):11-14.]
[2]YAN Junxu,LI Ye.Application of digital image processing technology in the separation of coal and gangue [J].Sichuan Ordnance Journal,2009,30 (11):16-20 (in Chinese). [閏俊旭,李曄.圖像處理在煤矸石識別系統中的應用 [J].四川兵工學報,2009,30 (11):16-20.]
[3]MA Xianmin,JIANG yong.Digital image processing method of coal gangues [J].Colliery Mechanical and Trial Technology,2004,31 (5):9-11 (in Chinese).[馬憲民,蔣勇.煤與矸石識別的數字圖像處理方法探討 [J].煤礦機電,2004,31(5):9-11.]
[4]YAO min.Digital image processing [M].Beijing:China Machine Press,2006:78-96 (in Chinese). [姚敏.數字圖像處理 [M].北京:機械工業(yè)出版社,2006:78-96.]
[5]SONG Jinling.Study on automatic separation of coal and gangue based on image processing techniques [J].Journal of China Coal Society,2004,41 (10):142-145 (in Chinese).[宋金玲.基于圖像處理技術的煤和矸石自動分選研究 [J].煤炭學報,2004,41 (10):142-145.]
[6]WU Dongyang,YE Ning,SU Xiaoqing.Wood defect recognition based on GLCM and clustering algorithm [J].Computer and Digital Engineering,2005,37 (11):38-41 (in Chinese).[吳東洋,業(yè)寧,蘇小青.基于灰度共生矩陣和聚類方法的木材缺陷識 別 [J].計算機與數 字工程,2005,37 (11):38-41.]
[7]CAI Yunxiang,XUE Shiqiang,ZHUO Zhiyong,et al.A method based on image processing for background classifying[J].Electro-Optic Technology Application,2010,25 (4):81-84(in Chinese).[蔡云驤,薛士強,周志勇,等.一種基于圖像處理的背景分類方法 [J].光電技術應用,2010,25(4):81-84.]
[8]Chris Ebey Honeycutt,Roy Plotnick.Image analysis techniques and gray-level co-occurrence matrices(GLCM)for calculating Bioturbation indices and characterizing biogenic sedimentary structures [J].Computers and Geosciences,2008,34(11):1461-1472.
[9]Hobson M,Carter R M,YAN Y.Characterisation and identification of rice grains through digital image analysis [C].IEEEInstrumentation Measurement and Technology Conference,2007:1-3.
[10]FAN Lihong,FU Li,YANG Yong.Analysis of texture feature extracted by gray level co-occurrence matrix [J].Computer Application,2009,29 (4):1018-1021 (in Chinese).[范麗紅,付麗,楊勇.灰度共生矩陣提取紋理特征的實驗結果分析 [J].計算機應用,2009,29 (4):1018-1021.]
[11]RUAN Jiuzhong,ZHOU Chenbo,YANG Guohua.Image texture based on co-occurrence matrix for non-planar surface roughness[J].Optics and Optoelectronic Technology,2008,6 (6):36-40 (in Chinese). [阮九忠,周晨波,楊國華.基于灰度共生矩陣的非平面表面粗糙的圖像紋理研究 [J].光學與光電技術,2008,6 (6):36-40.]
[12]BAI Xuebing,WANG Keqi,WANG hui.Research on the classification of wood texture based on gray level co-occurrence matrix [J].Journal of Harbin Institute of Technology,2005,37 (12):1667-1670 (in Chinese).[白雪冰,王克奇,王輝.基于灰度共生矩陣的木材紋理分類方法的研究 [J].哈爾濱工業(yè)大學學報,2005,37 (12):1667-1670.]
[13]David M Hobson,Robert M Carter,Yong Yanl,et al.Differentiation between coal and stone through image analysis of texture features[C].IEEE International Workshop on Imaging Systems and Techniques,2007:1-4.
[14]CHEN Quansheng,ZHAO Jiewen,FANG C H,et al.Feasibility study on identification of green,black and oolong teas using near-infrared reflectance spectroscopy based on support vector machine(SVM)[J].Spectrochimica Acta Part A,2007,66 (3):568-574.
[15]QI Hengnian.Support vector machines and application research overview [J].Computer Engineering,2004,30 (4):6-9(in Chinese).[祁享年.支持向量機及其應用研究綜述[J].計算機工程,2004,30 (4):6-9.]
[16]MA Huaizhi,WU Qingxiao,HAO Yingming.Steelmaking materials recognition based on lifting wavelet transform and SVM classification [J].Computer Engineering and Design,2010,31 (18):4093-4096 (in Chinese).[馬懷志,吳清瀟,郝穎明.基于提升小波和SVM分類的煉鋼物料識別 [J].計算機工程與設計,2010,31 (18):4093-4096.]
[17]Monica Marcuzzo,Pedro Quelhas,Ana Campilho.Automated Arabidopsis plant root cell segmentation based on SVM classification and region merging [J].Computers In Biology and Medicine,2009,39 (9):785-793.
[18]JIANG yuan.Research on target recognition for SAR image based on Contourlet transform and SVM [J].Information technology,2010,34 (11):105-110 (in Chinese). [蔣媛.基于Contourlet變換和SVM的SAR圖像目標識別 [J].信息技術,2010,34 (11):105-110.]