趙君君, 王小鵬, 渠燕紅
(蘭州交通大學 電子與信息工程學院,甘肅 蘭州 730070)
基于分水嶺和區(qū)域面積加權的粘連枸杞分級方法*
趙君君, 王小鵬, 渠燕紅
(蘭州交通大學 電子與信息工程學院,甘肅 蘭州 730070)
針對枸杞分級過程中出現(xiàn)的粘連枸杞分級效率不高、準確性低的缺點,提出了一種基于形態(tài)學分水嶺和區(qū)域面積加權的粘連枸杞分級方法。對粘連的枸杞圖像進行形態(tài)學預處理消除枸杞烘干晾曬過程中產(chǎn)生的細小噪聲,在保持區(qū)域輪廓位置不變的同時,盡可能地消除不規(guī)則邊緣;運用標記極小值的分水嶺算法分割圖像,依據(jù)枸杞紅色分量的分布剔除霉變顆粒,對正常枸杞二值圖像運用區(qū)域面積標記算法掃描標定各個目標獲取顆粒的面積,并用霍特林算法獲取顆粒的長寬比;以長寬比作為面積的權值對面積加權修正后進行聚類分析,分成3類。實驗結果表明:該方法能夠較快速、準確地對不同大小的粘連枸杞顆粒進行分類。
粘連枸杞; 形態(tài)學分水嶺; 區(qū)域面積加權; 聚類分析; 枸杞分級
傳統(tǒng)枸杞分級主要采用人工挑揀方式,人工判別枸杞的大小、顏色及表面缺陷,速度慢、效率低、可靠性不高,影響了枸杞的價格和銷售,不符合精品外運的發(fā)展要求[1]。隨著自動化技術的發(fā)展,國內外研究了基于機器視覺的農(nóng)產(chǎn)品分級方法,文獻[2,3]針對非粘連紅棗、大米的分級,通過設計硬件系統(tǒng)或者提取目標的大小、形狀等特征參數(shù)建立相應的模型進行分級,對非粘連農(nóng)產(chǎn)品的分級效果較好。文獻[4]提出了基于機器視覺的多鉚釘自動檢測算法,提取閾值分割后鉚釘?shù)妮喞ㄟ^計算鉚釘輪廓各點在兩側支撐區(qū)間內曲率的方法識別鉚釘。文獻[5]提出了基于機器視覺的枸杞分級方法,對非粘連枸杞的色澤特征和大小特征進行兩級分類,第一級依枸杞的色澤特征分成2類,第二級依枸杞的大小特征分成3類。針對粘連枸杞進行分級,先通過色澤特征剔除霉變顆粒提升分類的效率,然后標定正常顆粒的面積和長寬比,并對枸杞顆粒面積進行加權修正,加權值為對應枸杞顆粒的長寬比。CCD圖像傳感器采集粘連枸杞圖像先經(jīng)過預處理、標記極小值的分水嶺算法分割后提取枸杞圖像RGB的R分量,根據(jù)R分量的分布剔除霉變顆粒、運用區(qū)域面積標記算法和霍特林算法標定顆粒面積及長寬比;最后以枸杞顆粒的長寬比作為面積的權值對面積進行修正,對修正后的面積運用k-means算法進行聚類分析,實現(xiàn)粘連枸杞的分級。
粘連枸杞分級主要分為2個部分,如圖1所示,即粘連枸杞圖像分割和粘連枸杞聚類。粘連枸杞圖像分割可分為預處理和圖像分割;粘連枸杞聚類可分為特征提取、區(qū)域面積及長寬比標定和基于k-means面積加權聚類。1)對粘連枸杞圖像預處理消除細小噪聲和不規(guī)則邊緣;2)利用標記極小值的分水嶺算法分割粘連圖像;3)提取分割圖像單個顆粒的R分量,依據(jù)R分量的分布剔除霉變顆粒;4)運用區(qū)域面積標定算法和霍特林算法標定分割區(qū)域的面積及長寬比,以獲取的長寬比作為面積的權值運用k-means聚類算法對加權面積進行聚類分析。
圖1 粘連枸杞分級流程
2.1 預處理
枸杞在采摘晾曬烘干過程中容易受到光照、灰塵等因素的影響,導致枸杞顆粒內部出現(xiàn)灰點,顆粒邊緣產(chǎn)生不規(guī)則細節(jié)等噪聲,不利于二值圖像面積和長寬比的準確標定。為此,首先對CCD采集的粘連枸杞圖像進行預處理,灰度化后作高帽變換增強灰度圖像的對比度如圖2(a)所示
I=0.098 9fr+0.257 0fg+0.214 0fb
(1)
式中fr,fg和fb分別為粘連枸杞彩色枸杞圖像RGB分量;I為灰度化之后的圖像。然后采用OTSU法(即大律法或最大類間方差法),對高帽變換后的圖像作二值化處理,二值化后枸杞圖像中存在由于表面紋理和灰點所產(chǎn)生的孔洞問題給后續(xù)局部極小值的標記產(chǎn)生較大影響,導致分水嶺分割時嚴重的過分割,如圖2(b)所示。采用3×3的圓盤型結構元素作形態(tài)學面積開運算填充顆粒內部的孔洞,并用5×5窗口的中值濾波法平滑顆粒邊緣如圖2(c)所示。
圖2 粘連枸杞圖像預處理
2.2 圖像分割
粘連枸杞的分割對后續(xù)單個枸杞面積和長寬比的標定、分類至關重要。與文獻[6]和文獻[7]的分割方法相對比,標記極小值的分水嶺算法[8,9]不僅能分割枸杞目標與背景,且能分割粘連枸杞。針對圖2(c)運用bwareaopen函數(shù)先去除非粘連的顆粒并標記粘連顆粒的連通域,然后對該連通域進行歐氏距離變換;再標記變換后深局部最小區(qū)域位置;最后對深局部最小區(qū)域的距離變換運用標記極小值的分水嶺算法分割,分割過程如圖3(a)~(f)所示。
圖3 粘連枸杞分割過程
3.1 特征選擇
大小和色澤特征是枸杞分級的主要依據(jù)[10]。合并非粘連枸杞顆粒后,圖像由單個的連通區(qū)域組成,每個連通區(qū)域為單個枸杞顆粒,依次掃描每個連通區(qū)域提取單個枸杞RGB的R分量。選取正常枸杞顆粒和發(fā)生霉變的顆粒各50顆,分別繪制正常顆粒和發(fā)生霉變顆粒的R分布直方圖如圖4(a),(b)所示,橫軸為R分量0~255等級,縱軸為每個等級出現(xiàn)的平均次數(shù)??梢钥闯觯赫nw粒的R分量分布集中在75~150之間,而霉變顆粒的R分量相對分散分布在0~150之間。因此,根據(jù)枸杞R分量的分布對霉變顆粒進行標記,用含有霉變顆粒的圖像減去標記的霉變顆粒得到正常枸杞顆粒圖像。如圖4(c)為含有霉變顆粒的圖像,圖4(d)為剔除霉變顆粒后的圖像??紤]到枸杞本身的形狀特點,將分割顆粒區(qū)域的面積和長寬比作為衡量枸杞大小的特征參數(shù)。枸杞顆粒面積的測量采用區(qū)域面積標記算法,逐行、列,從上到下,從左到右掃描二值圖像,每次掃描對單個顆粒進行面積標定,如圖5(a),(b)所示為標定2副枸杞顆粒的面積;獲取單個枸杞顆粒的長寬比時,首先需要獲取枸杞的邊緣坐標,選用bwboundaries函數(shù)獲取枸杞的邊緣和邊緣像素坐標,然后運用霍特林變換[11]獲取枸杞的最小外接矩形,進而得到枸杞的長寬比。部分枸杞標定的面積及長、寬比,如表1所示。
3.2 區(qū)域面積標定
設置一個標記目標區(qū)域的標記符數(shù)組flag,初始值為1;設置一個標記顆粒個數(shù)的變量final,初始值為0。
1)以4鄰域方式掃描二值圖像當前像素的左、左上、上及右上像素,并對連通域用當前flag值進行標記,每次標記一個連通域,flag值加1。
圖4 R分布剔除霉變枸杞
圖5 枸杞顆粒面積標記
圖像a標號面積長寬比圖像b標號面積長寬比114542.16113922.21213932.24218112.17313741.78313772.01416321.47415091.14515311.5354341.64616741.79614352.29716651.69712212.14815111.12815341.15917632.23915841.091015821.791016101.261116591.621115141.34123431.05123861.18
2)判斷同一目標是否有不同標記符,如果有,則存入等價數(shù)組equal[12];否則,回到步驟(1)繼續(xù)掃描。
3)設置一個標號矩陣label保存所有的標記符,同時flag值減1。
4)掃描等價數(shù)組equal,檢測并替換等價標記符獲得顆??倲?shù)final,根據(jù)final值重新掃描標號矩陣label,替換等價標號。
5)根據(jù)final值遍歷所有已標記的連通域,并對每個連通域重新進行標號,更新標號矩陣label,并統(tǒng)計標號區(qū)域的像素數(shù)作為相應的枸杞面積。
3.3 獲取區(qū)域長寬比
按照各單連通區(qū)域的標號依次獲取枸杞顆粒的邊緣坐標,每個邊緣像素點作為一個二維向量Xi=[ai,bi]T,i=1,2,…,n,其中,n為邊緣像素點的個數(shù)。根據(jù)Xi計算枸杞邊緣像素坐標的均值向量mx和協(xié)方差矩陣cx,即
(2)
(3)
由于cx是2×2階的實對稱矩陣,故特征向量只有2個,特征向量矩陣A=(e1,e2)T,用式(3)進行霍特林變換得到新的坐標系向量
Yi=A(Xi-mx),i=1,2,…,n
(4)
該坐標系以枸杞顆粒的質心(均值向量坐標mx)為原點,以最大特征值對應的特征向量e1,e2的方向作為新坐標系橫軸和縱軸方向,坐標軸旋轉變換后得到枸杞顆粒最小外接矩形的長寬比
(5)
式中 xmax和xmin為新坐標系下枸杞顆粒邊緣像素點橫坐標的最大值和最小值;ymax和ymin為縱坐標的最大值和最小值。
3.4 基于k-means的面積加權聚類
k-means動態(tài)聚類算法[13]是通過迭代尋找c個聚類的一種劃分方案,用c個聚類的均值代表相應各類樣本時所得到的總體誤差最小。若Ni是第i類Γi中的面積及長寬比的樣本個數(shù),x為面積,k為長寬比,則樣本均值ei可以由面積x以k加權獲得
(6)
采用基于歐氏距離的最小距離分類器,基本思想是根據(jù)訓練集按照算術平均生成代表該類的中心向量e1,e2,…,ec,c為類別數(shù)目。對于每一個待分類樣本x,加權后計算其與類中心向量之間的距離,最后判定x屬于與之距離最近的類。距離計算采用歐氏距離
Di=‖k·x-ei‖2,i=1,2,…,c
(7)
將Γi中各樣本x的加權與均值ei的誤差平方和對所有類相加后為
(8)
式中Je為誤差平方和準則,度量了c個樣本子集所產(chǎn)生的總的誤差平方,使得Je最小的聚類是誤差平方和準則下的最優(yōu)分類。k-means算法步驟如下:
1)初始劃分3個聚類,計算第i類樣本Γi的ei及Je,i=1,2,3;
2)任取一個樣本x,加權后計算離它最近的聚類中心ei,并將其歸到所對應的聚類ci;
3)更新聚類中心ei及Je,i=1,2,3;
4)迭代計算Je至收斂,則停止;否則,轉步驟(2)。
為了驗證對粘連枸杞分級的有效性,運用Matlab對308顆去除霉變顆粒的樣本枸杞面積加權后進行聚類分析,由Silhouette函數(shù)繪制聚類輪廓圖如圖6(a)~(c)所示,相對分成2類和4類而言,分成3類時類內相似度較高,而類間相似度較低,再由聚類散點圖,如圖7所示,分成3類時各類別較集中,類間相似度較低,效果最佳,針對308顆樣本枸杞訓練所得分類基準如表2所示。選用1 540顆枸杞(約500 g)作面積和長、寬比標定,并對加權面積重復4次作聚類分析,與采用人工挑揀的方法進行對比,實驗結果如表3所示,本文方法平均每次耗時約為7.95 s,人工挑揀平均每次耗時約為300 s;同樣,對1 540顆枸杞運用本文方法進行聚類分析分成3類準確性約為96 %,人工挑揀的準確性約為85 %。實驗結果表明:該方法相比人工分類能更快速、準確地對粘連枸杞進行分類。
圖6 聚類分析輪廓
圖7 k-means聚類結果
加權面積類別分類基準范圍1類≥25002類≥18003類<1800
表3 本文方法與人工挑揀方式對比
提出了基于形態(tài)學分水嶺和區(qū)域面積加權的粘連枸杞分級方法,先運用標記極小值的分水嶺算法對經(jīng)過預處理除噪后的粘連枸杞圖像進行分割,考慮到分類效率的提升,選取枸杞顆粒圖像的R分量,根據(jù)R分量的分布剔除霉變顆粒減少分類的數(shù)量;然后以面積和長寬比為特征參數(shù),運用區(qū)域面積標記算法和霍特林算法標定各個正常顆粒面積大小及長寬比,將面積和長寬比特征結合在一起,以長寬比作為面積的權值對面積進行修正,最后運用k-means動態(tài)聚類算法對加權后的面積進行聚類分析,實現(xiàn)了粘連枸杞的分割到分類的完全自動化。實驗結果表明:該方法能夠較快速準確地對粘連枸杞進行分類。
[1] 崔 萍,汪澤鵬.寧夏枸杞產(chǎn)業(yè)發(fā)展現(xiàn)狀及對策[J].北方果樹,2008(5):36-37.
[2] 許 敏,馬 鉞,陳 帥.基于計算機視覺的紅棗形狀識別方法研究[J].傳感器與微系統(tǒng),2013,32(4):23-26.
[3] Jain N K,Khanna S O,Jain K R.Development of a classification system for quality evaluation of oryza sativa L(rice)using computer vision[C]∥2014 International Conference on Communication Systems and Network Technologies(CSNT).2014:1088-1092.
[4] 郭全民,胡 輝.基于機器視覺的多鉚釘自動檢測算法研究[J].傳感器與微系統(tǒng),2013,32(4):48-50.
[5] 王履程,譚筠梅,王小鵬,等.基于機器視覺的枸杞分級方法[J].計算機工程與應用,2013,49(24):16-18.
[6] 陳亞軍,劉 丁,梁軍利,等.一種無須預指定分割區(qū)域數(shù)的自適應多閾值圖像分割方法[J].模式識別與人工智能,2014,27(11):993-1004.
[7] 柯 衛(wèi),王宏力,袁 宇,等.基于區(qū)域生長法的星圖中星的提取方法[J].傳感器與微系統(tǒng),2015,34(12):57-58.
[8] 岡薩雷斯.數(shù)字圖像處理[M].阮秋琦,譯.3版.北京:電子工業(yè)出版社,2011.
[9] 高 麗,楊樹元,李海強.一種基于標記的分水嶺圖像分割新算法[J].中國圖象圖形學報,2007,12(6):1025-1032.
[10] 林 楠,楊宗學,藺海明,等.不同產(chǎn)地枸杞質量的比較研究[J].甘肅農(nóng)業(yè)大學學報,2013,48(2):34-39.
[11] 劉瓔瑛,丁為民,陳建偉,等.基于霍特林變換的稻米彩色圖像粒形檢測算法[J].中國水稻科學,2010,24(3):325-328.
[12] 劉奇琦,龔曉峰.一種二值圖像連通區(qū)域標記的新方法[J].計算機工程與應用,2012,48(11):178-180.
[13] 安計勇,高貴閣,史志強,等.一種改進的K均值文本聚類算法[J].傳感器與微系統(tǒng),2015,34(5):130-133.
Method of classification for touching wolfberry based on watershed and regional area weighted*
ZHAO Jun-jun, WANG Xiao-peng, Qü Yan-hong
(School of Electronic and Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China)
Aiming at problem of poor efficiency and low accuracy of manual operation of sorting the touching wolfberry,a touching wolfberry classification method based on morphological watershed and regional area weighted is proposed.Morphological operation is used for touching wolfberry image pre-processing to eliminate noise interference caused by drying or basking,remain the position of the region outline unchanged while eliminating irregular edges as much as possible;the watershed algorithm is used for image segmentation that has been marked the minimum region.According to the red(R)component distribution of the single wolfberry in the image,the mildew wolfberry particles will be removed,and through area mark algorithm,particles area of the normal binary wolfberry image will be labeled,and using Hotelling algorithm to obtain length-width ratio of particles;using the length-width ratio as weighting of area for cluster analysis after weighting correction,it is divided into three kinds.The experimental results show that this method can classify different sizes of touching wolfberry more quickly and accurately.
touching wolfberry; morphological watershed; regional area weighted; cluster analysis; wolfberry classification
10.13873/J.1000—9787(2017)09—0049—04
2016—09—26
國家自然科學基金資助項目(61261029)
TP 391.4
A
1000—9787(2017)09—0049—04
趙君君(1987-),男,碩士研究生,主要研究方向為數(shù)字圖像處理。
王小鵬(1969-),男,通訊作者,博士,教授,主要從事數(shù)字圖像處理,多媒體技術以及虛擬現(xiàn)實技術等研究工作,E-mail:zjjsincerely@foxmail.com。