李小林 周蓬勃 周明全 黃世國*
1(福建農(nóng)林大學(xué)計算機(jī)與信息學(xué)院 福建 福州 350002)2(北京師范大學(xué)信息科學(xué)與技術(shù)學(xué)院 北京 100875)
?
基于可區(qū)分二進(jìn)制局部模式特征的蛾類昆蟲識別
李小林1周蓬勃2周明全2黃世國1*
1(福建農(nóng)林大學(xué)計算機(jī)與信息學(xué)院福建 福州 350002)2(北京師范大學(xué)信息科學(xué)與技術(shù)學(xué)院北京 100875)
蛾類昆蟲多為農(nóng)業(yè)害蟲,自動識別蛾類昆蟲種類對蟲害預(yù)測預(yù)報意義重大。針對現(xiàn)有昆蟲自動識別方法集中在目以上層次昆蟲識別難以實現(xiàn)目內(nèi)昆蟲識別,提出一種基于紋理特征的蛾類昆蟲識別方法。應(yīng)用一種改進(jìn)的局部二進(jìn)制模式提取昆蟲圖像特征,對提取得到的特征矩陣按照蛾類昆蟲類別抽取本質(zhì)維數(shù),最后用KNN算法實現(xiàn)蛾類昆蟲識別。實驗結(jié)果表明:可區(qū)分CLBP能夠?qū)ハx原始圖像直接提取特征并獲得優(yōu)異的識別性能,同時,能夠有效降低特征矩陣的維數(shù),從而縮小存儲空間,降低相似性比較的計算復(fù)雜度。該研究拓寬了計算機(jī)視覺技術(shù)應(yīng)用范圍,有助于實現(xiàn)農(nóng)業(yè)病蟲害的盡早預(yù)測。
二進(jìn)制局部模式蛾類昆蟲圖像處理目標(biāo)識別
蛾類昆蟲屬于鱗翅目,該類昆蟲具有明顯的特征,尤其是不同昆蟲的翅膀差異明顯。昆蟲學(xué)家根據(jù)翅膀的特征對蛾類昆蟲進(jìn)行分類。但傳統(tǒng)的方法費時費力,特別是在因特網(wǎng)環(huán)境下人工識別昆蟲的方式難以發(fā)揮網(wǎng)絡(luò)技術(shù)的優(yōu)勢。因此,如何實現(xiàn)昆蟲的自動識別成為急待解決的問題。
近年來,于新文等應(yīng)用不同的形狀參數(shù)描述昆蟲的圖像特征實現(xiàn)基于圖像的昆蟲識別[1]。馬駿等應(yīng)用數(shù)據(jù)形態(tài)學(xué)方法提取昆蟲圖像骨架特征并結(jié)合神經(jīng)網(wǎng)絡(luò)算法實現(xiàn)昆蟲識別[2]。周龍則通過數(shù)學(xué)形態(tài)學(xué)提取昆蟲邊緣特征實現(xiàn)昆蟲識別[3]。劉德營等采用特征不變量等描述昆蟲特征實現(xiàn)昆蟲識別[4]。Wen等提出了基于圖像的5種果園害蟲的自動識別技術(shù)[5],在此基礎(chǔ)上結(jié)合圖像的局部特征和全局特征進(jìn)一步提高識別性能[6]。Wang等利用基于內(nèi)容的圖像檢索技術(shù)提取昆蟲的形狀特征、紋理特征和顏色特征實現(xiàn)蝶類昆蟲的識別[7],并應(yīng)用神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)以提高識別性能[8]?,F(xiàn)有昆蟲識別的方法主要集中在目層次的昆蟲識別,一般均需先提取出圖像中的昆蟲目標(biāo)區(qū)域,然后提取該區(qū)域的特征,但鑒于目前圖像分割技術(shù)的局限性,該處理往往是手工完成的,從而導(dǎo)致昆蟲自動識別無法實現(xiàn)。同時,現(xiàn)有昆蟲識別技術(shù)認(rèn)為形狀、顏色特征優(yōu)于紋理特征,但蛾類昆蟲形狀相似,同種昆蟲顏色各異,但翅的紋理特征突出,因此,合適的紋理特征表示是有效識別蛾類昆蟲的基礎(chǔ)。近年來,局部二進(jìn)制模式LBP特征提取技術(shù)被證明是較好的紋理特征提取方法,并已應(yīng)用于診斷病癥、鑒定性別、行為分類等[9-12]。同時,LBP技術(shù)也不斷得到改進(jìn),出現(xiàn)了諸多變種,如主LBP、CLBP等[13-16]。
為了避免現(xiàn)有處理方法先分割昆蟲目標(biāo)后提取特征的不足,本研究采用拍攝得到的蛾類昆蟲原始圖像,用CLBP算法直接提取這些昆蟲圖像的紋理特征,同時鑒于CLBP得到的特征矩陣巨大,而蛾類昆蟲的本質(zhì)特征維數(shù)有限的特點,對CLBP特征矩陣提取可識別的本征維數(shù),從而有限地降低特征矩陣存儲容量,并降低相似度比較的計算復(fù)雜度。
1.1蛾類昆蟲的特點及其特征提取
鱗翅目昆蟲約有112 000種,其中蛾類昆蟲是鱗翅目中最大的類群,占90%左右,其外觀變化很多,難以作一般描述。如圖1(a)、(b)和(c)屬于同一種蛾類,但其形狀和顏色均差異明顯。圖1(d)則屬于另一種蛾類昆蟲。由圖1可知,顏色和形狀作為蛾類昆蟲的特征表示效果不理想,但從紋理看,圖1(d)和(a)、(b)和(c)差異較明顯。因此,紋理特征也可作為蛾類昆蟲識別的依據(jù)。
LBP是近年來提出的很好的紋理特征提取算法,已出現(xiàn)多種變種。其中CLBP在原有LBP基礎(chǔ)上綜合考慮了中心點和其相鄰像素點的差異程度以及中心點。
對于一幅圖像中給定的某一像素,傳統(tǒng)的LBP特征計算如下:
(1)
(a) (b)
(c) (d)
文獻(xiàn)[16]認(rèn)為式(1)忽略中心點與其相鄰像素點的差異程度不利于圖像特征提取,因此,在式(1)基礎(chǔ)上提出:
(2)
其中:c為閾值,一般取整幅圖像的像素平均值。mp|gp-gc|。
同時,認(rèn)為中心點對目標(biāo)識別也有影響,提出下式:
CLBPCP,R=s(gc-c)
(3)
其中:c為閾值,一般取整幅圖像的像素平均值。
為了使CLBP特征具有旋轉(zhuǎn)不變性,LBPP,R改寫為:
(4)
圖2是圖1(a)的昆蟲CLBP特征表示,RI表示具旋轉(zhuǎn)不變性的CLBP特征,M表示式(2)表示的特征,S為式(1)表示的特征,數(shù)字8和24分別表示為式(1)和式(2)中P的值。
(a) S8 (b) RIS8
(c) S24 (d)RI S24
(e) M8 (f)RI M8
(g) M24 (h) RI M24
圖2(a)-(d)為傳統(tǒng)的LBP特征表示即式(1)以及旋轉(zhuǎn)不變性處理的圖像處理結(jié)果。圖2(a)和(b)比較表明旋轉(zhuǎn)不變性處理后得到的特征較不具旋轉(zhuǎn)不變性的特征能夠更好表達(dá)昆蟲的紋理特征;圖2(b)和(d)表明P=24時的昆蟲LBP特征比P=8時的特征更清晰和精細(xì);圖2(e)-(h)則為式(2)以及旋轉(zhuǎn)不變性處理的圖像處理結(jié)果,是CLBP特征中考慮到中心點和其相鄰點灰度差異程度外得到的紋理特征表示,同樣地,旋轉(zhuǎn)不變性處理后的比未經(jīng)處理的特征圖像、P=24比P=8時的特征圖像更清晰細(xì)致。圖1(d)和(h)則表明式(1)即傳統(tǒng)的LBP特征和式(2)即CLBP中擴(kuò)展傳統(tǒng)LBP后的特征之間具有差異且有互補(bǔ)性。因CLBP中式(3)表示的圖像特征與昆蟲本身不具有對應(yīng)關(guān)系,在本文中未列出。因此,本研究僅應(yīng)用CLBP中的式(1)和式(2)以及旋轉(zhuǎn)不變性處理后的特征表示。
1.2可區(qū)分的CLBP
第一步:得到每幅圖像的主要模式
對直方圖fi降序排列后得到新的按其模式的個數(shù)降序排列fi,對fis做以下循環(huán)運算:
Fork=1toTotal
break;
用Vec存儲篩選出的前k個模式。Veci表示第i幅圖像的前k個模式直方圖。
對于同一類中的圖像提取其CLBP特征并抽取前K個模式,同一類中不同圖像的k可能不一樣。
第二步:得到每類圖像的可區(qū)分模式
設(shè)某類圖像的個數(shù)為nj個,Veci為該類某幅圖像的主要模式,i=1,…,nj。假設(shè)輸出的第num類圖像的可區(qū)分模式為Class-Vecnum,則:
Class_Vecnum=Vec1
Forcount=2tonj
Class_Vecnum=Veccount∩Class_Vecnum
第三步:得到總的可區(qū)分模式
設(shè)總的可區(qū)分模式為Total_Class_Vec,圖像集中圖像的類別數(shù)量為nclass,則:
Total_Class_Vec=Class_Vec1
Forcount=2tonclass
Total_Class_Vec=Class_Veccount∪Total_Class_Vec
用數(shù)碼相機(jī)(分辨率為500萬像素)在日光燈照明情況下分別拍攝福建農(nóng)林大學(xué)林學(xué)院昆蟲標(biāo)本室中尺蛾科、燈蛾科、夜蛾科等三個科的昆蟲圖像,其圖像數(shù)分別為49、43和20,共112幅圖像。將每類圖像隨機(jī)各取出一半圖像作為訓(xùn)練集和測試集,其中訓(xùn)練集的圖像為57幅、測試集為55幅。對每幅圖像提取CLBP特征,即在提取傳統(tǒng)LBP特征基礎(chǔ)上進(jìn)一步提取旋轉(zhuǎn)不變性處理后的式(2)的特征,然后提取可區(qū)分的CLBP,最后用KNN算法實現(xiàn)識別。
本實驗在WindowXP操作系統(tǒng)上用Matlab2009b編程語言實現(xiàn),處理器為Intel1.6GHz,內(nèi)存為2GB。
表1 不同粒度可區(qū)分特征提取方法的識別率
注: 表中所有特征均為可區(qū)分特征,用D表示;RI、M、S、8、24的含義與圖2同
表2 P為24時LBP和CLBP可區(qū)分特征提取方法的識別率
注:表中所有特征均為可區(qū)分特征,用D表示;RI、M、S、8、24的含義與圖2同
表3 P為24時CLBP和可區(qū)分CLBP的維數(shù)
注:D、RI、M、S、8、24的含義同表1
首先比較了不同粒度時CLBP可區(qū)分昆蟲圖像特征表示的分類識別率(表1)。表1可看出P=24時的CLBP可區(qū)分特征表示的分類識別率比P=8時的CLBP可區(qū)分特征表示的高11%。P=8和P=24時的CLBP可區(qū)分特征的混合表示與P=24時的CLBP可區(qū)分特征表示的分類識別率相同。這說明P=24時的分類識別性能優(yōu)于P=8的,也說明P=24時的特征表示包含了蛾類昆蟲識別所需的特征表示信息。在此基礎(chǔ)上,進(jìn)一步比較P=24時,傳統(tǒng)LBP即DRIS24可區(qū)分圖像特征和CLBP即DRIM24+DRIS24可區(qū)分圖像特征的分類識別率(表2)。表2可看出P=24時的LBP特征表示的分類識別率比P=24時的CLBP特征表示的低9.2%,說明CLBP能夠有效地提高蛾類昆蟲識別率,具有更好的識別性能。表3可看出P=24時的可區(qū)分CLBP特征表示的維數(shù)僅為初始CLBP特征表示的0.7%以下,其中DRIM24的維數(shù)僅為RIM24的維數(shù)的0.2%,即99.8%的維數(shù)特征對分類不具影響,同時,DRIS24的維數(shù)僅為RIS24的維數(shù)的0.7%,99.3%的維數(shù)被丟棄了,且不影響分類性能。因此,可區(qū)分CLBP特征表示方法不僅能夠提高蛾類昆蟲的分類識別性能,并且能夠由于急劇減少用于分類的特征維數(shù)從而能夠更容易實現(xiàn)快速識別蛾類昆蟲的目標(biāo)。
蛾類昆蟲的翅膀具明顯的紋理特征且差異明顯。與傳統(tǒng)昆蟲識別方法將顏色描述子和形狀描述子作為昆蟲特征不同,紋理特征是適用于目以下的昆蟲識別的特征表示方法。本研究中我們用CLBP提取昆蟲原始圖像的紋理特征,并根據(jù)類別信息提取共有的表示模式,有效地降低了用于識別的維數(shù),與不具區(qū)分的CLBP特征維數(shù)相比,僅利用其不到1%的總維數(shù)即可以有效地識別蛾類昆蟲,最后用KNN算法得到的分類準(zhǔn)確率為96.4%。由此可知,可區(qū)分的CLBP特征是適用的蛾類昆蟲特征提取方法。在此基礎(chǔ)上開發(fā)出的蛾類昆蟲自動識別系統(tǒng)具有實際的應(yīng)用價值。同時,該系統(tǒng)還可以與網(wǎng)絡(luò)技術(shù)相結(jié)合,從而使得蛾類昆蟲的遠(yuǎn)程自動識別成為可能。本研究成果有助于農(nóng)業(yè)病蟲害的盡早發(fā)現(xiàn),從而減少經(jīng)濟(jì)缺失。
[1] 于新文,沈佐銳,高靈旺,等.昆蟲圖像幾何形狀特征的提取技術(shù)研究[J].中國農(nóng)業(yè)大學(xué)學(xué)報,2003,8(3):47-50.
[2] 馬駿,王建華. 一種基于數(shù)學(xué)形態(tài)學(xué)的植物病蟲識別方法[J].深圳大學(xué)學(xué)報:理工版,2004,21(1):72-75.
[3] 周龍.基于數(shù)學(xué)形態(tài)學(xué)的儲糧害蟲圖像邊緣檢測算法的研究[J].微計算機(jī)信息,2005,21(4):115-116.
[4] 劉德營,丁為民,趙三琴.稻飛虱圖像形狀和顏色特征提取的研究[J].江西農(nóng)業(yè)學(xué)報,2009,21(5):97-98.
[5]WenC,GuyerDE,LiW.Localfeature-basedidentificationandclassificationfororchardinsects[J].Biosystemsengineering,2009,104(3):299-307.
[6]WenC,GuyerD.Image-basedorchardinsectautomatedidentificationandclassificationmethod[J].ComputersandElectronicsinAgriculture,2012,89:110-115.
[7]WangJ,JiL,LiangA,etal.Theidentificationofbutterflyfamiliesusingcontent-basedimageretrieval[J].BiosystemsEngineering,2012,111(1):24-32.
[8]WangJ,LinC,JiL,etal.Anewautomaticidentificationsystemofinsectimagesattheorderlevel[J].Knowledge-BasedSystems,2012,33:102-110.
[9]BurcinK,VasifNV.Downsyndromerecognitionusinglocalbinarypatternsandstatisticalevaluationofthesystem[J].ExpertSystemswithApplications,2011,38(7)::8690-8695.
[10]ShanC.Learninglocalbinarypatternsforgenderclassificationonreal-worldfaceimages[J].PatternRecognitionLetters,2012,33(4):431-437.
[11]LiuYY,ChenM,IshikawaH,etal.AutomatedmacularpathologydiagnosisinretinalOCTimagesusingmulti-scalespatialpyramidandlocalbinarypatternsintextureandshapeencoding[J].Medicalimageanalysis,2011,15(5):748-759.
[12]NanniL,BrahnamS,LuminiA.LocalTernaryPatternsfromThreeOrthogonalPlanesforhumanactionclassification[J].ExpertSystemswithApplications,2011,38(5):5125-5128.
[13]PujolFA,GarcíaJC.ComputingthePrincipalLocalBinaryPatternsforfacerecognitionusingdataminingtools[J].ExpertSystemswithApplications,2012,39(8):7165-7172.
[14]FathiA,Naghsh-NilchiAR.Noisetolerantlocalbinarypatternoperatorforefficienttextureanalysis[J].PatternRecognitionLetters,2012,33(9):1093-1100.
[15]PapakostasGA,KoulouriotisDE,KarakasisEG,etal.Moment-basedlocalbinarypatterns:Anoveldescriptorforinvariantpatternrecognitionapplications[J].Neurocomputing,2013,99:358-371.
[16]GuoZ,ZhangL,ZhangD.Acompletedmodelingoflocalbinarypatternoperatorfortextureclassification[J].IEEETransactionsonImageProcessing,2010,19(6):1657-1663.
RECOGNINGINSECTSOFMOTHSPECIESBASEDONDISCRIMINATIVELOCALBINARYPATTERNFEATURES
LiXiaolin1ZhouPengbo2ZhouMingquan2HuangShiguo1*
1(College of Computer and Information,Fujian Agriculture and Forestry University,Fuzhou 350002,Fujian,China)2(College of Information Science and Technology,Beijing Normal University,Beijing 100875,China)
Mostofinsectsofmothspeciesaretheagriculturalpests,thereforetheautomaticrecognitionofthecategoryofinsectsofmothspeciesareofgreatimportanceforpestprediction.Currentautomaticinsectrecognitionmethodsmostlyfocusonrecognisingtheinsectsabovetheorderlevelbutarehardtorecognisetheinsectsontheorderlevel,inlightofthisproblemweproposedatexturefeature-basedrecognitionmethodforinsectsofmothspecies.Itextractsthefeaturesofinsectimagesbyapplyingamodifiedlocalbinarypatternalgorithm(CLBP),anddistilsnaturedimensionfromtheextractedfeaturematrixaccordingtothecategoryofinsectsofmothspecies,andfinallyappliesKNNalgorithmtotherealisationofrecognisinginsectsofmothspecies.ExperimentalresultsshowedthatthediscriminativeCLBPcanextractfeaturesfromoriginalinsectimagesdirectlyandachievesexcellentrecognitionperformance,meanwhileitcaneffectivelyreducethedimensionsoffeaturesmatrix,sothatdwindlesthestoragespaceanddecreasesthecomputationalcomplexityofsimilaritycomparison.Ourresearchbroadenstheapplicationscopeofcomputervisionandwillbehelpfulforearlypredictionofagriculturepestsanddiseases.
LocalbinarypatternInsectsofmothspeciesImageprocessingObjectrecognition
2014-10-27。國家自然科學(xué)基金項目(61170203);福建省自然科學(xué)基金項目(2013J01071);國家重點基礎(chǔ)研究發(fā)展計劃前期研究專項(2011CB311802);虛擬現(xiàn)實應(yīng)用教育部工程研究中心開放基金項目(MOEBNUEVRA200904)。李小林,副教授,主研領(lǐng)域:智能圖像處理。周蓬勃,實驗員。周明全,教授。黃世國,副教授。
TP391
ADOI:10.3969/j.issn.1000-386x.2016.03.039