摘要:為提高基于紅外光譜(NIR)對煙葉分級的效率,提出融合BPSO最優(yōu)粒子和被選概率特征對煙葉的NIR進行有用特征光譜的選擇?;谠摲椒ㄟx擇的有用NIR特征光譜,對2012年642片(13個等級)煙葉進行分級,試驗結(jié)果表明,通過合適的被選概率值可以得到數(shù)目相對少的用于煙葉自動分級的特征光譜組合,若與最佳粒子融合可以得到更好的分級吻合率。利用選擇后的特征光譜不僅可以提高分級速度,還可以適當提高分級正確率。
關(guān)鍵詞:近紅外光譜;BPSO;被選概率;支持向量機
中圖分類號:TN219 文獻標識碼:A 文章編號:0439-8114(2016)01-0205-03
DOI:10.14088/j.cnki.issn0439-8114.2016.01.054
物質(zhì)的光譜特征不僅可以反映物質(zhì)的成分組成和含量,還可以反映物質(zhì)的結(jié)構(gòu)。通過分析煙葉成分可知,近紅外光譜能夠在一定程度上反映煙葉主要特性,很多學(xué)者基于煙葉近紅外光譜數(shù)據(jù)對煙葉的化學(xué)成分和含量進行確定分析[1-3],表明近紅外光譜可以表征煙葉特性。張建平等[4]、束茹欣等[5]利用近紅外光譜實現(xiàn)對煙葉產(chǎn)地和部位的識別;章英等[6]依據(jù)近紅外光譜數(shù)據(jù)用最近鄰判別分析方法實現(xiàn)煙葉的自動分組;其他研究人員[7-10]利用近紅外光譜對鄭州地區(qū)的煙葉進行了自動分級研究。
已有的研究表明,近紅外光譜可以用來對煙葉進行自動分級,但是在這些等間隔采集的光譜數(shù)據(jù)中并不是所有的光譜對于分級都有好的影響,而且光譜數(shù)據(jù)間具有極大的相關(guān)性,這不僅影響了煙葉的分級吻合率,更嚴重影響了煙葉的分級速度。用于收購階段的煙葉自動分級不僅需要有高的分級識別率,還需要速度快,以便快速實時地對每片煙葉進行無損等級識別。因此有必要對原始的光譜數(shù)據(jù)進行有用特征光譜篩選,以減少數(shù)據(jù)的采集時間和分級模型的計算復(fù)雜度。趙海東等[8]提出利用聚類思想對光譜進行有用選擇,結(jié)果表明對光譜的選擇很有必要。為提高基于紅外光譜識別煙葉等級的效率,本文提出基于BPSO(Binary Particle Swarm Optimization,二進制粒子群)的特征被選概率方法對光譜數(shù)據(jù)進行特征篩選,對2012年642片13個等級的煙葉進行了分級識別,并利用BPSO的特征被選概率對原始數(shù)據(jù)進行光譜選擇,結(jié)果表明,基于BPSO的被選概率可有效選擇出有用的特征光譜,減少光譜采集維數(shù),不僅提高了分級速度,還可以適當提高分級正確率。
1.2 BPSO的最佳粒子和特征被選概率
BPSO運用于煙葉的光譜特征選擇時,每一個粒子對應(yīng)一種光譜的特征組合。對光譜進行特征選擇時,粒子的每一維對應(yīng)一個波長,粒子的某一維取值為1時表示這個光譜的特征被選中在特征集中,取值為0表示這一維特征沒有被選中。因此可根據(jù)粒子的值確定對應(yīng)的特征光譜,作為分類器的輸入模式,分級網(wǎng)絡(luò)輸出的分類準確率作為評價該粒子優(yōu)劣的適應(yīng)度函數(shù)。每個粒子對應(yīng)一個適應(yīng)度值,在所有的粒子中選擇適應(yīng)度值最大的粒子作為最佳粒子,所對應(yīng)的光譜組合稱為最佳特征光譜。
分析BPSO的進化過程,可知BPSO粒子的進化是朝著引起高正確分級率的方向進行的,所以在具有高適應(yīng)度的粒子中選擇比較大的特征概率屬于對分級影響大的特征進行選擇。統(tǒng)計高適應(yīng)度粒子中各個特征被選擇的次數(shù),由此得到每個特征的被選概率。顯然選擇合適的被選概率,可以保證得到一定正確分級率的數(shù)目相對較少的特征光譜。
1.3 有用特征光譜選擇
實際上由上述得到的最佳特征光譜僅僅是T×β個粒子中的最佳粒子,其中T為粒子進化次數(shù),而由α空間構(gòu)成的粒子數(shù)遠遠大于T×β,所以這樣得到的最佳特征光譜只是一個局部的最佳。
被選概率高的光譜可能有更高的概率對分級影響大,但不一定包括了所有對分級影響大的光譜,如果聯(lián)合考慮BPSO的最佳粒子和每個光譜的被選概率,融合這兩個所選擇的特征光譜,形成最終的用于分級的有用特征光譜有可能使得分級正確率得以提高。
3 小結(jié)
本文通過采用BPSO對粒子進行更新迭代后,選擇保留其中對分級影響好的特征,然后統(tǒng)計這些被選粒子中每個特征的被選概率,通過統(tǒng)計發(fā)現(xiàn)當被選概率為60%時,其分級的效果和最優(yōu)選擇的效果很接近,表明通過統(tǒng)計粒子中每個特征的被選概率的方法是可行的;然后把特征被選概率>60%的特征和最優(yōu)選擇的特征進行對比,把最優(yōu)選擇中有但被選概率中沒有的特征和被選概率特征進行結(jié)合發(fā)現(xiàn),最優(yōu)選擇的這些特征可以彌補被選概率中的缺陷,進一步提高煙葉分級的效果。文中用到的光譜數(shù)據(jù)維數(shù)過高,難免在BPSO搜索的過程中時間稍長,如果能在BPSO選擇前進行維數(shù)的選擇來加快后面的速度更好,這樣能夠在煙葉收購的過程中實現(xiàn)實時有效的處理,還需要進一步的研究。
參考文獻:
[1] 常愛霞,張建平,杜詠梅,等.烤煙香型相關(guān)化學(xué)成分主導(dǎo)的不同產(chǎn)區(qū)煙葉聚類分析[J].中國煙草學(xué)報,2010,16(2):14-19.
[2] 付秋娟,王樹聲,竇玉青,等.煙草根中N、K、Ca、Mg的近紅外光譜分析[J].煙草科技,2006(10):35-37.
[3] 杜閱光,崔登科,程小東,等.聲光可調(diào)近紅外光譜技術(shù)用于打葉復(fù)烤片煙化學(xué)成分均質(zhì)化生產(chǎn)控制[J].紅外技術(shù),2012,34(10):614-618.
[4] 張建平,陳江華,束茹欣,等.近紅外信息用于煙葉風(fēng)格識別及卷煙配方研究的初步探索[J].中國煙草學(xué)報,2007,13(5):1-5.
[5] 束茹欣,王國東,張建平,等.國產(chǎn)烤煙煙葉的NIRS模式識別[J].煙草科技,2006(8):12-16.
[6] 章 英,賀立源.基于近紅外光譜的烤煙煙葉自動分組方法[J].農(nóng)業(yè)工程學(xué)報,2011,27(4):350-354.
[7] 張樂明,申金媛,劉劍君,等.概率神經(jīng)網(wǎng)絡(luò)在煙葉自動分級中的應(yīng)用[J].農(nóng)機化研究,2011(12):32-35.
[8] 趙海東,申金媛,劉潤杰,等.基于聚類的煙葉近紅外光譜有效特征的篩選方法[J].紅外技術(shù),2013,35(10):659-664.
[9] 申振宇,申金媛,劉劍君,等.基于神經(jīng)網(wǎng)絡(luò)的特征分析在煙葉分級中的應(yīng)用[J].計算機與數(shù)字工程, 2012(7):122-124.
[10] LIU J J, SHEN J Y, SHEN Z Y, et al. Grading tobacco leaves based on image processing and generalized regression neural network[A]. Intelligent Control, Automatic Detection and High-End Equipment(ICADE), 2012 IEEE International Conference[C]. IEEE, 2012. 89-93.
[11] KENNEDY J, EBERHART R. Particle swarm optimization[A]. Proceedings of the 4th IEEE international conference on neural networks[C]. Piscataway: IEEE Service Center,1995. 1942-1948.