劉巍 史勇 田海清 郭俊先 李雪蓮 黃華 石砦
摘 要:建立了3種高光譜反射、透射和反透射模式成像系統(tǒng)用于分析皮棉雜質(zhì),對(duì)比不同成像模式下皮棉和雜質(zhì)區(qū)域的光譜類型識(shí)別率。反射、透射和反透射的高光譜圖像均采用固定閾值分割和形態(tài)學(xué)膨脹填充方法,確定皮棉和雜質(zhì)的區(qū)域,提取該區(qū)域的平均光譜。光譜經(jīng)預(yù)處理,然后進(jìn)行主成分分析,利用支持向量機(jī)模型識(shí)別方法建立皮棉和雜質(zhì)區(qū)域光譜類型識(shí)別模型,驗(yàn)證不同預(yù)處理方法對(duì)識(shí)別效果影響;同時(shí),預(yù)處理后的光譜進(jìn)行波長篩選,篩選后的波長建立判別分析模型。結(jié)果表明,反射、透射和反透射成像模式下皮棉和雜質(zhì)區(qū)域光譜識(shí)別率分別為90.63%、95.78%和88.47%,其中,透射成像模式光譜類型識(shí)別率最高。
關(guān)鍵詞:高光譜圖像;棉花;識(shí)別;光譜;波長篩選
中圖分類號(hào):S526
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1009-265X(2019)05-0044-06
Abstract:3 imaging systems including hyperspectral reflection, transmission and reflection-transmission modes were established to analyze ginned cotton impurities and compare spectrum type recognition rate of ginned cotton and impurity area under different imaging modes. For the hyperspectral images of reflection, transmission and reflection-transmission, fixed threshold segmentation and morphological expansion filling method were used to confirm the region of ginned cotton and impurities, and extract the average spectrum of the region. The spectra were pre-treated, and principal component analysis was conducted for the pre-treated spectra. The support vector machine model recognition method was utilized to establish spectrum type recognition model of ginned cotton and impurity region, and verify the influence of different pretreatment methods on the recognition effect. Meanwhile, wave length screening was performed on pre-treated spectra, and the discrimination analysis model was established for the screened wave length. The results showed that the spectrum recognition rates of ginned cotton and impurity region under reflection, transmission and reflection-transmission imaging modes were 90.63%, 95.78% and 88.47% respectively, of which the transmission imaging pattern had the highest recognition rate.
Key words:hyperspectral imaging; cotton; recognition; spectrum; wavelength screening
棉花是世界上最主要的農(nóng)作物之一,是重要的經(jīng)濟(jì)作物,也是紡織行業(yè)的主要原料[1]。棉花雜質(zhì)對(duì)棉花的質(zhì)量和價(jià)格有著直接影響,對(duì)于提高棉花價(jià)格和加工質(zhì)量非常關(guān)鍵[2]。馮顯英等[3]開展了機(jī)器視覺的異性纖維檢測。Pai等[4]基于模糊邏輯方法分析微斷層X光原棉圖像。Bhmer等[5]建立線掃描CCD照相機(jī)檢測棉花中聚丙烯和聚乙烯雜質(zhì)。Hogan[6]應(yīng)用熒光光譜進(jìn)行棉花雜質(zhì)分類。郟東耀等[7]利用多波段光譜信息融合成像檢測技術(shù),對(duì)棉花中異性纖維雜質(zhì)能夠有效識(shí)別。郭俊先等[8]采用近紅外光譜對(duì)皮棉雜質(zhì)含量預(yù)測和分類。Zhao等[9]采用數(shù)字圖像處理技術(shù)對(duì)原棉進(jìn)行雜質(zhì)和缺陷檢測。采用以上這些技術(shù)只能夠有效檢測棉花中顏色較淺、面積較大以及含有熒光物質(zhì)的雜質(zhì),對(duì)于表面面積較小、顏色較淺、透明、白色以及棉花內(nèi)部的雜質(zhì)不能有效檢測[10]。
高光譜技術(shù)是遙感技術(shù)中一部分,后被應(yīng)用于農(nóng)業(yè)和生態(tài)環(huán)境等方面的檢測[11]。高光譜具有高分辨率、波段信息豐富、波長覆蓋范圍寬等優(yōu)點(diǎn),能夠有效應(yīng)用于農(nóng)畜產(chǎn)品品質(zhì)檢測。高光譜成像模式多種,其中高光譜反射成像模式的設(shè)備結(jié)構(gòu)簡單其應(yīng)用最為廣泛[12],另外,透射和反透射模式也開始得到廣泛應(yīng)用[13]。由于高光譜反透射模式設(shè)備結(jié)構(gòu)較為復(fù)雜,和其他模式相比應(yīng)用較少,但是反透射能夠攜帶待測樣本更多的內(nèi)部信息[14]。郭俊先等[15]采集梳棉內(nèi)部多種雜質(zhì)高光譜圖像,確定雜質(zhì)檢測過程中的關(guān)鍵波長。張航等[16]對(duì)混入棉花中地膜應(yīng)用高光譜技術(shù)進(jìn)行檢測。魏新華等[17]采用高光譜技術(shù)和最小噪聲分離分析方法對(duì)籽棉表層多類難撿異性纖維的圖像進(jìn)行研究,結(jié)果表明識(shí)別率達(dá)到91%。高光譜技術(shù)可以有效針對(duì)棉花表面和內(nèi)部的雜質(zhì)進(jìn)行檢測。
針對(duì)棉花中難檢雜質(zhì),本研究構(gòu)建高光譜反射、透射和反透射(反射和透射交互作用)成像系統(tǒng)對(duì)皮棉中存在的雜質(zhì)進(jìn)行檢測、識(shí)別和分析。對(duì)反射、透射和反透射成像模式下皮棉和雜質(zhì)區(qū)域的光譜數(shù)據(jù)進(jìn)行提取并預(yù)處理,通過支持向量機(jī)方法選擇最佳的預(yù)處理,基于相關(guān)系數(shù)法對(duì)預(yù)處理后的光譜數(shù)據(jù)進(jìn)行特征波長篩選,然后利用判別分析識(shí)別該區(qū)域是雜質(zhì)或棉花,并比較反射、透射和反透射成像模式下雜質(zhì)識(shí)別效果。
1 材料與方法
1.1 試驗(yàn)材料
1.1.1 皮棉的梳棉處理
皮棉采自新疆自治區(qū)沙灣縣商戶地鄉(xiāng)蘑菇湖村和石河子市143團(tuán)棉花廠。利用棉花開松機(jī)(新疆農(nóng)業(yè)大學(xué)機(jī)電工程學(xué)院農(nóng)業(yè)工程重點(diǎn)實(shí)驗(yàn)室)對(duì)皮棉充分開松,開松棉網(wǎng)制成210 mm×297 mm、厚度為6~8 mm的樣本,開松前剔除棉網(wǎng)中的異性纖維,只保留普通植物性雜質(zhì)。高光譜圖像采集時(shí),一部分樣本不放置異性纖維,一部分樣本將異性纖維切斷成不同大小和長度隨機(jī)撒落在梳棉表面和內(nèi)部。
1.1.2 雜質(zhì)樣本制備
棉花雜質(zhì)共分為普通雜質(zhì)(NCT,natural cotton trash)包括葉子、莖桿、鈴殼、棉籽殼等,異性纖維包括淺灰色(GPP,gray PP fibers)、白色(WPP,white PP fibers)和透明丙綸絲(TPP,transparent PP fibers),黑色人發(fā)(BHH,black human hair),黑色(BPH,black pig hair)和白色豬毛(WPH,white pig hair)及透明聚乙烯地膜碎片(TPM,transparent PE mulching film)。將普通雜質(zhì)和一些異性纖維按照細(xì)分類隨機(jī)放置在梳棉樣本表面。制備高光譜反射、透射和反透射的采集樣本各65個(gè),其中高光譜反射圖像分割后獲得子圖像113個(gè)、透射獲得子圖像207個(gè)、反透射獲得子圖像121個(gè)。隨機(jī)3∶1劃分為校正集和驗(yàn)證集。
1.1.3 高光譜像反射、透射和反透射成像系統(tǒng)
搭建的高光譜反射、透射和反透射成像系統(tǒng)見圖1。該系統(tǒng)采用內(nèi)蒙古農(nóng)業(yè)大學(xué)機(jī)電工程學(xué)院的高光譜成像系統(tǒng),該系統(tǒng)包括Specim公司的Hyper-Spectral Camera光譜相機(jī),光譜相機(jī)imspector成像光譜儀modelV1OE、配套相機(jī)(Imperx:IGV-B1620,分辨率1 600×1 200)、鏡頭(Specim: OLE23,焦距:23 mm,C接口鏡頭)、電動(dòng)位移平臺(tái)、鹵素?zé)艄庠?、?shù)據(jù)獲取平臺(tái)、計(jì)算機(jī)和暗箱。
1.2 高光譜圖像采集和采集參數(shù)設(shè)置
高光譜圖像采集時(shí)將樣本放置于位移平臺(tái)玻璃載體上,調(diào)節(jié)載物臺(tái)移動(dòng)速度和成像系統(tǒng)曝光時(shí)間等參數(shù),數(shù)據(jù)采集之前預(yù)熱相機(jī),摘下鏡頭預(yù)熱30 min以上,增強(qiáng)光源強(qiáng)度穩(wěn)定性和減少溫度對(duì)實(shí)驗(yàn)影響,從而獲得高質(zhì)量的高光譜圖像。高光譜反射、透射和反透射成像模式參數(shù)設(shè)置如表1所示。
1.3 數(shù)據(jù)處理
1.3.1 數(shù)據(jù)處理軟件
高光譜圖像和光譜數(shù)據(jù)處理采用ENVI51(The Environment for Visualizing Images)、Matlab2014a(Version 8.3.0, the Math-Works, Natick, MA)軟件。
1.3.2 光譜提取
由于原始高光譜圖像數(shù)據(jù)冗余,采用ENVI51軟件裁剪原始高光譜圖像,減少冗余的數(shù)據(jù)容量,剔除多余的背景信息。裁剪后反射、反透射的光譜范圍和波段數(shù)分別為935.51~2 539.17 nm和256,透射的光譜范圍和波段數(shù)分別為382.24~2 539.17 nm和428。對(duì)提取的棉花波段圖像進(jìn)行閾值分割、噪點(diǎn)剔除和區(qū)域填充,對(duì)比幾種典型閾值分割和填充方法,初步確定固定選擇閾值分割和形態(tài)學(xué)膨脹填充方法,得到雜質(zhì)的實(shí)際區(qū)域二值圖像。根據(jù)雜質(zhì)和棉花的實(shí)際區(qū)域二值圖像,基于已存儲(chǔ)的波段信息提取棉花和雜質(zhì)的光譜信息。如圖2所示為采集得到的皮棉樣本高光譜3D立方體示意圖,圖2中橫縱坐標(biāo)x和y表示圖像像素信息,λ表示波長信息。高光譜圖像既可以對(duì)皮棉樣本表面雜質(zhì)進(jìn)行光譜分析,又可以對(duì)空間一部分感興趣區(qū)域進(jìn)行光譜分析,實(shí)現(xiàn)皮棉雜質(zhì)的空間可視化檢測。
1.3.3 光譜預(yù)處理
因?yàn)楦吖庾V圖像采集和光譜信息提取過程中受系統(tǒng)噪聲、背景信息等原因的影響,提取的光譜數(shù)據(jù)含有大量的無關(guān)信息和噪聲,通過預(yù)處理減少光譜曲線中存在的部分噪聲干擾[18]。對(duì)獲得的反射、透射和反透射光譜分別進(jìn)行標(biāo)準(zhǔn)正態(tài)變量交化SNV、多元散射校正MSC、移動(dòng)窗口平滑、歸一化預(yù)處理光譜數(shù)據(jù)。
高光譜圖像獲取的光譜數(shù)據(jù)量巨大和共性問題,導(dǎo)致計(jì)算困難和信息冗余大,因此對(duì)提取的光譜數(shù)據(jù)進(jìn)行降維非常必要[19]。高光譜圖像中降低冗余度最常用的方法是主成分分析[20],對(duì)預(yù)處理后的光譜數(shù)據(jù)進(jìn)行主成分分析,用于建立不同預(yù)處理的識(shí)別模型。
支持向量機(jī)主要目的是找到將兩類樣本進(jìn)行正確分類并且使得具有最大分類間隔的最優(yōu)超平面,是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的識(shí)別方法[21]。光譜經(jīng)光譜預(yù)處理和主成分分析后,利用支持向量機(jī)模式識(shí)別的方法對(duì)棉花光譜提取的不同主成分模型建立雜質(zhì)識(shí)別模型,確定3種采集模式下提取的光譜最佳的預(yù)處理方法。
1.3.4 特征光譜波長篩選
高光譜圖像的數(shù)據(jù)因?yàn)榫薮蠛凸残詥栴},所以必須對(duì)數(shù)據(jù)進(jìn)行降維,找到包含大部分信息的特征波長[22]。篩選特征波長可以簡化校正模型、減少建模時(shí)間,增強(qiáng)模型的預(yù)測能力和穩(wěn)健性[23]。相關(guān)系數(shù)法是將棉花樣本光譜陣中每一條波長吸光度向量x與分類識(shí)別模型參數(shù)y進(jìn)行相關(guān)性計(jì)算,得到波長-相關(guān)系數(shù)R圖。其中R絕對(duì)值越大對(duì)應(yīng)的波長所含信息越多。因此,可給定閾值,選取相關(guān)系數(shù)絕對(duì)會(huì)大于此閾值的波長參與模型建立。相關(guān)系數(shù)R計(jì)算如式(2):
R=∑ni=1(xi-)(yi-)∑ni=1(xi-)2∑ni=1(yi-)2(2)式中:=(∑ni=1xi)/n,=(∑ni=1yi)/n,n為校正集的樣品數(shù)。
2 結(jié)果與分析
2.1 光譜預(yù)處理
為了驗(yàn)證不同預(yù)處理方法,對(duì)棉花雜質(zhì)識(shí)別效果的影響,分別建立不同預(yù)處理方法的識(shí)別模型。棉花雜質(zhì)識(shí)別模型建立中,需要對(duì)提取的特征信息進(jìn)行歸一化處理,經(jīng)過不同預(yù)處理方法和主成分選擇,建立良好的雜質(zhì)識(shí)別模型,提取不同主成分作為模型輸入特征,利用支持向量機(jī)模式識(shí)別方法建立棉花雜質(zhì)的識(shí)別模型,通過對(duì)識(shí)別率高低判斷,用于對(duì)棉花雜質(zhì)識(shí)別效果優(yōu)劣進(jìn)行評(píng)價(jià)。如圖3為皮棉樣本的雜質(zhì)原始反射平均光譜及光譜各種預(yù)處理后的結(jié)果。從圖3(a)可以看出,原始光譜不光滑,存在噪音;由圖3(b)可知,移動(dòng)窗口去噪后光譜曲線整體平滑。由圖3(c)可知,歸一化后可以有效消除冗余信息變量,放大光譜特征信息。由圖3(d)可知,抑制了基線的漂移,提高了光譜信噪比。由圖3(e)可知,提高了原始光譜的集中性。
對(duì)梳棉樣本提取的棉花和雜質(zhì)的光譜進(jìn)行預(yù)處理后,并經(jīng)過主成分分析,隨著主成分?jǐn)?shù)不斷增加,累計(jì)貢獻(xiàn)率也不斷增加。當(dāng)主成分?jǐn)?shù)為9時(shí),高光譜反射、透射和反透射模式下提取的棉花和雜質(zhì)的光譜數(shù)據(jù)經(jīng)主成分分析后的累計(jì)貢獻(xiàn)率均達(dá)到95%以上。說明這9個(gè)主成分因子已經(jīng)能很好的反應(yīng)光譜的總體信息。因此,可以由這9個(gè)主成分因子建立模型。如表2所示為不同光譜預(yù)處理方法對(duì)應(yīng)的主成分累計(jì)貢獻(xiàn)率。
支持向量機(jī)建立識(shí)別模型優(yōu)先解決的問題是核函數(shù)的選擇,用徑向基作為支持向量機(jī)的核函數(shù)。如表3所示為光譜經(jīng)預(yù)處理后,反射、透射和反透射光譜的雜質(zhì)識(shí)別率。反射、透射和反透射光譜經(jīng)幾種不同光譜預(yù)處理后,借助主成分分析,通過支持向量機(jī)得到不同主成分因子數(shù)對(duì)應(yīng)的雜質(zhì)識(shí)別率。對(duì)比確定皮棉樣本反射、透射和反透射光譜經(jīng)多元散射校正預(yù)處理后,雜質(zhì)識(shí)別率最好,對(duì)應(yīng)雜質(zhì)識(shí)別率分別為89.57%、95.32%和88.34%。
2.2 特征波長的預(yù)測模型
皮棉樣本光譜預(yù)處理后,利用相關(guān)系數(shù)法對(duì)預(yù)處理后的光譜進(jìn)行波長篩選,表4為相關(guān)系數(shù)法篩 選的雜質(zhì)特征波長,利用相關(guān)系數(shù)波長篩方法選篩選出的波長用于建立反射、透射和反透射成像模式下皮棉樣本光譜的判別分析識(shí)別模型,選擇皮棉樣本中雜質(zhì)識(shí)別率最高的成像模式作為最終結(jié)果。表5為反射、透射和反透射成像采集模式下的棉花樣本光譜雜質(zhì)判別分析結(jié)果。
由表5可知高光譜反射、透射和反透射模式下的棉花和雜質(zhì)光譜數(shù)據(jù)經(jīng)光譜預(yù)處理和波長篩選后,建立判別分析模型,其中,透射成像模式下提取的光譜數(shù)據(jù)雜質(zhì)識(shí)別率達(dá)到最高,透射光譜相比其他兩種光譜包含更多的棉花雜質(zhì)信息,這可能是因?yàn)椴糠蛛s質(zhì)分布在皮棉樣本內(nèi)層原因,透射光譜可以較好地反應(yīng)皮棉樣本內(nèi)層特征。由于反射光譜不能夠有效反應(yīng)皮棉內(nèi)部信息,導(dǎo)致反射光譜雜質(zhì)識(shí)別率不如透射光譜。反透射光譜可能受到反射光的干擾,導(dǎo)致攜帶的內(nèi)部信息不如透射光譜。
3 結(jié) 語
構(gòu)建了高光譜反射、透射和反透射成像分析系統(tǒng),提取高光譜反射、透射和反透射模式下皮棉樣本中雜質(zhì)和棉花區(qū)域的光譜數(shù)據(jù),對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,借助主成分分析,建立支持向量機(jī)模式識(shí)別區(qū)域的棉花或雜質(zhì)屬性,確定反射、透射和反透射成像模式下提取的光譜數(shù)據(jù)對(duì)應(yīng)最佳預(yù)處理方法。對(duì)反射、透射和反透射光譜預(yù)處理后,采用相關(guān)系數(shù)法篩選波長,篩選出3種成像模式下各7個(gè)特征波長。利用篩選的波長建立區(qū)域光譜的判別分析類型,結(jié)果顯示反射、透射和反透射成像模式雜質(zhì)區(qū)域識(shí)別率分別為90.63%、95.78%和88.47%,透射成像模式雜質(zhì)區(qū)域的識(shí)別率最高。
參考文獻(xiàn):
[1] 郭俊先.基于高光譜成像技術(shù)的棉花雜質(zhì)檢測方法的研究[D].杭州:浙江大學(xué),2011.
[2] 郭俊先,李雪蓮,黃華,等.基于可見短波近紅外高光譜圖像的梳棉雜質(zhì)關(guān)鍵波長的優(yōu)選[J].新疆農(nóng)業(yè)科學(xué),2016,53(2):352-358.
[3] 馮顯英,任長志,黃燕云.基于機(jī)器視覺的異性纖維檢測系統(tǒng)[J].山東大學(xué)學(xué)報(bào)(工學(xué)版),2006,36(4):5-08.
[4] PAI A, SARIS H, HEQUET E F. Recognition of cotton contaminants via X-ray microtomographic image analysis[C]// Industry applications Conference, 2002. Ias Meeting. Conference Record of the. IEEE Xplore, 2002,1:312-319.
[5] BHMER S, BUDZIER H, KRAUSE V, et al. Two channels NIR camera system to detect foreign matter in raw cotton[C]//Proceedings of 8th Quantitative InfraRed Thermography(QIRT), Padova, Italy, 2007:53-59.
[6] HOGAN H. Spectroscopy focus: tracking cotton trash via fluorescence[J]. Photonics Spectra, 2007,41(8):98-99.
[7] 郟東耀,丁天懷.棉花中異性纖維的多光譜檢測[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,45(2):193-196.
[8] 郭俊先,饒秀勤,成芳,等.近紅外光譜用于皮棉雜質(zhì)含量預(yù)測和分類的研究[J].光譜學(xué)與光譜分析,2010,30(3):649-653.
[9] ZHAO X N, DENG Z M. Research and application of defects and impurities detection method of raw cotton[J]. Progress in Textile Science & Technology,2013,59(6):26-28.
[10] 郭俊先,應(yīng)義斌,成芳,等.皮棉表面多類異性纖維的高光譜圖像檢測[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(10):355-360.
[11] 滕安國,高峰,夏新成,等.高光譜技術(shù)在農(nóng)業(yè)中的應(yīng)用研究進(jìn)展[J].江蘇農(nóng)業(yè)科學(xué),2009,2009(3):8-11.
[12] YANG Y C, SUN D W, PU H, et al. Rapid detection of anthocyanin content in lychee pericarp during storage using hyperspectral imaging coupled with model fusion[J]. Postharvest Biology & Technology, 2015,103:55-65.
[13] 胡孟晗,董慶利,劉寶林.基于高光譜反射、透射和交互作用成像模式的藍(lán)莓硬度和彈性模量預(yù)測的比較[J].光譜學(xué)與光譜分析,2016,36(11):3651-3656.
[14] OFARRELL M, WOLD J, HY M, et al. On-line fat content classification of inhomogeneous pork trimmings using multispectral near infrared interactance imaging[J]. Journal of Near Infrared Spectroscopy, 2014,18(2):868-76.
[15] 郭俊先,應(yīng)義斌,李俊偉,等.梳棉內(nèi)部雜質(zhì)高光譜圖像檢測中波長選擇的初探[C]//2012中國農(nóng)業(yè)機(jī)械學(xué)會(huì)國際學(xué)術(shù)年會(huì).2012.
[16] 張航,喬曦,李振波,等.皮棉中地膜的高光譜圖像分割方法[J].農(nóng)業(yè)工程學(xué)報(bào),2016,32(13):161-167.
[17] 魏新華,吳姝,徐來齊,等.基于最小噪聲分離的籽棉異性纖維高光譜圖像識(shí)別(英文)[J].農(nóng)業(yè)工程學(xué)報(bào),2014,30(9):243-248.
[18] 庫靜.不同高光譜成像方式的馬鈴薯內(nèi)外部品質(zhì)檢測方法研究[D].武漢:華中農(nóng)業(yè)大學(xué),2016.
[19] WOLD J P, JAKOBSEN T, KRANE L. Atlantic salmon average fat content estimated by near-infrared transmittance spectroscopy[J].Journal of Food Science, 1996,61(1):74-77.
[20] MANOLAKIS D G. Dimensionality reduction of hyperspectral imaging data using local principal components transforms[J]. Proceedings of SPIE-The International Society for Optical Engineering, 2004,5425:393-401.
[21] 譚琨,杜培軍.基于支持向量機(jī)的高光譜遙感圖像分類[J].紅外與毫米波學(xué)報(bào),2008,27(2):123-128.
[22] 張航,喬曦,李振波,李道亮.皮棉中地膜的高光譜圖像分割方法[J].農(nóng)業(yè)工程學(xué)報(bào),2016,32(13):161-167.
[23] 褚小立,袁洪福,陸婉珍.近紅外分析中光譜預(yù)處理及波長選擇方法進(jìn)展與應(yīng)用[J].化學(xué)進(jìn)展,2004(4):528-542.