代 芬 李 巖 馮 棟
(華南農(nóng)業(yè)大學(xué) 工程學(xué)院,廣州 510642)
小波去噪在基于近紅外光譜的砂糖橘水分檢測(cè)的應(yīng)用
代 芬 李 巖 馮 棟
(華南農(nóng)業(yè)大學(xué) 工程學(xué)院,廣州 510642)
水分含量是衡量砂糖橘營(yíng)養(yǎng)品質(zhì)的重要指標(biāo)之一,其快速無損檢測(cè)顯得越來越重要。本文基于小波變換的方法,對(duì)砂糖橘的500-2500nm區(qū)間的漫反射光譜,利用正交小波函數(shù)DBn(n=2,3,…10)分別進(jìn)行2-6五個(gè)水平分解和消噪,并比較了不同小波函數(shù)和不同分解水平的消噪效果。結(jié)果表明,小波消噪有利于消除導(dǎo)數(shù)光譜中的噪聲,提高建模精度,基于小波函數(shù)DB3(分解尺度為3)消噪后的導(dǎo)數(shù)光譜建立的PLS模型的預(yù)測(cè)相關(guān)系數(shù)為0.8725,預(yù)測(cè)均方根誤差為0.6767。
砂糖橘;紅外光譜;含水量;小波消噪
砂糖橘(Citrus reticulate Blanco,Shatangju)又名十月橘,原產(chǎn)廣東省四會(huì)市。其果肉爽脆、口味清甜、色澤鮮艷、皮薄易剝,是柑橘類的名優(yōu)品種。砂糖桔果皮薄,在貯藏或者加工過程中易發(fā)生變質(zhì)。在評(píng)定砂糖桔品質(zhì),選擇貯藏條件和加工方式時(shí),含水率是重要的指標(biāo)之一?,F(xiàn)有砂糖橘水分檢測(cè)主要采用傳統(tǒng)的烘干法,這種方法需破壞樣品,且檢測(cè)時(shí)間較長(zhǎng)。研究一種快速無損檢測(cè)砂糖橘含水率的技術(shù),實(shí)現(xiàn)大批量、規(guī)?;a(chǎn)的在線檢測(cè),對(duì)于減少砂糖橘采后損失,提高產(chǎn)業(yè)經(jīng)濟(jì)效益具有重要的意義。
隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展以及化學(xué)計(jì)量學(xué)方法研究的日益深入, 近紅外光譜技術(shù)在農(nóng)畜產(chǎn)品品質(zhì)檢測(cè)領(lǐng)域得到較快發(fā)展。近紅外光NIR( Near Infrared) 是介于可見光譜區(qū)和中紅外光譜區(qū)之間的電磁波, 其波長(zhǎng)范圍約為 780 nm-2526nm, 波數(shù)范圍約為12820-3959cm-1。近紅外光譜檢測(cè)屬于非破壞性檢測(cè),可保留農(nóng)產(chǎn)品完整外表而得其內(nèi)在品質(zhì),測(cè)試簡(jiǎn)單,無繁瑣的前處理和化學(xué)反應(yīng)過程,測(cè)試速度快,測(cè)試周期短。近紅外吸收光譜包含了待測(cè)農(nóng)產(chǎn)品的所有成分吸收信息,可同時(shí)檢測(cè)多種內(nèi)部成分,對(duì)測(cè)試人員無專業(yè)化要求,測(cè)試過程無污染,檢測(cè)成本低。而且隨著研究的深入,隨著模型中優(yōu)秀數(shù)據(jù)的積累,模型不斷優(yōu)化,測(cè)試精度不斷提高,應(yīng)用范圍可以不斷拓展(雷松澤,2009)。
本文采用Field Spec 3光譜儀采集的200個(gè)砂糖橘樣本近紅外光譜為基礎(chǔ),通過學(xué)生化殘差圖剔除異常樣本,然后利用小波對(duì)原始光譜數(shù)據(jù)和一階導(dǎo)數(shù)光譜數(shù)據(jù)進(jìn)行除噪,比較在不同分解尺度下的小波消噪效果。
1.1 砂糖橘樣本
從市場(chǎng)上分批購買產(chǎn)自廣東省四會(huì)市的砂糖橘共 193個(gè)樣本,將樣本貼上標(biāo)簽備用。
1.2 樣本光譜采集
實(shí)驗(yàn)使用美國(guó) ASD(analytical spectral device)公司的FieldSpec 3光譜儀,如圖1所示。測(cè)量光譜范圍350-2500nm,采樣間隔為1.4nm@350-1000nm和2nm@1000-2500nm,光譜分辨率為3nm@350-1000nm和10nm@1000-2500nm,掃描次數(shù)10次,數(shù)據(jù)間隔1nm,并配有自帶光源的接觸式反射探頭。光源是與光譜儀配套的14.5 V鹵素?zé)?。分析軟件為unscrambler9.8和Matlab7.8.0。
圖1 FieldSpec3 便攜式地物波譜儀
經(jīng)分析研究表明,相對(duì)于較遠(yuǎn)的距離,近距離的測(cè)量而得到的定量分析模型效果較好[7]。因此本研究采用接觸式測(cè)量方式,在每個(gè)砂糖橘樣本的赤道部位取3點(diǎn)進(jìn)行測(cè)量,每個(gè)點(diǎn)相隔120,使用反射探頭采集樣本的漫反射光譜。每個(gè)點(diǎn)掃描30次,將30個(gè)光譜數(shù)據(jù)進(jìn)行平均作為這一點(diǎn)的光譜。然后將 3個(gè)點(diǎn)的光譜平均作為整個(gè)砂糖橘樣本的漫反射光譜。在采集光譜之前,實(shí)現(xiàn)要進(jìn)行光譜儀預(yù)熱,優(yōu)化和白板校正。在采集過程中,每隔15-20分鐘要重新進(jìn)行白板校正。200個(gè)砂糖桔的光譜數(shù)據(jù)如圖2所示。
圖2 200個(gè)砂糖橘樣品的原始光譜圖
1.3 砂糖橘水分含量測(cè)定
根據(jù)國(guó)家標(biāo)準(zhǔn)(GB/T 8858-1988)[8],采用烘干法測(cè)量砂糖橘水分含量。具體操作步驟:首先用精密天平測(cè)量鋁盒重量m1,然后采用四分法將砂糖橘樣品分成4份,每份約9-10g,將其裝入鋁盒,用精密天平測(cè)量鋁盒和樣品重量m2。將果肉用剪刀搗碎,將裝有樣品的鋁盒放入恒溫風(fēng)干箱中風(fēng)干,溫度設(shè)置為70℃。經(jīng)過9小時(shí)后,測(cè)量鋁盒和烘干后砂糖橘果肉的重量m3。烘干標(biāo)準(zhǔn)以前后半小時(shí)重量差小于0.001g為準(zhǔn)。砂糖橘水分含量則可按下式計(jì)算:
每個(gè)樣本取2份進(jìn)行含水量測(cè)量,最后取平均作為該樣本的含水量。
1.4 小波去噪的原理
小波(wavelet),即小區(qū)域的波,是一種特殊的長(zhǎng)度有限、平均值為0 的波形。它有兩個(gè)特點(diǎn):一是“小”,即在時(shí)域都具有緊支集或近似緊支集;二是正負(fù)交替的“波動(dòng)性”,也即直流分量為零(飛思科技產(chǎn)品研發(fā)中心,2003)。小波變換的定義是把某一被稱為基本小波(也叫母小波mother wavelet)的函數(shù) 做位移 后,再在不同尺度a下與待分析的信號(hào)X(t)做內(nèi)積:頻率之比)恒定的特點(diǎn),a越大相當(dāng)于頻率越低。適當(dāng)?shù)倪x擇基小波,使 在時(shí)域上為有限支撐, 在頻域也比較集中,就可以使WT在時(shí)、頻域都具有表征信號(hào)局部特征的能力,因此有利于檢測(cè)信號(hào)的瞬態(tài)或奇異點(diǎn)。
在近紅外無損檢測(cè)技術(shù)中,從光譜的測(cè)定和預(yù)處理、異常樣本點(diǎn)的剔除、校正集和預(yù)測(cè)集樣本的選擇到模型的優(yōu)化整個(gè)過程中,每一個(gè)環(huán)節(jié)都可能影響模型的預(yù)測(cè)性能[9,10]。因此,在建立光譜校正模型前,需對(duì)光譜樣本進(jìn)行異常樣本剔除、對(duì)光譜數(shù)據(jù)進(jìn)行必要的預(yù)處理和樣品集的有效劃分,以便增強(qiáng)光譜的有效信息和消除各種不確定因素的影響,獲得預(yù)測(cè)性能高的數(shù)學(xué)模型。
2.1 光譜數(shù)據(jù)預(yù)處理
導(dǎo)數(shù)光譜可以消除基線漂移和平緩背景干擾的影響,也可以提供比原光譜更高的分辨率和更清晰的光譜輪廓變化,但原始光譜經(jīng)導(dǎo)數(shù)處理后,會(huì)放大噪聲,降低原光譜的信噪比(嚴(yán)衍祿,2005)。對(duì)于導(dǎo)數(shù)光譜,嘗試用dbN小波消噪方法消除噪聲,提高信號(hào)的信噪比。將砂糖橘光譜首先轉(zhuǎn)化成一階導(dǎo)數(shù)光譜,然后分別選擇小波函數(shù)db2-db10,進(jìn)行2,3,4,5,6共 5層分解,不同小波函數(shù)不同層次分解消噪后的建模效果如表1所示。
表1 基于db小波消噪的導(dǎo)數(shù)光譜建模效果比較
小波變換有以下特點(diǎn):有多分辨率(multi-resolution),也叫多尺度(multi-scale)的特點(diǎn),可以由粗及細(xì)地逐步觀察信號(hào)??梢钥闯捎没绢l率特性為 的帶通濾波器在不同尺度a下對(duì)信號(hào)做濾波。由傅立葉變換的尺度特性可以知這組濾波器具有品質(zhì)因數(shù)恒定,即相對(duì)寬度(帶寬與中心
小波類型 分解層數(shù) Rc RMSEC Rv RMSECV 2 0.9265 0.5436 0.8586 0.7433 3 0.9202 0.5655 0.8709 0.7113 Db 64 0.9336 0.5176 0.8919 0.6541 5 0.9310 0.5273 0.8812 0.6855 6 0.9060 0.6116 0.8462 0.7752 2 0.9255 0.5473 0.8565 0.7483 3 0.9316 0.5252 0.8708 0.7135 Db 74 0.9332 0.5191 0.8886 0.6635 5 0.9370 0.5048 0.8799 0.6900 6 0.8969 0.6388 0.8404 0.7876 2 0.9248 0.5497 0.8538 0.7552 3 0.9356 0.5100 0.8734 0.7068 Db 84 0.9354 0.5107 0.8877 0.6663 5 0.9298 0.5318 0.8778 0.6944 6 0.9128 0.5900 0.8593 0.7443 2 0.9254 0.5475 0.8564 0.7489 3 0.9368 0.5056 0.8806 0.6874 Db 94 0.9348 0.5130 0.8944 0.6472 5 0.9279 0.5385 0.8764 0.6984 6 0.9096 0.6001 0.8456 0.7777 2 0.9240 0.5526 0.8543 0.7538 3 0.9335 0.5180 0.8735 0.7062 Db 104 0.9304 0.5296 0.8838 0.6775 5 0.9183 0.5719 0.8707 0.7128 6 0.9024 0.6226 0.8495 0.7665
由表1可知,原始光譜求一階導(dǎo)數(shù)過程中放大了噪聲,光譜出現(xiàn)尖峰干擾,如圖 3(a)所示,因此模型的穩(wěn)定性下降所致。因此有必要對(duì)其進(jìn)行小波消噪。通過小波消噪后,Rv有不同程度上升,RMSECV有不同水平下降,證明不同小波以及不同分解層次均有不同程度的消噪效果。
不同的小波函數(shù),消噪效果不同。以4層分解水平為例,以相關(guān)系數(shù)越大越好,均方根誤差越小越好,校正集數(shù)據(jù)與驗(yàn)證相應(yīng)集數(shù)據(jù)越接近越好這三條原則為判斷依據(jù),其消噪效果由好到差依次是db6-> db3-> db9-> db7-> db8-> db5->db2-> db4。
同一種小波,分解層次不同消噪的效果也不同。以db3小波為例,以第一個(gè)樣本為例,對(duì)其導(dǎo)數(shù)光譜進(jìn)行2,3,4,5,6層分解消噪,比較不同層次的消噪效果,如圖3所示。可見分解的層次越多,原始光譜與消噪光譜之間的差值越大。分解層次不夠,光譜中的噪聲消除不充分,會(huì)影響建模效果;反之,分解層次過多,在消除噪聲的同時(shí),將有用信息也進(jìn)行了消除,反而會(huì)降低建模精度。結(jié)合表1可見,以db3小波消噪時(shí),分解層次從適合到不適合依次是 4-> 3->5-> 2-> 6。
綜合比較發(fā)現(xiàn),經(jīng)過db6小波4層分解消噪后,Rc從原來的0.9305提高到0.9336,Rv從原來的0.8451提高到0.8944;經(jīng)過Db3小波3層分解消噪后,Rc從原來的0.9305提高到0.9386,Rv從原來的0.8451提高到0.8926,RMSEC和RMSECV相應(yīng)減小且更加接近,模型的精確度和穩(wěn)定性得到提高。可見一階導(dǎo)數(shù)光譜經(jīng)過db6小波3層分解和db3小波3層分解消噪后的建模效果最好。
圖3 db 3小波不同層次分解時(shí)的消噪效果比較
2.3 預(yù)處理效果驗(yàn)證
利用隨機(jī)劃分法將193個(gè)樣本劃分為145個(gè)校正集和48個(gè)預(yù)測(cè)集,校正集用于建立PLS模型,預(yù)測(cè)集用于預(yù)測(cè)所建模型的準(zhǔn)確性和可靠性。劃分校正集和預(yù)測(cè)集后的統(tǒng)計(jì)結(jié)果如表2所示。
表2 校正集和預(yù)測(cè)集的統(tǒng)計(jì)結(jié)果
校正集的最大值大于預(yù)測(cè)集的最大值,校正集的最小值小于預(yù)測(cè)集的最小值,校正集的標(biāo)準(zhǔn)偏差大于預(yù)測(cè)集的標(biāo)準(zhǔn)偏差,預(yù)測(cè)集水分含量范圍小于校正集水分含量范圍。用校正集中145樣本建模,并對(duì)預(yù)測(cè)集中的48個(gè)樣本進(jìn)行預(yù)測(cè),驗(yàn)證結(jié)果如表3所示,其中預(yù)測(cè)效果最好的模型D的預(yù)測(cè)回歸圖如圖4所示。
表3 經(jīng)最佳預(yù)處理后的PLS模型預(yù)測(cè)效果
說明基于導(dǎo)數(shù)光譜可以消除基線漂移和平緩背景干擾的影響,對(duì)提高建模精度有幫助。如果通過恰當(dāng)?shù)男〔ǚ纸鈩t可以在很大程度上消除引入的噪聲,其效果往往比基于原始光譜和導(dǎo)數(shù)光譜建立的模型效果要好。
圖4 模型D的預(yù)測(cè)回歸圖
探討了基于導(dǎo)數(shù)光譜的 dbN小波消噪,求一階導(dǎo)數(shù)過程中放大了噪聲,光譜出現(xiàn)尖峰干擾,因此基于導(dǎo)光譜的模型的穩(wěn)定性會(huì)下降。通過dbN小波消噪后,Rv有不同程度上升,RMSECV有不同水平下降,證明所有dbN小波在恰當(dāng)?shù)姆纸鈱哟紊暇胁煌潭鹊南胄Ч?。綜合比較發(fā)現(xiàn),基于小波函數(shù)DB3(分解尺度為3)消噪后的導(dǎo)數(shù)光譜最優(yōu),預(yù)測(cè)相關(guān)系數(shù)為0.8725,預(yù)測(cè)均方根誤差為0.6767。
[1]嚴(yán)衍祿,趙龍蓮,韓東海.近紅外光譜分析基礎(chǔ)與應(yīng)用[M].京:中國(guó)輕工業(yè)出版社,2005.
[2]何東健,前川孝昭,森島博.水果內(nèi)部品質(zhì)在線近紅外分光檢測(cè)裝置及試驗(yàn)[J].農(nóng)業(yè)工程學(xué)報(bào), 2001, 17 (1):146-148.[3]袁雷,劉輝軍,余桂英,等.柑橘品質(zhì)的近紅外光譜無損檢測(cè)[J].光譜實(shí)驗(yàn)室,2006,23(4):820-822.
[4]陸輝山,傅霞萍,謝麗娟,等.可見/近紅外光估測(cè)完整柑橘水果可溶性固形物含量的研究[J].光譜學(xué)與光譜分析,2007,27(9):1727-1730.
[5]夏俊芳,李小昱,李培武,等.基于小波變換的柑橘維生素 C含量近紅外光譜無損檢測(cè)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2007,23(6):170-174.
[6]劉燕德,陳興苗,孫旭東.可見/近紅外漫反射光譜無損檢測(cè)南豐蜜橘維生素 C[J].光譜學(xué)與光譜分析,2008,28(10):2318-2320.
[7]Slaughter D C,Thompson J F,Tan E S.Nondestructive determination of total and soluble solids in fresh prune using near infrared spectroscopy[J].Postharvest Biology and Technology. 2003, (28): 437-444.
[8]GB/T8858-1988,水果、蔬菜產(chǎn)品中干物質(zhì)和水分含量的測(cè)定方法[s].1988.
[9]Seasholtz M B,Kowalski B R. The parsimony principle applied to multivariate calibration[J].Analytica Chimica Acta,1993,277(2):165-177.
[10]史波林,趙鐳,劉文,等.蘋果內(nèi)部品質(zhì)近紅外光譜檢測(cè)的異常樣本分析[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2010,41(2):132-137.
[11]林萍,陳永明,何勇.基于可見近紅外光譜的糖類別快速鑒別研究[J].光譜與光譜學(xué)分析,2009,29(2):382-385.
Analysis of the Near Infrared Spectroscopy Based on Wavelet De-noising
DAI Fen, LI Yan, FENG Dong
(College of Engineering, South China Agricultural University, Guangzhou, 510642, China)
water content is one of the most important nutrition material in shatangju oranges. The fast and nondestructive examination of water content in sugar oranges is more and more important. Firstly, the spectra of Shatangju samples within 500-2500nm were decomposed in level 2-6 using the orthogonal wavelet functions DBn(n=2,3,…10). And then the de-noise results of different wavelet functions and different decomposing levels were compared. Wavelet de-noise (WD) was examined to be the optimal spectrum preprocessing method. The PLS model based on derivative spectra with DB3 wavelet de-noise (in decomposition level 3)produced best result (RMSEP=0.6767, Rp=0.8725 ).
Shatangju; Near infrared (NIR) spectrometry; Water content; Wavelet de-noising
A
1673-2219(2011)08-0036-04
2011-04-18
國(guó)家現(xiàn)代農(nóng)業(yè)(柑橘)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(xiàng)資金資助項(xiàng)目(農(nóng)科教發(fā)【2007】14號(hào),【2011】3號(hào));華南農(nóng)業(yè)大學(xué)校長(zhǎng)基金資助項(xiàng)目(4500-K09173)。
代芬(1978-),女,湖北天門人,博士,講師,研究方向?yàn)檗r(nóng)產(chǎn)品品質(zhì)無損檢測(cè)。
(責(zé)任編校:劉志壯)