郝 勇,吳文輝,商慶園
華東交通大學(xué)機電與車輛工程學(xué)院,江西 南昌 330013
飼料營養(yǎng)的精準配制不僅可以提高飼料的質(zhì)量,還可以節(jié)約成本。粗脂肪和粗纖維是飼料主要成分,其含量檢測是飼料精準配制的重要環(huán)節(jié),傳統(tǒng)的飼料成分方法為濕化學(xué)檢測方法其靈敏度和精確度高,但操作復(fù)雜、檢測時間長、成本高。近紅外技術(shù)作為一種快速無污染的檢測方法廣泛應(yīng)用于農(nóng)業(yè)、林業(yè)、化工、制藥等行業(yè)。如Sagrario Modrono等運用便攜式光譜儀實現(xiàn)了飼料中蛋白質(zhì)、粗纖維和淀粉等組分的實時測定[1]; Patrica A.Harris等運用近紅外光譜分析方法準確分析了馬蹄草的營養(yǎng)成分[2]; Lusia Mandrile等運用近紅外光譜進行飼料中蟲類蛋白含量的檢測等[3]。
本文利用近紅外光譜實現(xiàn)對飼料的粗脂肪和粗纖維的含量檢測,在利用近紅外光譜建立含量分析回歸模型前,采用光譜預(yù)處理方法和變量選擇方法來簡化模型,以提高模型分析精度。
收集了不同廠家不同時期生產(chǎn)的飼料樣本325個,包括乳豬飼料、中豬飼料和大豬飼料。在采集近紅外光譜前先將樣本利用高速萬能粉碎機(FW135)粉碎,過40目篩,制成粉末狀樣本。飼料的粗脂肪和粗纖維的實際含量按照國家標(biāo)準GB/T 6433—2006和GB/T 6434—2006確定。
使用瑞士步琦公司NIR-Flex N-500傅里葉近紅外光譜儀,其波數(shù)范圍為10 000~4 000 cm-1。為了保證光譜儀的正常運行和所獲光譜的一致性,飼料樣本的厚度統(tǒng)一為4 mm,實驗室溫度為10~30 ℃,濕度為30%RH~70%RH。本文共獲取352條飼料光譜,每條光譜由1 501個變量組成。
建立飼料粗脂肪和粗纖維定量識別模型時,352個樣本光譜根據(jù)x-y聯(lián)合距離劃分樣本集算法(sample set partitioning based on joint x-y distance,SPXY)按照2∶1比例劃分為校正集和預(yù)測集,校正集有235個樣本,預(yù)測集含有117個樣本[4]。
為消除背景噪聲的影響需要對原始光譜進行預(yù)處理。常用的光譜預(yù)處理方法主要分為兩大類: 光譜導(dǎo)數(shù)法和散射校正法,其中Norris-Williams導(dǎo)數(shù)法(Norris-Williams derivation,NW)和多元散射校正法(multiplicative scatter correction,MSC)有較好的光譜預(yù)處理效果[5-6]。
每條飼料的近紅外光譜有1 501個變量,其包含了飼料的全部信息。變量選擇方法通過選擇有用變量去除冗余信息來簡化模型,提高模型精度。變量選擇方法有很多,本文采用蒙特卡羅無信息變量消除法[7-9](Monte carlo based uninformative variable elimination,MCUVE)、變量組合集群分析法[10-12](variables combination population analysis,VCPA)和區(qū)間變量迭代空間收縮法[13-14](interval variable iterative space shrinkage approach,iVISSA)進行變量選擇并比較結(jié)果,從而確定最優(yōu)的變量選擇方法。
光譜經(jīng)過預(yù)處理和變量選擇后,利用校正集樣品建立飼料粗脂肪和粗纖維含量模型,再利用預(yù)測集樣品來對模型進行驗證,確定模型能否達到粗脂肪和粗纖維的含量分析要求。采用校正集相關(guān)系數(shù)Rc、預(yù)測集相關(guān)系數(shù)Rp、交叉驗證均方根誤差RMSECV、預(yù)測集均方根誤差RMSEP等指標(biāo)來評價模型的預(yù)測精度和穩(wěn)健性[15-17]。
飼料中粗脂肪和粗纖維的實際含量統(tǒng)計信息如表1所示。
表1 飼料中粗脂肪和粗纖維含量統(tǒng)計表(單位: %)
Table1Statisticaltableofcrudefatandcorasefibercontentinfeed(unitofcontent: %)
類別最大值最小值均值標(biāo)準差粗脂肪4.182.623.460.42粗纖維4.661.913.190.68
采用NW導(dǎo)數(shù)和MSC對光譜進行預(yù)處理。其中NW導(dǎo)數(shù)包括平滑法(NW0th)、一階導(dǎo)數(shù)法(NW1st)和二階導(dǎo)數(shù)法(NW2nd)三種方法,同時還利用NW1st-MSC方法來進行預(yù)處理。如表2所示為不同預(yù)處理方法的飼料粗脂肪和粗纖維含量模型結(jié)果。
表2 不同預(yù)處理方法的飼料粗脂肪和粗纖維含量模型結(jié)果
通過表2可以看出,相比與原始光譜的PLS模型,經(jīng)NW0th,NW1st和NW2nd三種方法處理后的模型都沒起到明顯的效果。而MSC與NW1st-MSC方法對飼料噪聲去除有明顯效果,對粗脂肪模型精度有明顯的提升。在粗脂肪模型中,相比于NW1st-MSC方法,單獨使用MSC預(yù)處理方法能夠更好的實現(xiàn)光譜的信息提取,校正集的RMSECV由0.74下降到0.64,Rc由0.84提高到0.87。在粗纖維模型中,MSC的RMSEP相比于未經(jīng)處理的有著0.01的提升,而RMSECV與Rc基本相同; NW1st-MSC處理后的效果與原始光譜模型一致。因此,針對飼料的粗脂肪和粗纖維含量分析的光譜預(yù)處理采用MSC方法。圖1為飼料的原始近紅外光譜和經(jīng)過MSC預(yù)處理后的光譜。MSC修正了光譜間的相對基線平移和偏移,使光譜更為緊密。
圖1 飼料的近紅外光譜與MSC預(yù)處理后的光譜
飼料光譜經(jīng)過MSC預(yù)處理后,分別利用MCUVE,VCPA和iVISSA三種變量選擇方法結(jié)合PLS建立飼料粗脂肪含量分析模型。圖2為不同變量選擇方法的脂肪含量分析PLS模型校正和測試相關(guān)圖。
圖2(a)為利用經(jīng)過MSC預(yù)處理的光譜建立的PLS模型,其校正集和測試集的回歸直線基本重合,相關(guān)系數(shù)Rc和Rp分別為0.87和0.88。模型的RMSECV和RMSEP分別為0.21和0.20。圖2(b)為MSC-MCUVE-PLS模型,圖中可以看出校正集與測試集相比與MSC-PLS模型分布更為緊密,Rc為0.92,RMSECV為0.17。相比于全譜的模型其校正模型更為穩(wěn)定,精度更高。同時,Rp相較于MSC-PLS模型提高了0.01,且RMSEP降低了0.01,變量數(shù)Vn為400,大幅度降低。圖2(c)為MSC-VCPA-PLS模型,在校正模型中Rc為0.87,RMSECV為0.21與全譜的PLS模型相同,而Rp為0.81,RMSEP為0.25,與MSC-PLS模型相比起預(yù)測結(jié)果相差較多。Vn為12個,小于全譜變量數(shù)和MCUVE篩選后的變量數(shù)。圖2(d)為MSC-iVISSA-PLS模型,在此模型中Rc為0.86,RMSECV為0.21與全譜的校正集模型相同,同時預(yù)測集的Rp為0.87,RMSEP為0.20且與全譜的預(yù)測值相同,Vn為20與VCPA選擇的變量數(shù)近似。
圖2 不同變量選擇方法的飼料粗脂肪含量分析PLS模型校正和測試相關(guān)圖
通過圖2可以看出三種變量選擇方法中,經(jīng)MCUVE方法變量選擇后,其模型的各個參數(shù)都優(yōu)于全譜模型。經(jīng)VCPA和iVISSA方法選擇后都以極少的變量建立檢測模型且與全譜模型幾乎相同。若精度要求不高時,可以選擇VCPA和iVISSA方法進行變量選擇,建立更簡潔的模型; 若要提升精度,MCUVE則是最好的選擇。
如圖3為經(jīng)不同變量選擇方法的粗纖維定量分析模型相關(guān)圖。圖3(a)為經(jīng)MSC預(yù)處理后由全譜1501個變量建立的PLS模型,其校正集相關(guān)系數(shù)Rc為0.91,RMSECV為0.28,在測試集中Rp為0.95,RMSEP為0.25。圖3(b)為經(jīng)過MCUVE變量選擇后的模型,選擇后剩余740個變量用于模型分析,其Rc和Rp分別為0.95和0.94,較全譜模型的校正集Rc提高了0.04。同時RMSECV為0.23,較全譜模型降低了0.05,RMSEP降低了0.02,Vn為740,由此可知MCUVE變量選擇法有效地選擇了有用變量,提高了模型的精度。
圖3(c)為經(jīng)過VCPA變量選擇后建立的PLS模型,由圖可知,經(jīng)過VCPA選擇了11個變量來建立模型,相比與全譜和MCUVE方法,VCPA用極少的變量實現(xiàn)了幾乎相同的結(jié)果,其校正集Rc為0.91,RMSECV為0.27略好于全譜校正模型,預(yù)測集Rp和RMSEP都差于全譜。圖3(d)為iVISSA變量選擇后的飼料粗纖維檢測模型,模型的建立基于20個變量,其Rc為0.90,RMSECV為0.29,Rp為0.93,RMSEP為0.27相比與全譜和MCUVE模型較差,但較于VCPA模型更好。
對比三種變量選擇方法,可以看出MCUVE變量選擇方法校正集模型參數(shù)優(yōu)于全譜模型,而預(yù)測集的參數(shù)與全譜預(yù)測集參數(shù)幾乎一致,因其變量數(shù)少于全譜,則模型更為簡潔。利用VCPA和iVISSA進行變量選擇后,都剩余極少變量,部分有用信息變量被剔除,因而其模型參數(shù)較全譜都稍差一些,其優(yōu)點是模型簡單。
圖3 不同變量選擇方法的飼料粗纖維含量分析PLS模型校正和測試相關(guān)圖
近紅外光譜分析方法用于飼料中粗脂肪和粗纖維的定量分析,采用不同的光譜預(yù)處理方法和光譜變量選擇方法對光譜模型進行優(yōu)化。結(jié)果表明,在飼料粗脂肪定量分析中,MSC預(yù)處理方法結(jié)合MCUVE變量選擇方法可以建立最優(yōu)粗脂肪分析模型,模型變量數(shù)由1 501降低到400,RMSEP和RMSECV分別降低為0.19和0.17,Rp和Rc提高到0.89和0.92; 在飼料粗纖維定量分析中,利用MSC預(yù)處理方法和MCUVE變量選擇方法可以實現(xiàn)最優(yōu)的粗纖維定量分析模型,模型變量數(shù)為740,模型的RMSEP和RMSECV分別為0.23和0.23,Rp和Rc分別為0.94和0.95。因此,基于近紅外光譜建立的MSC-MCUVE-PLS模型可以有效的進行飼料的粗脂肪和粗纖維的定量分析,其精度高,穩(wěn)定性好且更簡潔。