張 林 黨 楠 楊 琳 李亞文 袁訓(xùn)鋒
(商洛學(xué)院電子信息與電氣工程學(xué)院,陜西 商洛 726000)
基于近紅外光譜技術(shù)預(yù)測(cè)玉米伏馬菌素
張 林 黨 楠 楊 琳 李亞文 袁訓(xùn)鋒
(商洛學(xué)院電子信息與電氣工程學(xué)院,陜西 商洛 726000)
為了更好地利用近紅外光譜分析技術(shù)對(duì)玉米伏馬菌素含量進(jìn)行預(yù)測(cè),減小因玉米產(chǎn)地間的差異對(duì)玉米近紅外光譜預(yù)測(cè)模型的影響,以不同產(chǎn)地的玉米作為研究對(duì)象,利用x-y共生距的方法將試驗(yàn)樣本劃分為校正集與驗(yàn)證集,采用經(jīng)典的偏最小二乘法分別建立不同產(chǎn)地和混合產(chǎn)地的玉米伏馬菌素預(yù)測(cè)模型,并采用驗(yàn)證集樣本分別對(duì)模型的預(yù)測(cè)精度進(jìn)行驗(yàn)證。為了減小建模及預(yù)測(cè)過(guò)程的運(yùn)算量,采用連續(xù)投影算法(SPA)和競(jìng)爭(zhēng)性自適應(yīng)加權(quán)算法(CARS)對(duì)不同產(chǎn)地玉米的近紅外光譜的特征波長(zhǎng)進(jìn)行篩選,篩選出22個(gè)特征波長(zhǎng)變量作為輸入,大大降低了建模及預(yù)測(cè)過(guò)程的運(yùn)算量,同時(shí)預(yù)測(cè)準(zhǔn)確度也有所改善,其預(yù)測(cè)相關(guān)系數(shù)達(dá)到0.954,為快速、無(wú)損地實(shí)現(xiàn)對(duì)玉米伏馬菌素的檢測(cè)提供了可靠的理論依據(jù)。
玉米;伏馬菌素;近紅外光譜;預(yù)測(cè)
伏馬菌素(Fumonisins,F(xiàn)Bs)是被國(guó)際衛(wèi)生組織列為幾種嚴(yán)重致癌真菌毒素之一[1],是在合適的溫度與濕度條件下由串珠鐮刀菌代謝產(chǎn)生的二級(jí)代謝產(chǎn)物,其主要存在于玉米等谷物中。20世紀(jì)80年代Gelder blom等[2]在玉米制品中發(fā)現(xiàn)并成功分離出了B1型伏馬菌素,緊接著Laurent等[3]對(duì)伏馬菌素進(jìn)行了深入的研究,發(fā)現(xiàn)伏馬菌素其實(shí)包含有兩種結(jié)構(gòu)極其相近的有毒有害物質(zhì),分別將其命名為伏馬菌素B1和伏馬菌素FB2,隨著研究的深入,如今研究者[3]已經(jīng)發(fā)現(xiàn)多種類型的伏馬菌素,其主要可以分為A、B、C和P 4種類型。在玉米中最常見(jiàn)的是FB1型伏馬菌素,在目前所發(fā)現(xiàn)的所有種類的伏馬菌素當(dāng)中,B1型伏馬菌素對(duì)人體的危害最大,毒性最強(qiáng)。
早在1993年國(guó)際癌癥研究院就把伏馬菌素列為強(qiáng)致癌物質(zhì)目錄,將伏馬菌素認(rèn)定為可以危害動(dòng)物和人體健康的物質(zhì)之一[4]。目前,國(guó)際衛(wèi)生組織認(rèn)為伏馬菌素是幾種具有重大研究意義的真菌毒素之一[4]。傳統(tǒng)的伏馬菌素測(cè)定方法主要是通過(guò)分析化學(xué)的方法進(jìn)行測(cè)定與研究[5],包括色譜測(cè)定法和濕化學(xué)分析兩種方法,這兩種方法能夠準(zhǔn)確測(cè)定伏馬菌素的含量,但測(cè)量過(guò)程繁瑣,無(wú)法實(shí)現(xiàn)實(shí)時(shí)、無(wú)損的測(cè)定[6]。
本研究擬在分析玉米近紅外光譜特征的基礎(chǔ)上,采用近紅外光譜分析技術(shù)間接對(duì)玉米中伏馬菌素含量進(jìn)行定量預(yù)測(cè)研究,同時(shí)采用偏最小二乘法(Partial least squares regression,PLS)建立玉米伏馬菌素含量預(yù)測(cè)模型,并對(duì)模型的精度與穩(wěn)定性進(jìn)行驗(yàn)證。
1.1 試驗(yàn)材料
試驗(yàn)中的玉米樣本選自陜西、山西、河南和黑龍江,從中挑選360個(gè)玉米樣本進(jìn)行試驗(yàn),其中80個(gè)樣本產(chǎn)自陜西,90個(gè)產(chǎn)自山西,100個(gè)產(chǎn)自河南,90個(gè)產(chǎn)自黑龍江。將玉米樣本破碎、篩選并依次編號(hào),標(biāo)記光譜采集區(qū)域。試驗(yàn)進(jìn)行前先將玉米樣本取出在20 ℃的室溫下放置12 h,使玉米樣本與室內(nèi)溫度保持一致,盡量減少試驗(yàn)中溫度對(duì)光譜采集的影響;
近紅外光譜儀:Antaris II型,美國(guó)Nicolet公司。
1.2 伏馬菌素測(cè)定與光譜采集
試驗(yàn)過(guò)程中采用Antaris傅里葉變換近紅外光譜儀對(duì)玉米的近紅外光譜進(jìn)行采集,選擇對(duì)波長(zhǎng)800~2 400 nm范圍的光譜進(jìn)行采集,掃描次數(shù)32次,分辨率3.0 cm-1。玉米樣本的光譜采集完成后采用數(shù)字阿貝折光儀對(duì)玉米中的伏馬菌素含量進(jìn)行測(cè)定。
1.3 樣本的劃分
試驗(yàn)中采用x-y共生距的劃分方法,同時(shí)兼顧樣本的x變量(近紅外光譜數(shù)據(jù))和y變量(玉米伏馬菌素含量)的歐氏距離。為了保證試驗(yàn)樣本在x-y的空間的權(quán)重相同,將xy的距離進(jìn)行標(biāo)準(zhǔn)化:
(1)
式中:
n——試驗(yàn)樣本總數(shù);
dx/y(p,q)——試驗(yàn)中任意的兩個(gè)樣本之間的歐氏距離[7];
在試驗(yàn)過(guò)程中分別對(duì)4個(gè)產(chǎn)地的玉米樣本進(jìn)行分組,分別將其分為校正集和預(yù)測(cè)集。
1.4 特征波長(zhǎng)的選取
由于近紅外光譜中不但包含有需要的效信息,且包含著大量的冗余信息[8],在試驗(yàn)的過(guò)程中采用連續(xù)投影算法(Successiveprojectionsalgorithm,SPA)和競(jìng)爭(zhēng)自適應(yīng)加權(quán)算法(CompetitiveAdaptiveReweightedSampling,CARS)的方法選取玉米伏馬菌素有效近紅外光譜的特征波長(zhǎng)。
1.5 玉米伏馬菌素近紅外光譜檢測(cè)模型的建立
偏最小二乘法(PLS)因其具有良好的抗干擾性能和穩(wěn)定性,已在近紅外光譜分析領(lǐng)域得到了廣泛的應(yīng)用[9],也是經(jīng)典的近紅外光譜建模方法之一。試驗(yàn)過(guò)程中首先采用偏最小二乘法分別建立單一產(chǎn)地的玉米伏馬菌素近紅外光譜檢測(cè)模型,然后再建立2個(gè)產(chǎn)地混合、3個(gè)產(chǎn)地混合和4個(gè)產(chǎn)地混合的玉米伏馬菌素近紅外光譜預(yù)測(cè)模型。最后,采用驗(yàn)證集玉米樣本分別對(duì)模型的預(yù)測(cè)精度和穩(wěn)定性進(jìn)行驗(yàn)證。
2.1 玉米樣品的近紅外光譜分析以及樣本的劃分
為了減少光譜噪聲的影響及運(yùn)算量,試驗(yàn)過(guò)程中選取4 000~12 000cm-1共計(jì)3 200個(gè)波長(zhǎng)點(diǎn)進(jìn)行研究。圖1為玉米樣本的原始漫反射近紅外光譜,僅從光譜圖很難區(qū)分不同產(chǎn)地玉米樣本光譜間的差異,對(duì)其進(jìn)行主成分分析可以發(fā)現(xiàn)前5個(gè)主成分(PrincipalComponent,PC)包含了光譜數(shù)據(jù)的99%以上的信息。采用非參數(shù)檢驗(yàn)(KruskalWallis)[10]的方法對(duì)玉米樣本的前5個(gè)主成分間的差異進(jìn)行檢驗(yàn),所有主成分對(duì)應(yīng)的P<0.05,表明不同產(chǎn)地的玉米近紅外光譜間存在著比較明顯的差異。
圖1 玉米原始光譜圖Figure 1 Corn raw spectra
在將試驗(yàn)所用玉米樣本進(jìn)行分組之前,首先采用馬氏距離、杠桿值和學(xué)生氏殘差檢驗(yàn)法對(duì)試驗(yàn)中樣本進(jìn)行檢驗(yàn),剔除其中的異常樣本,然后將樣本分為校正集和預(yù)測(cè)集兩組。不同產(chǎn)地玉米伏馬菌素含量測(cè)定值分布和分組情況見(jiàn)表1。
2.2 單一產(chǎn)地的玉米伏馬菌素近紅外預(yù)測(cè)結(jié)果
采用偏最小二乘法和校正集樣本分別建立不同產(chǎn)地玉米的伏馬菌素含量預(yù)測(cè)模型,然后分別采用事先準(zhǔn)備好的驗(yàn)證集樣本對(duì)模型的預(yù)測(cè)精度進(jìn)行驗(yàn)證,結(jié)果見(jiàn)表2。采用單一產(chǎn)地玉米樣本建立的玉米伏馬菌素近紅外預(yù)測(cè)模型在對(duì)相應(yīng)的玉米進(jìn)行預(yù)測(cè)時(shí)模型具有較好的預(yù)測(cè)精度(達(dá)到0.9以上),但該模型用于其他產(chǎn)地的玉米伏馬菌素含量進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)精度大幅度下降。
2.3 混合產(chǎn)地的玉米伏馬菌素近紅外光譜模型預(yù)測(cè)結(jié)果
為了克服單一產(chǎn)地建立的玉米伏馬菌素近紅外光譜模型在對(duì)其他產(chǎn)地玉米伏馬菌素含量預(yù)測(cè)時(shí)預(yù)測(cè)結(jié)果明顯變壞的問(wèn)題,試驗(yàn)中將4個(gè)產(chǎn)地的校正集玉米樣本進(jìn)行混合,建立混合產(chǎn)地的玉米伏馬菌素近紅外光譜預(yù)測(cè)模型,并采用4個(gè)產(chǎn)地的玉米對(duì)模型的預(yù)測(cè)精度進(jìn)行檢驗(yàn),結(jié)果見(jiàn)表3。通過(guò)對(duì)建模結(jié)果的分析,可以發(fā)現(xiàn)隨著選取建立模型的玉米產(chǎn)地種類混合數(shù)量的增加,模型的預(yù)測(cè)精度在不斷提高,將4個(gè)產(chǎn)地的玉米混合后作為校正集建立的玉米伏馬菌素預(yù)測(cè)模型的精度最佳。通過(guò)以上的研究可知,當(dāng)校正集樣本中包含的玉米種類增加,玉米樣本的近紅外光譜信息也增加,這樣建立的預(yù)測(cè)模型具有更好的適應(yīng)性,能夠減少因玉米產(chǎn)地的差異而導(dǎo)致對(duì)玉米伏馬菌素預(yù)測(cè)的影響。
2.4 混合產(chǎn)地模型的優(yōu)化
為了進(jìn)一步減小玉米伏馬菌素預(yù)測(cè)過(guò)程運(yùn)算的復(fù)雜性同時(shí)提高預(yù)測(cè)的精度,在4 000~12 000cm-1光譜范圍內(nèi),采用競(jìng)爭(zhēng)自適應(yīng)加權(quán)算法(CARS)對(duì)4個(gè)產(chǎn)地的玉米混合后的校正集樣本的伏馬菌素進(jìn)行有效特征光譜的篩選。由于通過(guò)競(jìng)爭(zhēng)自適應(yīng)加權(quán)算法得到的最優(yōu)采樣次數(shù)會(huì)有細(xì)微的差異,因此將進(jìn)行60次試驗(yàn),選取其得到的交叉驗(yàn)證均方根誤差(RMSECV)最小的一次,本次競(jìng)爭(zhēng)自適應(yīng)加權(quán)算法對(duì)玉米伏馬菌素特征波長(zhǎng)的選取過(guò)程見(jiàn)圖2。當(dāng)采樣次數(shù)為45次時(shí)系統(tǒng)的交叉驗(yàn)證均方根誤差最小,此時(shí)對(duì)應(yīng)的光譜特征變量個(gè)數(shù)為109。將選定的109個(gè)特征波長(zhǎng)作為輸入變量,建立玉米伏馬菌素近紅外光譜預(yù)測(cè)模型,其結(jié)果見(jiàn)表4。與全波段建模相比不但減少了預(yù)測(cè)過(guò)程的運(yùn)算量,且模型的預(yù)測(cè)精度也有所提升。
表1 玉米樣本伏馬菌素含量測(cè)試結(jié)果統(tǒng)計(jì)數(shù)據(jù)Table 1 Content of fumonisin corn sample test results of statistical data
表2 單一產(chǎn)地的玉米伏馬菌素近紅外光譜建模及檢測(cè)結(jié)果?Table 2 Single origin of fumonisin corn near infrared spectrum modeling and testing results
?A為陜西,B為山西,C為河南,D為黑龍江;RP為預(yù)測(cè)集相關(guān)系數(shù);RMSEP為預(yù)測(cè)均方差。
表3 混合產(chǎn)地的玉米伏馬菌素近紅外光譜模型預(yù)測(cè)結(jié)果?Table 3 Hybrid origin of fumonisin corn near infrared spectrum model predicted results
? A為陜西,B為山西,C為河南,D為黑龍江;RP為預(yù)測(cè)集相關(guān)系數(shù);RMSEP為預(yù)測(cè)均方差。
采用競(jìng)爭(zhēng)自適應(yīng)加權(quán)算法剔除了玉米近紅外光譜中的大量無(wú)效信息,但剩余的109個(gè)特征波長(zhǎng)的光譜中仍然包含著一些具有共線性的冗余信息,接下來(lái)采用連續(xù)投影算法(SPA)在109個(gè)有效光譜點(diǎn)中進(jìn)一步優(yōu)選,剔除冗余項(xiàng),得到22個(gè)玉米近紅外光譜特征波長(zhǎng)變量,并用這22個(gè)特征波長(zhǎng)建立玉米的伏馬菌素含量預(yù)測(cè)模型。與全波段建模相比采用SPA簡(jiǎn)化后的模型更加簡(jiǎn)單,其對(duì)4個(gè)產(chǎn)地玉米的預(yù)測(cè)集樣本伏馬菌素檢測(cè)相關(guān)系數(shù)Rp=0.954,預(yù)測(cè)均方根誤差RMSEP=0.417。應(yīng)用該模型對(duì)4個(gè)不同產(chǎn)地的玉米伏馬菌素預(yù)測(cè)結(jié)果見(jiàn)圖3。通過(guò)去除光譜中的冗余信息,不但減少了建模與預(yù)測(cè)過(guò)程中的運(yùn)算量,同時(shí)進(jìn)一步提高了模型的預(yù)測(cè)精度。
圖2 競(jìng)爭(zhēng)自適應(yīng)加權(quán)算法對(duì)玉米近紅外光譜特征變量的篩選Figure 2 Competition adaptive weighting algorithm for corn screening of near infrared spectral characteristics of the variable
表4 玉米伏馬菌素模型優(yōu)化結(jié)果Table 4 Fumonisin corn model optimization results
? A為陜西,B為山西,C為河南,D為黑龍江;RP為預(yù)測(cè)集相關(guān)系數(shù);RMSEP為預(yù)測(cè)均方差。
圖3 采用CARS+SPA優(yōu)化模型的預(yù)測(cè)集樣本預(yù)測(cè)結(jié)果 與真實(shí)值散點(diǎn)圖
Figure3UsedCARS+SPAoptimizationmodelsetsamplepredictionresultsandtherealvalueofascatterdiagram
本試驗(yàn)以4個(gè)產(chǎn)地的玉米作為研究對(duì)象,采用近紅外光譜分析技術(shù)對(duì)玉米伏馬菌素檢測(cè)方法進(jìn)行了研究。研究發(fā)現(xiàn)采用混合產(chǎn)地的玉米樣本建立的模型相比采用單一產(chǎn)地玉米樣本建立的模型具有更好的適應(yīng)性。為了減少建模及預(yù)測(cè)過(guò)程的運(yùn)算量,試驗(yàn)中采用CARS+SPA從光譜的3 200個(gè)自變量中篩選出有效的22個(gè)特征光譜作為系統(tǒng)的輸入變量,大大減少了系統(tǒng)的運(yùn)算量和模型的復(fù)雜程度,同時(shí)預(yù)測(cè)結(jié)果也有所改善。試驗(yàn)結(jié)果表明在對(duì)含有不同產(chǎn)地的玉米建立預(yù)測(cè)模型時(shí),玉米的近紅外光譜中含有大量的線性變量,有效剔除這些共線性變量能夠提高玉米伏馬菌素含量的預(yù)測(cè)精度,減小由于玉米產(chǎn)地差異對(duì)玉米伏馬菌素近紅外光譜檢測(cè)的影響。本研究方法能夠較好地克服由于不同產(chǎn)地、不同品種導(dǎo)致近紅外光譜對(duì)玉米伏馬菌素含量預(yù)測(cè)精度低、系統(tǒng)穩(wěn)定性差的問(wèn)題,采用本試驗(yàn)方法建立的模型具有更高的適應(yīng)性。
[1]CAMPSDachoupakanSirisomboon,REDDYPutthang,PETTRSirisomboon.Applicationofnearinfraredspectroscopytodetectaflatoxigenicfungalcontaminationinrice[J].FoodControl, 2013, 33(4): 207-214.
[2]SMITAT,MISHRAL.ArapidFT-NIRmethodforestimationofaflatoxinB1inredchilipowder[J].FoodControl, 2009, 20(11): 840-846.
[3]XIAChu.Researchprogressinthetechnologyforrapiddetectionofmycotoxinsingrainanditsproducts[J].ScienceandTechnologyofCereals,OilsandFoods, 2013, 21(3): 76-81.
[4]JAMESK.Deoxynivalenol:mechanismsofaction,humanexposure,andtoxicologicalrelevance[J].ArchToxicol, 2010, 84: 663-679.
[5] 袁景, 郭小玉, 楊天溪, 等. 基于光譜技術(shù)的食品中常見(jiàn)真菌霉素的快速檢測(cè)研究進(jìn)展[J]. 上海師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2015, 44(5): 571-579.
[6] 劉秀英, 申健, 常慶瑞, 等. 基于可見(jiàn)/近紅外光譜的牡丹葉片花青素含量預(yù)測(cè)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2015, 46(9): 319-327.
[7]SIMSDA,GAMONJA.Relationshipsbetweenleafpigmeritcontentandspectralreflectanceacrossawiderangeofspecies,leafstructuresanddevelopmentstages[J].RemoteSensingofEnvrionment, 2002, 81(2/3): 337-354.
[8] 鄒小波, 陳正偉, 石吉勇, 等. 基于近紅外高光譜圖像的黃瓜葉片色素含量快速檢測(cè)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2012, 43(5): 152-156.
[9] 劉秀英, 王力, 宋榮杰, 等. 黃綿土風(fēng)干過(guò)程中土壤含水率的光譜預(yù)測(cè)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2015, 46(4): 266-272.
[10] 李栓民, 郭銀巧, 王克如, 等. 小麥籽粒蛋白質(zhì)光譜特征變量篩選方法研究[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2015, 48(12): 2 317-2 326.
Forecasting method of Fumonisin in corn using near infrared spectra technique
ZHANG LinDANGNanYANGLinLIYa-wenYUANXun-feng
(SchoolofElectronicInformationandElectricalEngineering,ShangLuoUniversity,Shangluo,Shaanxi726000,China)
In order to forecast the content of fumonisin in corn using the infrared spectrum analysis technology, and reduce the differences caused by their yield region, the influence of experiment using 4 different origin of domestic corn were investigated. The method of usingx-yco-occurrencedistancecouldbedividedintocalibrationsampleandvalidationsets,usingtheclassicalanddifferentregionsbasedonthepartialleastsquares,andthenthepredictionmodeloffumonisinmaizehybridorigin,andUSESthevalidationsetsamplestovalidatethepredictionprecision,respectively.Inordertoreducethecomputationalcomplexityofmodelingandforecastingprocess,experimentsusingcontinuousprojectionalgorithm(SPA)andcompetitiveadaptiveweightingalgorithm(CARS)thecharacteristicsoftheinfraredspectraofdifferentorigincornwavelengthfilter,and22characteristicswerefilteredout.Thenthese22wavelengthswereinputasvariables,andthisgreatlyreducedthecomputationalcomplexityofmodelingandforecastingprocess,aswellasimprovedthepredictionaccuracy,withthecorrelationcoefficientat0.954.
Corn; Fumonisins; NIR; Predict
商洛學(xué)院科學(xué)研究項(xiàng)目(編號(hào):16SKY-FWDF005);商洛市科學(xué)技術(shù)研究發(fā)展計(jì)劃項(xiàng)目(編號(hào):SK2016-52)
張林(1986—),男,商洛學(xué)院講師,碩士。 E-mail:759013520@qq.com
2016—10—10
10.13652/j.issn.1003-5788.2017.02.012