張 樂(lè) 吳靜珠 李江波 劉翠玲 孫曉榮 余 樂(lè)
(北京工商大學(xué)食品安全大數(shù)據(jù)技術(shù)北京重點(diǎn)實(shí)驗(yàn)室1,北京 100048) (北京農(nóng)業(yè)智能裝備技術(shù)研究中心2,北京 100097)
玉米是目前我國(guó)種植面積最廣、產(chǎn)量第一的農(nóng)作物。隨著玉米機(jī)械化單粒精量播種技術(shù)的引入,我國(guó)玉米種植模式發(fā)生了深刻的改變[1]。單粒精量播種技術(shù)較傳統(tǒng)播種模式更有利于機(jī)械化操作,省工、省種、高產(chǎn),但是對(duì)每顆種子都提出了更高的檢測(cè)需求。根據(jù)GB 4404.1—2008[2],水分是我國(guó)農(nóng)作物種子質(zhì)量四大必檢項(xiàng)目之一。因此單粒玉米種子水分的快速、高通量、無(wú)損檢測(cè)對(duì)于單粒精量播種具有重要的現(xiàn)實(shí)意義。
GB/T 3543.6—1995《農(nóng)作物種子檢驗(yàn)規(guī)程 水分測(cè)定》中顯示,種子水分測(cè)量方法有低恒溫烘干法、高溫烘干法、高水分預(yù)先烘干法[3],這些方法測(cè)試精度高但普遍存在試樣破壞性、耗時(shí)長(zhǎng)、無(wú)法單顆測(cè)定等問(wèn)題。近紅外光譜(Near Infrared Spectrometry,NIR)技術(shù)以其快速、無(wú)損、綠色分析特點(diǎn)在種子質(zhì)量檢測(cè)領(lǐng)域迅速發(fā)展[4,5]。我國(guó)在2010年發(fā)布了玉米水分含量近紅外法測(cè)定的國(guó)家標(biāo)準(zhǔn)用于玉米水分測(cè)定[6]。沈廣輝等[7]將近紅外光譜技術(shù)與偏最小二乘法結(jié)合建立了玉米籽粒中水分、粗蛋白、粗灰分和總能的定量分析模型,其中水分檢測(cè)模型的預(yù)測(cè)集相關(guān)系數(shù)和均方根誤差分別為0.76,2.41。肖青青[8]將近紅外技術(shù)與等間隔組合偏最小二乘法結(jié)合建立了玉米粉的水分、粗脂肪的高性噪比近紅外波長(zhǎng)模型,其中水分檢測(cè)模型的預(yù)測(cè)集的相關(guān)系數(shù)和均方根誤差分別為0.943和0.278。國(guó)標(biāo)制定和文獻(xiàn)表明近紅外光譜技術(shù)在玉米水分檢測(cè)領(lǐng)域具有實(shí)際應(yīng)用可行性,但已有研究的檢測(cè)對(duì)象大都為經(jīng)過(guò)粉碎的玉米或是多粒玉米,難以滿足玉米精量播種技術(shù)對(duì)單粒種子水分的檢測(cè)需求。
本研究重點(diǎn)探索將近紅外光譜與化學(xué)計(jì)量學(xué)方法相結(jié)合,建立性能優(yōu)秀的單粒玉米種子水分快速、無(wú)損檢測(cè)定量檢測(cè)模型,以期為玉米精量播種技術(shù)的推廣和發(fā)展探索可行的檢測(cè)手段。
55組玉米樣本品種包括中地77、沈玉29、中地168、強(qiáng)碩68、奔誠(chéng)15和春育8。從每組樣本中分別選取2個(gè)玉米籽粒,共計(jì)110份玉米樣本。首先采用單籽粒采樣附件掃描近紅外光譜后, 再使用HB43-S鹵素水分測(cè)定儀測(cè)定每組樣本水分。
表1為110份玉米樣本的含水量統(tǒng)計(jì)信息。按照3∶1的比例隨機(jī)劃分訓(xùn)練集和測(cè)試集,其中訓(xùn)練集樣本82份,測(cè)試集樣本28份。
表1 樣本集統(tǒng)計(jì)信息
采用VERTEX 70傅里葉變換紅外光譜儀[9]及單籽粒采樣附件采集單粒玉米種子光譜,如圖1所示。為減少裝樣引起的干擾,放置樣本時(shí)統(tǒng)一將樣本胚面朝下,樣本朝向一致。儀器參數(shù)設(shè)定:波數(shù)范圍為4 000 ~ 12 500 cm-1,分辨率為8 cm-1,掃描次數(shù)為64次。樣本近紅外光譜如圖2所示。不同顆粒的玉米種子表面平整度不一且種子形態(tài)、種皮性質(zhì)均存在明顯差異,導(dǎo)致光譜采集過(guò)程中光反射、散射影響程度不同,從圖2中也可以看出,樣本集近紅外光譜在整個(gè)譜區(qū)范圍內(nèi)離散度較大。但是所有樣品的光譜趨勢(shì)基本一致,玉米近紅外光譜在波數(shù)為8 400、7 000、5 000 cm-1處有3個(gè)明顯的特征峰。 其中8 400、7 000 cm-1處的特征峰為 O—H 鍵二級(jí)振動(dòng),5 000 cm-1處的特征峰為 O—H 鍵一級(jí)振動(dòng),均與玉米中水分含量有關(guān)。
圖1 單粒玉米種子測(cè)樣
圖2 樣本集近紅外原始光譜
為了降低由種子形態(tài)等引起的光譜噪聲干擾,選擇采用合適的光譜預(yù)處理方法提升光譜質(zhì)量。本實(shí)驗(yàn)采用OPUS 7.2軟件,分析比較了一階導(dǎo)、二階導(dǎo)、歸一化、消除常數(shù)偏移量、以及多元散射校正結(jié)合光譜波段自動(dòng)譜區(qū)搜索組合所建立的模型性能,如下表2所示。
表2 基于不同光譜預(yù)處理組合的PLS模型性能比較
由表2可以看出,求導(dǎo)并不適用于單粒玉米種子光譜數(shù)據(jù)預(yù)處理,單粒種子光譜本身含有的噪聲較大,求導(dǎo)更加劇了噪聲的引入,因此大大降低了模型的準(zhǔn)確性;多元散射校正可以有效消除近紅外漫反射光譜中由于樣品的鏡面反射及不均勻造成的噪聲[10],消除光譜的基線漂移現(xiàn)象及光譜的不重復(fù)性,因此基于多元散射校正相對(duì)其他預(yù)處理方法而言,建立的單粒種子水分模型性能較好,其訓(xùn)練集的相關(guān)系數(shù)為0.81,留一交互驗(yàn)證均方根誤差(Root Mean Square Error of Cross Validation,RMSECV)為0.75;測(cè)試集的相關(guān)系數(shù)為0.93,預(yù)測(cè)均方根誤差(Root Mean Square Error of Prediction,RMSEP)為0.86。實(shí)驗(yàn)結(jié)果表明基于PLS的單粒種子水分模型性能一般。
本實(shí)驗(yàn)基于PLS的多元線性校正建模方法建模效果不是十分理想,分析其原因可能是由于單粒玉米種子光譜采集時(shí)引入的非線性干擾導(dǎo)致的,因此本實(shí)驗(yàn)探索采用在小樣本、非線性建模領(lǐng)域極具代表性的建模方法[11]——支持向量機(jī)(support vector machine, SVM)建立單粒種子水分近紅外模型。
在Matlab2016中使用Libsvm3.1軟件包,將原始光譜數(shù)據(jù)經(jīng)過(guò)多元散射校正預(yù)處理后再進(jìn)行訓(xùn)練和測(cè)試。支持向量機(jī)中常見(jiàn)的核函數(shù)有線性、多項(xiàng)式、RBF和Sigmoid核函數(shù)4種形式。為選擇合適的核函數(shù), 分別采用4種核函數(shù)建立SVM模型。運(yùn)行結(jié)果如表3所示。通常情況下,相較于其他核函數(shù),RBF核函數(shù)更適用于特征維數(shù)少、樣本數(shù)量正常、沒(méi)有先驗(yàn)知識(shí)的情況,RBF核函數(shù)的參數(shù)決定了它對(duì)于數(shù)據(jù)中的噪聲有著較好的抗干擾能力[12]。從表3可以得出基于RBF核函數(shù)建立的模型訓(xùn)練集和測(cè)試集的準(zhǔn)確性更高。實(shí)驗(yàn)采用網(wǎng)格搜索法確認(rèn)了RBF的核參數(shù),懲罰因子 C為1.174 1,核函數(shù)參數(shù)g為0.062 5。最終建立模型的訓(xùn)練集相關(guān)系數(shù)達(dá)到0.99,預(yù)測(cè)均方根誤差為0.05;測(cè)試集相關(guān)系數(shù)達(dá)到0.96,預(yù)測(cè)均方根誤差為0.71。相較于PLS模型而言,基于SVM的種子水分非線性檢測(cè)模型性能更優(yōu)。
表3 基于四種核函數(shù)的SVM模型性能比較
本研究采用多種光譜預(yù)處理方法消除單粒種子采集光譜時(shí)由于顆粒形態(tài)等引起的噪聲干擾,比較建立了基于PLS線性模型和SVM非線性模型的單粒玉米種子水分近紅外檢測(cè)模型。實(shí)驗(yàn)結(jié)果表明,光譜預(yù)處理結(jié)合SVM非線性模型可以有效降低單粒玉米種子近紅外光譜采集時(shí)引入的非線性干擾,有助于提升單粒玉米種子水分近紅外快速無(wú)損檢測(cè)實(shí)際應(yīng)用可行性,有望為玉米精量播種技術(shù)的推廣和發(fā)展提供可行的檢測(cè)手段。