姬玉梅,孫華
(鶴壁職業(yè)技術(shù)學(xué)院,河南鶴壁458030)
小麥主要品質(zhì)指標(biāo)的近紅外光譜分析模型建立
姬玉梅,孫華
(鶴壁職業(yè)技術(shù)學(xué)院,河南鶴壁458030)
以黃淮地區(qū)83個小麥品種為材料,采用SPXY算法篩選目標(biāo)集、用馬氏距離法進(jìn)行預(yù)處理、用SPA法提取敏感波點、用偏最小二乘法建模,研究建立小麥蛋白質(zhì)、濕面筋和沉降值的近紅外光譜預(yù)測模型,并利用預(yù)測集進(jìn)行驗證。結(jié)果表明,蛋白質(zhì)含量、濕面筋含量和沉降值3種測定結(jié)果相關(guān)系數(shù)r分別為0.996 7、0.999 5和0.997 9,說明所建模型與常規(guī)化學(xué)值有較好的相關(guān)性,有較高的可信度,為再進(jìn)行類似測定提供借鑒。
小麥;品質(zhì);近紅外光譜技術(shù);建模
小麥品種的品質(zhì)水平狀況,不僅是小麥作為商品糧的品質(zhì)基礎(chǔ),也是食品加工企業(yè)生產(chǎn)優(yōu)質(zhì)食品的重要物質(zhì)基礎(chǔ)[1-4]。近年來,我國在小麥品質(zhì)性狀遺傳改良方面取得明顯進(jìn)展,已培育出一些品質(zhì)較好的小麥品種在生產(chǎn)上應(yīng)用,但依然存在優(yōu)質(zhì)專用小麥品種數(shù)量不足和優(yōu)質(zhì)不高產(chǎn)等問題。缺乏對雜種早代材料進(jìn)行準(zhǔn)確快速鑒定評價的方法是主要的原因之一[5]。而近紅外光譜分析技術(shù)具有操作簡便、非破壞性測定、速度快、穩(wěn)定性好、效率高等特點,以及測定一次光譜可同時獲得多種品質(zhì)成分含量的獨特優(yōu)點,因此,近紅外光譜技術(shù)在農(nóng)作物品質(zhì)分析中得到了廣泛的應(yīng)用[6-11]。段國輝[12]等以河南省地方小麥新品種為材料,提出近紅外光譜測定方法可以用于分析小麥品質(zhì)。劉玲玲[13]等設(shè)計了基于光柵技術(shù)的近紅外檢測系統(tǒng)快速無損地檢測小麥品質(zhì),測試了該系統(tǒng)的準(zhǔn)確性、重復(fù)性和穩(wěn)定性,建立偏最小二乘回歸模型并驗證。其試驗表明該模型對平均光譜的預(yù)測效果優(yōu)于單張光譜,可應(yīng)用于小麥品質(zhì)質(zhì)量檢測。由于近紅外技術(shù)檢測必須收集具有代表性的樣品,考慮到區(qū)域的樣品特點,為此,本研究建立了一個新的適宜于黃淮地區(qū)小麥主要品質(zhì)近紅外光譜分析檢測模型,分別采用國標(biāo)化學(xué)方法和近紅外光譜建模分析法對83個黃淮地區(qū)大面積種植小麥品種主要品質(zhì)指標(biāo)的含量進(jìn)行了檢測,并對黃淮地區(qū)小麥主要品質(zhì)近紅外光譜分析檢測模型精確度進(jìn)行了驗證。
試驗使用黃淮地區(qū)主要推廣的百農(nóng)矮抗58(新系)、百農(nóng) 207、周麥 16、周麥 22、西農(nóng) 979、新麥 26、鄭麥7698、鄭麥366、濟(jì)麥22等45個品種和38個試驗材料,統(tǒng)一進(jìn)行編號檢測。
樣品的處理采用瑞士產(chǎn)布勒三皮三心試驗?zāi)ミM(jìn)行制粉,細(xì)度為過100目篩,面粉水分控制在13%~15%范圍內(nèi),取粉按一心粉+二心粉+一皮粉+二皮粉+三心粉+三皮粉+刷麩粉,出粉率在60%,粉樣經(jīng)充分混合后放置一周以后進(jìn)行測定。
分別采用GB/T 5511-2008《谷物和豆類氮含量測定和粗蛋白質(zhì)含量計算凱氏法》,采用GB/T 5506.2-2008《小麥和小麥粉面筋含量第2部分:儀器法測定濕面筋》,采用GB/T 21119-2007《小麥沉降指數(shù)測定法Zeleny試驗》,每個樣品3次重復(fù),取平均值。
光譜采集:光譜數(shù)據(jù)采集采用FOSS公司的Infratec TM 1241型近紅外光譜谷物品質(zhì)分析儀掃描樣品,掃描溫度均控制在21℃~25℃之間,掃描波長范圍為834 nm~1 094 nm,掃描步長為2 nm,掃描10次,并作樣品平行,取平均光譜值用于近紅外光譜分析。
模型建立步驟和方法:SPXY(Sample set partitioning based on joint x-y distance)算法是一種基于統(tǒng)計學(xué)的樣本集選擇方法,由KS(Kennard-Stone)法發(fā)展而來,優(yōu)點在于能夠有效地覆蓋多維向量空間,合理劃分校正集和預(yù)測集。連續(xù)投影算法(Successive Projection Algorithm,SPA)只需要原始光譜數(shù)據(jù)中的少數(shù)幾列數(shù)據(jù),就可以高度概括絕大多數(shù)樣品光譜的信息,最大程度的避免了信息重疊[14]。
本文采用SPXY算法篩選出具有代表性的定標(biāo)集樣本和預(yù)測集,以馬氏距離為指標(biāo)對定標(biāo)集、預(yù)測集樣本的光譜數(shù)據(jù)進(jìn)行預(yù)處理,采用SPA對預(yù)處理后的光譜數(shù)據(jù)進(jìn)行敏感波點提取,采用偏最小二乘法建立敏感光譜波點與小麥蛋白質(zhì)、濕面筋和沉降值之間的校正模型,用預(yù)測集數(shù)據(jù)對模型進(jìn)行檢驗與評價。此研究通過SPXY算法選擇70個樣本作為定標(biāo)集,剩余的13個樣本作為預(yù)測集。
評價指標(biāo)模型建立:對模型進(jìn)行評價常用的指標(biāo)有定標(biāo)均方根誤差(Root mean square error of calibration,RMSEC),均方根誤差(Root mean square error,RMSE),預(yù)測均方根誤差(Root mean square error of prediction,RMSEP),定標(biāo)相關(guān)系數(shù)(Calibration correlation coefficient,Rc),預(yù)測相關(guān)系數(shù)(Prediction correlation coefficient,Rp)等,表達(dá)模型好壞的一個常用方法是,校正集和預(yù)測集真值對預(yù)測值的散點圖。本文樣本的劃分、光譜數(shù)據(jù)預(yù)處理、波長點選取及模型的建立均通過MATLAB 7.0編程實現(xiàn)。模型的評價指標(biāo)為預(yù)測相關(guān)系數(shù)(r)和預(yù)測均方根誤差(RMSEP)。
本次試驗樣品處理分析結(jié)果如表1中所示,全部樣品中蛋白質(zhì)含量最大值為17.54%,最小值為9.67%,大多分布在11.00%~16.00%之間。濕面筋和沉降值的含量也有類似蛋白質(zhì)含量的特點,可見,所選樣品的蛋白質(zhì)、濕面筋和沉降值含量范圍覆蓋面大,數(shù)據(jù)分布較為合理,表明選取的樣品具有代表性。
表1 定標(biāo)集和預(yù)測集蛋白質(zhì)、濕面筋和沉降值含量分布Table 1 The calibration set and prediction set included protein,wet gluten and sedimentation value
小麥樣品及處理后的光譜比較見圖1。
由圖1通過對原始光譜和預(yù)處理后的光譜進(jìn)行比較,可以看出經(jīng)過預(yù)處理后的光譜圖基本上消除了基線漂移和基線傾斜,光譜特征峰顯著,更便于對后續(xù)的建模提供有用的信息。
采用SPXY算法從83個樣本中篩選出具有代表性的70個樣本作為定標(biāo)集,其余13個樣本作為預(yù)測集,表1即是利用SPXY算法劃分出的定標(biāo)集和預(yù)測集樣品分布情況。由表1可以看出,定標(biāo)集和預(yù)測集中樣本的蛋白質(zhì)、濕面筋和沉降值含量分布都較大,亦有較大的標(biāo)準(zhǔn)差,說明樣本間差異較大,具有較好的代表性,基本能夠代表全省各地小麥品種的品質(zhì)現(xiàn)狀。
圖1 小麥樣品及處理后的光譜圖Fig.1 The spectral image after samples of wheat processing
采用SPXY算法篩選目標(biāo)集、用馬氏距離法進(jìn)行預(yù)處理、用SPA法提取敏感波點、用偏最小二乘法建模這一搭配組合的近紅外光譜分析方法,建立常規(guī)分析方法測定的數(shù)據(jù)與預(yù)處理過的光譜數(shù)據(jù)之間的數(shù)學(xué)校正預(yù)測模型,如圖2至圖4。
圖2 蛋白質(zhì)化學(xué)值與預(yù)測值之間的相關(guān)性Fig.2 Protein chemistry values and the relationship between the predicted value
圖3 濕面筋化學(xué)值與預(yù)測值之間的相關(guān)性Fig.3 Relationship between chemicaly values and predicted value of wet gluten
圖4 沉降值預(yù)測值與化學(xué)值之間的相關(guān)性Fig.4 Relationship between sedimentation value chemicaly and predicted value
利用驗證樣品集的13個樣品,驗證所建立的近紅外光譜定標(biāo)模型的預(yù)測精度和可靠性。通過線性回歸,得到小麥籽粒蛋白質(zhì)、濕面筋和沉降值含量化學(xué)分析值和模型預(yù)測值之間的相關(guān)關(guān)系,分別如表2和圖2至圖4所示。
表2 預(yù)測集樣品主要品質(zhì)指標(biāo)的化學(xué)值和模型預(yù)測值Table 2 The chemical value and the model predictive value of the main quality index of the sample
由表2可知,在13種預(yù)測集樣品中,77號樣品蛋白質(zhì)含量的化學(xué)值與預(yù)測值之間的差值(化學(xué)值絕對誤差)偏大,其余12種二者相互接近。
采用化學(xué)值絕對誤差的F檢驗,判定77號樣本為化學(xué)值異常,予以剔除后,對剩余預(yù)測集樣品的化學(xué)值和預(yù)測值進(jìn)行相關(guān)性分析,如圖2至圖4所示。
由圖2可以看到,趨勢線的斜率為0.994 6,相關(guān)系數(shù)為0.996 7;由圖3可以看到,趨勢線的斜率為1.020 8,相關(guān)系數(shù)為0.999 5;從圖4中可以看出,趨勢線的斜率為1.002 1,相關(guān)系數(shù)為0.997 9,每個圖中二者均接近于1,每個圖中校正模型的校正集預(yù)測均方根誤差(RMSEP)都小于5%,說明顯著性水平較高,因此所建立的小麥籽粒主要品質(zhì)指標(biāo)模型具有良好的預(yù)測性。
近年來,隨著人們對飲食安全的重視,快速、高效的對小麥品質(zhì)進(jìn)行類型檢測已發(fā)展成為一項重點研究課題。目前,許多學(xué)者在此項課題上己取得了一定的成果,如采用近紅外光譜分析技術(shù)實現(xiàn)小麥品質(zhì)類型的檢測。但目前的檢測方法仍存在一些問題,如所建模型不完善、模型預(yù)測精度不高等。就此問題許多學(xué)者進(jìn)行了不同程度的研究。錢海波[15]采用SPXY算法選擇具有代表性的校正集樣本,然后使用不同方法多光譜數(shù)據(jù)作預(yù)處理,增強(qiáng)光譜特征,在此基礎(chǔ)上分別采用偏最小二乘法回歸和BP神經(jīng)網(wǎng)絡(luò)方法建立了小麥蛋白質(zhì)、濕面筋及沉降值的校正模型。測試結(jié)果表明,蛋白質(zhì)、濕面筋預(yù)測相關(guān)系數(shù)分別為0.972 44和0.960 93,沉降值的校正模型相關(guān)性不理想。段國輝等[16]研究認(rèn)為近紅外品質(zhì)測定蛋白質(zhì)含量的校正值與國標(biāo)法測定結(jié)果吻合程度較好,濕面筋含量次之,而沉降值吻合程度較差。毛曉東[17]運用近紅外光譜分析了小麥按面筋強(qiáng)度分類的可行性,深入研究小麥類型監(jiān)測模型。
本研究結(jié)果表明,采用SPXY算法篩選目標(biāo)集、用馬氏距離法進(jìn)行預(yù)處理、用SPA法提取敏感波點、用偏最小二乘法建模這一搭配組合的近紅外光譜分析方法測定農(nóng)作物品質(zhì),結(jié)果能達(dá)到較高的校正相關(guān)系數(shù)。通過對近紅外光譜分析法與國標(biāo)法測得的小麥品質(zhì)結(jié)果進(jìn)行相關(guān)分析,蛋白質(zhì)含量、濕面筋含量和沉降值三種測定結(jié)果相關(guān)系數(shù)r分別為0.996 7、0.999 5和0.997 9,說明所建模型與常規(guī)化學(xué)值有較好的相關(guān)性,有較高的可信度。這一結(jié)果較其他報道都高,一方面可能受測試品種影響,另一方面可能是綜合多種處理和分析方法綜合運用的結(jié)果。
[1]朱天欽.食品專用面粉的種類及其質(zhì)量指標(biāo)[J].鄭州糧食學(xué)院學(xué)報,1985,19(1):10-16
[2]張國權(quán),魏益,歐陽韶陣,等.陜西關(guān)中小安品種品系的品質(zhì)分析[J].表類作物學(xué)報1998,18(2):18-21
[3]陳明引.面團(tuán)流變學(xué)特性與面包烘倍品質(zhì)的關(guān)系[J].糧食與油脂,1991(4):2-6
[4]馬長德,Liu G T,Rubenthaler G L.中國北部冬麥與美國太平洋兩北部冬安區(qū)小麥品種加工品質(zhì)的分析比較[J].作物學(xué)報,1987,13(2):130-134
[5]高居榮,韓秀蘭,孫彩玲,等.DA 7200近紅外儀在小麥品質(zhì)分析中的應(yīng)用研究[J].實驗室科學(xué),2009,2:173-176
[6]景茂,嚴(yán)衍祿,劉廣田.付里葉變換近紅外漫反射光譜法測定小麥單籽粒中蛋白質(zhì)含量[J].光譜學(xué)與光譜分析,1991,11(3):20-22
[7]李大群,王文真,張玉良.近紅外漫反射光譜法測定大豆和小麥中的蛋白質(zhì)含量[J].分析儀器,1990(4):45-50
[8]彭玉魁,李菊英,祁振英.近紅外光譜分析技術(shù)在小麥營養(yǎng)成份鑒定上的應(yīng)用[J].麥類作物,1997,17(2):33-35
[9]Paradkar M M,Sivzakesava S,Irudayaraj J.Discrimination and classification of adulterants in maple syrup with the use of infrared spectroscopic techniques[J].J Sci Food Agric,2002,3(83):71-72
[10]Barton I I,Franklin E.Theory and principles of near infrared spectroscopy[J].Spectroscopy Europe,2002,14(1):12-18
[11]何學(xué)超,郭道林,馮永建,等.小麥新陳快速鑒別方法的研究[J].糧食儲藏,2006(1):42-45
[12]段國輝,張園,高海濤,等.利用近紅外光譜技術(shù)分析不同類型小麥品質(zhì)[J].江蘇農(nóng)業(yè)科學(xué),2011(5):422-424
[13]劉玲玲,趙博,張銀橋,等.小麥品質(zhì)近紅外檢測系統(tǒng)的設(shè)計與試驗研究[J].光譜學(xué)與光譜分析,2013(1):92-97
[14]林松.近紅外光譜分析技術(shù)在啤酒酒精度檢測中的應(yīng)用研究[D].鎮(zhèn)江:江蘇大學(xué),2004
[15]錢海波.基于神經(jīng)網(wǎng)絡(luò)的小麥品質(zhì)建模與評估系統(tǒng)設(shè)計[D].哈爾濱:黑龍江大學(xué),2011
[16]段國輝,張園,高海濤,等.2011.近紅外光譜分析技術(shù)測定冬小麥主要品質(zhì)性質(zhì)[J].西北農(nóng)業(yè)學(xué)報,20(9):25-30
[17]毛曉東.基于多層SVM的面筋強(qiáng)度分類模型優(yōu)化研究[D].哈爾濱:黑龍江大學(xué),2014
Building a Near Infrared Spectral Analysis Model for Main Quality Indexes of Wheat
JI Yu-mei,SUN Hua
(Hebi Vocational and Technical College,Hebi 458030,Henan,China)
Taken 83 varieties of wheats in Huang-huai area as material,screened target set by SPXY Algorithm,pretreated by Mahalanobis Distance Method,extracted sensitive wave points by SPA Method,and modeled by PLS Method,a near infrared spectral prediction model for wheat protein,wet gluten and sedimentation value of wheat was researched and built,and verified by using the prediction set.The results showed that the correlation coefficient(r)of the three results of protein content,wet gluten content and sedimentation value were 0.996 7,0.999 5 and 0.997 9,indicating that there was a good correlation and high credibility between the model and the conventional chemical values,which could provide reference for similar determination.
wheat;quality;near infrared spectroscopy;modeling
10.3969/j.issn.1005-6521.2017.21.027
鶴壁市科學(xué)研究與技術(shù)開發(fā)計劃項目(20150613)
姬玉梅(1975—),女(漢),副教授,本科,主要從事作物營養(yǎng)研究。
2017-01-14