于翠紅,樊翠芹,張麗,徐俊杰,劉朝芳,蔣春志,唐曉東
(河北省農(nóng)林科學(xué)院糧油作物研究所,河北省作物遺傳育種實(shí)驗(yàn)室,河北 石家莊 050035)
玉米是我國(guó)重要的糧食作物之一,也是飼料和加 工業(yè)原料的主要來(lái)源。近年來(lái),隨著人們生活水平的提高和膳食結(jié)構(gòu)的改變,玉米的用途發(fā)生了重大變化,玉米品質(zhì)也變得越來(lái)越重要。國(guó)家標(biāo)準(zhǔn)中玉米粗蛋白含量測(cè)定采用常規(guī)的化學(xué)分析法,不僅需要一系列的前處理,操作繁瑣,還破壞了被測(cè)定樣品的子粒結(jié)構(gòu),使樣品不能再作為種子利用。而且針對(duì)不同的化學(xué)成分需要不同的分析方法和程序,分析速度慢,不適于作物品質(zhì)育種工作中大批量早代育種材料的篩選。因此,選擇一種快速、無(wú)破壞測(cè)定玉米品質(zhì)性狀的方法尤為重要。
近紅外光譜(near-infrared reflectance spectroscopy,NIRS) 分析技術(shù)是利用化學(xué)物質(zhì)在近紅外光譜區(qū)內(nèi)的光學(xué)特性,快速測(cè)定樣品中一種或多種成分含量和特性的物理測(cè)試技術(shù)。該技術(shù)是20 世紀(jì)80 年代后期迅速發(fā)展起來(lái)的,具有檢測(cè)樣品用量少、檢測(cè)速度快、無(wú)污染、非破壞性測(cè)定以及測(cè)定一次光譜可同時(shí)獲得多種品質(zhì)成分含量等優(yōu)點(diǎn),目前廣泛應(yīng)用于工業(yè)[1]、農(nóng)業(yè)[2]、食品[3,4]、醫(yī)藥[5,6]等領(lǐng)域,在歐美等國(guó)家已成為農(nóng)作物品質(zhì)分析的重要手段[7]。與國(guó)外相比,我國(guó)NIRS 分析技術(shù)在作物育種上研究進(jìn)展較為緩慢。該技術(shù)雖然在一些重要農(nóng)作物的主要品質(zhì)性狀分析上得到了一定程度的應(yīng)用,并建立了相應(yīng)的定標(biāo)模型,但是在實(shí)際應(yīng)用過(guò)程中還存在著一些問(wèn)題。如,建立模型所用的樣本量少,構(gòu)建的模型實(shí)際適用性差;模型得不到及時(shí)維護(hù)和升級(jí),不能適應(yīng)育種需要等。本研究旨在通過(guò)采集適合黃淮海地區(qū)種植的普通玉米雜交種,采用NIRS 分析與常規(guī)化學(xué)測(cè)定法相結(jié)合的方法,建立一種快速檢測(cè)玉米品質(zhì)性狀的定標(biāo)模型,以實(shí)現(xiàn)玉米品質(zhì)育種過(guò)程中早代材料的無(wú)破壞大批量檢測(cè),提高育種效率。
NIRS 分析技術(shù)用于測(cè)定玉米品質(zhì)研究已經(jīng)取得了一定進(jìn)展[8,9],但由于其是一種間接的分析方法,測(cè)定樣品成分含量的方法是建立在化學(xué)測(cè)定法或其它儀器測(cè)定基礎(chǔ)之上,是一種“再生”的測(cè)定方法[10],因此,任何一臺(tái)近紅外光譜儀對(duì)每種組分或每種參數(shù)都要單獨(dú)定標(biāo)[11]。利用DA7200 型近紅外光譜分析儀建立玉米子粒粗蛋白定標(biāo)模型,探討其用于測(cè)定玉米子粒粗蛋白含量的可行性,旨為玉米品質(zhì)育種提供一種快速、簡(jiǎn)易的測(cè)定方法,以適應(yīng)玉米品質(zhì)育種的工作需要。
試驗(yàn)材料為適合黃淮海地區(qū)種植的具有代表性的玉米品系,共計(jì)598 份。
1.2.1 樣品光譜采集 采用DA7200 二極管陣列近紅外光譜分析儀〔瑞典波通(Perten) 公司生產(chǎn)〕收集光譜數(shù)據(jù)。該光譜儀帶有旋轉(zhuǎn)式樣品檢測(cè)盤,在波長(zhǎng)950~1 650 nm 范圍內(nèi)采集光譜,采樣間隔為5.0 nm,每個(gè)樣品采集2 次做雙平行實(shí)驗(yàn)。取平均光譜值用于NIRS 分析。
1.2.2 樣品化學(xué)值測(cè)定 粗蛋白含量測(cè)定采用UDK159 全自動(dòng)凱氏定氮儀,按照GB 5009.5—2016進(jìn)行;水分含量測(cè)定采用LSIS-B2V/VC 111 型電熱恒溫干燥箱和CP114 型電子天平,按照GB 5009.3—2016進(jìn)行。每個(gè)樣品重復(fù)測(cè)定2 次。粗蛋白含量為折干基后含量,指標(biāo)值取2 次測(cè)定結(jié)果的平均值。
1.2.3 玉米粗蛋白定標(biāo)模型的建立與驗(yàn)證
1.2.3.1 近紅外漫反射光譜采集和處理分析。對(duì)參試玉米材料分別進(jìn)行光譜掃描,得到598 份玉米近紅外原始光譜。對(duì)復(fù)雜有機(jī)物的光譜分析,要利用其全波長(zhǎng)信息,運(yùn)用化學(xué)計(jì)量學(xué)方法進(jìn)行研究。在近紅外漫反射光譜中,各種基團(tuán)存在特定吸收峰,由于不同基團(tuán)產(chǎn)生的光譜在吸收峰位和強(qiáng)度上不同,隨著樣品組成的變化,光譜特征也將發(fā)生變化,因此,需要根據(jù)測(cè)定樣品的NIRS 與它們的組成成分,通過(guò)合理的光譜處理及校正方法,建立樣品光譜與組成成分之間的校正模型。本研究中,利用瑞典波通(Perten) 公司生產(chǎn)的Unscrambler 9.8 光譜分析軟件,在軟件提供化學(xué)計(jì)量方法中選用一階求導(dǎo)與標(biāo)準(zhǔn)正態(tài)變量轉(zhuǎn)換法(SNV) 相結(jié)合的方法進(jìn)行光譜預(yù)處理,得到處理后的NIRS。將常規(guī)化學(xué)分析方法測(cè)得的數(shù)據(jù)輸入到光譜數(shù)據(jù)中進(jìn)行分析,回歸統(tǒng)計(jì)方法采用偏最小二乘法(partial least square,簡(jiǎn)稱PLS)[12,13]。
1.2.3.2 定標(biāo)模型的建立與衡量。以玉米粗蛋白的化學(xué)測(cè)定值為橫坐標(biāo)、近紅外預(yù)測(cè)值為縱坐標(biāo),得到定標(biāo)集散點(diǎn)圖,并進(jìn)行一元線性回歸分析。建立定標(biāo)模型后,利用定標(biāo)標(biāo)準(zhǔn)差(SEC)、預(yù)測(cè)標(biāo)準(zhǔn)差(SEP)、定標(biāo)相關(guān)系數(shù)(Rc) 和預(yù)測(cè)相關(guān)系數(shù)(Rp) 衡量模型的預(yù)測(cè)能力。要求有較小的SEC 和SEP,較大的Rc和Rp。一般情況下,SEC 和SEP 越小,Rc 和Rp 越大,定標(biāo)模型的預(yù)測(cè)能力越好。
1.2.3.3 定標(biāo)模型的驗(yàn)證。選取90 個(gè)具有代表性的玉米品種,采用國(guó)家標(biāo)準(zhǔn)中的化學(xué)方法測(cè)定其粗蛋白含量,利用建立的定標(biāo)模型進(jìn)行粗蛋白含量預(yù)測(cè)。對(duì)NIRS 分析結(jié)果與常規(guī)化學(xué)分析結(jié)果做線性圖并進(jìn)行分析。
598 份定標(biāo)集玉米樣品的粗蛋白含量為7.35%~14.42%,平均值為9.65%,標(biāo)準(zhǔn)差為1.77。樣品的粗蛋白含量范圍基本覆蓋了玉米生產(chǎn)和育種材料中粗蛋白含量的常態(tài)分布范圍,具有良好的連續(xù)性和代表性,滿足NIRS 定標(biāo)條件的要求。
2.2.1 近紅外漫反射光譜采集和處理分析 對(duì)598 份玉米材料分別進(jìn)行光譜掃描,結(jié)果(圖1) 顯示,在950~1 650 nm 波長(zhǎng)范圍內(nèi)存在多個(gè)吸收峰。利用Unscrambler 9.8 光譜分析軟件,采用一階求導(dǎo)與SNV 相結(jié)合的方法進(jìn)行光譜處理,得到處理后的近紅外光譜(圖2)。
圖1 598 份玉米的近紅外原始光譜Fig.1 Near infrared original spectra of 598 corn samples
圖2 一階求導(dǎo)和SNV 處理后的近紅外光譜Fig.2 Near infrared spectroscopy after first-order derivatives and SNV treatment
2.2.2 玉米粗蛋白定標(biāo)模型的建立 從玉米粗蛋白定標(biāo)集化學(xué)測(cè)定值與近紅外預(yù)測(cè)值的相關(guān)散點(diǎn)圖(圖3)可以看出,樣品測(cè)定結(jié)果數(shù)據(jù)點(diǎn)基本分布在直線兩側(cè),且偏離很小。通過(guò)一元線性回歸,得到定標(biāo)方程為y=0.886x+1.126,Rc 為0.941 3,SEC 為0.358 7,呈極顯著正相關(guān),說(shuō)明定標(biāo)集的預(yù)測(cè)值與化學(xué)測(cè)定值具有顯著的線性關(guān)系。
對(duì)90 個(gè)玉米品種粗蛋白含量的化學(xué)測(cè)定值與預(yù)測(cè)值(表1) 進(jìn)行比較,同時(shí),對(duì)NIRS 分析結(jié)果與常規(guī)化學(xué)分析結(jié)果做線性圖(圖4),得到預(yù)測(cè)回歸方程為y=0.93x+0.450 7,Rp 為0.972 1,SEP 為0.313 7。表明驗(yàn)證集各樣品的NIRS 分析結(jié)果與常規(guī)化學(xué)分析結(jié)果具有較好的線性關(guān)系,樣品較集中地分布在中心線附近,預(yù)測(cè)值與實(shí)測(cè)值較吻合,所建模型具有較好的預(yù)測(cè)效果。
圖3 玉米粗蛋白定標(biāo)集化學(xué)測(cè)定值與近紅外預(yù)測(cè)值的相關(guān)散點(diǎn)圖Fig.3 Scatter diagram of correlation between chemical determination value of corn crude protein calibration set and the near infrared predictions
NIRS 分析依靠樣品間光譜信息的細(xì)微差別來(lái)對(duì)樣品進(jìn)行定量或定性分析,是一種物理的分析方法,其分析結(jié)果受多種因素影響,主要是樣品的代表性和化學(xué)分析誤差。本研究所用材料為適合黃淮海地區(qū)種植的玉米雜交種,子粒類型包括馬齒型、硬粒型和中間型,子粒粗蛋白含量變化范圍為7.35%~14.42%,因此,樣品具有較好的代表性。
粗蛋白含量化學(xué)值的測(cè)定采用國(guó)家標(biāo)準(zhǔn)方法,每個(gè)樣品進(jìn)行2 次重復(fù)測(cè)定,目的在于減少化學(xué)分析造成的誤差。其次,掃描時(shí)樣品的粒度大小、均勻性等也會(huì)造成光譜誤差。本研究中,采取了重復(fù)裝樣、取平均光譜的方法,來(lái)消除玉米子粒樣品因粒度大小、均勻性不一致等因素造成的光譜誤差。此外,在建模前采用一階求導(dǎo)處理與SNV 相結(jié)合的方法對(duì)光譜進(jìn)行預(yù)處理,部分消除了光譜誤差,從而提高了所建模型的質(zhì)量。
王鐵固等[14]以玉米完整子粒為試驗(yàn)材料,采用偏最小二乘回歸法建立近紅外反射光譜測(cè)定其蛋白質(zhì)和淀粉含量的數(shù)學(xué)模型,模型預(yù)測(cè)結(jié)果與化學(xué)測(cè)定值的相關(guān)系數(shù)分別達(dá)到了0.946 9 和0.924 0,校正后模型預(yù)測(cè)的準(zhǔn)確性與化學(xué)測(cè)定方法相當(dāng)。趙環(huán)環(huán)等[15]利用付里葉近紅外漫反射光譜技術(shù)與PLS 法相結(jié)合對(duì)玉米子粒樣品的蛋白質(zhì)含量進(jìn)行分析,預(yù)測(cè)樣品相關(guān)系數(shù)為0.982,預(yù)測(cè)標(biāo)準(zhǔn)差為0.587,預(yù)測(cè)模型對(duì)樣品的預(yù)測(cè)結(jié)果比較理想,可以滿足農(nóng)產(chǎn)品品質(zhì)分析的要求。本研究中,驗(yàn)證集NIRS 的測(cè)試值與化學(xué)方法實(shí)測(cè)值相關(guān)系數(shù)為0.972 1,預(yù)測(cè)標(biāo)準(zhǔn)差為0.313 7,絕對(duì)差值介于-0.35~0.77,符合粗蛋白含量測(cè)定允許的誤差范圍,說(shuō)明定標(biāo)模型的預(yù)測(cè)值與化學(xué)測(cè)定值具有較高的一致性,預(yù)測(cè)效果較好,達(dá)到了品質(zhì)分析對(duì)準(zhǔn)確度的要求。與傳統(tǒng)分析技術(shù)相比,利用NIRS 分析技術(shù)進(jìn)行測(cè)定時(shí)不需要對(duì)分析樣品進(jìn)行破壞,分析過(guò)程中不消耗試劑和耗材,且檢測(cè)速度快(檢測(cè)1 個(gè)品種只需3 min)。因此,用所建定標(biāo)模型進(jìn)行玉米子粒粗蛋白品質(zhì)分析適用于大批量育種早代材料的篩選。
表1 玉米粗蛋白含量化學(xué)測(cè)定值與近紅外預(yù)測(cè)值的比較Table 1 Comparison of chemical determination values and near infrared predicted values of corn crude protein content (%)
圖4 玉米粗蛋白驗(yàn)證集化學(xué)測(cè)定值與近紅外預(yù)測(cè)值的相關(guān)散點(diǎn)圖Fig.4 Scatter diagram of correlation between chemical determination value of corn crude protein validation set and the near infrared prediction
雖然本研究所用材料具有較好的代表性,粗蛋白含量范圍基本覆蓋了玉米生產(chǎn)和育種材料的常態(tài)分布范圍,所得定標(biāo)模型的驗(yàn)證結(jié)果表明模型的預(yù)測(cè)值與化學(xué)測(cè)定值的相關(guān)系數(shù)達(dá)到0.972 1,可以利用該模型對(duì)玉米子粒粗蛋白含量進(jìn)行無(wú)損檢測(cè),指導(dǎo)玉米品質(zhì)育種早代材料的篩選,但是,樣品中粗蛋白含量的變化范圍尚不夠?qū)挿?,所收集的材料中缺少含量低?%和高于15%的樣品。因此,應(yīng)在現(xiàn)有研究的基礎(chǔ)上,增加一些有代表性的樣品,使樣品中粗蛋白成分的變化范圍足夠?qū)挿翰⒛芨采w今后玉米生產(chǎn)或育種材料中粗蛋白含量的變化范圍,同時(shí)對(duì)所建定標(biāo)模型做進(jìn)一步優(yōu)化,以提高模型的質(zhì)量,擴(kuò)大其應(yīng)用范圍。