曾玉婷 李 博 王 容 王炳銳 趙林姝 張文英 劉錄祥 徐延浩,*
(1 長江大學農(nóng)學院澇漬災害與濕地農(nóng)業(yè)湖北省重點實驗室,湖北 荊州 434025;2 華中農(nóng)業(yè)大學植物科學技術(shù)學院,湖北 武漢 430070;3 中國農(nóng)業(yè)科學院作物科學研究所,北京 100081)
小麥(TriticumaestivumL.)是中國第三大糧食作物,其產(chǎn)量及品質(zhì)的持續(xù)發(fā)展為保障國內(nèi)糧食安全做出了貢獻[1]。近年,人們對高抗性淀粉[2]、纖維[3]、花青素[4]、籽粒鋅元素[5]等特異品質(zhì)小麥材料需求越來越強烈。誘變育種技術(shù)是種質(zhì)資源創(chuàng)新,新基因挖掘和新品種(系)選育的一個重要途徑[6]。目前,誘變技術(shù)已經(jīng)在高抗性淀粉、籽粒高鋅元素含量等特異小麥材料創(chuàng)制上顯示出了重要作用[7]。但誘變突變體產(chǎn)生概率僅為10-6~10-9[8],因此,突變體篩選是制約誘變技術(shù)應用的關(guān)鍵[9],亟需開發(fā)快速、準確又有效的突變體篩選技術(shù)。
鑒別突變體的方法包括形態(tài)學鑒定、離體篩選方法、分子篩選等[6]。形態(tài)學方法簡便、直觀、成本低,但很難篩選籽粒品質(zhì)性狀突變體[10]。應用離體培養(yǎng)與誘變技術(shù)結(jié)合的方法可以篩選具有非生物脅迫耐受性突變體[11]。結(jié)合Tilling(定向誘導基因組局部突變技術(shù))分子篩選技術(shù)可以鑒定突變?nèi)后w中含有目標基因的個體[11],但該方法成本高,篩選工作量大。隨著高通量表型技術(shù)的發(fā)展,結(jié)合高通量表型技術(shù)可以快速獲取植物型信息,可用于表型突變體的篩選[12]。小麥籽粒品質(zhì)性狀的測定,如蛋白質(zhì),一般采用化學法,需要樣品量較多且一般都需要破壞樣品。隨著微量酶標儀、全自動直鏈淀粉分析儀等微量、高通量品質(zhì)測定儀器的改進與應用,品質(zhì)突變體的篩選有了較大進展,但這些方法需要對樣品進行復雜的前處理[13-14]。近些年,近紅外光譜技術(shù)廣泛應用于小麥籽粒蛋白質(zhì)含量測定[15-16],該方法具有無損、快速的特點,但是該技術(shù)譜帶寬,重疊嚴重,通常用于OH、NH、CH等基團的定量分析;而且近紅外光譜測定需要的樣品量較多,只適用于高世代株系的品質(zhì)性狀篩選。
衰減全反射傅里葉變換紅外光譜(attenuated total reflection-fourier translation infrared spectroscopy,ATR-FTIR)是一種分子振動光譜技術(shù)。ATR-FTIR通過樣品的反射信號獲得樣品表層有機成分的結(jié)構(gòu)信息,具有無需樣品前處理、測試速度快、檢驗成本低、對樣品形狀及含水量無特殊要求等優(yōu)點[17-18]。與近紅外相比,ATR-FTIR技術(shù)需要的樣品量少。應用ATR-FTIR技術(shù)可以實現(xiàn)繪畫顏料中蛋白質(zhì)種類的“不分離即分析”[19],并且可以對葡萄籽的多糖、木質(zhì)素、脂質(zhì)、果膠等物質(zhì)的主要基團進行定性分析,并鑒定不同產(chǎn)地的葡萄籽[20]。目前,用于ATR-FTIR定性分析的算法主要有主成分分析(principal component analysis,PCA)、判別分析(discriminant analysis,DA)[21]、Bootstrap法[22]、支持向量機(support vector machine,SVM)[23]。DA是基于馬氏距離法的“有監(jiān)督的模式識別法”,馬氏距離表示光譜數(shù)據(jù)之間的協(xié)方差距離。DA法首先計算訓練集樣品每個分類的平均馬氏距離,然后計算驗證集樣品離各個類中心的馬氏距離,通過比較兩者距離判斷樣品的類別。
本研究旨在應用ATR-FTIR技術(shù),探索建立小麥籽粒ATR-FTIR識別模型的最佳預處理方法,并應用新采集光譜和新品系分別進行外部驗證,檢驗小麥籽粒ATR-FTIR識別模型的準確性,在此基礎(chǔ)上,應用建立的最佳識別模型對小麥籽粒性狀突變體進行識別,拓寬小麥籽粒性狀突變體篩選途徑,同時為ATR-FTIR技術(shù)在小麥突變體育種中的應用提供線索。
用于籽粒品種(系)識別的小麥由揚州大學許如根教授惠贈,來源于中國小麥微核心種質(zhì)庫,突變體親本YUW-1-207由長江大學農(nóng)學院選育。突變體群體是由YUW-1-207經(jīng)50 Gy7Li離子束處理并獲得(由中國農(nóng)業(yè)科學院作物科學研究所/國家農(nóng)作物航天誘變技術(shù)改良中心進行輻射處理)。2017年秋季,將供試的91個小麥品種(系)材料(表1)、突變體及其對照株系在長江大學試驗基地點播成行,行長1.3 m,行距25 cm,每行16粒。田間管理按照常規(guī)。2018年從田間隨機選擇576行M5突變體與235行對照用于后續(xù)研究。試驗材料采用單穗掛牌的方法,每個株行選擇6個單穗,成熟后手工剪穗,并手工脫取穗中部飽滿、無病害、霉變的籽粒(每穗6粒)。
收獲的小麥籽粒烘干保存待用,測試平衡籽粒水分(13.0%)。采用NICOLET is5紅外光譜儀(美國Thermo Fisher Scientific公司)采集小麥籽粒的ATR-FTIR光譜,該儀器配有ATR附件。測量前,先用酒精棉擦拭ATR附件樣品臺,將小麥籽粒置于ATR晶體表面(腹股溝朝下),掃描范圍4 000~525 cm-1,光譜分辨率4 cm-1,掃描次數(shù)16次。通過空氣背景掃描自動扣除背景環(huán)境中CO2和H2O的影響。利用OMNIC 8.2軟件收集ATR-FTIR光譜數(shù)據(jù)。每顆小麥籽粒采集5次光譜數(shù)據(jù),取5次光譜的平均光譜作為測定光譜。用于小麥籽粒識別的91個小麥品種(系),每個品種(系)采集20顆籽粒(4粒/穗,5穗);突變體株系及對照每個材料采集10顆籽粒(2粒/穗,5穗)。
使用TQ Analyst 9軟件對小麥籽粒ATR-FTIR光譜進行預處理和構(gòu)建模型,7種預處理方法分別為多元散射校正(multiplicative scatter correction, MSC),MSC+Norris平滑(norris derivative filter, ND),MSC+ Savitzky-Golay平滑(SG),MSC+ND+一階導數(shù)(first derivative, FD)(MSC+ND+FD),MSC+ND+二階導數(shù)(second derivative, SD)(MSC+ND+SD)和MSC+SG+FD,MSC+SG+SD。MSC用來消除由于樣品大小不一致及分布不均產(chǎn)生的散射對光譜的影響;ND和SG平滑處理為了消除光譜信號中的隨機噪聲,提高樣本信號的信噪比;FD和SD處理后,可以消除基線和背景的干擾。以品種(系)識別錯誤數(shù)作為評價小麥籽粒ATR-FTIR識別模型優(yōu)劣的標準,并以此篩選預處理方式。
將小麥籽粒ATR-FTIR光譜數(shù)據(jù)導入TQ Analyst 9軟件,每個小麥品種(系)的光譜數(shù)據(jù)按照訓練集和驗證集7∶3劃分。首先計算訓練集中每個品種(系)內(nèi)光譜數(shù)據(jù)的平均馬氏距離,再計算驗證集每個光譜數(shù)據(jù)到每個品種(系)內(nèi)中心的馬氏距離。根據(jù)未知光譜數(shù)據(jù)到某已知品種(系)中心的馬氏距離判定未知光譜的品種(系),未知光譜數(shù)據(jù)到某品種(系)的馬氏距離越小,則未知光譜數(shù)據(jù)與該品種(系)匹配程度越高[24]。
首先對最佳小麥籽粒ATR-FTIR識別模型進行新采集光譜驗證。從小麥籽粒ATR-FTIR識別模型的71個品種(系)中,隨機選擇15個品種(系)作為外部驗證的品種(系)(表2),每個品種(系)重新采集10個光譜數(shù)據(jù)作為待驗證數(shù)據(jù)。
進一步對最佳小麥籽粒ATR-FTIR識別模型進行新品種(系)的驗證。選擇未參與小麥籽粒ATR-FTIR識別模型的20個小麥品種(系)(表1),每個品種(系)測定10個光譜數(shù)據(jù),共計200個光譜數(shù)據(jù)作為待建模數(shù)據(jù)。按照小麥籽粒ATR-FTIR識別模型篩選到的最佳預處理方式建立外部驗證模型,并結(jié)合模型的二維分類圖效果、品種(系)識別錯誤數(shù)來判斷識別模型的優(yōu)劣。
表1 小麥籽粒ATR-FTIR識別建模及驗證材料名稱和來源
將突變體及對照株系的ATR-FTIR光譜數(shù)據(jù)導入小麥籽粒ATR-FTIR識別模型,突變體和對照株系的光譜數(shù)據(jù)分別按照7∶3的比例分為訓練集和驗證集,分別計算突變體和對照株系訓練集中的平均馬氏距離,再分別計算驗證集光譜數(shù)據(jù)到突變體和對照株系中心的馬氏距離。根據(jù)突變體和對照株系訓練集中的平均馬氏距離、驗證集光譜數(shù)據(jù)到突變體和對照中心的馬氏距離對突變體光譜數(shù)據(jù)重新聚類,以此獲得潛在的籽粒性狀突變體株系。并用驗證集光譜數(shù)據(jù)到突變體和對照株系中心的馬氏距離繪制小麥籽粒性狀突變體識別二維聚類圖,直觀反映聚類結(jié)果。
通過ATR-FTIR對不同小麥品種(系)籽粒進行ATR-FTIR光譜采集。結(jié)果表明,小麥籽粒具有明顯的ATR-FTIR光譜特征吸收峰(圖1)。蛋白質(zhì)的主要吸收峰為1 642 cm-1的酰胺Ⅰ(C=O拉伸),1 540 cm-1的酰胺Ⅱ(C-N拉伸,N-H彎曲)和1 239 cm-1的酰胺Ⅲ(C-N和N-H拉伸);碳水化合物的主要吸收峰包括1 745 cm-1的C=O伸縮振動;脂質(zhì)的主要吸收峰包含2 872 cm-1的CH3對稱拉伸;此外木質(zhì)素的吸收峰為1 514 cm-1,淀粉的吸收峰為1 150 cm-1、1 124 cm-1[25]。由于光譜3 648 cm-1附近吸收峰推測為羥基O-H的伸縮振動,因此該波段范圍內(nèi)受水的干擾較大;Pearson相關(guān)系數(shù)分析表明,1 000~525 cm-1波段內(nèi)的不同品種(系)光譜數(shù)據(jù)間的相關(guān)性系數(shù)高達0.91,無法提供有效的品種(系)識別信息。故本研究選擇3 600~1 000 cm-1波段范圍進行后續(xù)分析。
圖1 小麥籽粒ATR-FTIR光譜圖
應用原始光譜建立的小麥籽粒ATR-FTIR識別模型,共有3個品種(系)判別錯誤;相比原始光譜的小麥籽粒ATR-FTIR識別模型,經(jīng)過MSC+SG、MSC+ND+FD、MSC+SG+SD、MSC+SG+FD和MSC+ND+SD預處理后的模型,其判別錯誤的品種(系)數(shù)目分別為5、5、13、21和24個品種(系);而應用MSC+ND預處理后能夠更好地實現(xiàn)小麥品種(系)的識別,判別錯誤的品種(系)為0。光譜的導數(shù)變換雖然可以消除基線漂移,強化譜帶特征、避免譜帶重疊,但本試驗將光譜FD和SD變換后,品種(系)判別錯誤數(shù)反而增加,這可能是由于導數(shù)變換后信噪比降低,因此光譜中的噪聲被擴大。綜上,用于小麥籽粒ATR-FTIR識別模型的光譜數(shù)據(jù)選用MSC+ND進行預處理更佳,其判別錯誤的品種(系)為0,能夠全部識別71個品種(系)。
小麥籽粒ATR-FTIR識別模型的光譜數(shù)據(jù)選用MSC+ND進行預處理,71個小麥品種(系)內(nèi)的平均馬氏距離分布在0.014 3~2.110 9范圍內(nèi);所有品種(系)內(nèi)最小馬氏距離分布在0.001 1~1.566 4之間,最大馬氏距離分布在0.083 4~6.085 1范圍內(nèi)(表2)。71個小麥品種(系)間的平均馬氏距離分布在3.816 8~9.806 1范圍內(nèi),最小馬氏距離分布在0.812 4~6.176 0范圍內(nèi),最大馬氏距離分布范圍為9.575 1~12.469 2(表2)。白火麥(NO.44)品系內(nèi)的最大馬氏距離最大為6.085 1,其余70個品種(系)與白火麥間的最小馬氏距離為5.105 8??逛P10號(NO.28)品系內(nèi)的最大馬氏距離最小為0.083 4,其余70個品種(系)與該品種(系)間的最小馬氏距離為0.812 4。比較71個品種(系)的馬氏距離發(fā)現(xiàn),各個品種(系)內(nèi)的最大馬氏距離均小于品種(系)間的最小馬氏距離。品種(系)內(nèi)的平均馬氏距離也都遠小于各個品種(系)間的平均馬氏距離(表2)。
表2 小麥品種(系)識別模型馬氏距離
表2(續(xù))
新采集光譜驗證結(jié)果顯示,京紅5號、農(nóng)大183等15個品種(系)的所有光譜數(shù)據(jù)均能被檢測正確,每個品種(系)的10個光譜數(shù)據(jù)到光譜數(shù)據(jù)實際品種(系)的馬氏距離均小于實際品種(系)內(nèi)的最大馬氏距離,新采集外部驗證結(jié)果與小麥籽粒ATR-FTIR識別模型結(jié)果一致。
采用紅皮小麥等20個未參與建模的小麥品種(系)(表1)進一步進行新品系的外部驗證。結(jié)果表明,20個小麥品種(系)內(nèi)的平均馬氏距離分布范圍為0.471 1~1.642 0,最大馬氏距離分布范圍為0.742 1~5.465 1,最小馬氏距離分布范圍為0.233 7~0.888 0;20個小麥品種(系)間的平均馬氏距離分布范圍為3.023 5~6.132 4,最大馬氏距離分布范圍為4.890 5~8.112 2,最小馬氏距離分布范圍為1.038 2~5.667 9(表2)。長治6406(A14)品種(系)內(nèi)最大馬氏距離最大5.465 1,其余19個品種(系)到該品種(系)之間的最小馬氏距離為5.667 9;紅皮小麥(A1)品種(系)內(nèi)的最大馬氏距離最小為0.742 1,其余19個品種(系)到該品種(系)的最小馬氏距離為1.657 2(表2)。20個小麥品種(系)內(nèi)的最大馬氏距離均小于品種(系)間的最小馬氏距離,該結(jié)論與71個小麥籽粒ATR-FTIR識別模型一致。同時發(fā)現(xiàn),品種(系)內(nèi)的平均馬氏距離遠小于各個品種(系)間的平均馬氏距離(圖2-A),選擇紅皮小麥(A1)和白蒲(A20)作為參考,繪制20個品種(系)到2個品種(系)的二維分類圖,該檢測分類圖效果佳,能夠直觀地區(qū)分出20個品種(系)(圖2-B)。綜合新采集光譜和新小麥品種(系)兩種外部驗證結(jié)果,應用MSC+ND預處理后建立的小麥籽粒ATR-FTIR識別模型最佳。
表3 小麥籽粒ATR-FTIR識別模型新采集光譜外部驗證馬氏距離
圖2 小麥籽粒ATR-FTIR識別模型新品種(系)外部驗證平均馬氏距離(A)及其分類圖(B)
應用本研究構(gòu)建的小麥籽粒ATR-FTIR識別模型計算訓練集中對照內(nèi)和突變體內(nèi)株系的平均馬氏距離、計算驗證集中的各個光譜數(shù)據(jù)到對照和突變體株系中心的馬氏距離。訓練集中對照株系內(nèi)的平均馬氏距離為0.603 3,突變體株系內(nèi)的平均馬氏距離為0.820 5;驗證集中對照株系光譜數(shù)據(jù)到對照株系中心的馬氏距離分布在0.209 6~3.601 1之間;突變體株系光譜數(shù)據(jù)到對照株系中心的馬氏距離分布在0.226 6~13.581 0之間。有4個突變體株系的光譜數(shù)據(jù)到對照株系中心的馬氏距離遠大于對照株系內(nèi)的平均馬氏距離(0.603 3);并且這4個突變體株系到對照中心的馬氏距離也遠大于驗證集中對照株系的最大馬氏距離(3.601 1),這4個突變體株系光譜數(shù)據(jù)到對照中心的馬氏距離分別為13.737 2、9.523 9、7.622 1、8.483 3(圖3)。本研究預測這4個突變體為潛在的籽粒性狀突變體株系(突變率為0.69%)。
圖3 突變體鑒別模型分類圖
探究小麥籽粒性狀突變體快速、準確、簡便、有效的鑒別方法可以提高小麥籽粒品質(zhì)篩選突變體的效率,進而提高誘變育種的效率,加快特異品質(zhì)小麥的改良進程。前人研究結(jié)果表明,不同預處理方法對光譜模型的建立有一定的影響[26]。第五鵬瑤等[27]采用9組數(shù)據(jù),通過一階導數(shù)、二階導數(shù)、中心化、多元散射校正(multiplicative scatter correction,MSC)等10種預處理方法的120種組合探討了預處理的必要性及預處理方法的選擇,結(jié)果顯示,對于多數(shù)數(shù)據(jù),采用合適的預處理方法可以提高建模效果。本研究結(jié)果表明,適合的預處理方式是提高模型分辨率的關(guān)鍵,不適合的預處理方法可能降低建模效果。
ATR-FTIR技術(shù)作為一種快速分析技術(shù)在物質(zhì)定性鑒別分類已有大量報道[28-30]。Cozzolino等[31]用ATR-MIR對大麥完整種子樣品中脂肪酸和總脂含量進行定量分析。魏霞等[32]比較了ATR-FTIR和NIR(近紅外)光譜技術(shù)測定大麥籽??剐缘矸酆?,而鮮見利用ATR-FTIR進行作物品種(系)識別和突變體鑒別的研究。
中遠紅外與近紅外光譜相比,振動產(chǎn)生的吸收帶較稀疏,易于解析吸收峰。近些年,王純陽等[15]、張樂等[33]嘗試應用近紅外采集單粒種子的光譜,但由于單粒種子體積小,近紅外采集的光譜信噪比相對較低;而配備有ATR附件的中遠紅外儀可精確、無損地檢測單粒種子的紅外光譜,且采集的光譜吸收帶稀疏,吸收峰易解析,信噪比高。因此,ATR-FTIR技術(shù)比NIR技術(shù)在籽粒性狀突變體的鑒別上更具有發(fā)展前景。本研究通過建立判別分析模型,有效實現(xiàn)了通過小麥籽粒ATR-FTIR光譜對已知小麥籽粒品種(系)進行識別和區(qū)分,并應用兩種外部驗證鑒定模型準確性,兩種外部驗證結(jié)果顯示該品種(系)識別模型效果佳,各個品種(系)無交差,能完全識別71個品種(系),并利用該模型預測了4個突變體株系,這為籽粒突變體篩選開辟了新途徑。
張紀元等[34]通過進行十二烷基磺酸鈉-聚丙烯酰胺凝膠電泳(sodium dodecyl sulfate polyacrylamide gel electrophoresis, SDS-PAGE)鑒定篩選獲得小麥突變體的概率為4.65%,陳洋等[35]報道的小麥表型突變率為7.38%。本研究采用ATR-FTIR技術(shù)鑒別出的小麥籽粒性狀突變率為0.69%。這可能是本研究僅對籽粒的部分性狀進行了相關(guān)鑒定,且ATR-FTIR技術(shù)識別的物質(zhì)種類有限,從而造成突變率較低。本研究發(fā)現(xiàn)品種(系)內(nèi)籽粒光譜的差異小于品種(系)間,基于此可將同一品種(系)識別為一個內(nèi)群。同時,本研究還比較了突變體和對照籽粒的光譜差異,區(qū)分出突變體籽粒光譜的微小差異。但是,本研究對于篩選到的突變體株系屬于何種品質(zhì)突變尚不明確,后續(xù)工作中還需收集更多的突變體光譜數(shù)據(jù),增加不同品種(系)的突變體以及更多品種(系)的籽粒光譜數(shù)據(jù),提高鑒別模型的準確性,并將化學分析法與模型結(jié)合,進行突變性狀的定量分析,從而豐富ATR-FTIR技術(shù)在小麥籽粒突變體鑒定上的應用。
本研究利用小麥籽粒ATR-FTIR光譜,采用判別分析方法建立了小麥籽粒品種(系)鑒別模型,并應用該方法開展小麥籽粒性狀突變體鑒定,為小麥籽粒性狀突變體篩選提供了快速、無損的方法。但該模型的通用性還需要更廣泛數(shù)據(jù)的驗證。