摘要:在小麥(Triticum aestivum L.)幼苗生長過程中,將RBF神經網絡應用到可溶性糖含量的預測和數(shù)據(jù)變化的分析中,試驗數(shù)據(jù)經過RBF神經網絡的訓練和仿真后得到,網絡輸出結果的誤差小,網絡輸出矢量與目標矢量相關性好。說明可以將RBF神經網絡作為農作物幼苗生長中預測數(shù)據(jù)變化的有效方法。
關鍵詞:RBF神經網絡;小麥(Triticum aestivum L.)幼苗;可溶性糖;誤差;回歸分析
中圖分類號:TP273 文獻標識碼:A 文章編號:0439-8114(2013)02-0455-03
小麥(Triticum aestivum L.)是中國主要的糧食作物之一,干旱一直是影響小麥生產的最主要非生物脅迫因素[1]。在干旱脅迫條件下,植物為了減緩由脅迫造成的生理代謝不平衡,細胞大量積累了一些小分子有機化合物,如脯氨酸、甜菜堿等。其中,可溶性糖是干旱脅迫誘導的一種小分子溶質,其種類主要包括葡萄糖、海藻糖、蔗糖等。這些可溶性糖類參與滲透調節(jié),并可能在維持植物蛋白質穩(wěn)定方面起到重要作用[2]。在小麥發(fā)芽過程中多種酶類活力激增,淀粉、蛋白質、非淀粉多糖等組分都得到良好降解。發(fā)芽小麥中的淀粉酶主要包括α-淀粉酶、β-淀粉酶和極限糊精酶。
20世紀80年代末,Powell提出了徑向基函數(shù)(Radial-Basis Function,RBF)方法[3]。RBF神經網絡多用于函數(shù)逼近和分類問題的研究,函數(shù)逼近的目的就是找到一個函數(shù)能夠滿足一組輸入/輸出數(shù)據(jù)之間的關系[4]。經過理論證明,RBF神經網絡具有良好的任意非線性函數(shù)逼近能力和解析系統(tǒng)內在規(guī)律性的能力,并且具有極快的學習收斂速度[5]。在干旱條件下對小麥幼苗進行數(shù)據(jù)監(jiān)測發(fā)現(xiàn),在小麥幼苗生長過程中,其中的酶、淀粉以及可溶性糖的含量在不斷地發(fā)生變化,本研究試圖利用人工神經網絡分析它們之間的含量關系,并對可溶性糖的含量進行預測,意在對干旱脅迫條件下幼苗生長產生一定的指導作用。
1 材料與方法
1.1 材料
選用小麥品種百農207和華育198作為試驗材料,材料由河南科技學院遺傳育種實驗室提供。
1.2 方法
1.2.1 試驗設計 挑選子粒飽滿的種子用0.1% H2O2消毒30 min,沖洗3遍。取滅菌的小桶和沙土,試驗采用200 g/L聚乙二醇(PEG 6000)人工模擬干旱脅迫處理,桶中加200 g/L PEG-6000、沙土混合物(質量比為1∶4),厚度約10 cm。每桶播50粒種子,每個品種做5次重復,在光照培養(yǎng)箱中培養(yǎng),光照度12 000 lx,光暗周期14 h/10 h,晝夜溫度19 ℃/15 ℃,相對濕度60%,通過稱重法控制脅迫程度。待幼苗長至二葉一心時對每個品種進行指標測定,每個品種均分成兩組,分別測定數(shù)據(jù),一組數(shù)據(jù)作為訓練數(shù)據(jù),另一組作為測試數(shù)據(jù)。測定幼苗的淀粉含量、可溶性糖含量及α-淀粉酶和β-淀粉酶含量,試驗3次重復,每3天測定一次指標,訓練組共測定6組數(shù)據(jù),測試組測定5組數(shù)據(jù)。
1.2.2 指標測定 淀粉含量用蒽酮硫酸法[6]??扇苄蕴呛坑幂焱壬╗6]。α-淀粉酶和β-淀粉酶含量用比色法測定[6]。
2 結果與分析
通過試驗數(shù)據(jù)分析小麥幼苗淀粉酶含量、淀粉含量和可溶性糖含量的關系,并對可溶性糖含量進行預測。試驗挑選了百農207和華育198兩個品種,所測數(shù)據(jù)如表1和表2所示。表中前6組數(shù)據(jù)為訓練組數(shù)據(jù),后5組為測試組數(shù)據(jù);表中數(shù)據(jù)均為原始測得數(shù)據(jù)。數(shù)據(jù)分析在Matlab環(huán)境下進行,分別采用RBF神經網絡的兩種方法對數(shù)據(jù)進行訓練,以α-淀粉酶酶活、β-淀粉酶酶活、淀粉含量作為輸入量,以可溶性糖含量作為輸出量。首先利用函數(shù)Newrb創(chuàng)建一個廣義的RBF神經網絡,該函數(shù)在創(chuàng)建RBF神經網絡時,能自動增加隱含層神經元的數(shù)目,直到均方誤差滿足精度要求或者神經元數(shù)目達到最大為止[7]。這里取誤差為0.01%[5]。訓練網絡時取分布密度Spread為1。首先對數(shù)據(jù)進行歸一化處理,歸一化處理后數(shù)據(jù)分布在[-1,1]之間,然后用訓練數(shù)據(jù)對網絡進行訓練,接下來用測試數(shù)據(jù)對網絡進行仿真,驗證其預測性能。
先對百農207的數(shù)據(jù)進行訓練和仿真,當用測試數(shù)據(jù)測試訓練好的網絡時,得到仿真結果,可溶性糖含量為[0.201 1%,0.163 5%,0.261 4%,0.317 4%,0.298 4%],同實際值[0.227 0%,0.178 0%,0.230 0%,0.296 0%,0.305 0%]相比較,可得出預測誤差,誤差如圖1所示,可見誤差都在+0.04%以內,對于可溶性糖含量的預測來說,網絡的預測誤差并不大,說明網絡測試結果可信。同樣再對華育198的數(shù)據(jù)進行訓練和仿真,當用測試數(shù)據(jù)測試時,得到仿真結果的可溶性糖含量為[0.226 6%,0.242 4%,0.311 6%,0.305 0%,0.302 5%],同實際值[0.205 0%,0.241 0%,0.276 0%,0.306 0%,0.328 0%]相比較,誤差較小,誤差如圖2所示。通過兩個小麥品種的數(shù)據(jù)分析發(fā)現(xiàn),小麥幼苗在干旱脅迫條件下淀粉酶酶活、淀粉含量和可溶性糖含量之間確實具有一定的關系。
為了驗證網絡性能,利用Postreg函數(shù)對神經網絡的仿真結果進行線性回歸分析,可以得到目標矢量對網絡輸出的相關系數(shù)。其中目標矢量記為T,網絡輸出矢量記為A,相關系數(shù)記為R。當R為1時,輸出矢量和目標矢量之間的相關性最好。百農207的網絡輸出回歸曲線如圖3所示,由圖3可知,網絡輸出與目標矢量的相關系數(shù)為0.935,數(shù)據(jù)點分布合理,說明網絡性能較好,預測值可信度高。同樣再將華育198的測試樣本數(shù)據(jù)回代網絡中作回歸曲線,得到結果如圖4所示,由圖4可知,網絡輸出矢量與目標矢量的相關系數(shù)為0.885,數(shù)據(jù)點分布和最佳擬合線均與期望值接近,網絡性能較好。通過以上的網絡性能測試可知,RBF神經網絡可以作為小麥幼苗中可溶性糖含量預測的有效方法。
3 結論
淀粉是小麥的主要貯藏物質,在小麥萌發(fā)過程中,淀粉酶分解淀粉形成可溶性糖。糖作為代謝的中間產物或終產物調節(jié)了植物生長、發(fā)育、抗性形成等多個生理過程;同時參與了細胞內信號調節(jié)或轉導過程。本研究將RBF神經網絡應用到幼苗可溶性糖含量的預測和分析中,并對分析結果進行了性能測試和回歸分析,該模型不僅結構簡單、誤差小,而且計算準確性高,是預測和分析農作物在生長過程中糖含量的一種有效的方法。
參考文獻:
[1] 左文博,吳靜利,楊 奇,等.干旱脅迫對小麥根系活力和可溶性糖含量的影響[J].華北農學報,2010,25(6):191-193.
[2] 趙江濤,李曉峰,李 航,等.可溶性糖在高等植物代謝調節(jié)中的生理作用[J]. 安徽農業(yè)科學,2006,34(24):6423-6425,6427.
[3] POWELL M J D. Radial basis functions for multivariable interpolation:a review[A]. MASON J C,COX M G. Algorithms for approximation[C]. Oxford:Clarendon Press,1987. 143-167.
[4] 董長虹.MATLAB神經網絡與應用[M].北京:國防工業(yè)出版社,2005.
[5] 李 雪,熊建橋,邵秋萍,等. 基于BP神經網絡的微孔鉆削實時監(jiān)測[J].機床與液壓,2010,38(20):12-14.
[6] 陳毓荃.生物化學實驗方法和技術[M].北京:科學出版社,2005. [7] 羅成漢.基于MATLAB神經網絡工具箱的BP網絡實現(xiàn)[J].計算機仿真,2004,21(5):69-72.