黃良平 杜澤麗 范留軍
摘要:玉米是生態(tài)農(nóng)業(yè)的關(guān)鍵農(nóng)作物之一,富含蛋白質(zhì)、纖維素、脂肪等物質(zhì),為實現(xiàn)優(yōu)質(zhì)玉米的培養(yǎng),需要對玉米營養(yǎng)品質(zhì)進行快速鑒定。同時,針對同一品種的玉米對不同頻率的光會產(chǎn)生不同光譜響應(yīng)數(shù)據(jù)的特點,為實現(xiàn)利用光譜建模快速鑒定玉米營養(yǎng)品質(zhì)的目的,提出了基于BP神經(jīng)網(wǎng)絡(luò)的平均影響值(BP_MIV)光譜因子篩選方法。利用 BP_MIV法篩選出對玉米營養(yǎng)品質(zhì)貢獻率大的波長對應(yīng)的光譜響應(yīng)數(shù)據(jù)列,同時由于光譜測量過程中受到試驗環(huán)境、儀器參數(shù)配置、光散射效應(yīng)等因素的影響,光譜響應(yīng)數(shù)據(jù)中除包含玉米樣品營養(yǎng)品質(zhì)含量的信息外,同時還存在各種噪音干擾,因此,對該響應(yīng)數(shù)據(jù)進行小波去噪處理,最后建立優(yōu)選波長因子下的小波神經(jīng)網(wǎng)絡(luò)玉米營養(yǎng)品質(zhì)鑒定預(yù)報模型。結(jié)果表明,篩選出的波長因子能較好地代表眾多光譜因子,對玉米蛋白質(zhì)的預(yù)報精度較傳統(tǒng)的統(tǒng)計方法要高。
關(guān)鍵詞:營養(yǎng)品質(zhì);BP_MIV;貢獻率;小波去噪;預(yù)報精度
中圖分類號: TP183;S127 ?文獻標(biāo)志碼: A ?文章編號:1002-1302(2020)17-0225-04
河南省地處中原地區(qū),是人口大省,也是我國重要的糧食產(chǎn)區(qū)。其中玉米又占其全部糧食產(chǎn)量的近1/5。玉米的營養(yǎng)品質(zhì)是指玉米中所含的蛋白質(zhì)、纖維素、脂肪等各種營養(yǎng)成分。為實現(xiàn)優(yōu)質(zhì)玉米的培養(yǎng),首先要對玉米的營養(yǎng)品質(zhì)進行快速鑒定。而光譜檢測法[1]是一種能快速檢測物質(zhì)成分含量的分析方法,它根據(jù)物質(zhì)的光譜響應(yīng)特征來鑒別物質(zhì)并確定化學(xué)組成和相對含量,而光譜測量受到試驗環(huán)境、儀器參數(shù)配置、光散射效應(yīng)等因素的影響,光譜響應(yīng)數(shù)據(jù)中除了包含樣品成分的信息,同時還存在各種噪音干擾,鑒于此,引入了小波分析理論[2-3]對這些響應(yīng)值進行去噪處理。同時由于不同波長的光譜響應(yīng)值之間必然存在包含或相關(guān)關(guān)系,若把這些因子全部引入到預(yù)報模型中,不但提高不了模型的預(yù)報精度,反而會因超大的數(shù)據(jù)運算而對模型本身和計算機有很高的要求,因此,本研究提出了基于神經(jīng)網(wǎng)絡(luò)的平均影響值(mean impact value based on BP,BP_MIV)光譜因子篩選方法[4]。最終利用該方法篩選出貢獻率大的波長因子,經(jīng)小波去噪處理后建立基于小波神經(jīng)網(wǎng)絡(luò)的玉米營養(yǎng)品質(zhì)鑒定模型,并與傳統(tǒng)的統(tǒng)計模型進行比較。
1 不同波長下響應(yīng)值的小波去噪
不同波長下測量得到的光譜響應(yīng)數(shù)據(jù)主要反映的是玉米營養(yǎng)品質(zhì)含量的信息,同時也不可避免地包含有噪聲信息,其基本模型[5]表示為
通過對式(1)中含噪聲信號yj進行去噪,進而恢復(fù)原始信號Lj′,利用小波對不同波長下的不同玉米樣品的響應(yīng)值進行去噪,主要分為3個步驟:
(1)對各個波長下的不同玉米樣品響應(yīng)值進行分解。確定一個正交小波基函數(shù)后對含噪聲信號yj進行N尺度的小波分解。
(2)高頻系數(shù)的閾值選擇。對各尺度下的高頻信號設(shè)定一個合適的門限閾值,通過含噪聲信號的絕對值與所選定的閾值進行比較確定信號的取舍。本研究采用幾乎硬閾值法對高頻系數(shù)進行處理。
(3)小波重構(gòu)。利用幾乎硬閾值法對高頻信號d1、d2、…、dN處理后得到的d1′、d2′、…、dN′和第N層的低頻系數(shù)cdN進行一維信號的小波重構(gòu)。
2 基于BP_MIV法的波長因子篩選
2.1 BP神經(jīng)網(wǎng)絡(luò)基本理論
BP神經(jīng)網(wǎng)絡(luò)(back propagation neural network)是一種非線性系統(tǒng)辨識工具,通過梯度下降的誤差后向傳播實現(xiàn),具有結(jié)構(gòu)簡單、操作性強、快速實現(xiàn)模式識別和函數(shù)模擬等優(yōu)點。通常網(wǎng)絡(luò)有輸入層、隱含層和輸出層,網(wǎng)絡(luò)模型結(jié)構(gòu)見圖1。
BP神經(jīng)網(wǎng)絡(luò)主要分2個階段進行學(xué)習(xí)[5-6]:
第1階段(正向傳播):輸入層信息經(jīng)過處理輸給隱含層,并由隱含層輸出:
輸出層計算各單元的輸出值并輸出:
式中:wkm、wnk分別為隱含層-輸入層權(quán)值、輸出層-隱含層權(quán)值,b1k、b2k為隱含層和輸出層閾值。
第2階段(反向傳播):計算誤差更新權(quán)重和閾值。誤差計算:
更新權(quán)值和閾值計算:
2.2 BP_MIV法對波長因子篩選
籠統(tǒng)地將所有波長因子下的玉米響應(yīng)值納入網(wǎng)絡(luò)模型中,會使得模型運算耗時過長,甚至不能收斂,不利于提高模型的預(yù)報精度和可靠性[7],因此要依據(jù)貢獻率對這些波長因子進行剔除,而本研究采取基于BP神經(jīng)網(wǎng)絡(luò)的MIV法對因子進行篩選?;贐P神經(jīng)網(wǎng)絡(luò)的MIV法的基本思想:采用214種光波長在4 000~10 000 cm-1 范圍內(nèi)對100種玉米樣品對應(yīng)的光譜響應(yīng)數(shù)據(jù)進行分析,同時采用生化方法精確檢測出該100種玉米樣品的蛋白質(zhì)、纖維素、脂肪的含量。對光波t對應(yīng)的100種玉米樣品的響應(yīng)數(shù)據(jù)分別加10%和減小10%,其他光譜響應(yīng)數(shù)據(jù)保持不變,得到2個數(shù)據(jù)樣本P_in(t)和P_de(t),分別進行BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練得result_in(t)和result_de(t),計算2次訓(xùn)練結(jié)果的差值并求平均值mean[result_in(t)-result_de(t)],直至t從波長1到波長214,即MIV-t。這214種光波長對玉米蛋白質(zhì)含量的MIV-t如圖2所示。
MIV-t值有正有負(fù),其符號代表相關(guān)的方向,絕對值大小代表影響程度,圖2是由BP_MIV算法運行10次,求得各次結(jié)果絕對值的平均值后作出的。可以看出,有142種波長對蛋白質(zhì)含量的影響在1.5%以下,43種波長貢獻率在1.5%~2.0%之間,29種波長的貢獻率在2.0%以上,且累計達74%,較好地反映了波長與蛋白質(zhì)含量貢獻率的關(guān)系,因此選擇這29種波長對應(yīng)的光譜響應(yīng)值進行建模。這29種波長的MIV-t如表1所示。
3 建立玉米營養(yǎng)品質(zhì)的BP神經(jīng)網(wǎng)絡(luò)預(yù)報模型
3.1 利用小波對光譜響應(yīng)值進行去噪處理
采用db6小波函數(shù)對篩選出的29種波長下的光譜響應(yīng)值進行尺度為j=3的分解,各層的高頻系數(shù)利用公式(2)去噪,最后應(yīng)用Mallat快速重構(gòu)算法獲得光譜響應(yīng)數(shù)據(jù)的濾波值。這29種波長對應(yīng)的光譜響應(yīng)數(shù)據(jù)濾波前后的信噪比(SNR)如表2所示。
由表2可知,經(jīng)過db6小波濾波后29種光譜響應(yīng)數(shù)據(jù)的信噪比均有所提高,濾波后的數(shù)據(jù)能更好地反映波長與玉米營養(yǎng)品質(zhì)含量之間的關(guān)系。
3.2 建立BP神經(jīng)網(wǎng)絡(luò)預(yù)報模型
篩選出29種波長對應(yīng)的前80種樣品的光譜響應(yīng)數(shù)據(jù)訓(xùn)練樣本,可見輸入層神經(jīng)元數(shù)為29,根據(jù)高大啟仿真經(jīng)驗公式[8]得出隱含層神經(jīng)元數(shù)為10,輸出層為蛋白質(zhì)含量,從而構(gòu)建29×10×1的小波BP_MIV模型。利用構(gòu)建的小波BP_MIV模型對后20種玉米樣品的蛋白質(zhì)含量進行預(yù)報,并與多元線性回歸模型[9]預(yù)報的結(jié)果進行比較,結(jié)果如表3所示。為更直觀地反映3種模型的預(yù)報演結(jié)果,作殘差圖(圖3)。
由表3和圖3可以看出,3種模型對玉米蛋白質(zhì)預(yù)報結(jié)果總體上均與生化方法實測值相符,3種模型的均方根誤差(RMSE)分別為1.31、1.11、0.86 g;平均相對偏差(RAD)分別為10%、8%、7%,表明基于BP網(wǎng)絡(luò)的玉米蛋白質(zhì)非線性擬合模型較多元線性回歸模型預(yù)報的結(jié)果更穩(wěn)定,且精度更高;同時,經(jīng)過BP_MIV預(yù)先篩選并利用小波去噪處理后所建立的小波BP網(wǎng)絡(luò)模型的預(yù)報精度最高,大部分樣品的蛋白質(zhì)含量與實測值吻合。
4 結(jié)束語
本試驗主要研究基于BP神經(jīng)網(wǎng)絡(luò)的MIV光譜篩選方法,針對光譜響應(yīng)值測量過程中存在的誤差,利用小波進行去噪,最終建立具有較高貢獻率波長因子的小波BP網(wǎng)絡(luò)模型,并應(yīng)用于玉米蛋白質(zhì)含量的預(yù)報中,結(jié)果表明,小波BP網(wǎng)絡(luò)模型在預(yù)報精度和算法收斂時間上均優(yōu)于不做預(yù)先處理和因子篩選的BP網(wǎng)絡(luò)模型,鑒于該模型在蛋白質(zhì)含量預(yù)報中的高精確性,還可利用該模型預(yù)報玉米其他營養(yǎng)物質(zhì)的含量,如脂肪、纖維素,進而為農(nóng)作物的營養(yǎng)物質(zhì)快速鑒定和預(yù)報提供一種思路。
參考文獻:
[1]周 竹,李小昱,高海龍,等. 馬鈴薯干物質(zhì)含量高光譜檢測中變量選擇方法比較[J]. 農(nóng)業(yè)機械學(xué)報,2012,43(2):128-133.
[2]梁 亮,楊敏華,臧 卓. 基于小波去噪與SVR的小麥冠層含氮率高光譜測定[J]. 農(nóng)業(yè)工程學(xué)報,2010,26(12):248-253.
[3]胡昌華,李國華,周 濤. 基于MATLAB 7.X的系統(tǒng)分析與設(shè) 計—— 小波分析[M]. 西安:西安電子科技大學(xué),2008.
[4]胡紀(jì)元,文鴻雁,周 呂,等. 基于IPSO-BP模型的大壩多源監(jiān)測數(shù)據(jù)預(yù)報與反演[J]. 大地測量與地球動力學(xué),2014,34(4):67-70.
[5]程正興,楊守志,馮曉霞. 小波分析的理論、算法、進展與應(yīng)用[M]. 北京:國防工業(yè)出版社,2007.
[6]謝國權(quán),戚 藍,曾新華. 基于小波和神經(jīng)網(wǎng)絡(luò)拱壩變形預(yù)測的組合模型研究[J]. 武漢大學(xué)學(xué)報(工學(xué)版),2006,39(2):16-19,27.
[7]蘇 博,劉 魯,楊方廷. GM(1,N)灰色系統(tǒng)與BP神經(jīng)網(wǎng)絡(luò)方法的糧食產(chǎn)量預(yù)測比較研究[J]. 中國農(nóng)業(yè)大學(xué)學(xué)報,2006,11(4):99-104.
[8]高大啟. 有教師的線性基本函數(shù)前向三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)研究[J]. 計算機學(xué)報,1998,21(1):80-85.
[9]李 想,徐偉平,郭永田,等. 信息技術(shù)應(yīng)用對農(nóng)戶農(nóng)業(yè)經(jīng)營收入的影響研究[J]. 中國農(nóng)業(yè)科技導(dǎo)報,2014,16(1):172-181.