李楠楠,劉也嘉,林利忠,曹珍珍,趙思明,牛 猛,賈才華,張賓佳,,*
(1.華中農(nóng)業(yè)大學(xué)食品科學(xué)技術(shù)學(xué)院,湖北 武漢 430070;2.金健米業(yè)股份有限公司,湖南 常德 415001)
泰國(guó)茉莉香米外觀品質(zhì)優(yōu)良、氣味芳香,深受各國(guó)消費(fèi)者喜愛(ài),但由于其產(chǎn)量有限、價(jià)格較高,泰國(guó)茉莉香米中混摻普通白米的現(xiàn)象日趨嚴(yán)重,因此,國(guó)內(nèi)外科技工作者建立了系列用于鑒別大米摻偽的方法,包括感官檢驗(yàn)法、水煮法[1]、堿消度法[2]、DNA法[3-5]、蛋白質(zhì)電泳[4-5]、近紅外光譜技術(shù)[4]等。其中,近紅外光譜技術(shù)具有無(wú)損、快速、無(wú)污染等優(yōu)點(diǎn)[6-8],已應(yīng)用于大米新鮮度鑒別[9]、成分含量預(yù)測(cè)[10-11]、品種真?zhèn)舞b別[12]、產(chǎn)地 溯源[13-14]、定性定量預(yù)測(cè)[7,15]等方面。利用近紅外光譜技術(shù)研究不同地區(qū)(湖南、安徽、江西等7 ?。┑?0種稻米儲(chǔ)藏時(shí)間與品質(zhì)的變化關(guān)系,可建立用于稻谷新陳度判別的預(yù)測(cè)模型[16];以不同地域和品種的233 份大米為研究對(duì)象,利用近紅外光譜的特征波段能夠快速鑒別查哈陽(yáng)大米[17];利用近紅外光譜技術(shù)對(duì)建三江和五常地區(qū)的291 份大米進(jìn)行產(chǎn)地溯源,也具有較好的判別效果[16]。
若要解決泰國(guó)茉莉香米摻偽的問(wèn)題,必須在定性鑒別的基礎(chǔ)上,建立泰國(guó)茉莉香米的快速定量鑒定方法。作為常見(jiàn)的人工神經(jīng)網(wǎng)絡(luò)模型,BP神經(jīng)網(wǎng)絡(luò)具有操作簡(jiǎn)單、預(yù)測(cè)精度高、自適應(yīng)性好等優(yōu)點(diǎn)[17],適用于解決函數(shù)逼近、模式識(shí)別等問(wèn)題[18]。將BP神經(jīng)網(wǎng)絡(luò)與近紅外光譜結(jié)合可提高大米定量鑒定的準(zhǔn)確度和效率[19]。相關(guān)方法在大米的蛋白質(zhì)含量預(yù)測(cè)、水分含量預(yù)測(cè)等方面呈現(xiàn)出較好的應(yīng)用前景[20-22]。然而,對(duì)于如何建立基于紅外光譜和BP神經(jīng)網(wǎng)絡(luò)的泰國(guó)茉莉香米快速定量鑒定方法仍需系統(tǒng)研究。
因此,本研究以泰國(guó)茉莉香米及其摻偽樣品為研究對(duì)象,提取樣品的近紅外光譜特征信息并結(jié)合BP神經(jīng)網(wǎng)絡(luò)模型,建立泰國(guó)茉莉香米的快速定量鑒定方法,以期解決近紅外光譜等方法鑒別泰國(guó)茉莉香米時(shí)定量準(zhǔn)確率偏低的問(wèn)題,具有重要的實(shí)際應(yīng)用價(jià)值。
本實(shí)驗(yàn)選取8種大米(表1),均來(lái)源于金健米業(yè)股份有限公司。取普通米分別與5種泰國(guó)茉莉香米以90∶10、80∶20、70∶30、60∶40、50∶50、40∶60、30∶70、20∶80、10∶90比例進(jìn)行混合,每種混和米樣品制備3 份,每份300 g,3種普通米和5種泰國(guó)茉莉香米各1 份,共413 份混合樣品,用于后續(xù)近紅外光譜測(cè)試。
表1 大米基本信息Table 1 Information about rice samples tested in study
Supnir-2720型近紅外光譜儀 杭州聚光科技股份有限公司。
1.3.1 近紅外光譜采集
儀器條件:波長(zhǎng)范圍1 000~2 500 nm,光譜分辨率10 nm,波長(zhǎng)準(zhǔn)確性0.2 nm,掃描速率5 次/s。
將儀器預(yù)熱30 min后進(jìn)行儀器自檢、性能測(cè)試和白板參比,然后將混合均勻的90 g大米放入儀器自帶的直徑70 cm的樣品盒中,用樣品盒蓋壓平,將樣品盒放入指定位置,開(kāi)始光譜測(cè)定。測(cè)定條件:環(huán)境溫度15~25 ℃,波長(zhǎng)范圍1 000~1 799 nm,掃描間隔1 nm,儀器帶寬1 nm,采樣點(diǎn)數(shù)800,光譜重復(fù)性?xún)?yōu)于0.2 nm,信噪比優(yōu)于2 000∶1。每個(gè)樣品重復(fù)裝樣掃描6 次,取平均值。
1.3.2 樣本集劃分及特征波長(zhǎng)篩選
采用Kennard-Stone法將樣本集劃分為校正集和驗(yàn)證集[4,23],其中校正集樣本數(shù)占80%,驗(yàn)證集樣本數(shù)占20%??紤]變量之間的歐氏距離,在樣本光譜的特征空間中均勻選取樣本,依次選取歐氏距離最遠(yuǎn)的點(diǎn)進(jìn)入校正集[24],留下馬氏距離居中的點(diǎn)在驗(yàn)證集中,使光譜差異較大的樣本全部進(jìn)入校正集。
采用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣(competitive adaptive reweighted sampling,CARS)法篩選模型的特征波長(zhǎng),主要包括4個(gè)步驟:1)利用蒙特卡洛采樣法從校正集中選取樣本建立偏最小二乘模型;2)利用指數(shù)衰減函數(shù)去除回歸系數(shù)絕對(duì)值相對(duì)較小的點(diǎn),繼續(xù)利用蒙特卡羅采樣法采樣并建立偏最小二乘模型;3)評(píng)價(jià)每個(gè)變量的權(quán)重進(jìn)行變量篩選;4)利用交互驗(yàn)證法計(jì)算每次采樣后建立的偏最小二乘模型的交叉驗(yàn)證均方根誤差(root mean square error of cross validation,RMSECV),RMSECV越小表明剔除的無(wú)關(guān)變量數(shù)越多,RMSECV最小時(shí)對(duì)應(yīng)的變量子集即為最優(yōu)變量子集[25]。更為詳細(xì)的CARS算法過(guò)程及參數(shù)參考文獻(xiàn)[26-27]。
1.3.3 光譜預(yù)處理
為降低儀器狀態(tài)、樣品狀態(tài)與測(cè)量條件的差異造成近紅外光譜的平移或旋轉(zhuǎn),產(chǎn)生隨機(jī)誤差和系統(tǒng)誤差[28]。 本實(shí)驗(yàn)采用未處理、多元散射校正(multiplicative scatter correction,MSC)、Savitzky-Golay平滑、Savitzky-Golay導(dǎo)數(shù)、基線校正、標(biāo)準(zhǔn)正態(tài)變換(standard normal variate,SNV)等方法研究光譜預(yù)處理對(duì)模型性能的 影響[25],從而選出不同情況下最佳的預(yù)處理方式。
1.3.4 BP神經(jīng)網(wǎng)絡(luò)算法結(jié)構(gòu)設(shè)計(jì)和參數(shù)選擇
基于BP神經(jīng)網(wǎng)絡(luò)的非線性擬合算法,采用Matlab R2014a軟件研究BP神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)設(shè)計(jì)與參數(shù)選取,確定最佳的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。關(guān)于BP神經(jīng)網(wǎng)絡(luò)算法原理,參考文獻(xiàn)[29-30]。
1.3.4.1 訓(xùn)練函數(shù)的確定
BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中,權(quán)值和閾值的調(diào)整、修正通過(guò)訓(xùn)練函數(shù)完成,當(dāng)輸出層輸出值的誤差在允許范圍內(nèi)即停止訓(xùn)練[31]。常見(jiàn)的訓(xùn)練函數(shù)有traingd、traingdm、traingda、traingdx、trainlm,本實(shí)驗(yàn)研究5種訓(xùn)練函數(shù)對(duì)網(wǎng)絡(luò)性能的影響,選擇最適宜的訓(xùn)練函數(shù)。
1.3.4.2 節(jié)點(diǎn)傳遞函數(shù)的確定
常用S型函數(shù)作為BP神經(jīng)網(wǎng)絡(luò)的傳遞函數(shù),函數(shù)表達(dá)式見(jiàn)表2[17]。一般隱含層節(jié)點(diǎn)傳遞函數(shù)為對(duì)數(shù)S型函數(shù)或正切S型函數(shù),輸出層節(jié)點(diǎn)傳遞函數(shù)選擇線性函數(shù)或正切S型函數(shù)[32]。本實(shí)驗(yàn)隱含層節(jié)點(diǎn)傳遞函數(shù)、輸出層節(jié)點(diǎn)傳遞函數(shù)分別選擇對(duì)數(shù)S型函數(shù)、正切S型函數(shù)或線性函數(shù),確定最佳的節(jié)點(diǎn)傳遞函數(shù)。
表2 BP神經(jīng)網(wǎng)絡(luò)激活函數(shù)Table 2 BP neural network activation functions
1.3.4.3 網(wǎng)絡(luò)學(xué)習(xí)函數(shù)的確定
網(wǎng)絡(luò)學(xué)習(xí)函數(shù)在BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中主要是控制權(quán)值和閾值的變化量,調(diào)整小范圍的權(quán)值和閾值,最小化單個(gè)神經(jīng)元的誤差。利用BP學(xué)習(xí)規(guī)則learngd函數(shù)和帶動(dòng)量項(xiàng)的BP學(xué)習(xí)規(guī)則learngdm函數(shù),確定本研究最適宜的網(wǎng)絡(luò)學(xué)習(xí)函數(shù)。
1.3.4.4 隱含層層數(shù)與節(jié)點(diǎn)數(shù)的確定
對(duì)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)即為對(duì)BP神經(jīng)網(wǎng)絡(luò)的輸入層、隱含層和輸出層的設(shè)計(jì)。本實(shí)驗(yàn)輸入層的輸入值為近紅外光譜經(jīng)預(yù)處理后挑選的特征波長(zhǎng),輸出層的輸出值為泰國(guó)茉莉香米的預(yù)測(cè)含量。隱含層采用單隱層,神經(jīng)元數(shù)取3、4、5、6、7、8、9、10。
1.3.4.5 學(xué)習(xí)速率的確定
BP神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)訓(xùn)練過(guò)程中利用梯度下降法使權(quán)重沿誤差曲面的負(fù)梯度方向調(diào)整。本實(shí)驗(yàn)學(xué)習(xí)速率取值0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75。
由圖1可知,不同濃度的泰國(guó)茉莉香米在波峰、波形十分相似。光譜在1 200、1 440、1 570、1 720 nm附近有明顯吸收峰,在波段1 000~1 100、1 200~1 300、1 420~1 799 nm范圍內(nèi),吸光度具有明顯差異。但是由于大米近紅外光譜圖譜背景復(fù)雜,測(cè)量環(huán)境、時(shí)間不同等原因,導(dǎo)致光譜信息譜峰重疊嚴(yán)重、噪聲多,反映泰國(guó)茉莉香米含量的信息在近紅外光譜中譜峰強(qiáng)度較弱,因此需要采用不同的預(yù)處理方法,提取弱信息、減少背景干擾。
圖1 混合泰國(guó)茉莉香米近紅外光譜Fig. 1 Near infrared spectra of mixed Thai jasmine rice
圖2顯示了大米預(yù)處理后的光譜圖及特征波長(zhǎng)。大米樣品近紅外光譜的噪聲主要來(lái)源于顆粒大小、表面散射以及光程變化等因素,因此選擇一階導(dǎo)數(shù)、MSC、SNV、小波變換、去趨勢(shì)校正(de-trending correction,DT)5種預(yù)處理方式處理近紅外光譜,處理后的光譜數(shù)據(jù)采用CARS法挑選的特征波長(zhǎng)分別為48、128、48、18、69、128個(gè)。
圖2 光譜預(yù)處理后特征波長(zhǎng)分布情況Fig. 2 Distribution of key wavelengths in pretreated spectra
2.3.1 訓(xùn)練函數(shù)的確定
訓(xùn)練函數(shù)對(duì)模的預(yù)測(cè)效果見(jiàn)表3。采用traingd、traingdm、traingda、traingdx作為訓(xùn)練函數(shù)時(shí),均方根誤差(root mean square error,RMSE)偏大,模型預(yù)測(cè)精度較低[7,17,32]。Levenberg Marquardt BP算法的trainlm函數(shù)取得了較理想的預(yù)測(cè)效果,不同預(yù)處理并挑選特征波長(zhǎng)后的RMSE、R校正集、R驗(yàn)證集、R測(cè)試集分別為0.000 134~0.000 990、0.984 5~0.999 1、0.950 5~0.981 1、0.949 9~0.983 6,具有較好的預(yù)測(cè)效果。因此,確定trainlm為BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練函數(shù)。
表3 預(yù)處理光譜定量預(yù)測(cè)模型的訓(xùn)練函數(shù)優(yōu)化Table 3 Optimization of training function for quantitative prediction model with different spectral data pretreatments
2.3.2 節(jié)點(diǎn)傳遞函數(shù)的確定
由表4可知,對(duì)于未處理的大米近紅外光譜,隱含層節(jié)點(diǎn)傳遞函數(shù)為tansig,輸出層節(jié)點(diǎn)傳遞函數(shù)為purelin,或隱含層節(jié)點(diǎn)傳遞函數(shù)為logsig,輸出層節(jié)點(diǎn)傳遞函數(shù)為purelin時(shí),模型的R校正集較大,分別為0.983 7和0.988 7,但模型預(yù)測(cè)精度低。隱含層節(jié)點(diǎn)傳遞函數(shù)為logsig,輸出層節(jié)點(diǎn)傳遞函數(shù)為tansig時(shí),模型均方差最小,R驗(yàn)證集和R測(cè)試集最大,模型預(yù)測(cè)效果較好。因此,選擇logsig作為隱含層節(jié)點(diǎn)傳遞函數(shù),tansig作為輸出層節(jié)點(diǎn)傳遞函數(shù)。
表4 光譜定量預(yù)測(cè)模型的節(jié)點(diǎn)傳遞函數(shù)優(yōu)化Table 4 Optimization of node transfer function for quantitative prediction model
對(duì)于一階導(dǎo)數(shù)處理后的泰國(guó)茉莉香米近紅外光譜,隱含層節(jié)點(diǎn)傳遞函數(shù)為logsig,輸出層節(jié)點(diǎn)傳遞函數(shù)為tansig時(shí),模型的均方差最小為0.000 125,R校正集、R驗(yàn)證集和R測(cè)試集分別為0.981 3、0.940 5、0.962 5,模型預(yù)測(cè)效果較好。
對(duì)于MSC預(yù)處理后的泰國(guó)茉莉香米近紅外光譜,隱含層節(jié)點(diǎn)傳遞函數(shù)為logsig,輸出層節(jié)點(diǎn)傳遞函數(shù)為tansig時(shí),模型的均方差最小為0.000 620,R校正集最大為0.995 5,模型的R驗(yàn)證集、R測(cè)試集分別為0.974 1、0.972 7,此時(shí)模型的預(yù)測(cè)效果較好。
對(duì)于SNV預(yù)處理后的近紅外光譜,隱含層節(jié)點(diǎn)傳遞函數(shù)為logsig,輸出層節(jié)點(diǎn)傳遞函數(shù)為purelin時(shí),或隱含層節(jié)點(diǎn)傳遞函數(shù)為tansig,輸出層節(jié)點(diǎn)傳遞函數(shù)為tansig時(shí),模型的R校正集較大,分別為0.989 8、0.990 1,綜合比較模型的均方差、R驗(yàn)證集、R測(cè)試集,選擇logsig作為隱含層節(jié)點(diǎn)傳遞函數(shù),purelin作為輸出層節(jié)點(diǎn)傳遞函數(shù)。
對(duì)于小波變換預(yù)處理后的泰國(guó)茉莉香米近紅外光譜,隱含層節(jié)點(diǎn)傳遞函數(shù)為tansig,輸出層節(jié)點(diǎn)傳遞函數(shù)為purelin時(shí),模型的R校正集最大,為0.994 5,均方差較小為0.000 791,模型的預(yù)測(cè)效果較好。
對(duì)DT預(yù)處理后的泰國(guó)茉莉香米近紅外光譜,隱含層節(jié)點(diǎn)傳遞函數(shù)為tansig,輸出層節(jié)點(diǎn)傳遞函數(shù)為tansig,或隱含層節(jié)點(diǎn)傳遞函數(shù)為logsig,輸出層節(jié)點(diǎn)傳遞函數(shù)為tansig時(shí),模型的均方差最小,模型預(yù)測(cè)效果較好,綜合比較R校正集,選擇tansig作為隱含層和輸出層節(jié)點(diǎn)傳遞函數(shù)。
綜上所述,隱含層節(jié)點(diǎn)傳遞函數(shù)為tansig函數(shù)或logsig函數(shù),輸出層節(jié)點(diǎn)傳遞函數(shù)為tansig函數(shù)或purelin函數(shù)時(shí),RMSE小于0.001,達(dá)到訓(xùn)練的精度要求。
2.3.3 網(wǎng)絡(luò)學(xué)習(xí)函數(shù)的確定
由表5可知,網(wǎng)絡(luò)學(xué)習(xí)函數(shù)的選擇對(duì)網(wǎng)絡(luò)預(yù)測(cè)效果有較大影響。采用未處理、一階導(dǎo)數(shù)、MSC、DT預(yù)處理后的近紅外光譜訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)模型時(shí),適宜的網(wǎng)絡(luò)學(xué)習(xí)函數(shù)為BP學(xué)習(xí)規(guī)則learngdm。采用SNV或小波變換預(yù)處理后的近紅外光譜訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)模型時(shí),適宜的網(wǎng)絡(luò)學(xué)習(xí)函數(shù)為BP學(xué)習(xí)規(guī)則learngd。
表5 光譜定量預(yù)測(cè)模型的網(wǎng)絡(luò)學(xué)習(xí)函數(shù)優(yōu)化Table 5 Optimization of network learning function for spectral quantitative prediction model
2.3.4 隱含層神經(jīng)元數(shù)的確定
隱含層神經(jīng)元數(shù)對(duì)泰國(guó)茉莉香米含量的預(yù)測(cè)見(jiàn)表6。對(duì)于未處理大米近紅外光譜,神經(jīng)元數(shù)為6或7時(shí),BP神經(jīng)網(wǎng)絡(luò)RMSE較小,分別為0.000 907、0.000 921,綜合考慮模型的R校正集、R驗(yàn)證集、R測(cè)試集,將模型隱含層神經(jīng)元數(shù)設(shè)為7,此時(shí)模型的預(yù)測(cè)效果較好。
表6 處理光譜定量預(yù)測(cè)模型的隱含層神經(jīng)元數(shù)優(yōu)化Table 6 Optimization of hidden layer neurons for spectral quantitative prediction model with different spectral data preptreatments
對(duì)于一階導(dǎo)數(shù)預(yù)處理后的大米近紅外光譜,神經(jīng)元數(shù)為7和10時(shí),BP神經(jīng)網(wǎng)絡(luò)RMSE較小,分別為0.000 152、0.000 161,綜合考慮模型的R校正集、R驗(yàn)證集、R測(cè)試集,將模型隱含層神經(jīng)元數(shù)設(shè)為10,此時(shí)模型的預(yù)測(cè)效果較好。
對(duì)于MSC、SNV和小波變換預(yù)處理后的大米近紅外光譜,綜合考慮模型的RMSE以及R校正集、R驗(yàn)證集和R測(cè)試集, 確定神經(jīng)元數(shù)為7,此時(shí)模型的預(yù)測(cè)效果較好。
對(duì)于DT預(yù)處理后的大米近紅外光譜,神經(jīng)元數(shù)為5時(shí),BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果較好,模型的RMSE、R校正集、R驗(yàn)證集、R測(cè)試集分別為0.000 868、0.993 5、0.979 1、0.973 2。
2.3.5 學(xué)習(xí)速率的確定
學(xué)習(xí)速率是決定權(quán)重調(diào)整量的關(guān)鍵因素。學(xué)習(xí)速率取值過(guò)小,網(wǎng)絡(luò)收斂速度慢。學(xué)習(xí)速率取值過(guò)大,可能導(dǎo)致網(wǎng)絡(luò)在誤差的最小值附近來(lái)回跳動(dòng),產(chǎn)生振蕩現(xiàn)象,導(dǎo)致網(wǎng)絡(luò)發(fā)散而不能收斂。對(duì)于標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)速率取值范圍在0.1~0.75之間。學(xué)習(xí)速率對(duì)泰國(guó)茉莉香米含量預(yù)測(cè)的影響見(jiàn)表7~12。未處理、一階導(dǎo)數(shù)、MSC、SNV、小波變換、DT處理后的近紅外光譜預(yù)測(cè)泰國(guó)茉莉香米含量時(shí),當(dāng)學(xué)習(xí)速率分別為0.30、0.30、0.35、0.20、0.60、0.35時(shí),BP神經(jīng)網(wǎng)絡(luò)模型取得最佳的預(yù)測(cè)效果。
表7 未處理光譜定量預(yù)測(cè)模型的學(xué)習(xí)速率優(yōu)化Table 7 Optimization of learning rate for spectral quantitative prediction model without spectral data preprocessing
表8 一階導(dǎo)數(shù)處理光譜定量預(yù)測(cè)模型的學(xué)習(xí)速率優(yōu)化Table 8 Optimization of learning rate for spectral quantitative prediction model with first derivative preprocessing
表9 MSC處理光譜定量預(yù)測(cè)模型的學(xué)習(xí)速率優(yōu)化Table 9 Optimization of learning rate for spectral quantitative prediction model with MSC preprocessing
表10 SNV處理光譜定量預(yù)測(cè)模型的學(xué)習(xí)速率優(yōu)化Table 10 Optimization of learning rate for spectral quantitative prediction model with SNV preprocessing
表11 小波變換處理光譜定量預(yù)測(cè)模型的學(xué)習(xí)速率優(yōu)化Table 11 Optimization of learning rate for spectral quantitative prediction model with wavelet transform preprocessing
表12 DT處理光譜定量預(yù)測(cè)模型的學(xué)習(xí)速率優(yōu)化Table 12 Optimization of learning rate for spectral quantitative prediction model with DT preprocessing
選擇每種處理方式最優(yōu)的BP神經(jīng)網(wǎng)絡(luò)過(guò)程參數(shù)組合進(jìn)一步優(yōu)化,泰國(guó)茉莉香米含量預(yù)測(cè)的最優(yōu)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及預(yù)測(cè)效果見(jiàn)表13,與未處理光譜相比較,除SNV函數(shù)外,其余預(yù)處理函數(shù)RMSE都較低,說(shuō)明模型的預(yù)測(cè)精度得到提高。而且處理光譜R校正集顯著提高,均達(dá)到0.99以上,接近于1,說(shuō)明模型預(yù)測(cè)效果好。其中與其他預(yù)處理函數(shù)相比,綜合考慮MSC預(yù)處理后的BP網(wǎng)絡(luò)預(yù)測(cè)效果最好,此時(shí),模型的RMSE、R校正集、R驗(yàn)證集、R測(cè)試集分別為0.000 830、0.992 9、0.976 1、0.975 5。
表13 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的泰國(guó)茉莉香米純度定量預(yù)測(cè)結(jié)果Table 13 Results of quantitative prediction of Thai jasmine rice purity based on optimal BP neural network structure
采集不同含量泰國(guó)茉莉香米的混合大米近紅外光譜。結(jié)果表明,所有樣品近紅外光譜在波峰、波形上十分相似,在波長(zhǎng)1 200、1 440、1 570、1 720 nm附近有明顯吸收峰,在波段1 000~1 100、1 200~1 300、1 420~1 799 nm范圍內(nèi),吸光度具有明顯的差異。通過(guò)對(duì)光譜數(shù)據(jù)做一階導(dǎo)數(shù)、MSC、SNV、小波變換、DT 5種預(yù)處理,并采用CARS法挑選特征波長(zhǎng)。結(jié)果表明,未處理、一階導(dǎo)數(shù)預(yù)處理、MSC預(yù)處理、SNV預(yù)處理、小波變換預(yù)處理、DT預(yù)處理后的光譜分別得到48、128、48、18、69個(gè)和128個(gè)特征波長(zhǎng)。
以特征波長(zhǎng)對(duì)應(yīng)的吸光度為BP神經(jīng)網(wǎng)絡(luò)輸入層神經(jīng)元,以大米樣品中泰國(guó)茉莉香米的含量為輸出層神經(jīng)元,設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)和參數(shù),研究泰國(guó)茉莉香米含量預(yù)測(cè)模型。結(jié)果表明,MSC預(yù)處理后的光譜用于建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)泰國(guó)茉莉香米含量獲得了較好的預(yù)測(cè)效果,此時(shí)BP神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)為:訓(xùn)練函數(shù)trainlm,隱含層傳遞函數(shù)logsig,輸出層傳遞函數(shù)tansig,網(wǎng)絡(luò)學(xué)習(xí)函數(shù)learngdm,網(wǎng)絡(luò)輸入層神經(jīng)元數(shù)為48,隱含層神經(jīng)元數(shù)為7,輸出層神經(jīng)元數(shù)為1,學(xué)習(xí)速率0.35。所建立模型的RMSE、R校正集、R驗(yàn)證集、R測(cè)試集分別為0.000 830、0.992 9、0.976 1和0.975 5,具有較好的定量預(yù)測(cè)效果。