孟慶龍,馮樹(shù)南,譚濤,尚靜,黃人帥,曹森*
(1.貴陽(yáng)學(xué)院食品與制藥工程學(xué)院,貴州 貴陽(yáng) 550005;2.貴陽(yáng)學(xué)院農(nóng)產(chǎn)品無(wú)損檢測(cè)工程研究中心,貴州 貴陽(yáng) 550005)
開(kāi)陽(yáng)富硒枇杷富含微量元素硒,有助于增強(qiáng)人體的免疫力,其果皮及果肉均顯橙黃色,具有獨(dú)特的口感以及豐富的營(yíng)養(yǎng)價(jià)值,被稱(chēng)為貴州枇杷王[1]。枇杷糖度是衡量其內(nèi)部品質(zhì)的重要指標(biāo)之一,枇杷糖度傳統(tǒng)的測(cè)定方法是利用折射儀測(cè)定,然而該方法存在耗費(fèi)時(shí)間、破壞樣本,以及難以實(shí)現(xiàn)大規(guī)模檢測(cè)等缺點(diǎn)[2]。因此,開(kāi)展枇杷糖度的快速檢測(cè)研究對(duì)其品質(zhì)快速分級(jí)以及銷(xiāo)售等具有非常重要的指導(dǎo)意義。
基于光譜原理的快速無(wú)損檢測(cè)技術(shù)因具有檢測(cè)速度快、不破壞樣本等優(yōu)勢(shì),受到國(guó)內(nèi)外科研學(xué)者的關(guān)注。近年來(lái),該技術(shù)已被廣泛地應(yīng)用于水果內(nèi)、外部品質(zhì)的檢測(cè)領(lǐng)域[3-9]。目前,國(guó)內(nèi)外科研學(xué)者已研究了關(guān)于櫻桃[10]、橙子[4,11]、獼猴桃[2,5,12]、蘋(píng)果[13-14]、桃[6,15]、李子[16]、梨[17-18]以及藍(lán)莓[19]等水果糖度的快速無(wú)損檢測(cè),并取得了較好的成果。Hu等[20]無(wú)損檢測(cè)了1-甲基環(huán)丙烯(1-methylcyclopropene,1-MCP)對(duì)“海沃德”獼猴桃中不同糖分含量積累的誘導(dǎo)機(jī)制。高升等[21]基于可見(jiàn)/近紅外透射光譜技術(shù)無(wú)損檢測(cè)了紅提糖度,得出采用最小二乘支持向量機(jī)所建模型的效果好,但模型的運(yùn)算時(shí)間較長(zhǎng);對(duì)于采用偏最小二乘回歸所建模型的運(yùn)算時(shí)間較短,但模型的預(yù)測(cè)性能較差。光譜技術(shù)在水果內(nèi)、外部品質(zhì)快速無(wú)損檢測(cè)的應(yīng)用中,面臨的主要瓶頸是數(shù)據(jù)冗余,這嚴(yán)重影響了檢測(cè)模型的運(yùn)算效率。實(shí)現(xiàn)水果內(nèi)、外部品質(zhì)的無(wú)損檢測(cè),亟需建立簡(jiǎn)化的檢測(cè)模型,而且采用光譜技術(shù)以及反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)枇杷糖度的快速無(wú)損檢測(cè)研究也未見(jiàn)報(bào)道。
本文使用紫外/可見(jiàn)光纖光譜儀獲取開(kāi)陽(yáng)枇杷的反射光譜;利用標(biāo)準(zhǔn)正態(tài)變換(standard normal variation,SNV)以及多元散射校正(multi-scatter calibration,MSC)預(yù)處理原始的反射光譜,選取較優(yōu)的預(yù)處理方法,應(yīng)用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling,CARS)、連續(xù)投影算法(successive projection algorithm,SPA)以及SPA+CARS 3種方法分別篩選特征變量,構(gòu)建簡(jiǎn)化的BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型,依據(jù)模型的剩余預(yù)測(cè)偏差確定相對(duì)較優(yōu)的開(kāi)陽(yáng)枇杷糖度快速無(wú)損檢測(cè)模型,為研發(fā)開(kāi)陽(yáng)枇杷糖度的快速無(wú)損檢測(cè)裝備提供參考。
開(kāi)陽(yáng)富硒枇杷于2021年5月23日采摘自貴州省貴陽(yáng)市開(kāi)陽(yáng)縣禾豐鄉(xiāng)枇杷果園。為使樣品具有代表性,從不同的果樹(shù)上隨機(jī)挑選出120個(gè)無(wú)病蟲(chóng)害且無(wú)表面損傷的枇杷樣品。枇杷樣品采摘后馬上運(yùn)送至貴州省農(nóng)產(chǎn)品無(wú)損檢測(cè)工程研究中心實(shí)驗(yàn)室,并在(22±2)℃條件下進(jìn)行試驗(yàn)。試驗(yàn)前先用軟紙輕輕擦掉枇杷表面的雜物,對(duì)其依次編號(hào)后進(jìn)行反射光譜采集以及糖度的測(cè)定。
折射儀(ATAGO PAL-α):日本 Atago公司;光纖光譜儀(QEPro):蔚海光學(xué)儀器(上海)有限公司。
1.3.1 反射光譜采集
反射光譜采集前,利用適配器將反射探頭安裝在支架上,反射探頭離枇杷表面大約1cm。試驗(yàn)依據(jù)標(biāo)準(zhǔn)反射白板的光譜強(qiáng)度,通過(guò)調(diào)整積分時(shí)間等參數(shù),使采集到白板的反射率接近于100%。光譜儀的積分時(shí)間為110 ms,掃描平均次數(shù)為8次,滑動(dòng)平均寬度為1。同時(shí),確保采集枇杷反射光譜時(shí)的參數(shù)保持不變。
將標(biāo)記好的枇杷樣本緊靠在反射探頭支架上,每個(gè)枇杷樣本分A、B兩面,每面分別采集3次(靠近花萼部位、靠近赤道部位、靠近果梗部位),最終計(jì)算6次采集到反射率的平均值,作為該枇杷樣本原始的反射光譜。
1.3.2 糖度的測(cè)定
獲取完所有枇杷樣本的反射光譜后,立即進(jìn)行枇杷糖度的測(cè)定。參照NY/T 2637—2014《水果和蔬菜可溶性固形物含量的測(cè)定折射儀法》的方法,分別將每個(gè)枇杷樣本A、B兩面的果肉壓成汁,隨后使用一次性滴管將果汁滴到折射儀的檢測(cè)凹槽中,讀出糖度的參考值。每個(gè)枇杷樣本以A、B兩面測(cè)定結(jié)果的算術(shù)平均值作為該枇杷樣本的糖度參考值。
1.3.3 光譜處理及模型評(píng)價(jià)
1.3.3.1 光譜預(yù)處理及特征變量篩選
試驗(yàn)采用SNV和MSC預(yù)處理原始的反射光譜數(shù)據(jù),以消除原始的反射光譜中的噪聲信號(hào),探究相對(duì)較優(yōu)預(yù)處理方法。應(yīng)用CARS以及SPA篩選特征變量。其中CARS應(yīng)用五折交叉驗(yàn)證篩選出n個(gè)偏最小二乘模型的交叉驗(yàn)證均方根誤差(root mean squares errors for cross validation,RMSECV)最小的子集,最終將這些子集確定為相對(duì)較優(yōu)的特征變量[17]。而SPA依據(jù)均方根誤差(root mean squares errors,RMSE)來(lái)確定相對(duì)較優(yōu)的特征變量。
1.3.3.2 建模方法及模型評(píng)價(jià)方法
試驗(yàn)采用BP神經(jīng)網(wǎng)絡(luò)分別建立基于全光譜以及特征變量的開(kāi)陽(yáng)枇杷糖度無(wú)損檢測(cè)模型,BP神經(jīng)網(wǎng)絡(luò)是當(dāng)前應(yīng)用很廣泛的一種人工神經(jīng)網(wǎng)絡(luò)模型[22]。
將建模集和預(yù)測(cè)集的相關(guān)系數(shù)(rc)和(rp),建模集的均方根誤差(root mean squares errors for calibration,RMSEC)和預(yù)測(cè)集的均方根誤差(root mean squares errors for prediction,RMSEP),以及剩余預(yù)測(cè)偏差(residual predictive deviation,RPD)作為衡量模型優(yōu)劣的主要指標(biāo)。若RPD<1.4,證明構(gòu)建的檢測(cè)模型無(wú)法完成預(yù)測(cè);1.4≤RPD<1.8,則模型僅可粗略地預(yù)測(cè);1.8≤RPD<2.0,證明檢測(cè)模型可以完成相對(duì)較好的預(yù)測(cè);RPD≥2,證明模型可以較好地完成預(yù)測(cè)[23],RPD的計(jì)算公式如下。
式中:SD為預(yù)測(cè)集中枇杷樣本糖度值的標(biāo)準(zhǔn)偏差(standard deviation,SD)。
在建立無(wú)損檢測(cè)模型前,先基于反射光譜以及糖度參考值將所有枇杷樣本劃分為建模集和預(yù)測(cè)集,樣本集劃分優(yōu)劣的評(píng)判標(biāo)準(zhǔn)是建模集中參考值范圍是否比預(yù)測(cè)集的范圍寬。本文應(yīng)用光譜-理化值共生距離方法[24]將120個(gè)枇杷樣本依照3∶1的比例劃分為90個(gè)建模集以及30個(gè)預(yù)測(cè)集。其中,建模集中枇杷糖度的范圍(8.50%~13.80%)比預(yù)測(cè)集中的范圍(9.30%~13.70%)寬,這樣劃分的樣本集有助于后期構(gòu)建相對(duì)較好的無(wú)損檢測(cè)模型。建模集以及預(yù)測(cè)集中枇杷糖度的頻率分布圖見(jiàn)圖1。
圖1 枇杷糖度頻率分布圖Fig.1 Probability distribution of loquat sugar content
選擇360 nm~1 000 nm波段作為有效原始光譜區(qū)域,該區(qū)域總共包含了835個(gè)波段。由于原始反射光譜中包含一些噪聲,為提高枇杷糖度無(wú)損檢測(cè)模型的精準(zhǔn)度及穩(wěn)定性,分別運(yùn)用SNV以及MSC對(duì)原始的反射光譜進(jìn)行預(yù)處理。所有枇杷的原始的反射光譜以及經(jīng)過(guò)SNV、MSC預(yù)處理后的相對(duì)反射光譜見(jiàn)圖2。
圖2 枇杷的反射光譜Fig.2 Reflectance spectra of loquat
由圖2可知,預(yù)處理后的反射光譜曲線(xiàn)要比原始反射光譜曲線(xiàn)平滑,說(shuō)明對(duì)原始反射光譜進(jìn)行預(yù)處理去掉了部分噪聲以及背景干擾信息。為進(jìn)一步分析比較SNV以及MSC兩種方法預(yù)處理原始的反射光譜效果,分別將原始的反射光譜(original reflectance spectra,ORR)以及經(jīng)過(guò)SNV和MSC預(yù)處理后的相對(duì)反射光譜輸入BP神經(jīng)網(wǎng)絡(luò)模型中,構(gòu)建枇杷糖度無(wú)損檢測(cè)模型,建模結(jié)果見(jiàn)表1。
表1 基于兩種預(yù)處理方法的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)枇杷糖度的檢測(cè)結(jié)果Table 1 Detection results of loquat sugar content by BP neural network model based on the two preprocessed methods
由表1可知,基于兩種方法構(gòu)建的無(wú)損檢測(cè)模型的性能均優(yōu)于原始的反射光譜,而且經(jīng)SNV預(yù)處理后建立的BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型具有相對(duì)較大的rc(0.85)、rp(0.83)和RPD(1.73)以及較小的RMESC(0.72%)和RMSEP(0.79%),說(shuō)明SNV預(yù)處理方法相對(duì)較好,因此本文應(yīng)用SNV預(yù)處理原始的反射光譜。
2.3.1 采用SPA篩選特征變量
應(yīng)用SPA篩選特征變量時(shí),依據(jù)RMSE來(lái)確定相對(duì)較優(yōu)的特征變量。SPA篩選特征變量的結(jié)果見(jiàn)圖3。
圖3 SPA篩選特征變量的結(jié)果Fig.3 Characteristic variables selected by successive projection algorithm(SPA)
由圖3(a)可知,有效變量數(shù)小于5時(shí),RMSE隨著有效變量數(shù)的增加而下降,然而有效變量數(shù)大于5時(shí),RMSE減小的趨勢(shì)不明顯,因此將這5個(gè)變量(占總變量的0.59%)作為特征變量,圖3(b)即為篩選出的5個(gè)特征變量。
2.3.2 采用CARS篩選特征變量
應(yīng)用CARS篩選特征變量時(shí),應(yīng)用五折交叉驗(yàn)證方法計(jì)算所構(gòu)建的偏最小二乘模型的RMSECV(蒙特卡洛采樣次數(shù):50),相對(duì)較優(yōu)的特征變量通過(guò)RMSECV的最小值來(lái)確定。CARS篩選特征變量的結(jié)果見(jiàn)圖4。
圖4 CARS篩選特征變量的結(jié)果Fig.4 Characteristic variables selected by competitive adaptive reweighted sampling(CARS)
由圖4(a)可知,第24次采樣獲得的RMSECV值最小(0.67),該變量集包括了49個(gè)特征變量(占總變量的5.87%),圖4(b)即為篩選的49個(gè)特征變量。為進(jìn)一步探究SPA+CARS篩選的特征變量對(duì)BP神經(jīng)網(wǎng)絡(luò)模型檢測(cè)性能的影響,將SPA篩選的5個(gè)特征變量以及CARS篩選的49個(gè)特征變量組合在一起,剔除重合的1個(gè)特征變量,構(gòu)成新的特征變量(包含53個(gè)特征變量,占總變量的6.34%)。SPA+CARS組合篩選的特征變量分布情況見(jiàn)圖5。
圖5 SPA+CARS篩選的特征變量Fig.5 Characteristic variables selected by SPA+CARS
將全光譜(full spectra,F(xiàn)S)以及應(yīng)用SPA、CARS和SPA+CARS篩選的特征變量作為自變量,建模集以及預(yù)測(cè)集中枇杷糖度參考值作為因變量,建立預(yù)測(cè)開(kāi)陽(yáng)枇杷糖度BP神經(jīng)網(wǎng)絡(luò)無(wú)損檢測(cè)模型?;谔卣髯兞繕?gòu)建的BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型對(duì)開(kāi)陽(yáng)枇杷糖度的預(yù)測(cè)結(jié)果見(jiàn)表2。
表2 基于特征變量構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)枇杷糖度的預(yù)測(cè)結(jié)果Table 2 Detection results of loquat sugar content by BP neural network model based on the characteristic spectra
由表2可知,基于全光譜和SPA篩選的特征變量構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型僅可粗略地預(yù)測(cè)枇杷糖度,其RPD值分別為1.73和1.76。而基于CARS篩選的特征變量構(gòu)建的CARS-BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型具有相對(duì)較大的rc(0.92)和rp(0.91)以及較小的RMSEC(0.55%)和RMSEP(0.56%),且 RPD 值(2.42)大于2,表明構(gòu)建的CARS-BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型具有較好的預(yù)測(cè)性能。同時(shí)采用CARS從835個(gè)全變量中篩選出了49個(gè)特征變量,占總變量的5.87%,大大提高了模型的運(yùn)算效率。另外,基于SPA+CARS篩選的特征變量構(gòu)建的檢測(cè)模型的RPD值為2.33,相對(duì)于CARSBP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型,并沒(méi)有提升BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)性能。綜上所述,CARS算法是一種較好的變量篩選方法,與文獻(xiàn)[17]報(bào)道一致,而且構(gòu)建的CARSBP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型對(duì)檢測(cè)開(kāi)陽(yáng)枇杷糖度具有較好的檢測(cè)能力,且運(yùn)算效率得到了明顯提升。CARSBP神經(jīng)網(wǎng)絡(luò)無(wú)損檢測(cè)模型對(duì)開(kāi)陽(yáng)枇杷糖度的檢測(cè)結(jié)果見(jiàn)圖6。
圖6 枇杷糖度的實(shí)測(cè)值與預(yù)測(cè)值Fig.6 Measured and predicted values of loquat sugar content
本研究以開(kāi)陽(yáng)富硒枇杷為研究對(duì)象,采用紫外/可見(jiàn)光纖光譜儀采集開(kāi)陽(yáng)枇杷的反射光譜,探究比較了兩種方法(SNV和MSC)對(duì)原始的反射光譜的預(yù)處理效果,得出經(jīng)SNV預(yù)處理后建立的BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型具有較大的rc(0.85)、rp(0.83)和RPD(1.73)以及較小的RMESC(0.72%)和RMSEP(0.79%),說(shuō)明 SNV預(yù)處理效果相比于MSC較好;應(yīng)用SPA、CARS以及SPA+CARS分別篩選特征變量,進(jìn)而基于篩選的特征變量構(gòu)建了預(yù)測(cè)開(kāi)陽(yáng)枇杷糖度的BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型,得出采用CARS從835個(gè)全光譜中篩選了49個(gè)特征變量,不僅很好地提高了檢測(cè)模型的運(yùn)算效率,而且基于CARS篩選的特征變量構(gòu)建的CARS-BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型具有相對(duì)較大的rc(0.92)、rp(0.91)以及較小的RMSEC(0.55%)、RMSEP(0.56%),RPD 值(2.42)大于2,表明構(gòu)建的CARS-BP神經(jīng)網(wǎng)絡(luò)檢測(cè)模型具有較好的預(yù)測(cè)性能。為研發(fā)開(kāi)陽(yáng)枇杷糖度快速無(wú)損檢測(cè)裝備奠定較好的理論基礎(chǔ)。