朱 潔 黃 華 祝詩平 吳維吉 謝智勇 李 旭 劉廣昊
(西南大學(xué)工程技術(shù)學(xué)院1,重慶 400716)(中國天津糧油批發(fā)交易市場(chǎng)2,天津 300171)
小麥在儲(chǔ)藏和加工中,當(dāng)單粒小麥籽水分偏離正常值時(shí)會(huì)引起一系列問題[1],如霉變、蟲蝕和生芽等,若不及時(shí)處理會(huì)損失大量小麥。同時(shí)小麥種子水分過高極易發(fā)生凍害將導(dǎo)致發(fā)芽率降低。小麥籽水分檢測(cè)的方法主要分為兩大類:一是直接法[2],如105 ℃恒重法、真空干燥法、定溫定時(shí)烘干法和化學(xué)法等,這類方法具有檢測(cè)精度和準(zhǔn)確度高的優(yōu)點(diǎn),但其操作過程繁瑣且費(fèi)時(shí),并對(duì)檢測(cè)樣本有一定的破壞性;二是間接法[3],如近紅外光譜法、紅外法、電阻法、電導(dǎo)法、電容法、微波法、中子法、射頻阻抗法、核磁共振法、聲學(xué)法和摩擦阻力法等,這類方法具有檢測(cè)速度快的特點(diǎn)。由于近紅外光譜區(qū)具有豐富的基團(tuán)信息,因此利用近紅外光譜預(yù)測(cè)農(nóng)產(chǎn)品的水分得到了廣泛的應(yīng)用[4]。金華麗等[5]利用近紅外光譜對(duì)小麥粉水分進(jìn)行了定量分析,其預(yù)測(cè)水分的相關(guān)系數(shù)為0.98,表明利用近紅外光譜法預(yù)測(cè)小麥粉的水分具有較高的精度。Li等[6]將近紅外光譜技術(shù)和深度信念網(wǎng)絡(luò)結(jié)合,對(duì)小麥的相關(guān)成分進(jìn)行了預(yù)測(cè),其中水分的相關(guān)系數(shù)為0.99,預(yù)測(cè)的標(biāo)準(zhǔn)誤差為0.69%。Shi等[7]在研究光譜預(yù)處理和波長選擇對(duì)近紅外和中紅外光譜構(gòu)建的偏最小二乘回歸模型的影響,其研究對(duì)象為小麥的粗蛋白及水分含量。Mutlu等[8]利用近紅外光譜結(jié)合人工神經(jīng)網(wǎng)絡(luò)對(duì)小麥的多個(gè)品質(zhì)參數(shù)進(jìn)行預(yù)測(cè),其中水分預(yù)測(cè)的相關(guān)系數(shù)為0.92。
從文獻(xiàn)上看,利用近紅外光譜預(yù)測(cè)小麥及小麥粉的含水量具有精度高,檢測(cè)速度快等優(yōu)點(diǎn)。但這只是對(duì)一批小麥籽樣品進(jìn)行預(yù)測(cè),獲得的是該批樣品的平均含水量,沒有對(duì)單粒小麥籽含水量進(jìn)行預(yù)測(cè)。高光譜成像技術(shù)[9-12]除了獲得物質(zhì)的近紅外光譜信息外,還可以獲得物質(zhì)的圖像信息,這為實(shí)現(xiàn)單粒小麥籽含水量的檢測(cè)提供了可能。吳靜珠等[13]和Caporaso等[14]都利用高光譜成像技術(shù)和偏最小二乘法對(duì)小麥籽粗蛋白含量進(jìn)行預(yù)測(cè)。Qiu等[15]利用高光譜成像技術(shù)結(jié)合卷積神經(jīng)網(wǎng)絡(luò)對(duì)單粒水稻種子品種進(jìn)行了識(shí)別,隨著樣品數(shù)量的增加,其準(zhǔn)確率達(dá)到了94%。Mahesh等[16]把高光譜成像技術(shù)用于快速鑒別小麥水分等級(jí)。Zheng等[17]利用高光譜技術(shù)對(duì)小麥籽粒含水量進(jìn)行預(yù)測(cè),其相關(guān)系數(shù)為0.97,但其只研究一種預(yù)測(cè)模型,且采用了人工加濕的方法使樣本含水量在5%~45%之間。
本研究使用高光譜技術(shù)實(shí)現(xiàn)對(duì)單粒小麥籽含水量的預(yù)測(cè),并用小麥的圖像位置信息繪制出小麥籽水分分布圖。分布圖可以定位單粒小麥水分異常值,為實(shí)現(xiàn)從一批樣品中自動(dòng)識(shí)別與剔除水分異常的單粒小麥籽提供參考。
本實(shí)驗(yàn)樣品小麥由中國天津糧油批發(fā)交易市場(chǎng)提供,其收獲年份為2013年至2017年;其產(chǎn)地分別來自國內(nèi)的河北省和山東省,國外的澳大利亞、加拿大和美國;其種類包括硬質(zhì)白小麥、軟質(zhì)白小麥、硬質(zhì)紅小麥和軟質(zhì)紅小麥等,共計(jì)50份小麥樣品。從每一份樣品中隨機(jī)挑選出50粒小麥籽,共2 500粒小麥籽樣品用于實(shí)驗(yàn)。
選用VNIR-HIS-B1621型可見/近紅外成像系統(tǒng)作為單粒小麥籽的高光譜圖像采集系統(tǒng)。該系統(tǒng)主要由CCD相機(jī)、363~1 025 nm光譜成像儀、IT 3900 150 W鹵素光源、移動(dòng)平臺(tái)和暗箱等組成。裝載小麥籽的樣品池為12.6 cm×8.5 cm的塑料托盤,在塑料托盤頂部預(yù)先貼上寬度為17 mm的白色電氣絕緣膠帶作為參考白板,每次進(jìn)行樣品掃描時(shí)除了能獲得樣品的光譜信息外,同時(shí)也能獲得自定義參考白板的信息。高光譜相機(jī)使用35 nm的鏡頭,鏡頭與樣品池的距離為33 cm,在高光譜采集軟件中設(shè)置相機(jī)曝光時(shí)間為21 ms,移動(dòng)臺(tái)的速率為0.792 mm/s,圖像分辨率為1 632×1 232。
整個(gè)高光譜圖像采集過程將小麥分成A面與B面分別進(jìn)行光譜數(shù)據(jù)采集。首先將小麥樣品折痕向上(記為A面)放入樣品池中。樣品池內(nèi)小麥按照10行5列排列,一次光譜掃描可以獲得50粒小麥籽高光譜數(shù)據(jù)。經(jīng)過50次裝樣與高光譜掃描后可獲得2 500粒樣品小麥高光譜數(shù)據(jù)采集。然后將小麥樣品折痕向下(記為B面)放入樣品池中,重復(fù)該過程,總共獲得5 000條小麥籽的高光譜曲線。
按照GB 5009.3—2016《食品安全國家標(biāo)準(zhǔn) 食品中水分的測(cè)定》[18]中的直接干燥法測(cè)量單粒小麥籽樣品的含水量。首先,把干凈無蓋的小塑料瓶標(biāo)號(hào),并置于105 ℃的鼓風(fēng)干燥機(jī)中干燥1.0 h;其次,用精度為0.001 g的AL分析天平測(cè)量并記錄小麥干燥前粒質(zhì)量,將小麥放入對(duì)應(yīng)標(biāo)號(hào)的小塑料瓶,并置于105 ℃的鼓風(fēng)干燥機(jī)中干燥3.0 h,待冷卻0.5 h后記錄小麥粒質(zhì)量。重復(fù)上述步驟兩次后測(cè)得的兩次干燥的粒質(zhì)量差不超過2 mg,即為恒重。小麥樣品水分按式(1)進(jìn)行計(jì)算:
(1)
式中:m1為烘干前小麥粒質(zhì)量/g,m2為第3次烘干后小麥粒質(zhì)量/g。
由于一次高光譜掃描會(huì)獲得50粒小麥籽的數(shù)據(jù),為了分析單粒小麥籽的含水量需要從這50粒小麥中將單粒小麥籽光譜數(shù)據(jù)提取出來。高光譜采集系統(tǒng)獲得的光譜數(shù)據(jù)是一個(gè)大小為1 024×1 623×1 123的3維矩陣,其中1 024表示相機(jī)水平方向的像素?cái)?shù),1 623表示將波長363~1 025 nm分成1 632個(gè)點(diǎn),1 123表示總共掃描的行數(shù)。提取單粒小麥籽的光譜數(shù)據(jù)流程為:首先從獲得的3維數(shù)據(jù)矩陣中選擇波長為580 nm的光譜圖像;然后將其轉(zhuǎn)換成二值圖像,通過二值圖像獲得單粒小麥的邊緣信息,再根據(jù)小麥邊緣空間位置信息在原始光譜矩陣中提取光譜數(shù)據(jù),最后計(jì)算其平均值獲得單粒小麥籽的平均光譜數(shù)據(jù)。分別提取A面與B面小麥的光譜數(shù)據(jù)共5 000條譜線。
高光譜在每個(gè)波段下光源強(qiáng)度分布不均勻,通常需要對(duì)原始光譜數(shù)據(jù)進(jìn)行白板與黑板校正。本實(shí)驗(yàn)采用自定義的參考白板對(duì)原始光譜數(shù)據(jù)進(jìn)行白板校正。根據(jù)公式(2)對(duì)光譜數(shù)據(jù)進(jìn)行黑白板校正[19]:
(2)
式中:IO為白板校正后的光譜數(shù)據(jù);I為原始光譜;IW為白板的平均光譜數(shù)據(jù);ID為黑板的平均光譜數(shù)據(jù)。
實(shí)驗(yàn)中使用HSI Analyzer軟件采集光譜,使用MATLAB R2017b軟件進(jìn)行光譜數(shù)據(jù)分析與建模。
1.5.1 光譜數(shù)據(jù)預(yù)處理
常見的光譜預(yù)處理方法有去中心化(Mean)、標(biāo)準(zhǔn)正態(tài)變換(SNV)、多元散射校正(MSC)、應(yīng)用Savitzky-Golay平滑的一階導(dǎo)數(shù)(SAVG1)和二階導(dǎo)數(shù)(SAVG2)等,以及兩兩組合的復(fù)合預(yù)處理方法。經(jīng)過不同的預(yù)處理方法后,新的光譜數(shù)據(jù)將具有不同的統(tǒng)計(jì)特性。如原始光譜經(jīng)過去中心化處理后,新的光譜數(shù)據(jù)均值為0;經(jīng)過SNV預(yù)測(cè)處理后,新的光譜均值為0,方差為1。MSC預(yù)處理有利于消除光譜散射影響。SAVG1或SAVG2預(yù)處理,相當(dāng)于利用差值光譜進(jìn)行建模。分別比較未做預(yù)處理(None)與Mean、SNV、MSC、MSC+Mean、SAVG1+Mean、SAVG1+SNV和SAVG2+SNV預(yù)處理方法對(duì)小麥籽含水量的預(yù)測(cè)結(jié)果。根據(jù)校正集均方根誤差(RMSEC)、預(yù)測(cè)集均方根誤差(RMSEP)、校正集相關(guān)系數(shù)(RC)、預(yù)測(cè)集相關(guān)系數(shù)(RP)來評(píng)價(jià)模型的預(yù)測(cè)性能。在不同主成分(PC)下,RMSEP值越小,RP值越大,說明該模型具有更好的預(yù)測(cè)性能。
1.5.2 偏最小二乘法回歸法建模
在光譜的定量分析算法中有多元線性回歸、主成分回歸和偏最小二乘回歸(PLSR)等。PLSR在光譜建模分析中得到較廣泛的應(yīng)用。利用4種光譜模型預(yù)測(cè)單粒小麥的含水量,分別記為MA、MB、MC和MD。其中模型MA、MB分別由單粒小麥籽的A面和B面各2 500條譜線構(gòu)成。模型MC由同一粒小麥的A面與B面光譜數(shù)據(jù)的平均值構(gòu)成,模型MD將A面與B面的光譜數(shù)據(jù)共同構(gòu)成一個(gè)5 000條譜線的光譜矩陣。利用PLSR方法分析比較這4種模型對(duì)單粒小麥籽含水量預(yù)測(cè)性能的影響。
測(cè)得小麥樣品的參考含水量在1.83%~16.72%范圍中,按照含水量從低到高進(jìn)行排序。利用等間隔取樣法,按照3 ∶2的比例將小麥分成校正集和預(yù)測(cè)集,即每5個(gè)樣品中取出2個(gè)為預(yù)測(cè)集。本實(shí)驗(yàn)中校正集共1 500粒小麥籽,預(yù)測(cè)集共1 000粒小麥籽。
圖1 校正后的單粒小麥籽平均光譜曲線
對(duì)單粒小麥籽原始的光譜數(shù)據(jù)做黑白板校正后的平均光譜曲線如圖1所示,在363~410 nm左右吸光度隨波長的增加而減小,而在410~950 nm波長范圍內(nèi)吸光度增加的速率由快變緩,最后吸光度在950~1 025 nm波長范圍內(nèi)逐漸減小。
將MA、MB、MC和MD 4種光譜模型用不同的預(yù)處理方法分別進(jìn)行PLSR建模預(yù)測(cè)單粒小麥籽的含水量,其結(jié)果如表1至表4所示。
對(duì)比表1與表2中的數(shù)據(jù)可知,利用MA模型進(jìn)行PLSR建模的預(yù)測(cè)效果整體上優(yōu)于MB模型。這主要是PLSR建模使用的是單粒小麥籽的平均光譜,A面小麥籽的平整度比B面好,小麥籽越平整,其與光譜儀鏡頭之間的距離越一致,故獲得的反射光譜系數(shù)就越平穩(wěn)。
對(duì)比表1~表4可知, 4種預(yù)測(cè)模型采用SAVG1+SNV預(yù)處理時(shí)具有最佳的預(yù)測(cè)性能。這主要是SAVG1預(yù)處理利用光譜的1階差值譜建模,有利于消除光譜中基線的平移,可以消除其他背景的干擾。以RMSEP最小為依據(jù),4個(gè)模型的預(yù)測(cè)性能由高到低的次序是模型MD、模型MC、模型MA、模型MB,即模型MD具有最佳預(yù)測(cè)效果。模型MD將A面與B面小麥的光譜數(shù)據(jù)混合在一起具有較好的魯棒性。
表1 MA模型單粒小麥籽含水量的預(yù)測(cè)結(jié)果
表2 MB模型單粒小麥籽含水量的預(yù)測(cè)結(jié)果
表3 MC模型單粒小麥籽含水量的預(yù)測(cè)結(jié)果
表4 MD模型單粒小麥籽含水量的預(yù)測(cè)結(jié)果
對(duì)于模型MD,采用SAVG1+SNV預(yù)處理時(shí),其RMSEP =1.36%,RP=0.90。畫出模型MD在SAVG1+SNV預(yù)處理下預(yù)測(cè)小麥籽含水量的散點(diǎn)圖如圖2所示。
圖2 模型MD小麥籽含水量的預(yù)測(cè)結(jié)果
高光譜成像技術(shù)相對(duì)于近紅外光譜的優(yōu)勢(shì)在于高光譜不僅可以獲得物質(zhì)的光譜信息,還能把光譜信息與物質(zhì)的空間位置聯(lián)系起來,利用空間位置信息結(jié)合近紅外光譜的預(yù)測(cè)模型就可以獲得單粒小麥水分分布圖。為了檢驗(yàn)?zāi)P蚆D的性能,本實(shí)驗(yàn)重新從50份小麥樣品中每份隨機(jī)挑選出1粒小麥籽樣品,共50粒小麥籽用于外部測(cè)試。將這50粒小麥籽分成A面與B面進(jìn)行光譜掃描,然后將A面與B面的光譜數(shù)據(jù)利用模型MD進(jìn)行單粒小麥籽含水量的預(yù)測(cè)。單粒小麥與整盤小麥的水分分布圖如圖3所示。
圖3 A面與B面小麥籽水分分布圖
在圖3a中,A面與B面小麥的偽彩色圖由波長分別為680、550、450nm 3個(gè)波長點(diǎn)合成RGB三基色圖像。圖3b是整盤單粒小麥籽的水分分布,色彩越偏紅其含水量越高。從圖3b中可以直觀地觀察每一粒小麥的含水量,能定位到具體的含水量異常的小麥。圖3c將整盤小麥的前兩列,共20粒提取出來,并標(biāo)出參考含水量(紅色字體)與預(yù)測(cè)含水量(黑色字體)。
統(tǒng)計(jì)這50粒小麥籽含水量的預(yù)測(cè)結(jié)果為:A面小麥籽含水量預(yù)測(cè)的絕對(duì)誤差最小值為0.37%,最大值為3.60%,平均值為1.13%;B面小麥籽含水量預(yù)測(cè)的絕對(duì)誤差最小值為0.15%,最大值為3.50%,平均值為1.22%。
圖3中整盤小麥的平均含水量為7.18%,不難看出,不同小麥籽水分預(yù)測(cè)值存在差異,但同時(shí)又在平均含水量上下波動(dòng),說明采用高光譜成像技術(shù)預(yù)測(cè)單粒小麥水分的方法是可行的。本研究收集的小麥樣品有5種年份、4個(gè)種類和5個(gè)產(chǎn)地,其樣品分布具有代表性,這使得建立的預(yù)測(cè)模型具有很好的適應(yīng)性。
高光譜成像技術(shù)既可以預(yù)測(cè)一批小麥樣品整體含水量,又可以預(yù)測(cè)單粒小麥的平均含水量,甚至可以利用單粒小麥的光譜信息將單粒小麥水分分布可視化。將2 500粒小麥籽分為A面和B面進(jìn)行光譜掃描,利用A面和B面的光譜信息構(gòu)成MA、MB、MC和MD 4種模型用于建模預(yù)測(cè)小麥籽的含水量。由預(yù)測(cè)結(jié)果可知:利用模型MA進(jìn)行PLSR建模的預(yù)測(cè)效果整體上優(yōu)于B面。A面與B面實(shí)驗(yàn)結(jié)果表明:小麥樣品的不同放置方式對(duì)PLSR建模有影響,這主要是由于不同的放置形式,小麥光譜的反射面的平整度不一致所引起的。在這4種預(yù)測(cè)模型中,模型MD預(yù)測(cè)單粒小麥籽的含水量優(yōu)于其他3種模型。利用高光譜成像技術(shù)結(jié)合偏最小二乘回歸法預(yù)測(cè)單粒小麥含水量是可行的,并能夠定位一批樣品中單粒小麥的含水量不正常的粒籽。