汪志強(qiáng) 李大鵬 劉 強(qiáng) 廖舒懷 易宗霈
(中南林業(yè)科技大學(xué)機(jī)電工程學(xué)院,湖南 長沙 410004)
油茶是一種營養(yǎng)價(jià)值豐富的油料作物[1],近年來其種植面積和規(guī)模不斷擴(kuò)大[2]。水分對(duì)油茶籽干燥時(shí)和干燥后影響較大,是一個(gè)重要的評(píng)價(jià)參數(shù)[3]。研究[4]表明,干燥時(shí),水分含量會(huì)影響油茶籽干燥品質(zhì)和能耗。同時(shí),在茶油加工步驟中,干燥是第一步工序,水分含量是干燥時(shí)要控制的參數(shù);干燥后,水分含量仍會(huì)影響油茶籽的貯藏[5]。目前,常用的茶籽水分含量測定方法主要為烘干法,但該法效率低下、耗時(shí)耗力[6]。
近年來,利用光譜技術(shù)檢測農(nóng)產(chǎn)品中含油率及含水率、鑒偽等具有快速分析、無損檢測,以及無需樣品準(zhǔn)備等優(yōu)點(diǎn)。周宏平等[7]利用高光譜技術(shù)實(shí)現(xiàn)了對(duì)油茶籽含油率的無損檢測,利用兩組采集到的漫反射高光譜圖像,結(jié)合化學(xué)方法成功建立了含油率的回歸預(yù)測模型。彭彥昆等[8]通過近紅外光譜法設(shè)計(jì)了豬肉水分在線檢測分級(jí)系統(tǒng),能夠在線準(zhǔn)確預(yù)測豬肉水分,判斷準(zhǔn)確率達(dá)90%以上。郭文川等[9]利用近紅外光譜檢測油茶籽油的摻偽,對(duì)摻偽質(zhì)量分?jǐn)?shù)不低于3%的摻偽油茶籽油的識(shí)別準(zhǔn)確率達(dá)100%。Melfsen等[10]用漫反射近紅外光譜法估測了牛奶中脂肪酸含量,最終預(yù)測準(zhǔn)確率達(dá)92%以上。Elsohaby等[11]利用紅外光譜和偏最小二乘回歸預(yù)測了奶牛和肉牛初乳免疫球蛋白G濃度,平均相對(duì)誤差為5%。
然而,近紅外光譜檢測方法測得的光譜極易受溫度、樣品種類等因素影響,其中,溫度是最常見的影響因素[12]。分子間的內(nèi)力受溫度影響產(chǎn)生變化,主要表現(xiàn)為光譜振動(dòng)變化。油茶籽水分中含有O—H鍵,在干燥時(shí),油茶籽表面溫度的不同會(huì)影響水分子的振動(dòng)變化,導(dǎo)致O—H基團(tuán)對(duì)可見/近紅外光譜的吸收波段以及強(qiáng)度發(fā)生變化[13],因此需要修正溫度變化對(duì)光譜檢測的影響。
目前,有關(guān)溫度影響可見/近紅外光譜檢測油茶籽含水率的相關(guān)研究尚未見報(bào)道。研究擬以不同溫度下干燥的油茶籽為研究對(duì)象,提出一種改進(jìn)的溫度修正模型,解決可見/近紅外光譜檢測時(shí)結(jié)果受溫度影響的問題,為采用可見/近紅外光譜檢測干燥過程中油茶籽含水率時(shí)消除溫度的影響提供依據(jù)。
1.1.1 材料
油茶籽:選擇新鮮的油茶果360個(gè)(平均分為3部分,依次于50,60,70 ℃下進(jìn)行試驗(yàn)),去殼,隨機(jī)選取360粒顆粒飽滿、大小均勻、無缺陷、單粒均重4 g 的油茶籽樣品,收集其光譜數(shù)據(jù),湖南雪峰山茶油專業(yè)合作社。
1.1.2 主要儀器設(shè)備
光源:HL-1000型,功率為5 W的鹵素光源,上海聞奕光電科技有限公司;
光譜儀:Maya2000 Pro型,波長范圍為199~1 113 nm,使用Y型光纖連接光源和光譜儀,美國Oceanoptics公司;
烘干箱:XGQ-2000型,浙江力辰儀器有限公司;
精密電子天平:JY/YP11003型,浙江力辰科技制造有限公司。
使用自行設(shè)計(jì)的光譜平臺(tái)采集光譜數(shù)據(jù)(圖1),該系統(tǒng)包括光源、光譜儀、Y型光纖、電腦、置物臺(tái)、支架、暗箱。每次采集前為了消除誤差,需進(jìn)行光譜黑白校正,校正方法[14]:
(1)
式中:
R——油茶籽的反射率;
A——校正前樣本原始的反射數(shù)據(jù);
C——標(biāo)準(zhǔn)白板的參考反射光譜數(shù)據(jù);
D——標(biāo)準(zhǔn)黑板的參考反射光譜數(shù)據(jù)。
先將漫反射標(biāo)準(zhǔn)白板(反射率99%)放置在密閉暗箱中(黑暗環(huán)境),光纖探頭垂直于白板,在其正上方3 cm 處,收集校正的光譜信息;取出烘干箱中的油茶籽,置于光纖探頭正下方2~3 cm 處收集原始反射光譜數(shù)據(jù)。
對(duì)每一部分的120粒油茶籽隨機(jī)依次編號(hào),分為10組。測量時(shí),先將全部油茶籽放入烘干箱中,依次于50,60,70 ℃下烘干。烘干時(shí),每隔1 h取出一組進(jìn)行光譜測量,迅速采集光譜數(shù)據(jù),以免溫度下降,模擬干燥時(shí)的溫度;為使光譜數(shù)據(jù)與含水率對(duì)應(yīng)更準(zhǔn)確,在采集光譜數(shù)據(jù)后,用天平稱重并記錄相應(yīng)數(shù)據(jù),完成一組數(shù)據(jù)收集。1 h后重復(fù)操作直至10 h后全部采集完畢,得到120個(gè)包含不同含水率的光譜數(shù)據(jù)。
光譜數(shù)據(jù)由其自帶的軟件讀取,用Microsoft Excel 2019記錄,采用MATLAB 2019 b、Python 3.9軟件處理數(shù)據(jù)。
1. 光譜儀 2. 電腦 3. 光源 4. Y型光纖 5. 暗箱 6. 置物臺(tái) 7. 油茶籽 8. 支架 9. 光纖探頭
按GB 5009.3—2016中的直接干燥法測量油茶籽含水率。
采用SPXY算法將每一溫度下的全部樣品劃分為校正集與預(yù)測集,比例為3∶1,用90份樣品建模,其余30份樣品以預(yù)測的方式來建立合適的模型。
為了減少誤差,剔除光譜數(shù)據(jù)中的無用信息,為了提高模型精度和預(yù)測效果,需對(duì)原始反射數(shù)據(jù)(RAW)進(jìn)行預(yù)處理[15]。選取的預(yù)處理方法有多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)和標(biāo)準(zhǔn)化縮放(Au)。其中MSC可以消除散射影響,增強(qiáng)采集的光譜和數(shù)據(jù)之間的關(guān)聯(lián);SNV可以消除因?yàn)轭w粒大小、表面散射對(duì)光譜的影響;Au能夠消除因數(shù)據(jù)差異過大產(chǎn)生的誤差[16]。
采用競爭性自適應(yīng)重加權(quán)算法(CARS)[17]來消除因?yàn)楣庾V數(shù)據(jù)量大導(dǎo)致運(yùn)行速度慢、誤差大、建模效果不理想的缺點(diǎn),從而選取合適的特征波長建模。
建模方法為偏最小二乘回歸法(PLSR)[18],該方法具有運(yùn)行速度快,能夠同時(shí)考慮光譜信息和相應(yīng)的理化性質(zhì),從而避免信息缺失的優(yōu)點(diǎn)。
表1 RPD值范圍與其對(duì)應(yīng)的含義
分別按式(2)~式(4)計(jì)算模型的R2、RMSE和RPD值。
(2)
(3)
(4)
式中:
yai——第i個(gè)樣本的預(yù)測值,g/g濕基;
yi——第i個(gè)樣本的真實(shí)值,g/g濕基;
n——樣本數(shù)。
采用斜率/偏差法(S/B)對(duì)溫度進(jìn)行修正,以Ta溫度下建立的模型來預(yù)測Tb溫度下的含水率為例,說明溫度修正的方法。分別建立Ta溫度下的光譜矩陣Xa,Tb溫度下的光譜矩陣Xb,用Xa和其對(duì)應(yīng)的含水率真實(shí)值矩陣Ma建立模型N,將Xb代入模型N中預(yù)測Tb溫度下的含水率矩陣Mb。假設(shè)Ta溫度下的含水率真實(shí)值矩陣Ma和Tb溫度下的含水率矩陣Mb存在如式(5)所示的關(guān)系式[20]。
Ma=B+S×Mb,
(5)
式中:
Mb——修正前Tb溫度下的含水率預(yù)測值,g/g濕基;
Ma——Ta溫度下樣品含水率的真實(shí)值,g/g濕基。
(6)
式中:
選用的光譜儀波長范圍為199~1 113 nm,其中199~780 nm屬于可見光范圍,780~1 113 nm屬于近紅外范圍。以60 ℃下采集的油茶籽原始反射光譜為例分析,全波段光譜如圖2所示,為了消除噪音和誤差,有效提取光譜信息,需去除光譜首尾兩端波段,選擇波長范圍為400~1 000 nm,總計(jì)1 366個(gè)波長點(diǎn)。
由圖2可知,波長為400~1 000 nm時(shí),曲線逐漸上升,反射率逐漸變大,420 nm處出現(xiàn)一個(gè)吸收峰,與索雷特吸收有關(guān)[21];960~980 nm附近出現(xiàn)平臺(tái)區(qū),形成一個(gè)弱吸收峰,是由油茶籽中O—H基團(tuán)的第二泛頻所導(dǎo)致的[22]。
圖2 60 ℃下采集的油茶籽原始反射光譜圖
試驗(yàn)發(fā)現(xiàn),不同含水率下溫度對(duì)光譜曲線均會(huì)產(chǎn)生明顯影響。由于獲取的油茶籽含水率分布范圍較廣(1%~60%),為了更清晰地表明溫度對(duì)光譜曲線的影響,以最高含水率范圍(60±1)%內(nèi)的光譜數(shù)據(jù)平均值為例來進(jìn)行說明。
由圖3可知,同一含水率不同溫度下的光譜曲線雖然走勢一樣,但其高低不一致。其中70 ℃對(duì)應(yīng)的光譜曲線最高,而60 ℃對(duì)應(yīng)的光譜曲線開始時(shí)高于50 ℃的,在650 nm 處變?yōu)樽畹?,之后又逐漸升高,并高于50 ℃的。
圖3 原始光譜曲線和曲線之差比較
為了更明確說明溫度對(duì)光譜曲線的影響,以60 ℃下的光譜數(shù)據(jù)建立基準(zhǔn)模型,因此以60 ℃對(duì)應(yīng)的光譜曲線為0基準(zhǔn),將50,70 ℃的光譜曲線與60 ℃的進(jìn)行差值計(jì)算,獲得對(duì)比曲線。70 ℃對(duì)應(yīng)的光譜曲線與60 ℃的光譜曲線反射率之差為正值,表明在該區(qū)域內(nèi)溫度的升高使油茶籽對(duì)光譜的反射越來越強(qiáng),使光譜接收到的信息變多。50 ℃對(duì)應(yīng)的光譜曲線先為負(fù)后為正之后又為負(fù),表明其反射強(qiáng)度先小于后大于之后又小于60 ℃對(duì)應(yīng)的光譜曲線。
綜上,溫度對(duì)光譜曲線產(chǎn)生了明顯影響,是由于溫度變化會(huì)影響O—H鍵的振動(dòng)頻率,進(jìn)而改變反射率[13]。因此建立油茶籽含水率預(yù)測模型時(shí)需要考慮溫度的影響。
以60 ℃下90個(gè)校正集樣本作為建模集,其余30個(gè)樣本進(jìn)行預(yù)測,采用MSC、SNV、Au對(duì)其原始光譜(RAW)進(jìn)行預(yù)處理后再進(jìn)行PLSR建模,結(jié)果見表2。
表2 60 ℃下反射率建模結(jié)果
將50,70 ℃的校正集樣本代入基準(zhǔn)模型中建模,預(yù)測含水率值,結(jié)果如圖4所示。由圖4可知,當(dāng)溫度低于60 ℃時(shí),預(yù)測值偏高;當(dāng)溫度高于60 ℃時(shí),預(yù)測值偏低。
將50,70 ℃下的含水率預(yù)測值與真實(shí)值進(jìn)行回歸分析,得到回歸方程:
M60=1.036M50-5.492,
(7)
M60=1.122M70+3.226。
(8)
由回歸方程可知,50,70 ℃下修正斜率分別為1.036和1.122;偏差分別為-5.492和3.226。
修正前,將50,70 ℃下的預(yù)測集代入基準(zhǔn)模型中,結(jié)果見表3,其RPD值均<2.5,說明預(yù)測結(jié)果較差,精度較低。
用預(yù)測集的30個(gè)樣本來評(píng)價(jià)模型修正結(jié)果,用基準(zhǔn)模型來預(yù)測各溫度下的含水率,將預(yù)測值矩陣、斜率和偏差代入式(6)中進(jìn)行修正,得到各溫度下含水率的修正值,修正后的結(jié)果見表3。由表3可知,50,70 ℃下的RPD值均>2.5,優(yōu)于修正前的結(jié)果,達(dá)到了良好的預(yù)測精度;而60 ℃下的RPD值雖有所降低,但仍>2.5,可以滿足預(yù)測需要,下降原因可能是預(yù)測時(shí)出現(xiàn)過擬合。
圖4 50 ℃和70 ℃樣本建模結(jié)果
表3 各溫度下修正前與修正后結(jié)果比較
觀察式(7)、式(8)和其余回歸方程可知,斜率接近于1,其對(duì)預(yù)測值的偏差近似為線性關(guān)系。試驗(yàn)溫度以60 ℃ 為基準(zhǔn)模型,10 ℃為梯度,每上升或下降一個(gè)梯度,計(jì)算出其偏差約等于4.359。因此,任意溫度下的修正方程擬合為
(9)
式中:
T——樣品溫度,50~70 ℃。
陸錫昆等[23]利用高光譜技術(shù)檢測油茶籽含水率,其經(jīng)過MSC預(yù)處理建立的PLSR模型的Rp值達(dá)0.939,與試驗(yàn)結(jié)果類似,但是其利用太陽進(jìn)行自然烘干來獲取不同的含水率樣品,未研究溫度對(duì)光譜的影響,因此其模型可能不適用于干燥時(shí)的油茶籽含水率在線檢測。
為了解決干燥時(shí)溫度對(duì)可見/近紅外光譜技術(shù)檢測油茶籽含水率的影響,分別于50,60,70 ℃下進(jìn)行相關(guān)干燥試驗(yàn)。結(jié)果表明,以60 ℃下校正集建立基準(zhǔn)偏最小二乘回歸法模型,對(duì)比3種預(yù)處理方式,得到其相對(duì)最佳的預(yù)處理方式為多元散射校正處理;同時(shí)為了進(jìn)一步提高模型精度,經(jīng)競爭性自適應(yīng)重加權(quán)算法處理,其預(yù)測集決定系數(shù)、預(yù)測集均方根誤差以及相對(duì)分析誤差分別為0.909、3.102%和3.315。用60 ℃下的基準(zhǔn)偏最小二乘回歸法模型來預(yù)測50,70 ℃下的含水率值,由預(yù)測值與真實(shí)值計(jì)算出斜率和偏差,采用斜率/偏差法計(jì)算出預(yù)測集修正后的預(yù)測值,精度明顯提高,相對(duì)分析誤差均>2.5,可用于一般性的預(yù)測。同時(shí)由單個(gè)溫度修正模型分析得到50~70 ℃范圍內(nèi),任意溫度下模型預(yù)測值的修正公式。綜上,斜率/偏差法能夠解決干燥時(shí)溫度對(duì)油茶籽含水率在線檢測的影響問題。后續(xù)可在多個(gè)溫度下進(jìn)行試驗(yàn),以使模型精度更高,應(yīng)用范圍更廣。