李 月,劉貴珊*,樊奈昀*,何建國,李 燕,孫有瑞,蒲芳寧
1.寧夏大學(xué)食品與葡萄酒學(xué)院,寧夏 銀川 750021 2.寧夏大學(xué)物理與電子電氣工程學(xué)院,寧夏 銀川 750021
靈武長棗,是寧夏特色棗果,因其口感香脆、果肉豐富而受到消費(fèi)者青睞。完好長棗細(xì)胞壁的網(wǎng)狀結(jié)構(gòu)是由半纖維素、果膠及纖維素相互交聯(lián)形成,共同維持長棗組織的完整性,但人為或機(jī)械碰撞等因素會造成不同程度瘀傷使棗中半纖維素降解及分子結(jié)構(gòu)變化而影響細(xì)胞壁結(jié)構(gòu),造成長棗質(zhì)地軟化,縮短貨架期[1]。因此,半纖維素是衡量果品品質(zhì)重要評估指標(biāo)之一。常規(guī)半纖維素測定方法有HCl水解法、差重法等[2]。然而,這些方法具有破壞性強(qiáng),耗時長等缺點(diǎn)。因此,需尋找一種測定果品中半纖維素含量快速無損檢測方法。
高光譜成像將數(shù)字圖像與光譜集成在一個系統(tǒng)中,獲得評估果實(shí)質(zhì)量的空間和光譜信息,已被用于鑒定果品的可溶性固形物[3]、硬度[4]、早期瘀傷[5]和成熟度[6]等。二維相關(guān)光譜將光譜信號擴(kuò)展到第2維,為確定光譜特征細(xì)微變化和識別與擾動相關(guān)敏感變量提供了一種新思路[7]。
以靈武長棗為研究對象,探索高光譜成像結(jié)合二維相關(guān)光譜對靈武長棗中半纖維素含量快速無損檢測的可行性。
從寧夏靈武某果園中采摘無瘀傷、顏色全紅、大小均一的長棗249個,經(jīng)保鮮袋包裝后貯藏在(0±2)℃的冰箱中備用。
圖1為構(gòu)建靈武長棗瘀傷等級裝置,參照Yuan[8]的方法并稍作修改來構(gòu)建瘀傷態(tài)靈武長棗。完整棗定義為0級瘀傷,沖擊1次定義為Ⅰ級瘀傷,沖擊2次為Ⅱ級瘀傷,依次獲得Ⅰ,Ⅱ,Ⅲ和Ⅳ級瘀傷態(tài)長棗模型。
圖1 靈武長棗定量瘀傷裝置
高光譜成像系統(tǒng)(400~1 000 nm)主要由光譜儀、CCD相機(jī)、鹵素?zé)?、電控位移平臺和計(jì)算機(jī)組成[9]。采集光譜信息之前,先將系統(tǒng)預(yù)熱30 min,通過黑白校正消除暗電流,光源不均勻等影響圖像質(zhì)量的不良因素[10]。
參照Wang[11]等的方法測定半纖維素含量。
為建立校正模型,需對樣本數(shù)據(jù)集進(jìn)行劃分,采用隨機(jī)劃分法(random sampling,RS),Kennard-Stone法(KS)、光譜-理化值共生距離法(sample set partitioning based on joint X-Y distances,SPXY)和3∶1比例四種方法來優(yōu)選最合適劃分的方法。為減少原始光譜中背景和噪音的干擾,增強(qiáng)光譜有用信息,提高模型預(yù)測性能;利用Baseline,De-trending和Normalize對原始光譜進(jìn)行預(yù)處理。通過二維相關(guān)光譜(two-dimensional correlation spectroscopy,2D-COS)分析光譜信號的變化,在全光譜范圍內(nèi)尋找與半纖維素含量相關(guān)的敏感區(qū)域,減少全波段光譜數(shù)據(jù)的冗余。同時,為在2D-COS敏感波段區(qū)間提取有效信息,采用競爭性自適應(yīng)加權(quán)算法(competitive adaptive reweighted sampling,CARS)、引導(dǎo)軟收縮(bootstrapping soft shrinkage,BOSS)、區(qū)間變量迭代空間收縮方法(interval variable iterative space shrinkage approach,iVISSA)、變量組合集群分析法(variables combination population analysis,VCPA)四種算法和iVISS+BOSS,iVISS+CARS及iVISS+VCPA三種組合算法進(jìn)行特征波長選擇。偏最小二乘回歸模型(partial least square regression,PLSR)作為一種經(jīng)典的線性多元統(tǒng)計(jì)方法,常用于建立光譜模型,利用原始光譜、預(yù)處理光譜、2D-COS敏感波段和選擇的特征變量建立PLSR模型。
采用蒙特卡洛異常值檢測法檢測出10個異常樣本,剔除后采用SPXY,KS,RS和3∶1劃分法將剩余239個樣本劃分為179個校正集和60個預(yù)測集。由表1可知,按3∶1方法劃分后建立的PLSR模型R2最大且RMSE值最小。通常,R2值越高,RMSE值越低,說明模型性能較好[12-13]。綜上,后續(xù)數(shù)據(jù)分析采用3∶1方法劃分樣本集。
表1 不同樣本劃分結(jié)果
圖2為不同瘀傷等級靈武長棗的平均光譜反射曲線。從圖中可看出,5條曲線呈現(xiàn)相同變化趨勢,0和Ⅰ級瘀傷長棗光譜反射率高于Ⅱ,Ⅲ,Ⅳ級,說明不同程度瘀傷會影響棗中半纖維素降解的快慢,從而導(dǎo)致其半纖維素含量不同[1]。曲線在502,670和977 nm處出現(xiàn)波谷,在641和881 nm處出現(xiàn)波峰,前者可能是由于吸水率不同引起[14],后者可能與長棗表皮的葉綠素吸收有關(guān)[15]。
圖2 不同瘀傷等級靈武長棗的平均反射光譜
圖3 反射光譜
表2 半纖維素含量經(jīng)不同預(yù)處理方法后的PLSR模型
二維相關(guān)光譜由同步和異步光譜組成,視半纖維素含量為外部干擾,通過二維相關(guān)光譜對光譜信號分析可在全波段內(nèi)尋找與半纖維素含量相關(guān)的敏感區(qū)域。
同步和異步二維相關(guān)的3D立體圖如圖4(a)和(b)所示,其中,X軸和Y軸是自變量軸,代表波長,Z軸是因變量軸,代表相關(guān)強(qiáng)度。以半纖維素含量為外部干擾,對Baseline預(yù)處理光譜進(jìn)行2D-COS分析得到的同步二維相關(guān)譜如圖4(c)所示,在對角線位置出現(xiàn)3個自相關(guān)峰(401,641和752 nm),說明此變量處光譜信號對外擾較敏感。在(401,641),(641,752)和(401,752)nm處有明顯正相關(guān)峰,說明401,641和752 nm處的吸收峰強(qiáng)度在同一方向上同時變化[16]。在圖4(d)為異步相關(guān)光譜,(401,641),(641,752)和(401,752)nm的異步交叉峰均大于0,通過二維相關(guān)分析,選擇401~752 nm光譜范圍內(nèi)的波長作為靈武長棗中半纖維素含量的檢測區(qū)域。
2.5.1 BOSS算法提取特征波長
BOSS是一種結(jié)合自助抽樣與加權(quán)自助抽樣思想,生成隨機(jī)變量組合并構(gòu)建子模型的算法。經(jīng)BOSS算法在2D-COS范圍內(nèi)提取了14個特征波長,占總波長的18.9%。
2.5.2 CARS算法提取特征波長
CARS根據(jù)達(dá)爾文進(jìn)化論中“適者生存”原理獲取變量,經(jīng)多次循環(huán)采樣后提取特征波長。CARS算法在2D-COS范圍內(nèi)提取26個特征波長,占總波長的35.1%。
2.5.3 iVISSA算法提取特征波長
iVISSA結(jié)合全局和局部搜索,能較大限度提取樣品信息并保證其完整性。用iVISSA算法在2D-COS范圍內(nèi)提取了39個特征波長,占總波長的52.7%。
2.5.4 VCPA算法提取特征波長
VCPA是一種考慮了變量之間通過隨機(jī)組合可能產(chǎn)生相互作用效應(yīng)的算法。經(jīng)VCPA算法在2D-COS的范圍內(nèi)選出12個特征波長,占總波長的16.2%。
圖4 樣品的二維相關(guān)譜圖
2.5.5 二次提取特征波長
由于iVISSA算法提取的特征波長較多,需進(jìn)行二次提取。iVISSA+BOSS共提取15個特征波長,占總波長的20.2%;iVISSA+CARS共提取22個特征波長,占總波長的29.7%;iVISSA+VCPA共提取11個特征波長,占總波長的14.8%。
表3 不同特征波長提取方法建立的PLSR模型結(jié)果對比
利用可見-近紅外高光譜結(jié)合二維相關(guān)光譜對瘀傷靈武長棗半纖維素含量進(jìn)行預(yù)測,主要結(jié)論如下:
(1)采用蒙特卡洛異常值檢測法剔除10個異常樣本后進(jìn)行樣本集劃分,3∶1劃分法建立的預(yù)測模型較穩(wěn)健。
(3)以半纖維素含量為外部干擾,通過2D-COS分析發(fā)現(xiàn)401,641和752 nm處的光譜信號對外界干擾更加敏感。因此,選取401~752 nm光譜范圍內(nèi)的波長作為瘀傷靈武長棗中半纖維素含量的檢測研究區(qū)域。