李 月,劉貴珊*,樊奈昀*,何建國(guó),李 燕,孫有瑞,蒲芳寧
1.寧夏大學(xué)食品與葡萄酒學(xué)院,寧夏 銀川 750021 2.寧夏大學(xué)物理與電子電氣工程學(xué)院,寧夏 銀川 750021
靈武長(zhǎng)棗,是寧夏特色棗果,因其口感香脆、果肉豐富而受到消費(fèi)者青睞。完好長(zhǎng)棗細(xì)胞壁的網(wǎng)狀結(jié)構(gòu)是由半纖維素、果膠及纖維素相互交聯(lián)形成,共同維持長(zhǎng)棗組織的完整性,但人為或機(jī)械碰撞等因素會(huì)造成不同程度瘀傷使棗中半纖維素降解及分子結(jié)構(gòu)變化而影響細(xì)胞壁結(jié)構(gòu),造成長(zhǎng)棗質(zhì)地軟化,縮短貨架期[1]。因此,半纖維素是衡量果品品質(zhì)重要評(píng)估指標(biāo)之一。常規(guī)半纖維素測(cè)定方法有HCl水解法、差重法等[2]。然而,這些方法具有破壞性強(qiáng),耗時(shí)長(zhǎng)等缺點(diǎn)。因此,需尋找一種測(cè)定果品中半纖維素含量快速無(wú)損檢測(cè)方法。
高光譜成像將數(shù)字圖像與光譜集成在一個(gè)系統(tǒng)中,獲得評(píng)估果實(shí)質(zhì)量的空間和光譜信息,已被用于鑒定果品的可溶性固形物[3]、硬度[4]、早期瘀傷[5]和成熟度[6]等。二維相關(guān)光譜將光譜信號(hào)擴(kuò)展到第2維,為確定光譜特征細(xì)微變化和識(shí)別與擾動(dòng)相關(guān)敏感變量提供了一種新思路[7]。
以靈武長(zhǎng)棗為研究對(duì)象,探索高光譜成像結(jié)合二維相關(guān)光譜對(duì)靈武長(zhǎng)棗中半纖維素含量快速無(wú)損檢測(cè)的可行性。
從寧夏靈武某果園中采摘無(wú)瘀傷、顏色全紅、大小均一的長(zhǎng)棗249個(gè),經(jīng)保鮮袋包裝后貯藏在(0±2)℃的冰箱中備用。
圖1為構(gòu)建靈武長(zhǎng)棗瘀傷等級(jí)裝置,參照Yuan[8]的方法并稍作修改來(lái)構(gòu)建瘀傷態(tài)靈武長(zhǎng)棗。完整棗定義為0級(jí)瘀傷,沖擊1次定義為Ⅰ級(jí)瘀傷,沖擊2次為Ⅱ級(jí)瘀傷,依次獲得Ⅰ,Ⅱ,Ⅲ和Ⅳ級(jí)瘀傷態(tài)長(zhǎng)棗模型。
圖1 靈武長(zhǎng)棗定量瘀傷裝置
高光譜成像系統(tǒng)(400~1 000 nm)主要由光譜儀、CCD相機(jī)、鹵素?zé)?、電控位移平臺(tái)和計(jì)算機(jī)組成[9]。采集光譜信息之前,先將系統(tǒng)預(yù)熱30 min,通過黑白校正消除暗電流,光源不均勻等影響圖像質(zhì)量的不良因素[10]。
參照Wang[11]等的方法測(cè)定半纖維素含量。
為建立校正模型,需對(duì)樣本數(shù)據(jù)集進(jìn)行劃分,采用隨機(jī)劃分法(random sampling,RS),Kennard-Stone法(KS)、光譜-理化值共生距離法(sample set partitioning based on joint X-Y distances,SPXY)和3∶1比例四種方法來(lái)優(yōu)選最合適劃分的方法。為減少原始光譜中背景和噪音的干擾,增強(qiáng)光譜有用信息,提高模型預(yù)測(cè)性能;利用Baseline,De-trending和Normalize對(duì)原始光譜進(jìn)行預(yù)處理。通過二維相關(guān)光譜(two-dimensional correlation spectroscopy,2D-COS)分析光譜信號(hào)的變化,在全光譜范圍內(nèi)尋找與半纖維素含量相關(guān)的敏感區(qū)域,減少全波段光譜數(shù)據(jù)的冗余。同時(shí),為在2D-COS敏感波段區(qū)間提取有效信息,采用競(jìng)爭(zhēng)性自適應(yīng)加權(quán)算法(competitive adaptive reweighted sampling,CARS)、引導(dǎo)軟收縮(bootstrapping soft shrinkage,BOSS)、區(qū)間變量迭代空間收縮方法(interval variable iterative space shrinkage approach,iVISSA)、變量組合集群分析法(variables combination population analysis,VCPA)四種算法和iVISS+BOSS,iVISS+CARS及iVISS+VCPA三種組合算法進(jìn)行特征波長(zhǎng)選擇。偏最小二乘回歸模型(partial least square regression,PLSR)作為一種經(jīng)典的線性多元統(tǒng)計(jì)方法,常用于建立光譜模型,利用原始光譜、預(yù)處理光譜、2D-COS敏感波段和選擇的特征變量建立PLSR模型。
采用蒙特卡洛異常值檢測(cè)法檢測(cè)出10個(gè)異常樣本,剔除后采用SPXY,KS,RS和3∶1劃分法將剩余239個(gè)樣本劃分為179個(gè)校正集和60個(gè)預(yù)測(cè)集。由表1可知,按3∶1方法劃分后建立的PLSR模型R2最大且RMSE值最小。通常,R2值越高,RMSE值越低,說明模型性能較好[12-13]。綜上,后續(xù)數(shù)據(jù)分析采用3∶1方法劃分樣本集。
表1 不同樣本劃分結(jié)果
圖2為不同瘀傷等級(jí)靈武長(zhǎng)棗的平均光譜反射曲線。從圖中可看出,5條曲線呈現(xiàn)相同變化趨勢(shì),0和Ⅰ級(jí)瘀傷長(zhǎng)棗光譜反射率高于Ⅱ,Ⅲ,Ⅳ級(jí),說明不同程度瘀傷會(huì)影響棗中半纖維素降解的快慢,從而導(dǎo)致其半纖維素含量不同[1]。曲線在502,670和977 nm處出現(xiàn)波谷,在641和881 nm處出現(xiàn)波峰,前者可能是由于吸水率不同引起[14],后者可能與長(zhǎng)棗表皮的葉綠素吸收有關(guān)[15]。
圖2 不同瘀傷等級(jí)靈武長(zhǎng)棗的平均反射光譜
圖3 反射光譜
表2 半纖維素含量經(jīng)不同預(yù)處理方法后的PLSR模型
二維相關(guān)光譜由同步和異步光譜組成,視半纖維素含量為外部干擾,通過二維相關(guān)光譜對(duì)光譜信號(hào)分析可在全波段內(nèi)尋找與半纖維素含量相關(guān)的敏感區(qū)域。
同步和異步二維相關(guān)的3D立體圖如圖4(a)和(b)所示,其中,X軸和Y軸是自變量軸,代表波長(zhǎng),Z軸是因變量軸,代表相關(guān)強(qiáng)度。以半纖維素含量為外部干擾,對(duì)Baseline預(yù)處理光譜進(jìn)行2D-COS分析得到的同步二維相關(guān)譜如圖4(c)所示,在對(duì)角線位置出現(xiàn)3個(gè)自相關(guān)峰(401,641和752 nm),說明此變量處光譜信號(hào)對(duì)外擾較敏感。在(401,641),(641,752)和(401,752)nm處有明顯正相關(guān)峰,說明401,641和752 nm處的吸收峰強(qiáng)度在同一方向上同時(shí)變化[16]。在圖4(d)為異步相關(guān)光譜,(401,641),(641,752)和(401,752)nm的異步交叉峰均大于0,通過二維相關(guān)分析,選擇401~752 nm光譜范圍內(nèi)的波長(zhǎng)作為靈武長(zhǎng)棗中半纖維素含量的檢測(cè)區(qū)域。
2.5.1 BOSS算法提取特征波長(zhǎng)
BOSS是一種結(jié)合自助抽樣與加權(quán)自助抽樣思想,生成隨機(jī)變量組合并構(gòu)建子模型的算法。經(jīng)BOSS算法在2D-COS范圍內(nèi)提取了14個(gè)特征波長(zhǎng),占總波長(zhǎng)的18.9%。
2.5.2 CARS算法提取特征波長(zhǎng)
CARS根據(jù)達(dá)爾文進(jìn)化論中“適者生存”原理獲取變量,經(jīng)多次循環(huán)采樣后提取特征波長(zhǎng)。CARS算法在2D-COS范圍內(nèi)提取26個(gè)特征波長(zhǎng),占總波長(zhǎng)的35.1%。
2.5.3 iVISSA算法提取特征波長(zhǎng)
iVISSA結(jié)合全局和局部搜索,能較大限度提取樣品信息并保證其完整性。用iVISSA算法在2D-COS范圍內(nèi)提取了39個(gè)特征波長(zhǎng),占總波長(zhǎng)的52.7%。
2.5.4 VCPA算法提取特征波長(zhǎng)
VCPA是一種考慮了變量之間通過隨機(jī)組合可能產(chǎn)生相互作用效應(yīng)的算法。經(jīng)VCPA算法在2D-COS的范圍內(nèi)選出12個(gè)特征波長(zhǎng),占總波長(zhǎng)的16.2%。
圖4 樣品的二維相關(guān)譜圖
2.5.5 二次提取特征波長(zhǎng)
由于iVISSA算法提取的特征波長(zhǎng)較多,需進(jìn)行二次提取。iVISSA+BOSS共提取15個(gè)特征波長(zhǎng),占總波長(zhǎng)的20.2%;iVISSA+CARS共提取22個(gè)特征波長(zhǎng),占總波長(zhǎng)的29.7%;iVISSA+VCPA共提取11個(gè)特征波長(zhǎng),占總波長(zhǎng)的14.8%。
表3 不同特征波長(zhǎng)提取方法建立的PLSR模型結(jié)果對(duì)比
利用可見-近紅外高光譜結(jié)合二維相關(guān)光譜對(duì)瘀傷靈武長(zhǎng)棗半纖維素含量進(jìn)行預(yù)測(cè),主要結(jié)論如下:
(1)采用蒙特卡洛異常值檢測(cè)法剔除10個(gè)異常樣本后進(jìn)行樣本集劃分,3∶1劃分法建立的預(yù)測(cè)模型較穩(wěn)健。
(3)以半纖維素含量為外部干擾,通過2D-COS分析發(fā)現(xiàn)401,641和752 nm處的光譜信號(hào)對(duì)外界干擾更加敏感。因此,選取401~752 nm光譜范圍內(nèi)的波長(zhǎng)作為瘀傷靈武長(zhǎng)棗中半纖維素含量的檢測(cè)研究區(qū)域。