薛書凝,殷 勇,于慧春,袁云霞,馬帥帥
河南科技大學食品與生物工程學院,河南 洛陽 471023
香蕉是重要的水果作物,由于香蕉口味極佳,富含維生素等各種營養(yǎng)物質(zhì),具有抗氧化性,以及對預防疾病和維持人體健康有巨大的益處,因此在人類飲食中占據(jù)特殊地位[1]。 而香蕉作為呼吸躍變型水果,貯藏過程中腐敗現(xiàn)象相當嚴重,造成相當大的浪費。 所以,在香蕉貯藏過程中建立一個行之有效的腐敗預警模型對降低香蕉在貯藏中的浪費具有非常重要的現(xiàn)實意義。
高光譜成像技術(shù)以其無損、快速、分辨率高而著稱,不僅能夠獲取研究對象內(nèi)部成分與結(jié)構(gòu)的光譜信息,還能獲取其外部形狀、表面缺陷的圖像信息。 現(xiàn)在,高光譜技術(shù)已經(jīng)在精準農(nóng)業(yè)[2]、醫(yī)學診斷[3]、軍事防御[4]、農(nóng)產(chǎn)品品質(zhì)評價[5]及食品質(zhì)量控制[6]等方面得到廣泛使用。 但是,香蕉的高光譜研究主要集中在冷害、成熟度及腐敗進程研究,在腐敗預警方面研究尚少,并沒有建立一個有效的預警體系和腐敗標準以實時監(jiān)控腐敗進程。 因此,擬通過對不同貯藏期的香蕉樣本進行高光譜信息采集,獲取樣本的光譜信息,在有效確定腐敗基準光譜信息表征向量的前提下嘗試運用馬氏距離構(gòu)建香蕉貯藏期間可有效實現(xiàn)腐敗預警的判別模型,以便為降低香蕉貯藏過程中因腐敗而造成經(jīng)濟損失提供一種預警手段。
新鮮香蕉品種為廣東香蕉1號,于2019年4月8日購于當?shù)爻?,總重量?00斤。 考慮到貯藏條件僅起到加快或延遲香蕉的品質(zhì)變化過程,而不影響某一品質(zhì)等級下的樣本光譜信息。 因此,為減少貯藏時間和試驗時間,將新鮮香蕉置于貯藏庫中常溫存放,并對貯藏庫的溫濕度進行實時監(jiān)控,溫度變化范圍為20.07~24.07 ℃、相對濕度變化范圍為90.36%~93.55%,每天采集香蕉的光譜信息和色差指標。 其中隨機選取10根香蕉進行光譜信息采集,而色差信息是對固定的6根香蕉進行采集的。 根據(jù)實際貯藏過程中的感官情況,約在貯藏的第6天開始腐敗,但為了確保腐敗基準界定時分析數(shù)據(jù)的完整覆蓋性,共采集了8 d的貯藏數(shù)據(jù)。
高光譜圖像采集系統(tǒng)由高光譜成像儀(IST50-3810型,德國Inno-Spec公司,光譜分辨率為2.8 nm)、4個500 W的光纖鹵素燈(RK90000420108型,德國Esylux公司)、傳送裝置以及控制機(自制)構(gòu)成。 光譜采樣范圍為371.05~1 023.82 nm,采樣間隔為0.51 nm,共采集1 288個波段的光譜信息。
每天從貯藏庫中隨機選取10根香蕉,從每根香蕉的中部切取薄厚均勻的五片香蕉樣本,共計50個樣本。 每次試驗將一個樣本平鋪于潔凈的培養(yǎng)皿中,將培養(yǎng)皿放置于傳送帶上進行高光譜數(shù)據(jù)采集。 采集的參數(shù)設置為: 傳送帶傳送速度為1.20 mm·s-1,CCD相機的曝光時間為90 ms,物距為350 mm。
為了更好地避免或減少相機暗電流和光源亮度分布不均勻?qū)υ囼灲Y(jié)果產(chǎn)生的影響,在試驗前先對標準白板和全黑圖像進行采集,后對采集到的高光譜數(shù)據(jù)進行黑白板校正[7]。 黑白校正方法為
(1)
式(1)中:R為校正后的高光譜圖像;R0為高光譜原始圖像;Rw為標準白板標定圖像;Rb為全黑標定圖像。
能夠表征香蕉腐敗的指標眾多,但色差是香蕉在貯藏過程中反映表皮顏色變化的最直觀的指標,能夠表征顏色感官差異性,是一種模擬人類眼睛感受顏色變化的指標,但同時以具體數(shù)據(jù)來反映顏色變化,比人感官評價更準確、具體。 所以,采用了色差作為香蕉腐敗進程的理化表征指標。
使用Xrite color i5型色差計測量香蕉表面顏色變化。 色差計在使用前需用標準的白阱和黑阱進行校正。 顏色測定是在固定的6根香蕉的中段位置進行,每個樣本均重復3次測量,取平均值作為該樣本的色差值,并用亮度L*(從黑到白)、紅度a*(從綠到紅)、藍度b*(從藍到黃)三個基本指標評價香蕉顏色[8]。 根據(jù)測定的這三個色差指標可以通過式(2)計算出總色差ΔE[9]。 ΔE作為反映香蕉表面顏色變化的綜合指標,可以用于反映香蕉貯藏過程中總體顏色變化。
(2)
樣本的高光譜信息提取主要借助ENVI Classic軟件。 首先選取樣本圖像中的感興趣區(qū)域(region of interest, ROI)[10]。 因樣本形狀不規(guī)則,所以根據(jù)樣本與背景間的光譜差異,將樣本從背景中提取出來,如圖1所示的紅色區(qū)域即為所分離出來的感興趣區(qū)域,并提取出該區(qū)域的平均光譜曲線。 由于在掃描初始階段和末尾階段存在著較大的噪聲影響,可應用ENVI軟件動態(tài)顯示各波段圖像,分辨出包含信息量較多的波段,除去信噪比較低的371.05~482.60和880.99~1 023.82 nm兩個波段,選取483.11~880.49 nm為分析波段(含781個波段)。 雖除去了信噪比較低的波段,但提取的光譜值仍受電流、光線等外界環(huán)境的影響而產(chǎn)生不同程度的噪聲干擾,故采用Savitzky-Golary卷積平滑法[11](SG平滑)對獲取的光譜進行平滑降噪處理,減少噪聲的干擾。
圖1 香蕉樣本圖像感興趣區(qū)域的提取Fig.1 Extraction of interest region from banana sample image
為了減少冗余信息,簡化計算,將降噪后的高光譜數(shù)據(jù)進行特征波長的選取。 為此,提出一種基于Wilks Λ統(tǒng)計量的權(quán)重系數(shù)高光譜特征波長提取方法進行特征波長的選取。 由于Wilks Λ統(tǒng)計量要求變量之間應相互獨立[12],所以,首先用主成分分析法(principal component analysis, PCA)對降噪后的高光譜數(shù)據(jù)進行分析,得到能夠包含所有波長下光譜信息的主成分變量。 對獲取的主成分數(shù)據(jù)構(gòu)建Wilks Λ統(tǒng)計量[13],并用公式(3)得到每個主成分數(shù)據(jù)下的Wilks Λ值。 Wilks Λ值是表征類別間(同一貯藏日的樣本歸為1類)差異性的統(tǒng)計量,其值越小說明類別間的差異性越顯著。 對各個主成分的Wilks Λ值進行升序排列,選出Wilks Λ值最小的主成分。 將該主成分對應各波長下的權(quán)重系數(shù)計算出來,畫出權(quán)重系數(shù)圖,從而獲取能夠表征整體光譜信息的特征波長。 值得強調(diào)的是,該方法不需要理化指標為依據(jù),僅借助光譜信息進行特征波長提取,使所獲得的特征波長不受理化指標的改變而變化,提高了選取結(jié)果的魯棒性。
(3)
式(3)中:D為原始數(shù)據(jù)經(jīng)PCA后得到的主成分矩陣中每一列的組內(nèi)離差陣,T為原始數(shù)據(jù)經(jīng)PCA后得到的主成分矩陣中每一列的總離差。
1.6.1 基于色差變化的確定方法
香蕉在貯藏期內(nèi)品質(zhì)不斷地發(fā)生著變化,尤其是表皮顏色變化最為明顯,在實驗過程中僅肉眼感官即可觀測到隨著貯藏時間的延長,香蕉表皮逐漸由亮黃色過渡為暗黃色,后逐漸發(fā)生褐變,出現(xiàn)褐色斑點,最終整體變?yōu)楹诤稚?所以,根據(jù)實際貯藏過程中的感官情況,初步確定了腐敗基準點為第6個貯藏日,并在第6個貯藏日之后再采集兩天的貯藏數(shù)據(jù),以確保分析數(shù)據(jù)的完整覆蓋性。 因此,在樣本色差與光譜數(shù)據(jù)采集試驗中,共進行了8 d的貯藏試驗樣本的采集。
根據(jù)不同貯藏時間樣本的L*,a*,b*值數(shù)據(jù),通過式(2)計算反映總體顏色變化的總色差ΔE。 分析樣本L*,a*,b*,ΔE值隨貯藏時間變化的折線圖,根據(jù)各指標的變化趨勢,找到數(shù)據(jù)異常點(駐點、拐點等)所在位置,結(jié)合感官情況初步確定腐敗基準點。
1.6.2 基于高光譜信息的確定方法
為了進一步說明由感官及色差變化所確定的腐敗基準的合理性,應用光譜數(shù)據(jù)作進一步解釋。 即在選取特征波長的前提下,作出不同貯藏時間下樣本平均光譜反射值曲線,并對曲線最低點與色差數(shù)據(jù)進行對應分析,進一步確定了腐敗基準。
馬氏距離[14](Mahalanobis distance, MD)可被認為是計算兩個樣本之間相似度的一種距離度量,不僅消除了變量之間的相關(guān)性干擾還不受量綱的影響。 香蕉在貯藏過程中腐敗預警模型主要體現(xiàn)在確定腐敗基準的前提下,應用馬氏距離方法計算不同貯藏時間的樣本與腐敗基準之間的距離來表達。 若距基準的距離值越小則說明香蕉越接近腐敗。 馬氏距離計算公式如式(4)
(4)
實際上,在馬氏距離模型構(gòu)建過程中,最為核心的內(nèi)容是腐敗基準向量的構(gòu)造和與腐敗基準對應的協(xié)方差矩陣的確定。 一旦它們被確定,貯藏過程中某個貯藏日到腐敗基準的馬氏距離即可算出。
圖2給出了原始光譜和SG平滑處理后的光譜對比圖。 對比發(fā)現(xiàn),原始光譜曲線受噪聲干擾,存在許多毛刺,經(jīng)過SG處理過后的光譜曲線明顯平滑了許多,已有效的減少了光譜數(shù)據(jù)的噪聲干擾,為后面預警模型的構(gòu)建奠定了基礎。
圖2 香蕉光譜圖(a): 香蕉原始光譜圖; (b): SG平滑處理后香蕉光譜圖Fig.2 The spectra of banana(a): Original spectra; (b): Spectra after SG smoothing
由圖2(b)可知,在483.11~559.98 nm波段下,光譜光滑且變化趨勢明顯,包含了豐富的樣本信息,更能反映樣本信息的差異性。 而在560.49~880.49 nm波段下,光譜變化平緩且有較大波動,說明該波段反映的光譜信息類同,且存在較大的波動誤差,不利于后續(xù)數(shù)據(jù)分析。 為減少波動影響,僅將483.11~559.98 nm波段(151個波長)用作后續(xù)分析。
將經(jīng)過SG平滑處理后的483.11~559.98 nm波段光譜信息經(jīng)PCA處理,得到各個主成分數(shù)據(jù)后,運用式(3)計算各主成分變量下的Wilks Λ統(tǒng)計量值,選出Wilks Λ值最小的主成分變量為第3主成分(the 3rd PC),并繪出主成分3的權(quán)重系數(shù)圖,如圖3所示。
圖3 主成分3的權(quán)重系數(shù)圖Fig.3 The weight coefficients diagram of the 3rd PC
圖3給出了主成分3在每個波長(151個波長)下對應的權(quán)重系數(shù)值變化圖,而權(quán)重系數(shù)的絕對值越大則表明該波長擁有能表征類別間(與不同貯藏日期的光譜信息對應)差異性的信息越多,越有利于判別貯藏過程中香蕉的質(zhì)量變化情況。 將權(quán)重系數(shù)圖中的波峰、波谷所對應的波長提取出來即為該法提取出的特征波長。 共提取出494.90,499.00,507.71,514.88,522.06,530.77,538.46,550.76和558.95 nm,9個特征波長。
2.3.1 基于色差指標的腐敗基準確定
為直觀地反映在貯藏期間樣本的顏色變化,圖4給出樣本L*,a*,b*,ΔE值隨貯藏時間變化的折線圖。
圖4 香蕉色差參數(shù)變化曲線Fig.4 The variation curve of banana color difference parameters
由圖4(b)可知,在貯藏期間香蕉的a*呈上升趨勢,但在貯藏的第6天出現(xiàn)最大值,貯藏后期a*基本穩(wěn)定在8.5左右。 由圖4(a)和(c)可以看出在貯藏期間香蕉的L*和b*呈下降趨勢,且貯藏第1~5天是呈上切線下降趨勢,而在貯藏第6天及以后出現(xiàn)明顯的下切線下降趨勢,顏色變化出現(xiàn)了拐點。 由圖4(d)可以看出,ΔE在貯藏第1~5天是呈下切線趨勢上升,而在貯藏第6天及以后出現(xiàn)明顯的上切線上升趨勢,說明在貯藏的第6天香蕉表皮顏色變化發(fā)生了明顯的轉(zhuǎn)折。 所以,可初步確定貯藏第6天為腐敗基準點。
2.3.2 基于高光譜信息的腐敗基準確定
分析各個特征波長(9個波長)下不同貯藏時間樣本的平均光譜反射值曲線圖,以494.90和550.76 nm為例進行分析。 圖5(a)和(b)分別給出494.90和550.76 nm波長下不同貯藏時間樣本的平均光譜反射值曲線圖。
由圖5(a)和(b)可知,平均光譜反射值在貯藏前期呈整體下降趨勢,但在貯藏第二天有一個明顯的突降,是因為香蕉在入庫前并沒有進行挑選,且在搬運過程中有磕碰,存在著部分樣本損傷現(xiàn)象,導致光譜值存在波動。 而第三天上升是因為香蕉存在著后熟現(xiàn)象,在前兩天香蕉因沒有完全成熟,表皮顏色還可觀察到些許綠色,所以光譜值偏低,在貯藏第三天因為香蕉完全成熟,光譜值出現(xiàn)上升,在貯藏第三天以后,香蕉開始腐敗,光譜反射值開始依次下降。 但對比圖5(a)和(b)發(fā)現(xiàn),在不同波長下光譜反射值均在貯藏第6天達到最小值,與色差指標分析結(jié)果一致,這就進一步確定了腐敗基準點即為第6個貯藏日。
由2.3確定腐敗基準日為第6個貯藏日,共提取9個特征波長。 由于大樣本更能體現(xiàn)統(tǒng)計特征以及反映整體質(zhì)量屬性,且所表征的結(jié)果可靠性高。 所以,采用腐敗基準日50個樣本特征波長下光譜值的平均值作為腐敗基準的表征向量。 那么基于腐敗基準的特征光譜信息表征向量y和對應的協(xié)方差矩陣S可分別給出如下
圖5 494.90 nm (a)和550.76 nm (b)波長下香蕉的平均光譜反射值曲線Fig.5 Average spectral reflectance curves of banana at 494.90 nm (a) and 550.76 nm (b) wavelengths
分別計算不同貯藏日下50個樣本至腐敗基準的馬氏距離值,這些值可視為統(tǒng)計意義上的“期望值”。 為直觀的反映出隨貯藏時間的延長樣本的腐敗進程,圖6給出了這些期望值的變化曲線圖。
圖6 不同貯藏時間下50個樣本與的馬氏距離折線圖
由圖6可以看出,隨著貯藏時間的延長,樣本與腐敗基準的距離越來越接近,說明香蕉也越接近腐敗。 而第2個貯藏日至基準的馬氏距離有點降低,正是上面所指出的該日樣本有損傷的體現(xiàn),這反而更能充分地說明MD模型計算結(jié)果的精準性。 所以,應用光譜信息構(gòu)建馬氏距離腐敗預警模型對香蕉貯藏期間的腐敗進行預警是可行的。
考慮到實際應用中一般僅測試3~5個平行樣本來表征結(jié)果,所以,從每天采集的50個樣本中隨機選取5個平行樣本,計算不同貯藏時間下5個平行樣本至腐敗基準的馬氏距離值。 圖7(a)和(b)分別給出兩次隨機選取的計算結(jié)果。
圖7 不同貯藏時間5個平行樣本的馬氏距離折線圖Fig.7 The Mahalanobis distance curve of 5 parallelsamples with different storage time
由圖7可知,兩次隨機選取的不同貯藏時間5個平行樣本至腐敗基準的距離變化趨勢與“期望值”結(jié)果相一致,這充分說明了基準的確定以及對應給出的表征向量和協(xié)方差矩陣是合理的與可靠的。 上述結(jié)果有力地揭示了應用馬氏距離對香蕉貯藏過程進行腐敗預警是可行的,也是有效的。
通過對不同貯藏時間香蕉樣本高光譜數(shù)據(jù)的采集,采用SG平滑處理,經(jīng)基于Wilk Λ統(tǒng)計量的權(quán)重系數(shù)法提取出了9個特征波長。 根據(jù)色差變化和高光譜平均光譜值變化確定了腐敗基準,構(gòu)建了基于特征光譜信息的樣本與腐敗基準的馬氏距離預警模型。 結(jié)果表明,提出的基于Wilk Λ統(tǒng)計量的權(quán)重系數(shù)高光譜特征波長提取方法提高了特征波長提取的魯棒性,有效除去了冗余信息,簡化了運算。 通過分析香蕉樣本的色差指標隨貯藏時間的變化趨勢,初步確定了腐敗基準為第6個貯藏日; 通過分析了特征光譜數(shù)據(jù)下不同貯藏時間樣本平均光譜反射值曲線,發(fā)現(xiàn)曲線在貯藏第6天存在最低點,進一步證明了腐敗基準選取的正確性。 同時,運用馬氏距離構(gòu)建的香蕉腐敗預警判別模型能夠較好的反映貯藏期間香蕉接近腐敗的程度。 因此,給出的腐敗基準確定方法及用馬氏距離構(gòu)建的香蕉腐敗預警模型對于香蕉貯藏過程中的腐敗預警是有效的,為其他樣品的腐敗預警方法研究提供了參考。