余梅,李嘉儀,范偉,鄭郁,李跑,3*,蔣立文,劉霞
(1.湖南農(nóng)業(yè)大學(xué) 食品科學(xué)技術(shù)學(xué)院 食品科學(xué)與生物技術(shù)湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410128;2.湖南師范大學(xué) 醫(yī)學(xué)院,湖南 長(zhǎng)沙 410013;3.湖南省農(nóng)業(yè)科學(xué)院 湖南省農(nóng)產(chǎn)品加工研究所,湖南 長(zhǎng)沙 410125)
陳皮是由成熟柑橘皮經(jīng)長(zhǎng)時(shí)間干制存儲(chǔ)而成的一種食藥同源產(chǎn)品,主要包括揮發(fā)油、黃酮類(lèi)等功效成分,具有理氣健脾、燥濕化痰的功能。陳化年份不同,陳皮在藥理作用和化學(xué)成分的積累上均有差別,市場(chǎng)價(jià)格同樣具有較大的差別,因此市場(chǎng)中出現(xiàn)以低年份陳皮冒充高年份陳皮進(jìn)行售賣(mài)的現(xiàn)象[1]。目前對(duì)于陳皮年份的鑒別多采用感官評(píng)價(jià)法、高效液相色譜法(high performance liquid chromatography,HPLC)[2]、液相色譜-質(zhì)譜聯(lián)用(liquid chromatography-mass spectrometry,LC-MS)[3]及氣相色譜-質(zhì)譜聯(lián)用(gas chromatography-mass spectrometry,GC-MS)[4]等。感官評(píng)價(jià)法是對(duì)陳皮外部特征(顏色、氣味)等差異實(shí)現(xiàn)鑒別分析,具有操作簡(jiǎn)單、快速等優(yōu)點(diǎn),但鑒別的準(zhǔn)確度易受主觀條件及客觀環(huán)境因素的干擾。理化檢測(cè)法主要通過(guò)對(duì)陳皮中的成分組成和含量進(jìn)行測(cè)定以實(shí)現(xiàn)不同年份陳皮鑒別分析,準(zhǔn)確度高,但需要破壞樣品,且樣品前處理繁瑣,檢測(cè)時(shí)間長(zhǎng)、檢測(cè)成本高。因此,亟需開(kāi)發(fā)一種快速、無(wú)損、綠色的不同年份陳皮的無(wú)損鑒別方法。
近紅外光譜主要包含氫基團(tuán)化學(xué)健伸縮振動(dòng)倍頻及合頻信息,作為近年來(lái)快速發(fā)展起來(lái)的一種新型綠色無(wú)損檢測(cè)手段,近紅外光譜技術(shù)具有重現(xiàn)性好、檢測(cè)成本低、操作簡(jiǎn)單等特點(diǎn)[5-6]??芍苯訉?shí)現(xiàn)對(duì)未知樣品組分的定性定量分析[7-9],在農(nóng)業(yè)、食品、石油化工等領(lǐng)域皆有應(yīng)用[10-12]。在陳皮無(wú)損鑒別研究方面,郭念欣等[13]通過(guò)傅立葉近紅外光譜儀采集了不同產(chǎn)地陳皮光譜,結(jié)合主成分分析法實(shí)現(xiàn)了對(duì)陳皮產(chǎn)地的鑒別分析。周欣等[14]利用傅立葉變換紅外光譜法對(duì)7個(gè)產(chǎn)地陳皮中的揮發(fā)油進(jìn)行了分析,實(shí)現(xiàn)了新會(huì)陳皮和廣西陳皮的鑒別分析。但由于傅立葉近紅外光譜儀器存在價(jià)格較高、體積較大的問(wèn)題,而光柵型便攜式近紅外光譜儀因具備輕便、成本低、易攜帶、功耗低等優(yōu)點(diǎn)得到了廣泛研究[15-17]。胡甜等[18]采用Micro NIR1700微型近紅外光譜儀實(shí)現(xiàn)了霍山石斛的快速鑒別研究。李曉云等[19]通過(guò)便攜式近紅外漫反射結(jié)合偏最小二乘回歸法建立了牛奶脂肪、蛋白質(zhì)和干物質(zhì)的定量分析模型。然而現(xiàn)階段尚缺乏利用便攜式近紅外光譜儀用于陳皮的研究。其次,便攜式近紅外光譜中常存在較為嚴(yán)重的背景、基線漂移以及噪聲干擾,隨著對(duì)近紅外光譜的深入研究,發(fā)現(xiàn)結(jié)合預(yù)處理方法可以扣除光譜中存在的干擾情況,常見(jiàn)的預(yù)處理方法包括:去偏置(De-bias)[20]、去趨勢(shì)(de-trend,DT)[21]、標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variable,SNV)[22]、多元散射校正(multivariate scattering correction,MSC)[22]、最大最小歸一化(maximum-minimum normalization,Min-Max)[23]、一階導(dǎo)數(shù)(first derivative,1st)[24]、二階導(dǎo)數(shù)(second derivative,2nd)[24]和連續(xù)小波變換(continuous wavelet transform,CWT)[25],然而不同光譜預(yù)處理方法消除的干擾情況有所不同,DT和De-bias常被用于消除光譜中存在的基線漂移干擾,SNV和MSC被用于消除由樣品顆粒分布不均勻及顆粒大小不同對(duì)光譜所造成的散射干擾,Min-Max用于消除光譜的絕對(duì)吸收值及多余信息,1st、2nd和CWT等求導(dǎo)算法常用于消除由儀器原因?qū)庾V造成的背景或基線漂移等干擾,在實(shí)際分析中,由于儀器或者樣品的原因,光譜中往往存在多種干擾情況,僅用單一預(yù)處理方法無(wú)法實(shí)現(xiàn)對(duì)光譜的優(yōu)化,常需結(jié)合和預(yù)處理組合方式以消除光譜中存在的多種干擾。因此本研究以5年、10年、15年、20年和25年新會(huì)陳皮為研究對(duì)象,通過(guò)光柵型便攜式近紅外光譜儀采集不同年份陳皮內(nèi)囊和外壁光譜信息,采用化學(xué)計(jì)量學(xué)方法對(duì)不同年份陳皮光譜進(jìn)行優(yōu)化,最后基于無(wú)監(jiān)督模式識(shí)別的主成分分析(principal component analysis,PCA)以及有監(jiān)督模式識(shí)別的獨(dú)立軟模型 (soft independent modeling of class analogy,SIMCA)和Fisher線性判別分析(fisher linear discriminant analysis,F(xiàn)LD)方法以建立不同年份陳皮的準(zhǔn)確鑒別模型。
樣品:江門(mén)市新會(huì)區(qū)嶺南臻寶陳皮茶葉有限公司成品包裝陳皮,分別為陳化年份5年、10年、15年、20年和25年新會(huì)陳皮,每個(gè)年份樣品分別制備30份,共計(jì)150份樣品。不同年份陳皮見(jiàn)圖1。不同年份的陳皮在外觀上具有較大相似性,僅憑肉眼較難區(qū)分各年份陳皮。
圖1 不同年份陳皮Fig.1 Different-age Citri Reticulatae Pericarpium
i-Spec Plus光柵型便攜式近紅外光譜儀:必達(dá)泰克光電科技(上海)有限公司,用于采集不同年份陳皮漫反射光譜信息。
采集不同年份陳皮內(nèi)囊和外壁的漫反射光譜信息,采集范圍11 190 cm-1~5 800 cm-1,為了減小由試驗(yàn)操作帶來(lái)的誤差,每一樣品重復(fù)3次,取平均值作為該樣品的原始光譜。
1.4.1 光譜數(shù)據(jù)分組
光譜數(shù)據(jù)分析在MATLAB R2010b(The Mathworks,Natick,USA)軟件中實(shí)現(xiàn),光譜數(shù)據(jù)按照 Kennard-Stone方法以樣本個(gè)數(shù)比7∶3的比例分為105個(gè)校正集和45個(gè)預(yù)測(cè)集。
1.4.2 光譜預(yù)處理
為減小陳皮表皮厚度的不一致性和表面特征不均勻等因素的影響,需要采用預(yù)處理方法優(yōu)化光譜,試驗(yàn)采用De-bias等8個(gè)單一預(yù)處理和1st-DT、1st-SNV、1st-MSC、CWT-SNV和CWT-MSC等組合預(yù)處理方法優(yōu)化光譜。
1.4.3 模式識(shí)別方法
為了實(shí)現(xiàn)不同年份陳皮無(wú)損鑒別分析,結(jié)合PCA、SIMCA和FLD方法分別建立不同年份陳皮鑒別模型。PCA是一種常見(jiàn)的無(wú)監(jiān)督的模式識(shí)別方法。該方法不需要先驗(yàn)知識(shí),鑒別能力較弱;SIMCA和FLD是兩類(lèi)常見(jiàn)的有監(jiān)督模式識(shí)別方法,其原理有所不同,前者是在對(duì)每類(lèi)樣品建立獨(dú)立的PCA模型的前提下對(duì)未知樣品進(jìn)行分類(lèi);而后者是在類(lèi)內(nèi)差異小且類(lèi)間差異大的前提下將數(shù)據(jù)在低維度上進(jìn)行投影,以實(shí)現(xiàn)不同樣品的分類(lèi)。此外,F(xiàn)LD方法要求樣本數(shù)為變量數(shù)的3倍~5倍,常采用PCA方法對(duì)數(shù)據(jù)進(jìn)行降維處理,利用得到的主成分建立FLD模型。
圖2為不同年份陳皮內(nèi)囊和外壁的原始光譜圖。
圖2 陳皮內(nèi)囊及外壁原始光譜圖Fig.2 Original spectra of the inner capsule and outer skin of Citri Reticulatae Pericarpium
由圖2可知,內(nèi)囊和外壁光譜在11 190 cm-1~10 500 cm-1、6 000 cm-1~5 800 cm-1范圍均出現(xiàn)了明顯的噪聲干擾;雖然譜線大致走向趨勢(shì)一致,但光譜中出現(xiàn)了較為嚴(yán)重的基線漂移及譜峰重疊等干擾;光譜同時(shí)存在吸收峰強(qiáng)度弱、特征峰位不突出等問(wèn)題,僅有兩個(gè)較為明顯的峰,在8 300 cm-1~8 000 cm-1附近處出現(xiàn)的吸收峰可能與C-H鍵伸縮振動(dòng)的二倍頻吸收帶有關(guān)。在7 000 cm-1光譜中出現(xiàn)了較為明顯的吸收峰,可能是由于O-H鍵伸縮振動(dòng)的二倍頻吸收帶有關(guān)。內(nèi)囊及外壁的光譜差異較小,且僅根據(jù)原始光譜無(wú)法鑒別不同年份的陳皮,可能是由于陳皮在成分含量及組分組成上具有一定的相似性。
為了實(shí)現(xiàn)對(duì)不同年份陳皮的鑒別分析,采用預(yù)處理方法優(yōu)化光譜數(shù)據(jù)后結(jié)合PCA方法建立鑒別模型見(jiàn)圖3。
圖3 不同年份陳皮PCA結(jié)果Fig.3 PCA results of different-age Citri Reticulatae Pericarpium
圖 3(a)、圖 3(b)為不同年份陳皮內(nèi)囊和外壁原始光譜數(shù)據(jù)的PCA結(jié)果,采用第一主成分(PC1)與第二主成分(PC2)進(jìn)行PCA分析,不同年份陳皮的置信橢圓都存在不同程度的重疊,僅根據(jù)原始光譜的PCA無(wú)法實(shí)現(xiàn)不同陳化陳皮的鑒別。為了提高鑒別結(jié)果,采用單一及組合預(yù)處理方法對(duì)光譜進(jìn)行優(yōu)化。圖3(c)為內(nèi)囊數(shù)據(jù)結(jié)合最佳預(yù)處理(CWT)得到PCA結(jié)果,鑒別率為44%,圖3(d)為外壁數(shù)據(jù)結(jié)合最佳預(yù)處理(DT)得到的PCA結(jié)果,其鑒別率為35%。和原始光譜的PCA結(jié)果相比,采用預(yù)處理后的鑒別率略有提高,表明預(yù)處理方法可以有效消除光譜中的干擾。然而,采用PCA方法仍然無(wú)法實(shí)現(xiàn)對(duì)不同年份陳皮的準(zhǔn)確鑒別分析。
為了實(shí)現(xiàn)不同年份陳皮鑒別分析,采用SIMCA模式識(shí)別法結(jié)合預(yù)處理方法建立不同年份陳皮的鑒別模型。SIMCA方法得到的鑒別率見(jiàn)表1。
表1 通過(guò)SIMCA和不同的預(yù)處理方法獲得的鑒別率Table 1 Identification accuracies obtained by SIMCA and different pretreatment methods
對(duì)于內(nèi)囊數(shù)據(jù),采用原始光譜數(shù)據(jù)結(jié)合SIMCA模式識(shí)別法可實(shí)現(xiàn)不同年份陳皮94%的鑒別分析;采用單一預(yù)處理后光譜得到了優(yōu)化,采用De-bias、DT、Min-Max和1st預(yù)處理方法在一定程度上提高了鑒別結(jié)果,鑒別率為96%。采用組合預(yù)處理方法對(duì)光譜進(jìn)行優(yōu)化后,僅有CWT-SNV預(yù)處理后的結(jié)果達(dá)到了94%,其余4種組合預(yù)處理方法得到的鑒別率反而有所降低,可能是多種預(yù)處理把差異信息也進(jìn)行了消除。對(duì)于外壁數(shù)據(jù)的分析,采用原始光譜結(jié)合SIMCA模式識(shí)別法的鑒別率為88%,采用SNV預(yù)處理后鑒別準(zhǔn)確率提高至94%。采用組合預(yù)處理方法對(duì)光譜優(yōu)化后,鑒別率有所降低,以1st-SNV和1st-MSC預(yù)處理后得到的結(jié)果為較佳,鑒別率為84%。以上結(jié)果表明,采用SIMCA結(jié)合預(yù)處理方法基本可以實(shí)現(xiàn)對(duì)不同年份陳皮的鑒別分析;與原始光譜和單一預(yù)處理結(jié)果相比,運(yùn)用組合預(yù)處理方法可能會(huì)消除光譜中的有用信息,從而降低了鑒別率。
采用SIMCA模式識(shí)別依然無(wú)法實(shí)現(xiàn)不同年份陳皮的100%鑒別。為進(jìn)一步提高鑒別準(zhǔn)確率,通過(guò)FLD模式識(shí)別法結(jié)合不同預(yù)處理方法用于不同年份陳皮的鑒別分析。FLD模式識(shí)別法結(jié)合不同預(yù)處理方法的鑒別率見(jiàn)表2。
表2 通過(guò)FLD和不同的預(yù)處理方法獲得的鑒別率Table 2 Identification accuracies obtained by FLD and different pretreatment methods
與PCA和SIMCA模式識(shí)別法的結(jié)果相比,采用FLD方法后,內(nèi)囊原始數(shù)據(jù)的鑒別率上升到了96%;采用SNV預(yù)處理方法后可以實(shí)現(xiàn)100%的鑒別分析;結(jié)合組合預(yù)處理方法優(yōu)化內(nèi)囊數(shù)據(jù)后,其鑒別率反而有所下降,以1st-SNV和1st-MSC預(yù)處理后98%鑒別率為較佳。對(duì)于外壁數(shù)據(jù),采用FLD方法結(jié)合原始光譜便可實(shí)現(xiàn)不同年份陳皮96%的鑒別;光譜采用Min-Max、1st和CWT等單一預(yù)處理優(yōu)化后鑒別率提高至98%;在組合預(yù)處理方法的結(jié)果中,以1st-DT和CWT-MSC的結(jié)果較佳,鑒別率為98%。
為了更直觀地反映鑒別的效果,根據(jù)FLD前3個(gè)得分繪制三維圖見(jiàn)圖4。
圖4 利用SNV預(yù)處理內(nèi)囊數(shù)據(jù)和Min-Max處理外壁數(shù)據(jù)得到的FLD得分圖Fig.4 FLD scores of inner capsule data with SNV and outer skin data with Min-Max
圖4(a)和圖4(b)分別為采用SNV預(yù)處理內(nèi)囊數(shù)據(jù)得到的FLD結(jié)果和Min-Max預(yù)處理外壁數(shù)據(jù)的FLD結(jié)果,可以看到不同年份陳皮得到了較好的鑒別。結(jié)果表明,采用FLD方法可有效實(shí)現(xiàn)對(duì)不同年份陳皮的鑒別分析。其可能原因是FLD方法利用了先驗(yàn)知識(shí),在保證類(lèi)內(nèi)差異越小且類(lèi)間差異越大前提下,將數(shù)據(jù)在低維度上進(jìn)行投影以實(shí)現(xiàn)最佳的鑒別分析;而PCA方法是一種無(wú)監(jiān)督的分類(lèi)方法,沒(méi)有利用先驗(yàn)知識(shí),單純利用方差信息進(jìn)行分類(lèi),鑒別能力較差;SIMCA方法是通過(guò)對(duì)每一類(lèi)數(shù)據(jù)分別建立PCA模型,
再利用這些模型對(duì)未知數(shù)據(jù)進(jìn)行分類(lèi),依舊存在鑒別能力不夠強(qiáng)的問(wèn)題,對(duì)于類(lèi)間差異很小的樣本分析往往得不到滿意的結(jié)果。
基于光柵型便攜式近紅外光譜儀結(jié)合光譜預(yù)處理方法以及PCA、SIMCA和FLD等不同模式識(shí)別方法建立對(duì)不同年份陳皮的鑒別模型。由于儀器的限制,光譜中存在較為明顯的背景、基線漂移以及噪聲干擾,預(yù)處理方法可以有效消除光譜中存在的多種干擾。與主成分分析方法和軟獨(dú)立模式分類(lèi)法結(jié)果相比,F(xiàn)LD方法結(jié)果最優(yōu),Min-Max、1st和CWT等單一預(yù)處理或1st-DT、CWT-MSC等組合預(yù)處理方法結(jié)合外壁數(shù)據(jù)得到的鑒別率為98%,而采用內(nèi)囊數(shù)據(jù)結(jié)合原始光譜便實(shí)現(xiàn)了不同年份陳皮100%鑒別分析。采用光柵型便攜式近紅外光譜儀結(jié)合合適的化學(xué)計(jì)量學(xué)方法能有效實(shí)現(xiàn)對(duì)不同年份的鑒別分析。