孔 娜 楊 雪 王禹程 黃姍芬 李云亮 馬海樂
(江蘇大學(xué)食品與生物工程學(xué)院 江蘇鎮(zhèn)江 212013)
目前常用的檢測(cè)多糖的方法為苯酚硫酸法和蒽酮硫酸法[6]。多糖的傳統(tǒng)檢測(cè)方法由于人為原因出現(xiàn)誤差,整個(gè)檢測(cè)過程繁瑣,還會(huì)導(dǎo)致實(shí)際測(cè)量的化學(xué)值與生產(chǎn)過程之間存在延遲或者誤差,不能實(shí)現(xiàn)提取過程中多糖含量變化的原位監(jiān)測(cè)。對(duì)提取過程中重要參數(shù)建立快速、穩(wěn)定和可靠的在線監(jiān)測(cè)方法的研究顯得極為重要。
近紅外光譜因快速、無損、便攜等優(yōu)點(diǎn)廣泛而被應(yīng)用于目標(biāo)物質(zhì)的監(jiān)測(cè)。Mizushima等[7]對(duì)聚乙烯拉伸變形過程中的結(jié)構(gòu)變化進(jìn)行原位近紅外光譜監(jiān)測(cè);Wold等[8]也利用近紅外成像光譜儀在線確定完整牛肉配件的脂肪含量;Sampaio等[9]利用原位近紅外光譜監(jiān)測(cè)重組釀酒酵母菌株生產(chǎn)的番茄紅素的含量;Prieto等[10-11]也將近紅外光譜應(yīng)用于在線的工業(yè)加工,包括對(duì)輸送機(jī)上小牛肉樣本中的脂肪、水分和蛋白質(zhì)含量的在線監(jiān)測(cè),同時(shí)也應(yīng)用于運(yùn)送牛肉和豬肉樣品在輸送帶或絞肉機(jī)出口上化學(xué)成分的監(jiān)測(cè)。上述研究結(jié)果表明,近紅外光譜技術(shù)可用于監(jiān)測(cè)和分析食品在移動(dòng)的傳送帶上或連續(xù)過程的監(jiān)測(cè)[12]。近年來由于微小型光纖的發(fā)展,微小型便攜式近紅外光譜儀可將光纖探頭伸入溶液中采集光譜,可實(shí)現(xiàn)原位在線預(yù)測(cè)目標(biāo)物質(zhì)的含量。微小型便攜式近紅外光譜儀因具有速度快、成本低、無污染、預(yù)測(cè)結(jié)果準(zhǔn)確等優(yōu)點(diǎn)[13-14],為實(shí)現(xiàn)食品加工過程的自動(dòng)化控制奠定了基礎(chǔ)[15-16]。
本文主要利用超聲輔助提取瑪咖多糖并應(yīng)用便攜式近紅外光譜儀實(shí)時(shí)檢測(cè)提取過程中的光譜信息,建立光譜信息與多糖含量之間的數(shù)學(xué)模型,實(shí)現(xiàn)提取過程中對(duì)多糖含量的預(yù)測(cè),為提取過程終點(diǎn)的判斷提供技術(shù)支持。
瑪咖,青海神農(nóng)生物科技有限公司(多糖含量67.3%);其余試劑為分析純級(jí)。
雙頻逆流聚能式超聲設(shè)備,江蘇大學(xué)自主研制;DL-5C離心機(jī),上海安亭科學(xué)儀器廠;T-6新世紀(jì)可見分光光度計(jì),北京普析儀器有限公司;NIRQUEST256-2.5近紅外光譜儀、TP300浸入式光纖探頭、DH-2000-BAL UV-VIS-NIR光源,美國海洋光學(xué)。
用蒸餾水將原料(過60目篩)分別配制為不同料液比(1∶10,1∶20,1∶30,1∶40,1∶50 g/mL)的瑪咖懸浮液1 000 mL,設(shè)定超聲參數(shù):20~35 kHz交替雙頻,超聲功率150 W/L,超聲溫度50℃,間歇時(shí)間比4s/3s,超聲時(shí)間 60 min,前 30 min每隔 2 min取樣1次,后30 min每隔3 min取樣1次,共計(jì)130個(gè)樣品。將所有樣品離心(10 000 r/min離心10 min),收集上清液,放置于-20℃保存待測(cè)化學(xué)值。取樣同時(shí)采集光譜信息,光譜的范圍為900~2 500 nm,分辨率為6.4 nm,掃描8次,光程4 mm,以蒸餾水(50℃)作為背景,每次連續(xù)采集3次光譜信息,取其平均值作為原始光譜數(shù)據(jù)。
多糖的含量采用苯酚硫酸法測(cè)定[17-19],以干燥的葡萄糖標(biāo)準(zhǔn)品作為基準(zhǔn)物質(zhì)制作標(biāo)準(zhǔn)曲線,以蒸餾水代替多糖溶液做空白,提取的多糖含量按式(1)計(jì)算:
式中,T——提取出的瑪咖多糖含量(%);C——待測(cè)液中多糖質(zhì)量濃度(mg/mL);N——稀釋倍數(shù);V——樣液體積(mL);f——換算因素;m——樣品質(zhì)量(g)。
常用的原材料有:石灰石、白堊、黏土、頁巖、鐵礦石等。因礦石成分的不確定性,導(dǎo)致水泥中礦物組成變動(dòng)性大,使水泥與外加劑不相容。
采用偏最小二乘法(Partial least squares,PLS)、區(qū)間偏最小二乘法(Interval partial least squares,ipLS)和聯(lián)合區(qū)間偏最小二乘法(Synergy interval PLS,si-PLS)對(duì)光譜區(qū)間篩選,將篩選出的特征信息與同步測(cè)定的多糖含量化學(xué)值聯(lián)立并建模。
不同料液比提取多糖含量的理化指標(biāo)如圖1所示,隨著超聲提取時(shí)間的延長(zhǎng),多糖含量不斷增加。在提取前15 min,多糖含量增加快速,隨后增加緩慢并出現(xiàn)波動(dòng)增長(zhǎng)的趨勢(shì)。說明隨著時(shí)間的延長(zhǎng),瑪咖細(xì)胞的破碎度逐漸增大,多糖溶出率增加,提取率較高,然而時(shí)間過長(zhǎng),會(huì)使多糖重聚而沉淀,或由于超聲的強(qiáng)剪切力作用使大分子多糖斷裂,從而出現(xiàn)多糖含量呈波動(dòng)的變化趨勢(shì)[20]。同時(shí)監(jiān)測(cè)提取過程中不同料液比的多糖含量,可以更全面、更準(zhǔn)確的分析數(shù)據(jù)及建立模型。
圖1 瑪咖多糖在超聲輔助提取過程中含量的變化Fig.1 The content of maca polysaccharide in ultrasonic assisted extraction
通過 Centre、MSC、SG、SNV、1 st、2 st及 Centre、MSC、SG、SNV 分別與 1 st組合預(yù)處理原始光譜圖,所有的預(yù)處理方法都能很好的消除外界條件的干擾及光譜圖的冗余信息,提取及增強(qiáng)特征信息,提高預(yù)測(cè)模型的預(yù)測(cè)能力及穩(wěn)健性。不同方法預(yù)處理后的光譜圖如圖2所示。
圖2 不同預(yù)處理方法處理瑪咖水溶液近紅外光譜圖Fig.2 Near infrared spectra of maca aqueous solution by different pretreatment methods
將近紅外采集的樣本光譜經(jīng)過不同的預(yù)處理后,用PLS建立模型,同時(shí)用校正模型來預(yù)測(cè)預(yù)測(cè)集中的瑪咖水溶液中多糖含量,其中以Rc、RMSECV和Rp、RMSEP為評(píng)價(jià)指標(biāo),篩選最優(yōu)預(yù)處理方法。由表1可知,不同的預(yù)處理方法所得到的建模效果有所差距,其中SG是最有效地預(yù)處理方法,Rc和Rp最高且接近 1,RMSECV和RMSEP在所有的預(yù)處理中數(shù)值最小,所以在后續(xù)將使用平滑處理的光譜用于建模。
表1 不同方法預(yù)處理近紅外光譜的結(jié)果Table1 Results of near-infrared spectroscopy by different pretreatment methods
PLS法是基于全光譜區(qū)間(900~2 500 nm)的1 600個(gè)波長(zhǎng)變量上建立的監(jiān)測(cè)模型,所建立的模型如圖3所示。根據(jù)評(píng)價(jià)標(biāo)準(zhǔn),選取Rc和Rp相關(guān)系數(shù)最高和RMSECV、RMSEP最低的建模子區(qū)間,建立最佳的PLS模型。對(duì)于多糖檢測(cè)模型中,Rc的值為0.9453,RMSECV 值為0.0138,Rp的值為0.9638,RMSEP為0.0144,顯示PLS模型預(yù)測(cè)具有良好的預(yù)測(cè)效果。
偏最小二乘法是將整個(gè)光譜區(qū)間分為20個(gè)子區(qū)間,再對(duì)每個(gè)子區(qū)間建立模型,根據(jù)評(píng)價(jià)標(biāo)準(zhǔn),選取Rc和Rp相關(guān)系數(shù)最高和RMSECV、RMSEP最低的建模子區(qū)間,建立最佳的模型。由圖4和5可知,對(duì)于多糖檢測(cè)模型中,依據(jù)Rc最高為0.9163和RMSECV最低為0.017,在整個(gè)光譜區(qū)間的第19個(gè)子區(qū)間上所建的模型最佳,該區(qū)間所對(duì)應(yīng)的光譜區(qū)間為2356.166~2425.508 nm,此區(qū)間所建立的模型的Rp為0.9375,RMSEP為0.0178,此模型對(duì)多糖含量的預(yù)測(cè)效果也較好,而PLS法建立的模型比iPLS法可以更好的預(yù)測(cè)多糖含量。
圖3 PLS建立瑪咖多糖模型的校正集和預(yù)測(cè)集Fig.3 PLS established correction set and prediction set for the maca polysaccharide model
圖4 iPLS建立瑪咖多糖模型最佳子區(qū)間Fig.4 iPLS established the best subinterval of maca polysaccharide model
圖5 iLPS建立瑪咖多糖模型的校正集和預(yù)測(cè)集Fig.5 iLPS established calibration set and prediction set for the maca polysaccharide model
對(duì)于聯(lián)合區(qū)間偏最小二乘法,在被劃分的第26子區(qū)間并聯(lián)合其中4個(gè)子區(qū)間時(shí)(第7,19,21,24個(gè),所對(duì)應(yīng)的光譜區(qū)間分別為1 258.591~1 316.735 nm,2 027.121~2 084.226 nm,2 153.93~2 210.888nm和2 337.239~2 387.696 nm)所建的模型最佳,如圖6和7,Rc和RMSECV分別為0.9621和0.0116,Rp和RMSEP分別為0.9667和0.0137。此法與PLS法相比,Rp與Rc值均更高,且RMSECV和RMSEP相對(duì)來說更低,因此si-PLS法在3種方法中可更好地預(yù)測(cè)多糖含量。
圖6 si-PLS聯(lián)合最佳區(qū)間建立瑪咖多糖模型Fig.6 Establishment of maca polysaccharide model by si-PLS combined with optimal interval
圖7 si-LPS聯(lián)合最佳區(qū)間建立模型的校正集和預(yù)測(cè)集Fig.7 Correction set and prediction set of si-LPS joint optimal interval model
為確定定量模型,提高模型的建模效果及預(yù)測(cè)性能,采用3種方法(最小二乘法、偏最小二乘法、聯(lián)合區(qū)間偏最小二乘法)建立模型,以優(yōu)化瑪咖多糖定量預(yù)測(cè)模型。如表2所示。
表2 不同方法建立多糖含量模型的結(jié)果Table2 Results of different methods to establish polysaccharide content model
從表2可以明顯看出,利用近紅外實(shí)時(shí)采集光譜,并通過化學(xué)計(jì)量學(xué)計(jì)算,3種監(jiān)測(cè)方法均體現(xiàn)出較好的預(yù)測(cè)性能,可實(shí)現(xiàn)提取過程中多糖含量的快速檢測(cè);另外,比較3種方法可得,iPLS(Rc為0.9163和Rp為0.9375)穩(wěn)定性較好,其次PLS(Rc為0.9453和Rp為0.9638)穩(wěn)定性更好,si-PLS(Rc為0.9621和Rp為0.9667)模型所得校正精度與預(yù)測(cè)精度最高。3種模型的預(yù)測(cè)性能出現(xiàn)不同程度地變化,其原因如下:
PLS相比較其它2個(gè)建模方法,由于是將整個(gè)區(qū)間的1 600個(gè)變量用于建模,就會(huì)存在很多不相關(guān)的參數(shù)和冗余的波長(zhǎng)變量,使得PLS的建模效果減弱,預(yù)測(cè)性能降低。全光譜建模的校正集和預(yù)測(cè)集中的相關(guān)系數(shù)處于中間,也說明全光譜圖用于建模不會(huì)丟失任何數(shù)據(jù),只是增加了模型的復(fù)雜性,降低了模型的穩(wěn)定性。另外,從校正集的相關(guān)系數(shù)可看出,多糖的全光譜PLS模型存在一定的擬合過度現(xiàn)象,應(yīng)該是由于參與建模的主因子數(shù)過多引起的。因此,篩選特征光譜區(qū)間對(duì)于建模就顯得很重要。
在3個(gè)模型中,iPLS模型的預(yù)測(cè)性低于PLS和si-PLS法。最主要是由于iPLS在建模時(shí)只用了一個(gè)子區(qū)間上的數(shù)據(jù),刪除數(shù)據(jù)量過大,其中很多特征數(shù)據(jù)也并未得到利用,且第19個(gè)區(qū)間上的數(shù)據(jù)也不一定是有用數(shù)據(jù),最終導(dǎo)致校正集模型和預(yù)測(cè)集模型的性能都很差。近紅外采集的提取過程中光譜信息所反應(yīng)的參數(shù),主要來自瑪咖溶液中不同基團(tuán)伸縮振動(dòng)的倍頻和合頻的吸收,任何一個(gè)單獨(dú)的區(qū)間都不能完全反應(yīng)光譜信息。
Si-PLS模型的預(yù)測(cè)性能要優(yōu)于PLS模型和iPLS模型。該方法相比較其它兩種方法的優(yōu)點(diǎn)是,既可剔除很多無用光譜信息,也盡可能多地提取并利用有用信息,聯(lián)合4個(gè)相關(guān)的子區(qū)間,建立最佳的預(yù)測(cè)模型。同瑪咖多糖相關(guān)的變量信息,可能是不連續(xù)的且分散在整個(gè)光譜區(qū)間上,會(huì)存在一些子區(qū)間共線性的變量。本試驗(yàn)將不連續(xù)且分散在整個(gè)光譜區(qū)間上的4個(gè)子區(qū)間聯(lián)合并建立模型,具有更好的預(yù)測(cè)效果。
1)為擴(kuò)展樣本的數(shù)據(jù)范圍,將 1∶10,1∶20,1∶30,1∶40,1∶50 g/mL 不同料液比的瑪咖懸浮液作為在線監(jiān)測(cè)樣本。近紅外對(duì)瑪咖溶液提取過程進(jìn)行原位實(shí)時(shí)光譜的采集,并同時(shí)收集樣品,采用苯酚硫酸法離線檢測(cè)其提取過程中的多糖含量。
2)對(duì)瑪咖溶液提取過程中的原位光譜進(jìn)行中心化、中心化與一階導(dǎo)數(shù)、多元散射校正、多元散射校正與一階導(dǎo)數(shù)、平滑、平滑與一階導(dǎo)數(shù)、標(biāo)準(zhǔn)正態(tài)變量變換、標(biāo)準(zhǔn)正態(tài)變量變換與一階導(dǎo)數(shù)、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)不同方法的預(yù)處理,其中平滑預(yù)處理后,PLS建模效果最佳。
3)以相關(guān)系數(shù)和相對(duì)誤差為評(píng)價(jià)指標(biāo),采用最優(yōu)光譜波長(zhǎng)區(qū)間建立瑪咖多糖的Si-PLS模型。其 Rc、Rp和RMSECV、RMSEP 分別為0.9621,0.9667和0.0116,0.0137。 另外 Si-PLS與PLS和iPLS建模方法相比,可以在很大程度上減少建模時(shí)所需要的波點(diǎn)數(shù),提取并結(jié)合子區(qū)間,利用了原料溶液中的特征信息,能夠很有效的提高模型的預(yù)測(cè)能力,增加模型的穩(wěn)定性,可以實(shí)現(xiàn)提取過程參數(shù)的在線監(jiān)測(cè)。