唐保山, 劉義穩(wěn), 和 銳, 鄒 勇, 謝山宇, 張 弘*
(1.中國林業(yè)科學研究院 高原林業(yè)研究所;國家林業(yè)和草原局資源昆蟲培育與利用重點實驗室,云南 昆明 650233; 2.五峰赤誠生物科技股份有限公司,湖北 宜昌 443413;3.五峰土家族自治縣公共檢驗檢測中心,湖北 宜昌 443413)
五倍子,享有中國五倍子的聲譽,是癭綿蚜科蚜蟲寄生在鹽膚木、青麩楊等寄主植物的樹葉或葉柄上形成的蟲癭[1-2]。我國五倍子年產量1.2~1.3萬噸,占世界總產量95%以上,是我國的特色農林資源[3-4]。因五倍子收斂、止血,為我國傳統(tǒng)中藥材,而其提取物單寧酸及其加工衍生物沒食子酸丙酯則為常用食品添加劑[5]。五倍子主要由單寧酸和沒食子酸組成,此外還含有少量脂肪、蠟質、淀粉等。水分、單寧酸和沒食子酸的含量直接影響五倍子質量,尤其是水分含量過大,五倍子易產生霉變[6-7]。傳統(tǒng)測試方法多采用中華人民共和國林業(yè)行業(yè)標準進行測定,該方法經典、可靠,但分析時間長、樣品損耗量大,且無法同時測定,難以滿足大批量樣本分析,在很大程度上妨礙了行業(yè)標準在實際中的應用[8-9]。在工業(yè)快速發(fā)展的今天,研發(fā)一種就地、快速、準確的檢測方法對于五倍子的質量控制和市場監(jiān)管具有重要意義。
五倍子樣本130份(湖北省32、重慶市15、湖南省20、云南省14、貴州省21、陜西省14、四川省14),由五峰赤誠生物科技有限公司收集提供;為保證測試樣品的均勻性,將收集到的130份五倍子樣本經高速粉碎機粉碎后,取粒徑≤0.38 mm粉末備用。鉻皮粉,上海遠慕生物科技有限公司;沒食子酸標準品,美侖生物技術有限公司;單寧酸標準品,中國林科院林產化學工業(yè)研究所。
MPA傅里葉變換近紅外光譜儀,德國布魯克科技有限公司;Cary100紫外分光光度計,安捷倫科技有限公司;VOS-300VD真空干燥箱,倍捷科技有限公司;FW-100高速萬能粉碎機,北京中興偉業(yè)儀器有限公司。
五倍子樣本中水分參照LY/T 1302—2016[15]測定。稱取五倍子粉末原料8 g,用濾紙包裹后放入索氏提取器中,用800 mL去離子水在回流條件下抽提5 h,結束后轉入1 000 mL容量瓶中,待液體溫度降至室溫時,用去離子水稀釋到刻度,搖勻備用。單寧酸含量以鉻皮粉吸附法測定[15],鉻皮粉吸附后的溶液經濾紙過濾后參照LY/T 1642—2005[16]測定沒食子酸含量。每個樣品測定3組平行數據,以平均值作為樣品測定值。
開機預熱30 min,保證儀器穩(wěn)定;試驗環(huán)境溫度25 ℃;樣品采集時,設置儀器參數:掃描時儀器分辨率4 cm-1,掃描次數64次,光譜波數范圍12 500~4 000 cm-1;以空IN312-SH型樣品杯(Φ=97 mm)作為參比樣品進行光譜采集,樣品量為樣品杯體積的2/3,并用250 g砝碼壓住粉末樣品以保證樣品緊實度的一致性,光源從樣品杯底部照射樣品[17-18]。為確保樣品采集的均勻性,采用旋轉積分球漫反射光譜模式,每個五倍子樣品重復采集5次,取其平均光譜作為樣品代表性光譜。
1.4.1樣品集的劃分 把收集的五倍子樣本按約3∶1的比例隨機劃分為校正集和驗證集,校正集用來建立水分、單寧酸和沒食子酸的近紅外模型,驗證集用來驗證模型的可靠性,此時應注意組分的最大值和最小值應在校正集中。
1.4.2光譜的預處理方法 近紅外光譜的掃描測量易被光散射效應、儀器穩(wěn)定性、試驗環(huán)境等因素影響,需要對原始光譜進行預處理消除噪聲,以提高模型的準確性。本研究采用的預處理方法有無光譜處理(None)、一階導數(FD)、二階導數(SD)、矢量歸一化(VN)、消除常量偏移量(ECO)、最小-最大歸一化(M-MN)、減去一條直線(ML)、多元散射校正(MSC)[19-21],選取1種或2種進行復合光譜預處理,最終選出最佳光譜預處理方法。
1.4.3光譜的最優(yōu)波段 PLS雖然可以處理全譜信息,但這些信息中包含了過多的冗余信息。因此,需要找到能充分反映出樣品中各指標組分的最佳建模波段來改善模型性能,提高計算速度。采用組合區(qū)間偏最小二乘法(SIPLS)篩選五倍子中水分、單寧酸和沒食子酸的特征波段[22]。當交叉驗證均方根誤差(RMSECV)最小時,對應的組合區(qū)間就是該模型的最優(yōu)特征波段。
1.4.4主因子數 采用PLS建立定量模型時,采用內部交互驗證法篩選主因子數,主因子數的大小會影響模型預測能力。通常主因子數太小,模型輸入數據中與待測組分關聯(lián)的信息利用不充分;主因子數值太大,輸入數據中與待測組分無關的信息也被引入模型中。以RMSECV作為主因子數的選擇依據,對應最小的RMSECV為最佳主因子數[23]。
由圖1可知,五倍子近紅外圖譜趨勢大致相同,但不同樣本的吸收峰強度不同,表現(xiàn)出不同的反射率,說明各樣品組分含量不同。結果表明試驗的五倍子近紅外光譜數據符合建立近紅外定量分析模型的要求。
圖1 五倍子近紅外原始光譜Fig.1 Near infrared original spectra of Chinese gallnut
表1 預處理方法的選擇
a.水分moisture(FD+MSC); b.單寧酸t(yī)annic acid(FD); c.沒食子酸gallic acid(FD+ML)
表2 特征波段篩選
由圖3可知,水分、單寧酸和沒食子酸的主因子數分別為9、 10和5時,對應的RMSECV最小,說明在該主因子數下,該模型的誤差最小。
a.水分moisture; b.單寧酸t(yī)annic acid; c.沒食子酸gallic acid
校正集和驗證集中水分、單寧酸和沒食子酸的質量分數范圍、平均值和標準差見表3。由表3可知,所選樣品中各組分質量分數范圍較寬,代表性較強,且最小值和最大值都在校正集內,符合建立模型樣品選擇的原則。
表3 校正集和驗證集劃分
為使數據更好擬合,反復進行內部交叉驗證剔除異常值。水分、單寧酸和沒食子酸的校正集剔除異常值數量分別為0、 4、 1,驗證集剔除異常值數量分別為0、 1、 3。水分、單寧酸和沒食子酸的校正集、驗證集的預測值和真實值的關系如圖4所示。
校正集corrected sets: a.水分moisture; b.單寧酸t(yī)annic acid; c.沒食子酸gallic acid
表4 五倍子中水分、單寧酸和沒食子酸的模型回歸方程