陳美林 杜芬妮 陳 業(yè) 程 超 單長海 楊 迪 莫開菊,3
(湖北民族大學(xué)生物科學(xué)與技術(shù)學(xué)院1,恩施 445000) (恩施土家族苗族自治州食品藥品檢驗檢測中心2,恩施 445000) (生物資源保護與利用湖北省重點實驗室3,恩施 445000)
1973年,世界衛(wèi)生組織專家委員會正式宣布,硒是人體生理必需的微量元素,1988年,中國營養(yǎng)學(xué)會將硒列為15種微量元素之一[1]。硒在增強抗氧化、提高免疫力和預(yù)防癌癥等方面有重要功效[2,3]。全國有72%的地區(qū)處于缺硒、低硒帶,膳食中硒攝入量不足[4],需要通過富硒食品補充。土壤中的硒被植物吸收后通過代謝最終以無機硒和有機硒兩種形式存在,其中有機硒占總硒含量的80%以上,由大分子硒(硒蛋白、硒核酸和硒多糖等)和以硒代氨基酸及其衍生物形式存在的小分子硒化物(硒甲基硒代半胱氨酸、硒代高胱氨酸、硒代蛋氨酸和硒肽等)組成[5]。GB 5009.93—2017規(guī)定了食品中硒含量測定的方法[6],但是這些方法需要引入有毒的化學(xué)試劑,前處理繁瑣,分析設(shè)備昂貴,要求專業(yè)的操作人員才能獲得準確的測定效果[7]。而紅外光譜技術(shù)能準確快速靈敏的測定食品中的化學(xué)成分且無試劑參與,綠色而環(huán)保。
中紅外光譜是由化學(xué)成分中基團的基頻振動而產(chǎn)生的,具有高度特征性,可利用其化學(xué)鍵的特征吸收來鑒別化合物并定量測定[8]。中紅外光譜比較復(fù)雜,尤其是像食品這樣的多成分的復(fù)雜體系中的微量成分的定量分析,難以以某單一峰的強度作為定量分析的依據(jù)。因此采用衰減全反射中紅外光譜結(jié)合化學(xué)計量法測定米粉中極其微量的硒代胱氨酸的硒含量將是一項有益的探索。
東北大米、硒代胱氨酸(98%)、胱氨酸(98%)。
Nicolet iS5傅里葉變換中紅外光譜儀、iD7 Transmission衰減全反射附件。
1.2.1 材料制備
大米在粉碎機內(nèi)粉碎過140目篩,45 ℃烘?zhèn)溆谩?/p>
配制1 μg/mL(以硒計)硒代胱氨酸溶液:稱硒代胱氨酸(98%)0.108 g(0.05 g)用去離子水定容至1 000 mL(50 μg/mL),取10mL定容至500 mL(1 μg/mL)備用。
將1 μg/mL的溶液用去離子水分別稀釋成1、0.98、0.96、0.94、0.92、0.90、0.88、0.86、0.84、0.82、0.80、0.78、0.76、0.74、0.72、0.70、0.68、0.66、0.64、0.62、0.60、0.58、0.56、0.54、0.52、0.50、0.48、0.46、0.44、0.42、0.40、0.38、0.36、0.34、0.32、0.30、0.28、0.26、0.24、0.22、0.20、0.18、0.16、0.14、0.12、0.10、0.05和0 μg/mL的溶液,各取10 mL分別與10 g米粉混勻配成硒濃度梯度分別為100、98、96、94、92、90、88、86、84、82、80、78、76、74、72、70、68、66、64、62、60、58、56、54、52、50、48、46、44、42、40、38、36、34、32、30、28、26、24、22、20、18、16、14、12、10、5、0 μg/100 g的樣品,烘箱里45 ℃烘6 h后研缽里研磨均勻。
1.2.2 樣品光譜采集
取適量樣品置于衰減全反射附件的晶體上,壓實;光譜掃描范圍:4 000~400 cm-1;掃描次數(shù):32次;掃描間隔:2 cm-1;每個樣本分別采集3次。
1.2.3 數(shù)據(jù)分析
應(yīng)用TQ Analyst做數(shù)據(jù)處理、PLS建模和校驗。
每種化合物都有特征的紅外光譜,因此可以進行物質(zhì)的定性和定量分析。多組分樣品紅外光譜數(shù)據(jù)集相對較大,難以簡單辨析物質(zhì)的特征吸收光譜。因此需要合理的選擇光譜區(qū)間進行分析。選擇合適波段能減少計算量、提高精度[9]。
圖1為胱氨酸及硒代胱氨酸標準品的紅外圖譜。由于3 000.00~2 800.00 cm-1受羥基影響大,650 cm-1以后光譜又有較大的噪音,因此取1 600~650 cm-1為特征吸收光譜。由圖2能清楚看出硒代胱氨酸較胱氨酸特征波數(shù)往波數(shù)小的方向移動,波數(shù)越小波長越長,即發(fā)生了紅移,分子折合質(zhì)量越小,振動頻率(波數(shù))越大;鍵的力常數(shù)越大,振動頻率越大[10]。這與硒取代了硫元素導(dǎo)致分子折合質(zhì)量增大、偶極矩減小導(dǎo)致振動頻率變小的事實相符。
定量分析模型建立,打開TQ Analyst軟件,建模窗口從左向右設(shè)置參數(shù):
在Description窗口下選擇定量模型的算法Partial least squares(PLS)(偏最小二乘法):在Pathlength窗口下選擇光程類型,Constant(恒定光程);在Components窗口下設(shè)置定量組分的信息如組分名稱、濃度范圍等;在Standards窗口下導(dǎo)入數(shù)據(jù)并選擇作為建模和驗證的數(shù)據(jù);在Spectra窗口下設(shè)置數(shù)據(jù)格式,如Spectrum(原始光譜)、First derivative(一階導(dǎo)數(shù)光譜)、second derivative(二階導(dǎo)數(shù)光譜)等;在Regions窗口下選擇波數(shù)160 0~650 cm-1;在Other窗口下設(shè)置因子數(shù),選擇Optimize number of factors each time calibration is changed(每次校準更改時優(yōu)化因子數(shù));其他設(shè)置為默認。
C語言作為一門多數(shù)工科類學(xué)生必修的計算機語言類課程,被多數(shù)高校師生所推崇。通過學(xué)習(xí)C語言,可以掌握程序設(shè)計的基本知識,了解一些通用的計算機算法,培養(yǎng)學(xué)生對計算機編程的興趣,養(yǎng)成良好的編程習(xí)慣,同時培養(yǎng)學(xué)生能夠使用計算機思維去思考和解決專業(yè)上所遇到的實際問題。
圖1 胱氨酸及硒代胱氨酸標準品中紅外光譜
圖2 標準樣品中紅外光譜特征波數(shù)
建模窗口設(shè)置完后點擊工具欄上的Calibrate按鈕,計算校正模型,當前窗口就會顯示模型決定系數(shù)、校正均方差、預(yù)測均方差、因子數(shù)和校正結(jié)果,點擊菜單欄上Diagnostics下的Cross-Validation對模型作內(nèi)部交叉驗證,當前窗口就會顯示決定系數(shù)、交叉驗證均方差、因子數(shù)和校正結(jié)果。
2.2.1 留多模型建立
交叉驗證(Cross-validation)主要用于PCR、PLS回歸建模中。在給定的建模樣本中,拿出大部分樣本進行建模,留小部分樣本用于對建立的模型進行預(yù)測檢驗。留一交叉驗證每次只留一個樣本作為驗證數(shù)據(jù),這樣能保證每次計算有最大的訓(xùn)練集,被認為是漸近無偏的估計,當樣本量較少時采用留一法,當樣本量較大時,留一法計算較繁瑣,耗時,留多交叉驗證則改進了計算的復(fù)雜性,但通常會產(chǎn)生不可忽略的偏差[11];當樣本量很大的時候留多驗證可以減輕計算量,節(jié)約時間。
留多交叉驗證每次從數(shù)據(jù)集中抽出多個樣本,用剩余的樣本建模并預(yù)測被抽出的多個樣本,該過程重復(fù)多次。若樣本數(shù)為n,抽出的驗證數(shù)據(jù)為m,則需要進行n/m次交叉驗證并獲得n/m個模型。對于中度或較小的數(shù)據(jù)集(n<50),m的取值不應(yīng)過大,最好的留多交叉驗證是m=n×30%[12]。
為了保證驗證集分布較均勻,將全部樣本分為低中高濃度,分別用隨機數(shù)生成器產(chǎn)生1/3的樣本作為驗證集,剩下2/3作為建模集,模型內(nèi)部采用留一交叉驗證。表1是不同預(yù)處理后的PLS模型參數(shù)。
表1 模型參數(shù)
2.2.2 留多模型驗證
表2 驗證集的預(yù)測效果
結(jié)果顯示原始數(shù)據(jù)及經(jīng)過一導(dǎo)、二導(dǎo)處理的驗證集決定系數(shù)都達到0.95以上,RPD都大于3,說明模型都具有很好的預(yù)測性能;除驗證集1外經(jīng)過一導(dǎo)、二導(dǎo)處理后預(yù)測值與真實值的決定系數(shù)都達到0.97以上,較原始數(shù)據(jù)增大,說明其經(jīng)過一導(dǎo)、二導(dǎo)處理后預(yù)測值與真實值之間的整體方差較小,相對原始數(shù)據(jù)準確性提高了,二導(dǎo)處理后模型的預(yù)測效果比一導(dǎo)略好二導(dǎo)模型驗證數(shù)據(jù)的預(yù)測值與真實值的相對偏差在20%以內(nèi)的占87.50%以上;驗證集1經(jīng)過導(dǎo)數(shù)處理后決定系數(shù)、RPD都不如原始數(shù)據(jù),可能由于模型1只提取出了5個因子,因此丟失了些信息導(dǎo)致預(yù)測偏差較大。
為了更清楚看其預(yù)測效果,驗證集用經(jīng)二導(dǎo)處理模型計算的預(yù)測值與真值的比較如表3~表5。
由表3~表5可知,相對偏差大于20%集中分布在含量小于18μg/100 g的樣本中,少數(shù)分布在驗證集1稍高濃度樣品中,這可能是因為模型1的因子數(shù)較少導(dǎo)致預(yù)測誤差較大;含量在18μg/100 g以上的123個樣品中只有4個樣品相對偏差在20%以上,最高偏差為35.50%,也即相對偏差在20%以內(nèi)的占了96.75%,含量在50 μg/100 g(不含)以上的樣品中,有93.33%偏差在10%以內(nèi),只有6.67%偏差在10%以上,沒有偏差大于20%的樣品。以上數(shù)據(jù)說明當米粉中硒含量高時,所建模型預(yù)測較準確。表5中50 μg/100 g的樣品偏差在14.89%~23.23%之間,數(shù)據(jù)偏大,可能在測試過程中環(huán)境條件的偶然變化所致,對這種低概率的非系統(tǒng)偏差應(yīng)盡量避免,如減少人員進出對環(huán)境的擾動。
表3 驗證集1
表4 驗證集2
表5 驗證集3
為了更直觀的比較預(yù)測效果,將二導(dǎo)預(yù)測值與其真實值進行擬合作圖(圖3)。虛線是理想擬合線,表明預(yù)測值與真實值沒有偏差;實線為實際擬合線。
圖3 預(yù)測值與真值相關(guān)性比較
由圖3可知驗證集1較驗證集2和3分布分散,驗證集3較驗證集2斜率接近1,驗證集3整體偏移實際較小。各模型決定系數(shù)到達到0.95以上,斜率也較接近1,說明其方差較小且沒有整體偏移,預(yù)測效果較好。
校正樣本的代表性、數(shù)量和分布都會影響模型的準確性[19]?;瘜W(xué)計量法分析模型是基于統(tǒng)計學(xué)原理建立,結(jié)果可靠性取決于基礎(chǔ)校正集樣品數(shù)據(jù)的代表性,校正樣品選擇很重要。一般而言樣品越多、分布越廣,分布越均勻,代表性越強,模型越好。模型3矯正數(shù)據(jù)范圍大,驗證集數(shù)據(jù)都包含在內(nèi),分布均勻,所以預(yù)測也較準確,模型1和模型2驗證集在低含量分布較多,矯正數(shù)據(jù)分布在相對高含量區(qū)域,會導(dǎo)致對低含量區(qū)域的預(yù)測偏差較大,驗證集1和2的預(yù)測偏差確實偏大,特別是低含量的更明顯。
衰減全反射中紅外光譜結(jié)合偏最小二乘法能建立有效的大米硒代胱氨酸硒的定量分析模型。作為一種快速、準確的定量檢測方法,選擇1 600~650 cm-1作為特征波段,經(jīng)導(dǎo)數(shù)處理后建模,預(yù)測值與真實值的線性擬合決定系數(shù)能達到0.95以上,預(yù)測與真實值的相對偏差在20%以內(nèi)的高達87.94%以上,而含量在18 μg/100 g以上的樣品相對偏差在20%以內(nèi)的高達96.75%。本文采用的是單點反射附件,經(jīng)過一次衰減全反射(單點反射),光透入樣品深度有限,樣品對光吸收也有限,所得光譜吸收帶弱、信噪比差,表現(xiàn)在低含量時信噪比差,預(yù)測不穩(wěn)定、偏差較大,而在高含量時預(yù)測更穩(wěn)定、準確。為了進一步提高18 μg以下低含量樣品測定的準確性,今后將采用多點反射法以增加全反射次數(shù)使吸收譜帶增強,提高測試過程中的信噪比。