劉 星 范 楷 楊俊花 宋衛(wèi)國
(上海市農業(yè)科學院農產品質量標準與檢測技術研究所,上海 201403)
薏仁米為禾本科植物薏苡(Coixlachryma-jobiL.)的成熟種仁,被廣泛種植于中國各省、東南亞地區(qū)和巴西[1],中國年產量達30多萬t。薏仁米富含脂肪、蛋白質和其他谷物所缺少的賴氨酸、蛋氨酸和半胱氨酸等營養(yǎng)成分[2],且含有薏苡素、多糖等功能因子,具有祛濕、抗腫瘤(康萊特注射液)、降糖降脂、免疫調節(jié)等作用[3-5]。不同品種和不同產地的薏仁米營養(yǎng)組成不同,價格也存在差距。
薏仁米的食用量在逐年增加,市場上薏仁米產品很多,且多為粉末狀,其所用薏仁米依據其尺寸可分為小顆粒薏仁米(smallCoixseed,SCS)和大顆粒薏仁米(bigCoixseed,BCS)(圖1),一般SCS的價格高于BCS。已有的研究[6-8]多針對薏仁米的淀粉結構和理化性質、脂肪提取應用、活性成分提取條件優(yōu)化等,也有[9-10]開展某一種薏仁米或多種薏仁米的主要營養(yǎng)成分分析,但對于不同產地BCS和SCS主要營養(yǎng)成分的比較研究暫未見報道。對于與薏仁米相關的產品,一些商家為獲得更高的利潤均宣稱其產品所用的薏仁米為SCS,而消費者很難判斷真假,本課題組[11]前期研究發(fā)現可以借助近紅外光譜來進行BCS和SCS的判別,但是否能通過薏仁米的主要營養(yǎng)成分含量來判別BCS和SCS還未見報道。本研究采集了國內外多地薏仁米樣品,通過測定其主要營養(yǎng)組分(脂肪、蛋白質、氨基酸和礦物元素)來研究BCS和SCS中主要營養(yǎng)成分含量的差別,并將其主要營養(yǎng)成分含量結合化學計量學方法[主成分分析(principal component analysis,PCA)[12-13]和支持向量機(support vector machine,SVM)[14-16]]來判別BCS和SCS,以期為薏仁米產品的選材和薏仁米市場的規(guī)范提供參考。
圖1 大小顆粒薏仁米的尺寸Figure 1 The size of big Coix seed and small Coix seed
1.1.1 主要儀器
加速溶劑萃取儀:ASE 350型,美國ThermoFisher公司;
自動凱氏定氮儀:Kjeltec 8200型,丹麥FOSS公司;
全自動氨基酸分析儀:L-8900型,日本Hitachi公司;
電感耦合等離子體發(fā)射光譜儀:iCAP 6300型,美國Thermo Fisher公司;
分析天平:AL204型和PL2002型,梅特勒—托利多儀器(上海)有限公司;
電熱板:JH404型,上海錦凱科學儀器有限公司;
中藥粉碎機:HK-02A型,廣州旭朗機械設備有限公司。
1.1.2 主要試劑
丙酮:分析純,上海凌峰化學試劑有限公司;
凱氏定氮催化劑:丹麥FOSS公司;
氨基酸標準溶液:日本Hitachi公司;
多元素混合標準溶液:美國SPEX CertiPrep公司;
硫酸、鹽酸、硼酸、甲基紅、亞甲基藍、乙醇、濃鹽酸、苯酚、茚三酮、硝酸、高氯酸等:分析純,國藥集團化學試劑有限公司。
1.2.1 樣品采集 共采集了36個薏仁米樣品,其中包括16個BCS和20個SCS,這些樣品分別來自中國吉林、黑龍江、江蘇、貴州、福建、遼寧、河北、湖南、湖北、廣西、四川、山西、山東、陜西、浙江、安徽、寧夏、內蒙古18個省和自治區(qū),以及緬甸和泰國。試驗前將不飽滿的薏仁米顆粒挑出,再用粉碎機將薏仁米粉碎并全部通過0.25 mm 標準篩。
1.2.2 粗脂肪、蛋白質、氨基酸和礦物元素測定 薏仁米樣品中的粗脂肪利用快速溶劑萃取儀來提取,提取溶劑為丙酮[17],提取條件為溫度120 ℃,時間20 min,循環(huán)2次。薏仁米樣品中的蛋白質、氨基酸和礦物元素分別按GB 5009.5—2010《食品安全國家標準 食品中蛋白質的測定》、GB 5009.124—2016《食品安全國家標準 食品中氨基酸的測定》和GB 5009.268—2016《食品安全國家標準 食品中多元素的測定》方法來測定。
1.2.3 數據統(tǒng)計分析方法和化學計量學方法 數據為3次平行試驗的平均值,通過單尾方差分析來反映BCS和SCS主要營養(yǎng)成分含量的差別,并將主要營養(yǎng)成分含量與PCA法和SVM法結合,建立BCS和SCS定性判別模型。SVM法借助SPXY[18]法從36個樣品中選取75%的樣品作為訓練集,剩下的25%樣品作為測試集。統(tǒng)計分析和定性模型建立都是由Matlab軟件(R2009a 美國 Mathworks公司)來實現。
由表1可知,不同地區(qū)BCS和SCS的粗脂肪、蛋白質、苯丙氨酸、蛋氨酸、蘇氨酸、異亮氨酸、亮氨酸、纈氨酸、半胱氨酸、酪氨酸、天冬氨酸、絲氨酸、谷氨酸、丙氨酸、脯氨酸、K、Mg、Cu、Mn、Al含量在統(tǒng)計學上有顯著的差異,且除了粗脂肪、Mg、Al含量是BCS大于SCS外,其他營養(yǎng)成分均為SCS的含量高于BCS,說明不同地區(qū)來源的SCS主要營養(yǎng)成分在一定程度上是優(yōu)于BCS,這一結果與之前[11]所得結論——同一地區(qū)的BCS和SCS主要營養(yǎng)成分的差異現象一致,也為市場上SCS的價格高于BCS提供了依據。同時,對于SCS而言,不同地區(qū)來源的薏仁米其賴氨酸、Na、Ca、Fe、Al含量偏差較大,而不同地區(qū)的BCS也在Na、Ca、Fe、Al含量上有較大的差異,在一定程度上說明這幾種元素具有產地特征。
PCA是對數據進行降維處理的方法,是將多個變量轉化為少數綜合變量來表征原變量信息,即綜合變量(又稱為得分)保留原有變量的絕大部分信息,且可以由幾個變量來反映樣本數據的所有信息[12-13,19],所以PCA得分圖在一定程度上能夠反映數據集的分類。本研究前2個主成分中各營養(yǎng)成分的特征向量和累積貢獻率見表2。由表2可知,前2個主成分的累積貢獻率達71.044%,其中第1主成分PC1主要綜合了丙氨酸、絲氨酸、亮氨酸、纈氨酸、天冬氨酸、蘇氨酸、異亮氨酸、苯丙氨酸、脯氨酸、蛋白質、谷氨酸、酪氨酸、Cu等營養(yǎng)素含量的信息,第2主成分PC2主要綜合了組氨酸、酪氨酸、谷氨酸、苯丙氨酸、異亮氨酸、天冬氨酸、蛋白質等營養(yǎng)素含量的信息,說明前2個主成分包含了氨基酸、蛋白質、Cu、Mn、Zn、Na、Ca、Fe等營養(yǎng)素的信息,基本能反映BCS和SCS的營養(yǎng)組成信息。
利用PC1 和PC2 繪制的得分圖見圖2。由圖2可知,除了SCS中的5號遼寧樣品和BCS中的32號山西樣品外,不同地區(qū)的BCS和SCS基本可以借助主要營養(yǎng)成分分開,SCS樣品集中在右側(PC1>0),BCS樣品集中在左側(PC1<0);除了36號貴州樣品遠離數據集外,不同地區(qū)SCS樣品在得分圖中較均勻地分散,而BCS中橢圓形標識的1號貴州樣品、8號山東樣品、13號陜西樣品和4號內蒙古樣品、6號遼寧樣品、7號貴州樣品又分別聚到一起,可以認為這幾個地區(qū)的BCS綜合營養(yǎng)成分組成相似。說明薏仁米的產地和品種對其營養(yǎng)成分含量均有很大的影響,除個別樣品外,PCA基本能辨別不同地區(qū)的BCS和SCS。
采用SPXY來劃分訓練集和測試集,選取了27個樣品為訓練集,剩余9個樣品為測試集,其平均值、標準偏差和含量范圍見表3。將表3與表1中平均值和標準偏差相比可知,訓練集和測試集中各營養(yǎng)成分含量的平均值基本都落在SCS和BCS的平均值范圍內,說明各變量中不同地區(qū)BCS和SCS樣品均勻的分布在訓練集和測試集中;且測試集的各變量含量范圍也基本落在訓練集范圍內,說明此劃分方法所得訓練集和測試集是合理的,所建模型是具有通用性的。
表1 大小顆粒薏仁米中粗脂肪、蛋白質、氨基酸和礦物元素的含量?
? 同行不同字母表示差異顯著(P<0.05)。
表2 前2個主成分各變量特征向量及累積貢獻率
將上述所得訓練集和測試集利用SVM來建定性判別模型。SVM是建立一個分類超平面作為決策曲面來使得正反例之間的隔離邊緣被最大化,近似實現結構風險最小化[14]。SVM在進行模式分類預測時,先將訓練集和測試集歸一化到[0,1]區(qū)間,再進行建模,所建模型的正確率受懲罰參數c(c為回歸誤差的權重)和徑向基核函數參數g的影響。因為c值過大,樣本數據會發(fā)生過學習現象,而c值過小,樣本數據又會發(fā)生欠學習現象,因此需要優(yōu)化c、g值,采用交互驗證(Cross validation,CV)意義下的網格搜尋(Grid search)法來進行參數優(yōu)化。Grid search優(yōu)化參數時,是先讓參數c和g在一個大范圍內粗略搜尋,再根據粗選結果縮小c和g的搜尋范圍,最終得到最優(yōu)值來建模。
Grid search優(yōu)化參數的結果見圖3。圖中二維網格為c、g分別取以2為底數的對數后構成,等高線表示取相應的c和g后對應的CV方法的準確率,最佳的c、g值是通過交互驗證準確率的高低來確定的,最終所確定的最優(yōu)c為1,g為0.25。在最優(yōu)的c、g值下,所建SVM的模型預測結果見圖4。由圖4可知,準確率達100%,說明薏仁米主要營養(yǎng)成分含量結合SVM法來定性判別其BCS和SCS是可行的。
圖2 薏仁米主要營養(yǎng)成分主成分分析得分圖Figure 2 Principal component analysis score plots for main nutritional components of Coix seed
營養(yǎng)物質單位訓練集(樣本數27)均值±標準偏差范圍測試集(樣本數9)均值±標準偏差范圍粗脂肪%7.22±0.475.78~8.106.95±0.526.34~7.69蛋白質g/100 g14.49±1.1412.88~16.6514.99±1.0313.50~16.65賴氨酸mg/g2.56±0.222.20~3.072.55±0.182.31~2.84苯丙氨酸mg/g7.93±0.696.73~9.148.10±0.547.22~8.73蛋氨酸mg/g1.99±0.551.24~3.432.05±0.381.40~2.84蘇氨酸mg/g4.25±0.353.68~4.874.31±0.293.79~4.63異亮氨酸mg/g5.79±0.494.98~6.665.87±0.385.24~6.33亮氨酸mg/g21.60±2.4217.86~26.1222.49±2.1518.92~24.73纈氨酸mg/g7.88±0.646.73~8.947.98±0.547.03~8.58組氨酸mg/g3.97±0.782.96~5.553.58±0.433.17~4.36半胱氨酸mg/g1.49±0.191.13~1.961.58±0.211.28~1.88酪氨酸mg/g5.83±0.784.71~7.406.02±0.475.40~6.78天冬氨酸mg/g9.48±0.798.20~10.809.66±0.678.54~10.42絲氨酸mg/g6.89±0.575.98~7.917.04±0.496.22~7.58谷氨酸mg/g35.81±3.5531.11~42.1936.37±2.4832.38~39.24甘氨酸mg/g3.54±0.223.13~4.073.52±0.153.28~3.73丙氨酸mg/g15.38±1.7312.65~18.7116.14±1.6413.34~17.76精氨酸mg/g6.23±0.385.42~7.036.20±0.255.77~6.55脯氨酸mg/g10.91±1.388.36~13.4011.44±1.418.98~12.75Kmg/g3.02±0.422.32~3.842.74±0.332.37~3.42Mgmg/g1.71±0.171.43-2.071.63±0.161.47~1.99Pmg/g4.08±0.633.20~5.533.79±0.513.37~4.83Smg/g1.78±0.391.13~3.521.73±0.061.65~1.82Namg/kg78.93±35.6526.67~166.4096.50±44.4846.65~197.90Camg/kg96.71±20.1668.58~153.10111.47±36.4579.24~201.30Femg/kg46.81±11.7329.69~71.0156.92±25.4334.74~119.20Cumg/kg4.01±1.582.09~7.004.83±1.532.18~6.24Mnmg/kg25.75±5.9316.96~35.7529.20±7.7919.66~44.94Znmg/kg38.58±9.5726.99~59.1543.18±10.7729.92~63.43Almg/kg18.11±14.071.54~55.7310.25±8.742.05~25.52
圖3 網格搜尋法尋參示意圖Figure 3 Schematic diagram of grid search parameter
圖4 最優(yōu)參數情況下的SVM分類結果圖Figure 4 The classification result diagram of SVM with optimal parameters
本研究發(fā)現除了粗脂肪、Mg、Al含量是BCS>SCS外,其他營養(yǎng)成分含量均為SCS>BCS,在一定程度上說明不同地區(qū)的SCS營養(yǎng)價值高于BCS。對于BCS和SCS的判別,SVM能通過核函數參數的優(yōu)化來實現測試數據誤差最小,且同時縮小模型泛化誤差的上界來提高模型的泛化性能,其所建模型的預測準確率可達100%,說明薏仁米主要營養(yǎng)成分含量結合化學計量學方法來判斷BCS和SCS是可行的,也為大小顆粒薏仁米的判別提供了新的方法。由于不同地區(qū)的BCS和SCS主要營養(yǎng)成分含量有些差別很大,有些又很相近,PCA所提取的特征變量能將大部分薏仁米分開,但還是有個別的樣品被錯分,如5號遼寧樣品和32號山西樣品,后續(xù)還需要結合薏仁米中的其他特征成分開展大小顆粒的判別。