趙思夢,于宏威,高冠勇,陳 寧,王博妍,王 強*,劉紅芝*
1. 中國農(nóng)業(yè)科學院農(nóng)產(chǎn)品加工研究所,農(nóng)業(yè)部農(nóng)產(chǎn)品加工綜合性重點實驗室,北京 100193 2. 金勝糧油集團有限公司,山東 莒南 276600 3. 北京農(nóng)學院,北京 102206
花生是世界上油脂和蛋白的重要來源,其抗營養(yǎng)因子含量少[1],綜合利用價值高。我國2019年花生年產(chǎn)量1737萬噸(農(nóng)業(yè)農(nóng)村部統(tǒng)計數(shù)據(jù)),產(chǎn)量居全球首位?;ㄉ械鞍踪|(zhì)含量達25%~36%[2],花生蛋白中水溶性蛋白約為10%,鹽溶性蛋白占90%,主要由花生球蛋白、伴花生球蛋白Ⅰ和伴花生球蛋白Ⅱ組成[3],三者的構(gòu)成和含量影響蛋白質(zhì)的性能特性。花生球蛋白包含4個亞基,分子量分別為40.5,37.5,35.5和23.5 kDa,其中23.5 kDa亞基含量在18.70%~26.50%,37.5 kDa含量10.50%~17.90%,相對較高[3-4]。王麗[5]等研究表明,亞基組成影響蛋白質(zhì)功能特性; 劉巖[6]等研究表明花生球蛋白比伴花生球蛋白具有更高的熱穩(wěn)定性、更復雜的空間構(gòu)象和更差的變性協(xié)同性,伴花生球蛋白具有良好的溶解性和表面疏水性,其乳化活性、氣泡能力和熱凝膠特性皆優(yōu)于花生球蛋白; 楊曉泉[7]等研究表明,亞基的構(gòu)成、二硫鍵的穩(wěn)定性和親水疏水性等與蛋白的加工性質(zhì)有密切聯(lián)系。
傳統(tǒng)檢測蛋白質(zhì)組分和亞基含量的方法為聚丙烯酰胺凝膠電泳法(SDS-PAGE),需要對樣品進行脫脂、提取蛋白質(zhì)進行SDS-PAGE及光密度分析,該法分析速度慢,操作步驟繁多,樣品損耗量大。近紅外光譜分析通過反映分子中含氫元素的化學基團C—H,O—H和N—H分子振動的倍頻和合頻吸收信息[8],可以實現(xiàn)快速無損檢測,已經(jīng)廣泛應用于花生中水分、脂肪、氨基酸、蛋白質(zhì)等的檢測。但檢測花生蛋白組分的報道較少,花生蛋白亞基含量的近紅外檢測模型鮮有報道。
對整?;ㄉ鷺悠纷鹘t外光譜掃描,將其與化學值擬合,結(jié)合偏最小二乘回歸法進行數(shù)學模型的構(gòu)建。通過比較單一和復合光譜預處理方法,對比模型校正集和驗證集相關系數(shù)及誤差,確定了花生球蛋白、伴花生球蛋白、23.5 kDa、37.5 kDa亞基含量預測模型的最佳預處理方法,建立了近紅外光譜檢測方法并進行了外部驗證。為育種專家加工專用品種選育和蛋白加工企業(yè)原料選用提供了參考。
采用自然風干花生種子,去除雜質(zhì)和破損粒,在常溫下放置24 h,使樣品環(huán)境與儀器操作環(huán)境保持一致。選取來自山東、廣東等11個省份的178份花生樣品(來源: 花生產(chǎn)業(yè)技術(shù)體系)進行分析。先后采集近紅外反射光譜和測定蛋白質(zhì)組分及亞基含量。
采用基于MicroNIR光譜儀開發(fā)的便攜式花生品質(zhì)速測儀(型號: peanut 1.0; 廠家: VIAVI Solutions Inc.,USA),該裝置為一種高通量花生無損檢測裝置(圖1),組成部件包括: 箱體、箱蓋、顯示器和光譜儀。近紅外光譜儀采用漫反射光譜,光譜范圍為900~1 700 nm,光源采取10 W的鹵素燈,性能參數(shù)見表1。
便攜式花生品質(zhì)速測儀開機后常溫下預熱30 min,將花生樣品裝入樣品杯中,輕搖晃保證花生種子均勻分布,每個樣品掃描5次,每掃描一次將樣品杯旋轉(zhuǎn)一定的角度,重復裝樣掃描三次取平均值。
圖1 本試驗中使用的便攜式花生品質(zhì)速測儀和檢測配件Fig.1 Portable peanut quality spectrometer and test accessories used in the experiment
表1 速測儀性能參數(shù)Table 1 Spectrometer performance specifications
1.3.1 花生球蛋白與伴花生球蛋白的制備
首先將花生脫殼,進行晾曬,置于清水中浸泡脫去紅衣,再用烘箱烘干至水分含量7%左右。采用正己烷對粉碎機粉碎過后的樣品粉末進行脫脂,常溫提取5次,使其脂肪含量少于1%。脫脂后在通風櫥風干粉碎,得到的脫脂花生粉4 ℃冷藏備用[9]。
花生球蛋白和伴球蛋白的制備采用Chiou[10]等報道的提取方法,脫脂后花生粉加硫酸銨至飽和,離心后復溶沉淀,透析后冷凍干燥得到花生球蛋白和伴花生球蛋白。
1.3.2 SDS-PAGE電泳及亞基含量分析
根據(jù)Laemmli[11]報道的方法進行電泳。電泳結(jié)束后,將凝膠在染色液中染色1 h,置于搖床上脫色采集圖像。凝膠染色液采用考馬斯亮藍溶液,脫色采用高甲醇的醋酸溶液[12]。23.5和37.5 kDa蛋白質(zhì)亞基相對含量采用光密度分析軟件計算。
模型的構(gòu)建分析采用The Unscrambler X 10.3軟件(CAMO公司,挪威)。
1.4.1 光譜的預處理
由于近紅外光譜的測量容易受到試驗環(huán)境、儀器設備、光散射效應等因素的影響,因此需要對原始的光譜進行不同的預處理消除噪聲,來提高模型的分析準確性。
常用的光譜預處理方法主要有平滑(Normalization)、基準化(Baseline)、標準正態(tài)變量變換(SNV)、去趨勢(Detrend)、多元散射校正(MSC)、一階導數(shù)(1stDerivative,1st-der)和二階導數(shù)(2ndDerivative,2nd-der)等[13],選取以上七種單一預處理方法中較優(yōu)的兩種按不同順序組合進行復合光譜預處理,最終選出最佳光譜預處理方法。
1.4.2 模型建立與評價
對預處理后的光譜和化學值進行偏最小二乘回歸法分析(partial least squares regression,PLSR)[14]。PLSR是一種經(jīng)典的線性建模方法,它將光譜數(shù)據(jù)壓縮成為潛在變量的正交結(jié)構(gòu),描述光譜信息與參考含量值之間的最大協(xié)方差。與傳統(tǒng)的多元線性回歸相比,具有綜合篩選光譜數(shù)據(jù)、充分提取樣品光譜的有效信息、考慮內(nèi)在聯(lián)系等優(yōu)點,所構(gòu)建的模型能更加準確的識別信息[12]。
為使數(shù)據(jù)擬合反復進行內(nèi)部交叉驗證剔除異常值,采用外部驗證評價模型的穩(wěn)健性。通過比較模型的決定系數(shù)(R)、標準差(SEC)和測試集標準差(SEP)來篩選最佳模型,相關系數(shù)高且標準差低的模型穩(wěn)健性好。
178份花生樣品經(jīng)主成分分析(PCA)剔除異常值后剩余169份,其原始光譜如圖2所示?;ㄉ鷺藴蕵悠芳慕t外圖譜趨勢大致相同,但不同樣品的吸收峰強度不同,表現(xiàn)出不同的反射率,說明各樣品成分含量不同。結(jié)果表示本試驗的花生近紅外光譜數(shù)據(jù)符合建立近紅外定量分析模型的要求。
圖2 樣品集的近紅外光譜Fig.2 Near-infrared spectra of the sample set
建模所用的169種花生樣品的蛋白組分和亞基含量的化學值如表2所示,收集的花生樣品涵蓋較廣。樣品的花生球蛋白總量變幅為44.30%~71.99%,伴花生球蛋白變幅為28.01%~55.70%,花生球蛋白中 23.5 kDa亞基變化范圍為5.07%~28.42%,37.5 kDa花生蛋白質(zhì)亞基變化范圍為7.50%~21.60%。
將樣品按照3∶1的比例分為校正集和驗證集,用于建模的樣品127個,驗證集43個。數(shù)據(jù)分析表明預測集化學值含量位于校正集范圍內(nèi),可用外部驗證進行模型的校正。
表2 花生樣品蛋白組分和亞基含量化學值Table 2 Chemical values of protein componentsand subunits in peanut samples
2.3.1 光譜預處理方法的確定
為了從光譜中提取與化學組成相關的信息,消除干擾因素,采用合適的光譜預處理方法建立穩(wěn)定可靠的模型至關重要,研究了多種光譜預處理方法提高信噪比的效果,包括單一和組合預處理方法,對相關系數(shù)和標準差進行對比確定最佳預處理方法(表3和表4),花生球蛋白模型的最佳預處理方法為2nd-der with Detrend,伴花生球蛋白模型的最佳預處理方法為Detrend with 1st-der,23.5 kDa模型的最佳預處理方法為Normalization with 2nd-der,37.5 kDa模型的最佳預處理方法為Detrend with Baseline。
表3 不同光譜預處理對蛋白組分模型的影響Table 3 Results of Arachin model with different spectral pretreatment methods
表4 不同光譜預處理對亞基模型的影響Table 4 Results of 23.5 kDa model with different spectral pretreatment methods
2.3.2 模型的構(gòu)建及驗證
采用2.3.1節(jié)中篩選出的最佳預處理方法對花生球蛋白、伴花生球蛋白、23.5 kDa和37.5 kDa亞基含量進行模型構(gòu)建,分為校正模型和內(nèi)部驗證模型。
為驗證蛋白組分和亞基模型的精確性,經(jīng)43個樣品對所建模型進行外部驗證,結(jié)果見表5。花生球蛋白模型校正集相關系數(shù)為0.92,誤差為1.41%[圖3(a)]; 伴花生球蛋白含量模型的校正集相關系數(shù)為0.85,誤差為1.46%[圖4(a)]; 23.5 kDa亞基含量校正集相關系數(shù)為0.91,誤差為0.53%[圖5(a)]; 37.5 kDa亞基含量校正集相關系數(shù)為0.91,誤差為0.89 %[圖6(a)]。經(jīng)外部驗證,花生球蛋白的預測值與化學值的相關系數(shù)達0.82[圖3(b)],伴花生球蛋白預測值與化學值的相關系數(shù)達到0.94[圖4(b)],23.5 kDa亞基預測含量與化學值相關系數(shù)達到0.89[圖5(b)],37.5 kDa亞基預測含量與化學值相關系數(shù)達到0.97[圖6(b)]。
表5 模型構(gòu)建與驗證Table 5 Model construction and validation
目前NIR技術(shù)應用于檢測花生蛋白組分的報道較少,王麗分析141個樣品,建立花生球蛋白模型的校正集相關系數(shù)為0.80; 伴花生球蛋白模型校正集相關系數(shù)為0.78; 本研究中花生球蛋白相關系數(shù)0.92和伴花生球蛋白相關系數(shù)0.85均優(yōu)于已報道模型。尚未見關于花生蛋白23.5 kDa和37.5 kDa亞基含量的近紅外模型。
圖3 花生球蛋白校正模型(a)和預測模型(b)Fig.3 Results of calibration (a) and prediction (b)of arachin model
圖4 伴花生球蛋白校正模型(a)和預測模型(b)Fig.4 Results of calibration (a) and prediction (b)of conarachin model
圖5 23.5 kDa校正模型(a)和預測模型(b)Fig.5 Results of calibration (a) and prediction (b)of 23.5 kDa model
圖6 37.5 kDa校正模型(a)和預測模型(b)Fig.6 Results of calibration (a) and prediction (b)of 37.5 kDa model
建立了運用便攜式花生品質(zhì)速測和近紅外光譜技術(shù)對花生中蛋白質(zhì)組分和亞基含量進行快速無損檢測的方法。通過采集的178份數(shù)據(jù),對花生蛋白質(zhì)組分和含量進行建模分析,得出花生球蛋白含量最佳模型預處理方法為2nd-der with Detrend,模型校正集相關系數(shù)為0.92,外部驗證SEP為1.07; 伴花生球蛋白含量模型最佳預處理方法為Detrendwith 1st-der,模型校正集相關系數(shù)為0.85,外部驗證SEP為0.73; 23.5 kDa含量最佳預處理方法為Normalization with 2nd-der,模型校正集相關系數(shù)為0.91,外部驗證SEP為0.47; 37.5 kDa含量最佳預處理方法為Detrend with Baseline,模型校正集相關系數(shù)為0.91,外部驗證SEP為0.75。與目前報道比較,本方法能較準確的預測花生蛋白質(zhì)組分和亞基含量。
實現(xiàn)了對整?;ㄉM行花生球蛋白、伴花生球蛋白、23.7 kDa和37.5 kDa亞基含量的同步、快速、無損檢測,為育種專家加工專用品種選育和蛋白加工企業(yè)原料選擇提供了依據(jù)。