張穎穎,王守偉,康超娣,張明悅,李瑩瑩
(北京食品科學(xué)研究院,中國(guó)肉類(lèi)食品綜合研究中心,北京 100068)
近年來(lái),基于質(zhì)譜技術(shù)測(cè)定靶標(biāo)多肽的方法已被廣泛應(yīng)用于食品真?zhèn)舞b定中[1-3],該類(lèi)方法具有高熱穩(wěn)定性、高靈敏度、高通量等優(yōu)點(diǎn),應(yīng)用于多類(lèi)食品,如牛奶[4]、肉制品[5-6]、動(dòng)物副產(chǎn)品[7]。方法的基本流程[8]包括蛋白提取、胰蛋白酶酶解、高分辨質(zhì)譜采集數(shù)據(jù)、專(zhuān)業(yè)軟件搜索數(shù)據(jù)庫(kù)進(jìn)行蛋白及多肽鑒定、統(tǒng)計(jì)學(xué)分析。其中肉的物種特異性多肽主要來(lái)源于肌紅蛋白[9]、肌球蛋白[10]、血紅蛋白[11]、乳酸脫氫酶和肌酸激酶蛋白[12],大豆的特異性多肽主要來(lái)源于大豆球蛋白[13],牛奶的特異性多肽主要來(lái)源于酪蛋白[14]和乳球蛋白[15]。
目前,絕大多數(shù)靶標(biāo)多肽方法主要應(yīng)用于物種的定性鑒別實(shí)驗(yàn)中,然而,食品摻假不僅涉及原料種類(lèi)摻假,即用低價(jià)原料代替高價(jià)原料,還包括食品摻假程度的問(wèn)題,如在肉制品中加入較大量的非肉蛋白(植物蛋白)替代肉的含量冒充等級(jí)高的產(chǎn)品,而我國(guó)針對(duì)肉制品等級(jí)的判定,如GB/T 20712—2006《火腿腸》[16]、SB/T 10610—2011《肉丸》[17],僅能通過(guò)一些常規(guī)的參數(shù)檢測(cè),如蛋白總量、淀粉等,而無(wú)法測(cè)定其中真正肉的含量,因此在肉制品定量檢測(cè)方面存在方法盲區(qū)。目前的定量研究主要集中于2 個(gè)方向的探討:一是相對(duì)定量法,即測(cè)定食品中不同物種蛋白含量的比例。Camerini等[18]分析意大利乳清干酪的摻假現(xiàn)象,從β-乳球蛋白和α-乳清蛋白中選擇了特定的肽段,以鑒定牛、水牛、綿羊、山羊源性成分,并且在1%~50%的范圍內(nèi)進(jìn)行曲線(xiàn)擬合,線(xiàn)性相關(guān)系數(shù)高于0.99,方法的檢出限可測(cè)定0.5%的牛乳清成分。Watson等[9]建立了一種液相色譜-串聯(lián)質(zhì)譜方法判定肉制品的摻假,用各個(gè)物種特異性多肽的峰面積之比進(jìn)行物種相對(duì)定量分析,分別對(duì)5%、10%、20%、50%、80%和90%的馬肉摻假比例進(jìn)行線(xiàn)性擬合分析,其相關(guān)系數(shù)大于0.99,該方法的檢出限可達(dá)1%。另一研究方向是絕對(duì)定量法,可直接測(cè)定食品中蛋白質(zhì)的含量。Montowska等[19]提出了一種通過(guò)同位素內(nèi)標(biāo)法定量雞、鴨、鵝、豬、牛、大豆、牛奶和蛋清的專(zhuān)屬性多肽折算其中的蛋白含量。上述定量方法的原理均是物種含量與其含有的蛋白及多肽呈正相關(guān),通過(guò)測(cè)定其中多肽含量推算其中物種的含量,因此,篩選用于物種定量分析的多肽是整個(gè)實(shí)驗(yàn)的關(guān)鍵因素。由于高分辨質(zhì)譜分辨率高,質(zhì)量數(shù)可精確至小數(shù)點(diǎn)后四位,可用于分析鑒別物種蛋白及多肽,但同時(shí)得到的譜圖具有高緯度、高噪聲、高復(fù)雜度等特征,且每個(gè)物種得到的多肽數(shù)量眾多,因此需要有相關(guān)的專(zhuān)業(yè)技術(shù)方法從復(fù)雜數(shù)據(jù)中提取出有價(jià)值的信息,便于后期的實(shí)驗(yàn)驗(yàn)證。
近年來(lái),多元數(shù)據(jù)統(tǒng)計(jì)方法已廣泛用于代謝組學(xué)和蛋白質(zhì)組學(xué)分析[20],包括主成分分析(principal component analysis,PCA)、偏最小二乘判別分析(partial least squares-discrimination analysis,PLS-DA)和正交偏最小二乘判別分析(orthogonal partial least squares-discrimination analysis,OPLS-DA)統(tǒng)計(jì)方法,這些方法可通過(guò)減少數(shù)據(jù)維數(shù),有效地解決樣本少、自變量多、相關(guān)性高的數(shù)據(jù)分析。Yang Jinhui等[4]使用PCA方法分析了不同比例的摻假牛奶,通過(guò)建立模型,可以準(zhǔn)確地將樣品結(jié)果與模型進(jìn)行匹配。Yuswan等[21]使用PCA方法建立了豬、牛、雞的模型,能夠準(zhǔn)確區(qū)分這3 個(gè)物種,并使用OPLS-DA用于區(qū)分和增強(qiáng)模型的解釋性。Du Lijuan等[22]分別使用PCA、PLS-DA和支持向量機(jī)3種統(tǒng)計(jì)方法區(qū)別摻假牛奶與純牛奶。
本研究采用多元統(tǒng)計(jì)分析建立一種可用于篩選物種定量分析多肽的研究方法,將牛排作為研究對(duì)象,用高分辨率質(zhì)譜分析不同比例的摻假牛排,并建立多變量統(tǒng)計(jì)分析模型,用于篩選豬、牛差異顯著性的定量多肽,根據(jù)定量多肽含量區(qū)分摻假牛排中的牛肉和豬肉含量,旨在為摻假定量分析提供新的研究思路。
生牛肉、豬肉購(gòu)于屠宰場(chǎng);市購(gòu)商業(yè)牛排樣品于-18 ℃冷凍保存。
胰蛋白酶(測(cè)序級(jí))、二硫蘇糖醇(dithiothreitol,DTT)(生化級(jí)) 美國(guó)Promega公司;甲酸(formic acid,F(xiàn)A)、乙酸、乙腈(均為色譜純) 德國(guó)Merck公司;碘乙酰胺(iodoacetamide,IAA)、三氟乙酸(trifluoroacetic acid,TFA)(均為生化級(jí)) 美國(guó)Sigma公司;尿素、硫脲、鹽酸(均為分析純) 上海國(guó)藥集團(tuán)化學(xué)試劑有限公司。
Q Exactive HF-X液相色譜四極桿靜電場(chǎng)軌道阱高分辨質(zhì)譜系統(tǒng)(配有電噴霧離子源) 美國(guó)Thermo公司;HENGAO T&D固相萃取裝置 美國(guó)Agilent公司;CR21N高速冷凍離心機(jī) 日本Hitachi公司;HGC-24A氮吹儀 天津市恒奧科技發(fā)展有限公司;HLB固相萃取柱 美國(guó)Waters公司。
1.3.1 樣品制備
生牛肉、豬肉樣品分別剔除脂肪、筋膜后攪碎均勻,按照市場(chǎng)中冷凍牛排的制作工藝,制備10種含不同比例牛肉、豬肉的牛排制品,并加入大豆蛋白粉、鹽、水、磷酸鹽等其他添加劑,委托工廠生產(chǎn)模擬牛排,其中,豬肉和牛肉的比例如表1所示。
表1 模擬牛排中牛肉和豬肉的混合比例Table 1 Mixing ratio between beef and pork content in simulated steak%
1.3.2 樣品前處理
采用的樣品前處理過(guò)程與相關(guān)文獻(xiàn)[23]方法相似。準(zhǔn)確稱(chēng)取2 g樣品,加入20 mL提取溶液(7 mol/L尿素、2 mol/L硫脲、50 mmol/L Tris-HCl(pH 8.0))在冰水浴條件下采用均質(zhì)方法提取蛋白質(zhì),12 000 r/min離心20 min后,準(zhǔn)確移取200 μL上清液于小離心管中,加入30 μL DTT(50 mmol/L)溶液在56 ℃反應(yīng)1 h,待冷卻至室溫后,加入30 μL IAA(100 mmol/L)溶液暗處室溫條件下反應(yīng)0.5 h,再加入1.8 mL Tris-HCl(25 mmol/L,pH 8.0)、60 μL胰蛋白酶溶液(2 mg/mL)于37 ℃水浴中酶解過(guò)夜。冷卻至室溫后,用10% TFA調(diào)節(jié)pH值小于2.0以終止酶解反應(yīng),然后使用HLB固相萃取柱進(jìn)行凈化,HLB萃取柱先用乙腈、50%乙腈-水、0.1% TFA進(jìn)行活化,上樣,再分別用0.1% TFA、0.5%乙酸淋洗,最后用2 mL乙腈-0.5%乙酸(60∶40,V/V)洗脫,收集洗脫液,混勻后過(guò)0.22 μm濾膜,準(zhǔn)備上機(jī)測(cè)定。每個(gè)樣品進(jìn)行4 次平行實(shí)驗(yàn)。
1.3.3 數(shù)據(jù)采集
利用高分辨質(zhì)譜進(jìn)行多肽鑒定及定量分析,色譜柱為Hypersil GOLD C18色譜柱(2.1 mm×100 mm,1.9 μm),流速為0.2 mL/min,流動(dòng)相A為0.1%甲酸-H2O,流動(dòng)相B為0.1%甲酸-乙腈,梯度條件如下:0~0.2 min,97%~90% A,3%~10% B;15.8 min,60% A,40% B;16.8 min,20% A,80% B;17.3 min,20% A,80% B;18.3 min,20% A,80% B,18.5 min,97% A,3% B;25 min,97% A,3% B。進(jìn)樣體積為5 μL。
質(zhì)譜參數(shù)如下:噴霧電壓3 400 V,毛細(xì)管溫度320 ℃,鞘氣40 arb,輔助氣15 arb,全掃描分辨率120 000,質(zhì)量掃描范圍m/z350~2 000,自動(dòng)增益值為3×106,注入時(shí)間為100 ms,二級(jí)掃描,topN為10,分辨率為30 000,自動(dòng)增益值為2×105,注入時(shí)間為50 ms,碰撞能量為30 V。
高分辨質(zhì)譜對(duì)數(shù)據(jù)進(jìn)行采集后,利用Proteome Discoverer(PD)軟件進(jìn)行數(shù)據(jù)處理,通過(guò)搜索Uniprot數(shù)據(jù)庫(kù),對(duì)物種蛋白及多肽進(jìn)行鑒定分析。PD軟件分析包括2 個(gè)工作流程:Processing Step和Consensus Step(圖1)。Processing Step涉及物種多肽的篩選及定量分析,需要從Sequest HT模塊中加入豬、牛的蛋白質(zhì)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)是從UniProt數(shù)據(jù)庫(kù)(https://www.uniprot.org/)中下載fasta文件,導(dǎo)入至PD軟件后進(jìn)行搜索,其他參數(shù)設(shè)置為默認(rèn)值即可。Consensus Step是通過(guò)增強(qiáng)多肽和蛋白質(zhì)注釋對(duì)高可信度多肽進(jìn)行過(guò)濾,經(jīng)過(guò)該步驟分析后,數(shù)據(jù)可進(jìn)行可視化結(jié)果展示。通過(guò)使用悟空云平臺(tái)(https://www.omicsolution.com/wkomics/main/)在線(xiàn)工具對(duì)PD軟件分析的數(shù)據(jù)進(jìn)行PCA、PLS-DA、OPLS-DA統(tǒng)計(jì)分析[24]。
圖1 PD軟件分析流程圖Fig.1 Workflow of PD analysis
2.1.1 構(gòu)建PCA模型
PCA可通過(guò)正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線(xiàn)性不相關(guān)的變量[25]。當(dāng)樣品B10的牛肉多肽豐度設(shè)為0時(shí),將樣品B1~B9中不同比例的牛肉多肽信息用以構(gòu)建PCA模型;同樣,樣品B1的豬肉多肽豐度設(shè)為0,將樣品B2~B10中不同比例的豬肉多肽用以構(gòu)建PCA模型。
如圖2a所示,具有不同牛肉含量比例的牛排樣品通過(guò)PCA可以得到有效分離,并且按照牛肉含量由大至小進(jìn)行從左至右排列,牛肉含量較高的樣品主要分布在第3、4象限,而牛肉含量較低的樣品主要分布在第1、2象限。其中PC1的方差貢獻(xiàn)率為82.6%,表明該成分可以較好地反映原始樣品的信息;且PC1和PC2的累計(jì)方差貢獻(xiàn)率高達(dá)86.5%,因此該模型有望用于分析不同比例的牛肉樣品。相較而言,圖2b中不同比例豬肉含量樣品的PCA模型效果稍差。PCA圖的聚攏程度反映了樣品的相似性,即不同含量比例樣品的聚類(lèi)程度。除樣品B7外,B2~B10均實(shí)現(xiàn)了完全分離,而樣品B7的數(shù)據(jù)之間存在較大的距離,表明此比例下的數(shù)據(jù)差異較大,聚類(lèi)效果不佳。
2.1.2 構(gòu)建PLS-DA模型
PLS-DA[26]是在已知樣本的分組關(guān)系時(shí),用PLS回歸方法,在對(duì)數(shù)據(jù)降維的同時(shí)建立回歸模型,并對(duì)回歸結(jié)果進(jìn)行判別分析。目前,PLS-DA已廣泛應(yīng)用于蛋白質(zhì)組學(xué)及代謝組學(xué)中,用以分析樣本量小、變量之間獨(dú)立性強(qiáng)及相關(guān)性高的樣品數(shù)據(jù)[27]。
同上述構(gòu)建PCA模型的過(guò)程,分別進(jìn)行不同比例豬肉和牛肉的PLS-DA。在建立的PLS-DA模型中,從圖3a(R2Y=0.124,Q2=0.092 5)和圖3b(R2Y=0.571,Q2=0.338)可以看出,各自的樣品組都得到了明顯區(qū)分,說(shuō)明使用該模型分類(lèi)效果顯著,組間差異明顯。尤其是圖3b中不同豬肉含量的樣品數(shù)據(jù)模型,相較于PCA,使用PLS-DA實(shí)現(xiàn)了更好分離。圖3中均按照樣品含量比例遞減的規(guī)律從左到右排列,并且2 個(gè)模型中,除B9外的其他組樣本均比較集中,說(shuō)明組內(nèi)差異較小。而B(niǎo)9樣品橢圓范圍最寬,樣品點(diǎn)分散,組內(nèi)差異較大,原因可能是采用PLS-DA模型分析時(shí),不同批次之間數(shù)據(jù)差異比較大。
圖3 不同比例的牛肉和豬肉的PLS-DA模型Fig.3 PLS-DA score plot of beef and pork mixtures in different proportions
2.1.3 構(gòu)建OPLS-DA模型
OPLS-DA是在PLS-DA基礎(chǔ)上發(fā)展而來(lái)的算法,相較于PLS-DA,將X變量中的系統(tǒng)變異分解為2 部分,即同Y線(xiàn)性相關(guān)的部分和同Y正交的部分。隨著正交變異組分的增加,將提供更多的解釋性,并減少結(jié)果的誤差。Trygg等[28]認(rèn)為,該方法可有效降低模型的復(fù)雜性并增強(qiáng)模型的解釋能力,但并不會(huì)降低模型的預(yù)測(cè)能力。對(duì)上述豬、牛數(shù)據(jù)進(jìn)行OPLS-DA模型分析,豬的模型中的R2Y為0.401、Q2為0.139;牛模型中的R2Y為0.479、Q2為0.295。由圖4可知,豬、牛的每個(gè)混合比例的樣品組都得到了明顯區(qū)分,與PLS-DA建立的模型對(duì)比,組間間距更大,可以看出OPLS-DA模型分類(lèi)效果更為顯著;并且組內(nèi)之間的數(shù)據(jù)點(diǎn)間距較小,說(shuō)明組內(nèi)差異較小。表明利用高分辨鑒別的多肽中可以篩選到差異顯著性的變量以實(shí)現(xiàn)不同含量樣本的區(qū)分。
圖4 不同比例的牛肉和豬肉的OPLS-DA模型Fig.4 OPLS-DA score plot of beef and pork mixtures in different proportions
2.1.4 模型評(píng)價(jià)
由上述3種可視化模型圖可以得出,采用基于物種多肽響應(yīng)值進(jìn)行多元統(tǒng)計(jì)分析的方法對(duì)物種摻假量化判別可行。由上述模型的判別效果看,OPLS-DA模型的判別效果最好,因此后續(xù)數(shù)據(jù)的篩選將在OPLS-DA模型的基礎(chǔ)上進(jìn)行。
在進(jìn)行模型判別的過(guò)程中,需要關(guān)注模型的評(píng)估指標(biāo),即模型的擬合程度(R2Y)和模型的預(yù)測(cè)能力(Q2Y),從而可以識(shí)別出差異顯著性的肽段。R2Y指標(biāo)的數(shù)值越接近1,表明OPLS-DA模型的數(shù)據(jù)擬合度越好[29]。
變量重要度投影(variable importance for the projection,VIP)是OPLS-DA模型中評(píng)價(jià)變量貢獻(xiàn)率最常用的參數(shù),一般認(rèn)為VIP值大于1的變量能夠反映統(tǒng)計(jì)模型中一些重要特征[30]。因此設(shè)置OPLS-DA模型中VIP值大于1,相關(guān)系數(shù)P值小于0.05,篩選出模型中差異顯著的物種多肽,其中篩選出牛多肽為257 條,豬多肽為288 條。對(duì)篩選出的多肽重新進(jìn)行OPLS-DA模型擬合,如圖5所示。
圖5 篩選VIP值大于1的多肽數(shù)據(jù)繪制OPLS-DA模型Fig.5 OPLS-DA score plot of beef and pork mixtures with selected peptides based on VIP
通過(guò)刪除VIP值較小的多肽數(shù)據(jù),新生成的OPLS-DA模型均得到了顯著改善。牛模型的R2Y為0.96,Q2Y為0.721,豬模型的R2Y為0.479,Q2Y為0.582,進(jìn)一步說(shuō)明該模型具有較高的擬合度和預(yù)測(cè)能力。由圖5a所示,不同比例的樣品組均能夠得到良好區(qū)分,除B3樣品較為分散外,其他樣品組均聚攏良好。相對(duì)而言,圖5b中所有樣品組均有良好的聚攏和區(qū)分。表明經(jīng)過(guò)篩選后的多肽建立模型的預(yù)測(cè)能力更好,為后續(xù)篩選物種定量多肽打下基礎(chǔ)。
2.2.1 差異顯著性多肽的篩選
由2.1.4節(jié)中牛OPLS-DA模型繪制S圖,圖中相關(guān)系數(shù)p1值和pcorr1值均大于0時(shí),相應(yīng)的多肽響應(yīng)值與物種的含量比例呈正相關(guān),并且值越大,其相關(guān)性越高。按數(shù)值降序的順序選擇前10%的多肽,詳細(xì)信息如表2所示。表2中選擇的25 條牛肉多肽主要來(lái)源于肌聯(lián)蛋白、肌球蛋白結(jié)合蛋白C、α-1,4-葡聚糖磷酸化酶、L-乳酸脫氫酶A鏈、肌球蛋白。同樣,也選擇了豬的25 條差異顯著性多肽,信息列于表3。這些多肽主要來(lái)自肌球蛋白、血清白蛋白、肌球蛋白結(jié)合蛋白C、α-1,4-葡聚糖磷酸化酶和鈣轉(zhuǎn)運(yùn)ATP酶。這些蛋白大多數(shù)是高豐度蛋白質(zhì),具有較多數(shù)量的特異性多肽,如牛的肌聯(lián)蛋白、肌球蛋白、肌球蛋白結(jié)合蛋白C,豬的肌球蛋白結(jié)合蛋白C、α-1,4-葡聚糖磷酸化酶。
表2 牛顯著性多肽信息Table 2 Selected significantly differential beef peptides
表3 豬顯著性多肽信息Table 3 Selected significantly differential pork peptides
目前,已有采用上述來(lái)源蛋白中的多肽進(jìn)行物種定性鑒別的研究,如采用血清白蛋白和L-乳酸脫氫酶A中的多肽進(jìn)行物種鑒別[12,23]。Ruiz等[31]從肌紅蛋白、肌球蛋白1和肌球蛋白2中篩選物種特異性多肽用以摻假鑒別。由此也進(jìn)一步證實(shí)通過(guò)OPLS-DA模型篩選的物種多肽及蛋白可靠且有效。
2.2.2 差異顯著性多肽的線(xiàn)性方程分析及應(yīng)用
對(duì)上述篩選的豬、牛的差異顯著性多肽進(jìn)行線(xiàn)性擬合分析,以肉的含量為橫坐標(biāo),多肽的響應(yīng)值為縱坐標(biāo),繪制標(biāo)準(zhǔn)曲線(xiàn)。其中牛多肽中有10 條多肽呈現(xiàn)良好的線(xiàn)性關(guān)系即R2大于0.99,豬源多肽中有6 條呈現(xiàn)良好的線(xiàn)性關(guān)系,如表4所示。
表4 篩選多肽的線(xiàn)性擬合信息Table 4 Linear equations based on the selected peptides
表5 牛排樣品中牛肉含量的測(cè)定結(jié)果Table 5 Determination of beef contents in real steak samples
圖6 牛排樣品回收率分布圖Fig.6 Distribution of recoveries of beef in real steak samples
本研究旨在提供一種快速篩選用于定量分析多肽的方法,因此僅查詢(xún)了豬、牛的數(shù)據(jù)庫(kù)并篩選了差異顯著性多肽,并未對(duì)篩選多肽的物種專(zhuān)屬性進(jìn)一步篩查。通過(guò)對(duì)比測(cè)定牛排樣品中牛肉含量的結(jié)果,發(fā)現(xiàn)不同多肽測(cè)定結(jié)果并不相同,這可能是由于不同加工工藝或是添加的輔料使蛋白質(zhì)產(chǎn)生了不同程度的變性,從而影響了酶解過(guò)程中多肽的響應(yīng)值,并且本實(shí)驗(yàn)是通過(guò)高分辨質(zhì)譜進(jìn)行定量分析,相對(duì)而言,液相色譜-三重串聯(lián)四極桿質(zhì)譜的多反應(yīng)監(jiān)測(cè)模式具有強(qiáng)大的抗干擾能力及準(zhǔn)確的定量特性[32],因此后期實(shí)驗(yàn)會(huì)針對(duì)篩選的差異顯著性定量多肽進(jìn)行進(jìn)一步物種唯一性分析,并使用液相色譜-三重串聯(lián)四極桿質(zhì)譜進(jìn)行樣品檢測(cè),篩選回收率好的物種專(zhuān)屬性多肽進(jìn)行日常樣品定量分析。
本研究通過(guò)對(duì)牛排中的豬、牛多肽數(shù)據(jù)進(jìn)行統(tǒng)計(jì)計(jì)量學(xué)分析,分別采用PCA、PLS-DA、OPLS-DA 3種模型驗(yàn)證牛排中豬肉、牛肉含量的可行性,結(jié)果顯示,3種模型均能夠?qū)崿F(xiàn)不同含量樣品之間的區(qū)分,其中通過(guò)結(jié)合參數(shù)VIP值大于1篩選的多肽數(shù)據(jù)建立的OPLS-DA模型效果最好。利用該模型分別篩選出25 條差異顯著的牛、豬多肽,其中10 條牛多肽和6 條豬多肽得到的線(xiàn)性擬合結(jié)果較好,其線(xiàn)性相關(guān)系數(shù)R2均大于0.99,并開(kāi)展了真實(shí)樣品的驗(yàn)證,可以測(cè)定分析牛排中豬肉、牛肉的含量比例,實(shí)現(xiàn)定量分析。本研究為食品的定量分析及判別提供了一種新的多肽篩選思路。