張 舒,王長(zhǎng)遠(yuǎn),*,馮玉超,盛亞男,富天昕,張藝瑋,姜穎俊,于 淼,張麗媛
(1.黑龍江八一農(nóng)墾大學(xué)食品學(xué)院,黑龍江 大慶 163319;2.國(guó)家雜糧工程技術(shù)研究中心,黑龍江 大慶 163319)
代謝組學(xué)主要是將某種物質(zhì)內(nèi)所有小分子代謝物(氨基酸、糖醇類化合物、脂類等)在不同生長(zhǎng)環(huán)境、時(shí)期以及外界刺激下的代謝應(yīng)答變化作為研究對(duì)象,并對(duì)其進(jìn)行定性、定量的多種統(tǒng)計(jì)分析[1],在物質(zhì)相關(guān)指標(biāo)分析的基礎(chǔ)上,通過(guò)高通量檢測(cè)和數(shù)據(jù)處理的手段,進(jìn)行系統(tǒng)性信息整合,從而對(duì)生物體代謝規(guī)律進(jìn)行研究的一門(mén)科學(xué)[2]。代謝組學(xué)分析不僅可以觀察物質(zhì)代謝產(chǎn)物含量的變化,還可以從分子水平掌握其動(dòng)態(tài)信息,將代謝產(chǎn)物與時(shí)間、地域、環(huán)境等因素聯(lián)系起來(lái)探究代謝產(chǎn)物與各因素間的變化規(guī)律,從整體水平上評(píng)價(jià)物質(zhì)的生物效應(yīng)[3-4]。目前國(guó)內(nèi)外主要通過(guò)檢測(cè)分析礦物質(zhì)元素[5]、穩(wěn)定性同位素[6-7]、核磁共振[8]、近紅外光譜[9]、DNA指紋、氣相色譜-質(zhì)譜(gas chromatography-mass spectrometry,GC-MS)[10]、液相色譜-質(zhì)譜[11-12]等分析方法進(jìn)行農(nóng)產(chǎn)品品質(zhì)、產(chǎn)地鑒別和溯源的研究[13];每種分析手段都有優(yōu)勢(shì),但目前靠單一的分析手段還無(wú)法獲得代謝物的全部信息,因此需要采取多種方法和技術(shù)聯(lián)合使用。
目前稻米是世界上最為主要的糧食之一,是人類和牲畜攝取碳水化合物的主要來(lái)源,具有適應(yīng)性強(qiáng)、產(chǎn)量高、經(jīng)濟(jì)效益高的特點(diǎn)[14]。稻米中含有種類豐富的初生代謝物和次生代謝物,存在基本營(yíng)養(yǎng)物質(zhì)外還包含白藜蘆醇、兒茶素、生物堿等生物活性物質(zhì)。除了本身遺傳因素的影響,水質(zhì)、局部氣候、土壤條件、晝夜溫差等環(huán)境因素對(duì)稻米品質(zhì)的影響也十分顯著,這些因素塑造了具有典型地域特色的地理標(biāo)志產(chǎn)品,使栽培具有明顯的區(qū)域性[15]。Kawasaki等[16]針對(duì)日本、中國(guó)、澳大利亞、美國(guó)和越南5 個(gè)國(guó)家大米樣品中的同位素11B/10B和87Sr/86Sr值采用電感耦合等離子體質(zhì)譜進(jìn)行分析,發(fā)現(xiàn)2 種同位素值差距較大。王希越等[17]通過(guò)GC-MS技術(shù)對(duì)不同產(chǎn)地稻米油脂中脂肪酸進(jìn)行研究,發(fā)現(xiàn)不同品種的稻米脂肪輪廓存在較大差異。由于我國(guó)稻米種植區(qū)域廣、種類多、品質(zhì)差距較大,為了防控以次充好的現(xiàn)象,探究一種高效、可靠的稻米產(chǎn)地鑒別及溯源方法尤為重要。本實(shí)驗(yàn)以黑龍江省五常地理標(biāo)志稻米保護(hù)區(qū)和查哈陽(yáng)地理標(biāo)志稻米保護(hù)區(qū)的水稻樣本為研究對(duì)象,通過(guò)GC-MS技術(shù)的代謝組學(xué)平臺(tái),對(duì)2 個(gè)地理標(biāo)志性產(chǎn)地的稻米進(jìn)行代謝物的差異分析,探究產(chǎn)地對(duì)稻米代謝及代謝產(chǎn)物的影響情況,以期為稻米產(chǎn)地鑒別及溯源提供數(shù)據(jù)支持和理論參考。
稻米采自黑龍江省查哈陽(yáng)和五常地理標(biāo)志性產(chǎn)地,依據(jù)代表性采樣原則,采用五點(diǎn)采樣法進(jìn)行隨機(jī)采集,每個(gè)采樣點(diǎn)采集1~2 kg稻穗。每個(gè)產(chǎn)區(qū)選取30 個(gè)樣本,五常地區(qū)選擇9 個(gè)鄉(xiāng)鎮(zhèn)布點(diǎn)進(jìn)行樣本的采集,稻米品種主要為稻花香水稻,分別為綏粳4、五優(yōu)4號(hào)、龍稻16、創(chuàng)新918;查哈陽(yáng)地區(qū)選擇6 個(gè)管理區(qū)布點(diǎn)進(jìn)行樣本的采集,稻米品種分別為綏粳4、五優(yōu)4號(hào)、龍粳26、龍粳29、龍粳31、龍粳39、松粳9。稻米采集自2017年。
甲醇、吡啶(色譜級(jí),純度≥99.9%) 上海阿拉丁生化科技股份有限公司;2-氯苯丙氨酸、甲氧基胺鹽酸鹽、99%雙(三甲基硅烷基)三氟乙酰胺+1%三甲基氯硅烷、N,O-雙(三甲基硅)三氟乙酰胺 麥克林試劑有限公司。
7890A/5975C GC-MS聯(lián)用儀 美國(guó)Agilent公司;色譜柱HP-5ms(30 m×0.25 mm,0.25 μm) 美國(guó)Agilent J&W Scientific公司。
1.3.1 樣品采集及處理
稻米樣品的前處理采用馮玉超等[18]的方法。
1.3.2 GC-MS檢測(cè)
進(jìn)樣口溫度280 ℃;電子電離源溫度230 ℃;四極桿溫度150 ℃;高純氦氣(純度>99.999%)作為載氣,不分流進(jìn)樣,進(jìn)樣量1.0 μL。升溫程序:初始溫度80 ℃,維持2 min,10 ℃/min升至320 ℃,并維持6 min。采用全掃描模式進(jìn)行質(zhì)譜檢測(cè),質(zhì)量掃描范圍m/z50~550。
在R軟件平臺(tái)下采用XCMS軟件對(duì)GC-MS得到的原始數(shù)據(jù)進(jìn)行特征峰的提取和處理,并利用SIMCA軟件進(jìn)行多元統(tǒng)計(jì)分析。通過(guò)主成分分析(principal component analysis,PCA)對(duì)數(shù)據(jù)進(jìn)行降維處理,并對(duì)整體的分布趨勢(shì)進(jìn)行預(yù)覽,然后采用正交偏最小二乘-判別分析(orthogonal partial least square-discriminant analysis,OPLS-DA)對(duì)其進(jìn)行建模,之后根據(jù)Student’st檢驗(yàn)的P值小于0.05,同時(shí)OPLS-DA模型主成分的變異權(quán)重參數(shù)(variable importance in projection,VIP)值大于1,進(jìn)行差異性代謝物的篩選。差異性代謝物根據(jù)保留時(shí)間及質(zhì)荷比在Fiehn代謝組數(shù)據(jù)庫(kù)進(jìn)行注釋,對(duì)篩選出的差異代謝物進(jìn)行KEGG注釋,檢索出差異代謝物映射的所有通路,然后通過(guò)富集分析和拓?fù)浞治鰧?duì)差異代謝物所在的通路進(jìn)一步篩選,找到與代謝物差異相關(guān)性最高的關(guān)鍵通路。
代謝物通過(guò)Fiehn數(shù)據(jù)庫(kù)進(jìn)行定性,五常地區(qū)共檢測(cè)出127 個(gè)代謝物,查哈陽(yáng)地區(qū)共檢測(cè)出142 個(gè)代謝物。兩產(chǎn)地相比較,同時(shí)存在的代謝物有102 個(gè),五常稻米特有代謝物25 個(gè),查哈陽(yáng)稻米特有代謝物40 個(gè)。代謝物定性結(jié)果如表1所示。
表1 代謝物定性結(jié)果Table 1 Qualitative results of metabolites in rice
續(xù)表1
續(xù)表1
續(xù)表1
由表1可知,兩產(chǎn)地共定性出包括氨基酸及其衍生物、脂肪酸及其衍生物、有機(jī)酸、糖類及其衍生物、固醇類及其他類物質(zhì)代謝物167 種;其中其他類物質(zhì)多為醇、烷、腈以及少部分生物活性物質(zhì)。兩產(chǎn)地特有的代謝物相比較,查哈陽(yáng)特有代謝物中糖類物質(zhì)和其他代謝物所占比例顯著高于五常,兩產(chǎn)地特有的代謝物的氨基酸和脂肪酸類所占比例均較少,查哈陽(yáng)包含種類略低于五常;此外五常代謝物中含有亮氨酸等必需氨基酸,而查哈陽(yáng)未檢測(cè)出必需氨基酸物質(zhì);查哈陽(yáng)的特有代謝物中包含一種固醇類代謝物二氫膽固醇,而五常地區(qū)的特有代謝物無(wú)固醇類代謝物。由此說(shuō)明,相同品種的稻米,由于產(chǎn)地不同,其代謝物組分的種類和含量也具有一定的差異,代謝物的組成和含量是影響稻米風(fēng)味品質(zhì)的重要指標(biāo)之一[19]。
圖1 查哈陽(yáng)與五常地區(qū)樣本的PCA模型得分散點(diǎn)圖Fig. 1 Score scatter plot of PCA model for rice samples from Chahayang and Wuchang
PCA能夠直觀顯示樣本間的分組、變化趨勢(shì)和相似性關(guān)系,但差異變量會(huì)分布在各PC上,無(wú)法在后面的分析中將其剔除做更準(zhǔn)確的分析。而OPLS-DA是多元統(tǒng)計(jì)分析方法中一種常用的有監(jiān)督的分析方法,釆用偏最小二乘法對(duì)高維數(shù)據(jù)降維,然后再用線性判別,可除去代謝物中與分類變量不相關(guān)的正交變量,這樣不但實(shí)現(xiàn)了數(shù)據(jù)的可視化,而且取得了較好的后期判別效果[20]。
圖2 查哈陽(yáng)對(duì)五常地區(qū)樣本的OPLS-DA模型得分散點(diǎn)圖Fig. 2 Score scatter plot of OPLS-DA model for rice samples from Chahayang and Wuchang
圖3 查哈陽(yáng)地區(qū)對(duì)五常地區(qū)樣本的OPLS-DA模型的置換檢驗(yàn)結(jié)果Fig. 3 Permutation test of OPLS-DA model for rice samples from Chahayang and Wuchang
如圖3所示,R2和Q2的回歸線與橫坐標(biāo)交叉或者小于0,說(shuō)明評(píng)估模型可靠有效[22]。R2代表Y變量的可解釋性,Q2代表模型的可預(yù)測(cè)性,原模型比較接近1,說(shuō)明建立的模型比較符合樣本數(shù)據(jù)的真實(shí)情況;原模型Q2大于0.5證明原模型可以較好地解釋2 組樣本之間的差異[23]。Q2于Y軸的截距是負(fù)值,且置換檢驗(yàn)得到的R2=-0.13和Q2=-0.99均小于OPLS-DA置換檢驗(yàn)中和Q2的原始值,由此可得此模型無(wú)過(guò)擬合現(xiàn)象。
篩選兩產(chǎn)地間稻米差異代謝物的標(biāo)準(zhǔn)為OPLS-DA模型主成分的VIP值大于1且t檢驗(yàn)的P值小于0.05,結(jié)合Fiehn數(shù)據(jù)庫(kù)通過(guò)保留時(shí)間等條件與庫(kù)中物質(zhì)進(jìn)行匹配,從而進(jìn)行兩產(chǎn)地稻米差異代謝物的定性,如表2所示。
差異代謝物是兩產(chǎn)地同時(shí)存在的,但是含量上存在顯著差異。查哈陽(yáng)與五常稻米代謝物對(duì)比,共篩選出32 個(gè)差異代謝物,多數(shù)為糖類以及糖類的衍生物,還有少量有機(jī)酸、氨基酸、脂肪酸、固醇類及其他類物質(zhì)。由表2可知,這32 個(gè)差異物質(zhì)中,查哈陽(yáng)稻米樣本中有13 個(gè)代謝物的含量低于五常,這些物質(zhì)多數(shù)屬于其他類物質(zhì),主要為生物活性物質(zhì)酚類、醇類、腈類等;也包括少數(shù)的脂肪酸。查哈陽(yáng)稻米樣本中有19 個(gè)代謝物的含量高于五常,這些物質(zhì)多數(shù)為糖類及糖類的衍生物,倍性變化在0.34~2.44 倍之間。研究表明適宜的溫度和充足光照有益于稻米強(qiáng)勢(shì)籽粒的生長(zhǎng),而強(qiáng)勢(shì)籽粒會(huì)提早進(jìn)入淀粉糖快速累積的時(shí)期,使干物質(zhì)積累多,可塑溶解的雙鏈糖含量高,從而對(duì)稻米中糖類物質(zhì)的含量和成分有較大的影響[24-25]。查哈陽(yáng)地區(qū)屬于寒溫帶大陸季風(fēng)氣候,日照時(shí)數(shù)為2 773 h,而五常地區(qū)屬于中溫帶大陸性季風(fēng)氣候,日照時(shí)數(shù)為2 629 h,不同的氣候條件可能是導(dǎo)致查哈陽(yáng)稻米中糖類含量高于五常的主要原因。此外查哈陽(yáng)地理標(biāo)志稻米保護(hù)區(qū)的土壤類型以草甸黑鈣土為主,具有疏松、肥沃、種植強(qiáng)度低的特點(diǎn),而五常地理標(biāo)志稻米保護(hù)區(qū)以層厚,基礎(chǔ)肥力高的黑土為主,不同土壤的土壤水勢(shì)對(duì)稻米代謝物的影響也會(huì)有較大差異[26]。
表2 差異代謝物定性結(jié)果Table 2 Qualitative results of differential metabolites
如圖4所示,五常樣本前13 個(gè)代謝物的表達(dá)量明顯高于查哈陽(yáng)樣本代謝物的表達(dá)量,多數(shù)為酚類、醇類、萜類等物質(zhì),13 個(gè)代謝物中檢測(cè)出一個(gè)數(shù)據(jù)庫(kù)中檢索不到的未知物,該未知物在代謝通路中表達(dá)量和其余12 個(gè)已知物具有相似的高表達(dá),故推斷該未知物的結(jié)構(gòu)也屬于酚類、醇類、萜類等物質(zhì)。剩余的19 個(gè)差異代謝物的表達(dá)量查哈陽(yáng)明顯高于五常,這19 個(gè)差異代謝物多數(shù)為糖以及糖的衍生物,如左旋葡聚糖、半乳糖醇5、異麥芽酮糖醇、1,5-脫水葡萄糖醇等,可見(jiàn)查哈陽(yáng)稻米可為人體提供更多的碳水化合物;此外查哈陽(yáng)地區(qū)稻米的異亮氨酸、瓜氨酸等必需氨基酸的表達(dá)量也較高。通過(guò)層次聚類分析可以看出,產(chǎn)地對(duì)稻米中各類代謝物的含量具有顯著影響,而差異代謝物是眾多代謝物中因產(chǎn)地不同而導(dǎo)致含量變化顯著的物質(zhì),則差異代謝物對(duì)于稻米產(chǎn)地鑒別具有一定的參考意義。
植物在生長(zhǎng)過(guò)程中需要經(jīng)過(guò)多種物質(zhì)和反應(yīng)共同調(diào)控,是十分復(fù)雜的代謝過(guò)程,并不能從某一種物質(zhì)的含量高低進(jìn)行整體判斷,因此需進(jìn)一步對(duì)其代謝通路進(jìn)行分析。通過(guò)京都基因與基因組百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes,KEGG)中的Pathway數(shù)據(jù)庫(kù),共檢索到差異代謝物參與的18 條代謝通路,分別為類固醇生物合成、次生代謝物的生物合成、檸檬酸循環(huán)、脂肪酸生物合成、氧化磷酸化、精氨酸生物合成、嘧啶代謝、丙氨酸、天冬氨酸和谷氨酸代謝、酪氨酸代謝、苯丙氨酸代謝、β-丙氨酸代謝、丙酮酸代謝、丁酸鹽代謝、煙酸鹽和煙酰胺代謝、泛酸鹽和CoA生物合成、倍半萜和三萜生物合成、碳代謝。
將上述篩選鑒定的差異代謝物匹配信息后,利用對(duì)應(yīng)物種的通路數(shù)據(jù)庫(kù)對(duì)其進(jìn)行富集分析和拓?fù)浣Y(jié)構(gòu)分析,根據(jù)代謝通路的濃縮,識(shí)別出可能的受生物擾動(dòng)的代謝通路[27]。首先,通過(guò)差異代謝物對(duì)KEGG、PubChem等權(quán)威代謝物數(shù)據(jù)庫(kù)進(jìn)行映射,映射出5 個(gè)物質(zhì),脲基丙酸、角鯊烯、膽固醇、月桂酸、反丁烯二酸,且均為精確匹配。對(duì)差異代謝物和通路進(jìn)行相關(guān)性分析,得到多條相關(guān)通路。根據(jù)-lnP值和Impact值綜合分析,篩選出最為顯著的9 條代謝通路,如表3所示。
表3 代謝通路分析Table 3 Metabolic pathway analysis
圖4 查哈陽(yáng)與五常地區(qū)樣本的層次聚類分析熱圖Fig. 4 Heatmap of hierarchical clustering analysis for rice samples from Chahayang and Wuchang
對(duì)差異代謝物參與的代謝通路分析,共發(fā)現(xiàn)9 條關(guān)鍵通路,關(guān)鍵通路與代謝物差異相關(guān)性較高,見(jiàn)表3??梢园l(fā)現(xiàn)這9 條通路多數(shù)為氨基酸代謝,則說(shuō)明產(chǎn)地對(duì)稻米代謝中的氨基酸代謝具有一定影響。而這9 條通路映射的代謝物有5 個(gè),月桂酸主要參與氨基酸代謝、反丁烯二酸主要參與糖代謝,角鯊烯和膽固醇主要參與固醇代謝,此外角鯊烯也可參與合成皂苷類物質(zhì)代謝途徑和合成植物甾醇類物質(zhì)途徑等[28],同一代謝物同時(shí)參與多條代謝通路,說(shuō)明映射出的差異代謝物對(duì)通路影響較大。
圖5 查哈陽(yáng)對(duì)五常地區(qū)樣本的通路分析圖Fig. 5 Pathway analysis for Chahayang versus Wuchang rice samples
如圖5所示,氣泡代表代謝通路,氣泡顏色越深P值越小,富集程度越顯著;氣泡大小表示影響因子大小,氣泡越大影響因子越大。類固醇生物合成處的氣泡顏色最深、氣泡相對(duì)較大,說(shuō)明產(chǎn)地不同,對(duì)稻米中固醇類物質(zhì)的影響最顯著,角鯊烯和膽固醇是該通路中重要的代謝物。已有研究表明脂類化合物的含量是影響米飯可口性和米飯光澤的主要因素[13,29],而固醇類物質(zhì)屬于脂類物質(zhì),產(chǎn)地差異對(duì)稻米食味品質(zhì)具有較大影響。β-丙氨酸代謝、泛酸鹽和輔酶A生物合成2 個(gè)通路氣泡都較大,說(shuō)明2 個(gè)代謝途徑對(duì)稻米代謝的影響也較大。其次是檸檬酸循環(huán),該代謝途徑是糖、脂肪、蛋白質(zhì)3 種主要有機(jī)物質(zhì)徹底氧化的共同代謝途徑。而月桂酸主要參與的脂肪酸代謝的影響因子和富集程度相對(duì)較小,通常以其含量評(píng)價(jià)稻米的蛋白質(zhì)質(zhì)量[30]。由代謝通路結(jié)果可知,查哈陽(yáng)與五常2 個(gè)產(chǎn)區(qū)的稻米,在代謝中最大的差異是類固醇生物合成代謝過(guò)程,而對(duì)脂肪酸代謝影響也較大,則說(shuō)明脂類物質(zhì)受產(chǎn)地環(huán)境的影響較大[31-32],同時(shí),氨基酸代謝通路在產(chǎn)地差異中相關(guān)性也很高,說(shuō)明產(chǎn)地對(duì)稻米中脂類物質(zhì)及氨基酸類物質(zhì)的影響較大,但其受產(chǎn)地影響的機(jī)理目前尚不明確。
GC-MS的代謝組學(xué)技術(shù)研究產(chǎn)地對(duì)稻米代謝產(chǎn)物的影響具有可行性。結(jié)果表明,產(chǎn)地對(duì)稻米中代謝物的數(shù)量、種類及含量均具有影響,其中種類和含量的差異較顯著,查哈陽(yáng)稻米中的糖類、氨基酸、脂肪酸含量均高于五常稻米,相比較而言,查哈陽(yáng)稻米的食味品質(zhì)可能更好一些。兩產(chǎn)地對(duì)比共篩選出含量顯著變化的差異代謝物32 個(gè),其中查哈陽(yáng)稻米樣本中有13 個(gè)代謝物的含量低于五常,主要為酚類、醇類、腈類、脂肪酸等;查哈陽(yáng)稻米樣本中有19 個(gè)代謝物含量高于五常地區(qū),這些物質(zhì)多數(shù)為糖類及糖類的衍生物。產(chǎn)地不同,不同種類代謝物的含量存在顯著差異,則差異代謝物可作為稻米產(chǎn)地區(qū)分的參考物質(zhì)。代謝通路分析發(fā)現(xiàn),產(chǎn)地對(duì)稻米中脂類物質(zhì)及氨基酸類物質(zhì)的代謝具有顯著影響,角鯊烯、膽固醇、脲基丙酸、反丁烯二酸和月桂酸是關(guān)鍵代謝物質(zhì)。