羅 珺,劉友林,肖侑仙,趙詩文,王 偉
(1.大連海事大學(xué),遼寧 大連 116026;2.大連圣亞海洋生物研究所,遼寧 大連 116023;3.大連海洋大學(xué),遼寧 大連 116023)
海獅(Otarriinae)屬哺乳綱鰭足目海獅科[1],全世界均有分布,多數(shù)生活在寒帶海洋中。海獅以魚、烏賊、貝類等為食,繁殖時(shí)期到海島上產(chǎn)仔。大部分海獅的身體上都長有濃密的短毛,下面還有一層薄層的絨毛;但是各種海獅的毛色深淺并不一致,主要為黃褐色和褐色;海獅具有明顯的尾巴,但都較短;有的海獅種類頸部有長毛,類似獅子的鬃毛,得名海獅[2]。
非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)前處理與其他組學(xué)及其他學(xué)科一樣,將數(shù)據(jù)處理成方便后續(xù)統(tǒng)計(jì)分析、數(shù)據(jù)挖掘的格式,數(shù)據(jù)前處理過程是連接搜庫軟件定性定量分析和生物學(xué)意義挖掘(如蛋白質(zhì)間相互作用、通路富集等)分析的中間環(huán)節(jié),包括數(shù)據(jù)評(píng)估(穩(wěn)定性分析、缺失模式分析、變異分析、相關(guān)性分析、聚類分析)、數(shù)據(jù)清洗(低質(zhì)量樣本清洗、異常樣本清洗)、數(shù)據(jù)增強(qiáng)(數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)校正、缺失值填補(bǔ))等。非標(biāo)記定量蛋白組學(xué)數(shù)據(jù)經(jīng)過上述數(shù)據(jù)前處理過程后,后續(xù)經(jīng)差異表達(dá)分析等得出的結(jié)論具有足夠的可信度。非標(biāo)記定量技術(shù)對(duì)液相色譜串聯(lián)質(zhì)譜的重復(fù)性和穩(wěn)定性要求較高,不用借助成本較高的同位素標(biāo)簽,試驗(yàn)耗費(fèi)少,前處理操作過程不繁瑣,這樣使樣品最接近原始狀態(tài),且不受樣品條件、樣品數(shù)的限制,可用于大規(guī)模樣品數(shù)量檢測(cè)[3]。
本研究根據(jù)大樣本非標(biāo)記定量蛋白組學(xué)數(shù)據(jù)的特征,為這類數(shù)據(jù)選取了適用的數(shù)據(jù)前處理方法,包括數(shù)據(jù)質(zhì)量評(píng)估方法、質(zhì)譜定量蛋白組學(xué)領(lǐng)域經(jīng)典數(shù)據(jù)前處理方法及其他組學(xué)領(lǐng)域成熟的數(shù)據(jù)前處理方法、前處理效果評(píng)估方法等。最終經(jīng)過方法選取、編寫及整合,制作R工具包preprocessor。此工具包可助力研究者掌握試驗(yàn)數(shù)據(jù)概況,從而選取適用的數(shù)據(jù)校正及缺失值填補(bǔ)等數(shù)據(jù)前處理方法,并最終控制大樣本非標(biāo)記定量蛋白組學(xué)數(shù)據(jù)質(zhì)量,使后續(xù)分析更加可行可信。本研究應(yīng)用非標(biāo)記定量蛋白組學(xué)方法鑒定毛皮海獅種間的蛋白差異,對(duì)差異蛋白進(jìn)行GO富集分析、KEGG通路富集分析及差異蛋白的生物信息學(xué)分析,為病情診斷、預(yù)防及治療探索潛在的靶點(diǎn),現(xiàn)報(bào)道如下。
非澳毛皮海獅(Non-Arctocephaluspusillus)、南美毛皮海獅(Arctocephalusaustralis)、智利毛皮海獅(Arctocephalusphilippi),均由大連圣亞海洋世界提供,并且所有毛皮海獅個(gè)體健康狀況均良好。
SDS裂解液、BCA試劑盒、質(zhì)譜級(jí)水、乙腈、預(yù)制膠、PMSF(Amresco);DTT、EDTA·2Na、甲醇、蔗糖、醋酸銨、甘油、溴酚藍(lán)、TFA、IAA、十二水合磷酸氫二鈉、一水合磷酸二氫鈉、NaCl、Tris-HCl(pH值6.8,8.8)、APS、TEMED、Tris;甘氨酸、SDS、磷酸;丙酮、胰酶、TEAB、無水乙醇、異丙醇、甲酸(CNW);Tris-平衡酚。
磷酸鹽緩沖液(PBS):十二水合磷酸氫二鈉(Na2HPO4·12H2O)3.835 g,一水合磷酸二氫鈉(NaH2PO4·H2O)0.715 g,NaCl 1.051 g,加ddH2O定容至250 mL,待充分溶解之后調(diào)pH值至7.2。2×loading buffe儲(chǔ)存液(10 mL):5 mmol/L Tris-HCl 1.45 mL,甘油2 mL,10%SDS 3 mL,DTT 1 g,0.1%溴酚藍(lán)400 μL,加ddH2O定容至15 mL。二硫蘇糖醇溶液:稱取192.5 mg DTT,溶于50 mL去離子水中,混勻后分裝為200 μL/管,并于-20 ℃保存。碘乙酰胺溶液:快速稱取90 mg碘乙酰胺粉末,轉(zhuǎn)移到用錫紙包裹的15 mL離心管中,用3 mL去離子水混勻至溶解,定容到5 mL,避光保存。酚法抽提液:蔗糖2.2 g,NaCl 0.038 g,EDTA·2Na 0.163 g,DTT 0.02 g,0.5 mol/L Tris-HCl 2.5 mL,0.5 mol/L Tris-HCl 2.5 mL,然后加ddH2O定容至10 mL,充分溶解混勻。
以上試劑與用品均由大連圣亞海洋生物研究所采買和配制。
選取健康狀況良好的非澳毛皮海獅、南美毛皮海獅和智利毛皮海獅個(gè)體,分別剪取其胡須約2 g,取樣后置于-80 ℃冰箱冷凍保存。將冷凍的樣品取出,加入液氮,充分研磨。毛皮海獅胡須樣品信息見表1。
表1 毛皮海獅胡須樣品信息
取適量毛皮海獅胡須樣品粉末,置于2 mL離心管中,加入500 μL酚抽提取液、蛋白酶抑制劑(PMSF)調(diào)制終濃度為1 mmol/L。加入相同體積的酚-Tris-HCl飽和溶液,4 ℃混合30 min,并多次搖晃混勻。4 ℃離心10 min,并收集酚上層液。加入5倍體積的預(yù)冷0.1 mol/L醋酸銨-甲醇溶液,-20 ℃條件下進(jìn)行沉淀。4 ℃離心10 min,收集沉淀。收集后的沉淀物加入5倍體積的甲醇進(jìn)行清洗,混合。4 ℃離心10 min,收集沉淀。所獲取的上清液即為總蛋白溶液,用于蛋白濃度測(cè)定并分裝、儲(chǔ)存于-80 ℃冰箱,備用[4]。每種樣品均重復(fù)3次。
一般情況下,蛋白提取選用普通的蛋白裂解液、冰上裂解等。但是對(duì)于極易受環(huán)境影響的蛋白,選擇超強(qiáng)效蛋白裂解液,并且在低氧培養(yǎng)箱(37 ℃)中快速裂解效果更好。毛皮海獅胡須樣品蛋白濃度測(cè)定采用BCA蛋白濃度測(cè)定方法。BCA與硫酸銅等其他試劑組成的試劑混合在一起,即呈蘋果綠,為BCA試劑[5-6]。將待測(cè)毛皮海獅胡須樣品蛋白溶液加入96孔板,每個(gè)樣品設(shè)置3個(gè)復(fù)孔。首先于各孔內(nèi)加入150 μL顯色液,37 ℃條件下反應(yīng)30 min。然后利用酶標(biāo)儀測(cè)定溶液吸光度值。再根據(jù)標(biāo)準(zhǔn)蛋白溶液的已知濃度和吸光度值繪制標(biāo)準(zhǔn)曲線,將待測(cè)樣品的吸光度值代入標(biāo)準(zhǔn)曲線,計(jì)算得到毛皮海獅胡須樣品蛋白濃度。
胰蛋白酶是蛋白質(zhì)譜分析中應(yīng)用最廣泛的蛋白酶,主要從豬或牛胰腺中獲得,易于純化,一般用其進(jìn)行樣品的酶解[7]。當(dāng)溶液中存在尿素或胍鹽時(shí)水解反應(yīng)無法進(jìn)行,因?yàn)橐鹊鞍酌缸陨碜鳛橐环N蛋白質(zhì)會(huì)變性,失去酶活性。因此,尿素或胍鹽必須通過離子交換或滲析去除或?qū)舛冉档椭? mol/L以下。毛皮海獅胡須樣品蛋白酶解后肽段采用96孔板脫鹽。
采用聚丙烯酰胺凝膠電泳法對(duì)毛皮海獅胡須樣品總蛋白進(jìn)行電泳,步驟為灌膠與上樣、電泳、染色、脫色。脫色后參照參考文獻(xiàn)[8]的方法用成像儀成像。
HPLC是在經(jīng)典的液相色譜法基礎(chǔ)上發(fā)展起來的,其以液體作為流動(dòng)相,并采用顆粒極細(xì)的高效固定相的柱色譜分離技術(shù)。毛皮海獅胡須樣品總蛋白以300 nL/min的流速于分析柱上樣,進(jìn)行梯度洗脫操作過程。其后質(zhì)譜條件設(shè)定為全掃描,質(zhì)核比范圍為350~650 m/z,對(duì)其中10個(gè)最高峰進(jìn)行MS/MS掃描[9]。
毛皮海獅胡須樣品總蛋白LC-MS/MS原始文件導(dǎo)入Maxquant庫進(jìn)行搜索,并進(jìn)行非標(biāo)定量分析[10]。根據(jù)峰形錯(cuò)配情況,毛皮海獅胡須樣品總蛋白搜庫條件以假陽性率來控制。物種數(shù)據(jù)庫提供了目標(biāo)序列信息,可以通過過濾掉反庫和常見污染蛋白庫來剔除不符合分析標(biāo)準(zhǔn)的空值。具體搜庫參數(shù)設(shè)置見表2。
表2 質(zhì)譜檢索參數(shù)
利用數(shù)據(jù)庫檢索得到原始數(shù)據(jù),保留任意一組毛皮海獅胡須樣品總蛋白有表達(dá)值占比≥50%的蛋白。缺失值≤50%的蛋白用同組樣本均值填充,得到可信蛋白。對(duì)可信蛋白進(jìn)行樣品相關(guān)性分析。
根據(jù)可信的表達(dá)定量數(shù)據(jù)計(jì)算毛皮海獅胡須樣品總蛋白之間的歐氏距離(euclidean distance),然后對(duì)樣品距離矩陣進(jìn)行層次聚類,從而繪制出樣品歐氏距離的層次聚類樹狀圖[11-12]。
在利用非標(biāo)記定量技術(shù)所得可信蛋白基礎(chǔ)上,選取兩個(gè)標(biāo)準(zhǔn)計(jì)算毛皮海獅胡須樣品總蛋白間的差異。使用Foldchange手段對(duì)毛皮海獅胡須樣品總蛋白中的某一蛋白在樣品間的表達(dá)水平變化倍數(shù)進(jìn)行評(píng)估,利用t檢驗(yàn)計(jì)算P值,以直觀展現(xiàn)毛皮海獅胡須樣品總蛋白間差異的顯著程度[13]。其中差異篩選條件為FC(Foldchange)為1.5倍且P值小于0.05,同時(shí)FC為0和FC為inf都屬于“有無”差異狀態(tài);通過對(duì)比3種毛皮海獅胡須樣品差異表達(dá)蛋白的統(tǒng)計(jì)情況,來展示毛皮海獅差異表達(dá)蛋白整體分布情況。
通過非標(biāo)記定量技術(shù)得到毛皮海獅胡須樣品總蛋白差異表達(dá)蛋白,對(duì)毛皮海獅胡須樣品總蛋白差異蛋白進(jìn)行富集分析,對(duì)其功能進(jìn)行描述[14]。利用差異蛋白表達(dá)分析與GO富集分析結(jié)果繪制和弦圖。
毛皮海獅胡須蛋白標(biāo)準(zhǔn)品吸光度及濃度見表3。
表3 毛皮海獅胡須蛋白標(biāo)準(zhǔn)品吸光度及濃度
以O(shè)D562為橫坐標(biāo)、毛皮海獅胡須標(biāo)準(zhǔn)蛋白濃度為縱坐標(biāo)制作標(biāo)準(zhǔn)曲線圖,求出回歸方程,即標(biāo)準(zhǔn)曲線,結(jié)果見圖1。
圖1 毛皮海獅胡須樣品總蛋白蛋白定量標(biāo)準(zhǔn)曲線
毛皮海獅待測(cè)樣品吸光度及濃度見表4。
毛皮海獅胡須樣品SDS-PAGE測(cè)定結(jié)果見圖2,樣品蛋白條帶分布均勻,重復(fù)性好。
注:Marker為蛋白質(zhì)Marker,起特異性標(biāo)記作用。
毛皮海獅胡須樣品總蛋白經(jīng)LC-MS/MS檢測(cè)、搜庫后,蛋白定性定量統(tǒng)計(jì)結(jié)果見表5。
表5 基本鑒定結(jié)果統(tǒng)計(jì)
可信蛋白樣品的相關(guān)性分析結(jié)果見圖3。
注:圖中,上三角形(對(duì)角線的右上方),數(shù)字表示兩個(gè)樣品的相關(guān)性值,*表示顯著程度(*為P<0.05,**為P<0.01,***為P<0.001);下三角形(對(duì)角線的左下方),給出了兩個(gè)樣品表達(dá)值的散點(diǎn)圖,曲線為擬合趨勢(shì),斜率越大兩樣品間相關(guān)性越強(qiáng)。
通過圖3可以看出,南美毛皮海獅胡須蛋白與智利毛皮海獅胡須蛋白樣品間斜率相近,兩者種間相關(guān)性趨于擬合,說明相關(guān)性強(qiáng);同時(shí)發(fā)現(xiàn)非澳毛皮海獅與其他兩種毛皮海獅相關(guān)性相對(duì)較弱。通過樣品相關(guān)性圖中各樣品對(duì)角線視圖發(fā)現(xiàn),南美毛皮海獅和智利毛皮海獅胡須樣品總蛋白Z1自身表達(dá)量分布均勻,而非澳毛皮海獅分布相對(duì)不均勻。
智利毛皮海獅樣品Z1與南美毛皮海獅樣品N1具有相似的表達(dá)特征,而非澳毛皮海獅樣品F1歐氏距離與兩者相對(duì)較遠(yuǎn),表達(dá)特征不相近,見圖4。
注:每個(gè)分支末端表示一個(gè)樣品,聚在同一個(gè)分支內(nèi)的樣品被認(rèn)為是表達(dá)特征相似或接近的樣品,沒有聚到同一個(gè)分支的樣品可以認(rèn)為是特征不相似或不接近的樣品,具體可以根據(jù)縱坐標(biāo)的歐氏距離來衡量。
3種毛皮海獅胡須樣品差異表達(dá)蛋白見表6和圖5。
圖5 樣品差異蛋白統(tǒng)計(jì)圖
表6 樣品差異蛋白統(tǒng)計(jì)
根據(jù)毛皮海獅胡須樣品總蛋白差異蛋白統(tǒng)計(jì)圖可以看出:Z1與F1存在175種差異蛋白,其中41種蛋白質(zhì)表達(dá)上調(diào),134種蛋白質(zhì)表達(dá)下調(diào)。Z1與N1共有70種差異蛋白,其中52種蛋白質(zhì)表達(dá)上調(diào),18種蛋白質(zhì)表達(dá)下調(diào)。F1與N1共有162種差異蛋白,其中144種蛋白質(zhì)表達(dá)上調(diào),18種蛋白質(zhì)表達(dá)下調(diào)。智利毛皮海獅胡須樣品總蛋白Z1與南美毛皮海獅胡須樣品總蛋白N1樣品蛋白差異不明顯,非澳毛皮海獅胡須樣品總蛋白F1與其他兩種毛皮海獅胡須樣品總蛋白差異明顯。
毛皮海獅胡須樣品總蛋白F1、N1、Z1間GO富集分析和弦圖,所選的GO term和相應(yīng)差異蛋白列表之間的關(guān)系見圖6~8。
注:左面為蛋白、基因名,右面為所選GO term,紅色表示上調(diào),藍(lán)色表示下調(diào)。
根據(jù)毛皮海獅胡須樣品總蛋白間GO富集分析和弦圖可以看出,智利毛皮海獅胡須樣品總蛋白Z1與南美毛皮海獅樣品N1樣品GO富集分析和弦圖差異不明顯,非澳毛皮海獅胡須樣品總蛋白蛋白F1與其他兩種毛皮海獅胡須樣品總蛋白GO富集分析和弦圖差異明顯。
目前,已經(jīng)有一系列配套的非標(biāo)記定量分析軟件,其中包括GE公司開發(fā)的DeCyder MSTM軟件[15]及蛋白質(zhì)組學(xué)定性定量算法Max Quant[10]。運(yùn)用這些軟件對(duì)液相色譜串聯(lián)質(zhì)譜數(shù)據(jù)非標(biāo)記定量分析,是將質(zhì)譜數(shù)據(jù)由譜峰形式轉(zhuǎn)化為直觀、類似雙向凝膠的圖譜,再比較不同樣本上相應(yīng)肽段的強(qiáng)度,從而對(duì)肽段對(duì)應(yīng)的蛋白進(jìn)行相對(duì)定量[16]。因?yàn)槠溆泻芎玫亩繙?zhǔn)確性和可信性,目前已經(jīng)逐漸成為蛋白組學(xué)領(lǐng)域內(nèi)的標(biāo)準(zhǔn)解決方案。
通過皮毛海獅胡須樣品蛋白相關(guān)性分析、聚類樹狀圖分析、差異蛋白統(tǒng)計(jì)圖分析、GO富集結(jié)果分析發(fā)現(xiàn):智利毛皮海獅與南美毛皮海獅胡須蛋白相關(guān)性相對(duì)較強(qiáng),間接表明二者有相對(duì)近緣關(guān)系;智利毛皮海獅樣品總蛋白Z1與南美毛皮海獅樣品總蛋白N1具有相似的表達(dá)特征,而非澳毛皮海獅樣品總蛋白F1歐氏距離與兩者相對(duì)較遠(yuǎn),表達(dá)特征不相近。智利毛皮海獅樣品可信蛋白表達(dá)定量與南美毛皮海獅胡須樣品接近。通過計(jì)算毛皮海獅胡須樣品間差異蛋白,評(píng)估毛皮海獅蛋白間的表達(dá)水平變化倍數(shù),經(jīng)檢驗(yàn)計(jì)算毛皮海獅胡須蛋白樣品間差異的顯著程度,發(fā)現(xiàn)非澳毛皮海獅與南美毛皮海獅間差異表達(dá)蛋白較為顯著。結(jié)合可信蛋白樣品相關(guān)性分析結(jié)果,說明兩者親緣關(guān)系較遠(yuǎn)。綜上,通過蛋白組學(xué)非標(biāo)記定量技術(shù)可以初步判斷,智利毛皮海獅與南美毛皮海獅親緣關(guān)系較近,可能為毛皮海獅不同的亞種。非澳毛皮海獅與其他兩者毛皮海獅親緣關(guān)系較遠(yuǎn)。結(jié)合外部形態(tài)特征差異,非澳毛皮海獅與其他兩種毛皮海獅間有相對(duì)明顯的遺傳差異,為海獅科海狗屬的種,南美毛皮海獅與智利毛皮海獅差異相對(duì)不顯著,可能為不同亞種。
綜上所述,針對(duì)目前毛皮海獅種群資源稀缺,本研究通過前期飼養(yǎng)試驗(yàn),摸索出一套毛皮海獅的健康飼養(yǎng)模式,同時(shí)基于非標(biāo)記定量技術(shù)(label-free)對(duì)毛皮海獅進(jìn)行蛋白組學(xué)研究,分析了其種間差異和近緣關(guān)系。所獲結(jié)果可為毛皮海獅的健康飼養(yǎng)提供數(shù)據(jù)參考,同時(shí)為毛皮海獅的遺傳學(xué)研究提供理論依據(jù)。另外,在毛皮海獅的整體飼養(yǎng)過程中,發(fā)現(xiàn)智利毛皮海獅與南美毛皮海獅外部形態(tài)、體色局部略有差異,行為習(xí)性也有差別,可能是在不同自然區(qū)域分布的不同亞種。因此利用蛋白分析組學(xué)、形態(tài)學(xué)和行為學(xué)等來鑒定毛皮海獅種間差異和遺傳多樣性的方法仍需要更為深入的研究。