潘好遠, 戴曉婷, 胡乃娜, 曾啟繁,2**
(1. 中國海洋大學(xué)海洋生命學(xué)院, 海洋生物遺傳學(xué)與育種教育部重點實驗室, 山東 青島 266003;2. 青島海洋科學(xué)與技術(shù)試點國家實驗室, 海洋漁業(yè)科學(xué)與食物產(chǎn)出過程功能實驗室, 山東 青島 266237)
Smad蛋白介導(dǎo)由TGF-β超家族誘導(dǎo)的信號轉(zhuǎn)導(dǎo),調(diào)節(jié)目的基因的轉(zhuǎn)錄,參與調(diào)節(jié)細胞增殖、分化、遷移、創(chuàng)傷和創(chuàng)傷修復(fù)等多種生理反應(yīng)[1-3]。果蠅蛋白Mad和線蟲蛋白Sma是Smad蛋白家族的原始形式[4],蟾蜍、小鼠、人類中均發(fā)現(xiàn)了與Mad和Sma類似的基因,這些TGF-β信號轉(zhuǎn)導(dǎo)基因被統(tǒng)一命名為Smad[5]。目前,哺乳動物中Smad基因家族包括8個成員,分別為Smad1,Smad2,Smad3,Smad4,Smad5,Smad6,Smad7,以及Smad8/9??梢苑譃槿箢悾菏荏w調(diào)節(jié)Smad(R-Smad)、通用性Smad(Co-Smad)和抑制型Smad(I-Smad),Smad蛋白含有高度保守的N端結(jié)構(gòu)域mad homologous domain1(MH1)和C端結(jié)構(gòu)域mad homologous domain2(MH2)[6]。目前,在基因結(jié)構(gòu)、序列方面對Smad基因家族的研究較多,此外在胚胎發(fā)生過程中的表達模式和作用機制等方面也有所研究[7-9]。該家族在脊椎動物的早期發(fā)育、原腸形成、造血、背腹軸形成中均發(fā)揮重要作用[10];Smad2/3在癌變和衰老過程中可以被TGF-β信號激活,從而起到重要作用[11-12]。
軟體動物是冠輪動物中較為特殊的門類,其具有高度多樣化的軀體形態(tài),是最早出現(xiàn)在化石記錄中的雙側(cè)對稱動物之一[13]。近年來,TGF-β信號通路和Smad基因家族在雙殼貝類中的功能受到越來越多的關(guān)注,多個TGF-β超家族配體以及I型、II型受體和Smad家族成員被克隆,劉剛等[14]在太平洋牡蠣(Crassostreagigas)中克隆了Smad1/5/8和Smad4基因并發(fā)現(xiàn)其參與了胚胎背部化、三胚層形成和貝殼發(fā)生等較重要的發(fā)育過程,郭慧慧[15]在櫛孔扇貝(Chlamysfarreri)中克隆Smad1、Smad3、Smad4、Smad6基因的全長cDNA序列,董迎輝[16]在泥蚶中克隆得到Smad3基因。通過上述研究可以推測貝類可能存在相似的TGF-β/Smad信號通路,且與生長發(fā)育密切相關(guān)[15, 17-18]。最近完成的幾個雙殼類基因組測序項目[19-21]為系統(tǒng)描述海洋雙殼類中重要的轉(zhuǎn)錄因子家族提供了寶貴的基因組和廣泛的轉(zhuǎn)錄組資源。蝦夷扇貝(Patinopectenyessoensis)在超過3億年的演化過程中基因組變化緩慢,保持了高度保守的核型與相對完整的古老基因家族[20]。因此,分析Smad基因家族在蝦夷扇貝中的序列特征,系統(tǒng)發(fā)生關(guān)系及時空表達模式,將為理解古老動物類群Smad基因家族的進化與功能研究提供參考。
在Swiss-Prot數(shù)據(jù)庫[22](版本號:2019_11)(https://www.uniprot.org/)中選取代表性無脊椎動物(果蠅(Drosophilamelanogaster)、牡蠣(C.gigas)、海葵(Nematostellavectensis)、線蟲(Caenorhabditiselegans)、海鞘(Cionaintestinalis)、水螅(Hydravulgaris)、海參(Strongylocentrotuspurpuratus))和脊椎動物(人(Homosapiens)、小鼠(Musmusculus)、斑馬魚(Daniorerio))的Smad蛋白序列進行蝦夷扇貝全基因組序列篩查,所有用到的蛋白序列Accession ID詳見表1。利用BLAST將Smad蛋白序列與蝦夷扇貝的轉(zhuǎn)錄組和基因組數(shù)據(jù)進行比對(e<1×10-5),最終得到蝦夷扇貝候選Smad基因。
實驗樣本采自青島市南區(qū)南山市場,在實驗室暫養(yǎng)3 d后,選取活力良好的個體解剖3只取其平滑肌、橫紋肌、血和鰓,液氮速凍后置于-80 ℃冰箱中保存。
采用傳統(tǒng)酚氯抽提法提取各組織的RNA,取1.5 μg RNA,加入1 μL Oligo dT(100 μmol/L)后,將體系用水補至12.5 μL?;靹蚝?,65 ℃溫育5 min。加入4 μL 5×Buffer、0.5 μL Recombinant RNase Inhibitor(40 U/μL)、2 μL dNTP(10 mmol/L)、1 μL反轉(zhuǎn)錄酶(200 U/μL)?;靹蚝螅?2 ℃ 90 min,72 ℃ 10 min,獲得反轉(zhuǎn)錄cDNA?;谖r夷扇貝轉(zhuǎn)錄組數(shù)據(jù)庫篩選得到的Smad基因cDNA序列設(shè)計引物(見表2),對其開放閱讀框(ORF)進行克隆驗證。以血液cDNA為模板,按Phusion高保真DNA聚合酶說明書進行擴增。采用瓊脂糖凝膠(1.5%)電泳檢測PCR產(chǎn)物,利用MinElute膠回收試劑盒回收目的片段。將回收片段連接到TEASY-BLUNT載體上,轉(zhuǎn)化DH5α感受態(tài)細胞,涂平板,37 ℃過夜。次日,挑取陽性克隆,經(jīng)菌落PCR檢測后,交由生工生物工程(上海)股份有限公司測序。
表1 Smad基因鑒定分析所用蛋白序列注冊號
表2 基因系克隆引物及熒光定量PCR引物列表
對蝦夷扇貝Smad基因序列進行分析,利用CDD[23]軟件預(yù)測分析蝦夷扇貝Smad蛋白序列的結(jié)構(gòu)域。使用IBS1.0.3[24]展示基因結(jié)構(gòu)和蛋白結(jié)構(gòu)。利用Compute pl/Mw tool[25]分析軟件,計算蝦夷扇貝Smad蛋白序列的分子重量及等電點。使用多重序列比對軟件Clustal W比對分析蝦夷扇貝等物種Smad蛋白的MH1,MH2結(jié)構(gòu)域序列,然后通過Genedoc[26]軟件進行可視化處理。
在NCBI中下載牡蠣(C.gigas)、水螅(H.vulgaris)、海葵(N.vectensis)基因組和蛋白組文件,根據(jù)前述方法進行Smad基因的鑒定,得到蛋白序列,此外在UniProt數(shù)據(jù)庫中下載人(H.sapiens)、小鼠(M.musculus)、斑馬魚(D.rerio)和果蠅(D.melanogaster)的Smad蛋白序列,一起用于系統(tǒng)發(fā)生樹的構(gòu)建。
導(dǎo)入MEGA7.0[27]軟件分別進行鄰接法(Neighbor-Joining)和最大似然法(Maximum Likelihood)構(gòu)建系統(tǒng)發(fā)生樹,Bootstrapping值設(shè)為1 000。將序列導(dǎo)入BEAST2[28]軟件中采用貝葉斯(Bayes)法構(gòu)建進化樹,分析進行了1億代,每10 000代進行一次采樣,前10 000個樣品丟棄,最后3種系統(tǒng)發(fā)生樹通過軟件iTOL[29]進行展示。
將課題組前期收集的各個發(fā)育時期(受精卵、2~8細胞、囊胚期、原腸胚期、擔輪幼蟲、D形幼蟲、殼頂幼蟲、匍匐幼蟲和稚貝)以及成體組織(橫紋肌、血、肝胰腺、眼、精巢、足、鰓、腎、外套膜、卵巢、平滑肌)轉(zhuǎn)錄組數(shù)據(jù)[20],在本地的服務(wù)器上進行運行和分析,用 STAR[30]軟件,以蝦夷扇貝基因組為參考序列,將轉(zhuǎn)錄組文庫序列進行比對,用Samtools[31]軟件處理比對結(jié)果件,用featureCounts[32]軟件根據(jù)已發(fā)表的基因組注釋信息[20]統(tǒng)計每個個體中每個基因的counts值,最后基因的表達量用FPKM(Fragments Per Kilobase of exon model per Million mapped fragments)表示,計算公式為:
為了檢測蝦夷扇貝早期發(fā)育時期Smad基因的表達模式,將FPKM值導(dǎo)入RNentropy[33]軟件來進行統(tǒng)計分析,多重測試校正方法采用BH(Benjamini-Hochberg)校正法。使用SPSS20.0[34]軟件,通過單因素方差分析(one-way ANOVA)檢測基因在各個組織平行樣品中的表達量差異。
根據(jù)蝦夷扇貝Smad基因序列設(shè)計熒光定量PCR引物,因為EF1A在扇貝各組織中穩(wěn)定表達[35-36],所以選擇其為內(nèi)參基因,熒光定量PCR引物見表2。
實時熒光定量PCR反應(yīng)體系如下:將cDNA稀釋成10 ng/μL后取2 μL作為模板,加入10 μL SYBY Green I Real-time PCR Master Mix,上、下游引物(2 μmol/L)各4 μL。使用LightCycler480實時熒光定量PCR儀(Roche)進行擴增。PCR反應(yīng)條件:94 ℃ 10 min;94 ℃ 15 s,60 ℃ 1 min,40個循環(huán);94 ℃ 15 s,1個循環(huán)。分析產(chǎn)物熔解曲線,檢驗引物特異性,并采用2-ΔΔCt方法計算目的基因的相對表達量。使用SPSS20.0[34]軟件,通過單因素方差分析(one-way ANOVA)檢測基因在各個組織中表達量差異顯著性。
通過對蝦夷扇貝全基因組范圍的篩查共鑒定得到4個Smad基因,根據(jù)系統(tǒng)聚類分析,它們分別是Smad3、Smad4、Smad5和Smad6。此外還通過基因克隆獲得了Smad基因的ORF區(qū)域,將克隆得到序列與篩查鑒定得到的Smad基因進行比對,Smad3克隆序列與基因組序列相似度達到99.92%、Smad4克隆序列與基因組序列相似度達到99.83%、Smad5克隆序列與基因組序列相似度達到99.57%,Smad6克隆序列與基因組序列相似度達到100%。
根據(jù)序列信息,繪制Smad家族基因的結(jié)構(gòu)如圖1?;蛉L方面差異較大,最長的Smad3基因達到69 385 bp,有8個外顯子;最短的Smad5基因,長13 057 bp,有6個外顯子。但Smad基因的開放讀碼框長度相對穩(wěn)定,長度都在1 000~2 000 bp,編碼氨基酸個數(shù)在360~580(見表3)。通過Smad蛋白序列在CDD上進行結(jié)構(gòu)域預(yù)測(見圖2),其具有N端結(jié)構(gòu)域MH1和C端結(jié)構(gòu)域MH2。Smad4和Smad5連接區(qū)還分別具有MADS和MED15結(jié)構(gòu)域。對蝦夷扇貝Smad蛋白的多序列比對發(fā)現(xiàn),4個Smad蛋白的結(jié)構(gòu)域同源性很高,MH2結(jié)構(gòu)域具有較高的保守性(見圖3)。
(粉色框:外顯子編碼區(qū);橘黃色框:MH1結(jié)構(gòu)域;紫色框:MH2結(jié)構(gòu)域;白線或雙斜線:內(nèi)含子。The pink boxes indicate the exons. The orange boxes indicate the mad homologous domain1 (MH1) domain. The purple boxes indicate the mad homologous domain2 (MH2) domain. The white horizontal lines with sporadic double slash indicate the introns.)
表3 蝦夷扇貝Smad基因家族序列特征
(橘黃色框:MH1結(jié)構(gòu)域;紫色框:MH2結(jié)構(gòu)域;粉色:MED15結(jié)構(gòu)域:藍色:MADS結(jié)構(gòu)域。The orange boxes indicate the mad homologous domain1 (MH1) domain.The purple boxes indicate the mad homologous domain2 (MH2) domain. The pink boxes indicate MED15 domain.The blue boxes indicate MADS domain.)
(橘黃色箭頭:MH1結(jié)構(gòu)域,藍色箭頭:MH2結(jié)構(gòu)域.The orange arrow indicates the mad homologous domain1 (MH1) domain.The blue arrow indicates the mad homologous domain2 (MH2) domain.)
應(yīng)用鄰接方法、最大似然方法以及貝葉斯方法得到的結(jié)果基本一致,均得到相似的拓撲結(jié)構(gòu)。在貝葉斯進化樹中Smad蛋白序列更清晰地分為3支,Co-Smad與R-Smad兩支之間節(jié)點支持率為100%。鄰接方法進化樹與貝葉斯方法進化樹更好地體現(xiàn)了Smad由后口動物向脊椎動物進化的過程。蝦夷扇貝基因組中保留了后口動物中完整的Smad家族亞群,在水螅中鑒定Smad1/5/8、Smad2/3以及Smad4三類蛋白,在??需b定出Smad1/5/8、Smad2/3、Smad4以及Smad6/7四類蛋白,在牡蠣中鑒定出Smad3、Smad4、Smad5以及Smad6四類蛋白(見圖4)。三種進化樹均顯示Smad可以分為3個主要亞族:R-Smad、Co-Smad和I-Smad,其中最大亞族R-Smad又分成介導(dǎo)TGF-β通路的R-Smad和介導(dǎo)BMP通路的R-Smad。蝦夷扇貝中Smad被分為4個亞族,Smad3、Smad4、Smad5、Smad6,分別聚到TGF-β通路R-Smad、Co-Smad、BMP通路R-Smad和I-Smad四個亞族中(見圖4)。脊椎動物Smad之間表現(xiàn)出更緊密的聯(lián)系,蝦夷扇貝、牡蠣等無脊椎動物的Smad則聚在一起。值得注意的是,蝦夷扇貝的Smad3與其它物種的Smad2和Smad3聚在一起;Smad5與其它物種的Smad1、Smad5、Smad8聚類,兩者所在的亞族分別調(diào)控不同的信號通路,有很強的同源性。蝦夷扇貝的Smad4與其它物種的Smad4聚類,Co-Smad亞族中只有一種Smad4,負責(zé)與R-Smad蛋白形成異源復(fù)合物。 蝦夷扇貝Smad6與其它物種的Smad6、Smad7聚類。
(Hs:人;Mm:小鼠;Dr:斑馬魚;Dm:果蠅;Cg:牡蠣;Py:蝦夷扇貝;Nv:海葵;Hv:水螅;紅色:I-Smad亞群;橘紅色:介導(dǎo)TGF-β通路的R-Smad亞群;黃色:介導(dǎo)BMP通路的R-Smad亞群;藍色:Co-Smad亞群;a:NJ進化樹;b:ML進化樹;c:Bayes進化樹.Hs,H. sapiens;Mm,M. musculus;Dr,D. rerio;Dm,D. melanogaster;Cg,C. gigas;Py,P. yessoensis;Nv,N. vectensis;Hv,H. vulgaris;Red indicates the I-Smad subgroup;orange indicates the R-Smad subgroup that mediates the TGF-β pathway;yellow indicates the R-Smad subgroup that mediates the BMP pathway;blue indicates the Co-Smad subgroup;a,b,c represented phylogenetic tree of NJ,ML,Bayes respectively.)
不同Smad基因在胚胎各時期的表達水平各異,暗示Smad基因家族成員在蝦夷扇貝早期發(fā)育過程中可能參與調(diào)控不同的生物學(xué)功能(見圖5)。Smad3在受精卵和2~8細胞時期有顯著的高表達,囊胚期開始該基因表達量迅速降低。Smad4在受精卵、囊胚和原腸胚時期有著高表達量,擔輪期開始表達量顯著降低。Smad5在囊胚、原腸胚和擔輪幼蟲3個時期的表達量最高,在受精卵和D型幼蟲時期次之。Smad6的表達在進入原腸胚時期時,呈現(xiàn)出明顯的增長趨勢,約是囊胚時期表達量的2倍,可能在原腸胚時期發(fā)揮重要的作用。
本研究進一步分析了Smad基因在11種成體組織中的轉(zhuǎn)錄組數(shù)據(jù)(見圖6)。結(jié)果發(fā)現(xiàn),Smad基因家族在成體組織中的表達沒有明顯特異性,表達具有廣譜性。Smad3在橫紋肌和平滑肌中具有較高的表達量,F(xiàn)PKM值均在32以上,在平滑肌中達到40,在其它組織中也有穩(wěn)定的表達,F(xiàn)PKM值在15左右,在精巢中表達量最低,暗示該基因可能與肌肉生長密切相關(guān)。Smad4基因在各個組織均有表達,表達量很相似,F(xiàn)PKM值在13左右,在血液和平滑肌中有表達量較高。Smad5在血細胞中特異性表達,F(xiàn)PKM值高達63,表達量約為其它組織的2~3倍,在精巢中表達量最低。Smad6在鰓和平滑肌中表達量較高,在精巢中的表達量最低,足、眼、消化腺等組織的表達量約是精巢的5倍。
(受精卵:Fertilized eggs;2~8細胞:2~8-cells;囊胚期:Blastulae;原腸期:Gastrulae;擔輪幼蟲:Trochophores;D形幼蟲:D-shaped larvae;殼頂前期:Early umboperiod;殼頂中期:Middle umbo period:殼頂后期:Find umbo period:匍匐幼蟲:Creeping larvae;稚貝:Juvenile。 標注字母完全不同的表示存在顯著性差異(P<0.05). Different letters indicate significant differences(P<0.05).)
(橫紋肌:Striated muscle;血:Blood;消化腺:Hepatopancreas;眼:Eye;♀性腺:Female gonad;足:Foot;鰓:Gill:腎:Kidney:外套膜:Mantle;♂性腺:Male gonad;平滑?。篠mooth muscle。任意兩種組織間,標注字母完全不同的表示存在顯著性差異(P<0.05)。 Different letters between tissues indicate significant differences(P<0.05).)
在11個成體組織中選取平滑肌、橫紋肌、血和鰓進行熒光定量PCR驗證(見圖7),結(jié)果發(fā)現(xiàn)Smad3在平滑肌中表達量最高,Smad4和Smad5在血液中表達量最高,Smad6在鰓中表達量最高,其表達模式與RNA-Seq分析結(jié)果一致。
(平滑?。篠mooth muscle;橫紋?。篠triated muscle;血:Blood;鰓:Gill。任意兩種組織間,標注字母完全不同的表示存在顯著性差異(P<0.05)。Different letters between tissues indicate significant differences(P<0.05).)
對蝦夷扇貝Smad基因的結(jié)構(gòu)(見圖1)和蛋白結(jié)構(gòu)(見圖2)進行分析發(fā)現(xiàn),各個Smad的內(nèi)含子數(shù)目、蛋白長度、MH1/MH2結(jié)構(gòu)域位置等有明顯的結(jié)構(gòu)差異,基因全長方面差異較大,內(nèi)含子與外顯子數(shù)目也不相同,暗示它們在扇貝的生命活動中可能具有不同的作用。但其結(jié)構(gòu)域大致相同,Smad蛋白包含三個不同的區(qū)域MH1、MH2和一個連接區(qū)。MH1位于Smad蛋白的N端,MH2的結(jié)構(gòu)域位于Smad蛋白的C端,MH1和MH2之間的氨基酸序列是連接區(qū)[37]。MH1域可以與DNA鍵結(jié)合,此外,MH1域還具有11個氨基酸組成的發(fā)夾結(jié)構(gòu)。MH2結(jié)構(gòu)域含有約200個氨基酸,其氨基酸序列高度保守[38]。通過蝦夷扇貝Smad蛋白結(jié)構(gòu)域序列對比發(fā)現(xiàn),Smad基因家族都含有一個保守的MH1和C末端MH2結(jié)構(gòu)域,MH2結(jié)構(gòu)域相對于MH1具有更高的保守性(見圖3)。
通過進化分析的結(jié)果可以看出,蝦夷扇貝Smad數(shù)量跟無脊椎動物比較相近,保留了后口動物中完整的Smad基因家族亞群,前期研究顯示,Smad家族成員不僅影響細胞核內(nèi)轉(zhuǎn)錄蛋白的活性,而且可以與轉(zhuǎn)錄激活因子相互作用,對基因起到調(diào)節(jié)作用,在動物生理學(xué)和疾病免疫過程中扮演重要角色[39]。Smad在胚胎發(fā)育時期和成體組織的表達模式反映出,該基因家族成員在蝦夷扇貝的生命活動中具有重要的功能。大多數(shù)動物的胚胎發(fā)育都經(jīng)歷了從母體效應(yīng)基因控制到胚胎基因組控制的轉(zhuǎn)變,母體效應(yīng)基因主要控制胚胎發(fā)育的早期階段[40]。Smad3基因在受精卵和2~8細胞時期有較高的表達量,之后該基因表達量迅速降低,在以后的時期都處在很低的表達水平,推測該基因是母源基因,在胚胎早期細胞分裂過程中發(fā)揮重要作用。胚胎經(jīng)過卵裂發(fā)育到中囊胚階段后,母源基因控制轉(zhuǎn)變?yōu)榕咛セ蚩刂?,這種基因控制的變化叫做“中期囊胚轉(zhuǎn)換”(Midblastula transition,MBT)[41]。蝦夷扇貝Smad6在胚胎發(fā)育早期表達量較低,在囊胚期及原腸胚時期表達量大幅增加,與胚胎基因組開始轉(zhuǎn)錄導(dǎo)致的“中期囊胚轉(zhuǎn)換”現(xiàn)象相符合。
在蝦夷扇貝各成體組織中,Smad基因均有不同程度的表達,說明該家族在組織中的表達具有廣譜性。Smad1過量表達可以抑制肌肉特異性基因的表達,Smad1和Smad5被認為是BMP信號通路的兩個主要轉(zhuǎn)導(dǎo)介質(zhì),而BMP信號在脊椎動物早期發(fā)育過程中決定腹側(cè)命運[42]。Smad5和Smad1是具有相似功能的一類基因[1, 43],這可能是因為脊椎動物基因組在進化過程中發(fā)生過加倍,導(dǎo)致基因數(shù)量加倍[44]?;驈?fù)制在新基因的產(chǎn)生和基因家族的擴張過程中發(fā)揮重要作用[45]。蝦夷扇貝中Smad5在橫紋肌和平滑肌中的高表達量也暗示著Smad5基因具有相似的功能。Smad3基因在橫紋肌和平滑肌中的表達量約為其它組織的2倍,暗示其與肌肉的生長發(fā)育也密切相關(guān)。哺乳動物的研究表明Smad3是TGF-β的下游效應(yīng)因子,可阻斷MyoD誘導(dǎo)的肌源性分化[46]。Smad6在鰓中特異性表達,推測其在鰓中發(fā)揮調(diào)控作用,貝類的鰓具有呼吸和濾食功能,且在防御排毒過程中也發(fā)揮著重要作用。
本研究篩查鑒定出4個Smad基因。進化分析表明,蝦夷扇貝中的Smad基因分為3類,分別是R-Smad亞群中的Smad3、Smad5;Co-Smad亞群中的的Smad4;I-Smad亞群中的Smad6。胚胎時期表達分析顯示,Smad3基因在蝦夷扇貝受精卵和2~8細胞時期有較高的表達量,之后該基因表達量迅速降低,推測其可能是母源基因,在胚胎早期細胞分裂過程中發(fā)揮重要作用。在胚胎發(fā)育早期Smad6表達量較低,但表達量在囊胚期及原腸胚期顯著升高,可能與母型調(diào)控向合子型調(diào)控過渡的 “中期囊胚轉(zhuǎn)換”有關(guān)。各成體組織的表達分析結(jié)果顯示Smad3在橫紋肌和平滑肌中有較高的表達量,推測該基因家族在蝦夷扇貝的生長發(fā)育過程,尤其是肌肉生長方面起重要作用。