孟 婕,王 闖,楊 晴,張 貝,李可強(qiáng),張傳生,耿立英,李祥龍
(河北科技師范學(xué)院 河北省特色動物種質(zhì)資源挖掘與創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島066004)
為提高經(jīng)濟(jì)效益,家禽養(yǎng)殖中非常關(guān)注肌肉的快速生長,卻忽視了心臟、肝臟等內(nèi)臟器官發(fā)育緩慢的問題,這可能導(dǎo)致家禽免疫系統(tǒng)發(fā)育不良[1-3]。目前,關(guān)于禽類體質(zhì)量增長及肌肉發(fā)育方面的研究較多,但是對于內(nèi)臟器官的發(fā)育研究較少[4-5]。研究禽類內(nèi)臟器官發(fā)育調(diào)控基因?qū)仪莸慕】叼B(yǎng)殖具有重要意義。GATA 是廣泛存在于真核生物中的含鋅指結(jié)構(gòu)的轉(zhuǎn)錄因子家族,在細(xì)胞增殖和器官形成中起重要作用,其可與靶基因啟動子的A/T(GATA)A/G序列特異性結(jié)合[6]。
轉(zhuǎn)錄因子通過識別并結(jié)合靶基因啟動子的順式元件來調(diào)控基因的表達(dá),在生物的生長發(fā)育過程中,轉(zhuǎn)錄因子通過參與信號轉(zhuǎn)導(dǎo)從而發(fā)揮關(guān)鍵作用。目前,GATA 轉(zhuǎn)錄因子家族在脊椎動物中已廣泛研究,一般有6 個GATA 轉(zhuǎn)錄因子家族成員(GATA1—6)。脊椎動物的GATA 都有2 個高度保守的鋅指結(jié)構(gòu)區(qū)域(Cys-X2-Cys-X17-Cys-X2-Cys),這個區(qū)域以外的序列差異較大[7]。研究表明,GATA1、GATA2 和GATA3 主要在造血細(xì)胞系和神經(jīng)系統(tǒng)發(fā)揮作用[8-9];GATA4、GATA5 和GATA6 主要與心臟、肺臟、泌尿生殖系統(tǒng)等分化有關(guān)[10-11];TRPS1可以調(diào)控下游多種基因轉(zhuǎn)錄,在腎臟、乳腺、卵巢等組織廣泛表達(dá)[12-13]。最新研究發(fā)現(xiàn),GATA1 的CF 結(jié)構(gòu)域改變能夠引起貧血、血小板減少和巨核細(xì)胞增生伴隨輕度骨髓纖維化,從而誘發(fā)骨髓疾病[14]。
雞是禽類性狀形成分子機(jī)制、基因功能解析、基因組學(xué)與分子遺傳學(xué)研究中的關(guān)鍵物種[15]。迄今為止,尚未見有雞GATA(ChGATA)基因家族基本特性的研究報(bào)道。為此,從全基因組水平對ChGATA基因家族進(jìn)行鑒定,對其進(jìn)行理化性質(zhì)、結(jié)構(gòu)和進(jìn)化、蛋白質(zhì)互作等方面的分析,為研究ChGATA 基因家族生物學(xué)功能奠定基礎(chǔ)。
從Ensembl(https://asia.ensembl.org/index.html)數(shù)據(jù)庫中下載雞基因組序列和基因組結(jié)構(gòu)注釋文件,利用NCBI(https://www.ncbi.nlm.nih.gov/)BLAST搜索已報(bào)道的GATA 蛋白序列并與Pfam 數(shù)據(jù)庫比對,獲得GATA 基因家族的Pfam ID(PF00320)。用TBtools 軟件[16]BLAST 搜索ChGATA 基因家族的同源蛋白質(zhì),采用NCBI Batch 工具的CD-Search 程序進(jìn)一步驗(yàn)證,剔除冗余蛋白質(zhì)序列,得到ChGATA基因家族序列,并將其定位到染色體上。采用ProtParam 程序(https://web.expasy.org/protparam/)在線預(yù)測ChGATA 基因家族成員的理化性質(zhì)(氨基酸數(shù)目、分子質(zhì)量、理論等電點(diǎn)、疏水性、不穩(wěn)定性)。
利用SMART 分析ChGATA 基因家族的保守結(jié)構(gòu)域,并用TBtools對結(jié)果進(jìn)行可視化分析。
利用MEGA-X 軟件[17]分析ChGATA 基因家族成員進(jìn)化關(guān)系;用TBtools從基因組結(jié)構(gòu)注釋文件中提取對應(yīng)基因結(jié)構(gòu)信息,預(yù)測ChGATA 基因家族的內(nèi)含子和外顯子組成;用MEME 在線軟件(https://meme-suite.org/meme/tools/meme)對保守Motif 進(jìn)行分析,搜索Motif值設(shè)定為10,并用TBtools 軟件可視化分析。
利用MEGA-X 軟件中的Clustal W 程序?qū)?1 個物種的GATA 蛋白序列進(jìn)行多序列比對分析,分析結(jié)果用鄰接法(Neighbor-Joining,NJ)構(gòu)建系統(tǒng)進(jìn)化樹,Bootstrap 值設(shè)定為1 000 次,其他參數(shù)默認(rèn)不變[18]。構(gòu)建的系統(tǒng)進(jìn)化樹用iTOL 在線程序(https://itol.embl.de/)[19]修飾。
蛋白質(zhì)二級結(jié)構(gòu)用SOPMA 在線程序(https://npsa-prabi. ibcp. fr/cgi-bin/npsa_automat. pl? page=npsa_sopma.html)預(yù)測。將鑒定出的ChGATA 蛋白序列逐一提交SWISS-MODEL 網(wǎng)站(https://swissmodel.expasy.org/),預(yù)測蛋白質(zhì)三級結(jié)構(gòu)。
利用STRING 在線平臺[20](https://string-db.org/)構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò),分析ChGATA 蛋白與其他蛋白質(zhì)的相互作用。蛋白質(zhì)來源設(shè)置為雞(Gallus_gallus),其他參數(shù)默認(rèn)。
共鑒定到6 個ChGATA 基因,根據(jù)其蛋白質(zhì)保守結(jié)構(gòu)域分別命名為ChGATA2、ChGATA3、ChGATA4、ChGATA5、ChGATA6、ChTRPS1。由圖1 可知,6 個ChGATA 基因不均勻地分布在5 條染色體上,ChGATA3在1 號染色體上,ChGATA6和ChTRPS1在2號染色體上,ChGATA4在3 號染色體上,ChGATA2在12號染色體上,ChGATA5在20號染色體上。
ChGATA 蛋白序列的分析結(jié)果顯示,6 個ChGATA蛋白的氨基酸序列長度介于387~1 061個,其中ChTRPS1 的氨基酸數(shù)目最多(1 061 個),而ChGATA6 最少(387 個);蛋白質(zhì)相對分子質(zhì)量分析結(jié)果顯示,ChTRPS1 相對分子質(zhì)量最大(117 443.89),而ChGATA6 最?。?0 249.12)。等電點(diǎn)分析結(jié)果顯示,預(yù)測的ChGATA3 等電點(diǎn)最高(9.47),而ChTRPS1 的等電點(diǎn)最低(6.44)。不穩(wěn)定系數(shù)分析結(jié)果表明,6 個蛋白質(zhì)不穩(wěn)定系數(shù)均大于40,說明它們都是不穩(wěn)定蛋白質(zhì)。疏水性分析結(jié)果顯示,6 個ChGATA 蛋白的疏水性值均為負(fù)數(shù),歸為親水蛋白質(zhì)(表1)。
表1 ChGATA基因家族成員信息Tab.1 The information of ChGATA gene family members
由圖2可知,6個ChGATA 基因靠近3′端區(qū)域都含有ZnF_GATA 結(jié)構(gòu),從而構(gòu)成一個特異性的轉(zhuǎn)錄因子家族,該位置可能是GATA基因的主要功能區(qū),是該基因家族同源性所在。
ChGATA 基因的結(jié)構(gòu)分析結(jié)果表明(圖3),ChGATA2、ChGATA3、ChGATA4、ChGATA5、 和ChGATA6基因均含有6個外顯子和7個內(nèi)含子,但位置、長度均不同,表明基因間具有差異性;ChTRPS1含有7 個外顯子和6 個內(nèi)含子。利用MEME 在線軟件預(yù)測了6 個ChGATA 基因的保守基序(圖3),ChGATA5、ChGATA4、ChGATA6具有相似的保守基序;ChGATA3和ChGATA2具有相似的保守基序。同時,同一分支保守基序的個數(shù)及排列順序都相同。
為了研究ChGATA 基因家族的進(jìn)化關(guān)系,選取6 種進(jìn)化關(guān)系不同的物種,即人(Homo sapiens)、家鼠(Mus musculus)、火雞(Meleagris gallopavo)、斑馬魚(Danio rerio)、非洲爪蟾蜍(Xenopus tropicalis)、錦龜(Chrysemys picta)的GATA 蛋白序列。系統(tǒng)進(jìn)化樹分析結(jié)果(圖4)表明,6個ChGATA 基因可以分為3 個亞群。ChGATA6、ChGATA5和ChGATA4為1 個亞群;ChGATA2與ChGATA3為1 個亞群,ChTRPS1單獨(dú)為1個亞群。
用SOPMA 對ChGATA 蛋白序列的二級結(jié)構(gòu)預(yù)測結(jié)果見表2,ChGATA 家族大部分成員包含α-螺旋、β-轉(zhuǎn)角、延伸鏈及無規(guī)則卷曲,各部分所占比例明 顯 不 同。 ChGATA2、ChGATA3、ChGATA4、ChGATA5、ChGATA6 和ChTRPS1 無規(guī)則卷曲占比例最大,其次是α-螺旋,延伸鏈次之,β-轉(zhuǎn)角所占比例最少。利用SWISS-MODEL 在線軟件對ChGATA 蛋白家族三級結(jié)構(gòu)進(jìn)行預(yù)測(圖5),結(jié)果顯示,同一亞群的成員三級結(jié)構(gòu)高度相似,表明蛋白質(zhì)結(jié)構(gòu)與物種進(jìn)化存在關(guān)聯(lián)性。
表2 ChGATA家族蛋白質(zhì)二級結(jié)構(gòu)預(yù)測結(jié)果Tab.2 Secondary prediction results of ChGATA family proteins%
利用STRING 軟件預(yù)測ChGATA 蛋白的相互作用,構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò)(圖6),其中ChGATA2 和ChGATA3 共有的互作蛋白質(zhì)是T 細(xì)胞因子3(T cell factor 3,TCF3)、LMO2 轉(zhuǎn)錄因子、LIM結(jié)構(gòu)域結(jié)合蛋白(LDB1);ChGATA4、ChGATA5 和ChGATA6 共有的互作蛋白質(zhì)是鋅指蛋白FOG 家族蛋 白1(Zinc finger protein FOG family member 1,ZFPM1)、鋅 指 蛋 白FOG 家 族 蛋 白2(Zinc finger protein FOG family member 2,ZFPM2)、FOXA1 轉(zhuǎn)錄因子(Fork head box A1,F(xiàn)OXA1)、NKX2-5轉(zhuǎn)錄因子、胰島素基因增強(qiáng)子蛋白1(Insulin gene enhancer binding protein 1,ISL1);與TPRS1 有相互作用的蛋白質(zhì)包括真核起始因子3h(Eukaryotic initiation factor 3h,EIF3H)、CSMD3(CUB and Sushi multiple domains 3)、Runx2(Runt-related transcription factor 2)等。
GATA 轉(zhuǎn)錄因子是一種廣泛存在于真核生物體內(nèi)的轉(zhuǎn)錄因子,具有特異的鋅指結(jié)構(gòu)。本研究對ChGATA 基因家族6 個成員進(jìn)行了系統(tǒng)的生物信息學(xué)分析。染色體定位結(jié)果顯示,ChGATA 基因家族成員不均勻地分布在5條染色體上。系統(tǒng)進(jìn)化樹分析結(jié)果顯示,ChGATA 家族成員被分為3 個亞群。這與其他物種的分類相同,可根據(jù)亞群代表物種的GATA 基因功能來推斷ChGATA 相應(yīng)的功能。GATA1、GATA2和GATA3與紅細(xì)胞、淋巴和性腺發(fā)育有關(guān);GATA4、GATA5和GATA6等基因亞群與心臟、腸、外胚組織等的分化相關(guān);TRPS1在多種癌細(xì)胞因子轉(zhuǎn)錄的調(diào)控中發(fā)揮作用[13,21-24]?;蚪Y(jié)構(gòu)分析結(jié)果表明,同一亞群的GATA 含有相同個數(shù)和順序的保守基序,且基因結(jié)構(gòu)相似,推測其有相似的基因功能,而不同亞群間的差異可能是因?yàn)檫M(jìn)化過程中發(fā)生改變而產(chǎn)生的。保守結(jié)構(gòu)域分析結(jié)果表明,6 個ChGATA 均含有ZnF_GATA 結(jié)構(gòu)域,差異在于ChGATA2—6 在 靠 近3′端 含 有2 個ZnF_GATA 結(jié)構(gòu),而ChTRPS1含有1個ZnF_GATA 結(jié)構(gòu),這可能是ChTRPS1與其他GATA轉(zhuǎn)錄因子家族成員結(jié)構(gòu)與功能差異較大的原因。
二級結(jié)構(gòu)預(yù)測結(jié)果顯示,ChGATA 基因家族成員主要由無規(guī)則卷曲組成。與吳玉蓮等[25]的研究結(jié)果比較發(fā)現(xiàn),ChGATA3的α-螺旋占15.77%,高于山羊的12.61%;ChGATA3 的無規(guī)則卷曲占65.99%,低于山羊的69.37%;ChGATA3 的延伸鏈占11.94%,與山羊的11.49%基本一致;ChGATA3 的β-轉(zhuǎn)角占6.31%,與山羊的6.53%基本保持一致。這可能是哺乳動物與禽類物種的分化導(dǎo)致的二級結(jié)構(gòu)差異。三級結(jié)構(gòu)預(yù)測結(jié)果顯示,ChGATA 蛋白整體結(jié)構(gòu)存在較大差異性,但是同一亞群結(jié)構(gòu)相似性較高,表明同一亞群成員在進(jìn)化過程中結(jié)構(gòu)上同源性較高。
前人研究發(fā)現(xiàn),N 端鋅指結(jié)構(gòu)影響GATA 蛋白與DNA 結(jié)合的特異性及穩(wěn)定性[26]。此外,鋅指結(jié)構(gòu)還介導(dǎo)GATA 與其他轉(zhuǎn)錄因子的相互作用,如C 端鋅指結(jié)構(gòu)介導(dǎo)與NKX2-5、MEF2、p300、dHAND 和NFAT3 等轉(zhuǎn)錄因子的相互作用,而N 端鋅指結(jié)構(gòu)負(fù)責(zé)與FOG-2 結(jié)合[27-33]。ChGATA 家族成員都具有C端鋅指結(jié)構(gòu)域,這是蛋白質(zhì)與相關(guān)轉(zhuǎn)錄因子結(jié)合的高級結(jié)構(gòu)基礎(chǔ)。蛋白質(zhì)相互作用結(jié)果顯示,ChGATA 基因家族成員與較多轉(zhuǎn)錄因子相互作用,從而調(diào)控不同內(nèi)臟器官的發(fā)育。
本研究利用生物信息學(xué)的方法對ChGATA 基因家族成員進(jìn)行了較為全面的系統(tǒng)性分析,研究結(jié)果可為深入分析ChGATA 家族基因的功能提供理論參考。