胡莎莎,張冬群,張苡芃,韓鵬舉,蘭利瓊,卿人韋
(四川大學(xué)生命科學(xué)學(xué)院生物資源與生態(tài)環(huán)境教育部重點(diǎn)實(shí)驗(yàn)室,成都 610065)
近年來關(guān)于基因家族的研究主要集中于轉(zhuǎn)錄因子家族、酶家族(激酶、代謝通路相關(guān)酶類),如WRKY基因家族、MYB轉(zhuǎn)錄因子家族等,關(guān)于Actin基因家族的分類、功能分析研究較少.Actin基因家族是一類超基因家族,除了包含典型的Actin蛋白外,還含有ALP同源蛋白結(jié)構(gòu)域,它們具有稱為“actin fold”的共同結(jié)構(gòu)特征,這些蛋白由一個(gè)多基因家族編碼共同組成了Actin 基因家族[1].該基因家族在動(dòng)植物中廣泛存在,與各種微絲結(jié)合蛋白共同作用,形成獨(dú)特的微絲骨架結(jié)構(gòu),參與成膜體結(jié)構(gòu)的組成、囊泡運(yùn)輸、細(xì)胞運(yùn)動(dòng)、物質(zhì)轉(zhuǎn)運(yùn)、脅迫響應(yīng)等各項(xiàng)生命活動(dòng)[2].與動(dòng)物相比,植物肌動(dòng)蛋白之間的序列差異更大,表明肌動(dòng)蛋白基因家族可能在植物中具有更加復(fù)雜的生物學(xué)功能[3,4].
輪藻植物具有成膜體結(jié)構(gòu),且微絲、微管等骨架蛋白參與了該結(jié)構(gòu)的組成[5].另外,在輪藻植物中還廣泛存在無絲分裂現(xiàn)象,且微絲結(jié)構(gòu)的破壞顯著抑制了細(xì)胞的無絲分裂過程[6].但目前為止,還未有關(guān)于輪藻植物Actin基因家族的鑒定、結(jié)構(gòu)分析等相關(guān)研究,因此本研究基于布氏輪藻全基因組對(duì)Actin基因家族進(jìn)行了鑒定分析,從基因序列特征、蛋白理化性質(zhì)、結(jié)構(gòu)特征、系統(tǒng)發(fā)育、啟動(dòng)子順式作用元件及組織表達(dá)等方面對(duì)布氏輪藻的Actin基因家族進(jìn)行系統(tǒng)的研究,以揭示Actin基因家族在輪藻中的基因結(jié)構(gòu)、蛋白特征及可能參與的功能,這一結(jié)果也將為進(jìn)一步探究布氏輪藻的Actin基因家族的具體的生理生化功能及其特殊結(jié)構(gòu)形成的具體分子機(jī)制奠定基礎(chǔ).同時(shí),可以為探究輪藻植物無絲分裂現(xiàn)象的基因調(diào)控機(jī)制提供一定的理論依據(jù).
布氏輪藻的基因組文件和注釋文件下載于Phyzome基因組數(shù)據(jù)庫(kù)(https://phycocosm.jgi.doe.gov/Chabra1/Chabra1.home.html),擬南芥Actin基因家族下載于擬南芥基因組數(shù)據(jù)庫(kù)TAIR(https://www.arabidopsis.org/browse/genefamily/index.jsp).
2.2.1 成員的鑒定和理化性質(zhì)分析 利用TBtools根據(jù)布氏輪藻基因組文件和注釋文件提取基因的CDS序列,并將CDS序列文件轉(zhuǎn)化為蛋白序列文件,去除重復(fù)后獲得非冗余的蛋白序列文件.基因家族的鑒定通常包括兩種方法,第一種方法利用Blast軟件通過序列相似性進(jìn)行序列比對(duì)的方法篩選,第二種利用Pfam數(shù)據(jù)庫(kù)提供的蛋白結(jié)構(gòu)域模型文件摸索未知序列[7],如果具有相同的結(jié)構(gòu)域則認(rèn)為該基因?qū)儆谕患易宄蓡T.為了獲得更完整的布氏輪藻Actin基因家族成員,本研究結(jié)合了兩種方法對(duì)布氏輪藻的Actin基因家族進(jìn)行了鑒定.首先,以擬南芥Actin基因家族蛋白序列作為參考與布氏輪藻的蛋白序列進(jìn)行本地Blast比對(duì)(E-value<10-10), 獲得布氏輪藻中Actin基因的潛在序列.在Pfam數(shù)據(jù)庫(kù)中下載Actin結(jié)構(gòu)域的隱馬爾可夫模型(PF00022),使用HMMER軟件對(duì)布氏輪藻蛋白序列進(jìn)行檢索(E-value<10-10),篩選包含Actin結(jié)構(gòu)域的潛在基因家族.對(duì)blast結(jié)果與HMMER結(jié)果取并集,將獲得的所有蛋白序列提交至NCBI的CD-search網(wǎng)站最終獲得包含完整Actin結(jié)構(gòu)域的基因.根據(jù)基因在scaffold上的順序,將其分別重命名為CbACT1~CbACT16.使用ExPASy在線網(wǎng)站獲得Actin基因的等電點(diǎn)、分子質(zhì)量和序列長(zhǎng)度等信息,并預(yù)測(cè)其不穩(wěn)定系數(shù)和平均親水系數(shù).通過SOPMA網(wǎng)站預(yù)測(cè)分析蛋白序列的二級(jí)結(jié)構(gòu),并使用Plant-mPLoc進(jìn)行蛋白亞細(xì)胞定位分析.
2.2.2 系統(tǒng)發(fā)育及基因結(jié)構(gòu)分析 使用MAFFT軟件對(duì)獲得的蛋白序列進(jìn)行比對(duì),比對(duì)策略選擇auto其他參數(shù)選擇默認(rèn)[8].將比對(duì)結(jié)果導(dǎo)入Phylosuite軟件[9],使用Trim AI對(duì)序列進(jìn)行修剪,并將其轉(zhuǎn)換為PHY格式,最后通過IQ-TREE進(jìn)行建樹分析, Bootstrap設(shè)置為1000[10],IQTREE通過自動(dòng)檢測(cè)氨基酸替換模型建立最大似然樹.基因結(jié)構(gòu)的展示根據(jù)布氏輪藻的GFF注釋文件,利用TBtools軟件的Gene Structure View程序進(jìn)行分析.
2.2.3 蛋白保守基序分析和結(jié)構(gòu)域分析 通過MEME在線預(yù)測(cè)蛋白的保守基序,motif設(shè)置為10,其他保持默認(rèn)選項(xiàng),利用TBtools軟件繪制蛋白保守基序圖.利用NCBI的CD-search工具對(duì)16條Actin基因進(jìn)行保守結(jié)構(gòu)域分析,提取結(jié)果文件中的結(jié)構(gòu)域信息,將其導(dǎo)入TBtools對(duì)蛋白序列的結(jié)構(gòu)域可視化.
2.2.4 染色體定位及共線性分析 使用BLAST對(duì)輪藻所有蛋白序列進(jìn)行雙向比對(duì)并將雙向Blast結(jié)果進(jìn)行合并(E<10-5).利用TBtools結(jié)合Excel對(duì)GFF文件進(jìn)行簡(jiǎn)化處理,將簡(jiǎn)化的GFF文件及Blast結(jié)果文件作為輸入文件,通過MCScanX軟件進(jìn)行共線性分析,最后利用TBtools將結(jié)果進(jìn)行可視化[11].
2.2.5 啟動(dòng)子區(qū)域順勢(shì)作用元件分析 使用TBtools從布氏輪藻的基因組序列文件中提取Actin基因家族成員起始密碼子上游2000 bp的DNA序列作為Actin基因的啟動(dòng)子區(qū)域,將其提交至PlantCARE網(wǎng)站預(yù)測(cè)Actin所包含的順式作用元件.將結(jié)果導(dǎo)入到Excel中整理,最后用TBtools軟件可視化啟動(dòng)子元件.
2.2.6 轉(zhuǎn)錄表達(dá)模式分析 根據(jù)相關(guān)文獻(xiàn)下載布氏輪藻基因組數(shù)據(jù)庫(kù)中的表達(dá)矩陣,檢索16個(gè)Actin基因在4個(gè)不同組織包括營(yíng)養(yǎng)組織、藏精器、藏卵器及合子中的表達(dá)量,將表達(dá)量值經(jīng)過log2(FPKM+1)轉(zhuǎn)換后利用TBtools軟件的HeatMap繪制基因表達(dá)熱圖.
通過序列比對(duì)和結(jié)構(gòu)域篩選,共獲得布氏輪藻16個(gè)Actin基因,根據(jù)基因所在Scaffold的排列順序?qū)⑺谢蛑孛麨镃bACT1~CbACT16.理化性質(zhì)分析結(jié)果表明Actin基因氨基酸數(shù)量在361(CbACT9)~1182(CbACT7)AA之間,分子量在39 886.71(CbACT14)~117 256.72(CbACT13)Da之間,理論等電點(diǎn)在4.68(CbACT12)~8.93(CbACT11)之間,只有三個(gè)為堿性蛋白質(zhì)(理論等電點(diǎn)>7),其余均為酸性蛋白質(zhì)(理論等電點(diǎn)>7).氨基酸的平均親水系數(shù)表明,除了 2個(gè)基因(CbACT1、CbACT15)為疏水性蛋白外(平均親水系數(shù)>0),其余均為親水性蛋白(平均親水系數(shù)<0).不穩(wěn)定指數(shù)表明有7個(gè)蛋白(CbACT2、CbACT5、CbACT7、CbACT11、CbACT13、CbACT15、CbACT116)為不穩(wěn)定蛋白(不穩(wěn)定指數(shù)>40),其余Actin基因均為穩(wěn)定蛋白(不穩(wěn)定指數(shù)<40)(表1).
表1 布氏輪藻的肌動(dòng)蛋白基因家族基本特征
亞細(xì)胞定位預(yù)測(cè)顯示除了CbACT13定位于葉綠體之外,其余均定位于細(xì)胞質(zhì)(表2).為了進(jìn)一步了解Actin基因家族的空間結(jié)構(gòu)特征,對(duì)其進(jìn)行了二級(jí)結(jié)構(gòu)分析,結(jié)果表明,16條Actin基因均含有α螺旋、無規(guī)則卷曲、延伸鏈和β折疊.其中,α螺旋和無規(guī)則卷曲占二級(jí)結(jié)構(gòu)總量的26.48%(CbACT2)~46.51%(CbACT2),是該基因家族的主要二級(jí)結(jié)構(gòu)元件;延伸鏈占比12.30%(CbACT15)~22.22%(CbACT1),β轉(zhuǎn)角所占比例最少,在6.27%(CbACT3)~11.25%(CbACT16)之間.
表2 布氏輪藻的肌動(dòng)蛋白亞細(xì)胞定位及二級(jí)結(jié)構(gòu)
為了研究布氏輪藻的Actin基因家族的系統(tǒng)發(fā)育關(guān)系和基因結(jié)構(gòu)特征,本研究對(duì)布氏輪藻的16條Actin基因的蛋白序列進(jìn)行了序列比對(duì)建樹分析和基因結(jié)構(gòu)分析(圖1).系統(tǒng)發(fā)育分析結(jié)果表明布氏輪藻的Actin基因可以分為兩個(gè)亞家族,結(jié)合Actin基因的結(jié)構(gòu)分析,發(fā)現(xiàn)同一亞家族的基因
圖1 CbACT蛋白進(jìn)化樹及基因結(jié)構(gòu)
結(jié)構(gòu)較為相似,類型I中基因結(jié)構(gòu)較為保守,外顯子數(shù)目差異較小,基因序列外顯子數(shù)目均小于4.而類型Ⅱ發(fā)生了不同程度的內(nèi)含子插入導(dǎo)致基因結(jié)構(gòu)變化較大,外顯子數(shù)目變化范圍在1~14之間,這些結(jié)構(gòu)差異的基因進(jìn)而通過不同的轉(zhuǎn)錄加工,參與不同的轉(zhuǎn)錄調(diào)控過程.
利用NCBI-CDsearch對(duì)布氏輪藻的Actin基因進(jìn)行結(jié)構(gòu)域分析(圖2),所有的Actin基因家族均含有Actin的典型結(jié)構(gòu)域,除此之外類型Ⅰ的CbACT7還包含有RT-like結(jié)構(gòu)域,類型Ⅱ有2條序列還包含有F-box-like、PRK-13357的結(jié)構(gòu)域,因此在輪藻中Actin功能還參與了更加復(fù)雜的生命活動(dòng).為了進(jìn)一步了解序列的保守特征,利用MEME在線工具對(duì)該基因家族的保守基序進(jìn)行了預(yù)測(cè)分析,結(jié)果顯示:motif7,motif3,motif6在所有序列中都存在,屬于高度保守序列,可能作為Actin基因家族保守結(jié)構(gòu)域的關(guān)鍵序列而存在.基序在不同家族成員中的分布狀態(tài)均存在一定的差異,進(jìn)化關(guān)系越相近的成員共有的保守基序越相似,如類型Ⅰ蛋白序列均含有基序1、2、3、4、6、9.因此這些相同的保守基序表明同一亞家族的成員可能具有相似的功能,不同的保守基序可能是不同Actin執(zhí)行不同功能所必須.
圖2 CbACT結(jié)構(gòu)域及保守基序
Actin基因家族的染色體定位結(jié)果表明除了CbACT6、CbACT7、CbACT8分布于同一條scaffold上,其余單獨(dú)分布于13條scaffold上(圖3).為了研究Actin基因家族的擴(kuò)增機(jī)制,利用TBtools對(duì)布氏輪藻Actin基因家族進(jìn)行物種內(nèi)共線性分析,結(jié)果表明只有一對(duì)Actin基因?yàn)槠螐?fù)制所產(chǎn)生,沒有發(fā)現(xiàn)串聯(lián)重復(fù)的基因,推測(cè)該植物的Actin基因家族成員少部分是由基因片段復(fù)制
圖3 CbACT基因染色體定位及共線性分析
產(chǎn)生,大部分成員可能是跟隨物種進(jìn)化遺傳而來.另外為了解Actin在不同物種間的進(jìn)化遺傳關(guān)系,利用萊茵衣藻、克里藻的全基因組及其Actin基因家族與布氏輪藻的基因組、Actin基因家族進(jìn)行了物種間的共線性分析,結(jié)果并未發(fā)現(xiàn)兩兩之間存在共線性關(guān)系.由于目前已解析輪藻綱植物及親緣關(guān)系較近的雙星藻綱、鞘毛藻綱基因組較少,因此Actin基因家族在藻類物種間的進(jìn)化分析缺乏相關(guān)的數(shù)據(jù)支持,未來隨著藻類基因組數(shù)據(jù)庫(kù)的更加完善將會(huì)為不同基因家族在藻類中的進(jìn)化分析提供一定的幫助.
為了解Actin基因家族可能參與的轉(zhuǎn)錄調(diào)控過程,本研究分析了16個(gè)Actin基因上游2000 bp包含的順勢(shì)作用元件.在16個(gè)Actin基因家族中共鑒定出1094個(gè)順勢(shì)作用元件,根據(jù)功能將其分為6種類型.所有的Actin基因都包含了大量的基本啟動(dòng)子元件(AT-TATA-box、CAAT-box、TATA-box)和光響應(yīng)元件(G-box、Sp1、TCCC-motif).其他順式作用元件主要包括脅迫響應(yīng)元件包括低溫脅迫(LTR)、干旱脅迫(MBS)、厭氧響應(yīng)(ARE、GC-motif)等;激素響應(yīng)元件包括生長(zhǎng)素(AuxRR-core)、赤霉素(GARE-motif)、脫落酸(ABRE、)、水楊酸(TCA)、乙烯(ERE)等響應(yīng)元件.除此之外還有包含了組織特異性元件(CAT-box、RY-element)及與玉米黃素代謝有關(guān)的特殊元件(O2-site)(圖4和圖5).結(jié)果表明布氏輪藻的Actin基因廣泛參與了輪藻的生長(zhǎng)發(fā)育、生物和非生物脅迫、激素調(diào)控等過程,不同成員之間具有不同數(shù)量、種類的啟動(dòng)子元件,從而導(dǎo)致不同成員之間功能的差異性及多樣性.
圖4 CbACT啟動(dòng)子順勢(shì)作用元件
圖5 CbACT順勢(shì)作用元件統(tǒng)計(jì)分析
為了解不同Actin基因在輪藻不同組織中的表達(dá)情況,本研究基于布氏輪藻RNA-Seq轉(zhuǎn)錄組數(shù)據(jù),對(duì)布氏輪藻不同組織的Actin基因進(jìn)行了表達(dá)量分析(圖6).大部分基因的表達(dá)量在各組織中表達(dá)量較小,CbACT4、CbACT10、CbACT14三個(gè)基因的表達(dá)量在四個(gè)組織中表達(dá)量較高,表明這些基因?qū)τ谡{(diào)控輪藻植物的生長(zhǎng)發(fā)育發(fā)揮了較大的作用.CbACT5在合子、藏精器、藏卵器三個(gè)有性生殖器官中表達(dá)量較高,說明該基因可能主要影響了生殖器官的發(fā)育過程.另外由片段復(fù)制得到的CbACT4和CbACT3具有相似的表達(dá)模式,在各組織中表達(dá)量相似,表明這兩個(gè)基因還未發(fā)生功能的分化共同調(diào)節(jié)不同組織的發(fā)育過程.
圖6 CbACT不同組織表達(dá)譜
Actin基因在調(diào)節(jié)植物形態(tài)建成、細(xì)胞運(yùn)動(dòng)等方面具有重要作用,本研究根據(jù)同源性分析和結(jié)構(gòu)域篩選,在布氏輪藻中共獲得16個(gè)Actin基因,對(duì)該基因家族的二級(jí)結(jié)構(gòu)分析表明,布氏輪藻的Actin基因家族主要以無規(guī)則卷曲為主,與葡萄的Actin二級(jí)結(jié)構(gòu)分析結(jié)果相似,說明Actin基因家族的結(jié)構(gòu)存在一定的保守性[12];Actin的亞細(xì)胞定位分析結(jié)果顯示,布氏輪藻的Actin基因除了CbACT13定位于葉綠體,其他15個(gè)Actin基因均定位于細(xì)胞質(zhì),這也與該基因家族主要參與細(xì)胞骨架的構(gòu)成、細(xì)胞中物質(zhì)運(yùn)輸?shù)墓δ芊治鼋Y(jié)果相一致[13].擬南芥Actin7參與了細(xì)胞分裂時(shí)葉綠體的移動(dòng),因此CbACT13可能也參與了葉綠體相關(guān)的生命活動(dòng)[14].系統(tǒng)發(fā)育分析結(jié)果顯示,輪藻的Actin基因家族可以分為較為結(jié)構(gòu)保守的類型Ⅰ和結(jié)構(gòu)變化較大的類型Ⅱ兩個(gè)分支.這也與Wu等[15]的研究結(jié)果類似,在藻類中Actin基因家族至少可以分為兩個(gè)分支,其中一個(gè)分支序列較為保守,而另外一個(gè)分支序列則存在較大的差異.除了典型的Actin結(jié)構(gòu)域之外,布氏輪藻Actin基因還有F-box-like、PRK-13357、RT-like結(jié)構(gòu)域.F-box like蛋白參與調(diào)控蛋白降解、信號(hào)轉(zhuǎn)導(dǎo)、逆境脅迫等生物學(xué)過程[16].RT_like廣泛存在于植物基因組中,在一定條件下可以發(fā)生轉(zhuǎn)座,從而調(diào)控靶向基因的失活、突變等,使得不同基因的表達(dá)調(diào)控更具有多樣性[17].更加復(fù)雜的結(jié)構(gòu)域的存在使得輪藻植物的Actin基因家族的功能更加多樣化,從而更好地調(diào)節(jié)植物的環(huán)境適應(yīng)性;保守基序分析表明,基序3、6、7存在于所有基因家族中,類型I相比與類型Ⅱ共有保守基序更多,這些差異的基序可作為兩個(gè)亞家族之間分類的依據(jù);基因復(fù)制是基因家族發(fā)生擴(kuò)增的主要方式,布氏輪藻基因組研究結(jié)果表明布氏輪藻未發(fā)生過全基因組加倍事件,因此基因家族的擴(kuò)增方式可能主要來自于片段復(fù)制[18].但在布氏輪藻中Actin基因家族只有一對(duì)基因來自于片段復(fù)制,推測(cè)可能部分基因在植物逐漸進(jìn)化過程中由于基因重排、基因轉(zhuǎn)座、基因丟失等原因而導(dǎo)致共線性基因?qū)p少;基因的表達(dá)需要各種轉(zhuǎn)錄因子與啟動(dòng)子不同區(qū)域結(jié)合,從而調(diào)控基因適應(yīng)不同環(huán)境的變化,因此啟動(dòng)子順勢(shì)作用元件的分析對(duì)于了解不同基因的結(jié)構(gòu)、功能分析具有重要意義.對(duì)布氏輪藻的啟動(dòng)子順勢(shì)作用元件分析結(jié)果表明布氏輪藻Actin基因家族啟動(dòng)子區(qū)域除了基本啟動(dòng)子元件(CAAT-box、TATA-box、A-box等)外廣泛存在光響應(yīng)(G-box、TCCC-motif、Sp1等)、激素調(diào)控(AuxRR-core、ABRE、TGACG-motif等)、生物和非生物脅迫等元件(ARE、LTR、GC-motif等),說明Actin作為植物中重要的基因家族對(duì)于布氏輪藻環(huán)境適應(yīng)、生長(zhǎng)發(fā)育的調(diào)控、植物晝夜節(jié)律等發(fā)揮了重要作用;輪藻與其他綠藻門植物相比,出現(xiàn)了組織的分化,具有雌雄生殖器官、假根、小枝等,不同基因通過組織特異型表達(dá)調(diào)控不同組織的分裂分化.通過分析不同組織的表達(dá)譜表明,在布氏輪藻中Actin基因家族的功能發(fā)生了分化,不同家族成員在不同組織中表達(dá)量存在偏好性,有三個(gè)基因在不同組織中明顯高于其他組織,推測(cè)這幾個(gè)基因相對(duì)于其他家族成員對(duì)于輪藻的生長(zhǎng)發(fā)育更為重要.另外,對(duì)于來自片段復(fù)制的基因?qū)Ρ磉_(dá)譜趨于一致,說明該基因?qū)赡苓€未發(fā)生功能分化,共同參與了植物的生長(zhǎng)發(fā)育過程.與擬南芥的Actin表達(dá)譜相比,在輪藻中Actin并未明顯的分為生殖型和營(yíng)養(yǎng)型兩個(gè)類型,但有少數(shù)幾個(gè)Actin基因在生殖器官和營(yíng)養(yǎng)器官的表達(dá)出現(xiàn)了較為明顯的差異,因此可能在低等的藻類植物中也存在兩種類型的基因,但是兩種類型的基因在序列相似性上尚未存在明顯的差異,所以推測(cè)被子植物出現(xiàn)的兩種類型的Actin基因是在跟隨植物進(jìn)化過程中由古老的Actin基因逐漸發(fā)生變異從而最終分化形成了生殖型和營(yíng)養(yǎng)型的Actin亞家族.
目前在植物Actin的研究主要集中擬南芥、豌豆、棉花等,但是在其他物種特別是在藻類植物中研究較少.因此Actin基因?qū)喸寮捌渌孱惖纳L(zhǎng)發(fā)育、形態(tài)建成、脅迫響應(yīng)等功能的發(fā)揮及其內(nèi)在的分子機(jī)制還需要進(jìn)一步的深入研究.本研究從布氏輪藻全基因組中鑒定16個(gè)Actin基因家族,全面分析了Actin基因家族的蛋白理化特性、系統(tǒng)發(fā)育關(guān)系、基因結(jié)構(gòu)、組織表達(dá)模式等,結(jié)果表明Actin基因家族廣泛參與了輪藻植物的生長(zhǎng)發(fā)育、脅迫響應(yīng)等生物學(xué)過程,研究結(jié)果為Actin基因基因家族在輪藻科中的系統(tǒng)發(fā)育研究及對(duì)輪藻生長(zhǎng)發(fā)育的具體功能研究提供了一定的參考價(jià)值.