周 珂,劉乃新,于清濤,2
(1.黑龍江大學現(xiàn)代農業(yè)與生態(tài)環(huán)境學院,哈爾濱 150080; 2.哈爾濱市農業(yè)科學院,哈爾濱 150000)
植物的發(fā)育是一個非常復雜的過程。在這個過程中,DNA和蛋白質起著重要的作用。通過它們之間的相互作用,實現(xiàn)對基因表達的調控。眾所周知,基因表達的調控主要發(fā)生在轉錄水平上,而在轉錄水平上與DNA相互作用的蛋白質分子中最多樣化的是轉錄因子(TF)。轉錄因子通過激活許多與植物生長和發(fā)育有關的功能基因而發(fā)揮重要作用。通過與DNA結合或調節(jié)DNA結構,TF可以調節(jié)與逆境脅迫有關的基因的表達,從而控制植物的生物過程[1]。
NAC基因家族主要存在于植物中,它的名字來自于三個基因的縮寫(矮牽牛的NAM,擬南芥的ATAF和CUC2)。無根尖分生組織(NAM)是在矮牽牛中發(fā)現(xiàn)的第一個特征化的NAC蛋白[2],而擬南芥轉錄激活因子(ATAF)和杯狀子葉(CUC)是在擬南芥中發(fā)現(xiàn)的。NAC蛋白在N端有一個高度保守的NAC結構域[3]。NAC結構域由幾個螺旋體組成,環(huán)繞著一個反向平行的B-折疊,它可以結合DNA和其他蛋白[4],轉錄因子的C端是轉錄激活功能區(qū),其序列和功能具有多樣性[5]。
目前,在擬南芥中已發(fā)現(xiàn)110多個NAC成員,在水稻中發(fā)現(xiàn)140多個NAC成員。以前的研究表明,NAC基因家族參與了植物發(fā)育和形態(tài)發(fā)生的各種過程,包括芽尖分生組織的形成[6]胚胎發(fā)育[7]花器官的形態(tài)發(fā)生[8],側根的形成[9]葉衰老[10]和脅迫條件下的花器官誘導。NAC基因家族的成員還參與了細胞周期控制、激素信號轉導等。[11]激素信號轉導[12]和谷物營養(yǎng)物質的轉運[13]。
此外,NAC基因家族還與植物抗性有關,如干旱[14],高鹽[15]、低溫[16]、機械損傷[17]和病毒感染[18]。
甜菜(Betavulgaris)是一種兩年生草本植物,原產于歐洲西部和南部沿海地區(qū),是甘蔗以外的主要糖源。根據(jù)聯(lián)合國糧食及農業(yè)組織(FAO)的數(shù)據(jù),全世界每年有30%的糖產量來自甜菜,它也是生物乙醇的重要來源。[19]天然色素[20]蔬菜[21]和動物飼料的重要來源。[22]近年來,越來越多的瑞士甜菜[23]栽培品種(紅莖葉甜菜、紅葉甜菜)作為觀賞植物被廣泛用于景觀配置。
甜菜在生長發(fā)育過程中,容易受到各種生物和非生物脅迫的影響,嚴重影響甜菜的產量和觀賞價值。本研究以甜菜全基因組為基礎,鑒定了NAC家族的成員,并分析了其基因結構、染色體定位、亞細胞定位、蛋白質保守結構域和系統(tǒng)發(fā)育關系,為分析NAC轉錄因子的功能和構建抗逆調控網(wǎng)絡奠定了基礎。
甜菜基因組和注釋文件數(shù)據(jù)下載自NCBI(https://www. ncbi.nlm.nih.gov/sra/?term=beta+vulgaris)。NAC基因家族保守結構包含有PF01849、PF02365(數(shù)據(jù)來自Pfam數(shù)據(jù)庫),利用 HMMER3.0 軟件(http://www.ebi.ac.uk/Tools/hmmer/)搜索甜菜蛋白序列,鑒定甜菜的PF01849、PF02365的 NAC 候選基因。候選基因再利用保守結構域預測網(wǎng)站Pfam (http://pfam.xfam.org/)和CDD (http://www.ncbi.nlm.nih.gov/cdd/)進行檢測,保留完整的結構域的作為NAC基因。利用 ProtParam (http://web.expasy.org/protp-aram/)分析NAC基因的氨基酸長度、分子質量、理論等電點進行分析。
引入擬南芥 NAC 基因家族對甜菜NAC基因進行亞組分類,擬南芥 NAC 蛋白序列下載于arabidopsis網(wǎng)站 (http://www.arabidopsis.org/)。將篩選得到的甜菜 NAC 蛋白序列進行進化樹分析,利用 Clustalx2.0 軟件進行多序列比對,再通過進化樹分析軟件 MEGA5.2根據(jù)NJ方法構建系統(tǒng)進化樹(參數(shù)設置: P-distance, pairwise deletion, bootstrap (1 000 次重復))
使用MEME程序(http://meme.nbcr.net/meme/cgi-bin/meme.cgi)對甜菜的motif進行識別。主要參數(shù)Motif的最大數(shù)量是15。
甜菜 NAC 基因的內含子、外顯子和基因組定位信息均下載于NCBI數(shù)據(jù)庫甜菜注釋文件。利用在線軟件 GSDS2.0(http://gsds.cbi.pku.edu.cn/) 對 NAC 的內含子和外顯子結構進行分析和整理;利用R包chromPlot對NAC基因進行染色體定位。利用軟件MCscanX對 NAC 基因進行片段復制和串聯(lián)復制分析。
從NCBI下載甜菜逆境的轉錄組數(shù)據(jù), ID PRJNA254489。使用軟件solexQA 對下載的數(shù)據(jù)進行質量控制,使用軟件Tophat2進行比對并使用Cufflink計算表達量, 使用R包pheatmap進行候選基因的可視化。
前人研究報道,NAC基因可能受miR164調控。根據(jù) miR164 靶序列(TGCACGTGCCCTGCTTCTCCA) ,在篩選得到的 52 個候選甜菜 NAC 轉錄因子相應的核苷酸序列中使用 BLAST在線聯(lián)配工具,預測潛在的miR164的靶標。
通過 NCBI數(shù)據(jù)庫下載甜菜基因組及蛋白序列,根據(jù) NAC 保守域序列號 PF01849、PF02365(Pfam數(shù)據(jù)庫),利用 HMMER3.0 軟件檢索甜菜的氨基酸序列。再利用保守結構域預測網(wǎng)站 Pfam和 CDD對候選序列進行篩選鑒定。通過以上篩選獲得 87個NAC候選基因,5個含有NAC結構域,82個為NAM結構域。去除掉可變剪切和位于scaffold上的NAC基因,一共獲得52個甜菜NAC基因。利用 ExPASy 提供的在線軟件 ProtParam (http://web.expasy.org/protp-aram/)對候選成員氨基酸序列進行一級結構預測結果見表1。
表1 β硫化物中NAC基因的數(shù)量和特性
續(xù)表1
引入已知類型的擬南芥 NAC 蛋白序列,構建 BvNAC的進化樹。通過已知擬南芥 NAC 蛋白的類型指導 BvNAC 蛋白的分組。進化樹結果顯示,BvNAC 蛋白序列可分為 18 個亞族(圖 2)。各亞族成員數(shù)量分布差異很大,其中Ⅻ亞族的Bv NAC 轉錄因子成員最多為 28 個,而Ⅸ和Ⅹ亞族成員均只有一個。其中的Ⅻ亞族與擬南芥并沒有相聚成簇。
圖1 Beta vulgaris和擬南芥的NAC基因的系統(tǒng)發(fā)育樹
利用在線MEME軟件對甜菜 NAC 的 NAC 結構域進行分析,結果發(fā)現(xiàn)甜菜 NAC 轉錄因子的 NAC 保守結構域是高度保守的(圖2)。NAC 保守結構域中包含 15個亞結構域,其中 A、C、D 亞結構域保守性高,B 和 E 保守性低。由于亞族Ⅲ、Ⅵ、Ⅷ、Ⅸ、Ⅹ的成員較少無法使用 Web Logo 軟件構建該組的全序列標簽,所以沒有列出。甜菜 NAC 轉錄因子Ⅰ、Ⅴ、Ⅺ亞族成員的保守性最高,而Ⅻ亞族成員保守性最低(圖2)。
圖2 甜菜NAC 轉錄因子motif結構分布
甜菜 NAC 基因的內含子、外顯子和基因組定位信息均下載于 NCBI數(shù)據(jù)庫。利用在線軟件 GSDS2.0(http://gsds.cbi.pku.edu.cn/)對 NAC 的內含子和外顯子結構進行分析和整理(圖3)。甜菜 NAC 轉錄因子家族成員主要由 1~7 個外顯子組成,其中Ⅻ亞族大多數(shù)成員只含有一個外顯子,這可能與其是甜菜特有的一類 NAC 轉錄因子有關。
圖3 甜菜 NAC 轉錄因子家族染色體定位和數(shù)量分布
利用R包chromPlot制作 NAC 的染色體定位分布圖,并對 NAC 基因進行片段復制和串聯(lián)復制分析。本實驗篩選出的 52 個甜菜 NAC 基因不均勻的分布于 9 條染色體上,6 號染色體上分布最多,為11 個;其次是 1 號染色體,為 10 個;7 號染色體分布最少,只有 1 個(圖5B)。同時,對甜菜 NAC 轉錄因子基因進行片段復制和串聯(lián)復制檢測。多個甜菜 NAC 轉錄因子基因處于甜菜基因組復制事件區(qū)域,其中沒有基因經(jīng)歷了片段復制, 6個基因經(jīng)歷了串聯(lián)復制,占基因總數(shù)的 11.5%(圖5A)??梢?,甜菜 NAC 基因家族以串聯(lián)復制0為主要擴增方式。
根據(jù) miR164靶序列(TGCACGTGCCCTGCTTCTCCA)與篩選得到的 52 個候選甜菜 NAC 轉錄因子相應的核苷酸序列,利用 BLAST工具對 miR164 靶序列的定位分析,選取e-value小于 0.009的序列。結果表明,在 52 個甜菜 NAC 轉錄因子中有1 個 NAC 轉錄因子成員(BvNAC30)的核苷酸序列具有 miR164 靶序列識別位點。
本研究通過生物信息學方法篩選出了52條甜菜NAC轉錄因子,并對其構建了進化樹、 分析了蛋白質保守結構域、染色體上進行了定位和 mi R164 靶序列定位,這些研究結果將為以后 利用基因工程技術創(chuàng)制甜菜新種質提供優(yōu)異基因資源做準備。