宋曉峰魯成凱董曉娜高曉東孫熙文付春
(濰坊市農(nóng)業(yè)科學(xué)院,山東濰坊 261071)
同源異型盒基因家族(homeobox gene family)編碼一類含有同源異型盒結(jié)構(gòu)域的轉(zhuǎn)錄調(diào)控因子。 同源異形盒基因首先在果蠅突變體研究中發(fā)現(xiàn)并命名[1-2],隨后發(fā)現(xiàn)該基因家族在動(dòng)物、植物、真菌中廣泛存在[3-7]。 同源異型盒基因的典型特征是含有一段高度保守的DNA 序列,長度約180 bp,其編碼的60個(gè)氨基酸殘基在三維空間上形成一個(gè)三螺旋區(qū)結(jié)構(gòu)域。 根據(jù)蛋白質(zhì)的結(jié)構(gòu)特征,通常將植物同源異形盒蛋白分為14 類,其中KNOX(knotted1-like homeobox)和BELL 屬于非典型同源異型盒蛋白,其同源異型盒區(qū)的螺旋Ⅰ和螺旋Ⅱ之間多3個(gè)氨基酸殘基(Pro-Tyr-Pro),從而組成TALE(three amino-acid loop extension)同源異型盒蛋白超家族[8]。
KNOX基因廣泛存在于植物中[3],其編碼的蛋白質(zhì)具有四個(gè)結(jié)構(gòu)域,分別為KNOX1、KNOX2、ELK 和Homeobox KN[9]。 植物中第一個(gè)KNOX基因KNOTTED-1(Kn1)在玉米中發(fā)現(xiàn),起控制細(xì)胞分化作用[10]。 隨后在玉米、水稻、擬南芥、小麥、棉花、豆科植物等中發(fā)現(xiàn)大量KNOX基因[11-20]。 研究者根據(jù)基因家族成員所編碼蛋白的結(jié)構(gòu)域序列相似性及表達(dá)模式,將玉米中KNOX基因家族分為兩個(gè)亞家族——Class Ⅰ和Class Ⅱ[21]。 在表達(dá)模式上,Ⅰ類KNOX基因亞家族成員主要在分生組織中特異性表達(dá),通過參與調(diào)節(jié)細(xì)胞分化,進(jìn)而影響組織器官的形態(tài)建成[22-23]及控制籽粒大小[24];Ⅱ類KNOX基因亞家族成員在各組織器官中普遍表達(dá)[21]。 擬南芥中Ⅰ類KNOX基因有 4個(gè), 包括STM(At1g62360)、KNAT1(At4g08150)、KNAT2(At1g70510)、KNAT6(At1g23380),其中,STM對莖尖分生組織的形成以及功能維持起重要作用[25],KNAT1能夠激活細(xì)胞分裂素的合成[12];Ⅱ類KNOX基因也有4個(gè),即KNAT3(At5g25220)、KNAT4(At5g11060)、KNAT5(At4g32040)、KNAT7(At1g62990),由于突變體表型缺乏,對其功能研究相對較少。
我國是世界上最大的花生生產(chǎn)國,花生單產(chǎn)是世界花生單產(chǎn)的2.31 倍[26]。 花生是我國重要的油料作物,總產(chǎn)居油料作物之首。 鑒于花生基因組龐大,遺傳背景相對復(fù)雜,其分子生物學(xué)研究相對滯后于其他豆科植物,如大豆、蒺藜苜蓿等。但隨著栽培種花生基因組序列信息的公布,這種局面正在改變。 本研究在全基因組水平上對花生KNOX基因家族成員進(jìn)行鑒定,并對其序列特征、進(jìn)化關(guān)系和表達(dá)模式進(jìn)行系統(tǒng)分析,以期為解析花生KNOX基因的重要作用提供參考。
栽培種花生(Arachis hypogaeaL.)參考基因組、蛋白序列及注釋文件來自花生數(shù)據(jù)庫(https://www.peanutbase.org/)。 擬南芥(Arabidopsis thalianaL.)KNOX基因家族成員數(shù)據(jù)下載自TAIR 網(wǎng)站(http:/ /www.arabidopsis.org/)。 以擬南芥的8 條KNOX 蛋白序列(STM、KNAT1 ~KNAT7)為種子序列,利用TBtools v1.108[27]軟件的Blast 命令(E-value<e-5),在全基因組水平檢索花生蛋白數(shù)據(jù)庫中候選KNOX 蛋白成員,并刪除冗余序列。 為保證候選成員的真實(shí)性,利用NCBI-CDD 和Pfam 在線工具進(jìn)一步鑒定,去除不包含結(jié)構(gòu)域的序列。
利用ProtParam 網(wǎng)站預(yù)測每個(gè)KNOX 成員的蛋白理化性質(zhì),具體包括氨基酸(amino acid,AA)數(shù)、分子量、等電點(diǎn)和親水性,并在Softberry 網(wǎng)站上利用ProtComp 9.0 工具預(yù)測其亞細(xì)胞定位。
利用TBtools v1.108 的VisualizeGene Structure(Basic)工具對花生KNOX家族成員進(jìn)行基因結(jié)構(gòu)分析,Gene Location Visualize From GTF/GFF工具進(jìn)行染色體定位分析。
利用MEME 工具對花生KNOX 成員的保守基序進(jìn)行在線預(yù)測,設(shè)置基序數(shù)目為10,其他參數(shù)為默認(rèn)值;蛋白保守基序和CDD 預(yù)測的結(jié)構(gòu)域利用TBtools v1.108 的Gene Structure View(Advanced)工具繪制。
利用軟件MEGA 5[28]的“ClustalW”程序?qū)ㄉc擬南芥的KNOX基因家族成員進(jìn)行多重序列比對,參數(shù)選擇默認(rèn)。 并選擇鄰接法(Neighborjoining,NJ)構(gòu)建系統(tǒng)發(fā)育樹,相關(guān)參數(shù)設(shè)置如下:計(jì)算距離的替代模型(Substitution Model)選擇泊松校驗(yàn)(Poisson correction),Bootstrap 1 000 次。導(dǎo)出.nwk 文件利用FigTree v1.4.4 軟件進(jìn)行美化并參考擬南芥KNOX基因家族的分類系統(tǒng),劃分亞家族和亞組。
根據(jù)花生基因組數(shù)據(jù),提取AhKNOX基因轉(zhuǎn)錄起始位點(diǎn)上游2 000 bp 的序列作為啟動(dòng)子區(qū),并遞交至PlantCARE 數(shù)據(jù)庫,檢索并篩選潛在的順式作用元件,并利用TBtools v1.108 的Basic Biosequence View 工具進(jìn)行可視化。
從NCBI 下載花生22 種不同組織的RNA-seq數(shù)據(jù)(PRJNA291488)[29],分析AhKNOX基因的時(shí)空表達(dá)模式。 基于非生物脅迫處理下的RNA-seq 數(shù)據(jù)(PRJNA553073),分析AhKNOX基因逆境脅迫下的表達(dá)模式。 具體處理如下:分別用1% NaCl、20%PEG6000、20 mg/L ABA、1% H2O2、125 mg/L 茉莉酸甲酯(methyl jasmonate,MJ)、高溫(HT,37 ℃)以及低溫(LT,4 ℃)處理幼苗24 h。 RNA-seq 數(shù)據(jù)通過Hisat2、Samtools 和Cufflinks 分析得到FPKM 值。 將FPKM 值轉(zhuǎn)化為log2(FPKM),使用TBtools v1.108 制作表達(dá)譜的熱圖。
根據(jù)轉(zhuǎn)錄組數(shù)據(jù)分析篩選2個(gè)顯著響應(yīng)PEG脅迫的AhKNOX基因進(jìn)行RT-qPCR 分析。 以濰花8 號為試驗(yàn)對象,2023年2月1日催芽,2月4日定植于水培盒利用Hoagland 溶液在人工氣候箱(上海一恒,MGC-300H)中培養(yǎng),2月14日發(fā)育至三葉期時(shí)開始處理。 用 18% (W/V)PEG6000 做脅迫處理,處理3 d 后換回Hoagland營養(yǎng)液復(fù)水培養(yǎng)2 d;對照組用不含PEG6000 的Hoagland 溶液培養(yǎng)。 分別于處理0、1、2、3、4、5 d采集根,液氮速凍后用于總RNA 的提取。 利用MolPure?Plant RNA Kit 試劑盒(19291ES50)提取RNA,用Thermo Scientific Fermentas 反轉(zhuǎn)錄試劑盒(K1622)獲得cDNA。 RT-qPCR 分析采用SYBR?Green real-time PCR Master Mix (TOYOBO)在ABI 7500 FAST 平臺上進(jìn)行,以Ahactin11為內(nèi)參基因,利用NCBI 的Primer-BLAST 進(jìn)行引物設(shè)計(jì)(表1),每個(gè)樣品3 次重復(fù)。
表1 RT-qPCR 引物信息
經(jīng)過比對搜索,在花生基因組數(shù)據(jù)庫中共鑒定到26個(gè)AhKNOX基因(表2)。 理化性質(zhì)預(yù)測結(jié)果顯示,AhKNOX基因編碼的氨基酸長度差異較大,最短為139 aa(arahy.ZTJV1A.1),最長為478 aa(arahy.TRGC7G.1),分子量對應(yīng)為最小16 116.39 Da、最大52 987.90 Da。 除arahy.ZTJV1A.1 編碼的蛋白質(zhì)等電點(diǎn)達(dá)到8.63 外,其余KNOX 蛋白等電點(diǎn)均低于7,為酸性蛋白。 所有編碼的蛋白均為親水性蛋白,亞細(xì)胞預(yù)測分析表明所有編碼蛋白均定位于細(xì)胞核,符合轉(zhuǎn)錄因子細(xì)胞核定位的特征。
表2 花生KNOX 基因家族信息
對AhKNOX在染色體上的具體分布進(jìn)行可視化分析,結(jié)果顯示除2、12、18 號染色體外,Ah-KNOX在其余17 條染色體上均有分布(圖1A)。AhKNOX基因結(jié)構(gòu)分析發(fā)現(xiàn),各成員基因含有的外顯子數(shù)目范圍為2 ~8個(gè),其中,arahy.ZTJV1A.1的外顯子最少,為2個(gè);arahy.TRGC7G.1 含有的外顯子最多,達(dá)到8個(gè)(圖1B)。
圖1 花生KNOX 基因在染色體上的分布及基因結(jié)構(gòu)
利用擬南芥、花生的KNOX 氨基酸序列構(gòu)建進(jìn)化樹,KNOX基因家族蛋白可以分為Class Ⅰ和Class Ⅱ兩個(gè)亞家族,每個(gè)亞家族又可分為A 和B 兩個(gè)亞組(圖2)。 其中12個(gè)花生KNOX 蛋白與擬南芥STM、KNAT1 歸為Class ⅠA 組;4個(gè)花生KNOX 蛋白與擬南芥KNAT2、KNAT6 歸為Class ⅠB 組;2個(gè)花生KNOX 蛋白與擬南芥KNAT7 歸為Class ⅡA 組;8個(gè)花生KNOX 蛋白與擬南芥KNAT3、KNAT4、KNAT5 歸為Class ⅡB組。 所有花生KNOX 蛋白進(jìn)化樹末端的分支均有2個(gè)成員,且一個(gè)來自染色體1 ~10(四倍體A基因組),另一個(gè)來自染色體11~20(四倍體B 基因組),兩者為直系同源基因關(guān)系。
圖2 花生與擬南芥KNOX 基因家族系統(tǒng)進(jìn)化分析
利用MEME 在線工具對AhKNOX 進(jìn)行保守基序分析,結(jié)果顯示除arahy.ZTJV1A.1 外,其他KNOX 蛋白家族成員都含有Motif3;除arahy.JCQF9U.1、arahy.FU8PR5.1 外,其他KNOX 蛋白家族成員都含有Motif1;Motif5、Motif9 只在Class Ⅰ亞家族中存在,Motif4 只在Class Ⅱ亞家族中存在。 這可能說明不同分支的KNOX基因在花生中發(fā)揮不同功能。
利用CDD 工具檢測保守結(jié)構(gòu)域,結(jié)果顯示,26 條花生KNOX蛋白有20 條同時(shí)具有4個(gè)典型的結(jié)構(gòu)域,即KNOX1、KNOX2、ELK 和Homeobox_KN;有5 條具有3個(gè)結(jié)構(gòu)域,其中arahy.D6DE6U.1、arahy.EUX0L6.1、arahy.4NTH9K.1、arahy.C7XUBI.1 缺少ELK 結(jié)構(gòu)域,arahy.FU8PR5.1 缺少Homeobox_KN 結(jié)構(gòu)域;僅arahy.ZTJV1A.1 只含有Homeobox_KN 和ELK 兩個(gè)結(jié)構(gòu)域(圖3)。
圖3 花生KNOX 基因家族成員蛋白保守基序與結(jié)構(gòu)域
為了更好地研究AhKNOX表達(dá)調(diào)控機(jī)制,提取AhKNOX家族成員上游2 000 bp 的基因組序列并預(yù)測可能的順式作用元件。 結(jié)果顯示各成員的啟動(dòng)子區(qū)域均含有大量的順式作用元件,而且數(shù)量與種類存在明顯差異(圖4)。 26 條AhKNOX基因共預(yù)測到51 種元件,主要涉及植物生長發(fā)育及光、脅迫、激素響應(yīng)四大類。 其中,光響應(yīng)相關(guān)元件最多,包含Box 4、G-box、GT1-motif 等22種;其次為植物生長發(fā)育相關(guān)元件,包括種子特異性元件(RY-element)、胚乳表達(dá)元件(GCN4_motif)、O2-site(玉米醇溶蛋白代謝調(diào)節(jié)元件)、分生組織表達(dá)元件(CAT-box)等15 種元件,說明Ah-KNOX基因廣泛參與植物生長發(fā)育調(diào)控。 激素響應(yīng)相關(guān)元件包括脫落酸響應(yīng)(ABRE)、茉莉酸甲酯響應(yīng)(CGTCA-motif、TGACG-motif)、水楊酸響應(yīng)(TCA-element)、生長素響應(yīng)(TGA-element、AuxRR-core)、赤霉素響應(yīng)(P-box、GARE-motif)等8 種元件。 逆境脅迫相關(guān)元件包括ARE(厭氧誘導(dǎo))、TC-rich repeats(防御與脅迫壓力)、MBS(干旱誘導(dǎo))、LTR(低溫響應(yīng))、GC-motif(缺氧誘導(dǎo))和WUN-motif(創(chuàng)傷響應(yīng))6 種元件,推測部分AhKNOX基因參與逆境脅迫響應(yīng)。
圖4 花生KNOX 啟動(dòng)子順式作用元件分析
利用22個(gè)花生組織轉(zhuǎn)錄組測序數(shù)據(jù),構(gòu)建了25個(gè)AhKNOX基因的FPKM 值熱圖,如圖5A 所示,而arahy.0VJ2KM.1 未檢測到表達(dá)。 與玉米研究成果相似[17],AhKNOX基因的表達(dá)模式與其蛋白質(zhì)進(jìn)化分類呈現(xiàn)出較強(qiáng)一致性。 Class Ⅰ類基因主要在莖尖、果針等組織特異性高表達(dá)。 同一個(gè)基因在營養(yǎng)莖尖、生殖莖尖表達(dá)豐度趨于一致;入土前果針、入土后果針表達(dá)豐度趨于一致;但arahy.D6DE6U.1、arahy.EUX0L6.1、arahy.EP4LC1.1、arahy.VD5ZG0.1 在莖尖、果針表達(dá)豐度差異較大,推測這4個(gè)基因在花生果針與莖尖分生組織的形成以及功能維持上出現(xiàn)了功能分化。 arahy.B0V7RI.1、arahy.V2YWYI.1 在花器官中表達(dá)豐度較高,arahy.U5Q1QL.1、arahy.Z81W9B.1、arahy.EDBH1H.1、arahy.F9ETHR.1 在花生莢果發(fā)育初期表達(dá)豐度較高。 Class Ⅱ類基因在不同組織及發(fā)育時(shí)期均有表達(dá)。
圖5 花生KNOX 基因表達(dá)熱圖
為探究不同非生物脅迫處理下AhKNOX基因的表達(dá)模式,利用NaCl、PEG6000(模擬干旱)、低溫、高溫、過氧化氫、ABA、茉莉酸甲酯處理下花生幼苗期葉片和根組織轉(zhuǎn)錄組測序數(shù)據(jù),采用TBtools 構(gòu)建相對表達(dá)量的熱圖。 結(jié)果顯示部分基因受非生物脅迫影響,表達(dá)量較對照變化較大(圖5B)。 其中一些基因參與特定脅迫下的應(yīng)答,如arahy.VD5ZG0.1 在鹽和低溫脅迫下的根中表達(dá)大幅上調(diào),arahy.EP4LC1.1、arahy.F9ETHR.1 在干旱脅迫下的根中表達(dá)大幅上調(diào),arahy.EUX0L6.1在H2O2處理下的根中表達(dá)大幅上調(diào),arahy.ZTJV1A.1 在高溫脅迫下的根中表達(dá)大幅下調(diào),推測部分AhKNOX基因參與花生抗逆響應(yīng)。
基于轉(zhuǎn)錄組數(shù)據(jù)篩選得到兩個(gè)能夠特異性響應(yīng)PEG 處理的AhKNOX基因(arahy.EP4LC1.1 和arahy.F9ETHR.1),為探究其具體響應(yīng)規(guī)律,用18%的PEG6000 處理3 d 后復(fù)水2 d,通過RTqPCR 分析其表達(dá)模式。 結(jié)果(圖6)顯示,arahy.EP4LC1.1 和arahy.F9ETHR.1 均特異性響應(yīng)PEG脅迫,但響應(yīng)模式不同。 arahy.EP4LC1.1 隨著處理時(shí)間的延長表達(dá)量呈逐漸降低趨勢,復(fù)水2 d能夠恢復(fù)到正常水平;arahy.F9ETHR.1 的表達(dá)在處理1 d 后下調(diào),處理2 d 上調(diào)至2.5 倍,處理3 d表達(dá)量又下降但仍顯著高于對照,復(fù)水2 d 后仍顯著低于正常表達(dá)水平。
圖6 arahy.EP4LC1.1(A)和arahy.F9ETHR.1(B)在PEG6000 處理下的表達(dá)分析
KNOX基因家族作為一類轉(zhuǎn)錄因子,廣泛參與植物生長發(fā)育調(diào)控。 隨著高通量測序技術(shù)的發(fā)展,KNOX 轉(zhuǎn)錄因子家族已在多種植物中鑒定出來,但目前尚未見對花生KNOX基因的研究報(bào)道。本研究第一次在花生全基因組水平上對KNOX基因家族進(jìn)行了鑒定,并對其基因結(jié)構(gòu)、蛋白質(zhì)保守結(jié)構(gòu)域、系統(tǒng)進(jìn)化、基因表達(dá)模式進(jìn)行分析,可為進(jìn)一步研究AhKNOX基因的功能奠定基礎(chǔ)。
本研究共鑒定出26個(gè)花生KNOX基因家族成員,數(shù)量與同為豆科植物的大豆(27個(gè))相近[30]、遠(yuǎn)多于模式植物擬南芥(8個(gè))。 擴(kuò)充了的AhKNOX基因家族,可以滿足花生特有器官發(fā)育、復(fù)雜環(huán)境適應(yīng)等其他功能的細(xì)化需求。 對花生KNOX 蛋白保守結(jié)構(gòu)域分析發(fā)現(xiàn),除6個(gè)Ah-KNOX 蛋白外,其余AhKNOX 蛋白均含有4個(gè)典型結(jié)構(gòu)域;arahy.ZTJV1A.1 僅含有Homeobox_KN結(jié)構(gòu)域和ELK 結(jié)構(gòu)域,arahy.FU8PR5.1 缺少Homeobox_KN 結(jié)構(gòu)域,但兩者在果針入土前后有較高的表達(dá)。 果針為花生屬特異性組織器官,推測這兩個(gè)基因在果針發(fā)育中發(fā)揮一定的功能,具體機(jī)制有待進(jìn)一步研究。
AhKNOX在花生22個(gè)組織中的表達(dá)豐度分析顯示,Class Ⅰ類基因主要在莖尖、果針等組織中表達(dá),其中4個(gè)與擬南芥STM基因直系同源的基因在莖尖和果針處表達(dá)豐度差異較大。 擬南芥中STM在莖尖分生組織的形成以及功能維持中發(fā)揮作用,進(jìn)一步研究這4個(gè)KNOX基因在花生莖、果針發(fā)育過程中的功能分化,將有助于理解花生果針發(fā)育的特殊性。
植物KNOX基因不僅調(diào)控生長發(fā)育,還可以響應(yīng)不同非生物脅迫[31-32]。 本研究對AhKNOX家族成員的啟動(dòng)子順式作用元件進(jìn)行分析,發(fā)現(xiàn)AhKNOX基因除了有保守的光響應(yīng)元件外,還包含多種不同的逆境脅迫相關(guān)元件,推測該家族基因在花生響應(yīng)植物逆境脅迫中存在功能分化。 利用7 種非生物脅迫處理的花生轉(zhuǎn)錄組數(shù)據(jù)對Ah-KNOX基因家族表達(dá)模式進(jìn)行進(jìn)一步分析,發(fā)現(xiàn)有5個(gè)基因參與某特定脅迫下的應(yīng)答,如arahy.EP4LC1.1 和arahy.F9ETHR.1 特異性響應(yīng)干旱脅迫。 RT-qPCR 驗(yàn)證結(jié)果顯示這兩個(gè)基因在PEG處理及復(fù)水后表達(dá)均發(fā)生顯著變化。 這些基因在花生應(yīng)對干旱脅迫中的具體作用有待進(jìn)一步研究。