李曉凱,劉 霞,常紅娟,王鳳茹
(河北省植物生理與分子病理學重點實驗室/河北農(nóng)業(yè)大學真菌毒素與植物分子病理學實驗室,河北 保定 071000)
START 結構域是一個長度約為220 個氨基酸且可以結合并轉移脂質的結構域。X 射線晶體學揭示了START 域的α/β 螺旋和反平行β 折疊結構,內(nèi)含一個疏水腔,腔內(nèi)可容納單一配體分子,如固醇、磷脂、膽汁酸和神經(jīng)酰胺[1]。據(jù)報道,一些含START 結構域的蛋白質還可與類胡蘿卜素和葉黃素結合[2]。已有研究表明START 結構域在動物中具有重要的生物學功能[3-14],但植物中START 結構域的功能及作用機制尚不明確。擬南芥中,START結構域家族可分為僅含START 結構域和多結構域家族兩類,分別由9 個和26 個成員組成。根據(jù)結構域組成的不同,可把35 個成員分為5 個亞家族,分別為僅含START 結構域亞家族、START-DUF1336 結構域亞家族、PH-START-DUF1336 結構域亞家族、HD-ZIP-START 結構域亞家族、HD-ZLZ-START結構域亞家族。在HD-ZLZ-START 結構域亞家族中,已被報道具有生物學功能的有ATML1、PDF2、FWA、GL2 和AtEDT1,其中ATML1 和PDF2 通過與其啟動子區(qū)高度保守的L1 Box 結合來調控相關特異性基因表達[15]。atml-1 pdf2-1雙突變體表現(xiàn)出嚴重的幼苗生長遲緩,芽表皮分生組織缺陷以及開花前生長遲滯的現(xiàn)象,對單基因不同位點突變體分析結果發(fā)現(xiàn),ATML1 和PDF2 是胚胎發(fā)生過程中所必需的[16]。FWA 的過量表達會導致植株花序發(fā)生異常。ANL2 參與花青素的積累和皮層的發(fā)育,anl2突變體不僅在花青素積累存在缺陷[17],而且在根的皮層發(fā)育中也存在缺陷。GL2基因缺失后,擬南芥表皮毛數(shù)量及分枝數(shù)表現(xiàn)出顯著的增多[18],AtEDT1在擬南芥中過表達后可以促進根系的伸長,提高植物對深層土壤水分的吸收,從而提高抗旱性[19]。HD-ZIP-START 結構域亞家族中PHB、PHV 和REV胚胎發(fā)生過程中起著關鍵作用,rev 突變體葉片面積增大并發(fā)生卷曲,rev/phv雙重突變體出現(xiàn)喇叭狀葉片,近軸面表現(xiàn)出遠軸面特性,rev/phb/phv三重突變體的葉片幾乎全是喇叭狀,遠軸化特征加?。?0]。擬南芥PH-START-DUF1336 結構域亞家族和STARTDUF1336結構域亞家族成員生物學功能尚未見報道,僅含START 結構域亞家族成員除本實驗室前期在逆境脅迫下有關報道外,也尚未見其它研究[21]。
本研究利用生物信息學方法,對擬南芥START結構域家族成員進化關系、理化性質、基因結構和啟動子作用元件進行分析;利用qRT-PCR 技術分析了編碼僅含START 結構域蛋白基因在擬南芥發(fā)育不同部位的表達量,并對僅含START 結構域亞家族的8 個成員的功能獲得和功能缺失轉基因擬南芥幼苗形態(tài)進行了觀察,為闡述START 結構域在擬南芥生長發(fā)育過程中的生物學功能和作用機制奠定了基礎。
哥倫比亞野生型擬南芥(Arabidopsis thalianaColumbia, Col-0)和僅含START 結構域亞家族功能獲得轉基因植株種子均由河北農(nóng)業(yè)大學真菌毒素與植物分子病理學實驗室保存。
擬南芥僅含START 結構域亞家族成員的T-DNA插 入 突 變 體(SALK-106413C、SALK-053628、SALK-093319、SALK-053261、SALK-102986、SALK-006629、GK-067A04 和GK-056A02),均購于美國ABRC(Arabidopsisiological Resource Center)突變體庫,將其依次編號為stard1~stard8。
從 TAIR(The Arabidopsis Information Resource)數(shù)據(jù)庫下載擬南芥START 結構域家族成員的蛋白序列,利用MEGA7.0 軟件構建系統(tǒng)發(fā)育進化樹,利用MEGA7.0 軟件分析和構建系統(tǒng)進化樹,統(tǒng)計方法為NJ 法。
利用ProtParam(web.expasy.org/protscale/)對擬南芥START 結構域家族成員的理化性質進行分析,利用NCBI 的CD-search 工具預測保守結構域的位置信息。
利用NCBI(https://www.ncbi.nlm.nih.gov/)網(wǎng)站獲取START 結構域家族成員的基因序列和CDS序列,利用在線工具GSDS(https://www.himiku.com/amp/gsds)繪制基因結構圖。
基于公共數(shù)據(jù)平臺NCBI 下載關于擬南芥基因組的注釋信息,使用TBTOOLS 軟件中的Gtf/Gff3 序列提取工具,選取含START 結構域家族成員CDS 上游2 000 bp 的啟動子序列,將提取到的序列提交至plantcare(http://bioinformatics.psb.ugent.be/webtools/plantcare/)進行順式元件預測,根據(jù)反饋結果,使用TBTOOLS 軟件中的生物序列查看(BioSequence viewer)功能對擬南芥含START 結構域家族成員的啟動子作用元件進行可視化分析。
先將擬南芥種子進行消毒殺菌,然后均勻的撒在盛有MS 培養(yǎng)基的培養(yǎng)皿中使其萌發(fā)(過表達株系種子撒種在含0.1%潮霉素的MS 培養(yǎng)基),用封口膜封好后放在4 ℃冰箱春化2 ~3 d,取出轉移至光照培養(yǎng)箱中培養(yǎng),培養(yǎng)條件為20 ℃,光照條件為16 h 光照和8 h 黑暗交替進行,待幼苗長到4 片真葉時,將幼苗從培養(yǎng)皿中移植到蛭石和營養(yǎng)土1∶1(v/v)的培養(yǎng)盒中,并定期澆營養(yǎng)液保證其正常生長。
待擬南芥生長至4 周大小時,分別取擬南芥的根、莖、蓮座葉和莖生葉等不同的組織和轉基因植株成熟蓮座葉,放入液氮后轉移至-80℃冰箱保存。提取RNA 步驟參考全式金Trzol 法(詳細步驟參考說明書)。cDNA 第一條鏈的合成使用蘇州宇恒生物科技公司UEIris II RT-PCR System for First-Strand cDNA Synthesis( with dsDNase)試劑盒操作說明書步驟完成,每次設置3 個生物學重復。
擬南芥樣品總RNA 的提取完成后,采用TaKaRa PrimeScript TM RT reagent Kit with gDNA Eraser 試劑盒,反轉錄合成第一條cDNA 鏈,利用內(nèi)參基因UBQ5和編碼僅含START 結構域亞家族基因的特異性引物,參照 TransStart Tip Green qPCR Super Mix 說明書進行實時熒光定量分析。每個處理3 次重復,且以野生型在不同部位表達量為1 的基因轉錄水平作對照,采用比較 Ct 值法(2-ΔΔCt法)分析各個基因在擬南芥的不同部位和不同轉基因植株中的相對表達水平。
利用Prime 5.0(加拿大Premier 公司)、NCBI網(wǎng) 站Primer-blast 和DNAMAN( 美 國 的Lynnon Biosoft 公司)設計引物。本試驗所用相關引物均為通用生物有限公司合成,引物序列見表1。
表1 試驗中所需引物Table 1 Primers needed in the experiment
為了解START 結構域蛋白家族的進化關系,以擬南芥含START 結構域35 個成員的氨基酸序列構建系統(tǒng)發(fā)育進化樹。結合前期研究,根據(jù)所含結構域的不同,將擬南芥START 結構域家族35 個成員分為5 個亞家族,HD-ZIP-START 亞家族有5 個成員,PH-START-DUF1336 亞家族有4 個成員,START-DUF1336 亞家族有1 個成員,僅含START結構域亞家族有9 個成員。如圖1 所示,加粗部分為僅含START 結構域亞家族成員,可以看出,9 個成員共分布在4 個大分枝上,At4g26920 和At5g07260在同一個分枝,與其它成員親緣關系較遠。
圖1 擬南芥含START 結構域基因進化關系分析Fig.1 Analysis on the evolutionary relationship of Arabidopsis genes containing START domain
利用ProtParam、ProtScale 對擬南芥START 結構域家族成員的理化性質進行分析。結果顯示(表2),該家族成員不穩(wěn)定系數(shù)為36.92 ~58.65,大多數(shù)成員不穩(wěn)定系數(shù)在40 以上,表明結構不穩(wěn)定。其中含START 結構域的多結構域亞家族等電點pI<7 的蛋白達到88%以上,多數(shù)為酸性氨基酸。而僅含START 結構域亞家族等電點pI >7 的蛋白達到88%以上,多數(shù)為堿性氨基酸。
表2 擬南芥START 結構域家族蛋白理化性質分析Table 2 Analysis of physicochemical properties of Arabidopsis START domain family proteins
跨膜片段預測顯示,在擬南芥START 結構域家族中,只有僅含START 結構域亞家族存在跨膜片段,其中At3g13062、At1g55960、At3g23080 和At1g64720 蛋白氨基末端包含單個跨膜片段,序列相似性較高的At4g14500 和At5g54170 均含有2 個跨膜片段,
利用NCBI 的CD-search 工具預測基因的保守結構域的位置,發(fā)現(xiàn)START 結構域的大小在不同亞家族中出現(xiàn)明顯變化,在HD-ZLZ-START 亞家族中START 結構域從羧基端開始定位至大約470 個氨基酸的位置,HD-ZIP-START 亞家族中START 結構域從羧基端開始定位至大約370個氨基酸的位置,PH-START-DUF1336 亞家族中START 結構域亞家族中START 結構域位于2 個結構域之間,而僅含START 結構域亞家族START 結構域從羧基端開始定位至大約300 個氨基酸的位置,位置的差異可能導致功能上的改變(表3)。
表3 擬南芥START 結構域家族START 結構域分析Table 3 Analysis of START domain of Arabidopsis START domain family
續(xù)表:
內(nèi)含子-外顯子結構的多樣性也暗示基因在進化過程中復雜功能,其中外顯子作為基因中的保守部分,對判斷生物演化提供依據(jù)。結果如圖2,編碼START 結構域基因具有相對復雜的結構,所有基因均被內(nèi)含子打斷。編碼僅含START 結構域亞家族的基因外顯子數(shù)目均為6 個以下,其中At5g49800最少,只含有4 個外顯子,而編碼含START 結構域的多結構域亞家族的基因其外顯子數(shù)目明顯增多,編碼含PH-START-DUF1336 結構域蛋白的基因外顯子數(shù)目均為15 個以上,結構更為復雜。上述結果表明,隨著擬南芥START 結構域家族的進化,外顯子/內(nèi)含子的數(shù)目也在變化,相同亞家族間比較保守,可能具有類似的生物學功能。
圖2 擬南芥含START 結構域基因結構分析Fig.2 Analysis of gene structure of Arabidopsis gene containing START domain
通過在線網(wǎng)站phytozome 獲取編碼START 結構域蛋白家族基因上游2 000 bp 作為啟動子序列,鑒定出的啟動子作用元件與植物生長發(fā)育,激素和脅迫響應具有一定關聯(lián)。其中與植物生長發(fā)育相關的有分生組織表達調控元件(CAT-box)、玉米醇溶蛋白代謝元件(O2-site)、胚乳特異性表達元件(Element involved in Endosperm Expression)等,與激素相關有脫落酸(abscisic acid,ABA)響應元件、茉莉酸甲酯(Methyl Jasmonate,MEJA)響應元件,生長素(TGA-element)響應元件等。同時還發(fā)現(xiàn)編碼START 結構域蛋白家族的基因中還含有響應非生物脅迫的作用元件且在多個基因中被鑒定出,如:干旱脅迫響應元件(MBS)、低溫響應元件(LTRmotif)等。此外,START 結構域不同亞家族成員啟動子區(qū)作用元件類型有差異,如僅含START 結構域亞家族大部分成員含有分生組織表達調控元件、玉米醇溶蛋白代謝元件和低溫響應元件,其它多結構域亞家族中啟動子區(qū)相應元件較少,而赤霉素作用元件(P-box)和赤霉素響應元件(GARE-motif)在僅含START 結構域亞家族大部分成員中缺失,在其它多結構域亞家族中較多(圖3)。
圖3 擬南芥含START 結構域基因啟動子作用元件分析Fig.3 Analysis of the role elements of Arabidopsis thaliana gene promoter containing START domain
利用qRT-PCR 技術分析僅含START 結構域亞家族成員在擬南芥不同器官的表達量。結果如圖4 所 示。其 中At1g55960、At5g54170、At4g26920和At5g07260 在不同組織中表達量存在明顯差異,在種子中表達量較高,在其它組織中表達量較少,At3g13062、At3g23080、At4g14500 和At1g64720在蓮座葉和莖生葉中表達量較高。
圖4 擬南芥僅含START 結構域亞家族在不同部位的表達量Fig.4 Arabidopsis only contains the expression levels of the START domain subfamily in different parts
取過表達與突變體植株的成熟蓮座葉,進行qRT-PCR 表達量驗證(圖5)。qRT-PCR 結果表明,所選取的過表達擬南芥內(nèi)編碼僅含START 結構域基因表達量均高于野生型,突變體植株內(nèi)編碼僅含START 結構域基因的表達量均低于野生型。為了方便命名,我們將驗證好的過表達植株按表達量由高到低命名為OE-1、OE-2、OE-3,后續(xù)表型觀察選取過表達植株的一個株系并命名為At3g13062-OE、At1g55960-OE、At3g23080-OE、At4g14500-OE、At5g54170-OE、At1g64720- OE、At4g26920-OE 和At5g07260-OE;各自的T-DNA 插入突變體用At3g13062-T、At1g55960-T、At3g23080-T、At4g14500-T、At5g54170-T、At1g64720- T、At4g26920-T 和At5g07260-T 表示。
圖5 僅含START 結構域亞家族過表達和突變體植株的驗證Fig.5 Validation of overexpression of subfamily containing only START domain and mutant lines
將野生型、過表達和突變體植株種子春化后正常培養(yǎng)14 d 后對幼苗進行觀察。如圖6 所示,與野生型相比,過表達植株幼苗出現(xiàn)了極性的改變,但葉片大小未發(fā)生改變。At1g55960 過表達幼苗真葉葉柄短粗,At3g23080 過表達幼苗葉片發(fā)生卷曲,第一對真葉在近軸面出現(xiàn)遠軸面表型,At5g54170 和At4g26920 過表達幼苗真葉出現(xiàn)非對稱生長,同時期野生型有一對子葉和兩對真葉,而At3g13062、At4g14500 和At1g64720 過表達幼苗第一對真葉只長出一片葉子,葉片發(fā)育明顯受阻。突變體對稱性也出現(xiàn)變化,但極性發(fā)生改變的程度不如過表達嚴重。上述結果表明,僅含START 結構域亞家族成員表達量的改變會影響擬南芥幼苗期的發(fā)育。
圖6 幼苗時期表型觀察Fig.6 Phenotype observation at the seedling stage
START 結構域是一個保守的結構域,主要參與脂質運輸、代謝和細胞信號轉導。由于它具有和脂質配體的物質結合的特性,可以結合不同的配體。START 結構域在動物中負責將急性調節(jié)蛋白中的膽固醇運輸?shù)骄€粒體內(nèi)膜,而在之后的研究中證明,人類的諸多疾病都與START 結構域蛋白密切相關[1-2]。
目前為止,START 結構域在多個物種中被鑒定出,其中水稻有29 個,擬南芥有35 個,人和小鼠中各有15 個,秀麗隱桿線蟲和黑腹果蠅分別有7 個和4 個。在動物和植物中,大多數(shù)含START 結構域蛋白已經(jīng)發(fā)生不同的進化。RhoGAP-START 結構域僅存在于動物中,植物中不存在。但在植物中出現(xiàn)了2 個動物中不存在的HD-START 結構域亞家族,這些植物特有的START 結構域蛋白在雙子葉和單子葉植物中均被克隆到,進化關系上,它們起源于植物譜系的一個古老祖先。不同結構域的組合可能提高了植物在脂質或甾醇類信號的轉導效率。
PHB 顯性突變體Phb-1d 是第一個發(fā)現(xiàn)的葉片極性缺陷突變體[20],在成熟蓮座葉中出現(xiàn)近軸化的針狀葉和棒狀葉。調控葉片近軸面化基因還有PHV,它們的突變體均在葉的邊緣處出現(xiàn)近軸化的表型,葉片呈現(xiàn)棒狀和荷葉狀,這兩者表型十分類似。同屬該家族的還有REV,且擬南芥rev 突變體葉片增大并卷曲。本研究中僅含START 結構域亞家族在幼苗葉片發(fā)育時表現(xiàn)出和野生型明顯的差異,子葉向下卷曲,過表達植株第2 片真葉無法生長,植株對稱性發(fā)生下降。突變體植株中也出現(xiàn)這種情況,但并沒有過表達植株明顯。這說明START 結構域本身就具有調控近遠軸極性建成的作用。
對僅含START 結構域亞家族成員突變體和過表達轉基因擬南芥幼苗形態(tài)比較發(fā)現(xiàn),各成員的過表達植株均表現(xiàn)為不同程度的非對稱生長特性,結合過表達轉基因擬南芥中目的基因的表達水平分析,At1g55960 和At5g07260 的過表達水平很高,分別達到野生型的16 倍和47 倍(圖5),但這2個成員的過表達植株的表型并未表現(xiàn)為比其它成員的過表達植株(基因表達水平均是野生型得10 倍以下)更為嚴重的表型(圖6)。這可能與各亞家族成員在組織水平的表達特異性相關,因為本研究觀察的是幼苗形態(tài),分析的是蓮座葉的生長發(fā)育,而At1g55960 和At5g07260 在蓮座葉表達水平很低(圖4),而過表達植株表型嚴重的At3g13062、At4g14500 和At1g64720 均在蓮座葉中表達量較高(圖4、圖6),暗示著亞家族成員在幼苗期的生物學功能與其表達特性密切相關。
研究還發(fā)現(xiàn)僅含START 結構域亞家族成員的T-DNA 插入突變體的表型不如過表達植株明顯,但也表現(xiàn)出第2對真葉非對稱生長和發(fā)育受阻的表型,這說明START 結構域在植物中的功能可能與在動物中相似,表達量過高和過低均會影響植物的生長發(fā)育,之所以T-DNA 插入突變體表型不如過表達植株明顯,可能是該亞家族成員的功能冗余原因所致。
綜上所述,本研究運用生物信息學方法和qRTPCR 技術,對擬南芥START 結構域家族成員進行了系統(tǒng)發(fā)育、理化性質、基因結構、啟動子作用元件和組織表達特異性分析,并結合對僅含START 結構域亞家族功能獲得和功能缺失轉基因擬南芥表型的觀察,發(fā)現(xiàn)其參與調控植物生長發(fā)育的進程,為下一步探究其功能和作用機制提供理論依據(jù)。