呂 赟,丘日光,楊仕梅,吳佳海,宋 莉
(1.貴州大學(xué) 生命科學(xué)學(xué)院/農(nóng)業(yè)生物工程研究院/山地植物資源保護與種質(zhì)創(chuàng)新教育部重點實驗室/貴州省農(nóng)業(yè)生物工程重點實驗室,貴州 貴陽 550025; 2.貴州省草業(yè)研究所,貴州 貴陽 550006)
植物對外界環(huán)境變化的適應(yīng)性生長發(fā)育與激素調(diào)控密切相關(guān)[1-2],生長素(Auxin,IAA)是調(diào)控該過程的關(guān)鍵激素之一[3-5],在植物生長發(fā)育過程中呈濃度梯度的時空不對稱分布[6],這與其極性運輸方式有關(guān)[7]。植物生長素極性運輸由生長素輸出載體蛋白PIN-formed (PIN)家族、AUXIN RESISTANT1/LIKE AUX1家族(AUX1/LAX)和 ATP-Binding Cassette subfamily B/P-glycoprotein家族(PGP/ABCB)3類蛋白質(zhì)介導(dǎo)[8],其中PIN和PGP/ABCB屬于外向型運輸?shù)鞍踪|(zhì),AUX1/LAX屬于內(nèi)向型運輸?shù)鞍踪|(zhì)。PIN基因結(jié)構(gòu)及其編碼的蛋白質(zhì)特性是其實現(xiàn)生物學(xué)功能的基本前提,PIN基因家族的跨膜蛋白是植物特有的生長素輸出載體蛋白,幾乎存在于所有的植物中,在生長素極性運輸中發(fā)揮關(guān)鍵作用[9-10]。
百脈根(Lotuscorniculatus)為豆科百脈根屬多年生草本植物,其營養(yǎng)豐富、皂素含量低、適口性好、采食率高,是一種優(yōu)質(zhì)牧草[11-12]。同時,因其匍匐生長、覆蓋度好,根系較為發(fā)達,自繁能力強,在改造小流域、保持水土和提高經(jīng)濟效益中也有著重要價值[13-14]。此外,百脈根還具有再生力強、自交結(jié)實、遺傳轉(zhuǎn)化效率高、易得到穩(wěn)定遺傳的后代等優(yōu)點,常用作豆科模式植物進行生物學(xué)及基因組學(xué)研究[15-17]。PIN基因在擬南芥和水稻等模式植物中研究得較為清楚,但在百脈根中鮮見報道,鑒于此,利用擬南芥PIN蛋白家族信息,在百脈根全基因組數(shù)據(jù)中對其PIN基因家族成員(LjPIN)進行鑒定,并分析該基因家族成員的進化關(guān)系、編碼的蛋白質(zhì)理化性質(zhì)、順式作用元件組成及組織差異表達等,旨在為百脈根LjPIN的功能研究奠定基礎(chǔ)。
百脈根PIN基因及編碼蛋白質(zhì)序列來自百脈根全基因組數(shù)據(jù)庫(http://www.kazusa.or.jp/lotus/),擬南芥PIN蛋白家族序列來自KEGG數(shù)據(jù)庫(http://www.kegg.jp/),水稻PIN蛋白家族序列來自Pfam數(shù)據(jù)庫(http://pfam.xfam.org/family/PF03547/),大豆PIN蛋白家族序列參考WANG等[18]的報道。
通過構(gòu)建隱馬爾科夫模型,用Pfam數(shù)據(jù)庫(http://pfam.xfam.org/)含Mem_trans domain(PF03547)的模型與百脈根全基因組序列構(gòu)建比對庫,篩選鑒定百脈根PIN基因;通過在線軟件MG2C(http://mg2c.iask.in/mg2c_v2.0/)對獲得的PIN基因進行染色體定位,基因命名根據(jù)所在染色體位置進行。
從數(shù)據(jù)庫(http://www.kazusa.or.jp/lotus/)獲得百脈根PIN基因的外顯子和內(nèi)含子數(shù)據(jù)并進行分析,用GSDS 2.0基因結(jié)構(gòu)顯示系統(tǒng)(http//gsds.cbi.pku.edu.cn/)繪制基因結(jié)構(gòu)圖。利用MEGA 7.0鄰接法(Neighbor-joining,NJ)構(gòu)建百脈根、擬南芥、水稻和大豆的PIN蛋白進化樹,Bootstrap值設(shè)置為1 000,缺口設(shè)置“pairwise deletion”,采用“poisson model”驗證可信度。
采用ExPASy ProtParam(http://cn.expasy.org)程序?qū)Π倜}根PIN基因家族編碼的蛋白質(zhì)分子質(zhì)量、理論等電點、不穩(wěn)定系數(shù)和親水性指數(shù)進行分析;利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預(yù)測蛋白質(zhì)二級結(jié)構(gòu);通過MEME工具(http://meme.nbcr.net/meme/)分析蛋白質(zhì)保守基序(Motif),設(shè)置基序數(shù)量15個,其余參數(shù)為默認條件。
參考文獻[19],利用在線預(yù)測工具PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對獲得的百脈根PIN基因上游2 000 bp序列和主要的順式作用元件進行預(yù)測和分析。
從基因芯片數(shù)據(jù)庫(https://ljgea.noble.org/v2/)獲得百脈根PIN基因在根、莖、葉、花等器官及不同時期種子的表達量數(shù)據(jù),并進行分析、作圖。
經(jīng)比對共獲得35條LjPIN序列(表1),屬于27個候選基因,其中,LjPIN2、LjPIN6、LjPIN7、LjPIN19、LjPIN25和LjPIN27基因各2條LjPIN序列,LjPIN26基因有3條LjPIN序列,其他LjPIN基因各1條LjPIN序列。Lj0g3v0172269、Lj0g3v0320849、Lj1g3v0264160、Lj3g3v3735560、Lj5g3v0323470、Lj5g3v1174510和Lj5g3v2166080共7條序列存在可變剪切。通過Pfam數(shù)據(jù)庫對所有候選基因保守結(jié)構(gòu)域進行分析發(fā)現(xiàn),27個候選基因均含有PIN基因家族保守結(jié)構(gòu)域Mem_trans(PF03547)。
表1 LjPIN基因家族基本信息Tab.1 Basic information of LjPIN gene family members
注:+表示與染色體測序方向一致;-表示與染色體測序方向不一致。
Note: +means consistent with chromosome sequencing direction; - means inconsistent with the direction of chromosome sequencing.
根據(jù)百脈根基因組信息分析27個PIN基因在染色體上的分布情況。百脈根共有6條染色體(Chr1—Chr6),另定義Chr0為無法定位到染色體上的基因所虛構(gòu)的一條染色體。分析表明,在Chr1、Chr2、Chr3、Chr4、Chr5上分別分布著4、6、3、5、3個PIN基因, Chr6上無PIN基因分布,其中Lj0g3v0103729、Lj0g3v0172269、Lj0g3v0178829、Lj0g3v0178879、Lj0g3v0276789和Lj0g3v0320849存在于Chr0上(圖1)。
對鑒定得到的27個LjPIN基因進行系統(tǒng)進化、內(nèi)含子和外顯子分析。結(jié)果(圖2)表明,百脈根PIN基因家族除了LjPIN4、LjPIN13、LjPIN23這3個以外,其他均含1~10個內(nèi)含子和1~10個外顯子,其中LjPIN1和LjPIN2還存在非編碼區(qū)(UTR)。根據(jù)AtPIN與LjPIN的進化關(guān)系,參考文獻[20],可以將LjPIN分為兩大類,其中LjPIN3、4、6、10、11、13、20、21、22、23為Long PIN,其余的LjPIN成員為Short PIN。
Chr0為虛擬的一條染色體Chr0 is a virtual chromosome圖1 LjPIN基因的染色體定位分布Fig.1 Location map of LjPIN in chromosome
圖2 LjPIN的基因結(jié)構(gòu)和系統(tǒng)發(fā)育關(guān)系Fig.2 Gene structure and phylogenetic relationship of LjPIN
為了研究百脈根PIN基因與其他植物的親緣關(guān)系,對植物PIN蛋白家族進化進行探討。利用PIN基因研究較多的擬南芥、水稻和大豆3種植物與百脈根共78個PIN蛋白序列構(gòu)建系統(tǒng)進化樹(圖3)。分析發(fā)現(xiàn),百脈根LjPIN蛋白與擬南芥AtPIN、大豆GmPIN的進化關(guān)系較接近,而與水稻OsPIN的進化關(guān)系較遠。其中16個LjPIN未能與其他物種的PIN聚類到一起,可能與物種分化后因不同選擇壓力導(dǎo)致的進化方向不同有關(guān),可作為百脈根LjPIN基因鑒定的分子特征。
?表示未能與其他物種的PIN聚類到一起的16個LjPIN?means 16 LjPINs that failed to cluster with PINs from other species圖3 擬南芥、大豆、水稻和百脈根PIN蛋白的系統(tǒng)進化樹Fig.3 Phylogenetic tree of PIN proteins from Arabidopsis thaliana,soybean,rice and Lotus corniculatus
蛋白質(zhì)序列特性分析(表2)表明,LjPIN蛋白序列長度在108~645個氨基酸,其中最長的是LjPIN20,長度為645個氨基酸,蛋白質(zhì)分子質(zhì)量為70.112 00 ku;最短的是LjPIN7.2,長度為108個氨基酸,分子質(zhì)量為12.098 51 ku。35個PIN蛋白的理論等電點在5.33~9.94,除了LjPIN1、LjPIN2、LjPIN3、LjPIN5、LjPIN15、LjPIN16和LjPIN27為酸性蛋白質(zhì)外,其他均為堿性蛋白質(zhì)。不穩(wěn)定系數(shù)比較發(fā)現(xiàn),除了LjPIN8、LjPIN11、LjPIN12、LjPIN15、LjPIN16、LjPIN19.2、LjPIN21、LjPIN22和LjPIN26.2為不穩(wěn)定蛋白質(zhì)(不穩(wěn)定系數(shù)>40)外,大部分PIN蛋白為穩(wěn)定蛋白質(zhì)。親水性指數(shù)分析得到,LjPIN1、LjPIN2、LjPIN5、LjPIN7.1、LjPIN8、LjPIN9、LjPIN14、LjPIN15、LjPIN16、LjPIN17、LjPIN18、LjPIN25、LjPIN27蛋白均為疏水蛋白質(zhì),其余LjPIN蛋白為兩性蛋白質(zhì),親水性介于-0.5~0.5(GRAVY為負值表示親水性,正值表示疏水性)。
蛋白質(zhì)結(jié)構(gòu)分析(表3)表明,LjPIN蛋白由α-螺旋、延伸鏈、β-轉(zhuǎn)角、無規(guī)卷曲4種二級結(jié)構(gòu)元件組成,并以α-螺旋和無規(guī)卷曲2種元件為主。LjPIN1、LjPIN2.1、LjPIN2.2、LjPIN5、LjPIN7.1、LjPIN7.2、LjPIN8、LjPIN9、LjPIN13、LjPIN14、LjPIN15、LjPIN16、LjPIN17、LjPIN19.1、LjPIN19.2、LjPIN23、LjPIN25.1、LjPIN25.2、LjPIN27.1和LjPIN27.2等20個蛋白質(zhì)中的α-螺旋占比高于無規(guī)卷曲,其他LjPIN蛋白中則是α-螺旋占比低于無規(guī)卷曲。
表2 LjPIN蛋白的基本特性Tab.2 Basic characteristics of LjPIN proteins
表3 LjPIN蛋白的二級結(jié)構(gòu) Tab.3 Secondary structure of LjPIN proteins
續(xù)表3 LjPIN蛋白的二級結(jié)構(gòu) Tab.3(Continued) Secondary structure of LjPIN proteins
保守基序分析(圖4—5)發(fā)現(xiàn),35個LjPIN蛋白的保守基序數(shù)量介于2~9個,其中,LjPIN1的保守基序數(shù)量最少(2個),LjPIN20的保守基序數(shù)量最多(9個)?;騇otif6、Motif7、Motif9、Motif10和Motif13在LjPIN基因編碼的蛋白質(zhì)中分布最廣,分別存在于15個LjPIN基因中,表明這些基序在LjPIN蛋白的進化上具有相對保守性。
氨基酸位置 Amino acid position圖4 LjPIN蛋白的Motif分布Fig.4 Motif distribution of LjPIN proteins
圖5 LjPIN蛋白的關(guān)鍵MotifFig.5 Key motif of LjPIN proteins
通過對PIN基因上游2 000 bp序列進行分析發(fā)現(xiàn)(圖6),LjPIN基因家族除了存在大量的順式作用基本元件CAAT-box和TATA-box外,還存在光合反應(yīng)、激素調(diào)控和生長發(fā)育相關(guān)的3類順式作用元件,具體包括:(1)光響應(yīng)調(diào)節(jié)元件G-Box;(2)生長素響應(yīng)元件TGA-elemnt、茉莉酸甲酯(MeJA)反應(yīng)元件TGACG-motif、水楊酸反應(yīng)元件TCA-element、脫落酸反應(yīng)元件ABRE和赤霉素反應(yīng)相關(guān)元件(TATC-box、P-box和GARE-motif);(3)參與胚乳表達的調(diào)節(jié)元件GCN4-motif、參與分生組織表達的調(diào)控元件CAT-box、參與柵欄葉肉細胞分化的HD-Zip1元件。以上研究表明,LjPIN基因家族在百脈根中以激素調(diào)控為主,與植物生長發(fā)育過程密切相關(guān),其可能通過對生長素與其他激素的共同調(diào)控作用實現(xiàn)對植物生長發(fā)育的調(diào)控。
對百脈根的根、莖、葉、花及不同形成時期種子(按授粉后天數(shù)計算)的芯片數(shù)據(jù)進行分析,結(jié)果如圖7所示。由圖7可以看出,27個PIN基因中僅有11個在9個樣本中出現(xiàn)組織差異表達(上調(diào)),其中,PIN2.1、PIN6.1、PIN8、PIN9、PIN15和PIN25.1在葉中高表達;PIN2.1、PIN6.1、PIN8、PIN9和PIN14在莖中高表達;PIN2.1和PIN8在花中高表達;PIN2.1、PIN6.1、PIN8、PIN10和PIN21在根中高表達;PIN2.1、PIN8和PIN18在授粉后10、12、14 d的種子中高表達,PIN2.1、PIN8、PIN18和PIN25.1在授粉后16、20 d的種子中均高表達。
圖6 LjPIN基因的順式作用元件位點組成Fig.6 The cis-acting element site of LjPIN genes
圖7 LjPIN基因的時空差異表達變化Fig.7 Expression of LjPIN genes in different tissues and seed maturation stages
PIN蛋白是調(diào)控植物生長素極性運輸?shù)闹匾d體元件,參與調(diào)控植物生長發(fā)育。擬南芥和水稻等模式植物中的PIN基因研究得較為清楚,但在百脈根中尚未見報道,研究百脈根LjPIN基因?qū)ζ涔δ荑b定和利用具有重要意義。本研究從百脈根基因組中共鑒定出了27個PIN基因,編碼35個PIN蛋白,高于擬南芥(8個)、水稻(12)和大豆(23個)中的PIN成員數(shù)量[10,18,21]。系統(tǒng)進化分析發(fā)現(xiàn),LjPIN與擬南芥和大豆PIN基因家族的進化關(guān)系最為密切,LjPIN蛋白大多為堿性穩(wěn)定蛋白質(zhì),這與其他植物中的相關(guān)報道一致[22-23]。百脈根LjPIN基因的順式作用元件中含有光響應(yīng)、激素調(diào)控相關(guān)及生長發(fā)育響應(yīng)元件,表明LjPIN的生物學(xué)活性較為廣泛;百脈根PIN基因中的激素調(diào)控元件除了生長素類之外,還包括茉莉酸甲酯、水楊酸、脫落酸、赤霉素等其他激素的響應(yīng)元件,這表明LjPIN基因家族的功能涉及到多種激素調(diào)控,推測其在調(diào)控生長素的分布后,進而在局部與其他激素協(xié)作或拮抗,共同調(diào)控植物的生長發(fā)育。本研究發(fā)現(xiàn),百脈根LjPIN基因由多種順式作用元件組成,這為植物體中生長素與其他植物激素通過交互響應(yīng)調(diào)控植物生長發(fā)育[5]提供了重要依據(jù)。HE等[24]發(fā)現(xiàn),棉花PIN基因家族中僅有2個PIN基因?qū)γ藁ǖ闹鞲?、?cè)根發(fā)育起關(guān)鍵作用。WANG等[18]發(fā)現(xiàn),大豆PIN基因存在的表達類型、時間和空間差異性對每個組織的發(fā)育過程均至關(guān)重要,而來自不同組織的PIN基因協(xié)同表達,有助于大豆進化過程的靈活性及多變性。本研究中,在百脈根的根、莖、葉、花和不同發(fā)育階段的種子中,僅有11個LjPIN基因出現(xiàn)上調(diào)差異表達,表明LjPIN基因存在表達類型差異和時空表達特異性,這種差異可能與不同PIN基因?qū)Σ煌课缓筒煌瑫r期的調(diào)控有關(guān),百脈根LjPIN基因家族與上述棉花[24]和大豆[18]中PIN基因家族的表達類型差異和空間表達差異一致,而這種一致性是各種植物中該基因家族功能豐富和滿足特定發(fā)育部位和階段所必需的。綜上,百脈根中存在PIN基因家族,該家族基因具有典型的結(jié)構(gòu)特征和特定的表達特性,對進一步研究百脈根LjPIN奠定了基礎(chǔ),也為其他植物PIN基因家族的研究提供了參考信息。