孫曉莎 王 遂 趙曦陽 曲冠證
(林木遺傳育種國家重點實驗室,東北林業(yè)大學,哈爾濱 150040)
木質素由三種不同木質素單體通過不同比例組成,分別為香豆醇(p-coumaryl alcohol,H型),松柏醇(Coniferyl alcohol,G型),芥子醇(Sinapyl alcohol,S型)。不同的植物品種中木質素單體的比例大致是相近的,例如在楊樹中,S型和G型木質素單體比值大約為2∶1[1~2]。不同單體的化學特性有所不同,例如G型單體C5位置形成C-C鍵,該鍵在化學降解作用具有高度穩(wěn)定性,而S型木質素單體的醚鍵在化學降解過程中穩(wěn)定性則弱一些,因此在Kraft制漿工藝中,G型單體比S型單體更難去除[3]。木質素單體的合成由三個代謝途徑共同完成。第一個代謝途徑:莽草酸代謝途徑(Shikimate pathway);第二個代謝途徑:苯丙烷類代謝途徑(General phenylpropanoid pathway);第三個代謝途徑:木質素合成的特異途徑(General phenylpropanoid pathway)。在代謝途徑中有幾種重要的酶如:4-香豆酰-CoA連接酶(4-coumarate:coenzyme A ligase,4CL,EC6.2.1.12)、苯丙氨酸脫氨酶(Phenylalanine Ammonia-Lyase,PAL)及肉桂酸-4羥化酶(Cinnamate 4-Hydroxylase,C4H)等,其中4CL酶主要催化4-香豆酸、咖啡酸、阿魏酸、5-羥基阿魏酸和芥子酸等,生成相應的?;鵆oA酯,如香豆酰-、咖啡酰-、阿魏酰-、5-羥基阿魏酰-和芥子酰-CoA等。這些CoA將進入木質素合成特殊途徑,經(jīng)由肉桂酰-CoA還原酶(Cinnamoyl-CoA reductase,CCR)和肉桂醇脫氫酶(Cinnamyl alcohol dehydrogenase,CAD)的作用下,最終形成木質素單體-香豆醇、松柏醇和芥子醇[4~5]。在1999年,首次成功地通過降低白楊(Populustremuloides)4CL基因表達促使羥基肉桂酸酯在木質素合成途徑中無法被活化,從而降低了45%的木質素含量,并使纖維素的含量增加了15%。此后,降低4CL表達的策略在其它樹種中也得到了驗證[6]。吳錦程等人在枇杷中發(fā)現(xiàn)低溫(4℃)會增加果肉和木質素含量,該過程主要是由于PAL酶升高導致[7]。因此推斷降低4CL酶活可能會保持果肉含量不變而降低木質素合成含量。木質素填充于纖維素構架中,可起到增強植物體的機械強度、有利于根部輸導組織的水分運輸及抵抗不良外界環(huán)境的侵襲。另一方面木質素是制漿造紙業(yè)的不利因素,除去纖維素中的木質素,需要消耗大量能源,提高了造紙成本。4CL作為重要的木質素合成關鍵基因之一,研究4CL有助于了解木質素合成,進而提高木材抗壓性。此外抑制4CL基因表達可以減少木質素積累,降低造紙成本。
楊樹是我國重要的造林和用材樹種,也是研究林木生理和基因工程的模式植物。84K楊由韓國育種學家以銀白楊(Populusalba)為母本,腺毛楊(P.glandulosa)為父本雜交培育出來的品種,為雄性無性系,1984年引入我國。84K楊抗逆性強,具有較強的抗旱、抗寒、抗病、抗風能力,以及根系發(fā)達、造林成活率高等優(yōu)良特征[8];同時還具有材質好,苗期生長快,樹體高大直立等優(yōu)點。此外,84K楊為雄性,無“飛絮”,是一種不會對環(huán)境造成污染的優(yōu)良品種。84K楊具備分布廣、適應性強、生長速度快、遺傳轉化率高等特點,是楊樹基因工程研究的絕佳材料。因此,本研究以84K楊為材料,采用同源克隆的方法獲得了Pag4CL3/4CL5基因并進行生物系信息學分析,為楊樹木質素合成的遺傳改良奠定理論基礎。
84K楊(Populusalba×P.glandulosa)由東北林業(yè)大學林木遺傳育種國家重點實驗室保存。
1.2.1Pag4CL3/4CL5基因克隆
將84K楊野生型植株草炭土培養(yǎng)28天,培養(yǎng)室溫度為22±2℃,光照強度為200~300 μmol·m-2·s-1,光周期為16 h/8 h。相對濕度為40%。選取長勢一致的植株分別取葉、莖、根以及頂芽四個部分用MiniBEST Plant RNA Extraction Kit試劑盒提取RNA,并利用TaKaRa反轉錄試劑盒PrimeScriptTMRT reagent Kit with gDNA Eraser反轉錄為cDNA。根據(jù)已公布的毛果楊(PopulustrichocarpaTorr.&A.Gray)基因組信息,設計Pag4CL3基因和Pag4CL5基因特異性引物見表1,以反轉錄的cDNA為模板,通過PCR方法,克隆出Pag4CL3/4CL5兩個基因。PCR反應程序:94℃ 5 min;94℃ 30 s,58℃ 30 s,72℃ 1 min 45 s,30個循環(huán);最后72℃ 7 min。用Biospin Gel Extraction Kit試劑盒回收PCR產物,回收產物與pEASY連接載體,轉化大腸桿菌感受態(tài)細胞(Trans1-T1),涂于LB固體培養(yǎng)基(含50 mg·mL-1卡那霉素),37℃培養(yǎng)12 h后,隨機挑取單克隆,用液體LB培養(yǎng)基(含卡那霉素)進行37℃振蕩培養(yǎng),6 h后,用全式金的Easy Pure Plasmid MiniPrep Kit試劑盒提取質粒DNA并進行菌液PCR檢測,將陽性單克隆菌液送往哈爾濱擎科生物公司測序。
表1Pag4CL3/4CL5基因克隆及定量引物
Table 1Pag4CL3/4CL5 gene cloning and quantitative primers
引物名稱Primer name引物序列Primer sequence4CL3-FTCTAGATCTGCATCTTTAGCCCGCAATG4CL3-RGGTACCTGTTCAGTAACGTCTTCAGTTA4CL5-FTCTAGACCCTCTGCAACTTTAGCCCACAATG4CL5-RGGTACCATATGCCCTTTACAATCTTCATTTA4CL3-RT-FGGCAGACGAAAATGAAGCGCCT4CL3-RT-RACCGACTCTCAGCCCGCAGA4CL5-RT-FACACAGGCTGATGATGATGATATGCC4CL5-RT-RGCAGCACCAGCTCTCAACCCAActin-FTACAACGAGCTTCGTGTTGCActin-RACAAGGAAAGGACAGCCTGA
1.2.2Pag4CL3/4CL5基因的生物信息學分析
通過在線軟件DNAMAN和BioEdit進行氨基酸序列比對分析;利用在線軟件MEME(http://meme.Nbcr.net/meme/cgi-bin/meme.cgi)進行4CL蛋白的保守結構域分析;利用在線網(wǎng)站ProtParam(http://web.expasy.org/protparam/)進行蛋白的理化性質分析;利用SOPM(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.ht ml)預測4CL蛋白的二級結構;利用SWISS-MODEL(https://www.swissmodel.expasy.org/)預測4CL蛋白的三級結構及預測4CL基因編碼蛋白的功能;利用ProtScale軟件(http://web.Expasy.org/protscale/)進行疏水性進行分析;利用TMpred軟件(https://embnet.vital-it.ch/cgi-bin/TMPRED_form_parser)進行4CL蛋白序列跨膜區(qū)的預測。利用MEGA5軟件構建系統(tǒng)進化樹。
1.2.3Pag4CL3/4CL5基因在84K楊不同組織中的表達模式分析
利用Primer5.0軟件設計定量引物,由哈爾濱市擎科生物公司合成。qRT-PCR通過SYBR Premix Ex TaqTMⅡ熒光定量試劑盒,以不同組織部位cDNA為模板,并重復3次,進行定量檢測。反應體系為:SYBR Mixture 10 μL、模板2 μL、水6.4 μL、上游引物0.8 μL、下游引物0.8 μL;反應程序為:95℃ 30 s;95℃ 5 s,60℃ 35 s,40個循環(huán);95℃ 15 s;60℃ 1 min;95℃ 15 s。數(shù)據(jù)分析采用ΔΔCt法,得到Pag4CL3/4CL5基因在不同組織部位的相對表達量。
根據(jù)毛果楊4CL基因序列設計引物,PCR擴增,克隆得到兩個84K楊4CL基因(Pag4CL3和Pag4CL5)(圖1),Pag4CL3基因cDS全長1 623 bp,編碼一個由540個氨基酸殘基組成的蛋白序列(圖2);Pag4CL5基因cDS全長1 632 bp,編碼一個由543個氨基酸殘基組成的蛋白序列(圖3)。GenBank登錄號分別為MK183033(Pag4CL3)和MK183034(Pag4CL5)。對84K楊4CL基因編碼的蛋白的理化性質進行預測分析,結果顯示Pag4CL3蛋白的氨基酸中共含有70個帶負電荷氨基酸殘基,58個帶正電荷氨基酸殘基,蛋白的分子質量為58 987.28 Da,等電點為5.52,不穩(wěn)定系數(shù)為36.50,該值小于40,為穩(wěn)定蛋白;脂肪族指數(shù)為98.44,蛋白疏水性平均值為-0.027,為親水性蛋白。Pag4CL5蛋白的氨基酸中共含有67個帶負電荷氨基酸殘基,59個帶正電荷氨基酸殘基,蛋白的分子質量為59 268.57 Da,等電點為5.72,不穩(wěn)定系數(shù)為35.66,為穩(wěn)定蛋白;脂肪族指數(shù)為96.10,蛋白疏水性平均值為-0.060,為親水性蛋白。
圖1 Pag4CL3/4CL5基因PCR產物 M.DL5000 marker;1.Pag4CL3基因的PCR產物;2.Pag4CL5基因的PCR產物Fig.1 PCR product of Pag4CL3/4CL5 gene M.DL5000 marker;1.PCR product of Pag4CL3 gene;2.PCR product of Pag4CL5 gene
圖2 Pag4CL3基因的cDNA序列及其編碼的氨基酸序列Fig.2 cDNA sequence and its deduced amino acid sequence of Pag4CL3
我們與毛果楊、青楊及毛白楊三種楊樹的4CL蛋白進行序列比對,結果發(fā)現(xiàn)Pag4CL3與Pt4CL3蛋白相似性高達97%;Pag4CL5與Pt4CL5蛋白相似性也達到97%。此外,這四種楊樹4CL蛋白均包含SSGTTGLPKGV和GEICIRG兩個基序(圖4),這兩個基序構成了4CL家族標志性的保守結構域。SSGTTGLPKGV被認為是4CL催化反應中結合AMP保守積序[9];GEICIRG催化活動中心[10]。
圖4 Pag4CL3、Pag4CL5與Pt4CL3、Pt4CL5、PtC4CL、Pc4CL蛋白結構域分析Fig.4 Structural domain analysis of Pag4CL3,Pag4CL5 with Pt4CL3,Pt4CL5,PtC4CL and Pc4CL
圖5 Pag4CL3蛋白二級結構預測與分析Fig.5 Secondary structure prediction and analysis of Pag4CL3 protein
圖6 Pag4CL5蛋白二級結構預測與分析Fig.6 Secondary structure prediction and analysis of Pag4CL5 protein
圖7 4CL蛋白三級結構預測 A.Pag4CL3編碼蛋白三級結構;B.Pag4CL5編碼蛋白三級結構Fig.7 The encoding protein tertiary structure prediction of 4CL A.Pag4CL3 encoded protein tertiary structure; B.Pag4CL5 encoded protein tertiary structure
應用SOPMA在線軟件對蛋白的二級結構進行預測和分析。84K楊4CL3蛋白的二級結構由32.04%的α螺旋(α helix)、20.0%的延伸鏈(extended strand)、7.41%的β轉角(β turn)和40.56%無規(guī)則卷曲(random coil)組成(圖5);84K楊4CL5蛋白的二級結構由32.60%的α螺旋(α helix)、18.60%的延伸鏈(extended strand)、7.00%的β轉角(β turn)和41.80%無規(guī)則卷曲(random coil)組成(圖6)。
運用在線軟件SWISS-MODEL得到蛋白質三級結構的預測結果:4CL蛋白質的多肽鏈在各種二級結構的基礎上再進一步盤曲或折疊形成具有一定規(guī)律的三維空間結構。Pag4CL3蛋白三維結構由一個PDB號為3a9u.1.A的結構為模板建立,3a9u.1.A屬于4-coumarate—CoA ligase,序列的相似性為0.6,范圍為9~536 aa,平均值為0.99(圖7A);Pag4CL5蛋白三維結構由一個PDB號為3a9v.1.A的結構為模板建立,3a9v.1.A屬于4-coumarate—CoA ligase,序列的相似性為0.57,范圍為9~536 aa,平均值為0.98(圖7B)。
在NCBI網(wǎng)站下載4CL蛋白序列包括:毛果楊4CL3(Populustrichocarpa,XP_002297699)、毛果楊4CL5(Populustrichocarpa,XP_002304825)毛白楊4CL(Populustomentosa,AAL56850)、青楊4CL(Populuscathayana,AJA91785)、白花泡桐4CL(Paulowniafortunei,ACL31667)、赤桉4CL(Eucalyptuscamaldulensis,ACX68559)、擬南芥4CL1(Arabidopsisthaliana,AAQ86588)、擬南芥4CL2(Arabidopsisthaliana,AAQ86587)、擬南芥4CL3(Arabidopsisthaliana,AAQ86589)、擬南芥4CL5(Arabidopsisthaliana,AAQ86591)、葡萄4CL(Wine grape,XP_002274994)、白桑4CL(Morusalbavar.multicaulis,AHL83551)、陸地棉4CL(Gossypiumhirsutum,ADU15550)、山葡萄4CL(Vitisamurensis,AWY10751)、珊瑚菜4CL(Glehnialittoralis,ATG32161)、棗4CL(Ziziphusjujuba,ALM23512)、石榴4CL(Punicagranatum,AFU90743)、蘋果4CL(Malushybridcultivar,AFG30056)、大麻槿4CL(Hibiscuscannabinus,ADK24217)、辣椒4CL(Capsicum annuum,AAG43823)以及芝麻4CL(Sesamumindicum,ALA55541),并構建進化樹(圖8)。依照進化樹的推斷得知Pag4CL3/4CL5與毛果楊4CL、毛白楊4CL及青楊4CL被分為同一個分支上,說明它們在進化的過程中親緣關系最為密切。
圖8 4CL蛋白家族系統(tǒng)進化樹Fig.8 The clustering analysis of 4CL protein family
圖9 4CL保守結構域分析Fig.9 The conservative structure domain analysis of 4CL
利用在線軟件MEME對Pag4CL3/4CL5進行蛋白序列分析,結果發(fā)現(xiàn)Pag4CL3/4CL5蛋白與其它楊樹中4CL蛋白一致,基序種類、排序方式及基序位置都非常保守。這一結果與系統(tǒng)進化樹相吻合(圖9)。
利用GenScript在線預測Pag4CL3/4CL5蛋白序列亞細胞定位,結果發(fā)現(xiàn)(表2),Pag4CL3/4CL5蛋白可能是一種膜蛋白,主要在質膜上行使功能。
表2 Pag4CL3/4CL5蛋白亞細胞定位預測
Table 2 Subcellular localization prediction of Pag4CL3/4CL5 protein
細胞結構Cell structure4CL3(%)4CL5(%)內質網(wǎng)Endoplasmic reticulum55.6043.50線粒體Mitochondrion33.3334.80細胞核Nucleus11.1017.40囊泡Vesicles04.30
利用ProtScale軟件對蛋白疏水性進行分析,結果表明:在Pag4CL3蛋白的81~85區(qū)域、92~96區(qū)域、230~238區(qū)域、243~246區(qū)域、248~258區(qū)域、266~268區(qū)域、278~286區(qū)域、342~348區(qū)域、454~457區(qū)域、480~483區(qū)域以及515~518區(qū)域具有很強的疏水性,其中疏水性最強的在233,高達2.9(圖10);在Pag4CL5蛋白的81~85區(qū)域、92~96區(qū)域、231~238區(qū)域、243~246區(qū)域、248~260區(qū)域、266~268區(qū)域、278~289區(qū)域、342~348區(qū)域、465~467區(qū)域、480~483區(qū)域以及517~518區(qū)域具有很強的疏水性,其中疏水性最強的在233,高達2.9(圖11)。
圖10 Pag4CL3疏水性分析Fig.10 Hydrophobicity analysis of Pag4CL3
圖11 Pag4CL5疏水性分析Fig.11 Hydrophobicity analysis of Pag4CL5
圖12 Pag4CL3蛋白跨膜結構域預測Fig.12 Transmembrane domain prediction of Pag4CL3 protein
圖13 Pag4CL5蛋白跨膜結構域預測Fig.13 Transmembrane domain prediction of Pag4CL5 protein
圖14 Pag4CL3基因在不同組織中的表達分析Fig.14 Relative expression levels of Pag4CL3 in different organs
圖15 Pag4CL5基因在不同組織中的表達分析Fig.15 Relative expression levels of Pag4CL5 in different organs
利用TMpred軟件對蛋白跨膜結構域進行預測,預測結果為Pag4CL3蛋白從內到外共有1個跨膜區(qū)域在229~254 aa。從外到內有2個跨膜區(qū)域,在73~96 aa以及330~350 aa(圖12);Pag4CL5蛋白從內到外共有1個跨膜區(qū)域,241~259 aa,從外到內有2個跨膜區(qū)域,在73~96 aa以及330~350 aa(圖13)。
為了研究Pag4CL3/4CL5基因在不同組織部位中的表達特異性,本實驗采用實時熒光定量PCR方法,分析其在不同部位的表達差異。如圖14~15所示:Pag4CL3主要在葉及莖中表達,根和頂芽中表達量較低;與葉組織相比,頂芽中4CL3轉錄本低10倍左右。Pag4CL5主要在葉及根中表達,莖和頂芽葉中表達量較低;與根組織相比,頂芽中4CL5轉錄本低6.5倍左右。綜上所述,兩種同源基因的表達具有一定的組織部位差異性。
4CL是苯丙烷類代謝途徑中的關鍵酶,也是木質素合成中重要的限速酶之一[11]。已被證實,大多數(shù)維管植中存在多種4CL同工酶。在模式植物擬南芥基因組中發(fā)現(xiàn)了14個4CL基因或類似基因[12]。其中只有4CL1、4CL2、4CL3及4CL5編碼的蛋白具有催化活性,剩余的4CL基因及蛋白功能仍不清楚[13]。此外,擬南芥中4CL1、4CL2及4CL5與木質素合成相關,4CL3與黃酮素合成有關[14]。在白洋麻中也克隆出一個4CL基因,該基因被認為與木質素合成有關[15]。山楊中已被鑒定出兩個結構和功能不同的4CL基因Pt4CL1和Pt4CL2,其中Pt4CL1被認為與莖中木質素生物合成有關,Pt4CL2被認為參與黃酮類物質的生物合成[16]。本實驗首次克隆出84K楊中的Pag4CL3基因和Pag4CL5基因,通過對Pag4CL3/4CL5編碼的蛋白與其他楊樹4CL蛋白比較發(fā)現(xiàn),均含有SSGTTGLPKGV保守結構域及GEICIRG催化活動中心。序列比對和系統(tǒng)進化樹分析發(fā)現(xiàn)Pag4CL3/4CL5蛋白與毛果楊4CL、毛白楊4CL及青楊4CL蛋白分為同一個分支,親緣關系較近。已有報道稱毛白楊4CL蛋白能催化咖啡酸(caffeic acid)和阿魏酸(ferulic acid)生成相應的大CoA硫酯,不能催化芥子酸[17]。擬南芥中只有4CL5能催化芥子酸形成相應的CoA硫酯,以用于合成木質素單體。推測Pag4CL3/4CL5同毛白楊4CL蛋白一樣不具有催化芥子酸的能力。
4CL基因在植物不同組織中的表達存在差異。美洲山楊Pt4CL1在木質化的組織中特異性表達;Pt4CL2的mRNA豐度在莖及葉的表皮層中得到積累。歐芹花莖中4CL基因的表達量遠高于非生殖莖中4CL基因的表達量[18]。在擬南芥中At4CL1主要在幼根及抽薹莖中表達;At4CL2主要在幼根中表達;At4CL3在花和果莢中表達,在花中表達量最高[19]。本實驗克隆的Pag4CL3/4CL5在序列上具有極高的相似性,可能執(zhí)行近似的功能,但組織部位的表達差異性又導致了其在空間上的分工差異。Pag4CL3在葉及莖中表達較高,根和頂芽葉中表達量較低;Pag4CL5在葉及根中表達較高,莖和頂芽中表達量較低。推測Pag4CL3可能主要在葉和莖中行使功能,Pag4CL5主要在葉和根中行使功能。楊樹作為重要的經(jīng)濟樹種,是造紙工業(yè)的重要原材料。上述結果為今后研究楊樹4CL基因的功能及改良木質素生物合成奠定了理論基礎。