鮑思元 劉衛(wèi)東 李冬波
摘要[目的]對水稻OsARAB1基因進行電子克隆,并對其進行生物信息學分析。[方法]以NP 174188.1為查詢探針,通過電子克隆獲得OsARAB1基因全長cDNA,用生物信息學軟件對其核苷酸序列和蛋白質(zhì)序列進行生物信息學分析。[結果]獲得了OsARAB1基因全長cDNA,基因編碼區(qū)序列(CDS)全長1 086 bp。電子定位于第五染色體基因組序列NC 008398.2核苷酸序列6 769 813~6 773 213 bp區(qū)域。OsARAB1蛋白屬于親水性的胞外蛋白,比較穩(wěn)定,偏堿性。二級結構以α螺旋和無規(guī)則卷曲為主。具有2個功能結構域:SGNH水解酶型酯酶、GDSL脂肪酶。有21個磷酸化位點、7個糖基化位點。推定的活性位點的氨基酸殘基為Ser34、Gly107、Asn167、Asp333、His336。與玉米酯酶亞型B4FM12親緣關系最近。OsARAB1基因的表達對水稻的發(fā)育和形態(tài)發(fā)生起重要作用,與水稻抗稻瘟病有關。[結論]該研究為用試驗方法克隆該基因和功能鑒定奠定了基礎。
關鍵詞水稻;脂肪酶;生物信息學;氨基酸序列;OsARAB1基因
中圖分類號S188;Q943.2文獻標識碼A文章編號0517-6611(2015)31-038-07
In Silico Cloning and Bioinformatics Analysis of ARAB1like Gene from Rice
BAO Siyuan1, LIU Weidong2, LI Dongbo3
(1. College of Basic Medical, Hubei University of Science and Technology, Xianning, Hubei 437100; 2. School of Nuclear Technology and Chemistry & Biology, Hubei University of Science and Technology, Xianning, Hubei 437100; 3. Horticultural Research Institute, Guangxi Academy of Agricultural Sciences, Nanning, Guangxi 530007)
Abstract [Objective] The aim of this study was to clone the OsARAB1 gene from rice in silico, and to analyze its biological information. [Method] Using NP 174188.1 as the probe, the fulllength cDNA sequence of OsARAB1 gene was obtained by in silico cloning; its nucleotide sequence and protein were analyzed by bioinformatics softwares. [Result] The full length cDNA of OsARAB1 gene was obtained, and the sequence of the gene encoding region (CDS) was 1086 bp, encoded a protein of 361 amino acid residues. OsARAB1 gene was located in the genome sequence NC 008398.2( 6 769 813—6 773 213 bp region) by in silico mapping. OsARAB1 protein belonged to hydrophilic extracellular protein, and it was relatively stable, partial alkaline. The secondary structure of this protein was mainly composed of alpha helix and random coil. It belonged to SGNH lipase, and had 21 phosphorylation sites, 7 OβGlcNAc glycosylation sites. The putative active sites of amino acid residues were Ser34, Gly107, Asn167, Asp333, His336. It had the closest relationship with the esterase isoform B4FM12 from maize. The expression of OsARAB1 gene played an important role in development and morphogenesis of rice, and had a relationship with the rice blast resistance. [Conclusion] This study laid a foundation for OsARAB1 gene clone and functional identification using experimental method.
Key words Rice; Lipase; Bioinformatics; Amino acid sequence; OsARAB1 gene
脂肪酶(EC 3.1.1.3)是一類水解酶,廣泛分布于植物、動物、微生物中,催化多種生化反應,包括水解、醇解、酸解、酯化、酯交換、氨解。GDSL脂肪酶是一類重要的脂肪酶家族,具有一個GDSL模體(GXSXXXXG),活性位點的絲氨酸靠近多肽鏈的N端[1-2];而GXSXG模體的α/β折疊型水解酶超家族活性位點的絲氨酸位于多肽鏈的中間[3]。具有5塊高度保守的同源序列[1],由于4個高度保守的殘基:絲氨酸、甘氨酸、天冬氨酰、組氨酸分別位于塊I、塊II、塊III、塊V,GDSL脂肪酶被建議更名為“SGNH-hydrolases”[4]。GDSL脂肪酶的催化位置易于變構,因此該酶具有廣泛的底物特異性[5]。然而,大多數(shù)GDSL脂肪酶的天然底物仍未知。
大量的細菌GDSL脂肪酶已被克隆,其功能已被研究清楚,一些GDSL脂肪酶的晶體結構已經(jīng)構建[6-8]。植物GDSL脂肪酶也被發(fā)現(xiàn),其特性和功能研究已成為非常有吸引力的課題。一些植物GDSL脂肪酶已被分離、克隆和表征,如擬南芥、蘿芙木屬、紫花苜蓿、橡膠樹、穗看麥娘的幾個候選基因[2,9-13]。Mayfield等[14]報道6個從擬南芥花粉表皮分離的胞外脂肪酶。Teissre等[15]從發(fā)芽后的向日葵種子中分離純化了一個GDSL酶,并顯示有脂肪?;ニ饷傅幕钚?。擬南芥GDSL脂肪酶GLIP1具有脂肪酶和抗微生物活性,能直接破壞真菌孢子的完整性;在乙烯信號傳導的作用下,GLIP1在植物抗黑斑病過程中可能發(fā)揮關鍵作用[13]。到目前為止,這些已克隆或表征的GDSL脂肪酶主要參與植物發(fā)育、形態(tài)發(fā)生、次生代謝產(chǎn)物的合成和防御反應的調(diào)節(jié)。
搜索水稻數(shù)據(jù)庫,發(fā)現(xiàn)水稻GDSL脂肪酶家族有114個成員[16-17],但只有幾個GDSL酯酶/脂肪酶基因被研究。在水稻生產(chǎn)國,天然脂肪酶可以用來提高糙米、米糠油的質(zhì)量,以及生產(chǎn)相關產(chǎn)品。目前,2個GDSL酯酶/脂肪酶基因GER1、WDL1被克隆,它們分別在苗期調(diào)節(jié)胚芽鞘伸長和植物生長[18-19]。筆者利用電子克隆的方法克隆了水稻OsARAB1基因,獲得全長cDNA,預測其編碼蛋白質(zhì)的一級結構、二級結構、三級結構的特點,同時還利用電子表達分析技術對該基因的表達進行了分析,為用試驗方法克隆該基因和功能鑒定奠定了基礎。
1材料與方法
1.1氨基酸序列
擬南芥脂肪酶基因ARAB1蛋白質(zhì)的氨基酸序列NP 174188.1下載自NCBI的蛋白質(zhì)數(shù)據(jù)庫。tr|B4FM12|、tr|Q6K4Z3|、tr|G7IKB1|、tr|A0A0B2QCD5|、tr|B9H2K5|、tr|A0A061GEQ6|、tr|D7MSQ0|、sp|Q9FJ45|下載自UniProtKB蛋白質(zhì)數(shù)據(jù)庫。
1.2水稻OsARAB1基因的電子克隆
以擬南芥脂肪酶基因ARAB1蛋白質(zhì)的氨基酸序列為查詢探針對水稻EST數(shù)據(jù)庫進行tblastn同源性檢索,獲得與擬南芥脂肪酶基因ARAB1同源性較高的一系列水稻EST序列;從獲得的水稻EST序列中挑選出同源性最高的EST序列作為種子序列,用種子序列對水稻EST數(shù)據(jù)庫進行blastn檢索,得到多條與之高度同源的水稻EST序列;找到部分重疊的EST序列用CAP3軟件進行拼接,獲得序列重疊群;以獲得的重疊群反復對水稻EST數(shù)據(jù)庫進行blastn檢索、拼接,直到?jīng)]有新的EST 可供拼接為止。最后,將可能的新基因序列在非冗余數(shù)據(jù)庫中進行比對搜索,進行新基因確認。
1.3序列分析和系統(tǒng)發(fā)育樹構建
用FGENESH軟件進行基因預測[20];用ProtParam軟件進行蛋白質(zhì)的理化性質(zhì)分析[21];用FoldIndex軟件進行無序區(qū)域預測[22];用Pepinfo軟件進行蛋白質(zhì)疏水性/親水性預測;用PREDATOR 軟件進行蛋白質(zhì)二級結構預測[23];用TargetP 1.1軟件預測蛋白質(zhì)的亞細胞定位[24-25];用SignalP 4.1軟件預測信號肽[26];用TMHMM 2.0軟件進行蛋白質(zhì)跨膜螺旋預測[27];用NetPhos 2.0軟件進行磷酸化位點預測[28];用YinOYang 1.2軟件進行Oβ葡萄糖糖基化位點預測[29-30];用InterProScan 5軟件進行蛋白質(zhì)功能結構域預測;用ProtFun 2.2軟件預測蛋白質(zhì)的功能分類[31-32];用PSIBLAST軟件進行序列相似性搜索;用DNAMAN V6軟件進行氨基酸的多序列比對和系統(tǒng)發(fā)育樹構建;用SWISSMODEL同源建模軟件預測蛋白質(zhì)的三維結構[33-35]。
1.4水稻OsARAB1基因的電子表達分析
以水稻OsARAB1基因的編碼序列對水稻多個組織的EST數(shù)據(jù)庫進行blastn,選取同源性較高的EST序列作為該基因的EST,對每條EST來源的cDNA進行分析,得到文庫構建的詳細情況,其中包括組織來源、發(fā)育階段、脅迫類型等。根據(jù)這些EST序列的組織來源及其在不同組織中出現(xiàn)的頻率以及來源于生物或非生物脅迫材料分析該基因的組織特異性表達和不同脅迫條件下的表達特性。
1.5數(shù)據(jù)處理
1.5.1總平均親水性值(GRAVY)計算。所有氨基酸疏水性參數(shù)的總和與氨基酸數(shù)量的比值,負值越大表示親水性越強,正值越大表示疏水性越強。
1.5.2水稻OsARAB1基因的電子表達分析。將水稻EST數(shù)據(jù)庫中檢索出的與OsARAB1基因有同源性的所有EST序列進行分類統(tǒng)計、分析,分別統(tǒng)計組織類型和脅迫類型的EST數(shù)量,并在Excel表格中根據(jù)統(tǒng)計數(shù)據(jù)作出柱狀圖。
2結果與分析
2.1水稻OsARAB1基因的電子克隆及序列分析
將NP 174188.1序列作為查詢探針,利用tblastn工具對GenBank中水稻EST數(shù)據(jù)庫進行同源性檢索。從結果中選擇與探針序列同源性最高的EST序列CT845802作為種子序列。用CT845802對水稻EST數(shù)據(jù)庫進行blastn檢索,得到多條與之高度同源的水稻EST序列,剔除冗余序列后找到2條對CT845802有延伸作用的EST序列CA758743.1、CR286331.1,用CAP3軟件進行拼接。CAP3軟件拼接結果顯示CR286331.1不能拼接,CT845802.1和CA758743.1能拼接,獲得一個長為1 555 bp的序列重疊群。以獲得的序列重疊群對水稻EST數(shù)據(jù)庫進行blastn檢索,沒有找到有延伸作用的新的EST序列,表明所得的序列重疊群已不能再延伸。
用FGENESH軟件對序列重疊群進行基因預測,得到一個基因,含有一個外顯子,位于160~1 245 bp,PolA開始位點位于1 295 bp處。起始密碼子上游3位為A,下游+4位為G,符合Kozak規(guī)則。說明序列延伸得到的序列重疊群是水稻脂肪酶ARAB1類似基因的全長cDNA。將水稻脂肪酶ARAB1類似基因命名為OsARAB1,基因編碼區(qū)序列(CDS)全長1 086 bp(圖1),編碼361個氨基酸殘基的蛋白質(zhì)(圖2)。
安徽農(nóng)業(yè)科學2015年
2.2OsARAB1基因的電子定位
以OsARAB1基因的編碼區(qū)序列對GenBank水稻染色體數(shù)據(jù)庫blastn,結果顯示OsARAB1與水稻第五染色體基因組序列NC 008398.2的一致性達99%,查詢覆蓋度達100%,匹配區(qū)段5個。NC 008398.2全長30 039 014 bp,比對區(qū)域是6 769 813~6 773 213 bp,其中6 770 051~6 770 128、6 770 337~6 770 519、6 770 670~6 771 078、6 771 356~6 772 994 bp區(qū)段沒有參與匹配。因此OsARAB1基因的編碼序列位于第五染色體(基因組序列NC 008398.2 )6 769 813~6 773 213 bp區(qū)域,4個沒有參與匹配的區(qū)段是該基因的4個內(nèi)含子。Map Viewer顯示OsARAB1基因臨近區(qū)域存在多個基因,其中的2個基因Os05g0209600、Os05g0210100分別位于NC 008398.2 (6 769 736~6 773 472)、NC 008398.2 (6 806 624~6 809 353),參考狀態(tài)為臨時基因(PROVISIONAL gene),功能注釋為SGNH植物脂肪酶。
2.3蛋白質(zhì)的理化性質(zhì)分析和蛋白質(zhì)疏水性/親水性預測
理化性質(zhì)分析表明,OsARAB1編碼一條361個氨基酸殘基的多肽,分子量為38 902.5 Da,理論等電點(pI)為8.83,帶負電荷的殘基(Asp + Glu)總數(shù)為23個,帶正電荷的殘基(Arg + Lys)總數(shù)為31個,表明該蛋白為堿性蛋白質(zhì)。分子式為C1744H2678N470O500S21。不穩(wěn)定系數(shù)為28.56,表明該蛋白為穩(wěn)定蛋白。脂肪族指數(shù)為81.11。無序區(qū)域預測表明該蛋白在243~268位殘基處存在一個無序區(qū)域,該區(qū)域包含26個氨基酸殘基,占總殘基數(shù)的7.2%,因此這對OsARAB1蛋白折疊、表達水平干擾較小。
蛋白質(zhì)的折疊主要由氨基酸的親疏水性驅動,通過對親疏性分布圖的分析,可以反映蛋白質(zhì)的折疊情況;蛋白質(zhì)在折疊時形成疏水的內(nèi)核和親水的表面,同時潛在跨膜區(qū)會出現(xiàn)高疏水性結構域,據(jù)此可以判定跨膜結構域和蛋白質(zhì)表面氨基酸分布。利用Pepinfo軟件對蛋白質(zhì)進行疏水性/親水性分析,采用Kyte & Doolittle標度計算,其中正值為疏水性,負值為親水性。結果顯示,多肽鏈11位蛋氨酸疏水性參數(shù)最高,為3.100;308位天冬酰胺疏水性參數(shù)最低,為-2.400;N端存在一個較強的疏水性區(qū),推測其N端可能含有信號肽;總平均親水性值(GRAVY)為-0.015,說明OsARAB1蛋白為親水性蛋白(圖3)。
2.4蛋白質(zhì)二級結構預測
蛋白質(zhì)二級結構預測結果顯示,該蛋白由3種二級結構構成,其中,25.21%的氨基酸殘基構成α螺旋(Hh),14.40%的氨基酸殘基構成延伸鏈(Ee),60.39%的氨基酸殘基構成無規(guī)則卷曲(Cc)。α螺旋和無規(guī)則卷曲是OsARAB1蛋白的主要二級結構,延伸鏈散布于整個蛋白質(zhì)中(圖4)。
2.5亞細胞定位預測和蛋白質(zhì)跨膜螺旋預測
亞細胞定位預測結果顯示OsARAB1蛋白是一條含有22個氨基酸殘基信號肽的分泌蛋白。信號肽預測結果顯示OsARAB1蛋白含有信號肽,信號肽切割位點位于Ala22與Glu23之間。幾個已知生物功能的GDSL脂肪酶,如來源于穗看麥娘的酯酶[11]、來源于龍舌蘭屬植物葉表皮的SGNH水解酶[36]、來源于蘿芙木屬的乙酰基蘿芙木堿乙酰酯酶[12]、來源于甘藍型油菜的GDSL脂肪酶[37],它們都是胞外蛋白,在細胞外發(fā)揮作用。
蛋白質(zhì)跨膜螺旋預測結果顯示,OsARAB1蛋白第一個氨基酸殘基位于膜內(nèi),在2~21位氨基酸殘基處存在一個跨膜螺旋,22~361位氨基酸殘基位于膜外(圖5)。由于前60個氨基酸跨膜螺旋中預期氨基酸數(shù)為18.816 13,遠大于10,提示N端可能不是跨膜結構而是存在一個信號肽。結合疏水性∕親水性預測、亞細胞定位預測、信號肽預測,可以推測OsARAB1蛋白N端存在一個信號肽。在信號肽酶切除信號肽后,OsARAB1蛋白進入內(nèi)質(zhì)網(wǎng)腔,通過分泌途徑分泌到細胞外,在胞外參與脂類代謝。
2.6蛋白質(zhì)功能結構域及蛋白質(zhì)功能分類預測
蛋白質(zhì)功能結構域預測結果表明,OsARAB1蛋白具有2個功能結構域:SGNH水解酶型酯酶(InterPro ID:IPR013830)、GDSL脂肪酶(InterPro ID:IPR001087)。SGNH水解酶型酯酶超家族SSF52266位于3個區(qū)域:28~44位殘基處、72~86位殘基處、325~351位殘基處。GDSL脂肪酶功能結構域位于28~347位殘基處。由此可推斷OsARAB1蛋白為GDSL脂肪酶。
蛋白質(zhì)功能分類預測結果表明,OsARAB1蛋白屬于在細胞外具有激素作用的酶。Kiba等[38]、Cao等[39]發(fā)現(xiàn)GDSL脂肪酶參與與生長過程有關的激素途徑。
2.7翻譯后修飾位點預測
用NetPhos 2.0軟件進行serine、threonine和tyrosine磷酸化位點預測,結果顯示,Ser磷酸化位點12個,Thr磷酸化位點3個,Tyr磷酸化位點6個。Ser磷酸化位點分別位于30、34、70、91、110、144、247、248、257、318、321、344位氨基酸上。Thr磷酸化位點分別位于66、180、224位氨基酸上。Tyr磷酸化位點分別位于222、234、249、276、342、354位氨基酸上。說明磷酸化位點修飾對OsARAB1蛋白的功能可能非常重要,這些磷酸位點也可能參與該蛋白活性的調(diào)控。
Oβ葡萄糖糖基化位點預測結果表明,Ser糖基化位點有3個:Ser30、Ser91、Ser118;Thr糖基化位點有1個:Thr66;YinYang位點有3個: Ser30、Thr66、Ser91,這些位點在不同時期可逆地、動態(tài)地Oβ葡萄糖糖基化或磷酸化修飾。
2.8氨基酸的多序列比對和系統(tǒng)發(fā)育樹分析
將OsARAB1蛋白氨基酸序列對蛋白質(zhì)數(shù)據(jù)庫UniProtKB進行PSIBLAST,結果顯示,有500個GDSL蛋白質(zhì)與其同源,一致性最大值為99%,最小值為43%。從不同植物種類中選取8個GDSL脂肪酶和ARAB1蛋白(sp|Q38894|)、OsARAB1蛋白進行氨基酸多序列比對和系統(tǒng)發(fā)育樹構建(表1)。多序列比對結果表明,氨基酸序列一致性為59.48%,存在較多的同源序列,4個保守序列區(qū)域與SGNH水解酶保守序列塊包含的氨基酸非常相似[5]。根據(jù)同源序列區(qū)域的相似性,推定OsARAB1蛋白活性位點的氨基酸殘基為Ser34、Gly107、Asn167、Asp333、His336,Ser34靠近多肽鏈的N端(圖5)。
在多序列比對分析的基礎上用DNAMAN V6軟件構建系統(tǒng)發(fā)育樹(圖6)。系統(tǒng)發(fā)育樹顯示OsARAB1蛋白與玉米酯酶亞型B4FM12親緣關系最近,序列同源性最大,其次是粳稻脂肪酶Q6K4Z3;與可可脂肪酶A0A061GEQ6、楊樹脂肪酶B9H2K5親緣關系最遠,序列同源性最小。這是因為水稻與玉米同屬于禾本科植物,在進化上親緣關系較近,粳稻是水稻的一個亞種。但OsARAB1脂肪酶與粳稻脂肪酶Q6K4Z3的親緣關系不及玉米酯酶亞型B4FM12,這說明OsARAB1脂肪酶與玉米酯酶亞型B4FM12的功能更相似。
2.9三級結構預測為了更好地研究OsARAB1蛋白的功能,將OsARAB1蛋白氨基酸序列提交同源建模服務器SWISSMODEL進行三級結構預測,以在PDB晶體庫中與OsARAB1蛋白氨基酸序列一致性高達21.09%的銅綠假單胞菌全長轉運EstA的晶體結構(PDBid :1tibA)作為模板預測OsARAB1蛋白的三級結構(圖7)。OsARAB1蛋白的三級結構特點是5個β折疊組成了一個平面,外部由6個α螺旋包圍,整個結構呈球狀。這個結構特點符合脂肪酶的結構特點,脂肪酶活性位點位于疏水口袋里,底物與酶接觸時,α螺旋結構蓋子打開[40]。
2.10OsARAB1基因的電子表達分析
blastn共搜索到154條高度同源的EST,分別來源于不同的cDNA文庫(圖8)。整合分析后表明,OsARAB1基因在水稻的愈傷組織、花、稻芽、幼苗葉片、感稻瘟病菌的成熟葉子、發(fā)芽種子的根和嫩芽、全株苗、發(fā)芽的種子、種子、開花后的穗中都表達,在莖、營養(yǎng)分生組織的cDNA文庫中未發(fā)現(xiàn)EST序列,說明該基因的表達有組織和器官特異性特點。在愈傷組織中表達量最高,說明OsARAB1基因的表達在愈傷組織的分化中起重要作用。在葉子中表達量較高,在幼苗葉片cDNA文庫中發(fā)現(xiàn)了9條EST序列,說明OsARAB1基因的表達與葉子的形態(tài)發(fā)生有重要關系;在感稻瘟病菌的成熟葉子cDNA文庫中發(fā)現(xiàn)了3條EST序列,說明OsARAB1基因受稻瘟病菌的誘導而表達,與水稻抗稻瘟病有關。在發(fā)芽種子的根和嫩芽、開花后不同時期的穗cDNA文庫中分別發(fā)現(xiàn)了6、7條EST序列,說明OsARAB1基因對水稻種子的萌發(fā)和穗的發(fā)育起重要作用。與擬南芥GDSL脂肪酶ARAB1基因在種子萌發(fā)過程中表達,行使水解酶活性的研究結論一致[2]。在NAA處理的愈傷組織中發(fā)現(xiàn)了2條EST序列,說明NAA可誘導OsARAB1基因的表達,而NAA可促進根的生長。NAA是一種植物激素,推測OsARAB1基因可能參與植物激素信號通路應答。
3討論
電子克隆是依托現(xiàn)有的網(wǎng)絡資源(EST數(shù)據(jù)庫、核苷酸數(shù)據(jù)庫、蛋白質(zhì)數(shù)據(jù)庫、基因組數(shù)據(jù)庫等)采用生物信息學方法進行基因克隆的新策略,且伴隨著基因組計劃和EST計劃的實施而逐漸興起。利用電子克隆技術克隆基因不僅可以快速地發(fā)現(xiàn)新基因,更能為基因的結構研究和功能預測提供新思路[41-42]。電子克隆與傳統(tǒng)的克隆方法相比,具有成本低、效率高、技術要求低和針對性強等優(yōu)點[43]。但由于某些基因存在多種剪切方式,電子克隆獲得的結果只能作為參考;另外由于生物大分子結構和功能的復雜性,許多分析軟件的輸出結果存在較大偏差,因此利用生物信息學進行“虛擬”克隆的結果必需回到實驗室作進一步的試驗驗證。水稻是模式植物,基因組測序已完成,具有豐富的基因組序列和EST序列,截至目前,在NCBI 的EST 數(shù)據(jù)庫中可以檢索到1 695 551條水稻的EST序列,且這一數(shù)據(jù)量還將不斷擴大,這為水稻基因的電子克隆提供了很好的生物信息學平臺。該研究以NP 174188.1為查詢探針,通過搜索水稻EST數(shù)據(jù)庫和EST序列的拼接,用電子克隆的方法克隆了水稻脂肪酶基因OsARAB1。OsARAB1基因cDNA全長1 555 bp,基因編碼區(qū)序列(CDS)全長1 086 bp,編碼一個含有361個氨基酸殘基的蛋白質(zhì)。用生物信息學軟件對OsARAB1蛋白的結構、功能、進化等進行了分析。OsARAB1蛋白N端具有信號肽,屬于親水性的胞外蛋白,比較穩(wěn)定,偏堿性。二級結構以α螺旋和無規(guī)則卷曲為主,延伸鏈散布于整個蛋白質(zhì)中。具有2個功能結構域:SGNH水解酶型酯酶、GDSL脂肪酶,因此OsARAB1蛋白屬于SGNH脂肪酶。有21個磷酸化位點、7個糖基化位點,其中Ser30、Thr66、Ser91與OsARAB1蛋白的活性調(diào)控有關,在不同時期可逆地糖基化或磷酸化修飾。氨基酸多序列比對和系統(tǒng)發(fā)育樹分析表明OsARAB1蛋白與其他物種GDSL脂肪酶的氨基酸序列具有較高的一致性;推定的活性位點的氨基酸殘基為Ser34、Gly107、Asn167、Asp333、His336;與玉米酯酶亞型B4FM12親緣關系最近,一致性達到82%,由此推斷OsARAB1蛋白和玉米酯酶亞型B4FM12可能具有類似的生理功能。
電子表達分析是通過整合某物種中特定基因的所有相關表達序列標簽信息,從而獲得該基因表達相關信息的一種新型基因表達分析技術[44-45]。目前,電子表達分析常與電子克隆技術相結合,共同應用于新基因挖掘和基因功能分析,已被成功應用于多種植物目標基因的表達分析。White等[46]利用電子表達分析方法發(fā)掘了擬南芥中一批種子發(fā)育特異表達基因。Fei等[47]建立了一個包含15 000個非處理Unigene和6 000個規(guī)范化Unigene數(shù)據(jù)在內(nèi)的番茄電子表達分析數(shù)據(jù)庫。Mochida等[48]利用電子表達分析技術在小麥上鑒定了一批在抗旱和ABA處理中相應的基因。上官凌飛等[45]利用GenBank中大量葡萄EST序列,建立了基因電子表達分析的有效平臺,并通過RTPCR技術對電子表達分析結果的準確性驗證,結果顯示電子表達分析結果與RTPCR分析結果高度一致。由此可見,電子克隆技術與電子表達分析方法可作為新基因挖掘與功能分析的有效手段。OsARAB1基因的電子表達分析表明,OsARAB1基因的表達有組織和器官特異性特點,但也受稻瘟病病原菌誘導表達,說明OsARAB1基因的表達對水稻的發(fā)育和形態(tài)發(fā)生起重要作用,在水稻受到稻瘟病感染時,成熟葉子中OsARAB1基因被誘導表達形成對稻瘟病菌的防御反應。已克隆的基因PR1和幾丁質(zhì)酶基因的表達也有組織和器官特異性,在辣椒受到病原侵染時表達增強構成防御反應[49-52]。
OsARAB1基因的編碼區(qū)序列電子定位于第五染色體基因組序列NC 008398.2核苷酸序列6 769 813~6 773 213 bp區(qū)域,通過對匹配區(qū)段和4個沒有參與匹配區(qū)段的分析可以推測該基因有5個外顯子、4個內(nèi)含子,4個內(nèi)含子分別位于6 770 051~6 770 128、6 770 337~6 770 519、6 770 670~6 771 078、6 771 356~6 772 994 bp區(qū)段。該基因的編碼區(qū)序列與臨時基因Os05g0209600的染色體區(qū)域重疊,說明OsARAB1和Os05g0209600可能是同一個基因。因此,在克隆OsARAB1和研究OsARAB1功能時,可以參考臨時基因Os05g0209600的資料,提高試驗克隆和功能鑒定的效率。在該基因的附近還存在一個SGNH植物脂肪酶Os05g0210100,推測這2個基因可能由同一個脂肪酶基因經(jīng)序列復制而產(chǎn)生,其后又在各個復制片段上逐漸積累了突變而形成現(xiàn)在這種基因結構[53]。
參考文獻
[1]
UPTON C,BUCKLEY J T.A new family of lipolytic enzymes[J].Trends Biochem Sci,1995,20:178-179.
[2] BRICK D J,BRUMLIK M J,BUCKLEY J T,et al.A new family of lipolytic plant enzymes with members in rice,arabidopsis and maize[J].FEBS Lett,1995,377:475-480.
[3] BRENNER S.The molecular evolution of genes and proteins:A tale of two serines[J].Nature,1988,334(6182):528-530.
[4] MLGAARD A,KAUPPINEN S,LARSEN S.Rhamnogalacturonan acetylesterase elucidates the structure and function of a new family of hydrolases[J].Structure,2000,8(4):373-383.
[5] AKOH C C,LEE G C,LIAW Y C,et al.GDSL family of serine esterases/lipases[J].Prog Lipid Res,2004,43(6):534-552.
[6] CHEESEMAN J D,TOCILJ A,PARK S,et al.Structure of an aryl esterase from Pseudomonas fluorescens[J].Acta Crystallogr D Biol Crystallogr,2004,60(Pt 7):1237-1243.
[7] MATHEWS I,SOLTIS M,SALDAJENO M,et al.Structure of a Novel Enzyme that catalyzes acyl transfer to alcohols in aqueous conditions[J].Biochemistry,2007,46(31):8969-8979.
[8] VAN DEN BERG B.Crystal structure of a fulllength autotransporter[J].J Mol Biol,2010,396(3):627-633.
[9] PRINGLE D,DICKSTEIN R.Purification of ENOD8 proteins from Medicago sativa root nodules and their characterization as esterases[J].Plant Physiol Biochem,2004,42(1):73-79.
[10] ARIF S A,HAMILTON R G,YUSOF F,et al.Isolation and characterization of the early nodulespecific protein homologue (Hev b 13),an allergenic lipolytic esterase from Hevea brasiliensis latex[J].J Biol Chem,2004,279:23933-23941.
[11] CUMMINS I,EDWARDS R.Purification and cloning of an esterase from the weed blackgrass (Alopecurus myosuroides),which bioactivates aryloxyphenoxypropionate herbicides[J].Plant J,2004,39(6):894-904.
[12] RUPPERT M,WOLL J,GIRITCH A,et al.Functional expression of an ajmaline pathwayspecific esterase from Rauvolfia in a novel plantvirus expression system[J].Planta,2005,222(5):888-898.
[13] OH I S,PARK A R,BAE M S,et al.Secretome analysis reveals an Arabidopsis lipase involved in defense against Alternaria brassicicola[J].Plant Cell,2005,17:2832-2847.
[14] MAYFIELD J A,F(xiàn)IEBIG A,JOHNSTONE S E,et al.Gene families from Arabidopsis thaliana pollen coat proteome[J].Science,2001,292:2482-2485.
[15] TEISSERE M,BOREL M,CAILLOL B,et al.Purification and characterization of a fatty acylester hydrolase from postgerminated sunflower seeds[J].Biochim Biophys Acta,1995,1255:105-112.
[16] YOUENSCLARK K,BUCKLER E,CASSTEVENS T,et al.Gramene database in 2010:Updates and extensions[J].Nucleic Acids Res,2010,39:1085-1094.
[17] OUYANG S,ZHU W,HAMILTON J,et al.The TIGR Rice Genome Annotation Resource:improvements and new features[J].Nucleic Acids Res,2007,35:883-887.
[18] RIEMANN M,GUTJAHR C,KORTE A,et al.GER1,a GDSL motifencoding gene from rice is a novel early light and jasmonateinduced gene[J].Plant Biol (Stuttg),2007,9(1):32-40.
[19] PARK J J,JIN P,YOON J,et al.Mutation in Wilted Dwarf and Lethal 1 (WDL1) causes abnormal cuticle formation and rapid water loss in rice[J].Plant Mol Biol,2010,74(1-2):91-103.
[20] SOLOVYEV V V.Statistical approaches in Eukaryotic gene prediction[C]//BALDING D J,CANNINGS C,BISHOP M.Handbook of Statistical genetics.3d edition.Hoboken, NJ:WileyInterscience,2007:1616.
[21] GASTEIGER E,HOOGLAND C,GATTIKER A,et al.Protein identification and analysis tools on the ExPASy server[C]//WALKER J M.The proteomics protocols handbook.Totowa,NJ:Humana Press,2005:571-607.
[22] PRILUSKY J,F(xiàn)ELDER C E,RYDBERG E,et al.Foldlndex:A simple tool to predict whether a given protein sequence is intrinsically unfolded[J].Bioinformatics,2005,21(16):3435-3438.
[23] COMBET C,BLANCHET C,GEOURJON C,et al.NPS@:Network protein sequence analysis[J].TIBS,2000,25(3):147-150.
[24] EMANUELSSON O,NIELSEN H,BRUNAK S,et al.Predicting subcellular localization of proteins based on their Nterminal amino acid sequence[J].Mol Biol,2000,300:1005-1016.
[25] NIELSEN H,ENGELBRECHT J,BRUNAK S,et al.Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites[J].Protein Engineering,1997,10:1-6.
[26] PETERSEN T N,BRUNAK S,VON HEIJNE G,et al.SignalP 4.0:Discriminating signal peptides from transmembrane regions[J].Nature Methods,2011,8:785-786.
[27] SONNHAMMER E L L,HEIJNE G V,KROGH A.A hidden Markov model for predicting transmembrane helices in protein sequences[C]//GLASGOW J,LITTLEJOHN T,MAJOR F,et al.Proc of Sixth Int Conf on Intelligent Systems for Molecular Biology.Menlo Park,CA:AAAI Press,1998:175-182.
[28] BLOM N,GAMMELTOFT S,BRUNAK S.Sequence and structurebased prediction of eukaryotic protein phosphorylation sites[J].Journal of Molecular Biology,1999, 294(5):1351-1362.
[29] GUPTA R.Prediction of glycosylation sites in proteomes:From posttranslational modifications to protein function[D].CBS,2001.
[30] GUPTA R,BRUNAK S.Prediction of glycosylation across the human proteome and the correlation to protein function[J].Pac Symp Biocomput,2002,7:310-322.
[31] JUHL JENSEN L,GUPTA R,BLOM N,et al.Ab initio prediction of human orphan protein function from posttranslational modifications and localization features[J].J Mol Biol,2002,319:1257-1265.
[32] JENSEN L J,GUPTA R,STAERFELDT H H,et al.Prediction of human protein function according to Gene Ontology categories[J].Bioinformatics,2003,19(5):635-642.
[33] BIASINI M,BIENERT S,WATERHOUSE A,et al.SWISSMODEL:Modelling protein tertiary and quaternary structure using evolutionary information[J].Nucleic Acids Res,2014,42:252-258.
[34] ARNOLD K,BORDOLI L,KOPP J,et al.The SWISSMODEL workspace:A webbased environment for protein structure homology modelling[J].Bioinformatics,2006,22:195-201.
[35] BENKERT P,BIASINI M,SCHWEDE T.Toward the estimation of the absolute quality of individual protein structure models[J].Bioinformatics,2011,27:343-350
[36] REINA J J,GUERRERO C,HEREDIA A.Isolation,characterization,and localization of AgaSGNH cDNA:A new SGNHmotif plant hydrolase specific to Agave americana L.leaf epidermis[J].J Exp Bot,2007,58(11):2717-2731.
[37] LING H,ZHAO J,ZUO K,et al.Isolation and expression analysis of a GDSLlike lipase gene from Brassica napus L.[J].J Biochem Mol Biol,2006,39:297-303.
[38] KIBA T,NAITOU T,KOIZUMI N,et al.Combinatorial microarray analysis revealing Arabidopsis genes implicated in cytokinin responses through the His->Asp phosphorelay circuitry[J].Plant Cell Physiol,2005,46:339-355.
[39] CAO D,CHENG H,WU W,et al.Gibberellin mobilizes distinct DELLAdependent transcriptomes to regulate seed germination and floral development in Arabidopsis[J].Plant Physiol,2006,142:509-525.
[40] SVENDSEN A.Lipase protein engineering[J].Biochimica et Biophyscia Acta,2000,1543:223-238.
[41] 陳國強,孟鵬,劉李黎,等.高粱抗壞血酸過氧化物酶基因的電子克隆及序列分析[J].生物信息學,2011,9(2):125-130.
[42] 林立霞,郭海,黃少偉,等.火炬松DREB1基因的電子克隆與生物信息學分析[J].生物信息學,2010,8(1):43-46.
[43] FENG Y J,ZHANG H M,JIANG M G,et al.In silico cloning of full length cDNA of Cryphonectria parasitica ubiquitin conjugated enzyme gene (CpUBC) [J].Chinese J Bioinformatics,2004,2:5-9.
[44] 黃寧,張玉葉,闕友雄,等.甘蔗二氨基庚二酸異構酶基因的克隆與表達分析[J].熱帶作物學報,2013,34(11):2200-2208.
[45] 上官凌飛,王晨,房經(jīng)貴,等.利用GenBank中大量葡萄 EST序列分離有效基因的電子表達分析平臺[J].中國農(nóng)業(yè)科學,2011,44(13):2748-2759.
[46] WHITE J A,TODD J,NEWMAN T,et al.A new set of Arabidopsis expressed sequence tags from developing seeds.The metabolic pathway from carbohydrates to seed oil[J].Plant Physiol,2000,124(4):1582-1594.
[47] FEI Z,TANG X,ALBA R,et al.Tomato Expression Database(TED):A suite of data presentation and analysis tools[J].Nucleic Acids Res,2006,34:D766-770.
[48] MOCHIDA K,KAWAURA K,SHIMOSAKA E,et al.Tissue expression map of a large number of expressed sequence tags and its application to in silico screening of stress response genes in common wheat[J].Molecular Genetics and Genomics,2006,276(3):304-312.
[49] KIM Y J,HWANG B K.Pepper gene encoding a basic pathogenesis-related 1 protein is pathogen and ethylene inducible[J].Physiol Plant,2000,108:51-60.
[50] LEE Y K,HIPPESANWALD S,LEE S C,et al.In situ localization of PR1 mRNA and PR1 protein in compatible and incompatible interactions of pepper stems with Phytophthora capsici[J].Protoplasma,2000,211:64-75.
[51] HONG J K,HWANG B K.Induction by pathogen,salt and drought of a basic class II chitinase mRNA and its in situ localization in pepper (Capsicum annuum)[J].Physiol Plant,2002,114(4):549-558.
[52] HONG J K,LEE S C,HWANG B K.Activation of pepper basic PR-1 gene promoter during defense signaling to pathogen,abiotic and environmental stresses[J].Gene,2005,356:169-180.
[53] 本杰明·盧因.基因 VIII[M].余龍,江松敏,趙壽元,主譯.北京:科學出版社,2004:95-124.