潘倚天 黃敏
摘要:COBRA基因編碼糖基磷脂酰肌醇錨定的植物特異性蛋白,在初生和次生細(xì)胞壁的纖維素生物合成中發(fā)揮重要作用。通過生物信息學(xué)方法,從玉米基因組中發(fā)現(xiàn)了9個(gè)COBRA家族基因,并對其基因結(jié)構(gòu)、系統(tǒng)發(fā)育和表達(dá)模式等進(jìn)行了分析。結(jié)果表明,9個(gè)COBRA家族基因都含有CCVS保守結(jié)構(gòu)域,并且均定位于細(xì)胞膜上。系統(tǒng)進(jìn)化分析結(jié)果顯示,該家族可以分為2個(gè)亞族,每個(gè)亞族內(nèi)的基因具有相似的基因結(jié)構(gòu)和理化性質(zhì)?;虮磉_(dá)分析結(jié)果表明,所有COBRA家族成員響應(yīng)多種非生物脅迫,且當(dāng)植株受到紫外照射處理時(shí),ZmCOBL1~ZmCOBL3和ZmCOBL7~ZmCOBL9這6個(gè)基因均表現(xiàn)出上調(diào)應(yīng)答。
關(guān)鍵詞:玉米;COBRA基因家族;纖維素;表達(dá)模式;生物信息學(xué)
中圖分類號(hào):S513? ? ? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ? ? ? 文章編號(hào):1001-1463(2022)02-0067-06
doi:10.3969/j.issn.1001-1463.2022.02.017
Genome-wide Identification and Expression Pattern Analysis of COBRA Family Members in Maize
PAN Yitian, HUANG Min
(College of Life Sciences, Yangtze University, Jingzhou Hubei 434025, China)
Abstract:The COBRA gene encodes a glycosyl phosphatidyl inositol-anchored, plant-specific protein that plays an important role in cellulose biosynthesis in primary and secondary cell walls. In this study, 9 COBRA family genes were found from the maize genome by bioinformatics methods, and their gene structures, phylogeny and expression patterns were analyzed. The results showed that the 9 COBRA family genes all contained CCVS conserved domains, and all of them were located on the cell membrane. Phylogenetic analysis showed that COBRA family could be divided into two subfamilies, and the genes in each subgroup had similar gene structure and physicochemical properties. Gene expression analysis showed that all COBRA family members responded to a variety of abiotic stresses, and all six genes, ZmCOBL1~ZmCOBL3 and ZmCOBL7~ZmCOBL9, showed up-regulated responses when plants were exposed to UV irradiation.
Key words:Maize(Zea mays L.);COBRA gene family;Cellulose;Express pattern;Bioinformatics
玉米(Zea mays L.)是全世界最重要的糧食作物之一,在全球范圍內(nèi)分布十分廣泛。2018年,我國玉米總產(chǎn)量占到全國糧食總產(chǎn)量的39%以上,播種面積占到全國糧食作物播種面積的36%[1 ],可見玉米的產(chǎn)量高低與我國糧食安全息息相關(guān)。我國的玉米產(chǎn)量常受倒伏影響造成不同程度的減產(chǎn),因此通過篩選玉米與莖稈機(jī)械強(qiáng)度相關(guān)基因,增強(qiáng)玉米抗倒伏能力,是提升玉米產(chǎn)量和保證國家糧食安全的重要措施。
COBRA家族是由COBRA-Like(COBL)蛋白組成的一類糖基磷脂酰肌醇(Glycosyl phosphatidyl inositol,GPI)錨定蛋白,在初生和次生細(xì)胞壁的纖維素生物合成中發(fā)揮核心作用[2 ]。COBRA家族首先在擬南芥中被發(fā)現(xiàn),COBRA突變體根異常生? 長[3 ]。Brittle Stalk2(BK2)是在玉米中發(fā)現(xiàn)的首個(gè)COBRA家族成員[4 ],其在纖維素合成中發(fā)揮功能,并在成熟后的次生細(xì)胞壁發(fā)育發(fā)揮適當(dāng)?shù)淖饔肹5 ]。在大多數(shù)情況下,COBRA基因家族突變體表現(xiàn)出纖維素含量降低[6 ]。利用生物信息學(xué)對玉米COBRA家族基因進(jìn)行系統(tǒng)分析有助于預(yù)測COBRA家族成員的功能,將為后續(xù)研究該家族成員的生物學(xué)功能和應(yīng)用于玉米分子育種提供重要依據(jù)。
1? ?材料與方法
1.1? ?COBRA家族成員的鑒定和染色體定位
根據(jù)高粱的10個(gè)COBRA基因家族成員的序列[7 ],使用BlastP在玉米全基因組蛋白序列數(shù)據(jù)庫中搜索,得到候選序列。典型的COBRA家族成員含有1個(gè)COBL結(jié)構(gòu)域(PF04833)[8 ]。通過BatchCD-search功能和Pfam檢驗(yàn)驗(yàn)證序列是否含有保守結(jié)構(gòu)域,并刪去重復(fù)序列。使用TBtools軟件將玉米COBRA家族成員在染色體上的位置可視化[9 ],并根據(jù)基因在染色體上的位置進(jìn)行命名。
使用同樣的方法分別鑒定出水稻、高粱和擬南芥的所有COBRA基因家族成員,并根據(jù)在染色體上的位置進(jìn)行命名。
1.2? ?玉米COBRA家族成員序列分析
使用Expasy網(wǎng)站預(yù)測ZmCOBL蛋白的分子量和等電點(diǎn),使用SignalP-5.0預(yù)測N端信號(hào)肽,并用big-PI預(yù)測C端疏水末端的錨定位點(diǎn)[10 ]。用MEME網(wǎng)站分析蛋白序列中的保守基序,使用Softberry網(wǎng)站預(yù)測亞細(xì)胞定位。用TBtools分析家族成員的內(nèi)含子和外顯子結(jié)構(gòu)。
1.3? ?玉米和其他物種的COBRA蛋白系統(tǒng)發(fā)育分析及共線性分析
利用MEGA11中的ClustalW功能,對4個(gè)物種COBRA蛋白進(jìn)行多重比對,隨后利用最大似然法(MaximumLikelihood)構(gòu)建系統(tǒng)進(jìn)化樹,Bootstrap值設(shè)置為1 000。利用TBtools的One Step MCScanX功能分析玉米與高粱和水稻之間的共線性關(guān)系,并用Dual Systeny Plot功能進(jìn)行可視化。
1.4? ?玉米COBRA家族成員的表達(dá)模式分析
利用MaizeGDB中的qTeller功能下載COBRA家族成員的RNA-Seq數(shù)據(jù)[11 ],經(jīng)過均一化處理后使用TBtools進(jìn)行熱圖繪制。
2? ?結(jié)果與分析
2.1? ?玉米COBRA家族成員的鑒定和染色體定位
通過BlsatP比對和重復(fù)序列的去除,最終確定玉米全基因組中共含有9個(gè)COBRA家族成員。染色體定位結(jié)果顯示,9個(gè)成員在染色體上的分布不均勻,共分布在5條染色體上。其中1號(hào)染色體和7號(hào)染色體各分布有3個(gè)成員,而2號(hào)染色體、5號(hào)染色體和9號(hào)染色體各含有1個(gè)。根據(jù)其在染色體上的位置,將這些成員分別命名為ZmCOBL1-ZmCOBL9(圖1)。
2.2? ?玉米COBRA家族成員序列分析
對玉米COBRA家族成員進(jìn)行序列分析,結(jié)果見表1。該家族成員的分子質(zhì)量為25.734 59~75.169 48 kD,平均值為51.999 79 kD。蛋白質(zhì)等電點(diǎn)為6.03~9.19,其中大于7的有7個(gè)成員,小于7的只有2個(gè)成員,說明該基因家族成員多為堿性蛋白。在9個(gè)成員中,除ZmCOBL2和ZmCOBL7外,其余都含有N端信號(hào)位點(diǎn)。C端GPI錨定位點(diǎn)預(yù)測結(jié)果表明,除ZmCOBL2之外,其余成員均至少含有1個(gè)GPI錨定位點(diǎn)。亞細(xì)胞定位預(yù)測顯示,所有的ZmCOBL家族成員均定位在細(xì)胞膜上,與其他物種相同[11 ]?;蚪Y(jié)構(gòu)分析顯示,有4個(gè)ZmCOBL家族成員含有5個(gè)內(nèi)含子和6個(gè)外顯子(圖2),說明基因結(jié)構(gòu)在一定程度上較為保守。對保守基序分析后發(fā)現(xiàn),9個(gè)ZmCOBL家族成員均含有motif3(圖3),該保守基序含有1個(gè)高度保守的序列CCVS(圖4)。此外motif2和motif5均存在除ZmCOBL2之外的8個(gè)成員上。
2.3? ?玉米和其他物種的COBRA蛋白系統(tǒng)發(fā)育分析及共線性分析
為了分析COBRA蛋白的系統(tǒng)發(fā)育關(guān)系,將玉米、擬南芥、水稻和高粱等4個(gè)物種的COBRA蛋白序列,用最大似然法構(gòu)建進(jìn)化樹(圖5)。根據(jù)其聚類結(jié)果,將41個(gè)基因分為2個(gè)亞族。玉米COBRA家族成員在2個(gè)亞族內(nèi)的數(shù)量分別是7個(gè)(ZmCOBL2、ZmCOBL3、ZmCOBL4、ZmCOBL5、ZmCOBL7、ZmCOBL8、ZmCOBL9)和2個(gè)(ZmCOBL6和ZmCOBL1)。高粱和水稻也出現(xiàn)這種分布不均的現(xiàn)象,亞族1有8個(gè)成員,亞族2只有3個(gè)成員。擬南芥在2個(gè)亞族內(nèi)的分布較為均勻,分別是6個(gè)和5個(gè)。
為進(jìn)一步了解COBRA家族的進(jìn)化機(jī)制,選取另外2個(gè)禾本科植物和1個(gè)模式植物擬南芥,利用MCScanX功能分析COBRA家族基因間的共線性(圖6)。結(jié)果顯示,該基因家族在擬南芥和玉米之間沒有共線性(圖中未顯示)。在禾本科植物中,玉米與水稻、高粱分別有2個(gè)和5個(gè)共線性基因?qū)?,其中ZmCOBL1在高粱基因組內(nèi)有2個(gè)對應(yīng)基因,SbCOBL3在玉米基因組內(nèi)也有2個(gè)對應(yīng)基因。
2.4? ?玉米COBRA家族成員的表達(dá)模式分析
根據(jù)MaizeGDB公布的RNA-Seq數(shù)據(jù),篩選出玉米COBRA基因家族在不同脅迫處理下的表達(dá)量數(shù)據(jù),除ZmCOBL4和ZmCOBL6之外,其他的7個(gè)基因均有相對應(yīng)的表達(dá)量。根據(jù)上述數(shù)據(jù)制作表達(dá)量熱圖(圖7)。從圖中看出,7個(gè)基因在紫外輻射脅迫時(shí),除ZmCOBL5外均表現(xiàn)明顯的上調(diào)響應(yīng),而在面對高溫脅迫和鹽脅迫時(shí),除ZmCOBL2和ZmCOBL8外均表現(xiàn)出顯著的下調(diào)響應(yīng),說明這些基因在不同程度上都參與了非生物脅迫的調(diào)控。值得一提的是,玉米面對4種非生物脅迫時(shí),ZmCOBL5基因均表現(xiàn)出下調(diào)應(yīng)答,而其他基因的響應(yīng)模式不同。
3? ?小結(jié)與討論
通過BlastP檢索,去重和保守結(jié)構(gòu)域驗(yàn)證,共鑒定到9個(gè)玉米COBRA成員,通過其在玉米染色體上的位置分布,分別命名為ZmCOBL1~ZmCOBL9。對基因家族成員的序列分析發(fā)現(xiàn),所有蛋白序列都存在CCVS保守結(jié)構(gòu)域,8個(gè)蛋白包含N端信號(hào)肽,7個(gè)含有GPI錨定位點(diǎn),這些特征均表明其屬于典型的COBRA家族蛋白[12 ]。經(jīng)過與擬南芥、高粱和水稻3個(gè)物種共同構(gòu)建進(jìn)化樹,發(fā)現(xiàn)玉米COBRA蛋白和高粱的同源性最高,其次是水稻,而與雙子葉植物擬南芥的同源性最低,說明在單子葉植物中COBRA蛋白更加保守。此外還發(fā)現(xiàn),這些成員可以分為2個(gè)亞族,其中ZmCOBL6和ZmCOBL1在第二亞族,其他蛋白聚類在第一亞族。與其他禾本科作物一樣,玉米也存在成員分布不均的情況,說明COBRA蛋白序列在單雙子葉植物之間存在一定差異,其差異很有可能是在單雙子葉植物分化之后才形成。共線性分析表明,ZmCOBL1同時(shí)存在于高粱和水稻2個(gè)物種的共線性基因?qū)χ?,表明該基因在單子葉植物內(nèi)同時(shí)存在,但不存在于雙子葉植物間,可能是該基因形成于物種分化之后。玉米和高粱內(nèi)各有1個(gè)基因在種間形成2個(gè)基因?qū)?,說明玉米和高粱具有最大的相似遺傳關(guān)系,和擬南芥相比,水稻和玉米間的共線性關(guān)系也較高。任昂彥等[8 ]發(fā)現(xiàn),通過分析谷子(Setaria italica L.)與玉米、水稻和擬南芥的蛋白進(jìn)化關(guān)系,認(rèn)為谷子與玉米相似性最高,其次為水稻。這說明禾本科作物之間具有更近的親緣關(guān)系[13 ]。
根據(jù)對從公共數(shù)據(jù)庫獲得的ZmCOBL家族成員的表達(dá)數(shù)據(jù)分析,可以看出這些基因?qū)Ψ巧锩{迫都表現(xiàn)出不同程度的響應(yīng)。ZmCOBL家族成員是參與植物纖維素合成的重要基因,其表達(dá)量的高低直接關(guān)系到玉米成熟時(shí)的次生細(xì)胞壁發(fā)育和組織彈性的指標(biāo)[14 ],因此可推測當(dāng)玉米受到紫外處理時(shí),其纖維素的相關(guān)合成途徑會(huì)受到促進(jìn);而當(dāng)玉米受到高溫、鹽害等非生物脅迫時(shí),其木質(zhì)素含量和次生細(xì)胞壁發(fā)育會(huì)受影響,從而導(dǎo)致玉米莖稈強(qiáng)度下降等現(xiàn)象。
本研究通過對玉米COBRA家族成員進(jìn)行了鑒定和分析,闡明了該家族成員在序列特征、亞細(xì)胞定位、與其他物種的進(jìn)化關(guān)系和應(yīng)對非生物脅迫時(shí)的表達(dá)模式,系統(tǒng)的展現(xiàn)了該家族成員的特征,為將來利用分子設(shè)計(jì)育種手段提高玉米莖稈強(qiáng)度和應(yīng)對非生物脅迫提供了思路和理論基礎(chǔ)[15 ]。
參考文獻(xiàn):
[1] 李方圓.? 玉米脆性基因主效位點(diǎn)挖掘及連鎖分子標(biāo)記的開發(fā)[D].? 泰安:山東農(nóng)業(yè)大學(xué),2020.doi:10.272 77/d.cnki.gsdnu.2020.000985.
[2] LI P,LIU Y R,TAN W Q,et al.? Brittle Culm 1 encodes a COBRA-like protein involved in secondary cell wall cellulose biosynthesis in sorghum[J].? Plant & Cell Physiology,2018,60(4):788-801.
[3] BENFEY P N,LINSTEAD P J,ROBERTS K.? Root development in Arabidopsis:fourmutants with dramatically altered root morphogenesis[J].? Development,1993 119(1):57-70.
[4] CHING A,DHUGGA K S,APPENZELLER L,et al. Brittle stalk 2 encodes a putative glycosylphos phatidylinositol-anchored protein that affects mechanical strength of maize tissues by altering the composition and structure of secondary cell walls[J].? Planta,2006,224(5):1174-1184.
[5] SINDHU A,LANGEWISCH T,OLEK A,et al.? Maize Brittle stalk2 encodes a COBRA-like protein expressed in early organ development butrequired for tissue flexibility at maturity[J].? Plant Physiology,2007,145(4):1444-1459.
[6] DAI X,YOU C,CHEN G,et al. OsBC1L4 encodes a COBRA-like protein that affects cellulose synthesis in rice[J].? Plant Molecular Biology,2011,75(4):333-345.
[7 ] 元志成,柯余生,吳富進(jìn),等.? 高粱COBRA基因家族全基因組的鑒定和表達(dá)分析[J].? 河南農(nóng)業(yè)科學(xué),2020,49(10):33-41.
[8] 任昂彥,陳環(huán)宇,王根平,等.? 谷子COBRA家族成員的全基因組鑒定及表達(dá)模式分析[J].? 分子植物育種,2021,10(2):1-10.
[9] CHEN C J,CHEN H,ZHANG Y,et al.? TBtools:An integrative toolkit developed for interactive analyses of big biological data[J].? Molecular Plant,2020,13(8):1194-1202.
[10] 齊燕妮,李聞娟,王利民,等.? 亞麻COBRA基因家族的鑒定與生物信息學(xué)分析[J].? 甘肅農(nóng)業(yè)科技,2019(9):33-3