李東霞 石鵬 賀梁瓊 楊偉波 符海泉 徐中亮
摘 要 Ca2+是植物中重要的第二信使,幾乎介導了植物生長發(fā)育的全部反應。鈣依賴蛋白激酶(CDPKs)是植物中重要的鈣傳感蛋白,在植物生命活動中扮演著重要角色。目前2個二倍體野生種花生全基因組序列已經(jīng)公布,而由2個野生種雜交后形成的異源四倍體栽培種花生的全基因組序列還沒有公布,野生種花生CDPKs的生物信息學分析結果可以為栽培種花生CDPKs的研究提供參考。本研究采用生物信息學方法和工具對2個野生種花生CDPKs基因家族的全基因組分布、基因結構、進化和理化性質等進行分析。結果表明:2個野生種花生全基因組均比對到35個CDPKs基因序列,野生種花生與擬南芥CDPKs基因結構類似,蛋白質結構具有典型的蛋白質激酶和EF手型結構域,2個野生種花生與其它物種在進化過程中CDPKs變異較小,可能作為鈣傳感蛋白在細胞內各個部位和細胞器中行使功能。本研究結果可為栽培種花生的CDPKs結構和功能研究提供參考。
關鍵詞 野生種花生;鈣依賴蛋白激酶;生物信息學;EF手型結構域
中圖分類號 S565.2 文獻標識碼 A
Bioinformatics Analysis of Calcium Dependent Protein Kinases
Gene Family in Wild Peanut
LI Dongxia1,2, SHI Peng1,2, HE Liangqiong3, YANG Weibo1,2, FU Haiquan1,2, XU Zhongliang1,2
1 Coconut Research Institute, Chinese Academy of Tropical Agricultural Sciences, Wenchang, Hainan 571339, China
2 Hainan Key Biological Laboratory of Tropical Oil Crops, Wenchang, Hainan 571339, China
3 Cash Crops Research Institute of Guangxi Academy of Agricultural Sciences, Nanning, Guangxi 530007, China
Abstract The calcium ion(Ca2+)is known as a key second messenger in plants , almost participate plant growth and development. Calcium dependent protein kinases(CDPKs)is the important calcium sensor proteins, it play an important role in the life of plant. Now, two wild diploid peanut genome sequences have been published, but the sequence of allotetraploid peanut that derived from a hybridization between two wild species has not been published. The results of bioinformatics can offer a reference for the CDPKs analysis of cultivated peanut. In this study, we analyzed two wild peanut CDPKs' genome distribution, genes structure, evolution, physical and chemical properties using bioinformatics methods and tools. The results indicated that 35 CDPKs gene sequences were found in two wild peanut genome respectively, CDPKs genes structure is similar between wild peanuts and Arabidopsis thaliana, protein kinases and EF hand domain were found in the protein structure, CDPKs variation is small between two wild peanuts and other species in the evolutionary process, CDPKs may function as calcium sensor protein within all the parts of cell and organelles. The results can provide reference for the study of CDPKs' structure and function of cultivated peanut.
Key words wild peanut; calcium dependent protein kinases; bioinformatics; EF-hand domain
doi 10.3969/j.issn.1000-2561.2017.01.017
花生(Arachis hypogaea L.)是中國主要的油料作物和經(jīng)濟作物之一,也是海南省的重要油料作物[1-2]。鈣是植物生長發(fā)育過程必需的營養(yǎng)元素之一,參與植物從種子萌發(fā)、生長分化、形態(tài)建成到開花結果的全過程[3]。而花生是喜鈣作物,對缺鈣非常敏感[4],因土壤缺鈣造成花生大幅減產(chǎn)降質的問題尤為突出。海南島是一個典型的熱帶土壤分布區(qū),成土過程中鈣淋失嚴重,且鹽基高度不飽和,肥料施入后易遭損失而且海南島也是中國植物中含鈣最低的地區(qū)之一[5-6]。因此,在生產(chǎn)成本降低和環(huán)境保護雙重壓力下篩選耐低鈣花生品種對提高海南花生產(chǎn)量至關重要。
CDPKs(calcium-dependent protein kinases)是在植物中首先發(fā)現(xiàn)的一種鈣依賴型蛋白激酶,是植物和一些原生生物所特有的一類絲氨酸/蘇氨酸型蛋白激酶,在胞內鈣信號的放大并向下級聯(lián)傳遞過程中起著十分重要的作用[7]。CDPK擁有4個特別的結構域,N-末端結構域,ATP結合激酶結構域,自動抑制結構域和包含4個鈣離子結合EF-hand的C-末端的類鈣調蛋白結構域。鈣離子能直接結合到CDPK的類鈣調蛋白結構域上,因此CDPK能發(fā)現(xiàn)細胞內鈣離子的濃度變化,由此帶來的構象變化會造成激酶結構域的激活和自動抑制結構域的變化[8-9]。鈣信號的進一步傳遞則需經(jīng)Ca2+結合蛋白和鈣依賴蛋白激酶等才能完成,最后引起脅迫相關基因表達量的變化,從而引發(fā)植物細胞和植株生理生化過程的變化,提高植物對不良環(huán)境刺激的耐受性[10-11]。
植物CDPKs的研究起步較晚,但發(fā)展很快,目前在擬南芥中找到了34個CDPK基因,而且梨、棉花、大豆、水稻、番茄和玉米等許多其它物種中也存在CDPK家族[12-17]。CDPK主要參與植物干旱和高鹽脅迫、抗病反應、激素信號轉導、光周期調節(jié)和營養(yǎng)代謝等生理活動,在玉米、擬南芥、水稻、黃瓜等作物中都有相關研究報道[18]。Jain等[19]研究發(fā)現(xiàn)花生在土壤缺鈣情況下,種子發(fā)育過程中CDPK基因上調表達。同時,在莢果發(fā)育過程中也維持著較高的表達水平。
目前生產(chǎn)上種植的花生是栽培種花生(Arachis hypogaea L.),是四倍體一年生草本作物。其祖先為野生種花生,這2個野生種(Arachis duranensis,Arachis ipaensis)均為二倍體,已經(jīng)測序完成并公布序列[20]。對花生鈣依賴蛋白激酶開展研究非常必要,值得注意的是目前野生種花生公布了序列,而栽培種花生的全基因組序列還沒有公布,要研究栽培種花生CDPK,可以借鑒已公布序列的野生種花生。生物信息學作為一門新學科,近年來隨著測序技術的發(fā)展,得到了越來越多的應用[21]。目前栽培種花生CDPKs研究較少,本文從生物信息學的角度收集和分析野生種花生CDPK基因序列,為栽培種花生CDPK提供借鑒和參考。
1 材料與方法
1.1 材料
擬南芥AtCDPK1-AtCDPK34這34個基因蛋白質序列從TAIR網(wǎng)站下載(http://www.arabidopsis.org/)。野生花生種Arachis duranensis由廣西農業(yè)科學院經(jīng)濟作物研究所提供。從NCBI(National Center for Biotechnology Information)網(wǎng)站上下載到用于構建系統(tǒng)進化樹的其它物種CDPK氨基酸序列有:擬南芥(Arabidopsis thaliana,AtCDPK1,NP_196107.1)、野生大豆(Glycine soja,GsCDPK,KHN05362.1)、野生大豆(Glycine soja,GsCDPK1,KHN08596.1)、蒺藜苜蓿(Medicago truncatula,MtCDPK1,XP_003589907.1)、可可(Theobroma cacao,TcCDPK1,XP_007010504.1)、陸地棉(Gossypium hirsutum,GhCDPK,ACH88439.1)、陸地棉(Gossypium hirsutum,GhCDPK1,ACX37459.1)、山葡萄(Vitis amurensis,VaCDPK2,AGS14999.1)、楊樹(Populus trichocarpa,PtCDPK2,XP_002315411.1)。
1.2 試劑
反轉錄試劑盒購自Thermo Fisher公司(K1622);Taq DNA聚合酶購自中科瑞泰;引物合成和TA克隆測序通過華大基因公司完成;其它生化試劑均為進口或國產(chǎn)分析純試劑。
1.3 方法
野生花生CDPKs序列比對在Peanutbase網(wǎng)站(http://peanutbase.org/)上進行,以擬南芥的CDPK基因蛋白質序列進行比對,選取E-value小于10-5的序列(值越低,結果可靠性越高);基因結構分析使用GSDS 2.0(http://gsds.cbi.pku.edu.cn/)在線工具進行;野生花生種Arachis duranensis葉片RNA提取采用陳高等[22]方法進行;cDNA第一條鏈合成按照Thermo Fisher公司反轉錄試劑盒說明書進行;以預測的AdCDPK1基因的CDS序列為模板設計克隆引物(表1),以cDNA為模板進行PCR擴增。50 μL反應體系如下:模板10 μL、10×Taq Buffer 5 μL、Taq DNA Polymerase(5 U/μL)1 μL、dNTPs(10 mmol/L)1 μL、上下游引物各2.5 μL、ddH2O 28 μL。2對引物的PCR程序:94 ℃預變性5 min;94 ℃變性30 s,59.5/54 ℃退火30 s,72 ℃延伸1 min,35個循環(huán);72 ℃延伸10 min。擴增完成后,用1.2%瓊脂糖凝膠電泳檢測擴增產(chǎn)物,送PCR產(chǎn)物到公司克隆測序;蛋白質結構域分析使用ExPASY中的Prosite工具進行;蛋白質三維結構建模采用Swiss-Model在線工具(http://swissmodel.expasy.org/interactive)進行;系統(tǒng)進化樹構建利用MEGA 6軟件進行,采用鄰接關系法(Neighbor-Joining),進行1 000次bootstrap統(tǒng)計計算;親水/疏水性、跨膜結構域和信號肽預測使用ProtScale、TMHMM和SignalP在線工具。
2 結果與分析
2.1 野生種花生CDPKs基因分布與特點
利用擬南芥34個CDPK基因在2個野生種花生中均分別比對到35個基因,且在10個染色體上都有分布(表2,表3)。野生種花生Arachis duranensis的3和8號染色體上分布最少只有2個,2和10號染色體上分布最多有5個。野生種花生Arachis ipaensis的8和9號染色體上分布最少只有1個,2和5號染色體上分布最多有5個。2個野生種在基因分布上有相似性,比如都在2號染色體上分布著5個CDPK基因,說明2個野生種基因組之間存在一定同源性,在進化中相距的時間不會太長。野生種花生Arachis duranensis的CDPK基因CDS長度平均為1 644 bp,蛋白質長度平均為547 aa,外顯子數(shù)平均為8個。野生種花生Arachis ipaensis的CDPK基因CDS長度平均為1 619 bp,蛋白質長度平均為538 aa,外顯子數(shù)平均為8個。
通過對2個野生種花生CDPKs基因的基因結構進行分析,發(fā)現(xiàn)2個野生種同一染色體上的CDPK基因結構相似,例如2號染色體上的AdCDPK1,AdCDPK2,AdCDPK3與AiCDPK1,AiCDPK2,AiCDPK3基因結構類似,不過外顯子數(shù)目、外顯子和內含子長度存在部分差異(圖1)。
2.2 AdCDPK1基因序列驗證
為驗證基因序列預測的真實性,以AdCDPK1基因為例進行了PCR擴增和測序驗證。取野生種花生Arachis duranensis幼嫩葉片提取總RNA(圖2),使用反轉錄試劑盒合成第一鏈cDNA(圖3)。利用預測的AdCDPK1基因CDS序列設計2對擴增引物,以cDNA為模板進行PCR擴增,得到2條900 bp左右的條帶(圖4)。送華大基因進行TA克隆測序,對測序結果進行拼接,得到一條1 755 bp的序列。該序列與預測的基因序列進行比對,發(fā)現(xiàn)同源性高達99.6%,只有7個堿基的差異(圖5)。該結果說明,野生種花生Arachis duranensis中的確存在預測的AdCDPK1基因,證實了生物信息學預測的基因真實性。
2.3 野生種花生CDPKs蛋白質結構與進化分析
蛋白結構分析發(fā)現(xiàn),野生種花生的CDPK蛋白質基本具有鈣依賴蛋白質激酶的特征結構域。以AdCDPK1為例,發(fā)現(xiàn)AdCDPK1的121~379位為蛋白質激酶保守域,該區(qū)域是受Ca2+介導的蛋白質激活結構,422~563分布著4個EF-hand結構,作為Ca2+結合位點,是鈣依賴蛋白激酶的標志性結構(圖6)。野生種花生CDPK蛋白質結構與擬南芥等物種相似,特別是蛋白質激酶域和EF-hand結構,這些區(qū)域的保守性非常高。其中,每個EF-hand結構域由13個氨基酸殘基組成(DTDNSGQITFEEL,DIDNSGTIDYGEF,DKDGSGYITQDEL,DQDNDGR
IDYNEF),這些氨基酸殘基形成2個α-螺旋,進而形成環(huán),鈣離子正是通過這些環(huán)結合上去。
AdCDPK1蛋白質三維結構建模,發(fā)現(xiàn)與模板4mx9.1.A相似性最高,建模結果也表明是鈣依賴蛋白激酶(圖7)。圖中箭頭所示即為特征結構域4個EF-hand形成的鈣離子結合環(huán)狀結構,與Prosite工具分析的結果一致。
將70個野生種花生CDPKs氨基酸序列與擬南芥、野生大豆、蒺藜苜蓿、可可、陸地棉、山葡萄和楊樹進行比對并構建系統(tǒng)進化樹。系統(tǒng)進化樹表明,這些物種和野生花生CDPKs蛋白質的氨基酸序列變異較多,造成不同物種聚在一起的可能性很低(圖8)。但是值得注意的是,野生種花生Arachis duranensis和Arachis ipaensis的CDPKs相互混雜在一起,可能是因為2個野生種花生基因組具有一定同源性。利用CDPK氨基酸序列分析野生花生和其它物種進化關系時,能較好地體現(xiàn)物種間的真實親緣關系。
2.4 野生花生AdCDPK1的野生種花生CDPKs蛋白質的理化性質分析
通過對野生花生CDPKs蛋白質進行理化性質分析,發(fā)現(xiàn)其可能作為感受蛋白在細胞內各個部位和細胞器中行使功能。分析結果以AdCDPK1為例進行展示,分析發(fā)現(xiàn)其為親水性蛋白質;沒有發(fā)現(xiàn)明顯的跨膜結構域,說明其不是跨膜蛋白質;AdCDPK1預測分數(shù)沒有達到閾值,不是信號肽,說明不是作為信號肽行使功能(圖9~11)。
野生種花生CDPK蛋白質的亞細胞定位分析發(fā)現(xiàn),2個野生種的CDPK定位基本一致,主要分布在葉綠體基質、細胞核、內質網(wǎng)膜、細胞質、過氧化物酶體、細胞質膜和葉綠體內囊體膜中。其中Arachis duranensis部分CDPK蛋白質亞細胞定位結果見表4。
3 討論
Ca2+作為重要的第二信使,它在細胞質中濃度的變化是植物響應環(huán)境刺激信號網(wǎng)絡中的重要組成部分。最近的研究結果揭示了CDPKs作為Ca2+介導的免疫及脅迫響應的重要調控者,對植物的生存至關重要[10,23]?;ㄉ侵袊L江以南各省主要食用油料作物之一,然而華南、長江流域2大花生產(chǎn)區(qū)高溫、多雨,土壤酸度高,缺鈣普遍嚴重,花生的生長受低鈣脅迫嚴重,因土壤缺鈣造成花生大幅減產(chǎn)降質的問題突出。栽培種花生基因組沒有公布序列,本文借鑒野生種花生基因組序列來分析CDPK,借此了解栽培花生CDPK基因家族的結構和功能,為進一步研究栽培種花生CDPK基因家族對于鈣吸收傳遞、抗逆性和碳氮代謝等生命活動提供依據(jù)。對AdCDPK1的克隆測序也驗證了生物信息學預測基因的真實性,也可為分析栽培種花生CDPK基因提供參考。
水稻OsCPK21的ORF為1 698 bp,編碼565個氨基酸,OsCDPK14的ORF為1 542 bp,編碼513個氨基酸,與野生種花生CDPK的CDS和氨基酸長度基本一致[24-25]。擬南芥34個CDPK基因分布在5個染色體上,4號染色體上最多有11個,3號染色體最少只有4個。野生種花生Arachis duranensis的每條染色體上CDPK基因數(shù)量為2~5個,野生花生Arachis ipaensis的每條染色體上CDPK基因數(shù)量為為1~5個,與擬南芥相比偏少。2個野生種花生有4個染色體上CDPK基因數(shù)量相同,其它6個染色體則存在一些差異。擬南芥中34個CDPK蛋白質的激酶結構域、自動抑制結構域和類鈣調蛋白結構域高度保守,而N末端結構域則變異較大。其中類鈣調蛋白結構域包含94~147個氨基酸,由4個EF手型結構構成,具有結合鈣離子的功能,單個鈣離子分子可以結合到EF手型結構形成的環(huán)狀結構上[26],野生種花生CDPK也是如此有類似的結構,說明也可能具有同樣的功能。楊樹和擬南芥CDPK蛋白質進化分析表明,它們大致可以分為3類,總體來看相互之間進化關系較近,大部分CDPK蛋白質具有相似的功能[27]。野生種花生CDPK同源性同樣很高,系統(tǒng)進化樹分析表明它們混雜在一起,而與十字花科擬南芥、豆科的野生大豆、梧桐科的可可、錦葵科的陸地棉和楊柳科的楊樹等其它物種聚在一起的可能性很低,可能是由于CDPK蛋白質N末端的序列變異較大造成,與Shu-Hua等[26]的研究結果一致。由于CDPK蛋白質除了EF手型和激酶結構域較為保守外,N末端等區(qū)域變異較多,因此用CDPK蛋白質的氨基酸序列來研究物種的進化關系能很好地展現(xiàn)其真實親緣關系。擬南芥中9個CDPK基因亞細胞定位分析表明,AtCPK3、AtCPK4在細胞質與細胞核中存在,而AtCPK1、7、8、9、16、21、28則定位在膜上,水稻OsCPK21定位在細胞質膜上,OsCPK18定位于細胞膜,煙草NtCPK4在整個細胞中都存在,NtCPK5定位于細胞膜,馬鈴薯的StCDPK5定位于細胞膜(Dammann,Campos-Soriano,wang,Kobayashi)[28-31]。2個野生種花生CDPK蛋白質與以上物種定位結果基本一致,基本分布在細胞中各個部位和細胞器中。
參考文獻
[1] 楊偉波, 付登強, 劉立云, 等.海南花生研究現(xiàn)狀及展望[J]. 熱帶農業(yè)科學, 2013, 33(5): 73-75.
[2] 王文壯. 海南與臺灣: 農業(yè)發(fā)展比較與合作競爭[M]. 北京: 中國農業(yè)出版社, 2008.
[3] 李新國, 萬書波. 鈣對花生生長發(fā)育調控的研究進展[J]. 山東農業(yè)科學, 2011, 8: 65-67, 74.
[4] Rui Y. Calcium availability to runner-type peanut (Arachis hypogaea L.) in the southeastern United States[D]. Auburn: Graduate Faculty of Auburn University, 2015.
[5] 龔子同, 張甘霖, 趙文君, 等. 海南島土壤中鋁鈣的地球化學特征及其對生態(tài)環(huán)境的影響[J]. 地理科學, 2003, 23(2): 200-207.
[6] 魏玉云. 熱帶地區(qū)磚紅壤上不同土壤pH和含水量對尿素揮發(fā)的影響研究[D]. 儋州: 華南熱帶農業(yè)大學, 2006.
[7] 倪天華, 魏幼璋. 鈣依賴蛋白激酶(CDPKs)在植物中的生理功能[J]. 西北農林科技大學學報(自然科學版), 2002, 30(6): 214-247.
[8] Hrabak E M, Chan C W M, Michael G, et al. The Arabidopsis CDPK-SnRK superfamily of protein kinases[J]. Plant Physiology, 2003, 132(2): 666-680.
[9] Vidya C, Stollar E J, Kresten L L, et al. Structure of the regulatory apparatus of a calcium-dependent protein kinase (CDPK): a novel mode of calmodulin-target recognition[J]. Journal of Molecular Biology, 2006, 357(2): 400-410.
[10] Sanders D, Pelloux J, Brownlee C, et al. Calcium at the crossroads of signaling[J]. Plant Cell, 2002, 14(Suppl): S401-417.
[11] McAinsh M R, Pittman J K. Shaping the calcium signature[J]. New Phytol, 2009, 181: 275-294.
[12] 許園園, 李曉剛, 李 慧, 等. 梨CDPK基因家族全基因組序列鑒定分析[J]. 江蘇農業(yè)學報, 2015(3): 659-666.
[13] Liu W, Li W, He Q, et al. Genome-wide survey and expression analysis of calcium-dependent protein kinase in Gossypium raimondii[J]. PLoS One, 2014, 9(6): e98 189.
[14] Man-Ho O, Xia W, Huber S C. Impact of Ca(2+) on structure of soybean CDPKβ and accessibility of the Tyr-24 autophosphorylation site[J]. Plant Signaling & Behavior, 2013, 8(12): e27 671-27 671.
[15] Wei S Y, Hu W, Deng X M, et al. A rice calcium-dependent protein kinase OsCPK9 positively regulates drought stress tolerance and spikelet fertility[J]. Bmc Plant Biology, 2014, 14(1): 133.
[16] Wang J P, Xu Y P, Munyampundu J P, et al. Calcium-dependent protein kinase (CDPK) and CDPK-related kinase (CRK) gene families in tomato: genome-wide identification and functional analyses in disease resistance[J]. Mgg Molecular & General Genetics, 2015: 1-16.
[17] Kong X, Wei L, Jiang S, et al. Genome-wide identification and expression analysis of calcium-dependent protein kinase in maize[J]. Bmc Genomics, 2013, 14(1): 447-450.
[18] 楊洪強, 梁小娥. 高等植物中的CDPK及其生理生化功能[J]. 山東農業(yè)大學學報(自然科學版), 2003, 34(2): 284-288.
[19] Jain M, Pathak B K, Harmon A C, et al. Calcium dependent protein kinase (CDPK) expression during fruit development in cultivated peanut (Arachis hypogaea L.) under Ca2+- sufficient and - deficient growth regimens[J]. Journal of plant physiology, 2011, 168(8): 2 272-2 277.
[20] Bertioli D J, Cannon S B, Froenicke L, et al. The genome sequences of Arachis duranensis and Arachis ipaensis, the diploid ancestors of cultivated peanut[J]. Nature Genetics, 2016, 33(4): 118-120.
[21] 石 鵬, 曹紅星, 李東霞, 等. 油棕等植物γ-生育酚甲基轉移酶的生物信息學分析[J]. 熱帶作物學報, 2015, 36(2): 308-315.
[22] 陳 高, 單 雷, 周麗俠, 等. 花生總RNA提取方法比較研究[J]. 中國農學通報, 2011, 27(1): 214-218.
[23] 姜珊珊, 張 丹, 孔祥培, 等. 植物中的鈣依賴蛋白激酶(CDPK)的結構特征和功能研究進展[J]. 生物技術通報, 2013(6): 12-19.
[24] 魏 雪. 水稻鈣依賴性蛋白激酶21(OsCPK21)基因克隆及其性質驗證[D]. 北京: 北京師范大學, 2009.
[25] 張鐵剛. 水稻穎果發(fā)育信號分子鈣依賴性蛋白激酶(CDPK)新基因的克隆及其性質功能研究[D]. 北京: 北京師范大學, 2004.
[26] Shu-Hua C, Willmann M R, Huei-Chi C, et al. Calcium signaling through protein kinases. The Arabidopsis calcium-dependent protein kinase gene family[J]. Plant Physiology, 2002, 129(2): 469-485.
[27] 薛 彬, 夏新莉, 尹偉倫. 楊樹鈣依賴蛋白激酶基因家族生物信息學分析[J]. 經(jīng)濟林研究, 2010, 28(1): 20-25.
[28] Dammann C, Ichida A, Hong B, et al. Subcellular targeting of nine calcium-dependent protein kinase isoforms from Arabidopsis[J]. Plant Physiol, 2003, 132: 1 840-1 848.
[29] Campos-Soriano L, Gomez-Ariza J, Bonfante P, et al. A rice calcium-dependent protein kinase is expressed in cortical root cells during the presymbiotic phase of the arbuscular mycorrhizal symbiosis[J]. BMC Plant Biol, 2011(11): 90.
[30] Wang Y, Zhang M, Ke K, et al. Cellular localization and biochemical characterization of a novel calcium-dependent protein kinase from tobacco[J]. Cell Res, 2005, 15(8): 604-612.
[31] Kobayashi M, Yoshioka M, Asai S, et al. StCDPK5 confers resistance to late blight pathogen but increases susceptibility to early blight pathogen in potato via reactive oxygen species burst[J]. New Phytol, 2012, 196(1): 223-237.