李 暢,陳慧嬋,婁貴成,姜云爽,王政委,徐慶華,蒼 晶
(東北農(nóng)業(yè)大學生命科學學院,黑龍江哈爾濱 150030)
在植物體內(nèi),鈣離子(Ca2+)作為一種普遍存在的第二信使,響應很多逆境和發(fā)育過程。植物中有大量的鈣離子傳感-響應器組件負責鈣離子的信號轉導[1]。鈣調(diào)神經(jīng)磷酸酶B亞蛋白(CBL)和與其相互作用的蛋白激酶(CIPKs)是鈣離子介導的信號轉導通路中的關鍵分子,參與響應不同的外界應激信號[2-3]。不同的CBL蛋白具有不同的EF-hand結構域,CBL家族不同蛋白之間結構域的差異可能與它們對鈣離子的不同結合能力有關,這為CBL響應不同的刺激信號引起的Ca2+濃度變化提供了基礎[4]。CBL基因在擬南芥中首次被發(fā)現(xiàn),目前在水稻[5]、番茄[6]、藜麥[7]、葡萄[8]等不同植物中也檢測出了多個CBL基因家族;部分CBL轉基因植株在不同非生物脅迫下的表達模式會發(fā)生不同的變化,從而調(diào)節(jié)植物的抗逆性[9]。CBL家族在植物生長發(fā)育過程中發(fā)揮著關鍵作用,不僅能夠保持植物體內(nèi)離子濃度平衡與穩(wěn)定,在植物對環(huán)境適應過程中也有著不可或缺的作用。擬南芥中,CBL家族基因AtCBL1、AtCBL2、AtCBL5、AtCBL9、AtCBL10均響應非生物脅迫[10-14],其中,AtCBL1響應低溫脅迫[15]。玉米中,ZmCBL3、ZmCBL4、ZmCBL5和ZmCBL8與ZmCIPK16互作響應干旱、鹽等逆境脅迫[16]。在水稻中,過表達OsCBL8賦予了水稻對高溫和病原體的抵抗力[17],但OsCBL5對植物鹽脅迫負調(diào)控[18];低溫處理可提高豌豆的PsCBL轉錄水平,但干旱處理后,PsCBL的表達無顯著差異[19];在楊樹中,PeCBL1、PeCBL2、PeCBL4、PeCBL5和PeCBL9在鹽脅迫下表達量均上調(diào)[20]。但目前關于小麥CBLs的基因組學和參與非生物脅迫的研究尚未見報道。
為了探討小麥CBL的功能,本研究對小麥的CBL基因進行了全基因組分析,探究小麥CBL基因特征,并對本課題組前期在轉錄組數(shù)據(jù)庫中篩選獲得的8個差異表達的小麥CBL基因(未發(fā)表)進行表達模式分析,以期為深入研究小麥CBL基因的功能奠定基礎。
參考齊 越等[21]對小麥DEAD-box基因家族成員鑒定的方法。首先,從Ensembl Plants 數(shù)據(jù)庫(http://plants. ensembl.org/index.html)中下載小麥(中國春)全基因組數(shù)據(jù),包括全基因組序列及注釋文件,并且從水稻基因組數(shù)據(jù)庫(http://rice.plant biology.msu.edu/)下載水稻的CBL蛋白。利用水稻CBL家族蛋白質(zhì)序列作為query序列,以1∶5比例提取基因,并除去重復基因,檢索小麥CBL家族基因。利用Pfam(http://pfam.xfam.org/)及NCBI(http://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)驗證候選蛋白的結構域,手動逐一篩選錯誤序列,排除冗余序列,以獲得目標小麥CBL家族基因成員。使用在線軟件ExPASy(http://expasy.org/)預測小麥CBL蛋白氨基酸長度、分子量、等電點和脂肪指數(shù)等理化性質(zhì)。在亞細胞定位預測網(wǎng)站(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)對CBL進行亞細胞定位預測。
使用ClusterX V2.0(http://www.clustal.org/clustal2/)對小麥、水稻、擬南芥的CBL基因家族所編碼的蛋白質(zhì)進行氨基酸序列對比分析。使用MEGA(https: //www.megasoftware.net/)軟件的最大似然法(ML)構建系統(tǒng)發(fā)育樹,設置bootstrap值為1 000。下載的序列已知染色體位置。
對小麥CBL家族蛋白保守基序的檢索分析采用MEME軟件(http://meme-suit.org/),檢索參數(shù)使用Zero or one occurrence per sequence(zoops),基序數(shù)值設為9。參考Pfam數(shù)據(jù)庫,對小麥CBL基因家族進行蛋白保守結構域比對分析(E-value≤1.0)。使用在線軟件GSD2.0(http://gsds.gaolab.org/)分析基因結構,TaCBL基因組和CDS序列在EnSembl Plants數(shù)據(jù)庫中獲得,將序列導入到在線軟件GSD2.0中,對小麥CBL內(nèi)含子和外顯子結構進行分析。
應用Phytozome數(shù)據(jù)庫(https://data.jgi.doe.gov/)獲得水稻和擬南芥的全基因組序列及其基因注釋文件。小麥基因組數(shù)據(jù)庫中,使用Circos軟件獲得位置信息,將所有小麥CBL基因定位到染色體上。使用小麥全基因組數(shù)據(jù)與水稻及擬南芥全基因組對照提取(每個基因提取數(shù)≤30)。使用MCScanX對小麥進行共線性分析,參數(shù)設置取默認值?;蛑g的進化關系由同義替代率(Ks)和非同義替代率(Ka)表現(xiàn),使用KaKs_Calculator 2.0計算小麥的Ka/Ks比值,除了三對TaCBL基因的Ka/Ks比值大于1,其他TaCBL小麥基因的Ka/Ks比值均小于1,由此分別構建出小麥種內(nèi)共線性圖譜及小麥與水稻、擬南芥種間共線性圖譜。所有TaCBL基因的位置和染色體長度從EnSembl Plants數(shù)據(jù)庫注釋信息中獲得,并且用TB Tools進行繪制。
對課題組先前建立的轉錄組數(shù)據(jù)庫進行分析發(fā)現(xiàn),Dn1的分蘗節(jié)和葉片含有大量與低溫脅迫有關的CBL,篩選到8個低溫脅迫下表達量變化顯著的CBL,本研究對這8個CBL在低溫下的表達模式進行分析。供試材料選用強抗寒性冬小麥品種東農(nóng)冬麥1號(Dn1)和東農(nóng)冬麥2號(Dn2),于2020年9月12日播種于東北農(nóng)業(yè)大學試驗田,種植區(qū)行長2 m,種植間距0.2 m,播種深度為5 cm,每行播種約200粒。覆土進行自然萌發(fā)。大田自然降溫連續(xù)10 d平均的最低溫度分別達到5 ℃、0 ℃、-10 ℃和-25 ℃時,取其葉片和分蘗節(jié)用于8個基因表達量測定。
使用康為世紀的Ultrapure RNA Kit試劑盒提取樣品的總RNA,使用諾唯贊HiScript III 1st Strand cDNA Synthesis Kit (+gDNA wiper)試劑盒對提取的總RNA合成cDNA。使用小麥多組學數(shù)據(jù)庫(http://202.194.139.32/)設計8個CBL基因的qRT-PCR 特異性引物(表1),并且利用2-△△CT方法計算其相對表達量。
表1 qRT-PCR 特異性引物Table1 qRT-PCR specific primers
參照水稻基因組數(shù)據(jù)庫中CBL蛋白序列,在EnsemblPlants小麥全基因組數(shù)據(jù)庫中共鑒定出68個CBL基因,并分別命名為TaCBL1~TaCBL68,基因長度為444~4 679 bp,編碼的氨基酸在147~627 aa之間;對應的蛋白相對分子質(zhì)量在16.42~68.9 kDa之間,理論等電點(pI)4.1~6.6,脂肪系數(shù)70.07~94.84;親水性指數(shù)-0.031~-0.602,親水性較好的。亞細胞定位分析顯示,34個CBL蛋白定位于細胞核,25個定位于細胞膜,9個定位于細胞質(zhì)及細胞膜(表2)。
表2 小麥TaCBL基因家族理化性質(zhì)Table 2 Physical and chemical properties of wheat TaCBL gene family
利用ML對小麥、水稻和擬南芥CBL基因進行系統(tǒng)進化分析。通過拓撲結構域分析,可將CBL基因分成8類(圖1),其中G類的CBL基因最多,共31個,E類中的CBL基因最少,僅有2個,且均為小麥CBL基因。A、B、C、D四類在所選三個物種間均存在;相比于擬南芥,小麥與水稻的CBL家族成員關系更近,推測二者中CBL基因的功能類似,這可能與水稻和小麥都屬于禾本科單子葉農(nóng)作物有關。
圖1 小麥、水稻和擬南芥CBL家族蛋白系統(tǒng)進化樹Fig.1 Phylogenetic tree of the CBL family proteins in wheat, rice and Arabidopsis
基因的功能由其結構決定,MEME建樹顯示,68個小麥TaCBL可歸為8大類,與系統(tǒng)進化樹分類一致(圖2)。同類分支中各基因核心基序排列順序較統(tǒng)一,具體表現(xiàn)為:所有TaCBL基因均含有Motif4,絕大部分基因都含有Motif4和Motif5,推測其可能是CBL基因特有的保守序列;基序分析發(fā)現(xiàn),同一類群中的大多數(shù)成員具有相似的motif,推測其功能相似;個別核心基序與其他基序排列不同,如TaCBL9基因僅包含Motif5。通過結構域分析發(fā)現(xiàn),所有的CBL蛋白均含EF-hand結構域,其中F類中含有EF-hand結構域最多,D類中最少。
圖2 小麥CBL蛋白的進化樹(a)、核心基序(b)及蛋白結構域(c)Fig.2 Phylogenetic tree(a),core motif(b) and protein domain(c) of wheat CBL proteins
通過在線軟件GSD2.0對小麥CBL蛋白結構分析發(fā)現(xiàn),CBL基因家族成員的內(nèi)含子分布并不均勻,數(shù)量為 1~8個不等,但同類中大部分CBL基因內(nèi)含子與外顯子數(shù)量相近,如B類中的內(nèi)含子均為1個,H類中的內(nèi)含子為7~8個,而結構域也均被內(nèi)含子分隔。同類中大部分小麥CBL基因具有相似結構,表明基因結構可能與它們的遺傳進化關系密切。
小麥68個TaCBL共分布在18條染色體上,每條染色體攜帶的基因數(shù)各不相同(圖3),其中第五同源群染色體攜帶的TaCBL數(shù)最多,5A染色體共有6個TaCBL,5B和5D染色體均有7個TaCBL;第六同源群染色體所攜帶的TaCBL數(shù)最少,6A、6B、6D三條染色體均只包含一個TaCBL。
圖3 小麥TaCBL基因在染色體上的分布Fig.3 Distribution of TaCBL genes on chromosomes in wheat
共線性分析表明,本研究所檢測基因組共含100個共線性基因?qū)?而分布在同基因組不同染色體的Ta-CBL也普遍表現(xiàn)出共線性,這表明小麥TaCBL多為同源染色體上的等位基因或旁系同源基因,映射了其在進化上存在基因擴張。例如,位于1A染色體上的TaCBL2與位于3B染色體上的TaCBL32具有共線性關系;1B染色體上的TaCBL5與5A染色體上的TaCBL51有共線性關系,位于1B上的TaCBL8分別與3A、3B和3D染色體上的TaCBL27、TaCBL31以及TaCBL34基因間存在共線性關系;位于2D染色體的TaCBL23分別與位于4A、4B和4D染色體上的TaCBL36、TaCBL42以及TaCBL45基因之間存在共線性關系(圖4)。綜合結果得出,小麥TaCBL可能由基因復制形成,其所編碼的蛋白在進化過程中一定程度上受截斷復制影響。
圖4 小麥、水稻和擬南芥CBL基因的共線性關系Fig.4 Collinearity of CBL genes among wheat,rice and Arabidopsis
由圖4可見,擬南芥與小麥基因的種間共線性關系相對較少,只有5種,分布在小麥1A、1B和2B染色體上;而小麥與水稻種間共有87組共線性關系,各個染色體上關聯(lián)的共線性基因?qū)幌嗤?其中4B和5D兩條染色體上的共線性基因?qū)?shù)量最多,各有8對,6A、6B、6D存在的共線性最少,分別只有1對;水稻1號染色體上的3個OsCBL同小麥6A、6B和6D染色體上的3個TaCBL間發(fā)生有序配對,這表示水稻1號染色體和小麥6號染色體在CBL進化的線性關系上存在高度的一致性。
Dn1的qRT-PCR分析結果(圖5A和圖5B)表明,在分蘗節(jié)中,隨溫度降低,TaCBL1的表達量呈“升-降-升”的趨勢,在-25 ℃時表達量最高;TaCBL46和TaCBL59的表達量呈先升后降的趨勢,均在-10 ℃時表達量最高;TaCBL17、TaCBL30、TaCBL38、TaCBL47和TaCBL55的表達量逐漸升高,-25 ℃時的表達量最高,達到了0 ℃的二倍。在葉片中,隨溫度降低,這8個TaCBL的表達量均呈先升高后降低的趨勢,除了TaCBL47在0 ℃時的表達量最高,其他7個TaCBL均在-10 ℃時表達量最高,且均達到0 ℃時表達量的二倍以上?;蜷g比較,在Dn1分蘗節(jié)中,TaCBL30、TaCBL47和TaCBL55對低溫脅迫的響應最為明顯,且均在-25 ℃時表達量顯著高于其他基因;在Dn1葉片中,TaCBL30和TaCBL55對低溫脅迫的響應最為明顯,在-10 ℃時表達量顯著高于其他基因。
A:Dn1分蘗節(jié); B:Dn1葉片; C:Dn2分蘗節(jié); D:Dn2葉片; 圖柱上不同小寫字母表示不同處理間差異顯著(P<0.05)。A:Dn1 tillering nodes; B:Dn1 leaves; C:Dn2 tillering nodes; D:Dn2 leaves; Different lowercase letters above columns indicate significant differences between different temperatures (P< 0.05).圖5 低溫脅迫下Dn1和Dn2葉片和分蘗節(jié)中8個TaCBL的表達Fig.5 Expression of 8 TaCBL genes in leaves and tillers of Dn1 and Dn2 under low temperature stress
Dn2的qRT-PCR分析結果(圖5C和圖5D)表明,在分蘗節(jié)中,隨溫度降低,TaCBL17的表達量呈“升-降-升”的趨勢,在-25 ℃時表達量最高,達到了-10 ℃表達量的2倍;TaCBL46和TaCBL55的表達量呈現(xiàn)先升高后降低的趨勢,其中TaCBL46在0 ℃時表達量最高,TaCBL55在-10 ℃時表達量最高;TaCBL1、TaCBL30、TaCBL38、TaCBL47和TaCBL59的表達量逐步升高,-25 ℃時的表達量達到5 ℃時表達量的二倍以上。在葉片中,TaCBL1和TaCBL17的表達量隨著溫度的降低而逐步升高;TaCBL30、TaCBL38、TaCBL46、TaCBL47、TaCBL55和TaCBL59的表達量呈先升高后降低的趨勢,其中TaCBL46和TaCBL47在0 ℃時表達量最高,TaCBL30、TaCBL38、TaCBL55和TaCBL59在-10 ℃時表達量最高?;蜷g比較,在Dn2分蘗節(jié)中,TaCBL30、TaCBL47和TaCBL55對低溫脅迫的響應最為明顯,最高表達量均達到了0 ℃時表達量的二倍以上;在Dn2葉片中,TaCBL30、TaCBL47和TaCBL55對低溫脅迫的響應最為明顯,最高表達量均達到5 ℃時表達量的二倍以上。
目前,在多種單子葉和雙子葉植物中均發(fā)現(xiàn)了CBL家族成員,例如,在水稻中鑒定出了10個CBL家族成員[22],玉米中鑒定出了12個CBL家族成員[23],煙草和亞洲棉中各鑒定出了20個CBL家族成員[24- 25]。本研究基于生物信息學分析,共從小麥中鑒定出68個CBL,通過對TaCBL蛋白的理化性質(zhì)進行分析,基因片段、編碼蛋白的氨基酸數(shù)及其分子質(zhì)量和等電點(pI)及亞細胞定位均有一定的差異,預示著該基因功能具有多樣性;該家族成員在染色體上呈不規(guī)則分布,但在在第一和第五同源群染色體上分布較多,推測小麥A、B、D不同基因組中的TaCBL之間可能存在功能冗余或多數(shù)TaCBL基因不具有功能。
植物中的Ca2+傳感蛋白的功能主要表現(xiàn)在參與特定的信號轉導、感受并響應Ca2+濃度變化、參與植物對多種環(huán)境刺激(包括生物和非生物脅迫)的應答等方面,在植物的多種生命活動中發(fā)揮重要作用[26]。CBL蛋白作為小麥的Ca2+傳感蛋白,通過結合Ca2+并與特異的蛋白激酶互作后傳遞鈣信號[27]。結構分析顯示,小麥全部TaCBL都含有內(nèi)含子和外顯子,根據(jù)其結構特點可分為8類;同類中的核心基序間的排布表現(xiàn)出高度相似性,且所編碼的蛋白質(zhì)均攜帶數(shù)量不等,變異程度不均的EF-hand結構域。EF-hand結構域是植物中Ca2+傳感器活性調(diào)節(jié)的重要影響因素[28],其數(shù)量和位點差異可能導致其Ca2+結合能力不同,從而導致基因具有不同生物學功能[29-30]。8類小麥TaCBL蛋白中,A和B類所含EF-hand結構域數(shù)量最多,推測這兩類蛋白與Ca2+的結合能力更強,可能在響應Ca2+介導的抗寒調(diào)控過程中起重要作用。CIPK作為一種絲氨酸-蘇氨酸蛋白激酶,通過激活磷酸化酰化級聯(lián)反應對脅迫或抗應激功能相關基因的表達加以調(diào)控;CBL家族成員在各類非生物脅迫中起著重要作用,調(diào)控方式包括CBL和CIPK之間的互作及靶蛋白磷酸化等[31-32]。植物中的CIPK和CBL家族都屬于多基因家族蛋白,二者在Ca2+信號傳遞過程中協(xié)同發(fā)揮作用,對于CBL-CIPK網(wǎng)絡,其中的傳感器蛋白和效應激酶會以復雜的排列方式相互作用,而對上述Ca2+調(diào)控過程的詳細分子機制仍沒有完善的解釋。
CBL在植物逆境應激信號中發(fā)揮關鍵作用,我們根據(jù)轉錄組學分析選用了8個在低溫條件下差異表達最顯著的基因,分析其在強抗寒冬小麥的分蘗節(jié)和葉片中的表達,結果顯示,這8個TaCBL在不同品種中的表達不盡相同,TaCBL在Dn2的分蘗節(jié)和葉片的表達量總體比Dn1中相應部位高;而在不同組織之間TaCBL表達模式隨溫度變化也表現(xiàn)出顯著差異,例如,Dn1分蘗節(jié)中TaCBL30在-10 ℃時的相對表達量比5 ℃時提高了43%,而在葉片中TaCBL30在-10 ℃時較5 ℃時提高了60%,表明TaCBL在不同品系與組織間表達有差異。在Dn1和Dn2中,TaCBL在分蘗節(jié)中的表達量均高于葉片;分蘗節(jié)中TaCBL的表達量普遍在-25 ℃時最高,而在葉片中CBL的表達量普遍在-10 ℃時最高,說明TaCBL對寒冷脅迫響應速度不同,這可能會影響不同品系冬小麥抗寒能力,而出現(xiàn)這種現(xiàn)象的原因可能是由于葉片組織處于地上,分蘗節(jié)處于地下受到土壤保護,導致二者對環(huán)境脅迫的響應不同。
綜上,本研究對小麥CBL蛋白基因家族進行了全基因組鑒定、生物信息學分析和表達模式分析,為深入解析小麥CBL基因家族的功能及其作用機制奠定了基礎,對于進一步挖掘小麥抗寒基因資源,培育抗寒作物新品種,具有重要的理論和實踐意義。