劉文豪,孔憲輝,王旭文,司愛(ài)君,馬麒,趙福相,余渝
(新疆農(nóng)墾科學(xué)院棉花研究所/農(nóng)業(yè)農(nóng)村部西北內(nèi)陸區(qū)棉花生物學(xué)與遺傳育種重點(diǎn)實(shí)驗(yàn)室,新疆 石河子 832000)
植物細(xì)胞外信號(hào)主要由質(zhì)膜定位的類(lèi)受體蛋白激酶(Receptor-like kinases,RLKs)感知。類(lèi)受體蛋白激酶是由一個(gè)信號(hào)肽、一個(gè)富含半胱氨酸的細(xì)胞外結(jié)構(gòu)域、一個(gè)跨膜結(jié)構(gòu)域和一個(gè)預(yù)測(cè)的細(xì)胞內(nèi)激酶結(jié)構(gòu)域組成的一類(lèi)跨膜蛋白[1]。這些激酶參與細(xì)胞間通信協(xié)調(diào)植物組織的生長(zhǎng)和發(fā)育,控制植物地上器官的伸長(zhǎng)、葉片形成、花的發(fā)育和表皮分化[2],進(jìn)而影響不同植物物種的非生物脅迫耐受性。棉花是我國(guó)重要的經(jīng)濟(jì)作物,對(duì)抗病、抗逆優(yōu)質(zhì)棉的培育是解決產(chǎn)量問(wèn)題的根本途徑,而分析關(guān)鍵基因的調(diào)控網(wǎng)絡(luò)、差異表達(dá)及理化特性具有重要研究意義。
擬南芥ERfs家族受體(ERECTAfamily receptor,ERfs)是一個(gè)古老的富含亮氨酸重復(fù)序列的RLKs家族,該基因家族由ERECTA(ER)、ERECTA-LIKE1(ERL1)和ERL2組成[3]。研究表明,擬南芥ER介導(dǎo)的信號(hào)通路通過(guò)調(diào)節(jié)核小體動(dòng)力學(xué)來(lái)促進(jìn)細(xì)胞增殖,調(diào)節(jié)花序結(jié)構(gòu)形成[4]。整個(gè)擬南芥ER家族基因的缺失導(dǎo)致了顯著的矮化癥、側(cè)向器官尺寸減小和花朵發(fā)育異常,包括花瓣極性擴(kuò)張、心皮伸長(zhǎng)以及花藥和胚珠分化的缺陷[5]。青枯病菌極易引起擬南芥突變體植株Ler(Landsbergerecta)產(chǎn)生萎蔫病,而轉(zhuǎn)基因植株Ler對(duì)青枯病菌的抗病性顯著增強(qiáng)??赡苁荅R基因通過(guò)感知來(lái)自青枯病菌的外部生物刺激,然后激活信號(hào)通路,導(dǎo)致對(duì)病原體的抵抗力增加[6]。目前,已經(jīng)在菠菜、馬鈴薯、葡萄、黃瓜、大豆、高粱、楊樹(shù)、小麥、水稻、番茄等植物中有關(guān)于ER基因家族成員研究的相關(guān)報(bào)道。大豆質(zhì)膜上ER將光信號(hào)傳遞給胞質(zhì)中的光敏色素,光敏色素進(jìn)入核內(nèi)與轉(zhuǎn)錄因子相互作用,啟動(dòng)赤霉素和生長(zhǎng)素相關(guān)基因表達(dá),促進(jìn)植株下胚軸的伸長(zhǎng)[7]。高粱ER家族基因SbER1和SbER2的表達(dá)水平均隨著干旱脅迫程度的加深而逐漸提高,可能在抗旱機(jī)制中發(fā)揮作用[8]。PdERECTA改變氣孔的發(fā)育模式降低氣孔密度,從而限制水的消耗,增強(qiáng)楊樹(shù)的耐旱性[9]。高溫脅迫下小麥TaERECTA基因的表達(dá)促進(jìn)過(guò)氧化物酶和相關(guān)底物的合成,提高對(duì)脅迫產(chǎn)生活性氧的分解速率,以保護(hù)細(xì)胞免受高溫脅迫引起的損傷和死亡[10]。過(guò)表達(dá)擬南芥ER的轉(zhuǎn)基因番茄和水稻品系在溫室和田間試驗(yàn)中顯示出更好的耐熱性。此外,過(guò)表達(dá)ER的轉(zhuǎn)基因擬南芥、番茄和水稻植物的生物量增加[11]。
迄今為止,陸地棉ERECTA家族成員ERL1基因尚未被綜合分析,對(duì)生物和非生物脅迫的反應(yīng)過(guò)程中發(fā)揮的作用尚未得知,其涉及的調(diào)控網(wǎng)絡(luò)及差異表達(dá)尚不清楚。為了研究ERL1基因在植物生長(zhǎng)發(fā)育和脅迫響應(yīng)中的作用,本研究通過(guò)生物信息學(xué)方法獲取陸地棉ERL1基因序列,進(jìn)一步分析其理化性質(zhì)、序列特征、亞細(xì)胞定位、染色體位置,并對(duì)不同脅迫條件下陸地棉ERL1基因的表達(dá)模式進(jìn)行研究。實(shí)驗(yàn)結(jié)果將培育抗逆優(yōu)質(zhì)高產(chǎn)的新品種提供新的基因資源。
在NCBI(https://www.ncbi.nlm.nih.gov/)數(shù) 據(jù) 庫(kù)下載陸地棉ERL1基因序列和蛋白序列,利用SMART網(wǎng)站(http://smart.embl.de/)進(jìn)行結(jié)構(gòu)域的預(yù)測(cè)分析,TMHMM2.0(https://services.healthtech.dtu.dk/)分析蛋白的跨膜結(jié)構(gòu),ProtScale(https://web.expasy.org/protscale/)預(yù)測(cè)蛋白親疏水性。使用Prot-Param(https://web.expasy.org/protparam/)分 析理論等電點(diǎn)、帶正負(fù)電荷的氨基酸殘基、分子式、總原子數(shù)、不穩(wěn)定系數(shù)、脂肪指數(shù)。
在SOPMA網(wǎng)站(https://npsa-prabi.ibcp.fr/)頁(yè)面輸入氨基酸序列,依據(jù)多序列比對(duì)和多級(jí)系統(tǒng)進(jìn)化分析,設(shè)定默認(rèn)參數(shù),預(yù)測(cè)二級(jí)結(jié)構(gòu)的四種狀態(tài)[12]。在線網(wǎng)站SWISS-MODEL(https://swissmodel.expasy.org/)上傳氨基酸序列,運(yùn)行建模二級(jí)結(jié)構(gòu)進(jìn)一步折疊形成的結(jié)構(gòu)域[13]。
為準(zhǔn)確了解GhERL1蛋白在表達(dá)調(diào)控中所具有的功能,本研究從蛋白質(zhì)數(shù)據(jù)中篩選特征向量構(gòu)建數(shù)據(jù)集,使用在線網(wǎng)站Predictprotein(https://predictprotein.org/)和Plant-mPLoc(http://www.csbio.sjtu.edu.cn/)進(jìn)行亞細(xì)胞定位預(yù)測(cè)。
為了研究陸地棉發(fā)育過(guò)程中GhERL1基因的差異表達(dá),從陸地棉轉(zhuǎn)錄組數(shù)據(jù)庫(kù)(PRJNA248163)獲取GhERL1基因在根莖葉不同組織的基因表達(dá)量,以及在開(kāi)花后不同時(shí)間纖維、胚珠等部位的基因表達(dá)量。使用TB-Tools軟件和GENESCLOUD網(wǎng)站進(jìn)行差異表達(dá)分析、熱圖構(gòu)建。
利用String(https://string-db.org/)在線工具分析GhERL1蛋白-蛋白相互作用網(wǎng)絡(luò)[14]。輸入蛋白序列,根據(jù)蛋白名稱(chēng)、來(lái)源、注釋和序列相似性來(lái)進(jìn)行蛋白質(zhì)關(guān)聯(lián)的功能性和物理性分析。
GhERL1蛋白具有ER家族典型的LRR富集區(qū)和(S_TKc)絲氨酸/蘇氨酸蛋白激酶區(qū),參與接收上游配體信號(hào)(圖1A)。GhERL1蛋白序列含有998個(gè)氨基酸,在N端存在一個(gè)跨膜區(qū)位于第20到39個(gè)氨基酸之間,而第1-19個(gè)氨基酸在膜內(nèi),第40-998個(gè)氨基酸在膜外,跨膜區(qū)參與外部信號(hào)的傳輸(圖1B)。每個(gè)位點(diǎn)的氨基酸得分正值表示疏水性,負(fù)值表示親水性,GhERL1蛋白平均親/疏水性值為-0.027,具有較弱的親水性(圖1C)。而通過(guò)Prot-Param分析得知,GhERL1蛋白序列分子量為110198.57,理論等電點(diǎn)為5.76,帶負(fù)電荷氨基酸殘基有100個(gè),帶正電荷氨基酸殘基有80個(gè),分子式C4916H7832N1304O1480S41,總 原 子數(shù)為15573。不穩(wěn)定系數(shù)34.14,屬于穩(wěn)定蛋白類(lèi)別。脂肪族氨基酸指數(shù)105.19。
SOPMA分析發(fā)現(xiàn)(圖2),GhERL1的蛋白質(zhì)序列含有998個(gè)氨基酸,而在這些氨基酸的分布排列中α螺旋403個(gè),所占比例為40.38%;β轉(zhuǎn)角29個(gè),所占比例2.91%;延伸鏈120個(gè),所占比例為12.02%;無(wú)規(guī)卷曲446個(gè),所占比例為44.69%。
圖2 GhERL1蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)Figure 2 Prediction of secondary structure of GhERL1 protein
基于結(jié)構(gòu)基因組學(xué),把GhERL1的蛋白序列輸入在線網(wǎng)站SWISS-MODEL,通過(guò)搜索序列結(jié)構(gòu)模型相同的同源模型建立骨架,得到該蛋白三級(jí)結(jié)構(gòu)的Cartoon模型,而這個(gè)模型的氨基酸排列順序與二級(jí)結(jié)構(gòu)預(yù)測(cè)基本相符,注釋表明蛋白三級(jí)結(jié)構(gòu)含有類(lèi)受體蛋白激酶特有的絲氨酸/蘇氨酸結(jié)構(gòu)域,進(jìn)一步驗(yàn)證了GhERL1蛋白結(jié)構(gòu)的準(zhǔn)確性(圖3)。
圖3 GhERL1蛋白三級(jí)結(jié)構(gòu)預(yù)測(cè)Figure 3 Tertiary structure prediction of GhERL1 protein
細(xì)胞中蛋白質(zhì)合成后轉(zhuǎn)運(yùn)到特定的細(xì)胞器中,只有轉(zhuǎn)運(yùn)到正確的部位才能參與細(xì)胞的各種生命活動(dòng),如果定位發(fā)生偏差會(huì)對(duì)細(xì)胞功能產(chǎn)生重大影響。亞細(xì)胞定位的生物信息學(xué)研究作為亞細(xì)胞蛋白質(zhì)組學(xué)實(shí)驗(yàn)研究的補(bǔ)充,相互驗(yàn)證與促進(jìn)。本研究通過(guò)Plant-mPLoc預(yù)測(cè)結(jié)果表明該GhERL1蛋白定位在細(xì)胞膜,PredictProtein網(wǎng)站預(yù)測(cè)結(jié)果同樣表明該蛋白定位在細(xì)胞膜(圖4)。
圖4 GhERL1蛋白亞細(xì)胞定位Figure 4 Subcellular localization of GhERL1 protein
利用陸地棉轉(zhuǎn)錄組數(shù)據(jù)庫(kù)對(duì)GhERL1基因進(jìn)行表達(dá)模式分析。根據(jù)基因表達(dá)量值分析GhERL1基因的表達(dá)模式,在不同發(fā)育時(shí)期的子葉中表達(dá)存在差異性,第48小時(shí)的子葉表達(dá)量最高,第24小時(shí)的子葉中表達(dá)量最低(圖5A)。在纖維形成的第20天基因表達(dá)量最高,在第10天表達(dá)量最低(圖5B)。在開(kāi)花后第1天的胚珠中表達(dá)量最高,第10天的胚珠中表達(dá)量最低(圖5C)。GhERL1基因在陸地棉植株的根、莖、葉的表達(dá)模式存在顯著的差異性,在根中的表達(dá)量最高,而在莖中的表達(dá)量相對(duì)最低(圖5D)。
在模擬的冷、熱、鹽、干旱脅迫下,GhERL1基因的表達(dá)量與對(duì)照(未處理)相比,具有一定的差異性。在冷脅迫3小時(shí)的時(shí)候表達(dá)量最高,干旱脅迫6小時(shí)的時(shí)候表達(dá)量最高,熱脅迫3小時(shí)的時(shí)候表達(dá)量最高,鹽脅迫12小時(shí)的時(shí)候表達(dá)量最高(圖5E)。當(dāng)受到生物或非生物脅迫時(shí),GhERL1基因通過(guò)上調(diào)或下調(diào)表達(dá)發(fā)揮其功能。推測(cè)其可能在低溫、干旱、鹽堿化等環(huán)境的脅迫中發(fā)揮重要作用。
圖5 GhERL1基因在不同組織的表達(dá)分析Figure 5 Expression analysis of GhERL1 gene in different tissues
蛋白通過(guò)彼此之間的相互作用構(gòu)成蛋白質(zhì)相互作用網(wǎng)絡(luò),來(lái)參與生物信號(hào)傳遞、基因表達(dá)調(diào)節(jié)、能量和物質(zhì)代謝及細(xì)胞周期調(diào)控等生命過(guò)程的各個(gè)環(huán)節(jié)[15]。在STRING數(shù)據(jù)庫(kù)中的蛋白互作網(wǎng)絡(luò)中可找到GhERL1蛋白和EPF2(表皮模式因子2,Epidermal patterning factor 2)、TMM(受體類(lèi)蛋白,Protein too many mouths-like)、SERK1(體細(xì)胞胚胎發(fā)生受體激酶1,Somatic embryogenesis receptor kinase 1)、BRL3-1(受體樣蛋白激酶BRI1-like 3,Receptor-like protein kinase BRI1-like 3)等蛋白存在相互作用(圖6)。氣孔作為水氣交換的通道,對(duì)于優(yōu)化植物光合效率、增強(qiáng)環(huán)境適應(yīng)能力具有重要的作用。植物可以通過(guò)改變氣孔的孔徑和分布適應(yīng)環(huán)境脅迫,減少植株損傷[16]。GhERL1蛋白與TMM形成復(fù)合體參與識(shí)別氣孔調(diào)節(jié)肽EPF2等,調(diào)節(jié)氣孔發(fā)育過(guò)程中免疫應(yīng)答,調(diào)控內(nèi)在生理、發(fā)育過(guò)程以適應(yīng)不斷變化的環(huán)境。
圖6 蛋白互作網(wǎng)絡(luò)分析Figure 6 Protein interaction network analysis
類(lèi)受體蛋白激酶是植物生長(zhǎng)的重要調(diào)節(jié)因子,ERf家族受體與氣孔發(fā)育、莖尖分生組織功能、花細(xì)胞分化和生物/非生物脅迫有關(guān)[17]。本研究通過(guò)利用生物信息學(xué)方法對(duì)陸地棉GhERL1的理化性質(zhì)、結(jié)構(gòu)功能和表達(dá)模式等進(jìn)行分析。
通過(guò)理化性質(zhì)分析發(fā)現(xiàn)GhERL1蛋白的平均疏水性為-0.027,具有較弱的親水性。而疏水性是水對(duì)非極性分子產(chǎn)生的排斥作用,在蛋白質(zhì)的結(jié)構(gòu)、構(gòu)象及與其他蛋白質(zhì)的相互作用等方面具有重要作用,與蛋白質(zhì)的功能和性質(zhì)密切相關(guān)。蛋白質(zhì)的不穩(wěn)定系數(shù)與其結(jié)構(gòu)有關(guān),GhERL1不穩(wěn)定系數(shù)34.14,屬于穩(wěn)定蛋白類(lèi)別。GhERL1蛋白二級(jí)結(jié)構(gòu)主要由α-螺旋和無(wú)規(guī)卷曲構(gòu)成,β-轉(zhuǎn)角和延伸鏈的占比較少。GhERL1蛋白三級(jí)結(jié)構(gòu)建模有助于了解GhERL1蛋白在結(jié)構(gòu)的可視化,以及蛋白一蛋白相互作用和蛋白質(zhì)功能分析方面的應(yīng)用。植物蛋白質(zhì)的亞細(xì)胞定位是功能基因組學(xué)的重要內(nèi)容,而植物細(xì)胞的主要分區(qū)包括細(xì)胞膜和其他內(nèi)膜系統(tǒng)、細(xì)胞核、細(xì)胞質(zhì)以及位于其中的線粒體、葉綠體、高爾基體和內(nèi)質(zhì)網(wǎng)等各種細(xì)胞器[18]。GhERL1蛋白定位于細(xì)胞膜,感知膜外的富含半胱氨酸的多肽,在組織中實(shí)現(xiàn)細(xì)胞間的通信。
本研究分析了GhERL1基因在陸地棉不同組織的表達(dá)模式,發(fā)現(xiàn)GhERL1基因在葉中的表達(dá)量較高,可能參與葉片細(xì)胞發(fā)育,調(diào)控器官形態(tài)建成。GhERL1基因在根組織具有高表達(dá)量,而根組織具有吸收水分和固定地上部分的功能,還具有向土壤輸入有機(jī)質(zhì)和感知根部周邊環(huán)境變化的作用,推測(cè)其在根系網(wǎng)絡(luò)中具有重要功能。GhERL1基因在陸地棉植株的不同組織中均具有表達(dá)量,可能與陸地棉的整個(gè)生長(zhǎng)過(guò)程相關(guān)。而這不同組織的表達(dá)量存在差異性,表明其在不同組織的不同發(fā)育階段發(fā)揮著特有的功能。在蛋白-蛋白調(diào)控網(wǎng)絡(luò)中,發(fā)現(xiàn)GhERL1編碼蛋白與EPF2、TMM、SERK1、BRL3-1等蛋白存在相互作用。擬南芥EPF2在葉片表皮細(xì)胞發(fā)育中調(diào)節(jié)細(xì)胞密度,影響氣孔形成,可在不影響?zhàn)B分吸收的前提下提高植物的抗旱性,對(duì)植物的生存和產(chǎn)量至關(guān)重要[19]。TMM的突變會(huì)導(dǎo)致擬南芥葉片的氣孔模式缺陷,會(huì)消除莖部的氣孔形成。陸地棉SERK1基因編碼富含亮氨酸的重復(fù)受體蛋白激酶,在花藥發(fā)育和花粉粒的形成中有一定作用[20]。組成相互作用網(wǎng)絡(luò)的這些編碼蛋白主要參與信號(hào)轉(zhuǎn)導(dǎo)等途徑,它們可能在陸地棉生長(zhǎng)發(fā)育和響應(yīng)脅迫反應(yīng)中起重要作用。
棉花在生長(zhǎng)發(fā)育過(guò)程中,會(huì)受到高溫、鹽堿、干旱、營(yíng)養(yǎng)缺乏、病菌侵害等各種惡劣因素影響。然而,棉花細(xì)胞可以感受外界逆境信號(hào),激活抗逆信號(hào)通路,引起自身防御機(jī)制反應(yīng)。本研究分析了GhERL1的序列結(jié)構(gòu)和功能預(yù)測(cè)模擬,為大田育種廣泛應(yīng)用GhERL1改良作物生產(chǎn)潛力提供科學(xué)依據(jù)。而在GhERL1蛋白互作調(diào)控網(wǎng)絡(luò)發(fā)現(xiàn)的這些蛋白質(zhì)和基因有可能在未來(lái)解決一系列嚴(yán)重的農(nóng)業(yè)問(wèn)題,包括提高作物用水效率,以及改善高溫、鹽堿壓力對(duì)作物的影響。