鄒奕 ,閆彩燕 ,邳植 ,2,3*
(1.黑龍江省普通高等學校甜菜遺傳育種重點實驗室,哈爾濱150080;2.中國農業(yè)科學院甜菜研究所/黑龍江大學農作物研究院,哈爾濱150080;3.中國農業(yè)科學院北方糖料作物資源與利用重點開放實驗室,哈爾濱150080)
蛋白質翻譯后修飾是指mRNA翻譯為蛋白質后對蛋白質上個別氨基酸殘基進行共價修飾的過程,在生命體中具有十分重要的作用。這一過程使蛋白質結構更復雜,功能更完善,調控更精準。在真核細胞中常見的蛋白質翻譯后修飾約有20多種。其中,蛋白質的可逆磷酸化修飾是最為常見的蛋白質翻譯后修飾。Fisher和Kerbs研究證實蛋白質的可逆磷酸化在生物調控機制中的重要地位,該項研究最終獲得1992年的諾貝爾生理醫(yī)學獎[1-2]。蛋白質磷酸化主要發(fā)生在蛋白質的Ser、Thr、Tyr殘基,調控酶活性、亞細胞定位,蛋白質相互作用涉及細胞信號轉導、細胞增殖、發(fā)育和分化等生理過程[3-4]。值得注意的是在植物中編碼蛋白激酶的基因約占功能基因總數的4%,相當于人類基因組中所占比例的2倍[5]。這暗示著植物這種缺乏逃避逆境能力的生物具有復雜磷酸化級聯反應網絡感應外界環(huán)境變化,從而精準、快速地調節(jié)自身代謝途徑以適應逆境。
蛋白質的可逆磷酸化修飾由蛋白激酶和蛋白磷酸酶參與,在蛋白激酶的作用下ATP中的磷酸基團被轉移到蛋白質氨基酸殘基的羥基[6]。相反,蛋白磷酸酶可將蛋白質中的磷酸基團轉移至ADP,使蛋白質發(fā)生去磷酸化作用。以往研究表明,植物基因組中約含有1400個編碼蛋白激酶的基因,而編碼磷酸酶的基因數目僅有為蛋白激酶的1/10左右[7]。這就意味著單一蛋白磷酸酶可能負責多個蛋白激酶的可逆磷酸化過程,對于植物適應外界環(huán)境具有重要意義。根據其底物特異性蛋白磷酸酶可分為絲氨酸/蘇氨酸蛋白磷酸酶類(protein serine/threonine phosphatases,PSP)和酪氨酸蛋白磷酸酶類(protein tyrosine phosphatases,PTP)兩大類[8]。
系統進化分析可以將 PSP分為 PPP (plant protein phosphatase) 和 PPM (metal-dependent protein phosphatases)兩支[9]。 PPP 支主要包括 PP1、PP2A、PP2B(PP3)、PP4、PP5、PP6、PP7、Kelch、SLP 以及 PPP Unique共10個家族。PP1家族蛋白活性主要受熱穩(wěn)定蛋白l1和l2抑制,PP2A和PP2B(PP3)家族成員均不受蛋白l1和l2抑制,但PP2B(PP3)家族蛋白活性需要Ca2+激活,PP2A家族蛋白活性則不依賴2價金屬離子[10]。PP4家族成員含有兩個高保守的調控亞基R1和R2,PP5家族成員則在N-末端含有一個具有決定蛋白互作關系的TPR結構域,PP6家族成員則含有高保守的SAPS調控亞基和錨蛋白重復亞基,PP7家族成員則催化亞基同時分布在C-和N-末端,且同時含有EF結構域。Kelch家族成員主要包括BSU1、BSL1、BSL2,在N-末端含有重復Kelch結構,主要參與BR信號通路[11]。PPM支主要包活PP2C和PDP兩大家族。PDP家族成員含有PP2C催化結構域,主要與丙酮酸脫氫酶結合,催化該酶的去磷酸化過程[12]。PTP類根據含有磷酸酶功能結構域和催化功能不同可以分為 classical PTP、DSP、Asp Based PTP、CDC25、LMWPTP、PTPLA 幾支[13]。
甜菜為藜科二年生植物,是我國三北地區(qū)最主要的糖料作物,也是北方最具競爭力和潛力的經濟作物,具有栽培技術體系完善,機械化程度高,不與主糧爭地,土地利用率高,兼顧生態(tài)效益等多方面優(yōu)勢。然而,國內利用生物信息學對于甜菜基因家族的研究相對較少。自甜菜基因組信息發(fā)布以來,尚無關于磷酸酶超家族分析的相關報道。因此,本研究利用生物信息學的手段對甜菜磷酸酶超家族進行分析。
首先,從甜菜基因組數據庫(http://bvseq.molgen.mpg.de)下載甜菜蛋白質組信息[14]。利用EKPD數據庫(http://ekpd.biocuckoo.org)中29個蛋白磷酸酶HMM模型檢索甜菜蛋白質組序列,E-value閾值設為<1[15-16]。隨后,將檢索到的候選甜菜磷酸酶分別進行Pfam、Interpro和SMART蛋白結構域分析,剔除不含有磷酸酶功能結構域的序列。最后,利用在線軟件Compute pI/Mw和TargetP對篩選到的蛋白磷酸酶分子量、等電點和亞細胞定位進行預測[17-18]。
根據hmmsearch結果提取甜菜磷酸酶蛋白中得分最高的磷酸酶結構域序列。隨后,利用Cluster Omega對挑選出的磷酸酶結構域序列進行序列比對,所有參數采用默認值[19]。對比對結果進行人工校正后,以甜菜果糖-1,6-二磷酸酶(Bv2_024290 rmpf.t1)果糖二磷酸結構域序列作為外類群,采用iqtree軟件構建Maximum likelihood進化樹[20]。根據ModelFinder計算結果選擇WAG+F+G4為最優(yōu)模型,bootstrap設置為1000[21]。建樹結果利用Evolview軟件進行可視化及注釋[22]。
甜菜各磷酸酶家族基因數目根據hmmsearch和進化樹結果統計,其他物種磷酸酶家族數目來源于EKPD數據庫。為了避免基因組大小對不同物種磷酸酶基因家族比較的干擾,計算各磷酸酶家族在基因組中所占比例,并以擬南芥作為對照。根據甜菜及各物種磷酸酶家族大小進行層次聚類分析。
利用HMMER軟件對甜菜基因組進行分析,總共檢索到163個候選蛋白磷酸酶。進一步通過Pfam、Interpro、SMART蛋白結構域分析,最終從中篩選出143個編碼蛋白磷酸酶的基因,約占甜菜基因組編碼基因的0.5%。其數目略低于擬南芥(162個)、玉米(225個)、水稻(164個)等模式植物,但與其他物種所占基因組比例相近(0.35%~0.59%)。其中,編碼蛋白磷酸酶序列長度范圍454 aa~1555 aa,分子量范圍5.8 kDa~169.1 kDa,等電點范圍3.9~10.3。利用TargetP對甜菜蛋白磷酸酶亞細胞定位進行預測,結果顯示分別約有19.3%、10.3%和5.5%的蛋白磷酸酶定位于葉綠體、線粒體和細胞核。
以143個甜菜蛋白磷酸酶結構域序列構建進化樹,甜菜蛋白磷酸酶超家族可分為PSP和PTP兩個大支(圖1)。PSP一支涉及PP2C、PPP和CDC25家族。其中,PP2C家族含有63個基因,遠多于PPP家族(16個)和其他磷酸酶家族基因數目;PP2C家族成員蛋白活性主要依賴于Mn2+和Mg2+,是植物中家族成員最多的一類蛋白磷酸酶[11]。CDC25家族含有兩個基因,以往研究表明CDC25家族在植物中的成員相對較少,特異識別依賴性激酶(CDK),催化Thr14和Thr15的去磷酸化[23]。在甜菜中CDC25家族被分入PSP,其原因可能是甜菜CDC25結構域不完整導致。PTP一支包括Asp based PTP、DSP、LMWPTP、PTPLA 和 NRPTP,5 個磷酸酶家族。其中,Asp based PTP和DSP磷酸酶家族基因數目較多,分別為31個和25個。Asp Based PTP家族成員參與催化反應需要Asp作為親核基團[11]。DSP家族成員不僅能夠催化酪氨酸殘基去磷酸化,還能催化絲氨酸和蘇氨酸去磷酸化,進一步催化底物和結構域不同的7個家族[24]。LMWPTP、PTPLA和NRPTP家族所含基因數目較少,總共僅包含6個基因。LMWPTP家族是近些年新發(fā)現的一類蛋白磷酸酶家族,該家族成員具有較小的分子量,一般約為18 kDa[25]。PTPLA家族成員中酪氨酸磷酸酶保守基序CXXXXXR變異為CXXXXXA,對植物器官的發(fā)育、分化和維持具有重要作用[26]。
圖1 甜菜蛋白磷酸酶超家族系統進化樹Fig.1 Phylogenetic tree of protein phosphatase superfamily in sugar beet
根據hmmsearch和進化樹結果統計各磷酸酶家族基因數目,通過層次聚類分析(圖2)發(fā)現甜菜磷酸酶超家族基因分布狀況與衣藻(Chlamydomonas reinhardtii)、 小 立 碗 蘚(Physcomitrella patens)和紅藻(Cyanidioschyzon merolae)等孢子植物更近。這說明甜菜磷酸酶超家族成員在甜菜進化過程中較為保守。與其他物種相比,甜菜具有PPP家族較小的特點,PP1、PP2A、PP2B、PP4、PP5、PP6、PP7、Kelch 亞家族所含基因數目均只有擬南芥的一半。此外,CDC14、CDC25和 MDP1家族基因數目分別含為5個、2個、2個,而在其他物種中數目較少,甚至沒有。CDC14家族成員在N-末端具有一個高度保守的特異結構域,能夠催化CDK激酶底物發(fā)生去磷酸化作用[11]。MDP1家族成員在催化中心存在數個氨基酸的變異,能夠結合更多種類的底物[23]。
圖2 不同物種間蛋白磷酸酶超家族聚類分析Fig.2 Cluster analysis of protein phosphatase superfamily among different species
本研究利用生物信息學對甜菜蛋白磷酸酶超家族進行初步分析,從甜菜基因組中共篩選出143個蛋白磷酸酶,構建甜菜磷酸酶超家族系統進化樹。與擬南芥、玉米等植物相比,甜菜各蛋白磷酸酶家族基因數目基本呈現較少或持平的形勢。有趣的是甜菜磷酸酶家族成員分布與衣藻、紅藻和小立碗蘚等孢子植物相近,說明甜菜物種起源較早且蛋白磷酸酶超家族在物種進化中較為保守。
與其他高等植物相比,甜菜中CDC14、CDC25和MDP1家族數目具有一定優(yōu)勢,這些家族成員在進化過程中未被淘汰,暗示其對甜菜生長發(fā)育和形態(tài)建成具有一定作用。大多數植物基因組中沒有或極少量含有編碼CDC14和CDC25的基因,而在甜菜中分別發(fā)現5個和2個編碼CDC14和CDC25的基因。CDC14家族是調控細胞周期的關鍵因子,在DNA復制、有絲分裂退出和胞質分裂中起重要作用。在DNA修復期間可以促進紡錘體穩(wěn)定,是中期紡錘體維持、修復過程的關鍵[27]。CDC25家族同樣是細胞周期的關鍵調節(jié)因子,能夠催化CDK中的Thr14和Tyr15發(fā)生去磷酸化,從而激活CDK活性,達到驅動整個細胞周期的作用[23,28]。雖然,在甜菜中還未發(fā)現具有CDC25家族全長的同源基因,但是存在與C末端磷酸酶結構域直系同源的短序列成員。Spadafora等通過分析擬南芥CDC25突變體發(fā)現,缺失CDC25基因后擬南芥突變體對羥基脲引起的DNA損傷更為敏感,抑制擬南芥根部生長[29]。相反,過表達CDC25基因有助于提高擬南芥對DNA損傷修復的能力。因此,甜菜基因組中含有較多的CDC14和CDC25家族磷酸酶可能與甜菜逆境損傷修復和根部細胞增殖相關。在甜菜基因組中發(fā)現兩個編碼MDP1(Magnesium-dependent phosphatase 1)的基因,而在植物中相關功能報道較少。Yin等利用基因干擾手段對腫瘤細胞中MDP1功能進行研究發(fā)現,MDP1參與細胞增殖過程,其表達受抑制后細胞G0/G1細胞周期阻滯,導致大量細胞停滯在G1期[30]。但是,MDP1是否參與甜菜細胞增殖仍未見報道,值得進一步研究。