王鵬洋 曲姍姍 梁源
摘要 [目的]對水稻W(wǎng)RKY轉(zhuǎn)錄因子家族成員進行生物信息學(xué)分析,為進一步研究水稻W(wǎng)RKY轉(zhuǎn)錄因子的功能提供依據(jù)。[方法]從NCBI網(wǎng)站下載水稻全基因組序列,利用CDD、Blast、MEME、MEGA、ProtParam等在線工具或本地軟件篩選WRKY家族成員,對所得WRKY家族成員的理化性質(zhì)、系統(tǒng)進化親緣關(guān)系、保守元件等項目進行生物信息學(xué)分析。[結(jié)果]共從水稻基因組中鑒定篩選出65個WRKY家族成員,每一個成員中都具有WRKYGQK的保守元件,除此之外還有一個保守鋅指結(jié)構(gòu)的元件存在。利用MEGA對所得WRKY家族成員進行聚類發(fā)現(xiàn),65個WRKY家族成員可以分為A、B、C、D、E 5類,其中A、B、C、D 4類的親緣關(guān)系較近,可以聚為一類;而A類相對親緣關(guān)系較遠,認為A類成員可能是長期進化過程中被保留下來的較為原始的一類。[結(jié)論]該研究較系統(tǒng)地鑒定了水稻W(wǎng)RKY家族,為進一步研究水稻W(wǎng)RKY轉(zhuǎn)錄因子功能和互作關(guān)系提供參考。
關(guān)鍵詞 水稻;WRKY轉(zhuǎn)錄因子;生物信息學(xué);系統(tǒng)進化樹
中圖分類號 Q 943.2 ?文獻標識碼 A
文章編號 0517-6611(2019)12-0123-04
doi:10.3969/j.issn.0517-6611.2019.12.033
開放科學(xué)(資源服務(wù))標識碼(OSID):
Abstract [Objective]Bioinformatics analysis of WRKY transcription factor family members in rice was carried out to provide basis for further study on the function of WRKY transcription factor family in rice.[Method]The whole genome sequence of rice was downloaded from NCBI website.The WRKY family members were screened by CDD,Blast,MEME,MEGA,ProtParam and other online tools or local software.The physical and chemical properties,phylogenetic relationships and conservative elements of the WRKY family members were analyzed by bioinformatics.[Results]A total of 65 WRKY family members were identified from the rice genome,each of which had a conserved element of WRKYGQK,in addition to a conserved zinc finger structure.Using MEGA to cluster the obtained WRKY family members,65 WRKY family members can be divided into A,B,C,D,E 5 categories,among which A,B,C,D 4 are closely related and can be clustered into one group;while class A is relatively distantly related,and it is considered that class A members may be a relatively primitive class that has been preserved during longterm evolution.[Conclusion]This study systematically identified the WRKY family of rice,and provided a reference for further study on the function and interaction of WRKY transcription factors in rice.
Key words Rice;WRKY transcription factor;Bioinformatics;Phylogenetic tree
水稻(Oryza sativa)被譽為五谷之首,是我國的主要糧食作物之一,其生產(chǎn)史悠久,種植分布廣泛,我國水稻主產(chǎn)區(qū)主要是東北地區(qū)、長江流域、珠江流域[1]。稻米中有豐富的營養(yǎng),如碳水化合物、蛋白質(zhì)和一些礦物元素。據(jù)統(tǒng)計,世界上近一半人口都以稻米為食[2-3]。
WRKY是存在于植物中的最大且最重要的轉(zhuǎn)錄因子家族之一,因其存在WRKYGQK(色氨酸-精氨酸-賴氨酸-酪氨酸-甘氨酸-谷氨酰胺-賴氨酸)結(jié)構(gòu)域而得名,該結(jié)構(gòu)域十分保守[4]。WRKY轉(zhuǎn)錄因子是通過與靶基因啟動子中的W-box相互作用來啟動應(yīng)答的,一種應(yīng)答反應(yīng)常常需要多個WRKY因子的協(xié)同作用,而同一個WRKY轉(zhuǎn)錄因子有可能在多組應(yīng)答作用中發(fā)揮功能[5]。在多種植物中都存在WRKY轉(zhuǎn)錄因子,如擬南芥(Arabidopsis thaliana)中有74個、番茄(Lycopersicon esculentum Mill.)中有81個、蘋果(Malus pumila Mill.)中有116個[6]。
WRKY轉(zhuǎn)錄因子在應(yīng)對逆境脅迫時可以發(fā)揮重要功能[7]。有研究表明,許多WRKY基因有參與抗病過程的功能,其參與途徑一般為調(diào)控抗病相關(guān)基因的轉(zhuǎn)錄[8]。WRKY還在干旱、低溫、高鹽的情況下表達以降低植物受到的傷害,例如WRKY13選擇性的結(jié)合到SNAC1啟動子區(qū)不同的順式作用元件上通過調(diào)節(jié)氣孔閉合來提高對干旱的抗性[9];WRKY1、WRKY7、WRKY22等基因在低溫情況下有應(yīng)激反應(yīng)[10];WRKY75是對鹽脅迫響應(yīng)的重要調(diào)控因子[11]。因此解析WRKY基因的生物學(xué)功能對建立植物對逆境脅迫的調(diào)控信號網(wǎng)絡(luò)意義重大,也可對植物分子改良提供理論基礎(chǔ)。該研究擬對水稻W(wǎng)RKY進行生物信息學(xué)分析,以期全面了解水稻W(wǎng)RKY蛋白的基本性質(zhì)、結(jié)構(gòu)特點及系統(tǒng)進化等信息,為WRKY基因的進一步研究提供依據(jù)。
1 材料與方法
1.1 數(shù)據(jù)來源 從NCBI(https://www.ncbi.nlm.nih.gov/assembly/GCA_000004655.2)上下載水稻的全基因組序列,以染色體為單位下載,共12條染色體。用NCBI中的在線工具CDD[12](https://www.ncbi.nlm.nih.gov/cdd)得到WRKY轉(zhuǎn)錄因子家族的保守簡并結(jié)構(gòu)域(LDDGYRWRKYGQKVVKGNPYPRSYYKCTTPGCGVRKHVERAATDPKAVVTTYEGKHNH),并以該結(jié)構(gòu)域作為后續(xù)Blast的探針。
1.2 試驗方法
1.2.1 數(shù)據(jù)篩選。運用本地Blast軟件,采用tBlastn[13]算法,以水稻12條染色體的全基因組為數(shù)據(jù)庫,以WRKY保守結(jié)構(gòu)域為探針進行比對,E-value值設(shè)為1e- 5,手動除去短的干擾序列,輸出分值比較高的比對結(jié)果。上述tBlastn算法比對輸出的結(jié)果為蛋白序列,將其逐條于水稻數(shù)據(jù)庫(http://rice.plantbiology.msu.edu/)的在線Blastp算法比對以獲得WRKY蛋白的全序列。
1.2.2 數(shù)據(jù)的篩選與鑒定。將從水稻數(shù)據(jù)庫獲得的WRKY蛋白輸入CDD,有WRKY保守結(jié)構(gòu)域的蛋白質(zhì)才被確定為WRKY家族成員。應(yīng)用在線工具MEME(http://meme-suite.org/tools/meme)對WRKY家族成員做鑒定,尋找該家族是否有其他共有的保守序列,設(shè)定保守序列長度為2~600個氨基酸殘基,最多檢測10個保守序列,其余參數(shù)為默認,并得到保守序列處于蛋白位置的示意圖。
1.2.3 WRKY家族成員系統(tǒng)進化分析。將篩選鑒定得到的WRKY蛋白質(zhì)序列以fasta格式保存,利用軟件MEGA(Molecular Evolutionary Genetics Analysis)中的ClustalW進行序列比對,再利用MEGA中PHYLOGENY功能的鄰接法(neighbor-joining)[14-15],設(shè)置NO.of Bootstrap Replications值為1 000,Number of Threads值為3,其余參數(shù)為默認,作出WRKY家族的系統(tǒng)進化樹。
1.2.4 WRKY家族成員蛋白的理化性質(zhì)分析。利用在線工具ProtParam(https://web.expasy.org/cgi-bin/protparam/protparam)對WRKY家族成員蛋白作理化性質(zhì)預(yù)測與分析,分別預(yù)測了分子質(zhì)量(Molecular weight)、等電點(PI)、不穩(wěn)定系數(shù)(Instability index)和總平均親水性(Grand average of hydropathicity)。
2 結(jié)果與分析
2.1 水稻W(wǎng)RKY轉(zhuǎn)錄因子家族的鑒定及理化性質(zhì)分析 通過篩選鑒定得到水稻W(wǎng)RKY轉(zhuǎn)錄因子家族成員65個,鑒定依據(jù)為蛋白序列中存在WRKYGQK保守基序,WRKY家族成員的命名采用水稻數(shù)據(jù)庫中的名字,登錄號為水稻數(shù)據(jù)庫中該蛋白對應(yīng)基因的登錄號,并統(tǒng)計了蛋白氨基酸數(shù)目、對應(yīng)基因的ORF長度、蛋白相對分子質(zhì)量、等電點、不穩(wěn)定系數(shù)和總平均親水性。據(jù)統(tǒng)計,水稻W(wǎng)RKY家族中蛋白氨基酸數(shù)目最多為1 002個,最少為181個,極差較大,平均值為400個氨基酸。等電點范圍為4.52~10.20,其中小于7的有39個,大于7的有26個,說明該家族蛋白質(zhì)更偏向于弱酸性。相對分子質(zhì)量在18 481.3~109 042.29之間。該家族中不穩(wěn)定系數(shù)只有3個成員小于40,為穩(wěn)定蛋白,其余均為不穩(wěn)定蛋白??偲骄H水性均為負值,說明WRKY家族成員均為親水蛋白。
2.2 WRKY家族成員系統(tǒng)進化分析結(jié)果 為得到WRKY家族中各成員間的同源進化關(guān)系,筆者采用系統(tǒng)進化分析的方法,將鑒定得到的65個家族成員輸入MEGA繪制系統(tǒng)進化樹(圖1)。根據(jù)進化樹的聚類結(jié)果將這65個成員分為A、B、C、D、E 5類,其分別包括WRKY基因9、16、12、11和17個,A類中的WRKY成員最少,E類中的WRKY成員最多。從進化樹分支關(guān)系中還可以得到B、C、D、E 4類的親緣關(guān)系相對較近聚為一大類,而A類相對關(guān)系較遠,認為可能A類成員是在長期進化過程中保留下來的較原始的一類。根據(jù)進化樹分組結(jié)果將家族成員分組進行比對發(fā)現(xiàn),每組的保守氨基酸都各不相同,但相同的是所有組都有WRKY保守序列(圖2)。其中C組中同組完全保守氨基酸較多,E組中完全保守氨基酸較少。B、C、D、E 4組比較相似,它們與A組成員相差較遠,其差異主要表現(xiàn)在后半部分,從第1個保守的半胱氨酸(C字母)開始出現(xiàn)差異,第2個半胱氨酸相對于其他4組更晚出現(xiàn),且碳端保守組氨酸(H字母)也出現(xiàn)的更晚,這些是由于長期進化而出現(xiàn)的序列差異。
2.3 保守元件分析 利用在線工具MEME尋找WRKY家族的保守元件,發(fā)現(xiàn)除WRKYGQK的保守元件,該家族中還具有1個鋅指結(jié)構(gòu)[16],A組中該鋅指結(jié)構(gòu)為C-X7-C-X22-28-H-X-H,B組和C組中該鋅指結(jié)構(gòu)為C-X5-C-X23-H-X-H,而D組和E組中該鋅指結(jié)構(gòu)為C-X4-C-X23-H-X-H,其中X可以是任意氨基酸,但X中也有相對保守的氨基酸存在。
3 結(jié)論與討論
WRKY轉(zhuǎn)錄因子家族是在植物中廣泛存在的一類重要蛋白,其可以在很多逆境脅迫中發(fā)揮作用以減少逆境對植物帶來的傷害,因此對WRKY家族的研究至關(guān)重要。常常有多個WRKY協(xié)同發(fā)揮一個功能,但WRKY轉(zhuǎn)錄因子與基因之間或兩個WRKY之間是如何協(xié)同進行信號轉(zhuǎn)導(dǎo)的,該機制尚不清楚,仍需進一步闡明和完善。該研究對水稻W(wǎng)RKY轉(zhuǎn)錄因子家族成員的理化性質(zhì)、系統(tǒng)進化親緣關(guān)系、保守元件等項目的生物信息學(xué)分析。結(jié)果表明,水稻W(wǎng)RKY轉(zhuǎn)錄因子家族成員共有65個,每一個成員中都具有WRKYGQK的保守元件,除此之外還有一個保守鋅指結(jié)構(gòu)的元件存在。利用MEGA對所得WRKY家族成員進行聚類發(fā)現(xiàn),65個WRKY家族成員可以分為A、B、C、D、E 5類,其中A、B、C、D 4類的親緣關(guān)系較近,可以聚為一類;而A類相對親緣關(guān)系較遠,認為A類成員可能是長期進化過程中被保留下來的較原始的一類。該研究認為,水稻基因組中共有65個WRKY轉(zhuǎn)錄因子,這與Ross等[17]在日本晴水稻上得出的結(jié)論不同,可能是由于所選用的水稻基因組數(shù)據(jù)、篩選方式以及結(jié)構(gòu)域探針不同等因素導(dǎo)致的。該研究較系統(tǒng)地鑒定了水稻W(wǎng)RKY家族,為學(xué)者研究WRKY轉(zhuǎn)錄因子功能和互作關(guān)系提供生物信息學(xué)信息,有利于對WRKY的進一步深入研究。未來對WRKY轉(zhuǎn)錄因子的研究重點依然在明確WRKY在植物受逆境脅迫時的信號轉(zhuǎn)導(dǎo)途徑,以及利用WRKY對作物和林木進行分子改良以開發(fā)其巨大的應(yīng)用價值。
參考文獻
[1]ZHU D W,QIAN Z H,WEI H Y,et al.The effects of field preharvest sprouting on the morphological structure and physicochemical properties of rice (Oryza sativa L.) starch[J].Food chemistry,2019,278:10-16.
[2] YADAV S,GILL S S,PASSRICHA N,et al.Genomewide analysis and transcriptional expression patternassessment of superoxide dismutase (SOD) in rice and Arabidopsis under abiotic stresses[J].Plant gene,2019,17:1-9.
[3] 朱景福,李芳,鹿保鑫.基于聚類改進的Fisher與KNN判別分類算法對比研究[J].安徽農(nóng)業(yè)科學(xué),2019,47(1):250-252,257.
[4] 谷彥冰,冀志蕊,遲福梅,等.蘋果WRKY基因家族生物信息學(xué)及表達分析[J].中國農(nóng)業(yè)科學(xué),2015,48(16):3221-3238.
[5] 趙楠楠,劉立峰.植物WRKY轉(zhuǎn)錄因子及其生物學(xué)功能[J/OL].分子植物育種.[2018-12-25].http://kns.cnki.net/kcms/detail/46.1068.S.20181218.1113.004.html.
[6] ISHIGURO S,NAKAMURA K.Characterization of a cDNA encoding a novel DNAbinding protein,SPF1,that recognizes SP8 sequences in the 5' upstream regions of genes coding for sporamin and betaamylase from sweet potato[J].Molecular and general genetics,1994,244(6):563-571.
[7] ZHANG Y J,WANG L J.The WRKY transcription factor superfamily:Its origin in eukaryotes and expansion in plants[J].BMC Evolution Biology,2005,5(1):1-12.
[8] 劉夢佳,李海峰.水稻W(wǎng)RKY轉(zhuǎn)錄因子家族研究進展[J].河南農(nóng)業(yè)科學(xué),2016,45(3):1-8.
[9] 肖俊.水稻W(wǎng)RKY13通過選擇性結(jié)合不同順式作用元件調(diào)控非生物和生物脅迫信號路徑間的互作[D].武漢:華中農(nóng)業(yè)大學(xué),2013.
[10] 周麗霞,曹紅星.低溫脅迫下油棕WRKY轉(zhuǎn)錄因子基因的表達特性分析[J].南方農(nóng)業(yè)學(xué)報,2018,49(8):1490-1497.
[11] 萬永青,毛銘銖,萬東莉,等.中間錦雞兒WRKY75基因?qū)M南芥耐受鹽和ABA能力的影響[J].西北植物學(xué)報,2018,38(1):17-25.
[12] 梁濱,董冬.植物WRKY轉(zhuǎn)錄因子的研究進展[J].生物學(xué)通報,2018,53(6):5-8.
[13] 劉洋,鄭洋洋,宮超,等.番茄AS2基因家族的系統(tǒng)進化分析[J].基因組學(xué)與應(yīng)用生物學(xué),2018,37(9):3958-3965.
[14] SAITOU N,NEI M.The neighborjoining method:A new method for reconstructing phylogenetic trees[J].Molecular biology and evolution,1987,4(4):406-425.
[15] KUMAR S,STECHER G,LI M,et al.MEGA X:Molecular Evolutionary Genetics Analysis across computing platforms[J].Molecular biology and evolution,2018,35(6):1547-1549.
[16] 向貴生,王開錦,晏慧君,等.薔薇科植物MLO蛋白家族的生物信息學(xué)分析[J].基因組學(xué)與應(yīng)用生物學(xué),2018,37(5):2043-2059.
[17] ROSS C A,LIU Y,SHEN Q J.The WRKY gene family in rice (Oryza sativa)[J].J Integr Plant Biol,2007,49(6):827-842.