張勝利,李東方,周巖
(河南科技學院,河南新鄉(xiāng)453003)
條銹病是小麥的重要病害.種植抗病品種是防治小麥條銹病的最經(jīng)濟、有效又環(huán)保的措施[1].已經(jīng)定位的小麥條銹病抗病基因Yr5、Yr10、Yr15、Yr24和Yr26對我國目前3個流行優(yōu)勢生理小種(CY30,CY31,CY32)都表現(xiàn)為免疫或高抗,遺憾的是目前只有Yr10被克隆,這與小麥基因組復雜、龐大有很大關系[2].隨著新一代測序儀的不斷普及,包括EST在內(nèi)的DNA序列數(shù)據(jù)日益膨脹,這為進行基因的電子克隆提供了豐富的數(shù)據(jù)[3-4].為給抗病分子育種提供一定的理論基礎及技術參考,本研究采用與前人類似的方法進行了小麥Yr5基因的電子克隆研究.
以在GeenBank中登錄號為JQ318586.1的小麥Yr5基因相關的EST為材料,以NCBI中的EST數(shù)據(jù)庫為主要數(shù)據(jù)源,采用類似張德禮等[5-6]的方法進行了Yr5基因的電子克隆,并利用BlastX[7]、BlastP[8]、ORF finder、clustalX1.8等相關軟件對該基因及其同源基因進行了序列分析.
經(jīng)電子拼接得到的Yr5基因的cDNA長為1420 bp,ORF finder預測結果表明,ORF區(qū)從14 bp到1419 bp,長1407 bp,編碼469個氨基酸;由于沒有找到終止密碼子及polyA信號,所以電子拼接得到的該cDNA不是Yr5基因的全長(圖1).
圖1 電子克隆的Yr5基因的開放閱讀框Fig.1 Open reading frame of the in silico cloning gene Yr5
BlastX分析結果表明,電子克隆的Yr5基因與數(shù)據(jù)庫中大麥、高粱、谷子、水稻等的抗病基因具有較高的同源性,蛋白序列覆蓋度在97%以上,序列一致性在60%~68%(圖2).以預測的長度為469個氨基酸的蛋白為query,在CDD-42589 PSSMs蛋白保守結構域數(shù)據(jù)庫中進行檢索[9],結果表明,該蛋白含有NB-ARC、LRR_8兩個抗病基因大多均含有的保守結構域,但所含有的NB-ARC結構域不完整,因此進一步驗證了電子拼接的Yr5基因不是全長.
圖2 電子克隆的Yr5基因的BLASTX搜索結果(部分)Fig.2 BLAST Xsearch results(in part)of in silico cloning gene Yr5
同源基因的比較是估計電子拼接的Yr5基因全長的有效手段.在NCBI的相關數(shù)據(jù)庫中檢索小麥及其近緣種中已被克隆的銹病抗病相關基因,結果見表1.電子克隆的Yr5基因的保守結構域搜索結果見圖3.
表1 銹病抗病基因同源序列比較Tab.1 homologous sequences comparation of rust resistance gene
圖3 電子克隆的Yr5基因的保守結構域搜索結果Fig.3 Conserved domain search results of in silico cloning gene Yr5
結果表明,小麥銹病抗病基因除Lr1外蛋白長度多在810~930個氨基酸之間,平均為871±62.7個氨基酸;均含有NB-ARC保守結構域,平均長度為283.6±6.19個氨基酸,結構域的起點平均為184.2±16.72個氨基酸.本研究電子拼接的Yr5基因編碼蛋白的NB-ARC保守結構域長度為210個氨基酸,從圖3及表1可以推測,本研究電子拼接的Yr5基因在NB-ARC保守結構域上靠近N端少了約73個氨基酸,加上結構域的平均起點,N端總共少了約257個氨基酸.據(jù)此,還可以推測C端約少了145個氨基酸(871-469-257).
植物基因克隆常用的方法有圖位克隆法、轉座子標簽法、同源序列法、突變體篩選法、差異篩選法等,這些方法各有其優(yōu)缺點,在克隆基因時應根據(jù)供體基因組大小、被克隆基因的特點、遺傳圖譜和物理圖譜的完備性等選擇使用,有時需要通過幾種方法的融合.對于小麥來說,由于其巨大的基因組進行基因克隆及驗證相當困難,因此,從事小麥分子生物學相關研究的學者們都在積極探索小麥基因克隆的快速有效方法.
隨著新一代測序儀的不斷普及與完善,包括EST序列在內(nèi)的DNA序列數(shù)據(jù)日益膨脹,這為進行基因的電子克隆提供了豐富的數(shù)據(jù).張德禮等[5]、黃新杰[6]等在電子克隆方面都做了大量富有成效的工作.本研究采用類似的方法進行了小麥Yr5基因的電子克隆,結果表明克隆到了Yr5基因的大片段,根據(jù)同源基因比較推測該電子拼接的基因N端缺少了約257個氨基酸,C端缺少了145個氨基酸.雖然沒有拼接到Yr5基因的全長,但本研究拿到了Yr5基因編碼蛋白的53.8%(469/871)的長度,這為進一步通過實驗手段克隆該基因奠定了良好基礎,也為探索小麥抗病基因快速克隆方法提供了一定參考.
[1] 曹必好,宋洪元,雷建軍.植物抗病基因研究進展[J].天津農(nóng)業(yè)科學,2001,7(4):13-15.
[2] 馬漸新.小麥抗條銹病基因定位及分子標記進展[J].生物技術通報,1999(1):1-6.
[3] 胡皝,蕭浪濤.生物信息學在新基因全長cDNA電子克隆中的應用[J].生物技術通報,2007(4):93-96.
[4] Han W L,Ding P G,Xu M X,et al.Identification of eight genes encoding chemokine-like factor superfamily members 1-8(CKLFSF1-8)byin silicocloning and experimental validation[J].Genomics,2003,81(6):609-617.
[5] 張德禮,孫曉靜,凌倫獎,等.人類SR蛋白超家族新成員-SFRS12(SRrp508)的基因克隆和特性分析[J].遺傳學報,2002,29(5):377-383.
[6] 黃新杰.三個小麥抗條銹病相關基因的全長cDNA克隆及生物信息學分析[D].楊凌:西北農(nóng)林科技大學,2007:6.
[7] Stephen F A,Thomas L M,Alejandro AS,et al.Gapped BLAST and PSI-BLAST:a new generation of protein database search programs[J].Nucleic Acids Research,1997,25(17):3389-3402.
[8] Stephen F A,John C W,Gertz E M,et al.Protein database searches using compositionally adjusted substitution matrices[J].FEBS Journal,2005,272(20):5101-5109.
[9] Marchler-Bauer A,Lu S,Anderson J B,et al.CDD:a Conserved Domain Database for the functional annotation of proteins[J].Nucleic Acids Research,2011,39:225-229.
[10] van der Biezen E A,Jones J D.The NB-ARC domain:a novel signaling motif shared by plant resistance gene products and regulators of cell death in animals[J].Current Biology,1998,8(7):226-227.