國(guó)鈺環(huán),YAMAMOTO Naoki,彭正松,廖明莉,魏淑紅,吳一超,楊在君
(1.西華師范大學(xué) 生命科學(xué)學(xué)院,西南野生動(dòng)植物資源保護(hù)教育部重點(diǎn)實(shí)驗(yàn)室,四川 南充 637009;2.西昌學(xué)院 農(nóng)業(yè)科學(xué)學(xué)院,四川 西昌 615013)
小麥(TriticumaestivumL.)是全球最重要的谷類作物之一,為人類提供了大約20%的食物來源,在農(nóng)業(yè)生產(chǎn)中占有極其重要的地位。全世界小麥的總種植面積大約為2.2億 hm2,其中我國(guó)的種植面積為2 400萬 hm2[1-2],從種植面積來看,我國(guó)是世界上最大的小麥生產(chǎn)國(guó),但就其產(chǎn)量而言,我國(guó)的平均產(chǎn)量?jī)H有5 481 kg/hm2[3]。并且隨著經(jīng)濟(jì)的發(fā)展,我國(guó)的糧食安全還面臨著幾個(gè)重大的挑戰(zhàn),例如氣候變化、土壤流失、病蟲害問題等自然因素和人口數(shù)量的急劇增加以及多種因素共同影響下的可耕地面積的不斷縮減等人為因素,這些都是造成小麥產(chǎn)量供不應(yīng)求的原因。因此,為了滿足我國(guó)日益增長(zhǎng)的小麥需求,確保糧食安全,選育優(yōu)質(zhì)、高產(chǎn)、穩(wěn)產(chǎn)的小麥品種成為小麥育種的主要目標(biāo)之一[4]。提高小麥產(chǎn)量的策略主要有提高單位面積穗數(shù)、增加穗粒數(shù)、提高千粒質(zhì)量等,三雌蕊小麥(TP)就是通過提高穗粒數(shù),達(dá)到提高產(chǎn)量的目的。三雌蕊小麥(TP)是由Peng 等[5-6]對(duì)“三粒小麥”經(jīng)多年的改良培育所得,TP是由一對(duì)顯性核基因控制,與細(xì)胞質(zhì)遺傳無關(guān)。Yang等[7]已經(jīng)利用基因分型技術(shù)(GBS)構(gòu)建了小麥的高密度遺傳圖譜,并將控制小麥三雌蕊性狀的Pis1基因定位在SNP標(biāo)記M70與M71之間,與M70的距離為3.0 cM,與M71的距離為1.1 cM。
隨著DNA分子標(biāo)記技術(shù)的不斷成熟與發(fā)展,利用分子標(biāo)記進(jìn)行新品種的選育已代替?zhèn)鹘y(tǒng)育種方式成為一種比較前沿的方法。分子標(biāo)記的種類很多,如簡(jiǎn)單重復(fù)序列(SSR)、酶切擴(kuò)增多態(tài)性(CAPS)、限制性片段長(zhǎng)度多態(tài)性(RFLP)、隨機(jī)擴(kuò)增多態(tài)性DNA(RAPD)、單核苷酸多態(tài)性(SNP)和插入缺失標(biāo)記(InDel)等[8-11]。其中SNP/InDel作為一種新型的分子標(biāo)記技術(shù),相比于其他類型的分子標(biāo)記,有其本身特有的優(yōu)勢(shì)。InDel多態(tài)性是一種二等位基因遺傳標(biāo)記[12],可通過其表現(xiàn)形式分為以下5類:?jiǎn)螇A基對(duì)的插入/缺失;單一堿基的插入/缺失;重復(fù)單元為2~15堿基的多堿基對(duì)插入/缺失;轉(zhuǎn)座子插入/缺失;任意DNA序列的插入/缺失多態(tài)性。單核苷酸多態(tài)性(SNP)是指基因中單個(gè)堿基對(duì)發(fā)生替換、缺失或增添而引起的堿基序列改變,最終會(huì)導(dǎo)致DNA序列多態(tài)性。SNP標(biāo)記具有位點(diǎn)多、分布廣、易實(shí)現(xiàn)分析的多樣化、穩(wěn)定性較高、代表性強(qiáng)等特點(diǎn)。SNP標(biāo)記在小麥育種中主要用于構(gòu)建高密度的遺傳連鎖圖、分子標(biāo)記輔助育種、全基因組關(guān)聯(lián)分析和物種進(jìn)化等[13]。
本研究以三雌蕊近等基因系CM28TP與其輪回親本川麥28(CM28)為試驗(yàn)材料,利用轉(zhuǎn)錄組測(cè)序(RNA-Seq)技術(shù),對(duì)小麥幼穗的3個(gè)階段進(jìn)行測(cè)序,獲得小麥SNP/InDel標(biāo)記并進(jìn)行生物信息學(xué)分析,將3個(gè)階段共有的SNP/InDel位點(diǎn)所在的基因進(jìn)行GO注釋分析,獲得有重要價(jià)值的SNP/InDel分子標(biāo)記,為分子標(biāo)記輔助選擇育種和圖位克隆控制小麥三雌蕊性狀的Pis1基因奠定基礎(chǔ)。
本研究選用小麥三雌蕊近等基因系CM28TP與其輪回親本川麥28(CM28)為試驗(yàn)材料,CM28是由四川省農(nóng)業(yè)科學(xué)院作物研究所楊武云研究員提供。當(dāng)小麥進(jìn)入孕穗期后,采集長(zhǎng)度為0.2~0.5 cm,0.5~0.7 cm,0.7~1.0 cm 3個(gè)階段的小穗,浸入樣品保護(hù)劑Sample Protector(TaKaRa,中國(guó)大連),液氮速凍后,于-80 ℃冰箱中保存?zhèn)溆谩?/p>
由北京諾禾致源科技股份有限公司利用Illumina HiSeq PE150測(cè)序平臺(tái)對(duì)CM28TP和CM28的幼穗(幼穗長(zhǎng)度為0.2~0.5 cm,0.5~0.7 cm,0.7~1.0 cm 3個(gè)階段)進(jìn)行RNA-Seq測(cè)序,每個(gè)樣本測(cè)3個(gè)生物學(xué)重復(fù)。測(cè)序獲得的原始數(shù)據(jù)(Raw data)中包含少量帶有測(cè)序接頭或測(cè)序質(zhì)量較低的數(shù)據(jù)(reads)。為了保證數(shù)據(jù)分析的質(zhì)量及可靠性,需要對(duì)原始數(shù)據(jù)進(jìn)行過濾。主要包括去除帶接頭的reads、去除含N(N表示無法確定堿基信息)的reads、去除低質(zhì)量 reads(Qphred ≤20 的堿基數(shù)占整個(gè) read長(zhǎng)度的 50%以上的 reads),從而獲得高質(zhì)量序列(Clean reads)。同時(shí),對(duì)Clean data 進(jìn)行 Q20、Q30 和 GC 含量計(jì)算。后續(xù)所有分析均是基于Clean data進(jìn)行。以中國(guó)春基因組(IWGSC1.0,ftp://ftp.ensemblgenomes.org/pub/plants/release-48/fasta/triticum_aestivum/dna/)為參考基因組,利用HISAT2 v2.0.5對(duì)Clean reads進(jìn)行拼接。
使用 GATK(3.7)軟件對(duì)樣本轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行SNP和InDel位點(diǎn)分析,為了獲得準(zhǔn)確的SNP和InDel位點(diǎn)信息,分別比較了CM28和CM28TP在幼穗不同發(fā)育階段(幼穗長(zhǎng)度為0.2~0.5 cm,0.5~0.7 cm,0.7~1.0 cm)的SNP和InDel位點(diǎn),選擇在CM28和CM28TP 3個(gè)幼穗發(fā)育階段共有的SNP和InDel位點(diǎn)用于分析。利用SnpEff(4.3q)軟件對(duì)變異位點(diǎn)進(jìn)行注釋。利用agriGO[14](http://systemsbiology.cau.edu.cn/agriGOv2/index.php)對(duì)CM28和CM28TP 3個(gè)幼穗發(fā)育階段共有的SNP和InDel位點(diǎn)所在的基因進(jìn)行GO分類分析。
控制小麥三雌蕊性狀的Pis1基因位于2D染色體上,其物理位置為2D:580 226 867~601 216 125 bp[7,15]。因此,選擇Pis1基因所在物理區(qū)間附近的4個(gè)SNP位點(diǎn)進(jìn)行驗(yàn)證,利用Primer Premier 5.0 設(shè)計(jì)引物,SNP位點(diǎn)要盡量位于擴(kuò)增片段的中間,引物信息如表1所示。PCR反應(yīng)體系為25.0 μL,包括:2×TSINGKE Master Mix 12.5 μL;10 μmol/L的正向引物(F)和反向引物(R)各0.5 μL;模板DNA 2.0 μL;ddH2O 9.5 μL。PCR程序?yàn)椋?4 ℃預(yù)變性3 min;94 ℃變性30 s,52~60 ℃退火60 s(具體溫度根據(jù)引物而定),72 ℃延伸1 min,共35個(gè)循環(huán);最后72 ℃繼續(xù)延伸5 min。PCR擴(kuò)增結(jié)束后利用1%的瓊脂糖凝膠進(jìn)行檢測(cè),對(duì)PCR擴(kuò)增產(chǎn)物進(jìn)行回收純化之后,連接至PMD-19T載體上,將連接產(chǎn)物轉(zhuǎn)化至DH5α感受態(tài)細(xì)胞中,涂布于含有100 μg/mL氨芐青霉素的LB固體培養(yǎng)基上,37 ℃培養(yǎng)12~14 h,每個(gè)樣品挑選10個(gè)PCR檢測(cè)為陽性的克隆送至生工生物工程(上海)股份有限公司進(jìn)行菌液測(cè)序,利用Chromas 2.0和DNAMAN 7.0對(duì)測(cè)序結(jié)果進(jìn)行分析。
表1 位于Pis1定位區(qū)間附近的SNP標(biāo)記Tab.1 SNPs near the Pis1 location
為了在轉(zhuǎn)錄水平上挖掘三雌蕊小麥和單雌蕊小麥之間的SNP位點(diǎn),使用Illunina HiSeq PE150平臺(tái)對(duì)來自CM28TP和CM28的0.2~0.5 cm(階段1),0.5~0.7 cm(階段2),0.7~1.0 cm(階段3)的幼穗進(jìn)行了轉(zhuǎn)錄組測(cè)序分析。對(duì)每個(gè)樣品重復(fù)3次,測(cè)序讀取長(zhǎng)度為150 bp。在從原始reads中剔除接頭序列、低質(zhì)量reads和含有寡聚N的reads之后,平均Clean reads 為45 881 590.33,平均數(shù)據(jù)量為6.88 Gb,3個(gè)階段的平均GC含量差值較?。籕20均大于97%;Q30均大于94%(表2)。表明測(cè)序結(jié)果良好,可以進(jìn)行后續(xù)的SNP/InDel位點(diǎn)的數(shù)據(jù)挖掘與分析工作。
表2 RNA-Seq數(shù)據(jù)質(zhì)量評(píng)估Tab.2 RNA-Seq data quality assessment
對(duì)CM28和CM28TP幼穗3個(gè)階段的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行比較分析,幼穗長(zhǎng)度為0.2~0.5 cm的階段獲得SNP/InDel位點(diǎn)數(shù)共13 086個(gè),幼穗長(zhǎng)度為0.5~0.7 cm的階段獲得SNP/InDel位點(diǎn)數(shù)共11 001個(gè),幼穗長(zhǎng)度為0.7~1.0 cm的階段獲得SNP/InDel位點(diǎn)數(shù)共13 086個(gè),3個(gè)階段共有的SNP/InDel位點(diǎn)共5 310個(gè),SNP/InDel發(fā)生頻率為1/1 295 668,變異位點(diǎn)以SNP為主,共計(jì)5 024個(gè);InDel位點(diǎn)286個(gè),以2~10 bp的插入缺失為主。其中轉(zhuǎn)換和顛換分別占63.33%,31.28%,兩者的比值為2.02,286個(gè)變異位點(diǎn)超過2個(gè)核苷酸變異,約占5.39%(表3),轉(zhuǎn)換類型中A/G型最多,顛換類型中C/G型最多。286個(gè)InDel類型中,有152個(gè)插入,134個(gè)缺失。
表3 SNP/InDel類型統(tǒng)計(jì)Tab.3 SNP/InDel type statistics
5 310個(gè)SNP/InDel中有4 543個(gè)是屬于編碼蛋白,占比85.55%;11個(gè)假基因,占比0.21%;18個(gè)核仁小RNA,占比0.34%;3個(gè)小核RNA,占比0.06%;其中還包括了735不確定編碼類型的突變,占比13.84%(表4)。
表4 編碼類型Tab.4 Encoding types
對(duì)篩選所得的5 310個(gè)SNP/InDel變異位點(diǎn)利用SnpEff(4.3q)軟件預(yù)測(cè)其對(duì)編碼蛋白進(jìn)行功能性預(yù)測(cè)分析,將影響程度從高到低依次分為High、Moderate、Low和Modifier 4個(gè)等級(jí)。結(jié)果如圖1所示。High代表嚴(yán)重影響蛋白質(zhì)功能,共有36個(gè)(0.68%),Moderate代表中度影響蛋白質(zhì)功能,共有1 279個(gè)(24.09%),Low表示對(duì)蛋白質(zhì)功能的影響程度較低,共有1 849個(gè)(34.82%),Modifier表示與蛋白質(zhì)的功能無關(guān),共有2 146個(gè)(40.41%)。
對(duì)5 310個(gè)變異類型進(jìn)行統(tǒng)計(jì),結(jié)果如圖2所示,其中1 824個(gè)屬于同義突變,占比最高,達(dá)到了34.35%,1 221個(gè)錯(cuò)義突變,占比為22.99%,14個(gè)移碼突變,占比0.26%,分布在3′端非編碼區(qū)突變的位點(diǎn)747個(gè)(14.07%),分布在基因間隔區(qū)的位點(diǎn)735個(gè)(13.84%),分布在下游基因突變的位點(diǎn)252個(gè)(4.75%),分布在上游基因突變的位點(diǎn)182個(gè)(3.43%),另外還有一些占比較少的變異類型,如:43個(gè)內(nèi)含子突變位點(diǎn),30個(gè)保守框變異位點(diǎn),26個(gè)破壞框變異位點(diǎn),16個(gè)5′端過早起始密碼子增益突變位點(diǎn),6個(gè)終止增益變異位點(diǎn),6個(gè)終止缺失變異位點(diǎn),1個(gè)起始缺失變異位點(diǎn),1個(gè)剪切區(qū)突變位點(diǎn),19個(gè)SNPs位點(diǎn)被預(yù)測(cè)為鑒于2種變異類型之間。
5 310個(gè)SNP/InDel位點(diǎn)中有2 701個(gè)位于A基因組上,占比50.87%;1 912個(gè)位于B基因組上,占比36.01%;587個(gè)位于D基因組上,占比11.05%;110個(gè)SNP/InDel位點(diǎn)不能確定所在基因組,占比2.07%。其中分布在7A染色體上的SNP/InDel數(shù)是最多的,達(dá)到了774個(gè);分布在4D染色體上的數(shù)量是最少的,僅有25個(gè)(圖3)。
GO分析有助于理解基因背后所代表的生物學(xué)意義。利用agriGO對(duì)CM28和CM28TP 3個(gè)幼穗發(fā)育階段共有的SNP和InDel位點(diǎn)所在的基因進(jìn)行GO分類分析。結(jié)果顯示,5 310個(gè)SNP/InDel位點(diǎn)所在的基因主要分為3個(gè)大類和42個(gè)亞類(圖4),占比
最高的是生物學(xué)進(jìn)程,其次是細(xì)胞組分,最后是分子功能。生物學(xué)進(jìn)程分為20個(gè)小類,細(xì)胞進(jìn)程和代謝進(jìn)程的基因數(shù)目最多;細(xì)胞組分分為12個(gè)小類,細(xì)胞部分和細(xì)胞的基因數(shù)目最多;分子功能分為10個(gè)小類,催化活性和結(jié)合的基因數(shù)目最多。
從Pis1基因定位的物理區(qū)間附近選擇4個(gè)SNP位點(diǎn)進(jìn)行驗(yàn)證。這4個(gè)SNP位點(diǎn)分別命名為:T589505891C、G601219738A、A602512273G和T601058111C。其中T589505891C是2D染色體589505891位點(diǎn)由T突變?yōu)镃,G601219738A是2D染色體601219738位點(diǎn)由G突變?yōu)锳,A602512273G是2D染色體602512273位點(diǎn)由A突變?yōu)镚,T601058111C是2D染色體601058111位點(diǎn)由T突變?yōu)镃。經(jīng)過PCR擴(kuò)增和測(cè)序,發(fā)現(xiàn)這4個(gè)SNP位點(diǎn)在CM28和CM28TP中是真實(shí)存在的(圖5)。因此,這4個(gè)位點(diǎn)可用于后續(xù)Pis1基因的定位。
小麥?zhǔn)鞘澜缟献畛R姷氖秤霉任?,隨著世界人口的快速增長(zhǎng),小麥生產(chǎn)將在糧食安全和全球經(jīng)濟(jì)中發(fā)揮舉足輕重的作用。近年來,各種分子標(biāo)記被廣泛應(yīng)用于小麥研究,如:侯起嶺等[16]利用STS標(biāo)記、SSR標(biāo)記和KASP標(biāo)記等方法鑒定小麥光溫敏雄性不育系穗發(fā)芽抗性;朱靖環(huán)等[17]利用SSR標(biāo)記方法篩選小麥抗赤霉病優(yōu)異種質(zhì);魏廣輝等[18]利用SNP開發(fā)出的KASP標(biāo)記篩選高硒小麥。過去常用的其他分子遺傳標(biāo)記(SSR、CAPS、RFLP、RAPD)存在著開發(fā)成本高、重復(fù)性不好、數(shù)量有限等缺點(diǎn),而新發(fā)展起來的SNP/InDel標(biāo)記相對(duì)來說具有很多優(yōu)勢(shì),比如在基因組中分布廣、數(shù)量多、開發(fā)成本低、重復(fù)性好等,另外SNP/InDel 標(biāo)記可用于分子標(biāo)記輔助選擇育種(MAS)、基因型分型、種間親緣關(guān)系分析等[19]。SNP一般是指單個(gè)核苷酸的轉(zhuǎn)換、顛換、插入和缺失,其中轉(zhuǎn)換和顛換較為普遍,插入和缺失的情況較少;而InDel標(biāo)記本質(zhì)上是屬于長(zhǎng)度多態(tài)性標(biāo)記,是指基因組中脫氧核苷酸的插入或缺失。本研究通過對(duì)小麥三雌蕊近等基因系CM28TP及輪回親本CM28幼穗的3個(gè)階段進(jìn)行轉(zhuǎn)錄組測(cè)序,共挖掘出SNP/InDel位點(diǎn)5 310個(gè),SNP/InDel發(fā)生頻率為1/1 295 668,遠(yuǎn)低于其他物種。導(dǎo)致SNP/InDel發(fā)生頻率低主要有以下兩方面的原因:首先,本研究分析的是CM28TP和CM28小穗發(fā)育的3個(gè)階段共有的SNP/InDel位點(diǎn),有效地去除了假陽性位點(diǎn),后續(xù)在Pis1基因的定位區(qū)間附近選擇了4個(gè)位點(diǎn)進(jìn)行驗(yàn)證,也證實(shí)這4個(gè)位點(diǎn)在CM28TP和CM28中真實(shí)存在。這也進(jìn)一步佐證了挖掘出的5 310個(gè)SNP/InDel位點(diǎn)的準(zhǔn)確性。其次,CM28TP和CM28為近等基因系,其遺傳差異本身較小[20]。
在5 310個(gè)SNP/InDel位點(diǎn)中堿基變異類型主要為C/T、A/G,以轉(zhuǎn)換為主,轉(zhuǎn)換和顛換的比值為2.02,遠(yuǎn)大于理論值0.5。生物中SNP位點(diǎn)堿基變異的轉(zhuǎn)換和顛換的比值往往會(huì)大于理論值0.5,這種現(xiàn)象稱為“轉(zhuǎn)換偏差”[21]。王妍等[22]對(duì)向日葵銹菌的轉(zhuǎn)錄組數(shù)據(jù)分析結(jié)果中,轉(zhuǎn)換發(fā)生的頻率是65.40%,顛換發(fā)生的頻率為34.60%;陳姝欣等[23]對(duì)于人參果轉(zhuǎn)錄組測(cè)序結(jié)果中,轉(zhuǎn)換類型發(fā)生的頻率為61.10%,顛換類型發(fā)生的頻率為38.27%;張雨等[24]對(duì)山茛菪轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,結(jié)果顯示,轉(zhuǎn)換類型占64.26%,顛換類型占35.74%。這一現(xiàn)象說明,SNPs/InDels位點(diǎn)的堿基突變可能會(huì)受環(huán)境等其他因素的影響,并不是隨機(jī)發(fā)生的。在自然選擇過程中,轉(zhuǎn)換突變?cè)诘鞍拙幋a序列中會(huì)產(chǎn)生同義突變,因此,通常情況下SNP的轉(zhuǎn)換類型出現(xiàn)頻率都高于顛換類型。從SNP/InDel位點(diǎn)在染色體上的分布來看,A基因組上的位點(diǎn)最多,達(dá)到50.87%,其次是B基因組,為36.01%,D基因組上的位點(diǎn)最少,僅11.05%。這可能與D染色體組在進(jìn)化上比較保守有關(guān)[25-26]。
經(jīng)過GO分類注釋,5 310個(gè)SNP/InDel位點(diǎn)所在的基因主要分為3個(gè)大類和42個(gè)亞類,其中細(xì)胞進(jìn)程、代謝進(jìn)程、細(xì)胞成分、細(xì)胞、催化活性和結(jié)合這幾個(gè)亞類所包含的基因最多。這些亞類中所包含的基因可能在植物生長(zhǎng)發(fā)育中發(fā)揮了重要的功能,但這些基因在小麥三雌蕊性狀發(fā)育中的作用還有待進(jìn)一步研究。本研究從Pis1基因定位區(qū)間附近挖掘出4個(gè)SNP位點(diǎn),經(jīng)過PCR擴(kuò)增和測(cè)序驗(yàn)證,這4個(gè)位點(diǎn)與RNA-Seq結(jié)果一致,下一步將在CM28×CM28TP的重組自交系(RILs)群體中驗(yàn)證這4個(gè)SNP位點(diǎn),并計(jì)算其與Pis1基因之間的遺傳距離,進(jìn)一步精細(xì)定位Pis1基因。
近幾年來,SNP標(biāo)記在小麥的遺傳育種工作中受到了廣泛的關(guān)注,SNP標(biāo)記與第一、二代標(biāo)記相比,具有位點(diǎn)多、分布廣、穩(wěn)定性高和代表性強(qiáng)等特點(diǎn),所以具有更大的使用價(jià)值和發(fā)展空間。在小麥的遺傳育種工作中,將SNP用于高密度遺傳連鎖圖譜的構(gòu)建,更有利于基因的精細(xì)定位,從而為小麥的基因組分析、表型變異研究以及物種資源鑒定提供新途徑;其次,將SNP標(biāo)記技術(shù)作為選擇育種的輔助手段,將極大地提高育種的可預(yù)測(cè)性和選擇性,從而使新品種選育的判斷更具有客觀性;除此之外,通過分析小麥基因中存在的SNP,可以了解其物種進(jìn)化過程中在基因組水平上的DNA多態(tài)性,從而分析出不同小麥群體的結(jié)構(gòu)分類、遺傳多樣性或者群體分化等特點(diǎn)。簡(jiǎn)言之,SNP標(biāo)記技術(shù)將有利于小麥遺傳育種工作的進(jìn)行,是小麥農(nóng)藝性狀研究的一大助力[13]。