董 婧 逯曉萍,* 張坤明 薛春雷 張瑞霞
?
高丹草雜種及其親本轉錄組SNP及等位基因特異性表達分析
董 婧1逯曉萍1,*張坤明1薛春雷1張瑞霞2
1內蒙古農業(yè)大學農學院, 內蒙古呼和浩特 010019;2呼和浩特市種子管理站, 內蒙古呼和浩特 010020
為探究高丹草雜種及其親本間單核苷酸變異與其雜種優(yōu)勢形成的關系, 以高丹草雜種及其親本的根、莖和葉組織為試驗材料, 采用Illumina Hiseq 2000進行轉錄組測序。對平均長度達58 122 160 bp的各測序樣品序列信息進行檢測后, 均檢測到不少于58 000個SNP位點, 位于基因內的SNP個數(shù)顯著多于位于基因間的SNP個數(shù), SNP發(fā)生頻率為1/741 bp, 平均轉換顛換比為1.00∶1.53。在所有變異類型中, C/T和G/A發(fā)生頻率最高。經過篩選得到198 (21%)個極顯著偏向性等位基因表達偏向性SNP, 其中65%偏向父本白殼蘇丹草, 并且很多在白殼蘇丹草中具有高水平基因表達的轉錄本, 在高丹草雜種中的等位基因表達也偏向白殼蘇丹草。在3種組織中, 分別有79%、78%和82%轉錄本的2個親本等位基因表現(xiàn)出相對平衡的表達水平, 說明與順式作用相比, 反式作用可能更多地影響了等位基因的特異性表達。選擇6個極顯著偏向性等位基因表達偏向性SNP-unigene進行qRT-PCR驗證, 這些基因的差異基因表達模式與RNA-Seq分析結果一致。本研究采用Illumina 測序技術研究等位基因表達, 為高丹草雜種優(yōu)勢分析提供了依據(jù), 也為其他飼草作物的相關研究提供了理論參考。
高丹草; 雜種優(yōu)勢; 轉錄組; 單核苷酸多態(tài)性; 功能注釋
高粱()是一種古老的禾谷類作物, 具有抗旱、耐澇、耐鹽堿、適應性強等特點, 蘇丹草()是栽培最普遍的一年生禾本科牧草, 具有高度的適應性、很強的再生性和抗旱能力, 其莖葉品質優(yōu)良[1]。高丹草是高粱-蘇丹草雜交種的簡稱, 它結合了高粱和蘇丹草的優(yōu)點, 在畜牧業(yè)和漁業(yè)生產上具有廣闊的開發(fā)利用前景[2]。這種優(yōu)良的農藝性狀表現(xiàn)可能是由2個親本基因組互作造成的, 但是具體的遺傳機制尚不清楚。
雜交是自然界中普遍存在的現(xiàn)象, 不僅可以對物種形成、適應性進化和生態(tài)創(chuàng)新產生重要作用, 而且可能出現(xiàn)大量的等位基因變異[3-7]。有研究表明, 融合這些等位基因變異可能導致新的基因行為方式的出現(xiàn), 從而產生雜種優(yōu)勢[8-11]。但是, 以往對于雜種優(yōu)勢機理的研究只針對雜種及親本基因的表達水平, 而對雜種中不同親本等位基因差異表達的研究較少。
SNP (single nucleotide polymorphisms)是指在基因組上由單個核苷酸變異形成的遺傳標記, 其數(shù)量龐大[12]。通常雜交種中的等位基因特異性表達的研究方法有2種[13], 一是基于標記多態(tài)性, 利用已知基因組變異獲得高質量的等位基因表達結果[14-15]; 另外一種是利用SNP芯片同時獲得上萬個等位基因特異性表達位點[16-17]。然而, 這兩種方法都必須提前知道研究對象的基因組信息。隨著第二代高通量測序技術的發(fā)展, RNA-Seq技術逐漸被人們所熟悉并應用到等位基因特異性表達的研究中[18]。RNA-Seq技術無須預知研究對象的基因組信息并且分辨率能夠達到單堿基水平。應用這個方法能夠從全基因組水平無偏估計基因的調控, 而且能同時獲得轉錄豐度和等位基因表達偏向性的信息[19]。
本研究在高丹草遺傳圖譜構建、產量性狀QTL定位、雜種表現(xiàn)遺傳模型以及差異表達基因分析與蛋白質組學等[2,20-23]研究的基礎上, 比較和分析高丹草雜種中2個親本等位基因的特異性表達, 旨在了解雜交種中雙親等位基因的不同作用以及可能對雜種優(yōu)勢的貢獻, 進一步闡明高丹草雜種優(yōu)勢的分子機制, 為高丹草雜種的遺傳改良提供依據(jù)。
以高丹草雜種(11A×白殼蘇丹草)一代、母本高粱11A和父本白殼蘇丹草的根、莖、葉為試材, 設置3個生物學重復(表1)。在三葉期, 分別取高丹草雜種及其親本的根、莖、葉樣品, 立即投入液氮冷凍, 于-80℃保存?zhèn)溆谩?/p>
利用TRIzol法提取高丹草雜種及其親本各組織的總RNA, 構建高質量文庫后, 使用Illumina Hiseq 2000測序儀測序。由于高丹草和蘇丹草均尚未完成基因組測序, 所以使用親本之中已完成基因組測序的高粱基因組(ftp://ftp.jgi-psf.org/pub/compgen/phy-t- o-z-o-m-e/v9.0/early_release/Sbicolor_v2.1/)作為參考進行后續(xù)分析。利用TopHat 2[24]軟件在Clean Reads和高粱參考基因組之間比對。
表1 材料編號及名稱
在各樣品讀長與參考基因組序列的TopHat2軟件比對數(shù)據(jù)的基礎上, 利用GATK軟件尋找測序樣品與參考基因組間的單堿基錯配[25]。根據(jù)Nr注釋信息, 使用Blast 2 GO軟件[26]和WEGO (Web Gene Ont-o-l-o-gy Annotation Plot)軟件[27]得到unigene的GO (Gene Ontology)注釋信息和功能分類統(tǒng)計。利用蛋白數(shù)據(jù)庫KEGG (http://www.genome.jp/kegg/)進一步得到unigene的pathway注釋[28]。通過blastx (e-value<10–5)將包含SNP位點的unigene比對到COG數(shù)據(jù)庫, 從而獲得其COG分類注釋[29]。
本研究通過比較高丹草雜種及其親本3種組織所有同源基因測序讀長, 按照以下標準篩選單核苷酸多態(tài)性位點: (1)所有SNP位點須在高丹草及其親本3種組織測序的3個重復中均出現(xiàn); (2)為確保等位基因特異性表達數(shù)據(jù)的可靠程度, 各SNP位點至少有300條reads的支持。在某SNP位點, 兩親本reads中的堿基互不相同, 子代與親本之一堿基相同, 則認為高丹草雜種中存在等位基因表達偏向性。符合上述標準的SNPs用于后續(xù)分析。如果雜交種中2個親本等位基因對應的reads支持數(shù)的比值偏離1.0, 則認為雜交種中存在等位基因表達偏向性。采用卡方檢驗方法統(tǒng)計分析。
從極顯著偏向性等位基因表達偏向性SNP- unigene中選擇6個基因進行實時熒光定量PCR驗證分析, 使用 E.Z.N.A.Plant RNA Maxi Kit抽提RNA。根據(jù)基因序列, 使用Primer Quest Tool (http:// sg.idtdna.com/ Primerquest/Home/Index)設計引物。第1鏈反轉錄使用PrimeScrip RT reagent Kit with gDNA Eraser (Perfect Real Time)第1鏈合成試劑(RR047A)。熒光定量檢測使用abmEva Green qPCR Master Mix-No Dye試劑盒。PCR反應流程為95℃預變性1 min; 95℃變性10 s, 60℃退火30 s, 40個循環(huán)。以b-actin為內參, 使用2–ΔΔCt法分析表達量。
根據(jù)堿基替換的不同方式, 可以將SNP位點分為轉換(Transition)和顛換(Transversion) 2種類型; 根據(jù)SNP位點的等位(Allele)數(shù)目, 可以將位點分為純合型(只有一個等位)和雜合型(兩個或多個等位)[30]。計算高丹草雜種及其親本中的SNP位點數(shù)目、轉換類型、顛換類型比例和雜合型SNP位點比例, 統(tǒng)計結果見表2。
表2 SNP位點統(tǒng)計表
(續(xù)表2)
材料編號Material number總讀長Total readsSNP數(shù)SNP number基因內SNPGenic SNP基因間SNPIntergenic SNP轉換Transition (%)顛換Transversion (%)雜合型Heterozygosity (%) 1759 733 16095 72389 741598260.1739.8333.54 1872 158 58081 26775 641562660.3439.6629.79 1978 016 50895 20587 506769960.5039.5036.17 2053 568 21882 07977 412466760.4739.5330.25 2149 779 34273 90569 659424660.7539.2530.17 2259 151 35689 06882 884618460.3639.6438.21 2350 348 06675 27670 970430660.2339.7736.31 2451 025 42472 97868 695428360.4839.5236.28 2555 095 66881 94576 448549760.7539.2531.16 2657 676 61287 67382 696497760.3739.6331.16 2761 078 42478 86474 174469060.7439.2630.43
材料名稱及編號同上表1。
Name and number of the material are the same as there given in Table 1.
對平均長度達58 122 160 bp的序列, 各測序樣品中均檢測到不少于58 000個SNP位點, 位于基因內的SNP個數(shù)顯著多于位于基因間的SNP個數(shù)。高丹草雜種及其親本轉錄組SNP發(fā)生頻率為1/741 bp, 即平均每741 bp就有1個SNP位點出現(xiàn)。另外, 各樣品中轉換類型的SNP均占所有SNP數(shù)目的60%以上, 明顯多于顛換類型的SNP個數(shù), 平均轉換顛換比為1.00︰1.53 (表2)。
由圖1可知, 在所有12種單核苷酸變異類型中, 發(fā)生頻率最高的前4種分別是C/T、G/A、A/G和T/C, 均大于40 000個, 而其他8種單核苷酸變異C/G、G/C、C/A、G/T、T/G、A/C、A/T和T/A均在20 000以下。12種變異類型中以C/T類型頻率最高, 原因可能是CpG二核苷酸上甲基化的胞嘧啶殘基易脫去氨基而轉化成胸腺嘧啶[31]。
圖1 SNP類型統(tǒng)計
將SNP-unigene序列與GenBank中的非冗余蛋白數(shù)據(jù)庫Nr數(shù)據(jù)庫進行相似性比對。其中, 比對效率最高的有24 515條unigene (79.12%)與數(shù)據(jù)庫中已知的高粱基因同源; 3806條unigene (12.28%)與數(shù)據(jù)庫中已知的玉米基因組同源; 1435條unigene (4.63%)與數(shù)據(jù)庫中已知的谷子基因組同源(圖2)。
圖2 SNP-unigene Nr比對結果
括號內為該類型unigene數(shù)及其在所有unigene中所占比例。
Unigene number of this type and its proportion in all unigene are shown in parentheses.
能夠在COG中找到10 328條unigene相應的注釋信息, 共獲得15 799個COG功能注釋, 可分為24類(圖3中A~Z表示), 并對其進行數(shù)量統(tǒng)計。從分析統(tǒng)計結果可以看出, 這10 328條被注釋的unigene功能種類較為全面, 涉及大多數(shù)生命活動過程或功能?!耙话愎δ茴A測類”是最大的一個分類, 包含3099 (19.05%)個unigene。其次是“轉錄”、“復制、重組和修復”、“信號轉導機制”和“翻譯、核糖體結構和生物轉化”分別包含1521 (9.63%)、1430 (9.05%)、1309 (8.29%)和1099 (6.96%)條SNP-unigene?!昂私Y構”分類中包含2 (0.01%)條SNP-unigene, 數(shù)量最少(圖3)。
圖3 SNP-unigene COG比對結果
為了分析雜種中的等位基因特異性表達, 比較得到注釋的轉錄本外顯子區(qū)域的每個堿基并鑒定SNP, 經過篩選后, 將9308個SNP用于后續(xù)分析。在本研究中, 如果在一個轉錄本中同時存在多個SNP, 并且其中2個SNP的表達偏向性不同, 則將該轉錄本信息直接刪除。為了保證分析的準確性和可靠性, 本試驗只將表現(xiàn)極顯著偏向性(<0.01)的SNP用于后續(xù)分析。圖4所示是198個極顯著偏向性等位基因表達偏向性SNP在3種不同組織中的表達情況。
在親本基因差異表達對高丹草雜種中的等位基因特異性表達方式的影響分析中, 將父本白殼蘇丹草與母本高粱11A的基因表達比值命名為P1/P2, 高丹草雜種中的親本等位基因表達比值命名為F1/P2。結果表明, 很多在白殼蘇丹草中具有高水平基因表達的轉錄本, 在高丹草雜種中的等位基因表達也偏向白殼蘇丹草(圖5)。
圖4 等位基因表達偏向性SNP
在198個SNPs中, 根、莖、葉組織中分別有79個(涉及58個基因)、53個(涉及38個基因)和66個(涉及49個基因)單核苷酸多態(tài)性位點具有等位基因表達偏向性。其中, 有10個SNPs (涉及8個轉錄本)在根、莖、葉中均有表現(xiàn)(表3)。
圖5 高丹草雜種中等位基因表達偏向性
表3 10個等位基因表達偏向性SNPs
GO功能分析將Sobic.001G191200轉錄本定位到蔗糖響應機制(response to sucrose)、葡萄糖響應機制(response to glucose)、果糖響應機制(response to fructose)功能; Sobic.001G293800轉錄本定位到蛋白質磷酸化(protein phosphorylation)、ATP結合(ATP binding)、葉綠體(chloroplast)等32種功能; Sobic.002G215700轉錄本定位到干旱響應機制(response to desiccation)、醛脫氫酶活性(aldehyde dehydrogenase, NAD)、胞液(cytosol)等17種功能; Sobic.003G085700轉錄本定位到RNA加工(RNA processing)、基因表達調控 (regulation of gene expression)和核腔(nuclear lumen)等7種功能; Sobic.003G206800轉錄本定位到脂肪酸β氧化(fatty acid beta-oxidation )、激酶活性(kinase activity)等12種功能; Sobic.003G314500轉錄本定位到水解酶活性(hydrolase activity)、葉綠體被膜(chloroplast envelope )、有機物質代謝過程(organic substance metabolic process )等5種功能; Sobic.004G225100轉錄本定位到葉綠體(chloroplast)、吲哚乙酸生物合成過程(indoleacetic acid biosynthetic process )、氰化物代謝過程(cyanide metabolic process)等20種功能; Sobic.004G253000轉錄本定位到胞膜界小泡(cytoplasmic membrane-bounded vesicle)功能。
KEGG代謝通量分析發(fā)現(xiàn)Sobic.001G293800轉錄本參與b錄淀粉酶代謝通路; Sobic.002G215700轉錄本參與醛脫氫酶家族7成員A1代謝通路; Sobic. 004G225100轉錄本參與腈水解酶代謝通路; Sobic. 004G253000轉錄本參與FAM32A (A)蛋白代謝。
從198個等位基因表達偏向性SNPs中隨機選擇6個基因進行qRT-PCR驗證分析, 4個基因在3種組織中表現(xiàn)相同的偏向性, 2個基因在3種組織中表現(xiàn)不同的偏向性, 均與RNA-Seq分析結果一致(圖6)。
本研究表明, Illumina 雙端測序技術是同時分析雜交種中基因表達水平和等位基因表達方式的一個強有力工具, 為深入研究雜種優(yōu)勢的分子機制提供了有價值的信息。在高丹草雜種及其親本之間的SNP類型中, CT和GA為數(shù)量最多的類型。研究表明, 胞嘧啶甲基化可能是造成這種現(xiàn)象的原因[32], 發(fā)生甲基化的胞嘧啶比沒有發(fā)生甲基化的胞嘧啶突變頻率高, 而且甲基化的胞嘧啶發(fā)生脫氨基作用產生胸腺嘧啶T的頻率高于其他自發(fā)突變的頻率[33-35]。
本研究在根、莖和葉組織中的9308個等位基因表達偏向性一致的SNP中, 僅有198個存在極顯著的等位基因表達偏向性, 約占21%。He等[36]發(fā)現(xiàn)在日本晴93-11及其雜交種中有398 (22.7%)個存在顯著的等位基因表達偏向性。在玉米[37]和楊樹[38]的基因中, 分別有73%和57%的基因表現(xiàn)出等位基因表達偏向性。翟蓉蓉等[39]發(fā)現(xiàn)在超級稻協(xié)優(yōu)9308及其親本中有480 (17%)個存在顯著的等位基因表達偏向性。本研究中, 至少在一個組織存在等位基因表達偏向性的145個轉錄本中, 根、莖和葉分別有62% (36)、66% (26)和65% (32)的轉錄本的等位基因表達偏向白殼蘇丹草, 這些轉錄本編碼多種重要功能蛋白。在3種組織中, 與高粱11A的等位基因相比, 白殼蘇丹草的等位基因更能維持它們在高丹草雜種中的活性, 并且對雜種優(yōu)勢做出貢獻。白殼蘇丹草等位基因的功能多樣性也可能對高丹草雜種的優(yōu)良表型起作用。在上述145個轉錄本中, 49個轉錄本(約34%)的等位基因表達在不同組織表現(xiàn)出不同的偏向性, 說明雜交種中的等位基因表達具有組織特異性[38, 40]。
圖6 高丹草雜種及其親本3個組織中各基因表達量
順式作用元件或反式作用因子變異均可能引起等位基因的表達變異[41]。前者可能改變啟動子強度、增強子活性或轉錄穩(wěn)定性, 而后者可能影響結構、連接和轉錄因子[42]。順式和反式調控可以通過比較親本表達水平的比值和雜交種中親本等位基因特異性表達的比值來確定[38]。如果變異發(fā)生在順式作用元件, 那么親本表達水平的比值和雜交種中親本等位基因特異性表達的比值沒有差異。如果變異發(fā)生在反式作用因子, 由于雜交種中的兩個親本等位基因處于相同的亞細胞環(huán)境中, 雜交種中的雙親等位基因的表達沒有差異。本研究發(fā)現(xiàn), 在3種組織中,分別有79%和82%轉錄本的2個親本等位基因表現(xiàn)出穩(wěn)定的表達水平, 說明與順式作用相比, 反式作用可能更多地影響了等位基因的特異性表達, 這些涉及抗性或者其他重要代謝反應相關轉錄本的等位基因所受到的差異調控可能與高丹草雜種表現(xiàn)出的雜種優(yōu)勢有關。
共鑒定了9308個分布于整個基因組的高質量的SNP位點。Illumina測序技術是分析高丹草雜種中基因表達水平和等位基因表達方式的一個強有力工具, 為深入研究雜種優(yōu)勢形成的分子機制提供了有價值的信息。DNA甲基化現(xiàn)象可能存在于高丹草雜種及其親本中; 與母本高粱11A相比, 父本白殼蘇丹草的等位基因更能維持在高丹草雜種中的表達并對雜種優(yōu)勢形成產生影響; 根、莖和葉組織的高丹草雜種中親本等位基因具有不同的表達方式, 具有組織特異性; 高丹草雜種中親本等位基因的差異表達多數(shù)由反式作用因子調控。
[1] 詹秋文, 錢章強. 高粱與蘇丹草雜種優(yōu)勢利用的研究. 作物學報, 2004, 30: 73–77Zhan Q W, Qian Z Q. Research of Sorghum-Sudan grass of heterosis utilization., 2004, 30: 73–77 (in Chinese with English abstract)
[2] Lu X P, Yun J F, Gao C P. Quantitative trait loci analysis of economically important traits in′hybrid., 2011, 9: 81–90
[3] Arnold M L. Natural hybridization and the evolution of domesticated, pest and disease organisms., 2004, 13: 997–1007
[4] Hegarty M J, Hiscock S J. Hybrid speciation in plants: new insights from molecular studies., 2004, 165: 411–423
[5] Rieseberg L H. Hybrid origins of plant species., 1997, 28: 359–389
[6] Rieseberg L H, Raymond O, Rosenthal D M. Major ecological transitions in wild sunflowers facilitated by hybridization., 2003, 301: 1211–1216
[7] 曹廷杰, 謝菁忠, 吳秋紅, 陳永興, 王振忠, 趙虹, 王西成, 詹克瑟, 徐如強, 王際睿, 羅明成, 劉志勇. 河南省近年審定小麥品種基于系譜和SNP標記的遺傳多樣性分析. 作物學報, 2015, 41: 197–206 Cao Y J, Xie J Z, Wu Q H, Chen Y X, Wang Z H, Zhao H, Wang X C, Zhan K S, Xu R Q, Wang J R, Luo M C, Liu Z Y. Genetic diversity of registered wheat varieties in Henan province based on pedigree and single-nucleotide polymorphism., 2015, 41: 197–206 (in Chinese with English abstract)
[8] Birchler J A, Auger D L, Riddle N C. In search of the molecular basis of heterosis., 2003, 15: 2236–2239
[9] 曲存民, 盧坤, 劉水燕, 卜海東, 付福友, 王瑞, 徐新福, 李加納. 黃黑籽甘藍型油菜類黃酮途徑基因SNP位點檢測分析. 作物學報, 2014, 40: 1914–1924 Qu C M, Lu K, Liu S Y, Bu H D, Fu F Y, Wang R, Xu X F, Li J N. SNP detection and analysis of genes for flavonoid pathway in yellow-and black-seededL., 2014, 40: 1914–1924 (in Chinese with English abstract)
[10] Springer N M, Stupar R M. Allelic variation and heterosis in maize: How do two halves make more than a whole?, 2007, 17: 264–275
[11] Stupar R M, Spirnger N M. Cis-transcriptional variation in maize inbred lines B73 and Mo17 leads to additive expression patterns in the F1hybrid., 2006, 173: 2199–2210
[12] 許家磊. 基于甘薯徐781和徐薯18轉錄組測序的SNP標記開發(fā). 中國農業(yè)科學院碩士學位論文, 北京, 2015 Xu J L. Development of SNP Markers Based on Transcriptome Sequencing of Xu 781 and Xushu 18 in Sweetpotato,(L.) Lam. MS Thesis of Chinese Academy of Agricultural Sciences, Beijing, China, 2015 (in Chinese with English abstract)
[13] Pastinen T. Genome-wide allele-specific analysis: insights into regulatory variation., 2010, 11: 533–538
[14] 石璇, 王茹媛, 唐君, 李宗蕓, 羅永海. 利用簡化基因組技術分析甘薯種間單核苷酸多態(tài)性. 作物學報, 2016, 42: 641–647 Shi X, Wang R Y, Tang J, Li Z Y, Luo Y H. Analysis of interspecific SNPs in sweetpotato using a reduced-representation genotyping technology., 2016, 42: 641–647 (in Chinese with English abstract)
[15] 劉峰, 謝玲玲, 弭寶彬, 歐陽嫻, 茆振川, 鄒學校, 謝丙炎. 辣椒轉錄組SNP挖掘及多態(tài)性分析. 園藝學報, 2014, 41: 343–348 Liu F, Xie L L, Mi B B, Ouyang X, Mao Z C, Zou X X, Xie B Y. SNP mining in pepper transcriptome and the polymorphism analysis., 2014, 41: 343–348 (in Chinese with English abstract)
[16] Tirosh I, Reikhav S, Levy A A. A yeast hybrid provides insight into the evolution of gene expression., 2009, 324: 659–662
[17] Zhang X, Borevitz J O. Global analysis of allele-specific expression in Arabidopsis thaliana., 2009, 182: 943–954
[18] Zhai R, Feng Y, Wang H. Transcriptome analysis of rice root heterosis by RNA-Seq., 2013, 16: 19
[19] Zhang M, Li N, He W. Genome-wide screen of genes imprinted in sorghum endosperm, and the roles of allelic differential cytosine methylation., 2016, 85: 424–436
[20] 逯曉萍, 云錦鳳, 肖宇紅, 米福貴, 李美娜, 尹利. 高丹草(高粱×蘇丹草)產量及其構成因素的QTL分析. 華北農學報, 2007, 22(4): 80–85 Lu X P, Yun J F, Xiao Y H, Mi F G, Li M N, Yin L. QTL localization and analysis on yield and related factors of Sorghum×Sudan grass., 2007, 22(4): 80–85 (in Chinese with English abstract)
[21] 逯曉萍, 劉丹丹, 王樹彥, 米福貴, 韓平安, 呂二鎖. 高丹草遺傳效應與雜種表現(xiàn)預測模型. 作物學報, 2014, 40: 466–475 Lu X P, Liu D D, Wang S Y, Mi F G, Han P A, Lyu E S. Genetic effects and heterosis prediction model of×grass., 2014, 40: 466–475 (in Chinese with English abstract)
[22] 董婧, 逯曉萍, 米福貴, 王樹彥, 何麗君, 韓平安, 薛春雷, 叢夢露, 李俊偉. 高丹草雜種和親本葉片基因差異表達研究. 植物遺傳資源學報, 2016, 17: 738–747 Dong J, Lu X P, Mi F G, Wang S Y, He L J, Han P A, Xue C L, Cong M L, Li J W. Relationship between differential gene expression patterns in leaves of the hybrids and their parents of., 2016, 17: 738–747 (in Chinese with English abstract)
[23] Han P A, Lu X P, Mi F G, Dong J, Xue C L, Li J K, Han B, Zhang X Y. Proteomic analysis of heterosis in the leaves of Sorghum-Sudan grass hybrids., 2016, 48: 161–173
[24] Kim D, Pertea G, Trapnell C. TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions., 2013, 14: R36
[25] McKenna A, Hanna M, Banks E. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data., 2010, 20: 1297–1303
[26] Altschul S F, Madden T L, Zhang J. Gapped BLAST and PSI BLAST: a new generation of protein database search programs., 1997, 25: 3389–3402
[27] Ashburner M, Ball C A, Blake J A. Gene ontology: tool for the unification of biology., 2000, 25: 25–29
[28] Kanehisa M, Goto S, Kawashima S. The KEGG resource for deciphering the genome., 2004, 32: 277–280
[29] Tatusov R L, Galperin M Y, Natale D A. The COG database: a tool for genome scale analysis of protein functions and evolution., 2000, 28: 33–36
[30] 楊侃侃. 基于RNA-seq技術對西瓜果皮色澤差異表達基因的分析. 江西農業(yè)大學碩士學位論文, 江西南昌, 2015 Yang K K. Analysis of Genes Differentially Expressed in Watermelon Rind Color Based on RNA-seq. MS Thesis of Jiangxi Agricultural University, Nanchang, China, 2015 (in Chinese with English abstract)
[31] 杜瑋南, 孫紅霞, 方德福. 單核苷酸多態(tài)性的研究進展. 中國醫(yī)學科學院學報, 2000, 22: 392–394 Du W N, Sun H X, Fang D F. The research development of single nucleotide polymorphism., 2000, 22: 392–394 (in Chinese with English abstract)
[32] Bransteitter R, Pham P, Scharff M D. Activation-induced cytidine deaminase deaminates deoxycytidine on single-stranded DNA but requires the action of RNase., 2003, 100: 4102–4107
[33] Chodavarapu R K, Feng S, Ding B. Transcriptome and methylome interactions in rice hybrids., 2012, 109: 12040–12045
[34] Morgan H D, Dean W, Coker H A. Activation-induced cytidine deaminase deaminates 5-methylcytosine in DNA and is expressed in pluripotent tissues: implications for epigenetic reprogramming., 2004, 279: 52353–52360
[35] Yebra M J, Bhagwat A S. A cytosine methyltransferase converts 5-methylcytosine in DNA to thymine., 1995, 34: 14752–14757
[36] He G M, Zhu X P, Elling A A. Global epigenetic and transcriptional trends among two rice subspecies and their reciprocal hybrids., 2010, 22: 17–33
[37] Guo M, Rupe M A, Zinselmeier C. Allelic variation of gene expression in maize hybrids., 2004, 16: 1707–1716
[38] Zhuang Y, Adams K L. Extensive allelic variation in gene expression in populus F1hybrids., 2007, 177: 1987–1996
[39] 翟榮榮. 超級稻協(xié)優(yōu)9308根系雜種優(yōu)勢的轉錄組分析. 中國農業(yè)科學院博士學位論文, 北京, 2013 Zhai R R. Transcriptome Analysis of Root Heterosis in a Super Hybrid Rice Xieyou 9308 by RNA-Seq. PhD Dissertation of Chinese Academy of Agricultural Sciences, Beijing, China, 2013 (in Chinese with English abstract)
[40] Springer N M, Stupar R M. Allelic-specific expression patterns reveal biases and embryo-specific parent-of-origin effects in hybrid maize., 2007, 19: 2391–2402
[41] Wittkopp P J, Haerum B K, Clark A G. Evolutionary changes in cis and trans gene regulation., 2004, 430: 85–88
[42] Shen Y, Catchen J, Garcia T. Identification of transcriptome SNPs between Xiphophorus lines and species for assessing allele specific gene expression within F1interspecies hybrids., 2012, 155: 102–108
Analysis of SNP and Allele-specific Expression in Transcriptome of×and Their Parents
DONG Jing1, LU Xiao-Ping1,*, ZHANG Kun-Ming1, XUE Chun-Lei1, and ZHANG Rui-Xia2
1Agronomy College, Inner Mongolia Agricultural University, Huhhot 010019, Inner Mongolia, China;2Huhhot Seed Management Station, Huhhot 010020, Inner Mongolia, China
Taking root, stem and leaf tissues ofhybrids and their parents as test materials, Illumina Hiseq 2000 was used to analyze the transcriptome to explore the relationship between single nucleotide variation and heterosis in the hybrids ofand their parents. About 58 000 SNP loci were detected from the sequencing samples with an average length of 58 122 160 bp. The number of genic SNP was significantly more than that of intergenic SNP. The frequency of SNP was 1/741 bp, and the conversion ratio of the average conversion was 1.00:1.53. Among all the types of variation, C/T and G/A had the highest frequency. After screening, 198 (21%) extremely significant biased alleles were expressed in bias SNP, and 65% of them were biased towards paternal white shell, and many of the transcriptional copies with high level gene expression in the white shellwere also expressed in thehybrid. The two parental alleles with 79%, 78%, and 82% transcripts showed a stable level of expression in the three tissues. It is suggested that the trans-acting may affect the specific expression of the allele more than the-acting. Six highly-biased SNP-unigene alleles were selected for qRT-PCR validation. The differential gene expression pattern of these genes was consistent with that of RNA-Seq analysis. Illumina sequencing technology was used to study allelic expression in this study, provides a basis for heterosis analysis ofand also a theoretical reference for related studies of other forage crops.
; heterosis; transcriptomics; single nucleotide polymorphism; functional annotion
2017-12-21;
2018-07-20;
2018-07-25.
10.3724/SP.J.1006.2018.01809
通信作者(Corresponding author):逯曉萍, Email: lxp1960@163.com
Email: 984012971@qq.com
本研究由國家自然科學基金項目(31160302, 31460375)和呼和浩特市科技計劃項目(2012-重-計-8-2)資助。
This study was supported by the National Natural Science Foundation of China (31160302, 31460375) and the Science and Technology Plan Projects of Hohhot (2012-major-plans-8-2).
URL: http://kns.cnki.net/kcms/detail/11.1809.S.20180724.1631.006.html