吳丹萌 ,梁 丹 ,劉 丹 ,張 欣 ,胡子全 ,王志強(qiáng) ,梁 晨 ,劉一曉 ,潘萍萍 ,王從磊 ,袁卉馥 ,王建賀
(1.河北北方學(xué)院,河北 張家口 075000;2.天津市農(nóng)業(yè)科學(xué)院 農(nóng)作物研究所/天津市農(nóng)作物遺傳育種重點(diǎn)實(shí)驗(yàn)室,天津 300384;3.界首市農(nóng)業(yè)技術(shù)推廣中心,安徽 界首 236500;4.天津市寶坻區(qū)農(nóng)業(yè)發(fā)展服務(wù)中心,天津 301800;5.天津市農(nóng)業(yè)發(fā)展服務(wù)中心,天津 300061)
小麥?zhǔn)俏覈?guó)乃至世界的重要糧食作物[1-2]。隨著對(duì)小麥相關(guān)育種技術(shù)的研究不斷深入和小麥新品種選育及其配套栽培技術(shù)不斷應(yīng)用,我國(guó)乃至世界小麥單產(chǎn)已經(jīng)發(fā)展到較高的水平。但是,由于土壤條件及區(qū)域生態(tài)環(huán)境的影響,小麥生產(chǎn)水平存在地域之間及田塊之間的差異,存在超高產(chǎn)田的同時(shí),也存在中低產(chǎn)田,特別是土壤鹽漬化較重的地區(qū),小麥單產(chǎn)較低。近年隨著地下水不斷開(kāi)采,土壤次生鹽漬化程度也有不斷上升趨勢(shì),據(jù)統(tǒng)計(jì),目前有20%的耕地土壤鹽漬化或正在逐步鹽漬化,嚴(yán)重限制了小麥產(chǎn)量的進(jìn)一步提高,形成了大量的小麥中低產(chǎn)田[3]。
作物育種的實(shí)踐表明,育種上的突破性進(jìn)展在于關(guān)鍵性基因、關(guān)鍵材料的挖掘、研究與利用。如小麥山融3 號(hào)通過(guò)體細(xì)胞融合技術(shù),融入野生近緣種中的染色體片段,提高了其耐鹽性,在0.3%~0.5%的鹽漬化土壤種植,單產(chǎn)達(dá)到7 350 kg/hm2。目前,公認(rèn)的小麥耐鹽品種較少,耐鹽機(jī)制研究進(jìn)展緩慢。同時(shí),由于缺乏與鹽脅迫密切相關(guān)基因作用機(jī)制研究及分子標(biāo)記,嚴(yán)重制約了耐鹽小麥新品種的選育進(jìn)程,從而制約著小麥耐鹽性的進(jìn)一步提高。因此,挖掘小麥耐鹽基因,研究其在鹽脅迫下的信號(hào)通路,探明其耐鹽的分子機(jī)制,并挖掘優(yōu)異單倍型,開(kāi)發(fā)分子標(biāo)記,輔助耐鹽育種,對(duì)提升小麥耐鹽育種水平、進(jìn)一步培育耐鹽性突出的小麥新品種具有重要意義。
研究表明,耐鹽性是一個(gè)由多基因控制的農(nóng)藝性狀[4-7]。目前在擬南芥中明確SOS 信號(hào)轉(zhuǎn)導(dǎo)途徑與耐鹽性密切相關(guān)[8-10]。研究發(fā)現(xiàn),SOS 信號(hào)轉(zhuǎn)導(dǎo)途徑主要有2 個(gè)方面作用,一是維持細(xì)胞內(nèi)的離子穩(wěn)態(tài);二是清除鹽脅迫造成的自由基。目前在擬南芥SOS 信號(hào)轉(zhuǎn)導(dǎo)途徑上已經(jīng)發(fā)現(xiàn)6 個(gè)重要成員,分別是SOS1、SOS2(AtCIPK24)、SOS3(AtCBL4)、SOS4、SOS5 和SOS6,這6 個(gè)成員形成了SOS 途徑的主體網(wǎng)絡(luò)[8-10]。同時(shí),小麥中的蛋白磷酸酶信號(hào)轉(zhuǎn)導(dǎo)通路、油菜素內(nèi)酯信號(hào)通路、MAPK 信號(hào)通路上的部分基因均能受到鹽脅迫的響應(yīng),能夠提升轉(zhuǎn)基因材料的耐鹽性[3,11-14]。如異源三聚體蛋白磷酸酶的PP2A、PP2C 亞基均受到了鹽脅迫的影響。但是在漫長(zhǎng)的進(jìn)化過(guò)程中,植物形成了多種應(yīng)答鹽脅迫的信號(hào)系統(tǒng),仍然需要通過(guò)基因組、轉(zhuǎn)錄組、生物統(tǒng)計(jì)學(xué)進(jìn)行耐鹽基因的挖掘,為耐鹽分子育種提供豐富的優(yōu)異單倍型及分子標(biāo)記。
表觀遺傳修飾參與了植物對(duì)非生物脅迫的抵御過(guò)程,如DNA 的甲基化修飾、染色質(zhì)重塑以及長(zhǎng)鏈非編碼RNA 和小RNA 對(duì)下游靶基因的調(diào)控,從而影響植物對(duì)非生物脅迫的響應(yīng)。目前,典型的表觀修飾主要是DNA 的甲基化和組蛋白的乙?;?。細(xì)胞核中的染色體為高度濃縮狀態(tài),每146 bp 的雙鏈DNA 圍繞組蛋白形成核小體,再濃縮為染色質(zhì)[15]。其中,核小體為組蛋白八聚體,這些組蛋白由H2A、H2B、H3、H4 構(gòu)成[16]。組蛋白的編碼基因在真核生物中高度保守,控制著染色質(zhì)的結(jié)構(gòu),也影響基因的表達(dá)、修復(fù)等生物學(xué)功能。組蛋白通過(guò)表觀修飾,如組蛋白的甲基化、乙酰化參與基因的表達(dá)。目前關(guān)于組蛋白家族成員的數(shù)目、在染色體上的位置及在非生物脅迫中的作用報(bào)道相對(duì)較少。前人研究表明,家禽的組蛋白編碼基因約10 個(gè)拷貝,哺乳類動(dòng)物約20 個(gè)拷貝,而有的生物則有約上百個(gè)拷貝,如海膽中包含600 個(gè)組蛋白基因。說(shuō)明不同物種基因的拷貝數(shù)差異較大。而且組蛋白基因成簇存在,如人類的組蛋白編碼位點(diǎn)主要位于6 號(hào)染色體,少部分位于1 號(hào)染色體;小鼠的組蛋白編碼位點(diǎn)主要位于13 號(hào)染色體,少部分位于3 號(hào)染色體上。目前關(guān)于植物組蛋白編碼成員基因的數(shù)量及染色體分布研究的較少。
本研究通過(guò)鹽脅迫下轉(zhuǎn)錄組測(cè)序技術(shù),挖掘差異表達(dá)基因,重點(diǎn)關(guān)注組蛋白成員表達(dá)模式變化,最終挖掘到了一個(gè)編碼組蛋白的編碼基因His3.2,并在小麥中分離該基因。通過(guò)生物信息學(xué)分析,明確其保守結(jié)構(gòu)域,并分析小麥組蛋白全家族編碼基因在染色體組上的分布,明確其序列特征,通過(guò)reads 數(shù)目明確該基因在鹽脅迫的表達(dá)模式,初探其功能,并在小麥二倍體祖先種(AA/DD)、四倍體材料(BBAA)、六倍體栽培種(BBAADD)中分離序列,明確克隆序列的來(lái)源,通過(guò)重測(cè)序數(shù)據(jù)序列分析,初探該基因在不同材料中的變異情況,為探討利用該基因分離單倍型,開(kāi)發(fā)培育耐鹽小麥新品系的分子標(biāo)記奠定基礎(chǔ)。
所用小麥材料為:祖先種AA01(AA,二倍體,A基因組祖先種)、DD01(DD,二倍體,D 基因組祖先種)、DD02(DD,二倍體,D 基因組祖先種);四倍體小麥津硬8號(hào)(BBAA,四倍體)、kros(BBAA,四倍體);栽培小麥滄麥14(BBAADD,六倍體冬小麥)、滄6002(BBAADD,六倍體冬小麥)、以色列-1(BBAADD,六倍體冬小麥)、津農(nóng)6 號(hào)(BBAADD,六倍體冬小麥)、遼春10 號(hào)(BBAADD,六倍體春小麥)、津強(qiáng)7 號(hào)(BBAADD,六倍體春小麥),均由天津市農(nóng)業(yè)科學(xué)院農(nóng)作物研究所保藏。試驗(yàn)材料具有不同的冬、春性,地理來(lái)源不同,親緣關(guān)系較遠(yuǎn)且在耐鹽、抗旱、抗凍水培上存在較大差異,用于序列分析。
在12 h 光 照、12 h 黑暗、22oC 下培養(yǎng)小麥 幼苗至一心一葉期,一部分單株用于DNA 提取;另一部分進(jìn)行50 mmol/L NaCl 處理1 h,迅速取葉片及根系于2.0 mL 的離心管中,貯存于-80oC 超低溫冰箱中,用于提取RNA。
采用CTAB 法和多糖多酚植物總RNA 提取試劑盒(DP441)分別進(jìn)行DNA 和RNA 提取,采用thermo 的RevertAid Strand cDNA Sythesis Kit 進(jìn) 行cDNA 合成。DNA 提取后儲(chǔ)存-20oC 冰箱中,RNA 及cDNA 提取后儲(chǔ)存-80oC 冰箱中,待使用。
以50 mmol/L NaCl 轉(zhuǎn)錄組測(cè)序挖掘到的與鹽脅迫潛在相關(guān)的轉(zhuǎn)錄本為母序列(query sequence),利用Blastp 對(duì)A、D 基因組進(jìn)行序列比對(duì),找到小麥中His3.2完整序列信息;通過(guò)其上下游序列采用Primer premier 5.0 本地軟件設(shè)計(jì)克隆引物[17],引物如表1 所示。
表1 基因克隆引物Tab.1 Primer for gene cloning
編碼區(qū)及基因分離分別以cDNA 和DNA 為模板進(jìn)行,采用15 μL 體系進(jìn)行PCR 擴(kuò)增。所用高保真酶為TransStart?FastPfu DNA Polymerase(全式金,北京)。
將上述PCR 產(chǎn)物,采用1.2%的瓊脂糖進(jìn)行凝膠電泳,并對(duì)目的條帶進(jìn)行切膠回收,連接于Blunt載體中(全式金,北京),通過(guò)熱擊法轉(zhuǎn)入大腸桿菌Top10 中,挑取12 個(gè)單克隆進(jìn)行測(cè)序,獲取基因編碼區(qū)序列及基因組序列。
采用DNAman 軟件進(jìn)行核苷酸序列比對(duì);通過(guò)HMMER 網(wǎng)站(https://www.ebi.ac.uk/Tools/hmmer/)預(yù)測(cè)氨基酸結(jié)構(gòu)域,采用HMM 算法通過(guò)HMMER 軟件進(jìn)行全家族成員調(diào)取,并使用mapchart 進(jìn)行染色體定位可視化[18],使用TBtools進(jìn)行序列統(tǒng)計(jì)分析及可視化[19]。通過(guò)小麥基因組變異聯(lián)合數(shù)據(jù)庫(kù)(http://wheat-cau-edu-cn.vpn.cau.edu.cn:8118/WheatUnion/)進(jìn)行重測(cè)序數(shù)據(jù)的基因序列分析。
通過(guò)保守引物(Ta-4-F/Ta-3-R),在冬小麥津農(nóng)6 號(hào)(BBAADD)的cDNA 中進(jìn)行擴(kuò)增,并且連接到克隆載體上,隨機(jī)挑取12 個(gè)克隆進(jìn)行測(cè)序,結(jié)果表明,共分離到2 種核苷酸序列,其長(zhǎng)度均為411 bp,2 條序列存在9 個(gè)核苷酸的堿基差異(圖1);2 種核苷酸序列均編碼136 個(gè)氨基酸殘基,且氨基酸序列一致率為100%,即2 種序列編碼同樣的氨基酸序列。
圖1 小麥TaHis3.2 核苷酸序列比對(duì)Fig.1 Nucleotide sequence alignment of wheat TaHis3.2
經(jīng)過(guò)氨基酸保守結(jié)構(gòu)域分析發(fā)現(xiàn),該基因編碼的氨基酸僅包含一個(gè)結(jié)構(gòu)域,為Histon3 結(jié)構(gòu)域(Pfam:PF00125)(圖2)。
圖2 小麥TaHis3.2 結(jié)構(gòu)域Fig.2 Domain of TaHis3.2
為了進(jìn)一步研究該家族成員在小麥中的分布情況,明確家族成員數(shù)量及染色體分布,依據(jù)Histon 保守結(jié)構(gòu)域PF00125 進(jìn)行小麥組蛋白全家族成員調(diào)取,發(fā)現(xiàn)該家族存在398 個(gè)成員,在小麥的所有染色體上均有分布,且主要分布在染色體的兩端(圖3);研究表明,該家族成員在六倍體小麥的第1、6、7 同源群上分布較多,分別有70、90、77 個(gè)成員,在第2 同源群上分布最少,僅有17 個(gè)成員(圖4);編碼序列分析發(fā)現(xiàn),該家族成員由染色體上的57 390 bp 核苷酸編碼,最長(zhǎng)的編碼序列為482 bp,最短的編碼序列僅66 bp(表2)。說(shuō)明組蛋白家族成員眾多,可能存在功能分化及功能冗余。
表2 小麥組蛋白DNA 編碼序列特征Tab.2 Characteristics of the coding sequence of the wheat histone protein
圖3 小麥組蛋白家族成員在染色體上的分布Fig.3 The wheat chromosomal distribution of histone family members
圖4 小麥組蛋白家族成員在染色體上的分布數(shù)目Fig.4 The distribution number of histone family members of wheat on chromosomes
小麥TaHis3.2表達(dá)模式如圖5 所示。
圖5 小麥TaHis3.2 表達(dá)模式Fig.5 Expression pattern of TaHis3.2 in wheat
為了明確本研究克隆到的TaHis3.2基因表達(dá)是否具有組織特異性,是否受到鹽脅迫的影響,本研究具體分析了其表達(dá)模式,結(jié)果表明,自然狀態(tài)下,小麥TaHis3.2主要在根部表達(dá),葉片幾乎探測(cè)不到表達(dá),暗示該基因可能主要在根部行使相關(guān)功能;鹽脅迫處理下,根部表達(dá)受到抑制,葉片探測(cè)到的reads 較少(圖5),說(shuō)明該基因在小麥苗期主要在根部表達(dá),且鹽脅迫抑制該基因的表達(dá)。
通過(guò)設(shè)計(jì)基因組特異引物(Ta-2-F/Ta-1-R),并在二倍體(AA 和DD)、四倍體(BBAA)、六倍體(BBAADD)小麥材料中進(jìn)行擴(kuò)增。D 基因組特異引物在沒(méi)有D 基因組成分的材料中均無(wú)擴(kuò)增,僅在有D 基因組供體的材料中有擴(kuò)增(圖6)。同時(shí)在多種材料中擴(kuò)增該基因,基因區(qū)未發(fā)現(xiàn)核苷酸序列差異,說(shuō)明D 基因組在不同來(lái)源的材料中序列高度保守。
圖6 小麥TaHis3.2 基因D 基因組特異引物不同倍性材料擴(kuò)增Fig.6 Amplification of TaHis3.2 in genome D by different ploidy materials of specific primers
為了進(jìn)一步明確D 基因組上His3.2在自然界中的變異情況,探討該基因的保守性,本研究對(duì)667 份小麥重測(cè)序數(shù)據(jù)進(jìn)行分析,調(diào)取該基因的變異信息。發(fā)現(xiàn)在667 份來(lái)自不同地域的小麥材料中,該基因存在2 種單倍型,單倍型Ⅰ為主要的單倍型,單倍型Ⅱ包含的材料數(shù)目少于單倍型Ⅰ(圖7-A)。2 種單倍型在編碼區(qū)僅存在一個(gè)無(wú)義突變,并未導(dǎo)致氨基酸差異(圖7-B)。說(shuō)明His3.2 在進(jìn)化上高度保守,也暗示His3.2 具有重要功能,一旦發(fā)生氨基酸突變,可能導(dǎo)致植株無(wú)法正常生存。
圖7 小麥TaHis3.2 基因D 基因組單倍型Fig.7 Haplotype of TaHis3.2 in D genome
小麥作為重要的農(nóng)作物,耐鹽性水平影響小麥的廣適性,據(jù)統(tǒng)計(jì),京津冀區(qū)域中的濱海新區(qū)、寧河、寶坻、靜海、滄州、衡水、邢臺(tái)、唐山等地區(qū)含有大量的鹽漬化土壤,其面積達(dá)到京津冀總耕地面積的25%,提高這部分鹽漬化區(qū)域小麥單產(chǎn),成為京津冀區(qū)域小麥總產(chǎn)量進(jìn)一步提高的重要途徑。除栽培措施以外,培育篩選耐鹽性突出小麥新種質(zhì)也是小麥中低產(chǎn)田產(chǎn)量進(jìn)一步提升關(guān)鍵所在。通過(guò)耐鹽基因的克隆,挖掘優(yōu)異耐鹽單倍型,并開(kāi)發(fā)成標(biāo)記,能夠加速小麥耐鹽育種進(jìn)程,提升小麥耐鹽水平。因此,轉(zhuǎn)錄組測(cè)序技術(shù)、重測(cè)序技術(shù)被廣泛用于耐鹽基因的挖掘。
本研究通過(guò)鹽脅迫下轉(zhuǎn)錄組測(cè)序,結(jié)合小麥AA、DD 基因組祖先種供體烏拉爾圖小麥、粗山羊草的基因組測(cè)序數(shù)據(jù),挖掘到了一個(gè)受到鹽脅迫抑制的基因,經(jīng)過(guò)生物信息學(xué)分析,該基因含有一個(gè)典型的組蛋白保守結(jié)構(gòu)域,初步認(rèn)定該基因?yàn)榻M蛋白編碼基因TaHis3.2,在六倍體小麥中共分離到2 種編碼序列,其中一條序列來(lái)自于D 基因組,通過(guò)序列比對(duì)發(fā)現(xiàn),該基因在不同基因組上序列一致性較高,具有高度的保守性。前人研究表明,組蛋白為染色體上的重要基因,對(duì)維系染色體結(jié)構(gòu)具有重要意義[20-21]。因此,該基因的變異可能會(huì)嚴(yán)重影響染色體結(jié)構(gòu),從而影響DNA 的復(fù)制,最終影響生物體的各項(xiàng)生命進(jìn)程。
通過(guò)組蛋白保守結(jié)構(gòu)域(PF00125)在中國(guó)春基因組中調(diào)取該家族全部成員,發(fā)現(xiàn)在六倍體小麥中共存在398 個(gè)成員,且長(zhǎng)短不一。組蛋白在各條染色體上均有分布,在同一個(gè)同源群上分布接近。目前,發(fā)現(xiàn)組蛋白除了H2A、H2B、H3、H4 外,還有多 種 變 體[22-24],如H2AZ,當(dāng)DNA 雙 鏈 斷 裂 時(shí),H2AZ 可能通過(guò)改變核小體的穩(wěn)定性,與核小體重塑復(fù)合體部分冗余,并參與轉(zhuǎn)錄控制,從而維系染色體結(jié)構(gòu)的穩(wěn)定性,說(shuō)明組蛋白不同變體具有不同的作用,影響組蛋白修飾等[25-27]。同時(shí),染色體上的多個(gè)組蛋白可能具有功能的協(xié)同作用,如果1 個(gè)組蛋白基因發(fā)生突變,功能缺失,其余組蛋白編碼基因可繼續(xù)行使相關(guān)功能,確保生命體新陳代謝不受過(guò)多影響。另外,組蛋白編碼基因也可能是不同組蛋白在不同發(fā)育時(shí)期、不同組織中起到相關(guān)作用,如本研究中克隆的TaHis3.2主要在根部表達(dá),而在葉片中幾乎檢測(cè)不到。
鹽脅迫主要導(dǎo)致小麥發(fā)育遲緩,生長(zhǎng)緩慢,抽穗期晚于對(duì)照,株高、根長(zhǎng)都受到明顯抑制[28]。本研究發(fā)現(xiàn),組蛋白TaHis3.2的表達(dá)受到了鹽脅迫的抑制,表明鹽脅迫影響了組蛋白的表達(dá),可能影響了DNA 的復(fù)制,與鹽脅迫抑制植物生長(zhǎng)的現(xiàn)象相吻合。本研究克隆的TaHis3.2主要在根部表達(dá),在葉片幾乎探測(cè)不到表達(dá)水平,根系的發(fā)育情況與植物抵御非生物脅迫密切相關(guān),暗示該基因與逆境脅迫密切相關(guān)。
本研究設(shè)計(jì)了D 基因組特異性引物,在六倍體小麥中分離到D 基因組上的TaHis3.2-D基因序列,在親緣關(guān)系較遠(yuǎn)的小麥材料序列分析中發(fā)現(xiàn),TaHis3.2-D基因序列高度保守,并未發(fā)現(xiàn)序列差異。目前,由于D 基因的高度保守性,小麥大部分的單倍型主要發(fā)現(xiàn)于B、A 基因組,D 基因組由于變異較小,開(kāi)發(fā)的標(biāo)記也相對(duì)較少。同時(shí),已經(jīng)公布的基因組重測(cè)序數(shù)據(jù)中,也發(fā)現(xiàn)TaHis3.2-D在667 份來(lái)自于不同區(qū)域的材料中僅存在2 種單倍型,并且編碼同一種氨基酸。由于組蛋白基因功能的重要性[15],一旦發(fā)生變異,可能導(dǎo)致生物體的致死突變,因此,基因的變異頻率本身較少。
組蛋白雖然受到了鹽脅迫的抑制,但是該基因的D 基因組上未發(fā)現(xiàn)序列差異,因此,不適合在基因區(qū)開(kāi)發(fā)標(biāo)記進(jìn)行單倍型研究,用于小麥耐鹽分子育種。在今后的研究中,可以嘗試在該基因的D 基因組的啟動(dòng)子區(qū)域進(jìn)行SNP 的挖掘,同時(shí)設(shè)計(jì)基因組特異引物區(qū)分B、A、D 的表達(dá),明確哪條基因組上的基因與鹽脅迫最相關(guān)。同時(shí),利用B、A 基因組上該基因的編碼區(qū)及啟動(dòng)區(qū)進(jìn)行SNP 挖掘,開(kāi)發(fā)相關(guān)標(biāo)記。
本研究重點(diǎn)關(guān)注組蛋白編碼基因,利用同源克隆法從小麥中獲得組蛋白編碼基因His3.2,明確其蛋白序列特征TaHis3.2 包含PF00125 保守結(jié)構(gòu)域,通過(guò)HMMER 軟件進(jìn)行全家族調(diào)取,發(fā)現(xiàn)小麥中該家族共398 個(gè)成員,在各個(gè)染色體上均有分布,且主要分布在染色體的兩端。表達(dá)模式分析顯示,TaHis3.2 主要在根部表達(dá),鹽脅迫抑制該基因的表達(dá)。自然群體序列分析發(fā)現(xiàn),在D 基因組該基因高度保守,僅存在2 種單倍型。本研究為挖掘小麥耐鹽相關(guān)基因、開(kāi)發(fā)鹽脅迫下的分子標(biāo)記提供了新的思路。