楊 淵,黃明進(jìn)*,王大昌,阮寶麗,楊秋悅,楊 洋,羅影子,覃玉強(qiáng)
(1.貴州大學(xué)農(nóng)學(xué)院,貴州大學(xué)石斛研究院,貴州省藥用植物繁育與種植重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550025;2.貴州創(chuàng)禾源農(nóng)業(yè)科技有限公司,貴州 貴陽 550025)
白及為蘭科白及屬植物,具收斂止血、消腫生肌的功效[1]。我國產(chǎn)有黃花白及、小白及、華白及、白及[2]。近年來白及的研究逐漸增多[3-7],但由于缺乏基因組序列研究數(shù)據(jù),白及的分子生物學(xué)研究水平進(jìn)展緩慢。白及的細(xì)胞遺傳學(xué)研究主要集中在染色體水平上,研究發(fā)現(xiàn)白及的染色體為二倍體,其中核型類型有中部(m)、近中部(sm) 和近端 (st) 著絲點(diǎn),染色體核型有2B 和2C兩種[8-9]。
隨著二代Illumina 高通量測序技術(shù)不斷的發(fā)展,大量藥用植物的全基因組測序也隨之開展,基因組組裝也由scaffold、contig 及染色體水平發(fā)展到目前的端粒到端粒(T2T) 的0 gap 水平[10-11]。在對某個(gè)物種進(jìn)行denovo 基因組測序之前,對于沒有參考基因組的物種,通常會(huì)對該物種基因組大小,雜合度等信息進(jìn)行預(yù)估,根據(jù)基因組大小及復(fù)雜度來判斷測序數(shù)據(jù)的深度,組裝基因組的難易程度等,從而制定相應(yīng)的測序和分析策略,一般可通過細(xì)胞遺傳學(xué)[12-13]和基因組survey 測序與K-mer 分析2 種方式[14-15]獲取該物種的染色體核型、基因組大小、復(fù)雜度及重復(fù)序列比例等信息。本研究以白及為材料,嘗試采用上述測序技術(shù)對白及進(jìn)行細(xì)胞學(xué)分析與基因組測序,以期為白及后續(xù)精細(xì)圖階段的文庫構(gòu)建及全基因組de novo 測序策略奠定基礎(chǔ),同時(shí)也為白及分子生物研究的研究提供依據(jù)。
1.1 藥材 白及采自貴州大學(xué)農(nóng)學(xué)院石斛研究院白及資源苗圃,經(jīng)貴州大學(xué)趙財(cái)副教授鑒定為藥用植物白及Bletillastriata(Thunb.) Reichb.f.的干燥塊莖。
1.2 試劑 檸檬酸鈉 (批號D223BA0020)、MgCl2·6H2O (批號20191114)、碘化丙啶(批號550825)、無水乙醇(批號20220406)、MOPS (批號 0670200911)、RNAase ( 批號 20200318)、Triton X-100 (批號0694070511)、EDTA-2Na (批號20200303),由貴州創(chuàng)禾源農(nóng)業(yè)科技有限公司提供。
1.3 儀器 BD FACSCalibur 流式細(xì)胞儀(美國BD 公司); 5810R 離心機(jī)(德國Eppendorf 公司);PT-3502C 酶標(biāo)儀(北京普天新橋技術(shù)有限公司);DYY-6C 電泳儀、DYCZ-22A 水平電泳槽、DYCZ-24A 垂直電泳槽(北京六一生物科技有限公司);制冰機(jī) (日本SANYO 公司); C1000TMPCR 儀、Chemi DocTM凝膠成像系統(tǒng)(美國Bio-Rad 公司)。
2.1 染色體核型檢測 以白及成熟種子作為外植體經(jīng)組織培養(yǎng)5 個(gè)月后,取組培苗根尖作為供試樣品。將裝有根尖的離心管放置于充氣罐內(nèi),充入0.9~1.0 MPa N2O,靜置處理2 h,將90%預(yù)冷冰乙酸加入離心管內(nèi),靜置處理10 min。完成固定后,將冰乙酸吸出,ddH2O 進(jìn)行2 次清洗。用刀片將根的根尖白色部分切下,放入裝有25 μL 酶液的0.5 mL 離心管中,在37 ℃水浴條件下酶解1 h。酶解結(jié)束后,用70%乙醇將根尖清洗3 次,并用解剖針將根尖在剩余酒精中充分破碎和振蕩,4 000 r/min 離心,將細(xì)胞離心至管底后,晾干。根據(jù)根尖數(shù)量,在離心管內(nèi)加入25 ~45 μL 冰乙酸,離心,充分振蕩混勻。將載玻片放置在預(yù)先濕潤的盒子中,室溫保持在23 ℃左右,吸取8 μL 細(xì)胞懸浮液滴于載玻片正中間,立即蓋上蓋子,直到細(xì)胞散開,載玻片晾干后取出。將染色體標(biāo)本在顯微鏡下進(jìn)行觀察,采用雙色熒光原位雜交(FISH) 探針制備,使端粒與rDNA 原位雜交,并在高分辨率的熒光顯微鏡CCD 下拍照,進(jìn)行染色體核型的精準(zhǔn)分析。
2.2 流式細(xì)胞檢測基因組大小 白及塊莖上萌發(fā)1 個(gè)月的嫩芽,經(jīng)液氮-80 ℃速凍后保存?zhèn)溆谩H∧垩恐妙A(yù)冷的mGb 解離液經(jīng)刀片切碎,靜置10 min,過濾得細(xì)胞核懸浮液,加預(yù)冷PI 和RNAase置冰上避光染色0.5 ~1 h,CPI、CRNAase分別為50 μg/mL[16-17]。以番茄種子萌發(fā)后1 個(gè)月長出的嫩葉為內(nèi)參,在488 nm 波長處藍(lán)光激發(fā)檢測熒光強(qiáng)度,每次檢測收集10 000 個(gè)顆粒。變異系數(shù)小于5%。
2.3 Survey 分析白及基因組大小 植物白及嫩芽采集后用液氮速凍后使用提取試劑盒Qubit?dsDNA BRassay Kit 進(jìn)行提取,檢測基因組DNA 濃度、純度、完整性。檢測參數(shù)為膠濃度1%; 電壓150 V; 電泳時(shí)間40 min; 以M1λ-Hind Ⅲdigest,M2 D2000 作為Marker。基因測序與K-mer 分析委托深圳華大基因科技有限公司進(jìn)行Ilumina 雙端測序。公式為基因組大?。娇倝A基數(shù)/平均測序深度=總K-mer 數(shù)/平均K-mer 深度。
3.1 白及染色體核型分析 白及染色體用DAPI熒光染色通常呈藍(lán)色熒光,選取染色體形態(tài)清晰、染色程度適中、并分散良好分裂相,通過對不同分裂相觀察(圖1) 初步確定均白及染色體數(shù)目為32 條。利用端粒重復(fù)序列探針對染色體雙色進(jìn)行熒光原位雜交,被染色的端粒在熒光顯微鏡下呈綠色。由圖2 可知,以兩端都有端粒為一條染色體,白及染色體長度在1.0 ~4.5 μm 之間,根據(jù)Levan等[18]的染色體分類方法及Stebbins[19]核型分類的標(biāo)準(zhǔn)分類方法,白及主要為近中部(sm) 或近端部(st) 著絲粒染色體,基因組較小,核型類型為2C。白及18S rDNA 和5S rDNA 在染色體上的定位分析,由于染色體被染成藍(lán)色,經(jīng)Fluorescein-12-dUTP 標(biāo)記的18S rDNA 探針與染色體結(jié)合后,在顯微鏡下呈現(xiàn)綠色熒光,而經(jīng)Texas-Red-5-dUTP標(biāo)記5 SrDNA 在顯微鏡下呈現(xiàn)紅色熒光。由圖3 可知,5S rDNA 在2 條染色體上有顯示較強(qiáng)的紅色熒光雜交信號,18S rDNA 在2 條染色體顯示較強(qiáng)的綠色熒光雜交信號; 根據(jù)染色體長度、形狀等特征將其進(jìn)行同源染色體配對,其中5S rDNA 分布在13 號2 個(gè)同源染色體的間隙,18S rDNA 分布在2號色體短臂的核仁組織區(qū)。同時(shí)也證實(shí)了白及染色體為二倍體。
圖2 白及染色體端粒FISH 結(jié)果Fig.2 FISH results of telomere of Bletillae Rhizoma chromosome
圖3 白及染色體的rDNA FISH 結(jié)果Fig.3 The rDNA FISH results of Bletillae Rhizoma chromosomes
3.2 白及基因組大小檢測
3.2.1 流式細(xì)胞檢測白及基因組大小 番茄是茄科的模式植物,其全基因組大小為900 Mbp。本研究以番茄為對照,估算白及基因組的大小。由圖4可知,粒子團(tuán)明確、清晰且集中,表明該實(shí)驗(yàn)條件下樣品可良好區(qū)分。結(jié)果發(fā)現(xiàn),內(nèi)參番茄峰的熒光值為18.89,白及峰的熒光值為50.78,根據(jù)待測物種C 值計(jì)算公式為白及C 值=番茄DNA 含量×白及的熒光強(qiáng)度/番茄樣品的熒光強(qiáng)度,測得白及的基因組大小為2.37 Gb,是番茄的2.69 倍。
圖4 白及C 值流式細(xì)胞分析圖Fig.4 C value of Bletillae Rhizoma by flow cytometry analysis
3.2.2 白及基因組Survey 測序與K-mer 分析 采集樣品為白及嫩芽,通過試劑盒提取DNA 經(jīng)瓊脂糖凝膠電泳檢測得電泳圖譜(圖5)。電泳圖譜主帶清晰,無降解、輕度蛋白質(zhì)污染,且測得DNA總量為1.518 μg,總體積為60 μL,濃度CDNA為25.3 ng/μL,根據(jù)《DNA 測序樣品質(zhì)量標(biāo)準(zhǔn)》,白及DNA 樣品質(zhì)量滿足建庫測序要求,且建庫成功率約為97.40%。
圖5 白及DNA 電泳圖譜Fig.5 DNA electrophoregram of Bletillae Rhizoma
基因組利用由華大基因在Illumina 兩端進(jìn)行雙端測序(PE =150) 得出61.06 Gb 原始數(shù)據(jù),使用SOAPnuke (V 1.6.5) 軟件對原始數(shù)據(jù)進(jìn)行過濾,過濾掉低質(zhì)量、存在接頭污染和重復(fù)的數(shù)據(jù),得到有效數(shù)據(jù)共60.1 1Gb,公式為有效數(shù)據(jù)比例=(有效數(shù)據(jù)/原始數(shù)據(jù)) ×100%,有效數(shù)據(jù)比例越大,表明文庫質(zhì)量越好。白及的有效數(shù)據(jù)比例約為98.42%,表明白及的基因組DNA 測序質(zhì)量較優(yōu),測序結(jié)果整體的可信度高。
基于K-mer 分析原理,選取17~31 K-mer 進(jìn)行分析。通過GenomeScope 軟件對17 ~31 K-mer 的頻譜進(jìn)行擬合,構(gòu)建k=19 的K-mer 分布圖(圖6),進(jìn)行基因組大小、重復(fù)序列比率和雜合率的評估。
圖6 19-K-mer 分布曲線Fig.6 19-K-mer distribution curve
圖6 中,藍(lán)色柱子是K-mer 的觀測值; 橙紅色擬合線部分對應(yīng)著深度過低的K-mer,這些K-mer被認(rèn)為是測序錯(cuò)誤引入的; 黑色擬合線是除去被認(rèn)為是錯(cuò)誤的部分(橙紅色擬合線部分) 之后剩下的所有K-mer,這些被認(rèn)為是可靠的K-mer 數(shù)據(jù);黃色擬合線被認(rèn)為來自基因組非重復(fù)區(qū)域的K-mer分布; 垂直的黑色虛線為預(yù)測最低深度峰的整數(shù)倍覆蓋度。經(jīng)擬合后發(fā)現(xiàn),19-K-mer 分布曲線為非正常泊松分布,呈現(xiàn)雙峰分布,在10 和19 處各有一個(gè)峰,估測白及的為二倍體。平均K-mer 深度即主峰對應(yīng)的K-mer 深度為19,在主峰的前面期望深度的1/2 位置處有明顯的雜合峰,說明該基因組有一定雜合度的雜合度,即深度出現(xiàn)在10 附近的K-mer 序列為雜合序列,經(jīng)過Genomescope 軟件進(jìn)行雜合度分析,得到白及基因組的雜合率約為1.099%。K-mer 深度出現(xiàn)在主峰對應(yīng)深度2 倍以上的序列為重復(fù)序列,即深度大于40 的K-mer 序列為重復(fù)序列,重復(fù)序列約占67.45%從測序數(shù)據(jù)中得得到K-mer 數(shù)為59 981 133 228 個(gè),去除深度異常的K-mer 后得到25 277 266 個(gè)。根據(jù)K-mer 深度信息,基因組大?。娇侹-mer 數(shù)目/平均K-mer深度。估計(jì)基因組大小約為2.53 Gb,有效測序深度為23.73。
通過對調(diào)研圖文庫測序數(shù)據(jù)分析,該物種基因組的GC 含量(DNA 中鳥嘌呤和胞嘧啶所占比例)約為36.1%,較為適中,即白及的GC 分布無明顯偏向性,不會(huì)影響調(diào)研圖分析的準(zhǔn)確性,調(diào)研圖結(jié)果可靠。
本研究發(fā)現(xiàn)白及為二倍體,染色體數(shù)目32 條,染色體類型主要為sm 和st 型,這前人的研究結(jié)果大致相同[8-9]。從核型上看,白及的核型為2C 型,根據(jù)Stebbins[19]對染色體核型分類1A ~4D 中,2C型相對其他已發(fā)現(xiàn)的2B 型白及種質(zhì)資源進(jìn)化程度較高。而相同倍性的不同白及種質(zhì)資源在核型分類上存在差異,其原因可能是由于不同種質(zhì)資源為適應(yīng)不同生長環(huán)境而引起的進(jìn)化或?qū)嶒?yàn)等因素而引起的。
高等植物有45S rDNA 和5S rDNA 兩類[20]。18S rDNA 是45S rDNA 的一種,其定位位點(diǎn)主要在染色體的次縊痕部位,與隨體相連,一般認(rèn)為物種45S rDNA 的染色體雜交位點(diǎn)數(shù)與隨體數(shù)相同[21],而5S rDNA 通常有位于染色體末端和同源染色體間隙兩種位點(diǎn)[22]。研究發(fā)現(xiàn),白及在5S rDNA 和18S rDNA 各有1 對位點(diǎn),分別位于同源染色體間隙和染色體斷臂末端,因此認(rèn)為白及染色體存在2個(gè)隨體,且45S rDNA 和5S rDNA 在白及染色體上不存在共定位現(xiàn)象。本研究獲得了白及基于5S rDNA 和18S rDNA 熒光原位雜交核型與同源染色體上的2 個(gè)隨體,可作為白及染色體識別的有效標(biāo)志。
流式細(xì)胞測定結(jié)果依賴于內(nèi)參物種準(zhǔn)確性,且難以預(yù)判物種復(fù)雜程度; Survey 分析則受到會(huì)受數(shù)據(jù)質(zhì)量、軟件及參數(shù)設(shè)置等測序過程影響。因此在預(yù)估基因組大小時(shí)往往會(huì)結(jié)合進(jìn)行判斷,可將物種大小定位在一定的范圍內(nèi),現(xiàn)已用于地黃[23]、黃芪[24]等藥用植物的基因組估測。本研究以流式細(xì)胞術(shù)與Survey 分析相結(jié)合,估測白及的基因組大小范圍在2.37~2.53 Gb 之間。流式細(xì)胞術(shù)測得白及基因組大小略低于Survey 分析,其主要原因可能是流式細(xì)胞技術(shù)在測定基因組大小時(shí)會(huì)受到植物的不同部位、內(nèi)參物質(zhì)、處理環(huán)境與內(nèi)標(biāo)植物等因素影響。本研究以番茄為內(nèi)參,其基因組大小是白及的2.7 倍,差異較大,導(dǎo)致估測結(jié)果偏低,這與好好芭[25]、馬鞍藤[26]等預(yù)測的基因組大小結(jié)果相同。另外通過K-mer 分析得出白及基因組雜合度為1.099%,重復(fù)序列約67.45%,根據(jù)基因組雜合度分類,雜合度大于0.8%為高雜合基因組,重復(fù)序列比例大于50%為高重復(fù)基因組[27]。因此白及基因組被認(rèn)為是超高雜合、超高重復(fù)基因組。所獲得的白及基因組特征信息,既可對白及的物種起源研究和下一步的基因組學(xué)研究具有參考價(jià)值,同時(shí)將為后續(xù)白及全基因組測序、組裝、去冗余處理及精細(xì)圖譜繪制等工作提供參考。