李雪松,李建英,華 蓉,劉紹雄,岳萬松,張曉華,高章會,岳婷松,孫達鋒**
(1.中華全國供銷合作總社昆明食用菌研究所,云南 昆明 650221;2.云南省食用菌產(chǎn)業(yè)發(fā)展研究院,云南 昆明 650221)
姬松茸(Agaricus blaze Murill) 又名巴西蘑菇,屬擔子菌亞門(Basidiomycotina) 傘菌目(Agaricales) 蘑菇科(Agaricaceae) 蘑菇屬(Agaricus),原產(chǎn)于美國、巴西、秘魯?shù)葒鳾1]。姬松茸不但味道鮮美、營養(yǎng)豐富,而且含有豐富的多糖、甾醇等活性物質(zhì),在防癌、抗腫瘤、降低血糖方面有很好的效果[2]。有研究報道,在15 種食用菌中姬松茸所含多糖的抗腫瘤活性排名第一,說明姬松茸具有較高的藥用價值[2]。
近年來,由于姬松茸營養(yǎng)豐富且具有較高的藥用價值,受到廣大消費者的歡迎。在目前可購買到的多種人工栽培食用菌中,姬松茸對重金屬鎘(Cd)更敏感且具有更強的富集能力[3]。時有發(fā)現(xiàn)部分批次的姬松茸存在鎘超標的問題,嚴重影響了其商品流通。因此,探究姬松茸鎘富集的分子機制具有重要的現(xiàn)實意義,可為姬松茸重金屬脅迫相關(guān)研究提供理論基礎(chǔ)。
目前,部分學者對姬松茸中鎘的分布[4]、生理指標、吸收累計[5-7],以及鎘脅迫下的轉(zhuǎn)錄表達[8]、內(nèi)參基因[9]等相關(guān)生理及分子響應(yīng)機制開展了研究。發(fā)現(xiàn)姬松茸對重金屬的富集是由復雜的多基因、多通路調(diào)控,對于姬松茸的鎘喜好富集、細胞內(nèi)鎘的吸收代謝過程等生物學問題仍不清楚。
基因組是一個細胞或一個生物體所有遺傳信息的集合,這些信息可以闡明生物有機體與其所處環(huán)境之間的協(xié)調(diào)機制,讓研究者可以以某一物種特定的遺傳背景直接分析相關(guān)的生物學問題?;蚪MSurvey 分析是在全基因組精細圖譜構(gòu)建之前,對樣本進行低覆蓋度測序后對測序結(jié)果開展分析并獲取基因組的相關(guān)信息的方式,可為下一步制定合適的測序策略提供依據(jù);同時,對于缺乏基因組數(shù)據(jù)的非模式物種來說,針對基因組的Survey 分析是分子機理研究和基因資源開發(fā)的前提[10]。
試驗通過高通量測序技術(shù),對姬松茸新品種“中菌姬松茸1 號” 的基因組大小、雜和率、(G+C)含量等信息進行評估,為后續(xù)全基因組的測序策略以及高質(zhì)量基因組完成圖譜地繪制打下基礎(chǔ),為重金屬富集基因挖掘、菌株篩選等研究提供重要參考。
所用材料為姬松茸新品種 “中菌姬松茸1 號”(ZJJSR001),于2022 年5 月采自中華全國供銷合作總社昆明食用菌研究所文山姬松茸示范栽培基地。取組織塊置于凍存管內(nèi),液氮速凍30 min 以上,后置于-80 ℃超低溫冰箱保存,備用。
采用改良CTAB 法提取基因組DNA,使用德國Qiagen Q13343 試劑盒純化。使用NanoDrop 2000 分光光度法對DNA 的濃度進行粗略定量,使用Qubit熒光染料法進行精確定量。提取DNA 的完整性及純度有3 個判斷依據(jù),首先是用NanoDrop 測定的OD260與OD280、OD260與OD230的比值;其次是分別用NanoDrop 和Qubit 測定的核酸濃度的比值;最后是脈沖電泳的結(jié)果。
隨機打斷姬松茸樣品的DNA 片段,構(gòu)建1 個片段大小為500 bp 的文庫。構(gòu)建好的文庫通過廣州基迪奧生物科技有限公司的Illumina novaseq 6000 PE150 測序平臺進行雙末端測序。
原始數(shù)據(jù)需要進行質(zhì)控處理,過濾低質(zhì)量序列。首先,利用fastp 軟件對原始數(shù)據(jù)進行過濾,過濾標準包括:去掉reads 接頭序列;去除含N 比例大于10%的reads;去除全部為A 堿基的reads;當一條reads 中超過50%的堿基質(zhì)量分數(shù)小于20,則舍棄該reads 所對應(yīng)的一對reads。然后使用FastQC 軟件對有效數(shù)據(jù)進行質(zhì)控,若質(zhì)控合格,則進行后續(xù)分析。
對序列文件進行K-mer 的計數(shù)和統(tǒng)計;隨后參考洪芳等[11]的方法,預估姬松茸基因組的大小、雜合度等信息。
采用K-mer=17 構(gòu)建Contig 和Scaffold,利用高質(zhì)量數(shù)據(jù)進行SOAP de novo[12]組裝。得到Scaffold 序列后用SOAP 將過濾后的reads 比對到該組裝序列上直接拼接,獲得原始基因組序列及堿基深度[13]。對組裝的基因組序列以5 kb 為窗口,以無重復計算片段的平均含量和平均深度作圖,可以根據(jù)此圖判斷出測序數(shù)據(jù)的(G+C) 偏向性、是否存在污染等問題。
姬松茸 “中菌姬松茸1 號” 的子實體經(jīng)過基因組DNA 提取后,獲得71 uL 提取液。經(jīng)NanoDrop檢測,質(zhì)量濃度為457 ng·μL-1,OD260與OD280比值為1.89,OD260與OD230比值為1.99;Qubit 檢測質(zhì)量濃度為214 ng·μL-1,DNA 總量為15.19 ng。提取的基因組DNA 的Nc/Qc (NanDrop 檢測質(zhì)量濃度與Qubit 檢測質(zhì)量濃度之比) 比值為2.14,說明DNA質(zhì)量較好。電泳檢測結(jié)果顯示DNA 主帶在20 000 bp 以上,輕微斷裂,輕微降解,滿足建庫測序的質(zhì)量要求。
提取的基因組DNA 測序獲得3.25 Gb 的原始數(shù)據(jù)(raw data),原始read (raw read) 為21 640 782條,結(jié)果詳見表1。
表1 過濾數(shù)據(jù)分類Tab.1 Classification of clean data
如表1 所示,姬松茸測序的原始數(shù)據(jù)經(jīng)過過濾和質(zhì)控后,獲得的有效read (clean read) 數(shù)量為21 538 482 條,占總數(shù)據(jù)量的99.53%;接頭數(shù)據(jù)19 416 條,占總數(shù)據(jù)量的0.09%;低質(zhì)量數(shù)據(jù)165 768 條,占總數(shù)據(jù)量的0.38%。同時,經(jīng)過過濾和質(zhì)控后獲得3.22 Gb 有效數(shù)據(jù)(clean data),占總數(shù)據(jù)量的99.43%。其中,Q20 值為97.28%,Q30 值為92.39%,(G+C) 含量為45.96%。
在進行下一步分析前,可通過4 個堿基的組成初步判斷數(shù)據(jù)的質(zhì)量。質(zhì)控后堿基組成見圖1。
圖1 質(zhì)控后堿基的含量分布圖Fig.1 Base content distribution after quality control
如圖1 所示,X 軸上,1~150 bp 代表read1 的堿基位置,150~300 bp 代表read2 的堿基位置。在read1 與read2 中,A、T 曲線重合,G、C 曲線重合,表明堿基組成平衡。N 曲線代表每個位置未被測到的堿基的比例,在本次測序中N 的比例較低,表明測序質(zhì)量較好。mean 曲線表示堿基在每個位置的平均質(zhì)量。Q20 曲線代表堿基在每個位置的質(zhì)量值≥Q20 的堿基比例。
用K-mer=17 進行分析時使用的是質(zhì)控后的有效數(shù)據(jù)(3.22 Gb),獲得了2 881 098 033 個K-mer,得出其頻率分布情況詳見圖2。
圖2 基因組K-mer 分布曲線Fig.2 The frequency distribution of K-mer
從圖2 可以看出,深度為65×時出現(xiàn)的頻率最高,分布曲線成峰的情況較好?;蚪M中雜合子和重復序列的存在影響了K-mer 深度分布[13]。在最高峰值的一半左右出現(xiàn)1 個小峰,且2 個峰值的高度較為接近,因此判斷姬松茸基因組的雜合率較高。計算出姬松茸的初步基因組大小為41.11 Mb ,雜合率為1.368 3%,重復序列比例為24.46%。
初步組裝后,姬松茸 “中菌姬松茸1 號” 基因組大小為46.59 Mb,結(jié)果詳見表2。
表2 基因組組裝結(jié)果Tab.2 Genome assembly results
由表2 可知,組裝后Contig N50 和Scaffold N50分別為1 559 bp 和4 296 bp,Scaffold 的長度為46 591 444.00 bp,Scaffold 數(shù)量為20 342 個;Contig 長度為44 884 563.00 bp,Contig 數(shù)量為45 193個,最長Contig 為99 873 bp,(G +C) 含量為46.87%。姬松茸 “中菌姬松茸1 號” 的基因組信息顯示該基因組為高雜合率的復雜基因組,后續(xù)的測序和組裝需要考慮采用長讀長測序以及更準確的測序方法來克服基因組的雜合問題。
姬松茸 “中菌姬松茸1 號” 的(G+C) 含量及覆蓋深度詳見圖3。
圖3 姬松茸“中菌姬松茸1 號” 的(G+C) 含量和覆蓋深度Fig.3 (G+C) content and average depth of Agaricus blazei (ZJJSR001)
由圖3 可以看出,姬松茸 “中菌姬松茸1 號”的基因組堿基深度主要分布在30×和70×左右;基因平均(G+C) 含量為40%~60%。基因組(G+C) 含量無明顯分離的聚團現(xiàn)象,基因組堿基深度有少量分離,說明基因組中無明顯其他外源污染,姬松茸“中菌姬松茸1 號” 為高雜合的菌株。
在NCBI 數(shù)據(jù)庫中檢索到26 條蘑菇科的基因組信息,將其與姬松茸(ZJJSR001) 進行比較,結(jié)果詳見表3。
表3 姬松茸(ZJJSR001) 基因組組裝結(jié)果與26 個蘑菇科基因組比較Tab.3 Comparison of Agaricus blazei (ZJJSR001) assembly results with twenty-six Agaricaceae genomes
由表3 可知,26 個蘑菇科的物種基因組大小及(G+C) 含量的差異較大?;蚪M最大的是白環(huán)蘑屬(Leucoagaricus) 的L.gongylophorus,為152.53 Mb;最小的是蘑菇屬(Agaricus) 中的雙孢蘑菇[14],大小為30.23 Mb。(G+C) 含量最低的是白環(huán)蘑屬(Leucoagaricus) 的L.gongylophorus,為36.30%;最高的為環(huán)柄菇屬(Lepiota) 的劇毒環(huán)柄菇,為49.00%。
在26 個蘑菇科的基因組中,蘑菇屬包含5 個物種,基因組大小為32~44 Mb,(G+C) 含量為45%~47%。試驗基于第二代高通量測序技術(shù)獲得的姬松茸(ZJJSR001) 基因組大小為46.59 Mb,在整個科的基因組中屬于中等大小,比已公布的姬松茸的基因組大。(G+C) 含量與目前已測的蘑菇科近緣物種的含量相近[14]。同時,本次測序獲得的數(shù)據(jù)的覆蓋度為69×,在整個蘑菇科物種中屬于中覆蓋度的物種。
近年來,食用菌因營養(yǎng)豐富并具有較高的藥用價值,越來越受到人們的關(guān)注。但在我國食用菌產(chǎn)業(yè)的高速發(fā)展過程中,也出現(xiàn)了許多問題[15]。其中就包括由于食用菌對重金屬的富集,使其在食品質(zhì)量安全保障和商品流通中受影響。鎘作為重金屬元素之一,可以抑制或破壞多種細胞和生理機能[16-18]。而姬松茸對重金屬鎘更敏感且有更強的富集能力[3],在栽培過程中容易出現(xiàn)鎘超標現(xiàn)象,進而影響姬松茸的食(藥) 用價值和商品流通。
目前,隨著高通量測序、遺傳轉(zhuǎn)化、基因編輯等分子生物學技術(shù)在遺傳學研究中的廣泛應(yīng)用,有機會從遺傳背景的角度去理解和揭示食用菌重金屬的富集及調(diào)控機制,為綠色生產(chǎn)和食品安全標準的建立提供參考[15]。
試驗對姬松茸新品種“ 中菌姬松茸1 號”(ZJJSR001) 菌株進行全基因組測定,基于獲得的數(shù)據(jù)開展了Survey 分析。姬松茸(ZJJSR001) 的基因組大小約為46.59 Mb,比已公布姬松茸的基因組大,推測可能是因為姬松茸(ZJJSR001) 2 個核的異質(zhì)性高,導致雜合度高,使得組裝拼接的基因組偏大。與已報道的金黃色大球蓋菇的基因組Survey 相比[19],姬松茸(ZJJSR001) 的雜合率和重復序列比例更高,說明其遺傳背景和基因組的結(jié)構(gòu)更為復雜。后續(xù)構(gòu)建姬松茸(ZJJSR001) 的高質(zhì)量基因組精細圖或是基因組完成圖時,考慮到姬松茸(ZJJSR001)高雜合的特點,可采用三代測序Pac Bio HIFI 和Illumina 測序平臺相結(jié)合,以光學圖譜(Bio-NANO)技術(shù)或染色體構(gòu)象捕獲(Hi-C) 技術(shù)進行輔助,最終進行高質(zhì)量基因組的組裝。
試驗得到姬松茸(ZJJSR001) 的Survey 分析結(jié)果,將為高質(zhì)量基因組完成圖譜的繪制提供重要的科學依據(jù)。同時,為下一步姬松茸的重金屬富集調(diào)控等遺傳機制的研究提供基礎(chǔ)數(shù)據(jù)支持。