亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        環(huán)境DNA宏條形碼技術(shù)在藍藻群落監(jiān)測中的應用

        2021-03-02 03:04:50李小闖霍守亮張含笑金小偉李文攀張軍毅張靖天
        環(huán)境科學研究 2021年2期
        關(guān)鍵詞:物種數(shù)據(jù)庫方法

        李小闖, 霍守亮*, 張含笑, 金小偉, 李文攀, 張軍毅, 張靖天

        1.中國環(huán)境科學研究院, 環(huán)境基準與風險評估國家重點實驗室, 北京 100012 2.中國環(huán)境監(jiān)測總站, 北京 100012 3.無錫市環(huán)境監(jiān)測中心站, 江蘇 無錫 214023

        水體富營養(yǎng)化和氣候變暖背景下,藍藻水華暴發(fā)頻率、范圍、周期在不同程度上有所增加[1-2]. 部分水華藍藻產(chǎn)生藻毒素和異味物質(zhì),嚴重威脅飲用水源地水質(zhì)安全,限制水體的生態(tài)服務(wù)功能,對社會經(jīng)濟發(fā)展產(chǎn)生重要影響[3-4],迫切需要大規(guī)模和長周期的藍藻群落監(jiān)測. 基于形態(tài)特征的顯微鏡鏡檢方法耗時、耗力,無法滿足大量樣品觀測需求. 另外,鏡檢需要熟悉藍藻分類系統(tǒng)并具備樣品觀察經(jīng)驗的專業(yè)人員,分析結(jié)果因個人主觀經(jīng)驗的干擾而差異較大. 有研究讓兩位分類學家同時觀察17株藍藻培養(yǎng)物,發(fā)現(xiàn)僅3株在種水平鑒定結(jié)果一致,6株在屬水平結(jié)果一致,7株鑒定為不同的屬[5]. 長期項目或跨區(qū)域合作項目往往需要多個藻類分析員,保持監(jiān)測結(jié)果一致性和可比性存在困難. 另外,鏡檢容易忽視超微藻類群(粒徑<2 μm),當環(huán)境中藍藻未形成典型形態(tài)特征時,如厚壁孢子、異形胞、末端特殊結(jié)構(gòu)等,往往無法鑒定到種水平或出現(xiàn)鑒定錯誤[6-7].

        藍藻的原核特征被發(fā)現(xiàn)之前,一直被認為是真核藻類,物種命名以形態(tài)特征為基礎(chǔ),遵循植物學命名系統(tǒng). 直至20世紀60年代,由于電鏡和分子信息等技術(shù)發(fā)展,發(fā)現(xiàn)藍藻屬于原核生物[8]. 細菌學者認為,藍藻應采用細菌學命名系統(tǒng),物種命名基于模式菌株(純培養(yǎng)物)的觀察而確定[9]. 藍藻的原核特征被發(fā)現(xiàn)后,藍藻的命名采用植物學分類系統(tǒng)或細菌學分類系統(tǒng). 同一藍藻物種在兩個分類學系統(tǒng)下描述和命名,一物種兩學名給藍藻分類系統(tǒng)造成了困擾. 20世紀80年代以來,Anagnostidis和Komrek提出多相分類學方法(polyphasic approach),融合形態(tài)特征、超微結(jié)構(gòu)、繁殖方式、生理生態(tài)特征和分子數(shù)據(jù)等進行綜合分析,逐步完善了藍藻分類系統(tǒng)[10-11],形成經(jīng)典的藍藻四目系統(tǒng)(色球藻目、顫藻目、念珠藻目、真枝藻目),該分類系統(tǒng)流傳廣、接受程度高. 2000年以來,分子數(shù)據(jù)以指數(shù)倍增長,通過分子系統(tǒng)發(fā)育分析對基于形態(tài)特征描述的藍藻分類系統(tǒng)進行校正和修訂,大量新的藍藻種屬被描述和確立. 更高層次的藍藻分類單元(如色球藻目和顫藻目)并非單系類群,Komárek等[12]基于形態(tài)特征、類囊體結(jié)構(gòu)以及分子數(shù)據(jù)對四目系統(tǒng)進行修訂,提出了八目系統(tǒng),即粘桿菌目、聚球藻目、螺旋藻目、色球藻目、寬球藻目、顫藻目、擬甲色球藻目、念珠藻目.

        形態(tài)特征是基因表達的外化,是基因和環(huán)境共同作用的結(jié)果. 基于形態(tài)特征描述的藍藻分類系統(tǒng)不能反映各類群間進化關(guān)系,形態(tài)特征相似的物種可能進化上起源不同,而形態(tài)特征差異大的物種可能起源相同[13]. 分子數(shù)據(jù)的應用可以描摹出藍藻類群間進化關(guān)系,分子系統(tǒng)發(fā)育分析是現(xiàn)代藍藻分類學修訂中最重要的方法之一. 基于分子特征修訂的藍藻分類系統(tǒng)可以克服基于形態(tài)特征的弊端,更能準確地揭示藍藻物種多樣性組成.

        2000年后,以高測序通量為顯著優(yōu)勢的二代測序技術(shù)發(fā)展快速,高效的生物信息學處理方法和軟件相繼研發(fā),進一步推進了eDNA宏條形碼技術(shù)用于藍藻群落監(jiān)測的探索研究,以獲得藍藻群落組成、物種豐度及反映物種間進化關(guān)系的注釋結(jié)果. 基于分子特征修訂的藍藻分類系統(tǒng)還未完善,處于持續(xù)修訂中,但eDNA宏條形碼為快速和大規(guī)模藍藻群落監(jiān)測提供了可能,有必要推進eDNA宏條形碼在藍藻群落監(jiān)測中的應用. eDNA宏條形碼在藍藻群落監(jiān)測中應用處于初步探索階段,該研究從引物選擇、序列聚類、注釋方法和絕對定量4個層面概括宏條形碼數(shù)據(jù)處理方法,并對eDNA宏條形碼技術(shù)在藍藻群落監(jiān)測中的應用提出了參考建議,以推進eDNA宏條形碼在藍藻群落監(jiān)測中的應用.

        1 eDNA宏條形碼技術(shù)內(nèi)涵及在藍藻群落監(jiān)測中的應用

        eDNA指從環(huán)境樣本中提取的DNA,eDNA宏條形碼指利用特定分子標記對eDNA進行擴增,擴增產(chǎn)物進行高通量測序獲得DNA序列,通過序列檢索比對鑒定多個物種,廣義上宏條形碼不僅限于高通量測序. 簡單來說,eDNA宏條形碼是指利用特定分子標記檢測eDNA來同時鑒定多個物種. eDNA宏條形碼一次產(chǎn)生數(shù)萬條以上目標基因擴增子序列,由于測序通量大,藍藻多樣性遠高于鏡檢方法,不僅可以揭示藍藻群落組成,還有助于發(fā)現(xiàn)新物種[14]. 宏條形碼技術(shù)能實現(xiàn)大批量樣品的同時處理,試驗操作流程可標準化和自動化,分析結(jié)果不因操作人員或不同實驗室而異,有利于高效、準確地獲得大規(guī)模藍藻監(jiān)測數(shù)據(jù),為藍藻生物地理學分布特征研究提供可能[15].

        eDNA宏條形碼已開始應用在藍藻群落監(jiān)測,涉及湖、庫、河流、極地融雪水體、以及湖庫沉積物[16-18]. 一些研究關(guān)注特殊生境藍藻群落,如沙漠結(jié)皮、湖底或岸邊藍藻席、超微藍藻等[13,19-20]. eDNA宏條形碼檢測藍藻多樣性顯著高于鏡檢法,且兩種方法檢測的物種數(shù)目呈顯著相關(guān),eDNA宏條形碼在藍藻群落監(jiān)測中有較高的優(yōu)勢[18]. 用擴增子深度測序的方法對我國3個富營養(yǎng)狀態(tài)湖庫藍藻群落開展研究,發(fā)現(xiàn)微囊藻(Microcystis)是優(yōu)勢類群,但一定環(huán)境條件下,聚球藻(Synechococcus)在水面形成優(yōu)勢類群[16]. 聚球藻是超微藻類,在淡水和海洋常見,物種多樣性高,適應多種環(huán)境條件[21],是潛在的藍藻水華形成物種. 常規(guī)監(jiān)測中超微藻類易被忽略,考慮到聚球藻具有發(fā)生藍藻水華的潛在態(tài)勢,超微藻類應納入為一項常規(guī)監(jiān)測指標.

        eDNA宏條形碼用于南極洲雪融水體棲生藍藻席研究,發(fā)現(xiàn)藍藻多樣性較高,絕大多數(shù)藍藻席(cyanobacterial mats)存在微囊藻毒素和擬柱孢藻毒素[19]. 另外,eDNA宏條形碼可以實現(xiàn)長時間序列藍藻群落變化研究,揭示歷史藍藻群落組成和水生態(tài)健康狀況. Tse等[17]采用eDNA宏條形碼和古湖沼學技術(shù)探究加拿大一水庫藍藻群落百年尺度變化,發(fā)現(xiàn)近幾年長孢藻(Dolichospermum)相對豐度增加,與微囊藻毒素基因(mcyA)基因拷貝數(shù)變化趨勢相同.

        2 eDNA宏條形碼技術(shù)在藍藻群落監(jiān)測中的方法進展和關(guān)鍵技術(shù)

        2.1 引物選擇

        eDNA宏條形碼技術(shù)需要構(gòu)建分子標簽擴增子數(shù)據(jù)庫,擴增產(chǎn)物一般要求低于500個堿基對. 擴增引物遵循以下兩個原則:①選定基因序列易于PCR擴增,且方便設(shè)計通用引物;②選定條形碼區(qū)域能凸顯種間差異,但種內(nèi)差異小[22].

        核糖體小亞基16S核糖核酸基因(16S small ribosomal subunit RNA gene, 16S rRNA gene)是藍藻多樣性研究應用最廣的基因,既有高度保守性區(qū)域,又有多個高度變異性區(qū)域,可同時用于反映物種間的親緣關(guān)系和物種間的差異[23]. 近年來,GenBank數(shù)據(jù)庫藍藻16S rRNA 基因序列呈指數(shù)趨勢增加(見圖1),提升了藍藻分子鑒定的精確度和分子系統(tǒng)發(fā)育構(gòu)建的穩(wěn)健性,以及評估引物的特異性. 二代測序受測序讀長限制,只能選擇1~3個可變區(qū)作為擴增片段,不同可變區(qū)突變點位分布不均,選擇的擴增片段不同往往導致物種的分子鑒定結(jié)果出現(xiàn)偏差. 三代測序集合了Sanger測序的讀長優(yōu)勢和二代測序的高通量優(yōu)勢,可用較低的成本獲得16S rRNA 基因全長序列,避免了因選擇不同可變區(qū)域為擴增片段而影響藍藻物種分子鑒定結(jié)果的準確性. 16S rRNA 基因全長測序用于對23個培養(yǎng)菌株形成的模擬群落研究,發(fā)現(xiàn)16S rRNA 基因全長序列鑒定準確度高達99%,且重復性高;更全面的序列信息提高了物種鑒定的準確性,有利于種水平物種鑒定,對系統(tǒng)發(fā)育、群落鑒定和代謝通路預測研究更有優(yōu)勢[24].

        16S rRNA基因在結(jié)構(gòu)和功能上較保守,物種間16S rRNA基因序列差異小,不適合在物種水平上進行區(qū)分[25]. 16S-23S rRNA基因間隔區(qū)域(internal transcribed spacer, ITS)序列長、變異大,屬內(nèi)物種間差異顯著[26]. 基于ITS基因系統(tǒng)發(fā)育分析,擬圓孢藻屬(Sphaerospermopsis)3個物種各自形成單系類群,能彼此區(qū)分[27]. 相對核基因,功能基因進化快、含有變異信息多,能反映物種適應環(huán)境變化的生理生態(tài)特征,已被廣泛用于尋找物種間差異,比較常用的基因包括依賴于脫氧核糖核酸的核糖核酸聚合酶基因(DNA-dependent RNA polymerase gene,rpoC1)、藻藍蛋白及其轉(zhuǎn)錄間隔區(qū)(phycocyanin operon with intergenic spacer region,cpcBA-IGS)等[28]. 微囊藻是全球最普遍的水華藍藻物種,據(jù)AlgaeBase數(shù)據(jù)庫統(tǒng)計已有113個形態(tài)種,但形態(tài)物種間區(qū)分鮮少得到分子證據(jù)的支持. 基于cpcBA-IGS基因系統(tǒng)進化分析,惠氏微囊藻(M.wesenbergii)形成一獨立進化枝,可以和其他微囊藻物種區(qū)分開[29]. 功能基因有利于屬內(nèi)物種間區(qū)分,應繼續(xù)探究其他功能基因在形態(tài)物種間區(qū)分的分子證據(jù). 筆者基于GenBank數(shù)據(jù)庫統(tǒng)計,認為目前ITS間隔區(qū)及功能基因序列數(shù)目顯著低于16S rRNA基因序列數(shù)目,且不同功能基因序列數(shù)目各異,不利于環(huán)境樣品浮游植物物種精準鑒定(見圖1).

        注: 折線上數(shù)字代表去除未培養(yǎng)藻株序列數(shù)目. 1993年包括1993年以前數(shù)據(jù),數(shù)據(jù)收集截止至2020年4月2日.圖1 GenBank數(shù)據(jù)庫藍藻16S rRNA、ITS、rpoC1、藻藍蛋白基因序列(>200 堿基對)數(shù)目隨時間變化量Fig.1 Number of gene sequences larger than 200 base pairs within GenBank for the cyanobacterial 16S rDNA, ITS, rpoC1 and phycocyanin loci over time

        藍藻水華通常由部分關(guān)鍵藍藻物種引發(fā),探究水華藍藻種群結(jié)構(gòu)、時空動態(tài)變化、基因多樣性,解析藍藻水華演替機制,可為藍藻水華防控和水質(zhì)管理提供理論依據(jù). 微囊藻、長孢藻、擬柱孢藻(Cylindrospermopsis)是世界范圍內(nèi)常見的水華藍藻類群,目前針對3個類群的引物已研發(fā)出來并進行基因型和水華種源的挖掘[30]. 通過構(gòu)建克隆文庫發(fā)現(xiàn)太湖長孢藻存在兩個主基因型,主基因型隨著季節(jié)變化進行演替,表明不同水華階段由不同長孢藻生態(tài)型組成[31]. 基于高通量測序的eDNA宏條形碼檢測到微囊藻基因多樣性遠高于克隆文庫,發(fā)現(xiàn)的微囊藻多樣性和富營養(yǎng)化水平呈負相關(guān)[32]. eDNA宏條形碼用于水華藍藻基因型研究鮮見報道.

        2.2 序列聚類

        eDNA宏條形碼數(shù)據(jù)處理的第一步是將擴增子序列聚類為操作分類單元(operational taxonomic unit, OTU). 通過設(shè)定物種間分類閾值,將相似度超過該閾值的序列聚類為相同OTU. 然而分類閾值易使序列信息差異太小的物種被掩蓋,導致生物多樣性被低估. 近年來,序列差異低至單核苷酸變異的處理方法被提出,克服了物種丟失的弊端,可以檢出序列高度相似但屬于不同種屬的物種和生態(tài)型[33].

        通過距離度量方法計算不同序列之間的相似性,序列相似性高于分類閾值的聚為同一OTU. 采用OTUs聚類對eDNA宏條形碼數(shù)據(jù)進行處理,不僅縮減工作量,提高分析效率,而且剔除了擴增過程中的嵌合體以及測序過程中高通量測序儀器引入的錯誤序列[34],提高了分析的準確性. Qiime分析流程提供的OTU聚類方法有3種,包括denovo、closed-reference、open-reference聚類.

        無參OTUs聚類(denovoOTUs clustering). eDNA宏條形碼序列通過距離度量計算序列之間的相似性,每一序列都需與其余序列比對,比較序列間距離相似度和設(shè)定的分類閾值,將上萬條序列聚類成OTUs[35]. 數(shù)據(jù)通量越高,錯誤測序序列和單堿基變異的序列(unique sequence)增加,分層的無參聚類方法計算代價和時間以幾何倍數(shù)增長;序列比對不能同時進行,比對數(shù)據(jù)量大、耗時,適用于小規(guī)模數(shù)據(jù)集分析[36]. 無參聚類根據(jù)分類閾值聚類OTUs,可以消除一些錯誤序列. 對原核生物16S rRNA 基因的eDNA宏條形碼研究中,OTUs聚類的分類閾值通常設(shè)置為97%[37],后續(xù)處理中OTUs被當成物種,用來評價物種多樣性. 然而,該分類閾值是人為設(shè)定的,序列相似度高于該閾值的不同物種可能被掩蓋,不能準確體現(xiàn)物種間的進化關(guān)系,OTUs的生物學意義有待校驗. 不同的數(shù)據(jù)集OTUs難以合并分析,不利于不同研究的比較分析.

        有參OTUs聚類(closed-reference OTUs clustering). 與無參聚類不同,有參聚類需要參考數(shù)據(jù)庫,通過設(shè)定分類閾值,將輸入序列和參考序列距離相似度在閾值范圍內(nèi)的擴增序列歸為相同OTU[38]. 參考數(shù)據(jù)庫挑選高質(zhì)量的基因全長序列,參考序列間相似度低于97%,每一參考序列代表不同物種[36]. 有參聚類會出現(xiàn)輸入序列和多個參考序列相似度在分類閾值范圍內(nèi),導致序列注釋不明確[39]. 有參聚類會設(shè)定聚類中心,序列比對可同時進行,數(shù)據(jù)處理高效,適用于大數(shù)據(jù)集分析[40]. 有參聚類產(chǎn)生的OTUs具有生物學意義,不同數(shù)據(jù)集采用相同的參考數(shù)據(jù)庫,可以進行不同研究的比較分析. 有參聚類不能鑒別新物種,如果輸入序列和參考數(shù)據(jù)庫所有序列相似度均低于分類閾值,該序列被舍棄,丟棄了參考數(shù)據(jù)庫以外的新物種. 隨著參考數(shù)據(jù)庫不斷完善,這一缺點會逐漸弱化.

        注: 無參OTUs聚類方法限于自身數(shù)據(jù)集內(nèi),有參OTUs聚類方法不能得到數(shù)據(jù)集外的生物學變異,擴增子序列變異方法能得到所有的數(shù)據(jù)和生物學變異[43]. 圖2 基于研究數(shù)據(jù)集的3種序列聚類方法有效性程度Fig.2 The extent of the validity of de novo OTUs, closed-reference OTUs and ASVs methods determined from the study dataset

        開放式有參OTUs聚類(open-reference OTUs clustering). 開放式有參聚類融合了無參聚類和有參聚類的優(yōu)勢,輸入序列先通過有參聚類方法聚類成OTUs,未匹配序列再通過無參聚類生成OTUs,產(chǎn)生的OTUs具有生物學意義,也保留了數(shù)據(jù)庫以外的新物種[41]. 因無參聚類方法存在,不能避免耗時長的弊端,不利于大數(shù)據(jù)集處理. 二次抽樣開放式有參聚類(subsampled open-reference OTU clustering)是開放式有參聚類方法的優(yōu)化版本,通過隨機抽取與數(shù)據(jù)庫參考序列未匹配的擴增序列,增加為參考數(shù)據(jù)庫序列,序列聚類可并行運行,從而有效地縮短聚類時間,適用于大數(shù)據(jù)集分析[42].

        擴增子序列變異(amplicon sequence variants, ASVs)在引入錯誤序列之前得到有生物學意義的序列,基于熵值在單核苷酸的精度上區(qū)分序列之間的差異,可以用于區(qū)分生態(tài)型[43]. ASVs的核心思想是具有生物學意義的序列可以和錯誤序列區(qū)分,且數(shù)目遠大于錯誤序列數(shù). 錯誤序列在有效控制下,ASVs的準確度會增加. ASVs代表了具有生物學意義的序列,因此不受數(shù)據(jù)集的限制,不同的數(shù)據(jù)集之間可以進行比較分析. ASVs數(shù)據(jù)分析可重復,能更準確、更全面地評估eDNA宏條形碼數(shù)據(jù)結(jié)果. 若物種基因組的基因片段有多個拷貝,會得到多個ASVs,導致該物種區(qū)分不明確. 目前,ASVs分析有以下幾種方法,包括DADA2[44]、Unoise2[45]、Deblur[46]、Oligotyping[33]、Minimum Entropy Decomposition[47]、Sub-OTU resolution method[48]. 這些方法不需要參考數(shù)據(jù)庫,經(jīng)過質(zhì)量控制的序列降噪去除擴增與測序過程中的錯誤序列,得到具有生物學意義的序列(見圖2).

        基于Sub-OTU resolution method分析微生物群落,發(fā)現(xiàn)基于97%分類閾值聚類的OTU內(nèi)多達20個亞群落,這20個亞群落生態(tài)特征明顯不同,序列低至一個核苷酸差異(99.2%相似度)[48]. Oligotyping分析沼澤存在22個遠洋桿菌屬(Pelagibacter)寡核苷型,其中2個優(yōu)勢寡核苷型序列差異低至一個核苷酸(99.57%相似度),一個寡核苷型在冷季占優(yōu)勢,另一個在暖季占優(yōu)勢,表現(xiàn)不同的季節(jié)演替[33]. 低至單核苷酸差異的序列可以表現(xiàn)不同的生態(tài)特征,若以分類閾值聚類OTUs可能忽略這些生態(tài)型.

        2.3 注釋方法

        序列比對的物種注釋方法是通過與數(shù)據(jù)庫參考序列距離相似度比較給予物種名稱,注釋結(jié)果的準確度與參考數(shù)據(jù)庫的選擇息息相關(guān). 現(xiàn)有的16S rRNA 基因數(shù)據(jù)庫,如SILVA[49]、RDP[50]、Greengenes[51],由高質(zhì)量16S rRNA 基因全長序列組成,數(shù)據(jù)庫大多數(shù)序列由環(huán)境樣品擴增而來,序列注釋的物種名稱多是基于預測獲得,許多序列未注釋物種名稱[52]. 由于參考數(shù)據(jù)庫的完善性,eDNA宏條形碼序列比對注釋結(jié)果存在一定比例未注釋的序列[19-20]. 另外,大量藍藻純培養(yǎng)物基于形態(tài)特征的鑒定結(jié)果缺陷,擴增的基因序列提交至數(shù)據(jù)庫[9],若序列未核查和修訂,會導致eDNA宏條形碼序列錯誤的注釋結(jié)果.

        基于系統(tǒng)進化位置(phylogenetic placement method)注釋的方法可以對參考序列進行修正,提升輸入序列注釋的準確性,并且反映了輸入序列之間的進化關(guān)系[53]. 分子數(shù)據(jù)是現(xiàn)在藍藻分類學修訂最重要的指標之一,藍藻屬的修訂和新屬的提出需滿足進化分枝是單系類群[9-10]. 由于分枝未延伸到屬以下的分類單元,沒有界定種水平需滿足單系類群. 系統(tǒng)進化種(phylogenetic species concept)是系統(tǒng)進化關(guān)系能可靠推斷出的最小分類單元. 從譜系學的角度來看,系統(tǒng)進化種規(guī)定物種產(chǎn)生于進化關(guān)系間的轉(zhuǎn)變,可以在系統(tǒng)進化關(guān)系上將系譜關(guān)系連接起來[54]. 分類學和系統(tǒng)發(fā)育分析的結(jié)果常常不一致,系統(tǒng)發(fā)育分析的結(jié)果和序列質(zhì)量、序列比對質(zhì)量以及方法和參數(shù)息息相關(guān).

        基于最大似然法的系統(tǒng)發(fā)育分析,是推斷未知序列分類學最可靠的方法,由于計算復雜性和缺乏系統(tǒng)進化信號,不適用于大數(shù)據(jù)分析[55]. 系統(tǒng)進化位置的注釋方法,首先基于參考序列構(gòu)建系統(tǒng)發(fā)育樹,輸入序列通過序列比對添加到參考系統(tǒng)發(fā)育樹上,該方法可以對數(shù)以萬計的輸入序列快速又準確的注釋,相關(guān)軟件有EPA (evolutionary placement algorithm)[56]和pplacer[55]. EPA和pplacer分析速度和準確度相當,pplacer的參考系統(tǒng)進化樹和進化枝是固定的;而EPA優(yōu)化了參考系統(tǒng)進化樹的進化枝長度以及輸入序列在進化枝的位置,每一個輸入序列的注釋推導是基于略有差異的參考系統(tǒng)進化樹.

        2.4 絕對定量

        eDNA宏條形碼分析往往僅考慮物種的相對豐度,然而相對豐度不能反映樣本中真實的絕對豐度. 相對豐度相同的樣本絕對豐度可能差別很大,相對豐度差別很大的樣本絕對豐度可能相同,因此相對豐度可能導致錯誤的預估結(jié)果,掩蓋了生理學和生態(tài)學潛在的有價值的信息[57-58]. 相對豐度不能體現(xiàn)物種在不同樣本中的絕對含量的變化,不利于不同樣本間的比較分析. 定量PCR常用于獲得樣本微生物總豐度,但分析結(jié)果因DNA提取和擴增效率的不同而出現(xiàn)偏差[59-60]. 以細菌基因組或人工合成的嵌合體DNA作為內(nèi)參的內(nèi)標法[58,61],以及利用細胞生物量和拷貝數(shù)間關(guān)系的細胞體積校正系數(shù)法[62]等絕對定量方法,為跨樣本間物種豐度的比較分析提供了可能.

        內(nèi)標法是在樣本微生物基因組提取之前,將內(nèi)標DNA添加到樣本中,與樣本微生物共提取基因組并進行擴增,根據(jù)內(nèi)標DNA豐度推算樣本微生物總豐度. 內(nèi)標DNA可以來源于細菌[61,63],或者合成的嵌合DNA[58]. 內(nèi)標DNA的加入量應根據(jù)樣本DNA總量來決定,在0.1%~1.0%之間均可,加入量既要保證有足夠的內(nèi)標序列來分析,也要避免加入太多造成對原始微生物群落的檢測帶來影響[61]. 細菌應選取不存在于樣本群落中且與樣本中任何普遍存在的物種相似度都不高,避免對樣本中微生物絕對定量分析的影響. 合成的嵌合DNA可以彌補這一缺陷,嵌合DNA設(shè)計包含以下3個關(guān)鍵要素:①目標研究類群基因的引物結(jié)合位點;②與擴增產(chǎn)物相同長度和GC含量的優(yōu)化合成填充序列;③合成嵌合DNA的來源易于獲得. 樣本中可同時加入針對多個類群(細菌、真菌、真核生物)的嵌合DNA,能一次實現(xiàn)多個類群的絕對定量,可以在生物域水平揭示菌群結(jié)構(gòu)的變化〔見圖3(a)〕.

        內(nèi)標法只能對樣本微生物總基因拷貝數(shù)進行絕對定量,不能直接獲得微生物絕對豐度. 每種微生物細胞含有一到多個16S rRNA基因拷貝數(shù),擴增后測序會放大這種基數(shù)效應,造成物種的序列數(shù)產(chǎn)生偏差. 雖然rrnDB在線數(shù)據(jù)庫可以基于物種全基因組對基因拷貝數(shù)進行評估和矯正來獲取eDNA宏條形碼數(shù)據(jù)每個物種絕對豐度[64],但現(xiàn)僅有400個藍藻藻株基因組,且大多數(shù)藻株來自于海洋和法國巴斯德研究所保存的淡水藍藻株,只能覆蓋極少數(shù)藍藻物種[65]. 因此,基于rrnDB數(shù)據(jù)庫只能對部分藍藻物種基因拷貝數(shù)進行矯正,且校正結(jié)果因不同研究區(qū)域而有所偏差.

        圖3 eDNA宏條形碼絕對定量方法[61-62]Fig.3 Methods of absolute quantification of eDNA metabarcoding[61-62]

        細胞體積校正系數(shù)法(correction factor, CF)是通過物種細胞體積和細胞含有的基因拷貝數(shù)目之間建立聯(lián)系得到校正系數(shù),實現(xiàn)eDNA宏條形碼物種豐度的絕對定量. 該方法已對環(huán)境魚類、兩棲動物[66]、寡毛綱[67]、細菌[68]、古菌[68]以及硅藻[62]進行評估和定量,而關(guān)于藍藻類群的研究還鮮見報道.

        Vasselon等[62]發(fā)現(xiàn)硅藻8個物種細胞體積、長度、寬度和rbcL拷貝數(shù)顯著相關(guān). 基于8個物種混合類群評估,eDNA宏條形碼數(shù)據(jù)經(jīng)過CF校正和顯微鏡鏡檢得到物種絕對豐度結(jié)果一致,而未經(jīng)CF校正的豐度和鏡檢數(shù)據(jù)存在很大差異〔見圖3(b)〕. 基于環(huán)境硅藻類群評估,經(jīng)過和未經(jīng)CF校正的eDNA宏條形碼數(shù)據(jù),優(yōu)勢類群發(fā)生明顯變化,表明eDNA宏條形碼數(shù)據(jù)未經(jīng)過CF校正直接影響硅藻群落結(jié)構(gòu)變化,如大體積物種豐度被高估,而小體積物種豐度被低估,這一變化導致了生態(tài)學意義的差異[62]. 經(jīng)過CF校正的環(huán)境樣本硅藻和寡毛類絕對豐度,由其推導的水質(zhì)評價結(jié)果和鏡檢結(jié)果是可比的,可以替代形態(tài)監(jiān)測方法進行水體生態(tài)評價[62,67].

        CF假定細胞基因拷貝數(shù)和細胞體積是穩(wěn)定的,但它們會因生理狀態(tài)的不同而發(fā)生變化,如不同環(huán)境和生活周期等[69]. 雖然細胞體積因環(huán)境條件而改變,但Mann[70]發(fā)現(xiàn)環(huán)境水體硅藻細胞大小分布是呈正態(tài)分布的,大、小個體數(shù)目均衡克服了這一缺陷. 未來研究需考慮細胞基因拷貝數(shù)和細胞體積的變化對CF的影響;另外,還需評估更多物種細胞體積和基因拷貝數(shù)之間聯(lián)系,以獲得更準確的CF值.

        3 結(jié)論與展望

        eDNA宏條形碼因通量高、易發(fā)現(xiàn)新物種,相比形態(tài)方法,可以更準確地揭示微生物群落結(jié)構(gòu)和組成. eDNA宏條形碼已經(jīng)應用于探究各種生境藍藻群落組成,檢測物種多樣性遠高于顯微鏡檢法,群落組成可以反映不同季節(jié)和不同富營養(yǎng)化程度水體之間差異,研究發(fā)現(xiàn)聚球藻等超微藻類可能是潛在的水華發(fā)生類群,eDNA宏條形碼在藍藻群落監(jiān)測和水生態(tài)健康評價中表現(xiàn)出極大的優(yōu)勢性. 但以往研究在eDNA宏條形碼數(shù)據(jù)處理過程中未考慮生態(tài)型且注釋結(jié)果未反映物種間的進化關(guān)系,導致潛在的生理學和生態(tài)學信息被掩蓋,不利于對水體生態(tài)健康進行科學評價和管控. 因此,筆者從以下幾個方面對eDNA宏條形碼技術(shù)在藍藻群落監(jiān)測的數(shù)據(jù)處理方法優(yōu)化提出了建設(shè)性意見,以準確地揭示藍藻群落結(jié)構(gòu)和組成.

        a) 引物選擇. 針對藍藻,引物選擇應能覆蓋廣譜的藍藻物種;針對水華藍藻類群以及產(chǎn)毒、產(chǎn)異味類群,選擇合適的基因并對設(shè)計引物進行測試. 目前16S rRNA 基因是eDNA宏條形碼最常用的選擇,因該基因數(shù)據(jù)庫涵蓋藍藻物種范圍廣. 但16S rRNA基因在屬內(nèi)物種間區(qū)分效果不好; 再者,16S rRNA基因數(shù)據(jù)庫含有部分物種名稱注釋錯誤的序列,導致eDNA宏條形碼序列注釋錯誤. 應對數(shù)據(jù)庫16S rRNA基因序列進行修正,追溯到原始發(fā)表文章進行基于形態(tài)特征鑒定的核驗,為eDNA宏條形碼序列準確的注釋提供高質(zhì)量源頭序列. ITS基因以及功能基因變異大、含有更多序列變異信息,在藍藻屬內(nèi)物種間具有較好的區(qū)分,但基因數(shù)據(jù)庫體量小,未來研究應擴充數(shù)據(jù)庫ITS基因以及功能基因序列,為eDNA宏條形碼在藍藻物種水平注釋提供可能.

        b) 單核苷酸變異序列具有生物學意義. OTUs聚類通過設(shè)定物種間分類閾值且序列相似度高于該閾值的序列聚類為相同OTU,然而序列信息差異過低的物種和生態(tài)型可能被忽視,導致生物多樣性被低估. ASVs可以在單核苷酸的精度上區(qū)分序列,用于區(qū)分生態(tài)型,ASVs代表了具有生物學意義的序列,實現(xiàn)了跨數(shù)據(jù)集間的比較分析.

        c) 基于系統(tǒng)進化位置的注釋方法反映物種間的進化關(guān)系. 系統(tǒng)進化位置方法不僅可以對參考數(shù)據(jù)庫序列進行修正,提升輸入序列注釋的準確性,另外也反映了序列間進化關(guān)系. 系統(tǒng)進化位置方法能同時對數(shù)以萬計的輸入序列快速又準確的注釋,注釋準確度和分辨率隨著數(shù)據(jù)庫物種多樣性增加和藍藻分類學系統(tǒng)的持續(xù)修訂及完善而提升.

        d) 絕對定量. 相對豐度不能反映樣本中真實的絕對豐度,相對豐度和絕對豐度可能存在巨大反差,因此基于樣本相對豐度分析可能導致錯誤的預估結(jié)果,掩蓋了生理學和生態(tài)學潛在的有價值的信息. 內(nèi)標DNA法和細胞體積校正系數(shù)法為eDNA宏條形碼用于藍藻豐度的絕對定量提供了可能,為物種豐度的跨樣本間分析提供了可能.

        猜你喜歡
        物種數(shù)據(jù)庫方法
        吃光入侵物種真的是解決之道嗎?
        英語世界(2023年10期)2023-11-17 09:18:18
        回首2018,這些新物種值得關(guān)注
        電咖再造新物種
        汽車觀察(2018年10期)2018-11-06 07:05:26
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        可能是方法不對
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        數(shù)據(jù)庫
        財經(jīng)(2016年6期)2016-02-24 07:41:51
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        久久久久成人精品免费播放动漫| 国产系列丝袜熟女精品视频| 亚洲五月七月丁香缴情| 亚洲av成人波多野一区二区| 久久天天躁夜夜躁狠狠85麻豆| 亚洲一区 日韩精品 中文字幕| 成年男女免费视频网站| 国产成人AⅤ| 中国黄色一区二区三区四区| 国产伦精品免编号公布| 久久99精品久久久久久久清纯| 国产熟女自拍视频网站| 日本一区二区三区四区高清不卡| 香港三级日本三级a视频| 成人国产午夜在线视频| 日本高清一区二区在线观看| 国产视频一区二区三区在线免费 | 久久丫精品国产亚洲av不卡| 成黄色片视频日本秘书丝袜| 国产一区二区三区再现| 午夜精品久久久久久久久| 风韵饥渴少妇在线观看| 国产91一区二这在线播放| 女同在线网站免费观看| 亚洲av无码国产综合专区| 无遮高潮国产免费观看| 亚洲一区丝袜美腿在线观看| 日本黑人乱偷人妻在线播放| 消息称老熟妇乱视频一区二区| 午夜被窝精品国产亚洲av香蕉| 和外国人做人爱视频| AV成人午夜无码一区二区| 精品国产av一区二区三区| 国模冰莲极品自慰人体| 玩弄放荡人妻一区二区三区| 激情五月婷婷六月俺也去 | 狼人狠狠干首页综合网| 国产精品国产亚洲精品看不卡| 亚洲av无码日韩精品影片| 中国产无码一区二区三区| 中文字幕 在线一区二区|