朱星遇,李飛龍,胡丹心,何文祥,郭 芬,高 偉,張 遠*
1. 廣東工業(yè)大學環(huán)境生態(tài)工程研究院,廣東省流域水環(huán)境治理與水生態(tài)修復重點實驗室,廣東 廣州 510006
2. 廣東省廣州生態(tài)環(huán)境監(jiān)測中心站,廣東 廣州 510006
開展長時間序列的生態(tài)監(jiān)測,闡明物種與群落的演變動態(tài)及其與環(huán)境因子的內在關聯(lián),是識別與預測生態(tài)系統(tǒng)變化和管理策略制定的先決條件[1-3]. 近年來,借助于古湖沼學、古生態(tài)學、考古學和新型化學分析技術的發(fā)展,跨學科研究成為生態(tài)系統(tǒng)長期監(jiān)測數據集構建的重要方法與路徑[4-6]. 如依賴生物骨骼、花粉孢子和貝殼等生物遺骸直接推斷生態(tài)系統(tǒng)不同歷史時期的物種定殖、入侵和群落演變[7-9];利用碳(δ13C)和氮(δ15N)同位素、沉積色素和甾醇類等生物標志物的種類、結構和含量作為生態(tài)系統(tǒng)變化的指示替代物來間接揭示群落組成與結構變化[10-11]. 雖然上述方法的進展在時間尺度上極大地擴展了生態(tài)系統(tǒng)數據信息,但仍存在諸多缺陷,如大多數化石無法保存完好、樣本保存量小、樣品的分類鑒定難度大等,使得獲取的數據質量和可靠性受到人們質疑[12-13]. 面對日趨快速多變且加速退化的生態(tài)系統(tǒng),因此迫切需求新的群落反演技術來有效且精準地預測生態(tài)系統(tǒng)變化.
沉積物古DNA(sedimentary ancient DNA)技術的最新進展為水生態(tài)系統(tǒng)中生物群落反演提供了新路徑[14-17]. 該技術主要是從湖泊、水庫、河口和海底等環(huán)境介質中采集樣品[18],通過對沉積物樣品中DNA的提取、目標基因富集或雜交捕獲、高通量測序和生物信息學分析等試驗流程(見圖1),在長時間尺度上獲取群落的物種組成及多樣性信息. 由于釋放到環(huán)境介質中的DNA能夠被吸附到顆粒物上,隨著水體的橫向遷移和垂向沉降等過程,最終在湖泊或海洋沉積物中富集,有的DNA核酸分子甚至可以在沉積物中保存至數萬年[19-21]. 通過對沉積物中古DNA信號檢測將有助于在大時空尺度上揭示生態(tài)系統(tǒng)群落的變化. 此外,DNA提取所用樣品量少,往往只需要幾百毫克至幾克的干重樣品,就可以同時掌握生態(tài)系統(tǒng)物種與群落演變動態(tài)[22-23]. 相比于傳統(tǒng)的遺骸化石和花粉等方法,古DNA技術操作更為便捷,時間序列也更加連續(xù),且不需要古生態(tài)學和考古學繁瑣的篩查與專業(yè)的人為鑒定. 更為重要的是,相較于傳統(tǒng)的生物標志物而言,利用沉積物中古DNA技術在追蹤目標物種時信號更為敏感,對群落的物種組成識別也有更高的分辨率[24].
圖1 沉積物古DNA技術操作流程與應用領域概況Fig.1 Operation process and application field of sediment ancient DNA technology
綜上,本研究首先著重介紹了沉積物古DNA技術的基本原理和操作流程,包括樣品的采樣、DNA提取、目標基因富集、高通量測序以及生物信息學分析等,對比分析了目前4種主流研究技術的優(yōu)缺點.然后重點描述了沉積物古DNA技術在物種入侵與定殖、物種遺傳進化、群落演變動態(tài)和揭示富營養(yǎng)化、氣候變化及多壓力源等環(huán)境壓力下生態(tài)系統(tǒng)長時間序列變化特征等方面的應用. 最后總結了沉積物古DNA技術目前所存在的問題與局限性,概述了潛在的解決方法,如占有率模型和貝葉斯模型的運用、交叉數據源的結合以及與機器學習聯(lián)用等,以期為開發(fā)并建立沉積物古DNA技術并應用于生態(tài)系統(tǒng)的監(jiān)測與保護管理提供技術參考.
沉積物古DNA一般是指從湖泊、水庫、河口和海底等沉積物巖芯樣本中分離和純化的DNA,這些DNA主要來自棲息地生物體釋放或死后殘留于骨骼、種子、孢子和鱗片等組織材料中[18-19,25]. 進入環(huán)境的細胞死亡后,很快會被裂解釋放DNA. 隨著時間的推移,這些細胞外的DNA會受到細菌和真菌酶解(細胞外DNA降解的主要機制)、氧化以及水解等過程的破壞,使DNA片段化、損傷等. 但是部分DNA會以不同的形式保存下來,一種是通過與黏土礦物、較大的有機分子或其他帶電粒子等環(huán)境化合物的結合,來降低外源核酸酶活性,使DNA免受酶解的影響而保存;另一種則是利用細菌的自然轉化. 具有感受態(tài)的細菌會從周圍環(huán)境中攝取游離DNA,并整合到自身基因組中,從而通過基因水平轉移得到長期保存[13,26].
湖泊、水庫等水生態(tài)系統(tǒng)的沉積物作為流域以及周圍陸地環(huán)境的信息載體,有著強大的地層環(huán)境與特殊的組成結構,一方面為古DNA提供了缺氧、低溫、高壓等穩(wěn)定的保存條件,不僅抑制DNA水解、氧化過程,而且最大限度降低生物擾動;另一方面沉積物中含有較多的礦物基質與腐殖質,對古DNA有著極強吸附作用,能使古DNA免受微生物和自發(fā)化學降解保存[27-28]. 另外,沉積層具有年分辨率的紋層記錄可以為生態(tài)分析提供精確的時間標尺. 因此,直接從沉積物樣品中提取古DNA片段,利用高通量測序技術和生物信息學分析,可實現在長時間序列尺度上對生物生存信息的監(jiān)測和群落變化動態(tài)的反演[29].
與環(huán)境DNA(environmental DNA)研究相似,沉積物古DNA技術主要遵循5個步驟,包括樣品的采集、古DNA提取、目標基因富集或雜交捕獲、高通量測序和生物信息學分析[18]. 具體而言,從湖泊、水庫、河口和海底等采集的沉積物巖芯樣本,為去除當代DNA源(modern DNA sources)的影響,會在無菌、密閉和專用的實驗室內進行分層切割、冷凍干燥和低溫保存等前處理. 一般稱取0.5~5 g干質量樣品進行DNA提取[22,30-31]. 常用的商業(yè)試劑盒包括DNeasy PowerSoil、NucleoSpin Soil、DNeasy PowerMax Soil和FastDNA Soil等[32]. 根據不同的研究目的可以分別選擇4種不同的技術進行后續(xù)試驗與分析處理(見表1).
表1 沉積物古DNA主流技術優(yōu)缺點對比Table 1 Comparison of advantages and disadvantages of sediment ancient DNA mainstream technologies
a) 定量PCR(quantitative real-time PCR,qPCR),該方法主要針對目標物種(如入侵物種、珍稀瀕危物種等)[33-35],使用該目標特異性引物進行定量檢測. 高度特異性的引物可以優(yōu)先排除提取樣品中其他非靶向DNA(非目標生物、污染DNA)的擴增,而且不需要對產物進行測序,但其處理量小,成本較高. 如Kuwae等[36]針對日本別府灣3種主要的魚類設計特異性引物,成功從沉積物中定量擴增其DNA.
b) DNA宏條形碼(DNA metabarcoding)法,即擴增子測序,用于研究非目標物種或特定生物類群(如藻類、植物和魚類等),是目前最為常用的方法之一[37-38].該技術依賴于通用性引物對具有代表性和保守性較強的DNA片段進行PCR擴增,在一次高通量測序中可同時獲得多個生物類群多樣性信息[39]. 這一技術的主要優(yōu)勢是樣品處理量大、監(jiān)測成本低、對揭示未知的生物多樣性有著積極作用. 然而,由于PCR存在擴增的偏好性,在一定程度上會導致物種比例發(fā)生變化,且PCR過程中引物的固定結合與高保真酶的修復作用,會造成古DNA末端損傷信號的丟失[40].
c) 鳥槍法(shotgun metagenomics),用于研究環(huán)境中的所有分類群. 該方法將環(huán)境中的所有可能DNA進行提取測序,通過生信處理將測序信息轉譯為群落組成信息,從而完成過去生物群落的重建. 相比DNA宏條形碼方法,鳥槍法不需要對目標區(qū)域擴增,所以排除了PCR過程中的引物限制及偏倚. 該技術可以保留各種大小的古DNA片段以及古DNA分子末端損傷模式,允許后續(xù)古DNA鑒定分析[41-42]. 然而,該技術利用的基因組參考數據庫完善程度不高,分配準確率比DNA宏條形碼方法低. 當重點關注的物種豐度較低時,鳥槍法需要進行深度測序才能滿足分析要求,使得測試成本較高.
d) 雜交捕獲法(hybridization capture),屬于宏基因組方法中的一種,主要用于研究重點關注的目標物種,是一項極具潛力的方法[43]. 該方法保留了鳥槍法的優(yōu)勢,以短探針靶向的方式捕獲目標DNA片段,因此僅需要分析感興趣的目標物種. 但雜交捕獲探針容易捕獲非目標片段,造成高通量測序成本增加. 近期Murchie等[44]開發(fā)了探針集PaleoChip Arctic 1.0,成功地捕獲了加拿大育空地區(qū)更新世晚期植物和動物的古DNA.
除上述4種方法處理外,古DNA數據分析還包括古DNA的鑒定、假陰/陽性的分析等方面.
a) 古DNA的鑒定. 古DNA很容易受到現代DNA的污染,因此對古DNA的精準鑒定,可以保證結果的真實性[45]. 有研究發(fā)現古DNA即使在最有利的保存條件下,也很容易受到氧化和水解的影響,使得古DNA出現高度片段化(古DNA平均長度小于100 bp)以及末端損傷等明顯特征[43]. 其中末端損傷是由于古DNA分子末端的胞嘧啶(C)經氧化脫氨變?yōu)槟蜞奏?U),從而使得后續(xù)測序過程中分子末端出現高頻的C-T取代[46]. 目前已經開發(fā)了相應的統(tǒng)計模型來評估這類損傷,如Lammers等[42]使用mapDamage方法研究了And?ya島湖泊中3個最具代表性分類群的DNA損傷模式,結果顯示,微擬球藻和分枝桿菌的序列皆表現出明顯的古DNA損傷曲線,而人類基因組沒有,進而證明序列來自古代而不是現代污染物.
b) 假陰/假陽性的分析. 由于對野外樣品的信號檢測存在一定的偶然性,進而造成對目標物種DNA檢測的低估. 針對這一問題,目前最常用的方法是占有率模型(occupancy models),通過計算樣本中物種出現的頻次,利用統(tǒng)計建模的方法估算檢測出物種數據信號的檢測概率和錯誤概率[47-48]. 貝葉斯模型(Bayesian models)可以用于估計采樣與分析過程中假陰/陽性的概率. 這一手段的核心是根據試驗數據明確地判斷出一些異常數據,將其歸結于假陽性或假陰性的結果,進而估計其錯誤概率以及矯正物種定殖推斷時間[49].
古DNA覆蓋時間長,可以完整記錄物種的生存、遷移、入侵和滅絕等變化動態(tài)(見表2). Olajos等[49]在Stora L?gdasj?n和Hotagen湖的沉積物中提取白鮭魚的DNA,得出白鮭魚是在9 000~12 000年前被引入到Stora L?gdasj?n湖,不僅證實了該物種是在出現地形遷移障礙之前定殖的假設,而且也證明了Hotagen湖1794年前人為引入白鮭魚的歷史記錄.Graham等[50]利用圣保羅島湖泊沉積巖心的古DNA,推斷出5 600年前,由于海平面的上升和氣候的干燥造成淡水短缺,導致了當地猛犸象的滅絕.
表2 沉積物古DNA技術解析環(huán)境變化下生態(tài)系統(tǒng)群落演變的主要應用案例Table 2 Main application cases of sediment ancient DNA technology in analyzing ecosystem community evolution under environmental change
沉積物古DNA憑借能推斷物種定殖時間的優(yōu)勢,同樣可以用于識別非本地物種或外來物種的入侵歷史,這對保護和恢復本地物種有著重要的數據支撐. 班夫國家公園湖的魚類,由于無人為引進的歷史記錄,且具有遷移地形障礙,一直被認為是自然無魚的. 然而Nelson-Chorney等[51]分析湖泊沉積物古DNA時發(fā)現,一種名為西坡割喉的鱒魚比其他引入的物種存在時間更早,所以該物種屬于一種本地魚,這一發(fā)現為后來該種魚類的保護提供了可靠數據支撐. 對于外來入侵物種,沉積物古DNA不僅可以推斷其入侵時間,還能評估物種入侵后對周圍生態(tài)環(huán)境的影響.自20世紀40年代以來,凱爾開朗群島遭受著外來兔子的入侵,Ficetola等[52]利用湖泊沉積物中兔子和相關食性的植物DNA,不僅驗證了兔子出現時間與植物群落的變化時間一致,且評估了隨時間推移,兔子入侵對島上植物和土壤侵蝕等生態(tài)環(huán)境的影響.
利用古DNA能夠從遺傳學的角度研究物種地理分布特征以及形成原因,其應用案例如表2所示.如Stoof-Leichsenring等[53]研究了西伯利亞湖泊沉積物中硅藻7 000年間的遺傳進化及其驅動機制,發(fā)現譜系的更替與環(huán)境變量(即植被類型)存在顯著的相關性,而與樣本間的地理距離之間相關性較弱. 此外,Stoof-Leichsenring等[54]開發(fā)了一種專門針對硅藻的遺傳調查技術,利用核酮糖-1,5-二磷酸羧化酶/加氧酶基因的短區(qū)域作為遺傳條形碼,擴增了肯尼亞熱帶湖泊沉積物中的硅藻,發(fā)現由于沿海物種被浮游物種所取代,導致硅藻群落在過去200年中出現急劇變化,并且沿海物種舟形藻不同單倍型組的變化呈現出的周期性,與同一時期的干燥和濕潤氣候條件時間相吻合.
追蹤物種的遺傳進化對拯救瀕危物種起著積極作用. 因為對于許多保護物種而言,非本地物種的引入或物種入侵,使得本地物種與相似物種之間內向雜交,遺傳滲透,管理者無法對本地種進行有效的識別與保護. Nelson-Chorney等[51]利用沉積物DNA追蹤湖中原始鱒魚的研究發(fā)現,西坡鱒魚是沒被遺傳入侵的當地物種,從而為后面恢復其保護范圍提供了一個有力依據.
古DNA分析雖然能從微觀的分子視角研究環(huán)境變化對物種的影響,但無法從表現型對生物適應性進化展開研究. 復活生態(tài)學的引入可以將基因表達與生理表現聯(lián)系起來,直觀地比較環(huán)境因素刺激下歷史再生生物與現代生物的反應,二者結合將會更好地研究環(huán)境變化下生物基因型與表現型的進化機制[16,55].
沉積物古DNA技術的巨大優(yōu)勢在于可以同時提供多類群的物種動態(tài)信息,追蹤生物群落的演變特征及變化規(guī)律,以解析外界環(huán)境變化的生態(tài)效應(見表2). 如Voldstad等[56]用斯瓦爾巴群島北部古DNA重建了全新世早期(Early Holocene)當地植被與氣候變化以及喜熱植物分布范圍的擴增,表明了冰川的消退與氣候的變暖. Epp等[57]采集布利斯湖的沉積物巖心,提取了維管植物、苔蘚植物的古DNA,重建了格陵蘭島北部植被歷史,發(fā)現黑頭谷精草等本土植物生長范圍向南擴展了幾百千米,表明全新世早期夏季溫度相對較高.
時間跨度久遠的古DNA甚至可以進一步反演環(huán)境的形成過程. 如Coolen等[58]通過保加利亞海岸沉積古DNA重建了過去約11 400年黑海的浮游生物群落結構,并結合有機碳與脂質生物標志物,反演了黑海從淡水湖到內陸海的過渡動態(tài),大量未知海洋生物類群的存在表明,至少在過去的9 600年間,黑??赡茉谝欢ǔ潭壬鲜艿今R爾馬拉海暗流的影響,為海洋重新連接后黑海的水文變化提供了新的證據.
此外,古DNA還可以用于描述各生物間隱含復雜關系的歷史變化. 如Kyle等[33]使用挪威湖泊沉積DNA探索了浮絲藻與寄生壺菌之間的關系,指出可能是由于低溫和低光條件限制了壺菌的生長,或是浮絲藻用來抵御壺菌的寡肽產生了更強的變異,使得兩種對抗性物種在湖中共存了35年. Xiao等[34]在南極洲阿德利島的湖泊中采集了一個大約1 600年的沉積物巖心,擴增了幾丁質溶解放線菌群落的幾丁質酶DNA,結果顯示,該類細菌群落的頻繁變化與企鵝糞便中甲殼素有關,從而證明了該類放線菌群落與企鵝之間存在著一定的歷史聯(lián)系. 除有針對性的物種外,網絡分析的應用不僅可以幫助我們快速了解生物群落結構以及物種關系,還能識別關鍵物種和類群,進而研究生物群落的演變規(guī)律. 然而,目前利用沉積物古DNA數據開展網絡分析的研究并不多[3,16,55].
古DNA反演水體富營養(yǎng)化主要用于湖泊、河口和海洋等生態(tài)系統(tǒng)(見表2). 在湖泊生態(tài)系統(tǒng)中,古DNA的研究對制定有效的保護策略有重要意義[59-60].Zhang等[61]在中國云貴高原的3個典型湖泊中開展沉積物DNA采樣,通過對藍藻類群的網絡分析,發(fā)現當水中總磷濃度超過生態(tài)閾值后,藍藻物種間的相互作用及關鍵類群發(fā)生了顯著變化,當湖泊處于寡營養(yǎng)狀態(tài)時,總磷濃度對藍藻群落動態(tài)的影響要大于氣溫. 但隨著總磷濃度對生態(tài)閾值的超額增加,氣溫的影響也增加. 這些結果表明減少非點源養(yǎng)分負荷,對減輕氣候變化對高山湖泊水生生態(tài)系統(tǒng)的影響非常重要.
由于開發(fā)導致的水文變化和污水的涌入,使得河口更容易產生富營養(yǎng)問題. 開展河口古DNA研究可以幫助人們更好地了解海洋浮游生物群落應對入侵物種及富營養(yǎng)化等人類活動的影響機制. 如Shaw等[62]利用18S rRNA測序從多個海洋港口樣本和船舶壓載艙沉積物樣本中鑒定了63個歷史和現代潛在有害的微藻類群,不僅揭示了澳大利亞海岸線周圍30年間的赤潮爆發(fā)事件,而且還檢測出兩種甲藻類群的引入歷史. 更早的樣本中出現的有害藻類類群表明,有害藻類可以通過船舶運輸到新的地方.
對于海洋生態(tài)系統(tǒng)而言,古DNA可以追溯海洋環(huán)境中有害藻華的存在歷史,進而發(fā)現局部性隱秘種群. Armbrecht等[63]在澳大利亞瑪麗亞島近海采集了約有9 000年歷史的海洋沉積物巖心,利用雜交捕獲技術對鏈狀亞歷山大藻(Alexandrium catenella)、鏈狀裸甲藻和夜光藻3種有害藻華物種分析,結果表明亞歷山大藻已經在澳大利亞存在了9 000年,是該地區(qū)的特有物種,由于受氣候引起的環(huán)境刺激而引發(fā)水華,同時也驗證了鏈狀裸甲藻和夜光藻是大約30年前引入的.
位于極端條件下的北極、南極以及低緯度高山地區(qū)(如青藏高原),是探究氣候變化對生物群落歷史影響的最佳地區(qū)[64-66]. 其中位于北極高山地區(qū)的植被通常被認為是溫度變化最可靠的指示種群[67]. 如Clarke等[68]根據北極烏拉爾山脈上湖中的沉積物DNA與花粉記錄,揭示了該區(qū)域2.4萬年來的植物動態(tài)信息,結果顯示從最后一次盛冰期(Last Glacial Maximum,LGM)到全新世(Holocene)早期,氣溫的升高使得植物豐度持續(xù)增加,而更新世(Pleistocene)至全新世過渡期間,由于溫度的降低,出現了草本植物到苔蘚植物的優(yōu)勢轉變,并表明這種推演結果與花粉重建的結果是一致的.
古DNA數據集可以對一些模型與假設進行驗證,有助于研究與氣候有關的生物多樣性模式的形成機制(見表2). 以往對沿海拔梯度的植物多樣性研究發(fā)現,在與變暖相關的林線上升過程中,植物多樣性會增加. 然而,這個結論是存在質疑的. Liu等[69]從青藏高原沉積物巖心中提取了植物DNA,發(fā)現當地植物類群豐度在冰川消退期間達到最高,在氣候回暖的全新世早期階段豐度下降. 近年來研究人員借助模型預測未來植被變化,得出高原變暖會使當地林線向上運動,致使植物豐富度下降的結論[70]. 這與Liu等[69]研究結果較為一致,表明在未來氣候變暖條件下,青藏高原地區(qū)應以高山棲息地為重點實施生物多樣性保護.
除高山植被外,海冰對氣候的變化也異常敏感,因此用于揭示海冰范圍變化的微生物也是氣候反演的指示物種. De-Schepper等[71]運用北極格陵蘭海沉積物古DNA追蹤了10萬間海冰甲藻的動態(tài),進一步反演了海冰范圍的變化. 與傳統(tǒng)冰代理(如甲藻孢囊、海冰硅藻生物標志物)推演結果的一致性表明,古微生物DNA可以作為了解氣候影響下海冰演變的新工具. Boere等[72]在南極埃利斯峽灣中收集了長達4 500年的沉積柱,從其中擴增甲藻群落的古DNA,發(fā)現在1 850年前由多個優(yōu)勢種到以海冰甲藻為主的群落轉變與該階段南極氣候變冷有關.
沉積物古DNA可以追蹤古老時期人類畜牧、農業(yè)活動等多重環(huán)境變化的生態(tài)影響(見表2). 如Giguet-Covex等[73]提取安泰爾內湖沉積物中家養(yǎng)哺乳動物和植物的古DNA信息,表征了人類畜牧活動以及森林覆蓋度變化,發(fā)現在公元200年前的羅馬時期,氣候平穩(wěn)的情況下,人類過度放牧和森林砍伐時期與沉積學推演得到的重大侵蝕事件時間一致,證明了鐵器時代晚期和羅馬時期該地區(qū)的土壤侵蝕危機是由人類活動引發(fā). Siano等[74]對來自布雷斯特灣沉積物巖心中的原生生物群落進行分析,發(fā)現原生生物的巨大轉變與第二次世界大戰(zhàn)期間的污染積累峰值相吻合,并且證實了二戰(zhàn)后期農業(yè)污染的投入是主要污染源的假設,揭示了150年間由于多重壓力導致生物群落發(fā)生不可逆轉的變化. Garcés-Pastor等[75]利用阿爾卑斯山上Sulsseewli湖的沉積物古DNA,重建了過去約12 000年中植被對人類活動的響應,結果發(fā)現一定傳統(tǒng)的農業(yè)活動使得在不同緯度帶出現植物豐富度增加的現象.
沉積物古DNA的運用也使得對其他環(huán)境問題的研究不再僅限于化石遺跡和長期監(jiān)測. 如Li等[76]利用18S rRNA基因與16S rRNA基因分別擴增了真核微生物與細菌沉積物古DNA片段,揭示巢湖過去150年間湖內營養(yǎng)鹽與高金屬負荷對微生物群落結構影響,結果顯示,自1960年代以來巢湖營養(yǎng)成分和重金屬負荷增加了2~4倍,而這些微生物的群落結構在1960s、1980s和2010s發(fā)生了重大變化,并確定了營養(yǎng)鹽是影響細菌群落的主導因素,而重金屬對真核微生物的影響更高. More等[77]借助18S rRNA基因分析以及碳、氧同位素等,揭示了阿拉伯東北部過去43 000年中海洋氧最小區(qū)域(OMZ,oxygen minimum zone)條件變化對原生生物群落的影響機制,并指出全新世晚期富營養(yǎng)化的長期增加和硅藻/甲藻比率的降低有利于海洋中上層食物網達到更高營養(yǎng)水平,而當下與全球氣候變化有關的沿海OMZ擴張可能也會出現類似的情況.
雖然沉積物古DNA正在為生態(tài)系統(tǒng)長時間序列信息的獲取提供變革性技術,但其也面臨著很多問題和挑戰(zhàn)(見圖2),如實驗室當代DNA源污染和古DNA降解等問題[66-78].
圖2 沉積物古DNA存在的問題及其潛在的解決方法Fig.2 Questions and potential solutions of sediment ancient DNA
a) 沉積物中古DNA的降解、移動和浸出. 在沉積物古DNA的保存過程中,DNA很容易因降解而無法檢測,所以試驗中會對相同樣品進行多次提取和擴增. 其次,流水擾動引起的沉積物重新堆積也是一個不可忽視的問題,古DNA的保存依賴于結合的底物.這些與黏土礦物結合的DNA分子很有可能因為侵蝕而被移動[26],所以選擇采樣地點時應盡可能謹慎.特別地,DNA可能會隨著沉積物中的孔隙水而發(fā)生垂直遷移,從而混淆物種的出現時間[3]. 雖然之前的一些研究將古DNA出現時間與歷史記錄進行了對比,且未發(fā)現DNA在水環(huán)境沉積物中發(fā)生浸出[56,58,79],但這個問題仍需要設計專門的研究.
b) 活體生物DNA干擾,即當代DNA源污染. 沉積物中存在許多活的生物(尤其是微生物),其產生的DNA會造成嚴重干擾,所以分離過去DNA與當代污染的DNA非常重要. 除了直接依據古DNA損傷特征進行區(qū)分外,其他間接檢驗的方法亦可達到區(qū)分目的. 一是通過分析生物生存條件進行排除,如不會出現在沉積物黑暗、缺氧條件下的生物可排除[32].二是利用活體來源的遺傳物質進行區(qū)分,如從樣品中分離細胞內DNA(intracellular DNA,iDNA)和胞外DNA(eDNA,extracellular DNA)[80],或者共同提取RNA與DNA,由于RNA一定來源于活體生物,所以只需要從DNA讀取序列中去除掉RNA序列即可[3].
c) 與其他替代物數據存在差異. 沉積物古DNA雖然對生物群落反演結果大體上與古生態(tài)學一致,但不同方法之間仍存在一些差異. 如Paw?owska等[81]從海洋沉積物化石中鑒定出有孔蟲27屬,其中有14個屬是依賴沉積物中DNA信號而無法獲得的,表明古DNA在反演真實情況時確實存在不足. J?rgensen等[82]將古DNA與傳統(tǒng)花粉進行對比,發(fā)現所識別植物分類群中除部分重疊外,有40%是古DNA單獨提供的,有25%是花粉獨有的. 因此,古DNA是否能完全作為過去生物多樣性的代理還需要進一步地優(yōu)化與改進.
3.2.1 統(tǒng)計學模型矯正
占有率模型對判別DNA檢測信號假陰性和假陽性概率起著重要作用. 如Schmidt等[83]使用占有率模型分析了真菌病原體鐵皮病菌的存在,比原有數據估計值高出5%~10%. 此外,貝葉斯模型的使用可以進一步估計錯誤概率. 如Ficetola等[52]在檢測兔子古DNA時,發(fā)現表層沉積物樣品中兔子檢測概率較低,僅在1/4~1/2的樣品中有. 而利用占用率模型估計其存在概率僅為0.72,而錯誤概率<0.01,很好地證明了兔子DNA信號的存在. 然而,這種方法仍存在固有的局限性,即當檢測率極低或樣品數據不足時,會使模型估計造成較大的偏差. 改善采樣方法、適量的PCR重復以及使用對錯誤檢測建模的替代方法等,都能提供一定程度上的補充[48,78]. 此外,Olajos等[49]開發(fā)的貝葉斯模型可用于矯正推理的物種定殖時間,在推理白鮭魚定殖時間中,其模型估計最早樣本有41%的概率是假陽性,而其后沒有擴增成功的3個樣本有59%的概率是假陰性,相比之下錯誤率較少的最早樣本出現時間即為物種的定殖時間.
3.2.2 多數據源結合與交叉驗證
盡管沉積物古DNA與古生態(tài)學、古湖沼學等研究之間存在差異,但數據源之間相互結合與交叉驗證必然會提高生態(tài)系統(tǒng)重建的準確性. 如Sj?gren等[79]在利用沉積物古DNA與植物化石、花粉,重建19世紀中期蘇格蘭南部針葉樹造林帶來的植被變化時,發(fā)現二者結合使用所得的植物分類群擴展了65%. 有機地球化學替代品能提供其他古生態(tài)信息,與古DNA結合可以更完整地還原環(huán)境演化過程. García-Rodríguez等[84]在研究南極冰緣湖泊的過程中,用植物的脂質標志物來推斷冰川融化引發(fā)烏拉圭湖出現的過程,而用細菌的古DNA說明南極變暖造成生物多樣性的損失,并還原了南極冰川衰退對微生物網造成惡化的過程.
遙感作為一種新型的環(huán)境監(jiān)測技術,能夠提供環(huán)境變化非常豐富的資料,如土地利用、植物覆蓋和水質污染等圖像數據. 歷史航空圖片及地理資料等為古環(huán)境DNA帶來了重要的補充材料. Sj?gren等[79]利用19世紀軍械調查地圖和林業(yè)種植地圖來還原蘇格蘭西南部針葉林引入的歷史記錄,與古DNA一起反演了針葉樹造林的變化. García-Rodríguez等[84]利用菲爾德斯半島的航拍照片,顯示了柯林斯歷史冰川的退縮和過去雪線位置,并與古DNA一起還原了冰川衰退導致冰緣湖泊的形成過程. 遙感技術對環(huán)境反演還能提供新的歷史數據參考. 如Darel-Tiegs等[85]使用歷史航空攝影數據,量化了河道隨時間的變化,進一步評估了洪水對水生生物多樣性的影響. 總之,結合遙感數據與古DNA利用能評估長期環(huán)境變化對生物多樣性的影響[86].
3.2.3 與人工智能等技術聯(lián)用
新一代高通量測序技術的發(fā)展,使得DNA監(jiān)測數據呈現多量化和復雜化. 擅長于從大量、復雜的樣本數據中挖掘潛在規(guī)律與經驗的機器學習無疑為古DNA帶來了一個新的發(fā)展工具[85]. 目前,機器學習已經用于未知分類單元(OTUs,operational taxonomic units)的分類鑒別以及尋找群落間隱藏的關系網絡[87-88]. 古DNA具有時間分辨率的優(yōu)勢,這些具有因果聯(lián)系的數據有助于機器學習預測生態(tài)系統(tǒng)未來的發(fā)展方向.如Eastwood等[89]指出,機器學習可將時間數據(即來自古DNA獲取的生物多樣性數據以及歷史數據庫中的環(huán)境數據)與網絡模型相結合,識別了生物多樣性和環(huán)境變量的共變因素,建立了生物、環(huán)境因素和生態(tài)系統(tǒng)功能間的時空相關性,并且與構建的人工生態(tài)系統(tǒng)(fabricated ecosystems)驗證,預測了水生態(tài)系統(tǒng)的未來變化動態(tài). Tse等[90]運用了隨機森林建模方式,量化了藍藻群落與其他環(huán)境變量的關系,以此推斷出用作生態(tài)系統(tǒng)管理和補救的關鍵參數閾值.
沉積物古DNA作為一項新興的技術,相比于古湖沼學、古生態(tài)學、考古學等傳統(tǒng)方法,該技術具有簡便、分辨率高的優(yōu)勢,在研究水生態(tài)系統(tǒng)的群落長期演化機制方面有著較大潛力和優(yōu)勢. 然而,如何建立可靠和精準的沉積物古DNA技術,并將其應用于水生態(tài)環(huán)境保護與管理,是國內外研究者關注的熱點和難點問題. 本文概括了沉積物古DNA的技術原理與流程,總結了該技術在生物入侵、遺傳進化、群落動態(tài),以及富營養(yǎng)化、氣候變化及多壓力源等環(huán)境問題中的應用,展示了該技術在追蹤生物變化和量化人類活動影響方面的強大能力. 沉積物古DNA技術的廣泛應用,有助于人們開展長時間尺度的水生態(tài)監(jiān)測工作以及制定水生態(tài)保護政策.
值得注意的是,雖然沉積物古DNA技術近年來發(fā)展迅速,但其仍存在諸多缺陷,如古DNA的降解和污染等問題. 這些因素使得沉積物古DNA技術的應用前景嚴重受限. 基于上文的回顧和總結,結合現代分子生物學和測序技術的最新進展,本文認為在未來數年內,研究者可從以下幾個方面努力,以期取得突破和新見解.
a) 了解DNA產生、遷移和保存等過程是應用沉積物古DNA技術的前提. 從DNA的起源開始,生物體物種類型、生物量以及遷移途中運輸距離、非生物因素(紫外線、溫度等)都對DNA的后續(xù)保存有著重要影響. 特別是在沉積物吸附保存后,沉積物不同的物理和化學特征(pH、礦物質組成等)以及沉積過程(水文條件、土壤侵蝕等)會不斷影響DNA的質量與豐度. 然而目前針對這些過程的研究并不多,因此解譯沉積物古DNA復雜的埋藏學過程機制,將進一步增加古DNA解讀信息的真實性.
b) 目前在沉積物古DNA主流技術中,由于古DNA片段化以及錯配損傷等特征,使得宏條形碼技術自身缺陷暴露無遺. 經目標靶向富集的宏基因組技術雖然可以直接繞過PCR擴增的固有偏倚與盲點,允許古DNA末端損傷的識別,但由于成本、效率等問題使得古DNA應用受限. 所以各分析方法仍需要繼續(xù)優(yōu)化. 基于納米孔分子測序的第三代測序技術能直接避免傳統(tǒng)的PCR擴增過程,且具有較長的讀長、測序速度快等優(yōu)勢. 但該技術現在還處于發(fā)展階段,尚未應用于沉積物古DNA領域.
c) 古DNA研究的可靠性和重復性仍存在質疑.盡管有諸多解決方法,如建模評估、與其他古環(huán)境替代物指標結合等,但仍需要進行大量研究以提高古DNA群落反演結果的可靠性. 遙感技術、機器學習與人工智能的發(fā)展,以及沉積物古DNA與多學科研究結合,將為生態(tài)系統(tǒng)長期監(jiān)測數據集重建提供新方法與路徑.