楊海樂,張 輝,吳金明,李君軼,王成友,杜 浩,危起偉
中國水產(chǎn)科學(xué)研究院長江水產(chǎn)研究所,農(nóng)業(yè)農(nóng)村部淡水生物多樣性保護(hù)重點實驗室, 武漢 430223
流域生態(tài)學(xué)(watershed ecology)是研究流域范圍內(nèi)陸地和水體生態(tài)系統(tǒng)相互關(guān)系的學(xué)科(全國科學(xué)技術(shù)名詞審定委員會),其主體在于整合研究以流域生態(tài)系統(tǒng)過程為核心所關(guān)聯(lián)起的流域內(nèi)各相關(guān)子系統(tǒng)(subsystem)[1]。流域生態(tài)系統(tǒng)過程研究的核心工作是研究流域生態(tài)系統(tǒng)中依托于水循環(huán)過程的各個子系統(tǒng)之間及之內(nèi)的物質(zhì)流、能量流、信息流[2]。流域生物信息流(watershed biological information flow)是生物信息依托于流域生態(tài)系統(tǒng)過程在不同空間和系統(tǒng)之間進(jìn)行傳遞、交流、作用、反饋的路徑、過程與控制,主要關(guān)注生物體及生物質(zhì)所承載的生物信息在時空上的遷移擴散,以及與生物體及生物質(zhì)間相互作用相伴隨的生物信息作用和反饋[3]。任何生物能都依托于生物物質(zhì),而任何類型的生物物質(zhì)都攜帶有其特定的信息標(biāo)記,因而作為流域生態(tài)系統(tǒng)過程研究的三大主題(物質(zhì)流、能量流、信息流)之一,流域生物信息流通過物質(zhì)流、能量流、信息流的三位一體而具有對流域生態(tài)系統(tǒng)中的物質(zhì)輸移和能量輸移過程的指征和標(biāo)記功能,流域生物信息流的研究可以為流域生態(tài)系統(tǒng)研究中生物物質(zhì)輸移和生物能輸移過程的跟蹤和標(biāo)記提供理論的可能和技術(shù)的支撐[4—5]。
河流上游到下游的流域生物信息流是eDNA(environmental DNA)技術(shù)調(diào)查評估河流水體中物種組成空間特征的事實基礎(chǔ)[5—8],估算河流上游到下游的流域生物信息流是用eDNA技術(shù)調(diào)查評估河流水體中物種組成空間特征的方法基礎(chǔ)[9—11]?;诩仙鷳B(tài)系統(tǒng)概念框架,根據(jù)研究尺度和分辨率的需要,可以將流域生態(tài)系統(tǒng)構(gòu)建為一個包含了多個子系統(tǒng)的集合生態(tài)系統(tǒng)(meta-ecosystem)[12]。評估河流水體中物種組成的空間特征,即評估河流水體(基于空間劃分)各子系統(tǒng)中的物種組成。假設(shè)各子系統(tǒng)在特定時間的物種組成相對穩(wěn)定,各子系統(tǒng)中的個體釋放到環(huán)境中的eDNA則隨著河川徑流向下游輸移。因為流水水體中的eDNA受釋放、稀釋、吸附、再懸浮、輸移、降解等過程的影響[13—15],上游水體子系統(tǒng)中個體釋放到環(huán)境中的eDNA隨著河川徑流向下輸移的距離有限[16—18],因而可以通過估算流域生物信息流來評估河流水體各子系統(tǒng)中的物種組成,進(jìn)而評估河流水體中物種組成的空間特征。
分析流域生物信息流,第一步是估算上游子系統(tǒng)到下游子系統(tǒng)的流域生物信息流輸移有效度(即用下游樣點水體eDNA監(jiān)測上游樣點水體中生物組成信息的監(jiān)測有效度,上游樣點水體中的水生生物信息能在下游樣點水體的eDNA中被檢出的比例和概率)[3]。監(jiān)測有效度估算的核心是(1)有限采樣對采樣區(qū)域的生物組成信息的檢出度和(2)由上游到下游的流域生物信息流輸移有效度。在實踐應(yīng)用中,調(diào)查采樣往往是有限的,因而存在兩個問題:(1)平行樣的設(shè)置情況如何影響生物組成信息檢出度的估算,(2)平行樣的設(shè)置情況如何影響流域生物信息流輸移有效度的估算?;诔闃诱{(diào)查的基本原理和前期eDNA調(diào)查研究可知,采樣數(shù)量越多對采樣區(qū)域的生物組成信息的檢出度越大,因檢出度受多種因素影響,具體的平行樣數(shù)量和檢出度之間的關(guān)系需要一系列具體研究來進(jìn)行量化[19]。如果將由上游到下游的流域生物信息流過程簡化為上游區(qū)域生物信息通過隨機取樣然后轉(zhuǎn)移到下游區(qū)域,那么基于有限采樣的流域生物信息流估算就是對隨機抽樣調(diào)查結(jié)果的隨機抽樣調(diào)查,基于隨機抽樣調(diào)查的基本原理可以猜測,采樣數(shù)量不影響抽樣調(diào)查結(jié)果的準(zhǔn)確度,但會影響其精密度。
根據(jù)流域生物信息流研究框架[3],本文就平行樣的設(shè)置對流域生物信息流估算的影響展開了模擬計算,以檢驗“在流域生物信息流估算中各樣點平行樣數(shù)量不影響抽樣調(diào)查結(jié)果的準(zhǔn)確度,但會影響其精密度”的假設(shè),并探討在流域生物信息流估算中各樣點平行樣數(shù)量(檢出度)的增加或減少對流域生物信息流估算的具體影響,為以下游水體eDNA監(jiān)測上游水體中物種組成信息的監(jiān)測有效度評估方案提供指導(dǎo)和支持,推動eDNA技術(shù)在水生生物多樣性調(diào)查監(jiān)測中的應(yīng)用和發(fā)展。
隨機抽樣過程中,抽樣數(shù)量越多,抽樣結(jié)果的集合對整個系統(tǒng)的反映程度越全面。在本研究中,抽樣即eDNA采樣,抽樣數(shù)量即eDNA樣本數(shù),對整個系統(tǒng)的反映程度即eDNA對該樣點水體生物信息種類的檢出度。因此在模擬計算中,我們將平行樣數(shù)量的增加轉(zhuǎn)化為對該樣點水體生物信息種類檢出度的增加。
上下游樣點間共有生物信息種類組成占上游樣點總生物信息種類組成的比例,即上游到下游的流域生物信息流。因為上下游相鄰樣點間的流域生物信息流是整體流域生物信息流計算的基礎(chǔ)單元,所以本模擬計算中流域生物信息流的估算用上下游相鄰樣點間的共有生物信息組成占上游樣點總生物信息組成的比例估算簡單指代。
平行樣數(shù)量的增加對流域生物信息流估算的影響,用生物信息檢出度的增加對上下游樣點間共有生物信息種類組成占上游樣點總生物信息種類組成的比例估算的影響來等價模擬展示。在本模擬計算中,設(shè)定上下游樣點分別有生物信息1000種、900種(可顛倒替換),樣點生物信息檢出度和實際流域生物信息流作為兩個自變量,估算流域生物信息流為因變量,進(jìn)行單變量模擬,具體分組及參數(shù)如表1,然后計算特定上下游樣點生物信息種類數(shù)組合情況下,樣點生物信息檢出度變化對估算流域生物信息流的影響(即實際流域生物信息流與估算流域生物信息流的差異)以及不同實際流域生物信息流條件下估算流域生物信息流的結(jié)果偏差程度。
模擬計算的基本思路是,在特定上下游樣點生物信息種類數(shù)組合情況下、在特定樣點生物信息檢出度情況下、在特定實際流域生物信息流情況下,通過隨機取樣計算得出某流域生物信息流值的概率,然后通過統(tǒng)計展示估算流域生物信息流相對于實際流域生物信息流的偏差,進(jìn)而評估樣點生物信息檢出度變化對估算流域生物信息流的影響以及不同實際流域生物信息流條件下估算流域生物信息流的結(jié)果偏差程度。具體模擬計算公式如下列公式組
表1 不同樣點生物信息檢出度條件下的流域生物信息流估算條件分組及參數(shù)設(shè)置
式中,M,上游樣點生物信息種類數(shù);N,下游樣點生物信息種類數(shù);r,樣點生物信息檢出度;k,實際流域生物信息流;a,監(jiān)測到的生物信息種類數(shù);y,所估算的流域生物信息流值;f(aM),上游樣點處監(jiān)測到數(shù)量為a的生物信息種類數(shù)的概率;f(aN),下游樣點處監(jiān)測到數(shù)量為a的生物信息種類數(shù)的概率;f(y),估算出流域生物信息流值為y的概率。
根據(jù)該公式組,按照上述參數(shù)設(shè)定分6組進(jìn)行模擬計算,然后通過組內(nèi)和組間模擬計算結(jié)果的對比分析,探討(1)樣點生物信息檢出度狀況對流域生物信息流估算的影響(即實際流域生物信息流與估算流域生物信息流的差異),(2)在特定樣點生物信息檢出度條件下,不同實際流域生物信息流狀況對流域生物信息流估算的影響,(3)在特定樣點生物信息檢出度和實際流域生物信息流條件下,上下游樣點生物信息種類數(shù)相對關(guān)系對流域生物信息流估算的影響。
模擬計算顯示,上下游樣點分別有生物信息1000種、900種的條件下,在實際流域生物信息流水平在0.5的時候,(1)隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的最優(yōu)估值從0.48(偏離4%)逐步增長到0.4978(偏離0.44%),即隨著樣點生物信息檢出度的增長估算流域生物信息流的最優(yōu)估值逐漸趨近于實際流域生物信息流水平;(2)隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.34—0.59(最大偏離32%)收縮到0.4822—0.51(最大偏離3.56%),即隨著樣點生物信息檢出度的增長估算流域生物信息流的估值區(qū)間逐漸集中于實際流域生物信息流水平(圖1)。
圖1 不同樣點生物信息檢出度下(A組)估算流域生物信息流值的概率分布Fig.1 Probability distributions of estimated watershed biological information flow (WBIF) in different biological information detection efficiency (BIDE) conditions at sampling sites (group A)A組,上下游樣點分別有生物信息1000種、900種,實際信息流水平為0.5,樣點生物信息檢出度為變量。WBIF:流域生物信息流 watershed biological information flow;BIDE:生物信息檢出度 biological information detection efficiency
在實際流域生物信息流水平在0.8的時候,(1)隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的最優(yōu)估值從0.79(偏離1.25%)逐步增長到0.7978(偏離0.275%),即隨著樣點生物信息檢出度的增長估算流域生物信息流的最優(yōu)估值逐漸趨近于實際流域生物信息流水平;(2)隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.67—0.86(最大偏離16.25%)收縮到0.7867—0.8067(最大偏離1.66%),即隨著樣點生物信息檢出度的增長估算流域生物信息流的估值區(qū)間逐漸集中于實際流域生物信息流水平(圖2)。
圖2 不同樣點生物信息檢出度下(B組)估算流域生物信息流值的概率分布Fig.2 Probability distributions of estimated watershed biological information flow (WBIF) in different biological information detection efficiency (BIDE) conditions at sampling sites (group B)B組,上下游樣點分別有生物信息1000種、900種,實際流域生物信息流水平為0.8,樣點生物信息檢出度為變量
模擬計算顯示,上下游樣點分別有生物信息1000種、900種的條件下,在樣點生物信息檢出度為0.1時,(1)隨著實際流域生物信息流從0.1增長到0.9,估算流域生物信息流的最優(yōu)估值基本穩(wěn)定在偏小0.02左右,但其偏離程度在逐步減小(從偏離20%到偏離趨近于0%),即隨著實際流域生物信息流的增長估算流域生物信息流的最優(yōu)估值對實際流域生物信息流的偏離程度逐漸減?。?2)隨著實際流域生物信息流從0.1增長到0.9,估算流域生物信息流的99.9%置信區(qū)間幅寬逐漸先增大再減小(從0.14(0.02—0.16)逐步增大到0.25(0.34—0.59)再逐步縮小到0.1(0.8—0.9)),最大幅寬出現(xiàn)在實際流域生物信息流為0.5的時候,但其最大偏離程度一直在逐步減小(從最大偏離80%到最大偏離11%),即隨著實際流域生物信息流的增長估算流域生物信息流的估值區(qū)間幅寬先增大再減小,但整體上逐漸相對集中于實際流域生物信息流水平(圖3)。
圖3 不同實際流域生物信息流下(C組)估算流域生物信息流值的概率分布Fig.3 Probability distributions of estimated watershed biological information flow (WBIF) in different actual WBIF conditions (group C)C組,上下游樣點分別有生物信息1000種、900種,樣點生物信息檢出度為0.1,實際流域生物信息流為變量
在樣點生物信息檢出度為0.5時,(1)隨著實際流域生物信息流從0.1增長到0.9,估算流域生物信息流的最優(yōu)估值從偏小0.004增大到偏小0.008再減小到0,但其偏離程度在逐步減小(從偏離4%到偏離趨近于0%),即隨著實際流域生物信息流的增長估算流域生物信息流的最優(yōu)估值對實際流域生物信息流的偏離程度逐漸減?。?2)隨著實際流域生物信息流從0.1增長到0.9,估算流域生物信息流的99.9%置信區(qū)間幅寬逐漸先增大再減小(從0.05(0.068—0.118)增大到0.084(0.446—0.53)再縮小到0.03(0.87—0.9)),最大幅寬出現(xiàn)在實際流域生物信息流為0.5的時候,但其最大偏離程度一直在逐步減小(從最大偏離32%到最大偏離3.3%),即隨著實際流域生物信息流的增長估算流域生物信息流的估值區(qū)間幅寬先增大再減小,但整體上逐漸相對集中于實際流域生物信息流水平(圖4)。
圖4 不同實際流域生物信息流下(D組)估算流域生物信息流值的概率分布Fig.4 Probability distributions of estimated watershed biological information flow (WBIF) in different actual WBIF conditions (group D)D組,上下游樣點分別有生物信息1000種、900種,樣點生物信息檢出度為0.5,實際流域生物信息流為變量
模擬計算顯示,上下游樣點生物信息種類數(shù)對調(diào)(分別為900種、1000種)之后,在實際流域生物信息流水平在0.5的時候,(1)隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的最優(yōu)估值從0.4778(偏離4.44%)逐步增長到0.4975(偏離0.5%),即隨著樣點生物信息檢出度的增長估算流域生物信息流的最優(yōu)估值逐漸趨近于實際流域生物信息流水平,但相比于上下游樣點生物信息種類數(shù)對調(diào)之前(上游1000種,下游900種)的最優(yōu)估值的偏離程度有所增大;(2)隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.3222—0.6(最大偏離35.56%)收縮到0.4802—0.5111(最大偏離3.96%),即隨著樣點生物信息檢出度的增長估算流域生物信息流的估值區(qū)間逐漸集中于實際流域生物信息流水平,但相比于上下游樣點生物信息種類數(shù)對調(diào)之前(上游1000種,下游900種)的估值區(qū)間的幅寬和最大偏離程度都有所增大(圖5)。
圖5 不同樣點生物信息檢出度下(E組)估算流域生物信息流值的概率分布Fig.5 Probability distributions of estimated watershed biological information flow (WBIF) in different biological information detection efficiency (BIDE) conditions at sampling sites (group E)E組,上下游樣點分別有生物信息900種、1000種,實際流域生物信息流水平為0.5,樣點生物信息檢出度為變量
模擬計算顯示,上下游樣點生物信息種類數(shù)對調(diào)(分別為900種、1000種)之后,在樣點生物信息檢出度為0.5的時候,(1)隨著實際流域生物信息流從0.1逐步增長到0.9,估算流域生物信息流的最優(yōu)估值從偏小0.0044(偏離4.40%)逐步增長到0.0089(偏離2.97%)然后再縮小到0.0067(偏離0.74%),即隨著實際流域生物信息流的增長估算流域生物信息流的最優(yōu)估值對實際流域生物信息流的偏離程度逐漸減小,但相比于上下游樣點生物信息種類數(shù)對調(diào)之前(上游1000種,下游900種)的最優(yōu)估值的偏離程度有所增大;(2)隨著實際流域生物信息流從0.1逐步增長到0.9,估算流域生物信息流的99.9%置信區(qū)間幅寬從0.0543(最大偏離33.3%)逐漸先增大到0.0934(最大偏離11.56%)再減小到0.0666(最大偏離4.93%),即隨著實際流域生物信息流的增長估算流域生物信息流的估值區(qū)間幅寬先增大再減小,但整體上逐漸相對集中于實際流域生物信息流水平,相比于上下游樣點生物信息種類數(shù)對調(diào)之前(上游1000種,下游900種)的估值區(qū)間的幅寬和最大偏離程度都有所增大(圖6)。
圖6 不同實際流域生物信息流下(F組)估算流域生物信息流值的概率分布Fig.6 Probability distributions of estimated watershed biological information flow (WBIF) in different actual WBIF conditions (group F)F組,上下游樣點分別有生物信息900種、1000種,樣點生物信息檢出度為0.5,實際流域生物信息流為變量
隨著樣點生物信息檢出度的增長估算流域生物信息流的最優(yōu)估值逐漸從偏低趨近于實際流域生物信息流水平?;贏組和B組參數(shù)的模擬計算結(jié)果顯示,上下游樣點分別有生物信息1000種、900種的條件下,在實際流域生物信息流水平在0.5的時候,隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的最優(yōu)估值從0.48(偏離4%)逐步增長到0.4978(偏離0.44%);在實際流域生物信息流水平在0.8的時候,隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的最優(yōu)估值從0.79(偏離1.25%)逐步增長到0.7978(偏離0.275%)。在樣點生物信息檢出度的各個水平條件下,估算流域生物信息流的最優(yōu)估值對實際流域生物信息流都偏小,并且樣點生物信息檢出度越高估算流域生物信息流的最優(yōu)估值對實際流域生物信息流的偏小程度越小,估算準(zhǔn)確度越高。
隨著樣點生物信息檢出度的增長估算流域生物信息流的估值區(qū)間逐漸集中于實際流域生物信息流水平?;贏組和B組參數(shù)的模擬計算結(jié)果顯示,上下游樣點分別有生物信息1000種、900種的條件下,在實際流域生物信息流水平在0.5的時候,隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.34—0.59(最大偏離32%)收縮到0.4822—0.51(最大偏離3.56%);在實際流域生物信息流水平在0.8的時候,隨著樣點生物信息檢出度從0.1逐步增長到0.9,估算流域生物信息流的99.9%置信區(qū)間逐漸從0.67—0.86(最大偏離16.25%)收縮到0.7867—0.8067(最大偏離1.66%)。估算流域生物信息流的99.9%置信區(qū)間內(nèi)的概率分布近似正態(tài)分布,但向偏小的方向滑動(圖1、圖2),置信區(qū)間上限的最大偏離程度小于置信區(qū)間下限的最大偏離程度;樣點生物信息檢出度對估算流域生物信息流的99.9%置信區(qū)間內(nèi)的概率分布對實際流域生物信息流的偏離程度有影響,檢出度越高估算流域生物信息流的99.9%置信區(qū)間越小,對實際流域生物信息流的偏小程度也越小,估算精密度越高。
樣點生物信息檢出度越高,對樣點生物信息的刻畫越精確,對基于樣點生物信息檢出度的相關(guān)評估結(jié)果的估算也越精確。調(diào)查樣點的生物信息檢出是整個研究江段流域生物信息流估算的基礎(chǔ)[3],決定了用eDNA監(jiān)測水生生物多樣性的可監(jiān)測距離的估算[11]。前人的研究中,對流水水體中的水生生物的可監(jiān)測距離的估算有各種各樣的數(shù)值,從小幾十米[18,20],到幾百米、數(shù)公里[21—22],再到上百千米[16]都有,導(dǎo)致這一結(jié)果差異的涉及到eDNA的產(chǎn)生、輸移、吸附、沉積、再懸浮、降解等一系列動力學(xué)過程[13—14],受各種各樣的因素影響[17,20,23—24],也會有樣點生物信息檢出度差異對其估算結(jié)果的影響。為了推動基于eDNA技術(shù)的研究具有更好的可靠性和可重復(fù)性,標(biāo)準(zhǔn)化的研究方案和論文研究細(xì)節(jié)說明已被大家所注意到,但截至目前大家所關(guān)注的主要是采樣點狀況、采樣技術(shù)方案、采樣環(huán)境條件、采樣時間設(shè)置、樣品處理方式、污染控制狀況、樣品存儲和運輸條件、PCR條件等[25—28],較少關(guān)注平行樣對研究結(jié)果影響的評估,以至于大家對用eDNA技術(shù)調(diào)查結(jié)果不做評估地直接展示[29—30]。因此,本研究在此強調(diào),對各eDNA監(jiān)測研究所獲得的可監(jiān)測距離在采信之前需要給予相應(yīng)基于樣點生物信息檢出度的可信度評估,同時也建議未來基于eDNA技術(shù)的研究對各自的研究結(jié)果進(jìn)行可信度評估。
為了得到可信的流域生物信息流估算結(jié)果,有必要基于流域生物信息流估算可信度目標(biāo)進(jìn)行樣點生物信息檢出度的控制。在實際調(diào)查應(yīng)用中,調(diào)查到或沒調(diào)查到某一目標(biāo)對實際該目標(biāo)存在與否的判斷只是在一個概率意義上成立,當(dāng)某一情況的可信度達(dá)到某一閾值其結(jié)果才可信或可用。與之相應(yīng),在流域生物信息流實際調(diào)查評估中,估算出的兩個樣點間的流域生物信息流值對實際流域生物信息流的表征也只是在一個概率意義上成立,當(dāng)某一估算結(jié)果的可信度達(dá)到某一閾值其結(jié)果才可信或可用。假設(shè)我們設(shè)流域生物信息流估算的最優(yōu)估值對實際值的偏離不超過1%,且流域生物信息流估算值的99.9%置信區(qū)間對實際值的最大偏離不超過5%,為流域生物信息流估算可信度的目標(biāo)。那么,在上下游樣點分別有生物信息1000種、900種的,實際流域生物信息流水平在0.5左右的條件下,樣點生物信息檢出度應(yīng)控制在0.8以上(圖1);在上下游樣點分別有生物信息1000種、900種的,實際流域生物信息流水平在0.8左右的條件下,樣點生物信息檢出度應(yīng)控制在0.5以上(圖2)。
2020年9月在武漢江段一個調(diào)查樣點的eDNA調(diào)查結(jié)果顯示,可用eDNA(單引物mlCOIintF/ jgHCO2198R)調(diào)查到的魚類物種最優(yōu)估計約99種,單樣品eDNA的魚類物種檢出能力約為26種,檢出效率約為25.8%,在50%的檢出度目標(biāo)下,需要約3個平行樣,在80%的檢出度目標(biāo)下,需要約10個平行樣[19]。如果在這一時段需要在長江干流武漢江段進(jìn)行eDNA采樣估算以魚類為指標(biāo)的流域生物信息流,其中假設(shè)采樣距離設(shè)置為10km,實際流域生物信息流預(yù)估為0.8左右,那么為了獲得一個可信的流域生物信息流正式估算值,每個樣點需采的平行樣數(shù)量不應(yīng)少于3個;假設(shè)如果采樣距離設(shè)置為30km,實際流域生物信息流預(yù)估為0.5左右,那么為了獲得一個可信的流域生物信息流正式估算值,每個樣點需采的平行樣數(shù)量不應(yīng)少于10個。
在兩個采樣點間的實際流域生物信息流值較低的情況下,應(yīng)適當(dāng)提高平行樣數(shù)量。實際流域生物信息流大小不影響樣點生物信息檢出度對估算流域生物信息流的影響規(guī)律(圖1、圖2對比),但影響了估算流域生物信息流的估算(圖3、圖4)。流域生物信息流本身的值越低,采樣和計算中的不確定性產(chǎn)生的影響就越大;流域生物信息流本身的值越高,采樣和計算中的不確定性產(chǎn)生的影響就越小。用模擬計算結(jié)果來講,估算流域生物信息流的最優(yōu)估值隨著實際流域生物信息流降低而逐漸偏離(偏小)實際流域生物信息流水平(圖3),估算流域生物信息流的99.9%估值區(qū)間的最大偏離程度隨實際流域生物信息流降低而逐漸增大,估值區(qū)間相對于實際流域生物信息流水平的集中度逐漸降低(圖4),所以在實際流域生物信息流的值較低時,應(yīng)適當(dāng)提高平行樣數(shù)量,以通過提高樣點生物信息檢出度來提高估算流域生物信息流的精確度。2019年在青藏高原一個小型河流的流域生物信息流量化研究結(jié)果顯示,春季封凍期、夏季降雨天、秋季多云天的流域生物信息流估算結(jié)果分別為75.86%、97.41%、96.07%每千米[11],如果以10km2為間隔設(shè)置樣點,其樣點間流域生物信息流估值分別為6.31%、76.92%、66.97%,那么為了獲得一個可信的流域生物信息流正式估算值,各樣點的信息檢出度分別需要達(dá)到98%、50%、60%左右。
在上游樣點生物信息種類數(shù)小于下游樣點生物信息種類數(shù)的情況下,應(yīng)適當(dāng)提高平行樣數(shù)量。上游樣點的生物信息種類與下游樣點的生物信息種類的相對關(guān)系,并不影響樣點生物信息檢出度和實際流域生物信息流對估算流域生物信息流的影響規(guī)律,但影響了估算流域生物信息流的估算。由于在上游樣點生物信息種類數(shù)小于下游樣點生物信息種類數(shù)的情況下所估算的流域生物信息流估值比在下游樣點生物信息種類數(shù)小于上游樣點生物信息種類數(shù)的情況下所估算的流域生物信息流估值相對流域生物信息流實際值有更大的最優(yōu)估值偏離(偏小)程度(圖1、圖5對比)和更大的99.9%估值區(qū)間的幅寬和最大偏離程度(圖4、圖6對比),所以在上游樣點生物信息種類數(shù)小于下游樣點生物信息種類數(shù)時,應(yīng)適當(dāng)提高平行樣數(shù)量,以通過提高樣點生物信息檢出度來提高估算流域生物信息流的精確度。由于流域生物信息流會增加輸入水體的生物信息種類[3—4],因此通常情況下,上游樣點的生物信息種類會少于下游樣點的生物信息種類,在這種條件下,估算流域生物信息流最優(yōu)估值對實際流域生物信息流的偏小程度更大,估算流域生物信息流估值區(qū)間的幅寬和最大偏離程度也更大。由于流域生物信息流對所輸入水體的生物信息種類的增加在持續(xù)的向下游輸移過程中是非累計的[3],所以河流的干支流交匯處的生物信息種類會比交匯處下游較遠(yuǎn)處的生物信息種類要多,在這種條件下,估算流域生物信息流最優(yōu)估值對實際流域生物信息流的偏小程度會減小,估算流域生物信息流估值區(qū)間的幅寬和最大偏離程度也會減小。另外,隨著水體理化環(huán)境的轉(zhuǎn)變,流域生物信息流中的有效流域生物信息流部分會被環(huán)境過濾效應(yīng)所過濾掉,導(dǎo)致上游樣點的生物信息種類會多于下游樣點的生物信息種類[3],在這種條件下,估算流域生物信息流最優(yōu)估值對實際流域生物信息流的偏小程度會減小,估算流域生物信息流估值區(qū)間的幅寬和最大偏離程度也會減小。因而,相比于在河流交匯處及河流理化環(huán)境狀況急劇轉(zhuǎn)換處,在通常的河流條件下,流域生物信息流調(diào)查估算中需要更多的平行樣。
在上下游樣點生物信息種類數(shù)相對關(guān)系確定、實際流域生物信息流確定、樣點生物信息檢出度確定的情況下,理論上所可得的估算流域生物信息流的值依然是分布在某一特定估值區(qū)間,而非一個確切值。雖然說通過基于流域生物信息流估算可信度目標(biāo)的樣點生物信息檢出度控制可以提高理論上所可得的估算流域生物信息流的估值區(qū)間的集中度,進(jìn)而使得流域生物信息流估算值對實際值有較好的近似程度,但在實際應(yīng)用中還是有必要給出這個流域生物信息流估值所對應(yīng)的實際流域生物信息流(區(qū)間)及相應(yīng)后驗概率,以保障其結(jié)果的科學(xué)性嚴(yán)謹(jǐn)性,給不同研究之間的橫向比較提供科學(xué)可行合理可靠的基礎(chǔ)。
在實際調(diào)查評估工作中,上下游樣點生物信息種類數(shù)可以通過各調(diào)查樣點一定數(shù)量的平行樣的調(diào)查結(jié)果的物種積累曲線的分析而估算獲得[19],各調(diào)查樣點的樣點生物信息檢出度可以通過調(diào)查所得的生物信息種類數(shù)除以各相應(yīng)調(diào)查樣點的生物信息種類數(shù)而計算獲得[19],估算流域生物信息流的值可以通過上下游共有生物信息種類數(shù)除以上游樣點生物信息種類數(shù)而計算獲得[3],然后可以根據(jù)模擬計算公式組進(jìn)行相應(yīng)的模擬計算,再通過后驗概率計算實際流域生物信息流狀況及其概率分布。
流水水體中,自上游到下游的流域生物信息流過程十分復(fù)雜,涉及到eDNA的釋放、稀釋、吸附、再懸浮、輸移、降解等過程[13—15]。有一種方向是朝著弄清楚機理的方向努力,通過受控實驗弄清環(huán)境因子對流域生物信息流過程中各環(huán)節(jié)的影響,再通過各環(huán)境因子的參數(shù)化、流域生物信息流過程各環(huán)境的模型化來推動對整個流域生物信息流的理解和量化[17,31—33]。我們認(rèn)為,還可以有另外一個方向,即暫時先把流域生物信息流的復(fù)雜過程打包成黑箱,接受不確定性控制不確定性量化不確定性,通過輸入和輸出的量化分析,推進(jìn)流域生物信息流研究的應(yīng)用和發(fā)展。這即是我們所提出的流域生物信息流分析框架的處理問題方式[3,11],也是本研究的目的。
本文針對平行樣的增減是否會顯著改變以及會如何改變流域生物信息流的估算結(jié)果這一問題,通過對問題進(jìn)行簡化而轉(zhuǎn)化為檢出度是否會以及會如何影響估算流域生物信息流的問題,進(jìn)而通過模擬計算對其進(jìn)行了探討。模擬計算結(jié)果顯示,估算流域生物信息流的最優(yōu)估值小于實際流域生物信息流,隨著樣點生物信息檢出度(即平行樣數(shù)量)的增長估算流域生物信息流的最優(yōu)估值逐漸趨近于實際流域生物信息流值,估算流域生物信息流的估值區(qū)間逐漸集中于實際流域生物信息流值,即樣點生物信息檢出度越高(平行樣越多)估算流域生物信息流的準(zhǔn)確度和精密度越高。另外,實際流域生物信息流大小、上下游樣點生物信息種類數(shù)相對關(guān)系均對估算流域生物信息流的準(zhǔn)確度和精密度有明確影響:實際流域生物信息流越大估算流域生物信息流的準(zhǔn)確度和精密度越高,上游樣點的生物信息種類多于下游樣點的生物信息種類時的估算流域生物信息流的準(zhǔn)確度和精密度相對更高。在實際應(yīng)用中,為了提高流域生物信息流估算結(jié)果的可靠性,有必要基于流域生物信息流估算可信度目標(biāo)進(jìn)行樣點生物信息檢出度的控制,并且對流域生物信息流估算結(jié)果進(jìn)行后驗概率評估。