許曉青 余楚萌 徐榮林 劉 頌*
(1.同濟大學(xué)建筑與城市規(guī)劃學(xué)院,自然資源部國土空間智能規(guī)劃技術(shù)重點實驗室,上海 200092;2.四川農(nóng)業(yè)大學(xué)風(fēng)景園林學(xué)院,成都 611130;3.黃龍國家級風(fēng)景名勝區(qū)管理局,松潘 623306)
生物多樣性是人類賴以生存和社會可持續(xù)發(fā)展的基礎(chǔ),是地球生命共同體的血脈和根基。聲紋識別技術(shù)正在成為輔助生物多樣性監(jiān)測的重要手段,由于聲紋數(shù)據(jù)采集的特征及計算性生物聲學(xué)的發(fā)展,聲學(xué)技術(shù)在物種鑒別、種群研究、環(huán)境成因研究方面正表現(xiàn)出優(yōu)勢。以黃龍自然保護區(qū)為例,以指示性物種鳥類的鳴聲為對象,通過保護區(qū)中較高人為影響(黃龍景區(qū))和較低人為影響(張家溝)這兩個區(qū)域的被動式監(jiān)測,采集了6 303 min聲音數(shù)據(jù)。通過經(jīng)典聲學(xué)指數(shù)計算、人工智能物種識別與樣線調(diào)查相結(jié)合的方法,研究得出:(1)人工智能技術(shù)下鳥類多樣性及鳴聲時間分布特征;(2)聲紋識別技術(shù)較之于傳統(tǒng)調(diào)查方法更具有效性;(3)聲學(xué)指數(shù)計算對環(huán)境的響應(yīng)程度與有效性辨析。研究試驗性地對數(shù)據(jù)進行了分析闡釋,以黃龍自然保護區(qū)為例作為方法的探索,為此類保護地保護管理提供借鑒。
聲紋識別;鳥類多樣性;自然保護地;聲景;保護管理
生物多樣性是人類賴以生存和社會可持續(xù)發(fā)展的基礎(chǔ),是地球生命共同體的血脈和根基。聲景生態(tài)作為一門新興學(xué)科,綜合了生態(tài)學(xué)、生物聲學(xué)、城市環(huán)境聲學(xué)等多門學(xué)科理論與方法。其目標是理解和保護生物多樣性,以及管理和改善人類活動對環(huán)境的影響。聲景生態(tài)研究主要圍繞生物聲學(xué)和生態(tài)聲學(xué)兩個領(lǐng)域展開。現(xiàn)代生物聲學(xué)已有近70年的歷史,隨著計算性生物聲學(xué)的發(fā)展,使用人工智能輔助信號統(tǒng)計技術(shù),結(jié)合聲學(xué)指數(shù)評估物種多樣性和種群密度,以及使用各種機器學(xué)習(xí)技術(shù)進行物種識別正在興起[1]。
從生物聲學(xué)層面來看,聲景生態(tài)關(guān)注動物行為,研究動物個體間的聲信號交流,相關(guān)研究表明聲音可以作為物種分類依據(jù),為觀察動物行為和監(jiān)測生物多樣性提供了較好的機會[2-3]。Koehler等[4]發(fā)現(xiàn)許多鳴叫特征的定量差異在同物種個體之間存在顯著變化。也有學(xué)者從信號類型角度研究了水下生物[5-6]、蝙蝠[7-8]、鳥類[9]、蛙類[10]為代表的兩棲動物、哺乳動物[11]等的物種識別、豐度計算和評估方式[12]。此外,聲景生態(tài)也關(guān)注整體環(huán)境,自然與人的交互,其中包括動物聲音、植物聲音、環(huán)境聲音等多方面對人的改變[13]。Farina[14]認為地球物理聲、生物聲和人為聲是動物用來導(dǎo)航、交流以及將未知環(huán)境轉(zhuǎn)化為熟悉棲息地的重要線索,聲音可以通過自主音頻記錄設(shè)備記錄,并作為定量指標而被用來評估生物多樣性、環(huán)境健康和人類福祉。Do Nascimento等[15]在巴西羅賴馬州Viruá國家公園的研究證明聲景指數(shù)可以用來預(yù)測不同生境類型,并且提出聲景與植被結(jié)構(gòu)的最佳關(guān)聯(lián)指標為聲音均勻度指數(shù)(AEI)和偏度指數(shù)(SKEW);聲學(xué)指數(shù)是一種快速化解釋的工具,在進行環(huán)境成因分析方面具有優(yōu)勢。Fuller等[16]在澳大利亞破碎森林中的研究,提出可以作為研究區(qū)域生態(tài)監(jiān)測工具的三個指標為聲熵指數(shù)(H)、聲音均勻度指數(shù)(AEI)和標準化聲景差異指數(shù)(NDSI),它們與景觀特征、生態(tài)條件和鳥類物種豐富度相關(guān)性最高。Gasc等[17]認為應(yīng)用聲景生態(tài)學(xué)的重點在于開發(fā)基于聲景的干擾指標,其可以適用于不同生態(tài)系統(tǒng)和環(huán)境條件。此外,Buxton等[18]通過對36個最具指示性的指數(shù)建模,發(fā)現(xiàn)聲景指數(shù)模型能準確預(yù)測生物聲的高多樣性和低多樣性,對于中等多樣性的預(yù)測可靠性有待進一步增強。
近年來,聲景生態(tài)的研究在國內(nèi)呈現(xiàn)出火熱的趨勢。肖治術(shù)等[19]闡述了現(xiàn)代生物聲學(xué)的學(xué)科內(nèi)涵和學(xué)科特征,總結(jié)了動物生物聲學(xué)、生態(tài)聲學(xué)、水下生物聲學(xué)、環(huán)境生物聲學(xué)、保護生物聲學(xué)、計算生物聲學(xué)在生物多樣性領(lǐng)域的應(yīng)用前景。許曉青等[20]綜述了聲學(xué)手段輔助自然保護地生物多樣性監(jiān)測現(xiàn)狀及應(yīng)用建議,指出了聲學(xué)監(jiān)測的優(yōu)劣勢。多名學(xué)者從指數(shù)與動物多樣性、生境質(zhì)量、動物活躍性之間關(guān)聯(lián)的方向和程度方面進行了研究[21-22]。此外,也有研究聚焦于機器學(xué)習(xí)以及鳴聲數(shù)據(jù)庫在聲學(xué)監(jiān)測中的運用[23]。
總之,聲學(xué)監(jiān)測技術(shù)的應(yīng)用具有多方面的優(yōu)勢:(1)被動式聲學(xué)監(jiān)測技術(shù)有助于解決目前遇到的長時間、大面積、全物種動態(tài)監(jiān)測難題;(2)整合生態(tài)學(xué)、信息科學(xué)、人工智能手段,探究生物多樣性時空分布格局,在時間、物種、區(qū)域、經(jīng)濟成本等尺度上滿足生物多樣性調(diào)查的需求。但該技術(shù)還有待于在大量的自然保護地中被驗證與應(yīng)用?;诖?,本研究以黃龍自然保護區(qū)(一期)聲紋研究回答以下幾個科學(xué)問題:(1)聲紋監(jiān)測技術(shù)在物種識別方面是否更加有效;(2)聲學(xué)指數(shù)在不同的環(huán)境條件下的適用性。
黃龍自然保護區(qū)位于四川省阿壩藏族羌族自治州松潘縣境內(nèi),是世界自然遺產(chǎn)地。其獨特的地質(zhì)景觀由彩池、雪山、峽谷、森林4大景觀構(gòu)成,各類物種資源豐富,是重要的生物多樣性保護單元。黃龍自然保護區(qū)總面積14 601 hm2,包含一般控制區(qū)面積1 516 hm2,核心保護區(qū)面積13 091 hm2。區(qū)內(nèi)一部分是大熊貓的棲息地,大熊貓國家公園黃龍園區(qū)總面積53 301 hm2,一般控制區(qū)面積6 733 hm2,核心保護區(qū)面積46 568 hm2。從目前紅外相機監(jiān)測的大熊貓軌跡看,大熊貓的活動非常頻繁。對鳥類群落的監(jiān)測也從側(cè)面反映大熊貓這個傘護種帶來的傘護效應(yīng)。另一方面,監(jiān)測區(qū)域是棕頭歌鴝已知的極少數(shù)繁殖地之一,人類對這種神秘的鳥類還是知之甚少。本研究為了解其種群動態(tài)提供了一種新的監(jiān)測手段。
近10年來黃龍已基本形成了生物多樣性監(jiān)測的基礎(chǔ)。然而,與其他保護地類似,黃龍自然保護區(qū)生物多樣性保護工作普遍面臨生物物種資源數(shù)據(jù)庫信息缺乏、監(jiān)測和預(yù)警系統(tǒng)不完善、調(diào)研工作實施難度大、投入資金有限等問題。目前黃龍自然保護區(qū)主要運用的是紅外相機監(jiān)測,對于大熊貓等旗艦物種具有優(yōu)勢,但對于鳥類等的監(jiān)測還存在一定的局限性。因此,需要結(jié)合綜合監(jiān)測工具的方式,通過多源數(shù)據(jù)庫進一步完善物種的監(jiān)測。基于黃龍自然保護區(qū)在生物多樣性監(jiān)測中的重要地位以及黃龍自然保護區(qū)作為景區(qū)在不同人為影響程度下具有一定代表性的特點,針對目前監(jiān)測存在的問題,本研究采取被動式監(jiān)測的方式,對黃龍自然保護區(qū)的鳥類時空分布規(guī)律進行監(jiān)測并驗證聲學(xué)監(jiān)測和聲學(xué)指數(shù)的適用性。
為了加強對生物聲的采集,本研究選取了靈感科技國產(chǎn)被動監(jiān)測設(shè)備L-bird,該設(shè)備具有全向麥克風(fēng),可以24 h記錄聲音,其分辨率為16 bit。以每小時錄制前10 min休眠,用時50 min的方式進行采樣,音頻文件通過4G網(wǎng)絡(luò)回傳到數(shù)據(jù)終端,采樣率為44.1 kHz。采樣時間為2023年4月29日–6月7日,包含完整的一個月數(shù)據(jù)并覆蓋五一黃金周,共記錄音頻6 303 min。
考慮自然保護地土地覆蓋情況、冬季鳥類游蕩性強的特點,以及4G網(wǎng)絡(luò)和太陽能供電需求,本研究選擇在自然保護區(qū)中核心保護區(qū)內(nèi)的張家溝和核心保護區(qū)外的黃龍景區(qū)各布設(shè)一臺設(shè)備(圖1)。張家溝擁有豐富的生物多樣性資源,作為嚴格保護區(qū),其受到較少的干擾和破壞,可以更好地反映生態(tài)系統(tǒng)內(nèi)部的自然狀況。偶爾產(chǎn)生的人為利用影響為放牧影響。在核心保護區(qū)張家溝中,生物聲(主要是鳥類和蛙類等動物發(fā)出的聲音)是主要的監(jiān)測對象,這些生物聲是生態(tài)系統(tǒng)健康狀況的重要指標。而作為非保護區(qū)的黃龍景區(qū)則是人類活動較為頻繁的區(qū)域,該點位受到的人為利用噪聲包含游客的喧嘩、交談、腳步聲以及外放錄音機所產(chǎn)生的噪聲(表1)。通過兩者的對比,可以看出人為利用強度對鳥類多樣性的影響。
表1 設(shè)備布設(shè)選點環(huán)境條件、主要聲源、人為影響程度Tab. 1 Environmental conditions, main sound sources, and human impact degree of equipment location
圖1 設(shè)備布設(shè)位置和實景照片F(xiàn)ig. 1 Equipment layout
本研究通過傳統(tǒng)樣線樣方調(diào)查結(jié)合聲紋檢測的方式,對采集數(shù)據(jù)進行智能識別,實現(xiàn)黃龍自然保護區(qū)的生物物種的監(jiān)測。在實地調(diào)查工作包括了鳥類調(diào)查和植被調(diào)查,對于鳥類調(diào)查樣線設(shè)置,選取張家溝與黃龍景區(qū)兩條樣線,每條長度2 km,沿著樣線以1.5 ~2 km/h的速度行進,記錄兩側(cè)50 m范圍內(nèi)觀察到或聽到的野生鳥類種類和數(shù)量。每條樣線在早上和傍晚各調(diào)查一次。對于植被調(diào)查,分別選取20 m×20 m、5 m×5 m、1 m×1 m的樣方,進行了植物種類、高度、蓋度、數(shù)量、冠幅、胸徑、物候期、所屬層級等數(shù)據(jù)的記錄。
本文采用了聲紋監(jiān)測法和樣線樣點采樣法兩種方式對張家溝和黃龍景區(qū)進行了物種識別調(diào)查與分析:在兩條監(jiān)測樣線附近進行采樣,并對采集的樣本進行分類和數(shù)據(jù)分析,并計算香農(nóng)多樣性指數(shù)(H),見公式(1)。式中,Ln為自然對數(shù),Pi為由物種i組成的整個群落的比例。
在完成聲紋數(shù)據(jù)處理與分離后,采用卷積神經(jīng)動物網(wǎng)絡(luò)(CNN)技術(shù)提取聲音的時頻特征,并將其轉(zhuǎn)化為可以輸入到分類器中的向量,通過大量物種聲音數(shù)據(jù)為輸入進行模型訓(xùn)練以及物種識別,最終結(jié)合大數(shù)據(jù)爬取和專家知識圖譜的方式對識別結(jié)果進行復(fù)核和校驗(圖2)。為了更加直觀顯示數(shù)值變動表現(xiàn)兩個點位鳥類鳴聲的時空分布規(guī)律,本研究通過Tableau進行數(shù)據(jù)可視化,在環(huán)形熱圖中以顏色變化來展示數(shù)據(jù)分布情況,其清晰地顯示出不同時間段內(nèi)張家溝核心區(qū)和黃龍景區(qū)緩沖區(qū)的生物聲和人為聲的情況,并用曲線可視化表達鳥類鳴聲規(guī)律。此外,利用點狀圖對周圍單位的聲學(xué)指數(shù)監(jiān)測數(shù)據(jù)的最大值以及方差進行表達,直觀反映指數(shù)的波動和變異程度。本研究通過R軟件計算了經(jīng)典指數(shù)ACI、ADI、H、BIO、NDSI、AEI(表2),以進一步研判指數(shù)所闡釋的生態(tài)學(xué)意義以及背后的成因。
表2 指數(shù)計算公式及其生態(tài)學(xué)意義Tab. 2 Formula for index calculation and its ecological significance
圖2 聲紋數(shù)據(jù)處理流程Fig. 2 Voiceprint data processing process
經(jīng)樣線調(diào)查分析,2條樣線4次調(diào)查共記錄鳥類19種,其中黃龍景區(qū)12種,張家溝12種,5種為2條樣線均有記錄。國家二級重點保護野生動物2種:橙翅噪鹛和喜山鵟;中國特有種1種:橙翅噪鹛。記錄數(shù)量最多的鳥類前5位分別為煙腹毛腳燕、戴菊、霍氏旋木雀、黑冠山雀和橙翅噪鹛(圖3)。
圖3 鳥類實地調(diào)查照片F(xiàn)ig. 3 Field survey photos of birds
收集了兩臺聲學(xué)監(jiān)測設(shè)備經(jīng)AI識別和人工復(fù)核的數(shù)據(jù),共篩選出高置信度鳥類鳴聲2 973條,共識別出鳥類43種,隸屬于2目16科;其中兩處共有的鳥類16種。國家二級保護動物2種:橙翅噪鹛和大噪鹛。鳴聲數(shù)量最多的鳥種前5位分別為橙翅噪鹛、烏嘴柳鶯、棕眉柳鶯、銹胸藍姬鹟和黃眉柳鶯。為了進一步確定鳥類的多樣性,計算香農(nóng)多樣性指數(shù),結(jié)合物種判斷多度。
對兩種監(jiān)測方法下的調(diào)查結(jié)果比較分析(表3),發(fā)現(xiàn)從物種角度聲紋監(jiān)測已經(jīng)展現(xiàn)出了較強的優(yōu)勢。聲學(xué)監(jiān)測得到的物種數(shù)(43種)多于4次樣線調(diào)查得到的物種數(shù)(19種)。樣線調(diào)查的19種中有11種在聲學(xué)監(jiān)測中也記錄到了。將兩種監(jiān)測方式進行對比,能明顯確定的是黃龍景區(qū)和張家溝在聲紋監(jiān)測中記錄了更多的鳥類種數(shù)和個體數(shù)。比較其與樣點樣線方法在物種識別上的差別,發(fā)現(xiàn)雖然通過兩種研究方法得到的規(guī)律相似,但使用聲學(xué)檢測技術(shù)分析得到的種數(shù)和個體數(shù)量均遠超樣線樣點調(diào)查法所得結(jié)果,顯示出較高的準確性。因此,聲紋庫和訓(xùn)練模型是影響物種識別精準性的重要因素之一,而深度學(xué)習(xí)算法則是實現(xiàn)高精度物種識別的關(guān)鍵。
表3 兩種監(jiān)測方式調(diào)查結(jié)果Tab. 3 Investigation results of two monitoring methods
選擇了代表物種豐富度的BIO(圖4,圖5),代表人為影響與生物聲的NDSI(圖6,圖7),以及反映聲音豐富度的ACI(圖8,圖9)進行兩個點位的指數(shù)計算,并用環(huán)形熱圖的形式進行可視化。通過對比BIO指數(shù)數(shù)值可知,黃龍景區(qū)(代表人為干擾較大)的鳴聲高峰與張家溝(代表幾乎無人為聲干擾)存在一致性,高峰都發(fā)生在6:30–9:30左右,但由于黃龍景區(qū)人為影響因素較強,黃龍景區(qū)內(nèi)(緩沖區(qū))的鳴聲高峰持續(xù)的時間較張家溝(核心區(qū))更短,大約在8:30左右結(jié)束。通過識別張家溝這個時段最多的是橙翅噪鹛、鷦鷯、銹胸藍姬鹟、烏嘴柳鶯。結(jié)合鳥類活動節(jié)律曲線(圖10)來看,以烏嘴柳蔭為例的鳥類鳴聲整體呈現(xiàn)早晚兩個活動高峰,符合森林生境下的鳥類活動規(guī)律,但曲線波動較大。但因監(jiān)測密度較低、監(jiān)測周期較短,總體有效數(shù)據(jù)量較少,日活動節(jié)律的規(guī)律性不夠明顯,存在偶然記錄。
圖4 黃龍景區(qū)BIO值Fig. 4 BIO value of the scenic area
圖5 張家溝BIO值Fig. 5 BIO value of Zhangjiagou
圖6 黃龍景區(qū)NDSI值Fig. 6 NDSI value of the scenic area
圖7 張家溝NDSI值Fig. 7 NDSI value of Zhangjiagou
圖8 黃龍景區(qū)ACI值Fig. 8 ACI value of the scenic area
圖9 張家溝ACI值Fig. 9 ACI value of Zhangjiagou
圖10 鳥類日活動節(jié)律Fig. 10 Bird activity rhythm on a daily basis
NDSI指數(shù)反映了生物聲和人類聲的影響。在環(huán)形熱圖中,紅色部分代表的是生物聲,藍色部分代表人為聲。張家溝和黃龍景區(qū)相比,在某些時段,生物聲更為主導(dǎo),但是作為黃龍景區(qū)的緩沖區(qū),幾乎沒有生物聲主導(dǎo)的時間。從聲音豐富度角度講,5月1日–9日,黃龍景區(qū)ACI的值變化波動較大,頻譜顯示這一段時間產(chǎn)生了更為豐富的聲音變化和波動,從時間上看,正好與黃金周黃龍景區(qū)的高到訪率吻合。
對兩個點位的聲學(xué)指數(shù)BIO、NDSI、ACI數(shù)值進行可視化表達,比較發(fā)現(xiàn)黃龍景區(qū)內(nèi),鳥類的空間活躍度由于不同人為利用梯度而呈現(xiàn)差異;共性是時間節(jié)律上呈現(xiàn)早晚兩個活動高峰的現(xiàn)象,黃龍景區(qū)(代表人為干擾較大)的鳴聲高峰與張家溝(代表幾乎無人為聲干擾)存在一致性,高峰都發(fā)生在6:30至9:30左右,但由于黃龍景區(qū)人為影響因素較強,黃龍景區(qū)內(nèi)(緩沖區(qū))的鳴聲高峰持續(xù)的時間較張家溝(核心區(qū))更短,大約在8:30左右結(jié)束。人聲干擾程度會降低鳴聲高峰的持續(xù)時間。
鑒于單個物種識別的難度挑戰(zhàn)以及精細化探索產(chǎn)生的大量數(shù)據(jù),越來越多研究走向了數(shù)據(jù)可以被相對快速、大批量處理的聲景指數(shù)評估。但聲景指數(shù)的計算不考慮單個物種,在監(jiān)測中要求必須嚴格理解指數(shù)與生物多樣性真實測量值間的關(guān)系,即通過其他方式收集的生物群落信息對其進行驗證和校準。目前尚未形成對指數(shù)普適性應(yīng)用場景的綜合性研究,對于聲景指數(shù)的可擴展性和廣泛適用性還存在一些爭議。
盡管如此,聲景指數(shù)仍可以被用作突顯或過濾某些聲源的指標以幫助監(jiān)測數(shù)據(jù)的篩選和排除。由于每種聲源的特性不同,一些聲源的變化和浮動可以在聲學(xué)指數(shù)中反映出來。例如鳥類群落的高頻快速鳴叫相比于汽車飛機等恒定頻率的人為噪聲,在ACI中會產(chǎn)生更高值[29]。本研究通過抽樣一周的聲學(xué)指數(shù)驗證,張家溝與黃龍景區(qū)的聲紋特征形成較為鮮明的對比(圖11,圖12),黃龍景區(qū)內(nèi)各聲學(xué)指數(shù)以周為單位波動較小,但張家溝(核心區(qū))以周為單位的聲學(xué)指數(shù)波動都較大。其原因可能是張家溝(核心區(qū))幾乎是處于無人為打擾的狀態(tài),一定程度上會導(dǎo)致聲學(xué)反映更為靈敏,指數(shù)的變異性更大。
圖11 黃龍景區(qū)各指數(shù)變化情況Fig. 11 Changes in each index of the scenic area
圖12 張家溝各指數(shù)變化情況Fig. 12 Changes in each index of Zhangjiagou
由于單個樣點的環(huán)境特征基本不變,聲景指數(shù)可以通過不同時間序列的數(shù)值大小比較來判斷不同時間切片下動物群落的聲音活動和干擾前后的聲景變化,未來可針對氣候變化,物種入侵,人為活動干擾[30-31],管理部門保護工作干預(yù)成效等因素對保護地所面臨問題進行具體分析。
本文以黃龍自然保護區(qū)為例,基于為期一個月的6 303 min的聲音數(shù)據(jù)采集作為試驗,通過物種識別結(jié)合聲音指數(shù)分析的方式,選擇了人為干擾兩種不同梯度條件下的鳴聲特征進行分析。研究發(fā)現(xiàn)了鳴聲特征的一般規(guī)律,證實了聲紋監(jiān)測的有效性,聲學(xué)指數(shù)的使用特征,并希望未來在物種識別能力、時空規(guī)律揭示方面產(chǎn)生更新的突破。未來的研究將在以下兩方面進行突破:
(1)物種識別的精準性進一步提升。本研究完成了岷山地區(qū)鳥類聲紋庫建立,通過大數(shù)據(jù)爬取和專家知識圖譜的方式進行了核驗,此工作融合了專家知識與大數(shù)據(jù),具有不可替代性。該數(shù)據(jù)庫包含了從xeno-canto.org開源數(shù)據(jù)收集的82 406條聲音數(shù)據(jù)。從已經(jīng)收集得到6 303多條數(shù)據(jù)中選取了置信度較高的2 973條進行物種標簽識別。通過卷積神經(jīng)網(wǎng)絡(luò)技術(shù)結(jié)合人工辨識,建立了初步的置信度較高的黃龍鳥類聲紋識別模型。有研究表明,卷積神經(jīng)網(wǎng)絡(luò)技術(shù)輔助聲學(xué)監(jiān)測可以保證物種識別準確率達到94%[32],但還應(yīng)通過語圖樣本集的建立和計算對模型進行訓(xùn)練,進一步提高識別準確率[33]。
(2)通過聲紋識別輔助生物多樣性保護與管理。通過黃龍自然保護區(qū)的聲紋與生物多樣性研究,已經(jīng)初步證實了聲紋技術(shù)的有效性。未來將在如何通過聲紋技術(shù)輔助保護地管理方面進一步努力,結(jié)合對自然保護地的已有研究基礎(chǔ)[34-35],對人為產(chǎn)生的影響定量化分析,從而更為精準地對保護地的人為影響進行管控,更好地實現(xiàn)生物多樣性保護與地方發(fā)展。
注:文中圖表均由作者自繪/攝。