亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的鳥聲識(shí)別技術(shù)研究
        ——以北京翠湖國(guó)家城市濕地公園為例

        2024-04-15 11:20:24王一宇郭慧敏鑒海防
        園林 2024年4期
        關(guān)鍵詞:翠湖鳥類音頻

        王一宇 夏 舫 劉 松 彭 濤 郭慧敏 鑒海防*

        (1.中國(guó)科學(xué)院半導(dǎo)體研究所,北京 100083;2.山東師范大學(xué)物理與電子科學(xué)學(xué)院,濟(jì)南 250358;3.北京市海淀區(qū)濕地和野生動(dòng)植物保護(hù)管理中心,北京 100094)

        鳥類是生態(tài)系統(tǒng)的重要組成部分,在評(píng)估生態(tài)系統(tǒng)狀態(tài)方面具有不可忽視的作用,因此鳥類的調(diào)查和監(jiān)測(cè)對(duì)于保護(hù)生態(tài)環(huán)境和維護(hù)生物多樣性至關(guān)重要。傳統(tǒng)的鳥類監(jiān)測(cè)手段需要消耗大量人力物力,并且結(jié)果的準(zhǔn)確性和可靠性有限。針對(duì)這一問(wèn)題,提出一種基于深度學(xué)習(xí)的鳥類聲音數(shù)據(jù)分析識(shí)別系統(tǒng),并在北京翠湖國(guó)家城市濕地公園進(jìn)行應(yīng)用示范,以驗(yàn)證系統(tǒng)的性能和準(zhǔn)確性。該系統(tǒng)首先使用傳統(tǒng)聲音信號(hào)處理方法對(duì)前端拾音器采集的音頻進(jìn)行預(yù)處理,然后使用殘差神經(jīng)網(wǎng)絡(luò)提取音頻特征并進(jìn)行分類,從而實(shí)現(xiàn)對(duì)目標(biāo)聲音所包含物種信息的自動(dòng)識(shí)別。在系統(tǒng)運(yùn)行期間,成功監(jiān)測(cè)到有效鳥類聲音片段共計(jì)200 044條,其識(shí)別準(zhǔn)確率達(dá)到93%。系統(tǒng)共識(shí)別出野生鳥類9目16科52種,其中,屬于國(guó)家II級(jí)重點(diǎn)保護(hù)野生動(dòng)物有6種,分別是大天鵝、鴻雁、紅角鸮、縱紋腹小鸮、藍(lán)喉歌鴝、游隼;屬于北京市重點(diǎn)保護(hù)野生動(dòng)物共計(jì)22種,分別是蒼鷺、夜鷺、普通鸕鶿、綠頭鴨等。監(jiān)測(cè)到音頻片段中相對(duì)多度較高的前5個(gè)物種依次是蒼鷺(26%)、鴻雁(16%)、夜鷺(13%)、白頭鵯(11%)、普通鸕鶿(8%)。實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)實(shí)現(xiàn)了對(duì)鳥類聲音的自動(dòng)采集和分析,顯著提高了鳥類監(jiān)測(cè)的效率,為風(fēng)景園林的合理規(guī)劃、生態(tài)節(jié)點(diǎn)的保留以及景觀可持續(xù)性的提升提供了有力支持。

        翠湖國(guó)家城市濕地公園;鳥類監(jiān)測(cè);深度學(xué)習(xí);鳥類聲音識(shí)別;鳥類多樣性;北京

        在城市的綠化區(qū)域中,鳥類的群落結(jié)構(gòu)與植被類型的多樣性緊密相連。由于各種鳥類對(duì)生活環(huán)境的需求存在差異,因此它們對(duì)棲息地的要求也不盡相同。茂密的樹冠和較為安靜的環(huán)境為鳥類提供了理想的棲息地,而低矮的灌木叢則為它們提供了獲取食物的場(chǎng)所[1]。在國(guó)內(nèi),園林作為城市中較少展現(xiàn)森林景觀的地方,在保護(hù)城市鳥類和維護(hù)城市綠地系統(tǒng)方面扮演著關(guān)鍵角色。園林綠地植被不僅增加了城市綠化覆蓋率,還為鳥類提供了重要的生態(tài)環(huán)境空間。

        然而,隨著中國(guó)城市化快速推進(jìn),土地利用形式和性質(zhì)發(fā)生了急劇變化,導(dǎo)致鳥類原始棲息地環(huán)境遭到破壞,城市生態(tài)環(huán)境逐漸惡化。盡管城市規(guī)劃結(jié)構(gòu)為人類提供了方便,其卻對(duì)鳥類的穩(wěn)定性和物種多樣性帶來(lái)了不利影響。城市快速發(fā)展導(dǎo)致短期內(nèi)生態(tài)環(huán)境的劇變,給鳥類帶來(lái)了更大的環(huán)境適應(yīng)壓力,使它們面臨更嚴(yán)峻的生存挑戰(zhàn)[1]。在城市中,鳥類以城市公園綠地為主要棲息地,它們?cè)谶@里直接或間接地獲取食物。《園冶》強(qiáng)調(diào)了鳥類在構(gòu)成中國(guó)園林中的重要作用,從中國(guó)古典園林美學(xué)的角度來(lái)看,動(dòng)物景觀作為越發(fā)被重視的組成部分,聲音美被提到了一個(gè)重要層面,鳥類發(fā)出的鳴聲正滿足了這一層面的需求[2]。通過(guò)鳥類監(jiān)測(cè),研究人員可以評(píng)估園林修復(fù)計(jì)劃對(duì)多樣性鳥類群落的吸引力,從而提高生態(tài)系統(tǒng)中物種的多樣性;通過(guò)了解鳥類在不同環(huán)境中的棲息偏好,可以更有效地設(shè)計(jì)和改進(jìn)園林修復(fù)計(jì)劃,創(chuàng)造更加適宜的生態(tài)環(huán)境;同時(shí)鳥類對(duì)環(huán)境變化十分敏感,它們的存在和數(shù)量可作為環(huán)境健康的指標(biāo),通過(guò)監(jiān)測(cè)鳥類的活動(dòng),能更好地了解環(huán)境中潛在問(wèn)題,如污染和棲息地破壞,為環(huán)境管理提供有力的數(shù)據(jù)支持[3]。

        目前,對(duì)于園區(qū)鳥類的保護(hù)監(jiān)測(cè),通常采用傳統(tǒng)的人工監(jiān)測(cè)手段,多數(shù)鳥類在晝間活動(dòng),可通過(guò)望遠(yuǎn)鏡直接觀察,辨識(shí)種類和技術(shù);習(xí)性較為隱秘的鳥類可通過(guò)聲音偵測(cè)并記錄,鳥類通常在繁殖前期和每天日出前會(huì)發(fā)出復(fù)雜的鳴聲,研究人員可在這些時(shí)段辨別種類;一些外觀相似,鳴聲差異大的鳥類也可以通過(guò)聲音輕松識(shí)別;還有一些鳥類可以通過(guò)飛行姿態(tài)和覓食行為來(lái)鑒定[4]。目前,常規(guī)檢測(cè)中常用的方法是樣線法,調(diào)查人員沿著一段樣線勻速前進(jìn)時(shí)記錄見到或聽到的沿線兩側(cè)的鳥類及其據(jù)樣線的垂直距離然后通過(guò)距離取樣原理,記錄該生境中鳥類的密度[5]。由于有的地形較為崎嶇,可采用樣點(diǎn)法,將樣線換成樣點(diǎn),調(diào)查人員依次到達(dá)事先設(shè)定好的樣點(diǎn),記錄一段時(shí)間內(nèi)鳥類種類和距離以及數(shù)量[6]。但是這些方法不僅需要大量的人力物力,而且需要具備專業(yè)知識(shí)的鳥類專家才能進(jìn)行辨別[4],難以實(shí)現(xiàn)高效的鳥類監(jiān)測(cè)。隨著觀鳥活動(dòng)的興起,公民科學(xué)也成為了重要的鳥類監(jiān)測(cè)方式,但是這種方式取決于所在地區(qū)的到達(dá)難易程度和當(dāng)?shù)赜^鳥者的數(shù)量。同時(shí)觀鳥者傾向于記錄更為稀有的鳥類,對(duì)常年的鳥類記錄不準(zhǔn)確,容易導(dǎo)致偏差。與此同時(shí),保護(hù)園區(qū)的視頻監(jiān)控系統(tǒng)主要面向安防監(jiān)控需求,監(jiān)控?cái)?shù)據(jù)每隔一段時(shí)間就會(huì)被覆蓋,導(dǎo)致無(wú)法進(jìn)行有效數(shù)據(jù)的存放與分析。

        近年來(lái),隨著以深度學(xué)習(xí)為代表的人工智能技術(shù)的不斷發(fā)展,基于深度學(xué)習(xí)的聲音識(shí)別技術(shù)取得了顯著的進(jìn)步,并在語(yǔ)音處理[7]、語(yǔ)音識(shí)別[8-9]等領(lǐng)域得到了廣泛應(yīng)用。受此啟發(fā),一些研究者嘗試將該類技術(shù)應(yīng)用在鳥類聲音識(shí)別任務(wù)中[10],通過(guò)特征提取和分類訓(xùn)練實(shí)現(xiàn)鳥類物種信息的自動(dòng)識(shí)別(圖1)。2021年,康奈爾大學(xué)鳥類學(xué)實(shí)驗(yàn)室通過(guò)開發(fā)一種名為BirdNET的深度神經(jīng)網(wǎng)絡(luò),能夠識(shí)別出北美和歐洲的大部分鳥類[11];2022年,廣州大學(xué)電子與通信工程學(xué)院的團(tuán)隊(duì)在廣州市白云山公園嘗試運(yùn)用無(wú)監(jiān)督的音節(jié)聚類分析提取鳥鳴音節(jié)并對(duì)其進(jìn)行推斷分類,實(shí)現(xiàn)了對(duì)鳥類聲音的識(shí)別[12]。在鳥類識(shí)別軟硬件系統(tǒng)方面,科研人員、研究機(jī)構(gòu)也同樣開展了許多研究。例如,Hüppo等[13]通過(guò)布設(shè)自動(dòng)錄音裝置錄制不同天氣條件下的鳥聲音頻數(shù)據(jù),能夠分析得出鳥類遷徙活動(dòng)與天氣之間的關(guān)系,進(jìn)而評(píng)估風(fēng)力發(fā)電廠對(duì)歐洲候鳥種群的潛在影響;2016年,加拿大自然資源部的科學(xué)家基于計(jì)算機(jī)視覺(jué)技術(shù)和機(jī)器學(xué)習(xí)算法開發(fā)了鳥類視頻監(jiān)測(cè)系統(tǒng),其能夠?qū)崿F(xiàn)鳥類巢穴和繁殖情況的有效監(jiān)測(cè);2019年,西南林業(yè)大學(xué)基于人工智能技術(shù)構(gòu)建了云南野生鳥類自動(dòng)圖像識(shí)別系統(tǒng),以識(shí)別出云南省全境鳥類并給出該種類個(gè)體對(duì)應(yīng)的目科屬等相關(guān)信息[14]。綜上所述,目前常見的野外聲音監(jiān)測(cè)設(shè)備在野外放置一段時(shí)間進(jìn)行錄音后帶回交由專家分析,無(wú)法實(shí)時(shí)錄音識(shí)別。現(xiàn)有的野外實(shí)時(shí)監(jiān)測(cè)設(shè)備,能夠進(jìn)行鳥類自動(dòng)識(shí)別的軟硬件系統(tǒng)大多基于圖像數(shù)據(jù)進(jìn)行分析。這類系統(tǒng)通常需要足夠的光照條件才能正常工作,陰天、黑夜或惡劣的天氣條件下會(huì)影響圖像的質(zhì)量和穩(wěn)定性,難以實(shí)現(xiàn)全天候的鳥類監(jiān)測(cè)。

        圖1 鳥類聲音識(shí)別流程圖Fig. 1 Flowchart of bird voice recognition model

        針對(duì)以上問(wèn)題,本研究基于深度學(xué)習(xí)和信號(hào)處理技術(shù),構(gòu)建鳥類聲音識(shí)別系統(tǒng),對(duì)采集到的聲音數(shù)據(jù)進(jìn)行實(shí)時(shí)自動(dòng)識(shí)別,不僅能夠高效獲取不同時(shí)間段鳥類多樣性的變化情況,還能夠自動(dòng)識(shí)別記錄該保護(hù)區(qū)出現(xiàn)的新鳥類物種,可以為風(fēng)景園林的景觀規(guī)劃提供重要信息。

        1 研究方法

        1.1 研究區(qū)概況

        北京翠湖國(guó)家城市濕地公園(以下簡(jiǎn)稱北京翠湖)位于北京市海淀區(qū)上莊鎮(zhèn)上莊水庫(kù)北岸,坐標(biāo)為40°5′36″S–40°06′39″ N,116°10′27″ W–116°11′28″ E,是北京最大或也是僅有的一塊自然濕地[15]。北京翠湖植被茂盛,鳥類物種豐富,在春秋遷徙季是鳥類重要補(bǔ)給地和棲息地。到目前為止,在北京翠湖共觀察到野生鳥類21目64科281種中,屬于國(guó)家級(jí)重點(diǎn)保護(hù)野生動(dòng)物(2021)共63種,其中I級(jí)保護(hù)鳥類13種,II級(jí)保護(hù)鳥類50種;屬于北京市保護(hù)野生動(dòng)物(2021)共112種,其中I級(jí)保護(hù)鳥類17種,II級(jí)保護(hù)鳥類95種[16]。

        1.2 平臺(tái)簡(jiǎn)介

        鳥類聲音識(shí)別系統(tǒng)由北京翠湖與中國(guó)科學(xué)院半導(dǎo)體研究所合作建設(shè),監(jiān)測(cè)對(duì)象為北京翠湖候鳥。系統(tǒng)架構(gòu)包括設(shè)備端、數(shù)據(jù)終端和數(shù)據(jù)展示端。具體工作流程見圖2,前端拾音器設(shè)備負(fù)責(zé)周圍聲音數(shù)據(jù)的實(shí)時(shí)采集;后端邊緣設(shè)備通過(guò)內(nèi)置的聲音信號(hào)端點(diǎn)檢測(cè)算法與鳥類聲音識(shí)別算法完成對(duì)采集聲音片段的自動(dòng)分析處理;在獲取到檢測(cè)結(jié)果后,通過(guò)無(wú)線網(wǎng)絡(luò)傳輸模塊將識(shí)別結(jié)果與對(duì)應(yīng)的音頻數(shù)據(jù)傳輸?shù)綌?shù)據(jù)終端進(jìn)行可視化展示。

        圖2 鳥類聲音識(shí)別系統(tǒng)流程圖Fig. 2 Flowchart of bird sound recognition system

        系統(tǒng)從數(shù)據(jù)終端獲取到監(jiān)測(cè)結(jié)果后,會(huì)自動(dòng)在監(jiān)測(cè)界面(圖3)中設(shè)備安裝點(diǎn)位彈出相應(yīng)的鳥類圖像并播放聲音。與此同時(shí),當(dāng)天監(jiān)測(cè)到的所有鳥類物種信息也會(huì)在右下角的監(jiān)測(cè)記錄中滾動(dòng)播放,便于管理者及時(shí)了解園內(nèi)的鳥類信息。

        圖3 鳥類聲音識(shí)別系統(tǒng)監(jiān)測(cè)界面Fig. 3 Monitoring interface of intelligent bird sound recognition system

        1.3 硬件系統(tǒng)架構(gòu)

        (1)聲音拾取設(shè)備(拾音器)。本系統(tǒng)采用的聲音拾取設(shè)備為烽火通信科技股份有限公司生產(chǎn)的烽火FH-300 N室外防水防爆峰火拾音器。該拾音器的采樣率為36 KHz,指向性為全向,靈敏度為-36±3 dBV,最大承受聲壓為128 dB SPL,信噪比為65 dB。其同時(shí)具有噪聲抑制功能,能夠?qū)崿F(xiàn)保護(hù)區(qū)內(nèi)聲音數(shù)據(jù)的實(shí)時(shí)采集及噪聲抑制。

        (2)鳥類聲音識(shí)別邊緣設(shè)備。鳥類聲音識(shí)別邊緣設(shè)備是一種集成鳥聲識(shí)別算法與計(jì)算模塊的嵌入式系統(tǒng)設(shè)備,能夠在設(shè)備本地進(jìn)行聲音信號(hào)的處理和分析,實(shí)現(xiàn)對(duì)鳥類聲音的不間斷監(jiān)測(cè)與實(shí)時(shí)識(shí)別,并通過(guò)寬帶網(wǎng)絡(luò)或4G/5G無(wú)線網(wǎng)絡(luò)將聲音樣本和識(shí)別結(jié)果按照不同的主題(Topic)通過(guò)分布式消息隊(duì)列(Kafka)發(fā)送到數(shù)據(jù)終端平臺(tái)。

        (3)數(shù)據(jù)終端平臺(tái)。數(shù)據(jù)終端平臺(tái)從Kafka接收音頻數(shù)據(jù)和對(duì)應(yīng)識(shí)別結(jié)果之后,將音頻保存在本地,并將音頻位置和識(shí)別結(jié)果寫入數(shù)據(jù)庫(kù)。

        (4)開發(fā)用戶界面(UI)。通過(guò)UI,在有新數(shù)據(jù)存入數(shù)據(jù)庫(kù)之后,自動(dòng)進(jìn)行數(shù)據(jù)獲取,并在監(jiān)測(cè)界面中設(shè)備安裝點(diǎn)位彈出相應(yīng)的鳥類圖像并播放聲音。

        1.4 軟件系統(tǒng)構(gòu)建

        1.4.1 信號(hào)預(yù)處理

        鳥類聲音識(shí)別設(shè)備采集到聲音數(shù)據(jù)后,由于原始聲音信號(hào)中含有大量的環(huán)境噪音和靜音片段,需要對(duì)其進(jìn)行預(yù)處理以提高識(shí)別效果。為此,可以使用聲音信號(hào)降噪算法和聲音信號(hào)端點(diǎn)檢測(cè)算法,對(duì)聲音信號(hào)進(jìn)行分析和處理。具體為,首先通過(guò)聲音信號(hào)降噪算法去除環(huán)境噪音對(duì)聲音信號(hào)的影響,以獲得更清晰的聲音信號(hào);然后,通過(guò)聲音信號(hào)端點(diǎn)檢測(cè)算法,去除無(wú)效的靜音片段,以提取有效的聲音片段。

        由于鳥類聲音信號(hào)中高頻成分較少,且高頻信號(hào)的衰減率比低頻高,因此在提取特征前要進(jìn)行預(yù)加重,補(bǔ)償高頻分量在傳輸中衰減的部分,以增強(qiáng)聲音信號(hào)中高頻部分的分辨率。在此,運(yùn)用一階有限長(zhǎng)單位沖激響應(yīng)高通數(shù)字濾波器(FIR)對(duì)信號(hào)進(jìn)行預(yù)加重[17],具體見公式(1)。

        式中,為輸入信號(hào),n為時(shí)間點(diǎn),為預(yù)加重后的輸出信號(hào)。α為預(yù)加重系數(shù),一般取值范圍是0.9<α<1,在本研究中,將其設(shè)置為0.97。

        鳥聲信號(hào)多為非平穩(wěn)信號(hào)[18],因此,在對(duì)長(zhǎng)序列聲音信號(hào)做傅里葉變換時(shí),需要先通過(guò)窗函數(shù)h(n)對(duì)原始信號(hào)進(jìn)行分幀,以確保局部信號(hào)的平穩(wěn)性;再逐段進(jìn)行傅里葉變換得到信號(hào)的局部“頻譜”;最后,將多個(gè)局部“頻譜”按時(shí)間維度進(jìn)行堆疊,生成完整的聲音譜圖,相應(yīng)的短時(shí)傅里葉變換見公式(2)。式中,STFT(t,ω)表示在時(shí)刻t和頻率ω處的短時(shí)傅里葉變換結(jié)果。

        1.4.2 梅爾濾波器

        根據(jù)接收信號(hào)頻率的不同,人耳耳蝸在進(jìn)行聲音信號(hào)獲取時(shí),對(duì)不同頻率的感知能力是非線性的,通常對(duì)低頻信號(hào)敏感,對(duì)高頻信號(hào)不敏感。因此,在進(jìn)行聲音信號(hào)的采集時(shí),需要考慮到人耳的感知特征,為了模擬人耳這種效應(yīng),本研究將使用梅爾濾波器對(duì)每幀信號(hào)進(jìn)行濾波,通過(guò)梅爾濾波器組的輸出公式見(3)。

        式中,k表示信號(hào),x(t)經(jīng)過(guò)FFT變換后的編號(hào),m表示梅爾濾波器的編號(hào)。其中,梅爾濾波器組Hm(k)是一系列等高的三角形濾波器,具體見公式(4)。式中,f(m)為中心頻率。

        1.4.3 網(wǎng)絡(luò)結(jié)構(gòu)

        卷積神經(jīng)網(wǎng)絡(luò)(CNN)[19]是實(shí)現(xiàn)聲音信號(hào)特征提取及分類的主流方式之一,主要由卷積層、池化層、全連接層等構(gòu)成,例如VGGNet[20]、GoogLeNet[21]、ResNet[22]。VGGNet網(wǎng)絡(luò)的結(jié)構(gòu)非常簡(jiǎn)潔,整個(gè)網(wǎng)絡(luò)都使用了同樣大小的卷積核尺寸(3×3)和最大池化尺寸(2×2),其中VGG19比VGG16增加了三層卷積核,但由于缺乏殘差連接塊,導(dǎo)致模型在訓(xùn)練和推理過(guò)程中需要更多的計(jì)算資源。GoogLeNet由多個(gè)Inception模塊堆疊而成,這些模塊在同一層級(jí)上使用不同大小的卷積核并行運(yùn)行,然后將結(jié)果合并,以提高特征表征的豐富度和計(jì)算效率。相較于同等深度的VGGNet,GoogleNet使用了更少的參數(shù)。然而,隨著模型深度的不斷增加,仍然會(huì)在訓(xùn)練過(guò)程中遇到梯度消失的問(wèn)題。針對(duì)深層模型難以訓(xùn)練的問(wèn)題,ResNet引入了殘差連接(residual connection)的概念。這種連接方式允許網(wǎng)絡(luò)學(xué)習(xí)殘差,即目標(biāo)函數(shù)與輸入的差異,而不是學(xué)習(xí)整個(gè)函數(shù)。通過(guò)將前一層的輸出直接與后續(xù)層的輸入相加,ResNet解決了深度網(wǎng)絡(luò)訓(xùn)練中的梯度消失或爆炸的問(wèn)題。這種設(shè)計(jì)使得網(wǎng)絡(luò)更易于訓(xùn)練,可以訓(xùn)練更深的網(wǎng)絡(luò),從而在圖像識(shí)別等任務(wù)中取得了顯著的性能提升。

        表1為不同網(wǎng)絡(luò)模型在ImageNet驗(yàn)證集上的錯(cuò)誤率[22]。由表1可知,RestNet相較于其他兩種常用算法錯(cuò)誤率最低,考慮到音頻分類任務(wù)與圖像分類任務(wù)類似,因此本系統(tǒng)也同樣采用圖4中的ResNet50結(jié)構(gòu)提取音頻特征并分類。該ResNet50網(wǎng)絡(luò)包括48個(gè)卷積層、1個(gè)最大池化層和1個(gè)平均池化層,該網(wǎng)絡(luò)將常規(guī)的殘差模塊替換為瓶頸結(jié)構(gòu)(bottleneck),在保證識(shí)別精度的同時(shí),還大幅地減少了網(wǎng)絡(luò)參數(shù)量。

        表1 ImageNet 驗(yàn)證集上單一模型結(jié)果的錯(cuò)誤率(單位:%)Tab. 1 Error rates (%) of single-model results on the ImageNet validation set

        圖4 Resnet50網(wǎng)格結(jié)構(gòu)示例Fig. 4 Example network architectures for Resnet50

        2 實(shí)驗(yàn)設(shè)置

        2.1 數(shù)據(jù)集組成

        本研究前期通過(guò)Xeno①Xeno網(wǎng)址為https://xeno-canto.org/。進(jìn)行鳥類聲音樣本的收集,并基于這些樣本建立一個(gè)用于訓(xùn)練鳥類聲音識(shí)別模型的先驗(yàn)數(shù)據(jù)集,具體來(lái)說(shuō),本研究根據(jù)北京翠湖鳥類名錄從Xeno上獲得相應(yīng)的音頻數(shù)據(jù),對(duì)于每條數(shù)據(jù),按質(zhì)量分?jǐn)?shù)進(jìn)行篩選,共提取出6 200條音頻。在獲得原始音頻后,通過(guò)運(yùn)用雙門限法的聲音端點(diǎn)檢測(cè)算法[23]濾除每個(gè)音頻信號(hào)中的靜音片段。在Kahl等[11]的研究中提到大量物種的發(fā)聲平均時(shí)長(zhǎng)為1.94 s,因此每個(gè)音頻片段被剪輯成3 s。本研究也采取同樣的剪輯的方式,使用3 s的剪輯窗口將處理后的音頻分割成塊,共得到17 056個(gè)鳥聲剪輯片段,最后這些片段以7∶1∶2的比例分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,形成一個(gè)完整的鳥聲數(shù)據(jù)集。

        2.2 監(jiān)測(cè)點(diǎn)位布置

        考慮到靠近水邊的樹木、灌叢、濕地等區(qū)域是鳥類繁殖、覓食和棲息的主要場(chǎng)所,通常會(huì)有更多種類的鳥類活動(dòng),且湖邊環(huán)境開闊可以減少噪聲的干擾。因此,本研究選擇在北京翠湖荷花塘附近布設(shè)一個(gè)鳥類音頻監(jiān)測(cè)點(diǎn)位(圖5),該地點(diǎn)地處水域邊緣,環(huán)境優(yōu)美,擁有豐富的樹木和植被,為鳥類提供了豐富的棲息和覓食資源。

        圖5 翠湖荷花塘音頻監(jiān)測(cè)點(diǎn)位Fig. 5 Audio monitoring point of lotus pond in Cuihu Lake

        2.3 研究結(jié)果

        對(duì)于部署在北京翠湖的監(jiān)測(cè)設(shè)備,拾音器捕獲到鳥聲信號(hào)后,聲音數(shù)據(jù)經(jīng)過(guò)聲音降噪和端點(diǎn)檢測(cè)算法去除噪聲和靜音片段,經(jīng)過(guò)分幀加窗后使用梅爾濾波器提取出鳥聲的梅爾頻譜圖,原始波形圖和梅爾聲譜圖如圖6所示。然后,梅爾聲譜圖輸入到已經(jīng)加載預(yù)訓(xùn)練模型參數(shù)的鳥聲識(shí)別模型,鳥聲經(jīng)過(guò)模型選取預(yù)測(cè)概率最大的鳥類作為最后的預(yù)測(cè)結(jié)果。

        圖6 鴻雁叫聲波形圖和聲譜圖Fig. 6 Waveforms and spectrograms of honkers sounds

        部署在北京翠湖荷花塘的音頻監(jiān)測(cè)系統(tǒng)自2023年2月持續(xù)運(yùn)行至12月,累計(jì)工作10個(gè)月,共獲得209 686條音頻數(shù)據(jù)。這些數(shù)據(jù)完整地記錄了北京區(qū)域不同季節(jié)鳥類的種類以及叫聲頻次變化,其中,鳥類鳴叫片段200 044條,人類干擾聲音3 741條,其他環(huán)境噪聲5 123條。通過(guò)專家的校驗(yàn),系統(tǒng)識(shí)別鳥聲準(zhǔn)確率為93%。在識(shí)別的鳥類鳴聲片段中,共涵蓋了9目16科52種鳥類。圖7為2023年2–12月的聲音頻次統(tǒng)計(jì)圖,其中,相對(duì)多度較高的前5個(gè)物種為蒼鷺(26%)、鴻雁(16%)、夜鷺(13%)、白頭鵯(11%)和普通鸕鶿(8%);屬于國(guó)家II級(jí)重點(diǎn)保護(hù)野生動(dòng)物有6種,分別是大天鵝、鴻雁、紅角鸮、縱紋腹小鸮、藍(lán)喉歌鴝和游隼,北京市重點(diǎn)保護(hù)野生動(dòng)物蒼鷺、夜鷺、普通鸕鶿、綠頭鴨等22種,詳見表2。

        表2 翠湖鳥類聲音監(jiān)測(cè)名錄Tab. 2 Bird sound monitoring list in Cuihu Lake

        圖7 翠湖鳥類物種聲音頻次統(tǒng)計(jì)圖(2023.02–2023.12)Fig. 7 Statistical chart of bird species sound frequency in Cuihu Lake(2023.02–2023.12)

        3 討論

        本研究通過(guò)采用鳥類聲音識(shí)別系統(tǒng),實(shí)現(xiàn)了北京翠湖鳥類多樣性的自主監(jiān)測(cè),相較于傳統(tǒng)方法,采用該系統(tǒng)不僅能夠?qū)崿F(xiàn)鳥類聲音數(shù)據(jù)的長(zhǎng)期獲取及自動(dòng)分析,還能夠形成結(jié)構(gòu)化的識(shí)別數(shù)據(jù),便于鳥類的監(jiān)測(cè)和保護(hù),為北京翠湖鳥類種群和生態(tài)多樣性的研究提供了豐富的鳥類聲音數(shù)據(jù)支撐。

        在本系統(tǒng)的監(jiān)測(cè)下,共記錄到52種野生鳥類,其中包括6種國(guó)家II級(jí)重點(diǎn)保護(hù)野生動(dòng)物,通過(guò)與專家校驗(yàn)對(duì)比,研究發(fā)現(xiàn)本系統(tǒng)的識(shí)別準(zhǔn)確率達(dá)到了93%。此外,還基于這些實(shí)采數(shù)據(jù)對(duì)比了不同網(wǎng)絡(luò)模型的性能。從表3可以看出,本研究所采用的ResNet50模型相較于VGG16和VGG19模型,在準(zhǔn)確率上分別提升了1%和0.8%。同時(shí),其參數(shù)量分別減少了112.5 MB和118.5 MB。這一優(yōu)勢(shì)極大地降低了模型在算力受限的邊緣設(shè)備上的部署難度,并且提升了模型的推理效率。這種顯著的改進(jìn)主要源于ResNet50采用的殘差結(jié)構(gòu)。這種結(jié)構(gòu)使得網(wǎng)絡(luò)更深,同時(shí)減少了梯度消失的問(wèn)題,從而提高了模型的準(zhǔn)確率。此外,ResNet50的卷積層中使用了1x1的卷積核,這一設(shè)計(jì)有效地減少了模型的計(jì)算量和參數(shù)量。

        表3 ResNet50與目前已有算法比較Tab. 3 Comparison between ResNet50 and existing algorithms

        本研究所提出的鳥類聲音識(shí)別系統(tǒng)與傳統(tǒng)方法相比有效提升了鳥類監(jiān)測(cè)的效率,并實(shí)現(xiàn)了較高的識(shí)別精度。但性別、生長(zhǎng)階段、棲息環(huán)境和繁殖狀況等因素會(huì)對(duì)鳥類的發(fā)聲產(chǎn)生影響,從而影響系統(tǒng)的識(shí)別性能。此外,鳥類在繁殖、交流、尋找食物和保護(hù)領(lǐng)土?xí)r表現(xiàn)出豐富多樣的聲音,這種聲音不僅是生物學(xué)特征,更是風(fēng)景園林的聲音調(diào)色板。因此,對(duì)鳥類聲音與不同行為之間的深入分析對(duì)于理解園林生態(tài)的演變具有非常重要的意義。

        后續(xù)研究將通過(guò)收集處于不同生長(zhǎng)階段、位于不同地理位置以及不同性別的鳥類數(shù)據(jù),建立一個(gè)更加全面的鳥類聲音數(shù)據(jù)庫(kù),為系統(tǒng)識(shí)別性能的提升和鳥類多樣性的研究提供更為有利的數(shù)據(jù)支撐;同時(shí),基于深度學(xué)習(xí)技術(shù),建立鳥類聲音與具體行為之間的關(guān)聯(lián),以實(shí)現(xiàn)對(duì)鳥類個(gè)體行為的準(zhǔn)確檢測(cè),從而為風(fēng)景園林規(guī)劃和管理提供更深層次的生態(tài)學(xué)信息。這不僅有助于提高園林的生物多樣性,同時(shí)也為打造更具生態(tài)平衡和可持續(xù)性的園林環(huán)境提供了科學(xué)支持。

        4 結(jié)語(yǔ)

        鳥類作為生態(tài)系統(tǒng)中不可或缺的組成部分,城市生態(tài)的完善程度很大程度上可通過(guò)鳥類的種類和數(shù)量反映。在城市園林修復(fù)中,鳥類監(jiān)測(cè)起到了不可替代的重要作用。通過(guò)在典型生態(tài)區(qū)域中部署鳥類聲音識(shí)別系統(tǒng),能夠?qū)崿F(xiàn)鳥類信息的自動(dòng)監(jiān)測(cè)分析,并為研究人員提供詳實(shí)的統(tǒng)計(jì)報(bào)告和監(jiān)測(cè)數(shù)據(jù),有助于深入了解它們?cè)诔鞘协h(huán)境中的生存狀況。這些監(jiān)測(cè)結(jié)果不僅是城市園林修復(fù)的科學(xué)依據(jù),更是保護(hù)生物多樣性、維護(hù)生態(tài)平衡的有力工具。此外,在城市園林修復(fù)過(guò)程中,鳥類監(jiān)測(cè)可以幫助評(píng)估修復(fù)效果,指導(dǎo)相關(guān)工作的調(diào)整和改進(jìn),以確保修復(fù)項(xiàng)目的順利實(shí)施和生態(tài)效益的最大化。只有制定出更加精準(zhǔn)、可持續(xù)的修復(fù)策略,才能為城市創(chuàng)造出更宜人、更生態(tài)友好的綠色空間。因此,深刻認(rèn)識(shí)并充分利用鳥類監(jiān)測(cè)的重要性,將為城市園林的未來(lái)發(fā)展注入新的活力,實(shí)現(xiàn)城市與自然的和諧共生。

        注:文中圖表均由作者繪制。

        猜你喜歡
        翠湖鳥類音頻
        翠湖
        岳池翠湖
        善于學(xué)習(xí)的鳥類
        學(xué)與玩(2022年9期)2022-10-31 02:54:08
        我的濕地鳥類朋友
        文苑(2020年12期)2020-04-13 00:54:14
        鳥類
        必須了解的音頻基礎(chǔ)知識(shí) 家庭影院入門攻略:音頻認(rèn)證與推薦標(biāo)準(zhǔn)篇
        基于Daubechies(dbN)的飛行器音頻特征提取
        電子制作(2018年19期)2018-11-14 02:37:08
        我在翠湖等你
        鳥類的叫聲
        音頻分析儀中低失真音頻信號(hào)的發(fā)生方法
        電子制作(2017年9期)2017-04-17 03:00:46
        亚洲国产精品自拍成人| 精品国产av无码一道| 亚洲日产国无码| av在线播放亚洲天堂| 领导边摸边吃奶边做爽在线观看 | 亚洲高清在线天堂精品| 农村欧美丰满熟妇xxxx| 四虎精品免费永久在线| 精品专区一区二区三区| 人妻精品在线手机观看| 中国农村熟妇性视频| 国产AV无码专区亚洲AV桃花庵| 日韩熟女精品一区二区三区视频| 国产精品一区二区三久久不卡| 亚洲国产日韩欧美一区二区三区| 国产精品久久久久久久久免费观看 | 久久国产精品一区二区三区| 免费中文熟妇在线影片| 国产精品久久1024| 人妻露脸国语对白字幕| 后入内射国产一区二区| 秋霞鲁丝片av无码| 国产在线观看免费一级| 国内自拍偷国视频系列| 凹凸在线无码免费视频| 国产精品久久1024| 视频国产一区二区在线| 粗大的内捧猛烈进出小视频| 99这里只有精品| 丝袜美腿久久亚洲一区| 洲色熟女图激情另类图区| 熟妇高潮一区二区三区| 日韩成人精品日本亚洲| 亚洲成人一区二区av| 无码人妻人妻经典| 国产香蕉尹人综合在线观| 女同欲望一区二区三区| 国产日产亚洲系列最新 | 97日日碰日日摸日日澡| 久久精品亚洲一区二区三区画质| 亚洲av无码av在线播放|