亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

雙耳立體聲技術(shù)在音樂直播中的應(yīng)用方法研究

2022-08-02 09:34:20王藝霖陳思涵

電聲技術(shù) 2022年6期

王藝霖，陳思涵

（1.湖南省廣播電視集團(tuán)，湖南長沙 410000；2.湖南省藝術(shù)職業(yè)學(xué)院，湖南長沙 410000）

0 引言

由湖南廣播電視集團(tuán)重點(diǎn)打造的芒果TV 旗下音樂IP 項(xiàng)目“馬欄山音樂節(jié)”，已持續(xù)舉辦多年，期間進(jìn)行了許多錄制并傳輸至互聯(lián)網(wǎng)端的探索，并積累了大量音樂類節(jié)目相關(guān)制作經(jīng)驗(yàn)。相比其他非音樂類節(jié)目，這類節(jié)目的音樂演出環(huán)節(jié)往往占有較大比重，同時(shí)對聽感的要求也比其他類型節(jié)目要求更高。因此，如何更好地保留音樂現(xiàn)場的聽感并將信號傳輸給互聯(lián)網(wǎng)觀眾是至關(guān)重要的。

本文就近年來湖南廣播傳媒中心對音樂直播所作的技術(shù)創(chuàng)新為例，闡述如何在不改變傳統(tǒng)廣播電臺傳輸路徑的前提下，利用雙耳立體聲技術(shù)保留音樂節(jié)現(xiàn)場聽感并傳輸至互聯(lián)網(wǎng)平臺，讓用戶僅通過一副耳機(jī)就能感受到更加自然、沉浸式的音樂體驗(yàn)。

1 概述

雙耳立體聲（binaural）技術(shù)是一種通過頭部相關(guān)函數(shù)（HRTFs）[1]過濾聲波來模擬人耳聽到的聲音效果的3D 聲場重建技術(shù)[2]。隨著音頻制作技術(shù)的發(fā)展，使用頭部相關(guān)函數(shù)作為聲波過濾算法的軟插件很多，但主要多用于后期制作，并不適合直播和現(xiàn)場混音。此外，目前已有的大型直播比如東京奧運(yùn)會直播、春節(jié)聯(lián)歡晚會直播以及《我是歌手》節(jié)目[3]等，主要是借助杜比編碼器、內(nèi)置沉浸式混音以及下變換模塊的調(diào)音臺如SSl System T、Calerc等[4]，完成5.1，5.1.2，5.1.4，7.1，7.1.2 及7.1.4格式的混音和直播任務(wù)[4]，也可將多通道音頻下變換為立體聲（stereo），但并不能實(shí)現(xiàn)雙耳立體聲（binaural）的混音與直播需求。此外，對用戶來說，如果直接將傳輸多通道格式的音頻呈現(xiàn)在互聯(lián)網(wǎng)平臺的節(jié)目當(dāng)中，需要配備相同通道數(shù)的環(huán)繞聲音響系統(tǒng)才能體驗(yàn)到節(jié)目中的環(huán)繞聲音樂，相較于通過耳機(jī)便能收聽3D 聲的雙耳立體聲（binaural）來說，缺乏便捷性與可移動(dòng)性。

針對上述問題，本文基于Max/Msp 編程平臺開發(fā)一套實(shí)時(shí)混音程序，用于實(shí)現(xiàn)以下播出目標(biāo)：

（1）良好的音樂傳輸質(zhì)量，電平符合播出標(biāo)準(zhǔn)，音樂音質(zhì)清晰；

（2）良好的環(huán)繞聲效果，音源定位清晰，具有空間感、沉浸感；

（3）可實(shí)現(xiàn)雙耳立體聲實(shí)時(shí)混音。

要實(shí)現(xiàn)這幾個(gè)目標(biāo)，需要針對性地給出解決方案。

首先是音樂質(zhì)量的保證。音樂節(jié)因?yàn)槿巳罕姸嗉又F(xiàn)場有主擴(kuò)音箱，現(xiàn)場錄音難免出現(xiàn)雜音過多、電平過載的問題。因此，在選擇拾音位置時(shí)需避開集中人群，同時(shí)需要在程序中加入電平監(jiān)測與響度控制模塊，防止音量過大導(dǎo)致失真。

其次是環(huán)繞聲效果的實(shí)現(xiàn)。為拾取音樂節(jié)現(xiàn)場環(huán)繞聲聲場，環(huán)繞聲錄音話筒的選擇與拾音位置非常重要。需選擇專業(yè)級環(huán)繞聲話筒，提前進(jìn)行拾音位置測量與實(shí)驗(yàn)，確定好最佳擺放位置。

最后是實(shí)時(shí)混音核心處理環(huán)節(jié)，即通過Max/Msp 平臺開發(fā)的程序，將拾取的環(huán)繞聲聲源與舞臺音樂在計(jì)算機(jī)中進(jìn)行實(shí)時(shí)混音，最終生成雙耳立體聲（binaural）信號用于直播。具體信號流程總結(jié)如圖1 所示。

圖1 直播與擴(kuò)聲系統(tǒng)流程圖

由圖1 可知，用于雙耳立體聲（binaural）直播的聲音信號主要由舞臺音源與環(huán)繞聲話筒聲源組成。舞臺音源（即針對在舞臺演出的樂隊(duì)樂器、人聲拾音所獲取的音樂類信號）與環(huán)繞聲話筒（即上文提到的用于拾取音樂節(jié)現(xiàn)場聲場的環(huán)繞聲錄音話筒）的信號輸入數(shù)字調(diào)音臺后，為了能同時(shí)滿足舞臺擴(kuò)聲與直播的需求，舞臺音源（樂器、人聲等音樂信號，主要為單聲道與立體聲信號）由調(diào)音師混成立體聲，分別分配給Mix output 和Master Output，其中Mix output 經(jīng)由聲卡送至計(jì)算機(jī)，進(jìn)入Max/Msp 實(shí)時(shí)混音程序進(jìn)行雙耳立體聲混音，Master Output 送至音樂節(jié)舞臺主擴(kuò)音箱用于現(xiàn)場擴(kuò)聲；而環(huán)繞聲話筒聲源經(jīng)由數(shù)字調(diào)音臺直接送至Max/Msp實(shí)時(shí)混音程序，與調(diào)音師混好的立體聲信號進(jìn)行混音，最終生成雙耳立體聲（binaural）并輸入至衛(wèi)星直播車用于音樂節(jié)直播。

2 空間拾音方案

由以上表述可知，空間拾音主要依靠環(huán)繞聲話筒來實(shí)現(xiàn)，通過對現(xiàn)場空間和整體聲場的測量與實(shí)驗(yàn)，確定環(huán)繞聲話筒在現(xiàn)場的擺放位置，也就是聽音的“甜點(diǎn)位”[5]，從而獲得良好的現(xiàn)場沉浸式聽感。但此次拾音方案與近年錄制的環(huán)繞聲音樂類綜藝節(jié)目所不同的是，之前大多關(guān)注的是5.1 環(huán)繞聲系統(tǒng)（左、中、右、左后、右后、超重低音）為對象的空間拾音，因此使用的也是5.0 制式的話筒陣列，但由于缺乏對上、下聲音方位的空間信息的拾取，并不能真正還原3D 聲聲場。

為彌補(bǔ)這一不足，技術(shù)團(tuán)隊(duì)使用了基于Ambisonic 錄音原理開發(fā)的TetraMic 四面體麥克風(fēng)進(jìn)行環(huán)繞聲錄音，實(shí)物如圖2 所示。該話筒含有四個(gè)同軸振膜，以“A”格式錄制，通過相關(guān)軟件轉(zhuǎn)換為可用于多種環(huán)繞聲制式的“B”格式，包含W，X，Y，Z 四個(gè)音頻通道（即不同方向空間信息，依次是全方位、前后方向、左右方向、上下方向）。它能拾取360°空間方位的聲音信息，同時(shí)也具有較寬的頻率響應(yīng)（30 Hz～18.5 kHz）與空間分辨率（5 °或更?。6]。

圖2 TetraMic 四面體麥克風(fēng)

由于音樂節(jié)現(xiàn)場主要通過主擴(kuò)音箱進(jìn)行擴(kuò)聲，現(xiàn)場觀眾的聽感也來自于此，要準(zhǔn)確還原現(xiàn)場聽感，就需要模擬觀眾聽感來確定聽音“甜點(diǎn)位”[7]。通過對現(xiàn)場主擴(kuò)音箱位置距離、角度的測量和聲場測試，多次錄音實(shí)驗(yàn)后，該位置確定在以主擴(kuò)音箱中心為軸線，距離演出舞臺37 m 的位置。場地位置情況如圖3 所示（其中耳機(jī)符號代表話筒擺放位置）。該位置主擴(kuò)音箱的直達(dá)聲大于空間反射聲，錄音實(shí)驗(yàn)結(jié)果表明聲音清晰同時(shí)具有足夠的聲場空間感，能較好還原聽眾現(xiàn)場感受。當(dāng)然，根據(jù)不同的現(xiàn)場環(huán)境，該位置只做參考，具體還需要根據(jù)現(xiàn)場環(huán)境來確定。

圖3 場地分布平面圖

確定好環(huán)繞聲話筒拾音位置后，所有聲音信號進(jìn)入調(diào)音臺之后進(jìn)行信號分組和路由。由于雙耳立體聲信號的生成需要單獨(dú)進(jìn)行編碼處理，因此TetraMic 的聲音信號由direct out 送至計(jì)算機(jī)進(jìn)行編解碼。另外需要注意的一點(diǎn)是，由于TetraMic 的位置距離主擴(kuò)有一定距離，如果直接與舞臺音源混到一起，會聽到TetraMic 的信號晚于舞臺音源。為避免這個(gè)問題，使用TetraMic 時(shí)加入了延時(shí)[8]，以縮小二者之間的時(shí)間差。

3 Max/Msp 實(shí)時(shí)混音

為了實(shí)現(xiàn)雙耳立體聲混音與直播，使用環(huán)繞聲話筒拾取現(xiàn)場聲場之后，最重要的是通過Max/Msp編程實(shí)現(xiàn)實(shí)時(shí)混音并生成最終需要的雙耳立體聲（binaural）信號。筆者所使用的Max/Msp 是一套圖形化編程語言，可用于控制聲音參數(shù)、實(shí)時(shí)互動(dòng)、聲音混音、設(shè)計(jì)prototype 等等專為視覺與聲音設(shè)計(jì)的編程語言，利用其中物件（object）自定義串接，設(shè)計(jì)出程序模塊。本次的程序設(shè)計(jì)主要設(shè)計(jì)三大模塊，分別為聲音控制模塊、B 格式音源轉(zhuǎn)換模塊以及雙耳立體聲生成模塊。

如上文中圖1 所提到的，舞臺音源與環(huán)繞聲話筒聲音信號由調(diào)音臺傳輸至計(jì)算機(jī)中的Max/Msp程序后，兩類信號經(jīng)過聲音控制模塊進(jìn)行實(shí)時(shí)音量監(jiān)控后被分別處理。其中，舞臺音源加以500 ms延時(shí)使之與TetraMic 信號同步，TetraMic 信號被送至B 格式音源轉(zhuǎn)化模塊從A 格式轉(zhuǎn)為B 格式。最后這兩類信號經(jīng)由雙耳立體聲生成模塊轉(zhuǎn)為雙耳立體聲（binaural）信號并混音，形成最終的輸出信號送至衛(wèi)星直播車。Max/Msp 程序最終操作界面如圖4 所示，左側(cè)為總操控界面，右側(cè)為binaural 轉(zhuǎn)換界面。

圖4 左側(cè)為總操控界面，由上至下依次為，聲卡輸入物件（object）TetraMic 輸出為4 個(gè)通道，由adc～1234 表示，舞臺音源為立體聲輸出，由adc～5 6 表示。此外，delay～500 物件（object）則是上文提到的延時(shí)，讓舞臺音源的時(shí)間延遲500 ms，與TetraMic 信號趨近于同步。下面四通道和二通道的電平表分別用于控制TetraMic和音樂的音量，vst～是專門用于加載插件的子模塊，其中A-formattrans 是TetraMic 專用的格式轉(zhuǎn)換器，Binauraltrans 則是將所有信號轉(zhuǎn)換為binaural信號用于最后的直播，具體信號情況和電平也可以通過右邊的窗口實(shí)時(shí)檢測。中間右上角經(jīng)緯線物件（object）用于給予舞臺音樂注明該音源之于TetraMic 的具體角度、距離，以便準(zhǔn)確地還原起初設(shè)想的虛擬VIP 位置的聽覺效果。需要注意的是，實(shí)際情況較理論更為復(fù)雜，為保證良好聽覺效果，進(jìn)行人工微調(diào)十分有必要，如對舞臺音源（音樂直達(dá)聲）與環(huán)境聲之間的音量比例關(guān)系進(jìn)行調(diào)整，根據(jù)演出當(dāng)日人群雜音等情況調(diào)整環(huán)繞聲話筒位置等[9]。另外，在Max/Msp 程序中加入用于預(yù)制設(shè)置的子模塊，使參數(shù)設(shè)置能根據(jù)不同樂隊(duì)進(jìn)行量身定制，例如，在彩排過程中發(fā)現(xiàn)有的樂隊(duì)的program 中加了非常重的混響，但主擴(kuò)出來之后并不是非常明顯，通過降低原音樂音量增加的環(huán)境聲的音量后，聽感層次感清晰度增強(qiáng)，于是單獨(dú)保存了該預(yù)置效果，以便在直播中快速切換。

圖4 Max/Msp 實(shí)時(shí)混音操作界面

4 效果評估總結(jié)

節(jié)目播出后，用戶反饋此次聽感在空間感與沉浸感的塑造上有明顯提升與改善，猶如置身其中，音樂傳輸質(zhì)量、環(huán)繞聲聽感、實(shí)時(shí)混音這三點(diǎn)播出目標(biāo)都獲得了較高的完成度。

從技術(shù)層面說，這次用于直播的Max/Msp 完成了實(shí)時(shí)雙耳立體聲混音和渲染的任務(wù)，但考慮到該程序主要是針對帶有PA 系統(tǒng)、含有電聲樂器的電子音樂演出設(shè)計(jì)的，因此并不適用于不插電演出，后者沒有PA 的部分，因此需增加補(bǔ)點(diǎn)話筒，每個(gè)樂器的聲音最好都能送入渲染程序中進(jìn)行混音以保證最好的雙耳立體聲聽感[10]。如果現(xiàn)場環(huán)境聲中混響效果不明顯，還需要在程序中增加混響器，讓整體音色聽起來更加融合、更具有空間感[11]。類似的方式方法很多，具體需要在原有理論基礎(chǔ)上根據(jù)實(shí)際情況來設(shè)計(jì)。程序完成后還需多次實(shí)驗(yàn)、改進(jìn)，方便使用，并根據(jù)現(xiàn)場效果進(jìn)行實(shí)時(shí)監(jiān)測和現(xiàn)場混音調(diào)整等。

從聽感來說，相較于之前的音樂節(jié)直播效果，本次因?yàn)?D 聲制作技術(shù)的加入，讓音樂整體不再只是干癟的、缺乏活力的調(diào)音臺輸出，而是多了環(huán)境聲的渲染，讓直達(dá)聲和環(huán)境中的反射、衍射等空間聲場信息混合在一起，聲音變得更自然、更有質(zhì)感和包裹性。同時(shí)，定位信息的有效拾取和雙耳立體聲的生成方式，也增加了聲音的層次感和空間感。用戶通過耳機(jī)就能感受到音樂節(jié)寬闊草坪的聲場效果，聽覺的趣味性也有所增加。

5 結(jié) 語

此次通過自主編程實(shí)現(xiàn)了實(shí)時(shí)雙耳立體聲混音與直播，是音樂類互聯(lián)網(wǎng)節(jié)目在音頻技術(shù)層面一次較為成功的嘗試，在完成播出任務(wù)的同時(shí)極大地增加了空間聽感，使互聯(lián)網(wǎng)的音頻傳輸從環(huán)繞聲真正上升到了3D 聲音頻，讓用戶不需要通過復(fù)雜的多通道音響系統(tǒng)而是僅憑一副耳機(jī)即可收聽到沉浸式音樂現(xiàn)場。隨著技術(shù)的發(fā)展，越來越多的應(yīng)用方式皆可在未來進(jìn)行嘗試，如將VR 視覺與3D 聲傳輸結(jié)合，通過使用頭部跟蹤技術(shù)讓用戶與互聯(lián)網(wǎng)節(jié)目進(jìn)行互動(dòng)等等。只有不斷地進(jìn)行創(chuàng)新性應(yīng)用嘗試，才能更好地傳達(dá)給用戶一個(gè)更具趣味性、沉浸式的互聯(lián)網(wǎng)聽覺體驗(yàn)。