亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺談空間音頻技術(shù)的發(fā)展與應(yīng)用

        2021-04-02 02:52:44
        現(xiàn)代電影技術(shù) 2021年3期

        (中國(guó)傳媒大學(xué)音樂與錄音藝術(shù)學(xué)院,北京 100024)

        1 引言

        隨著視聽媒介的快速發(fā)展,人們?cè)趫D像和聲音的三維化道路上已經(jīng)進(jìn)行了多年的探索和實(shí)踐。對(duì)于聲音的空間感究竟是如何產(chǎn)生,抑或到目前為止空間音頻技術(shù)又發(fā)展到什么程度,這不僅是音頻領(lǐng)域?qū)I(yè)人士關(guān)注的熱點(diǎn),更是眾多音頻發(fā)燒友所感興趣的話題。本文將以聲音和空間為主題,淺析與此相關(guān)的理論和技術(shù)。

        2 聲音的空間感

        聽覺是人類最重要的感觀之一,甚至從胎兒時(shí)期起就對(duì)人的感知產(chǎn)生重要影響。研究表明,在人的所有感覺中,視聽感知占據(jù)了絕大部分的比例。但不同于視覺的是,我們可以通過閉上眼睛來關(guān)閉視覺的作用,而無法關(guān)閉我們的耳朵?;诼犛X的特殊性,我們無時(shí)無刻不沉浸在一個(gè)連續(xù)變化的聲音世界之中。這些自幼積累的聽音經(jīng)驗(yàn),也逐漸成為我們認(rèn)知事物的重要手段,讓我們可以通過聲音來判斷聲源的方位、通過混響來辨別房間的聲學(xué)特點(diǎn)等。

        聲音是通過發(fā)聲源振動(dòng)產(chǎn)生的。振動(dòng)的能量通過介質(zhì)傳遞,如最常見的空氣,并且在傳遞過程中可能會(huì)遇到介質(zhì)的變化、界面的反射等因素,導(dǎo)致聲音性質(zhì)發(fā)生改變,最終到達(dá)人耳。在這個(gè)過程中聲音的構(gòu)成主要可以概括為兩個(gè)部分:第一是聲源信號(hào);第二是環(huán)境的空間信息。進(jìn)一步來說,我們從后者中能獲取的信息又可以分為直達(dá)聲的位置信息和反射波的環(huán)境信息,正是這些信息為我們帶來了聲音的空間感。

        根據(jù)心理聲學(xué)的研究,聽覺對(duì)聲源的水平定位主要源于雙耳效應(yīng):第一,聲波到達(dá)雙耳的時(shí)間不同而產(chǎn)生的雙耳時(shí)間差(interaural time difference,縮寫為ITD);第二,聲波到達(dá)雙耳的強(qiáng)度不同而產(chǎn)生的雙耳強(qiáng)度差(interaural intensity difference,縮寫為IID)。通常來說,對(duì)于來自不同方向的低頻信號(hào),到達(dá)兩邊耳朵的時(shí)間不同,故具有一定的聲程差,進(jìn)而引入了左右耳信號(hào)的相位差異,通過該差異我們能辨別低頻信號(hào)的方位。而對(duì)于波長(zhǎng)相對(duì)較短的高頻信號(hào)來說,人的頭部以及耳廓形成了一定的遮蔽作用,使得到達(dá)左右耳的信號(hào)強(qiáng)度有所改變,產(chǎn)生了強(qiáng)度差和音色差,進(jìn)而幫助我們判斷高頻信號(hào)的方位。而雙耳信號(hào)的相位差對(duì)于高于一定頻率的信號(hào)來說會(huì)超過180°,從而產(chǎn)生混淆,因此不易通過相位差來判斷高頻方位。而人耳對(duì)于高度信息的判斷通常也是通過譜因素帶來的音色差異來判斷,包括幅度差和相位差。

        反射波的環(huán)境信息主要包括聲源在空間中所激發(fā)的早期反射聲和混響聲。其中前者帶有明確的聲波方向性和聲場(chǎng)能量分布的不均勻性,后者則呈現(xiàn)出聲波的方向隨機(jī)性和聲場(chǎng)能量分布的均勻性。通常來說,早期反射聲對(duì)聲源的定位、空間幾何形狀的感知和空間聲場(chǎng)的親切感、包圍感等屬性有著重要影響。混響則是空間中聲音均勻擴(kuò)散的結(jié)果,它會(huì)影響聲學(xué)空間感知上的豐滿度和活躍度等屬性——當(dāng)中高頻的混響不足時(shí),將會(huì)感知到缺乏共鳴或活躍度差;當(dāng)高頻不足時(shí),則感知到聲音不明亮;當(dāng)?shù)皖l不足時(shí),則感知到缺乏低頻沖擊感及聲音不溫暖的現(xiàn)象。

        3 立體聲技術(shù)

        不同于以二維平面形式存在的圖像,聲音在現(xiàn)實(shí)世界中向來都是以三維的形式存在。但自1877年愛迪生發(fā)明了留聲機(jī)以后,聲音也可以以二維的數(shù)據(jù)形式存儲(chǔ)下來——唱片表面描述聲波振動(dòng)的刻痕。人們通過讀取二維的聲音數(shù)據(jù),再經(jīng)過重放設(shè)備放大就可以還原聲音的三維形態(tài)。

        最初的留聲機(jī)只能記錄一條聲音通道,也就是單聲道信號(hào)。在聽音重放的時(shí)候,人們可以通過聲音信息中樂器的電平、音色差異感受聲源距離的遠(yuǎn)近,但卻感受不到聲源的方向,而現(xiàn)實(shí)中的樂器演奏顯然不可能只在某個(gè)方向的一條直線上進(jìn)行。這種情況因后來的雙聲道技術(shù)的出現(xiàn)得到了極大的改善。雙聲道錄音和重放使得聲音信號(hào)帶有了聲源的空間分布感,聲音有了分布和方向,這才真正變得立體起來,并且成為了聲音制作領(lǐng)域的主流制式之一。為了追求聲音重放以實(shí)現(xiàn)更為真實(shí)的空間感,隨后出現(xiàn)的四方聲、X.1環(huán)繞聲,提供了具有一定空間信息的環(huán)繞聲道,使聽眾能夠得到來自身側(cè)和身后的聲音。三維環(huán)繞聲則進(jìn)一步引入了不同高度層的聲音信息,使得立體聲技術(shù)更加地“立體”。

        通常人們提到的立體聲其實(shí)指的是狹義的雙聲道立體聲(Stereo)。從聲源的錄音、制作、重放三個(gè)流程來看,基于雙聲道的音頻技術(shù)已經(jīng)相當(dāng)成熟和穩(wěn)定。

        3.1 聲源

        立體聲拾音技術(shù)按照層級(jí)關(guān)系,從高到低為“立體聲方法”“立體聲拾音方法”“傳聲器方法(拾音制式)”三種。立體聲方法主要分為“房間立體聲”和“人頭立體聲”兩種原則,它決定了立體聲信號(hào)的拾取和重放原則。立體聲拾音方法可以分為“時(shí)間差拾音方法”“強(qiáng)度差拾音方法”“混合拾音方法”。傳聲器方法則指的是“拾音制式”,代表了各種具體的傳聲器使用設(shè)置方案。以上“立體聲”方案都是基于上文所提到的雙耳效應(yīng)來設(shè)計(jì)的,目的就是模擬到達(dá)雙耳信號(hào)存在時(shí)間差、強(qiáng)度差、相位差和音色差的信息。值得一提的是,人頭立體聲中所使用的人工頭拾音方案其實(shí)已經(jīng)體現(xiàn)了三維聲的空間感,但由于人工頭模型與實(shí)際聽音者的頭部并不能夠完全吻合,有時(shí)候也會(huì)帶來聲源定位的畸變。

        3.2 制作

        雙聲道立體聲的制作則主要通過硬件或者軟件調(diào)音臺(tái)實(shí)現(xiàn)。制作者可以在調(diào)音臺(tái)上對(duì)聲音信號(hào)進(jìn)行音色處理、添加效果,并進(jìn)行最重要的聲像電位器(Pan Pot)和電平推子的控制。但傳統(tǒng)的聲像電位器往往只是對(duì)分配到左右母線的電平進(jìn)行調(diào)整,使得左右聲道產(chǎn)生強(qiáng)度差。雖然在使用立體聲錄音制式的情況下,該方案能還原相應(yīng)錄音制式的聲音原貌,但對(duì)于單聲道音軌來說,僅僅對(duì)其分配電平差難免會(huì)導(dǎo)致聲源定位不符合真實(shí)情況的現(xiàn)象——如低頻有相位差、高頻有音色差。這種弊端在雙聲道制作中并不顯著,因?yàn)椴徽撌侵谱鞫诉€是接收端,人們都已經(jīng)習(xí)慣了該制作模式帶來的聽感。但進(jìn)入三維聲的領(lǐng)域后,傳統(tǒng)的Panning方案會(huì)帶來明顯的聲像定位誤差,從而導(dǎo)致空間感不真實(shí),重放質(zhì)量較差。因此,更適宜的聲像分配方案應(yīng)該是引入雙耳相位差的雙耳Panning,比如Logic Pro 10 軟件中就可以選擇Binaural(雙耳)Pan的模式。

        3.3 重放

        從重放的角度來看,基于聲場(chǎng)立體聲原理制作的節(jié)目比較適合立體聲音箱重放,而基于人頭立體聲原理制作的節(jié)目則更適合耳機(jī)重放。其原因在于人頭錄音采集到的信號(hào)是人耳耳道入口的聲音,這個(gè)聲音已經(jīng)帶有了經(jīng)過人頭和上身的反射、衍射引入的聲染色信息,直接通過耳機(jī)重放能更加接近地還原錄音時(shí)的聽音狀態(tài),但通過音箱重放則會(huì)引入聽音者頭部的二次聲染色,從而帶來聲音偏差。而音箱制作節(jié)目則類似,由于缺少自然狀態(tài)下頭部帶來的聲染色,聽上去聲音狀態(tài)并不真實(shí),“頭中定位”效應(yīng)嚴(yán)重。當(dāng)然,我們可以通過相應(yīng)的DSP濾波器進(jìn)行信號(hào)轉(zhuǎn)換,以適應(yīng)不同立體聲重放之間的相互兼容。

        立體聲技術(shù)的發(fā)展,催生了各式各樣的環(huán)繞聲音頻技術(shù)。為了還原真實(shí)聽音環(huán)境中的狀態(tài),水平環(huán)繞聲的后置聲道通常會(huì)加入以空間信息為主的反射聲、混響等信息。實(shí)現(xiàn)的方法可以是錄制的時(shí)候就采取環(huán)繞聲錄音制式,使用環(huán)境聲話筒拾取環(huán)境聲,并且盡量避開直達(dá)聲的輻射區(qū)域,這樣在制作階段將環(huán)境聲分配到環(huán)繞聲道來提高重放聲音的臨場(chǎng)感和包圍感;亦或在制作階段通過信號(hào)處理方式為直達(dá)聲生成空間信號(hào)送入環(huán)繞聲道。以這種方式制作的節(jié)目要格外注意環(huán)繞聲道和主聲道之間的關(guān)系,盡量降低二者之間的相關(guān)性,否則很容易引入主聲道和環(huán)繞聲道之間的不良聲源定位,帶來聲像的漂移。另外,由于揚(yáng)聲器的布置需要遵循嚴(yán)格的數(shù)量和方位,因此會(huì)出現(xiàn)聽音甜點(diǎn)區(qū)較小的問題。

        4 空間音頻(Spatial Audio)

        空間音頻是近年來的熱門話題。其實(shí)在水平環(huán)繞聲發(fā)展階段,三維聲就已經(jīng)有了雛形。延續(xù)了水平環(huán)繞聲的制作理念,人們?cè)阡浺綦A段添置上層的拾音器矩陣,制作階段將其分配到上層揚(yáng)聲器,形成了最基礎(chǔ)的三維環(huán)繞聲。而后的發(fā)展中,人們所說的3D 音頻、沉浸式音頻、空間音頻等概念從本質(zhì)上來說描述的都是一件事情:即進(jìn)一步還原真實(shí)的三維聲場(chǎng)。但空間音頻的制作在發(fā)展的過程中出現(xiàn)了與傳統(tǒng)立體聲制作完全不同的思路。

        4.1 實(shí)現(xiàn)原理

        從基本實(shí)現(xiàn)原理來說,人們可以通過兩種方式來構(gòu)建聲場(chǎng)。

        第一種是物理建模的方式,例如通過波動(dòng)方程來仿真聲場(chǎng),對(duì)所有聲音元素建立聲壓標(biāo)量和振速矢量模型,其中最具代表性的是波場(chǎng)合成技術(shù)(WFS)。惠更斯原理認(rèn)為,每個(gè)聲源發(fā)出的球形波面上的一點(diǎn)都是新的次級(jí)球面波的子波源。于是我們可以通過對(duì)各揚(yáng)聲器處的聲音波動(dòng)進(jìn)行模擬,將其當(dāng)作子波源,最終合成聲波在空間中的分布狀態(tài)——波場(chǎng)。如徐真德等人就對(duì)上海大劇院中的長(zhǎng)廊進(jìn)行了建模,并采用了聲音渲染引擎CORE 對(duì)聲音對(duì)象實(shí)時(shí)渲染,在60米長(zhǎng)、7米寬的長(zhǎng)廊里進(jìn)行了現(xiàn)場(chǎng)演出以及音樂節(jié)目的制作和展出,為聽眾帶來了沉浸式的聽音體驗(yàn)。呂小詩則是采用了DMS邊界采樣錄音原理,通過傳聲器陣列對(duì)交響音樂會(huì)進(jìn)行拾音,直接記錄了演出現(xiàn)場(chǎng)的波場(chǎng)信息。但WFS方法實(shí)現(xiàn)成本很高,龐大的音軌數(shù)目需要對(duì)應(yīng)數(shù)量的揚(yáng)聲器陣列以及復(fù)雜的算法來支持運(yùn)算和重放。且真實(shí)的聲源輻射特性和揚(yáng)聲器指向性并不一致,因此還需要在數(shù)學(xué)計(jì)算上的近似和簡(jiǎn)化,故容易引入誤差,實(shí)際效果可能與理想狀態(tài)有所出入。

        第二種方法則是根據(jù)心理聲學(xué)的原理,以近似地模擬聽音情況為目標(biāo),而不是重建完整的真實(shí)聲場(chǎng),實(shí)現(xiàn)運(yùn)算量減小,進(jìn)而優(yōu)化實(shí)現(xiàn)成本。也就是說我們只需要根據(jù)人耳聽音的習(xí)慣,塑造符合聽音期望的聲音效果就能很大程度地提升空間音頻體驗(yàn)。大多數(shù)已經(jīng)使用的空間音頻技術(shù)也都是基于該方法來實(shí)現(xiàn)的,以下討論的內(nèi)容也主要以第二種為主。

        4.2 技術(shù)手段

        從制作技術(shù)的角度來說,其可以分為三種方案:基于聲道的方案、基于對(duì)象的方案、基于場(chǎng)景的方案,以下對(duì)三種方式進(jìn)行簡(jiǎn)要的介紹。

        4.2.1 基于聲道的方案

        基于聲道的方案在理念上與上述傳統(tǒng)環(huán)繞聲類似,制作時(shí)根據(jù)心理聲學(xué)中雙耳的時(shí)間差、強(qiáng)度差等原理對(duì)聲音進(jìn)行渲染并分配至各個(gè)重放聲道,從而模擬不同方位的聲音聽感。其中具有代表性的技術(shù)如Auro-3D,在錄制和重放時(shí)采取了上、中、下三層傳聲器和揚(yáng)聲器陣列。另外日本NHK 所推行的22.2聲道更是將基于聲道的節(jié)目制作推向了更復(fù)雜的階段。由于聲道數(shù)目進(jìn)一步提高,揚(yáng)聲器的布局范圍也更大,觀眾能夠更準(zhǔn)確地感受三維空間各個(gè)方向的聲源,有效聽音范圍也有所擴(kuò)大。但該種方案的劣勢(shì)在于,隨著聲道數(shù)目的上升,制作復(fù)雜度也大大提高,如NHK 在2006年紅白歌會(huì)所進(jìn)行的22.2節(jié)目制作,錄音棚預(yù)混輸出信號(hào)和現(xiàn)場(chǎng)信號(hào)總計(jì)152通路,如此龐大的通道數(shù)對(duì)制作人員提出了極大的挑戰(zhàn)。另外聲道制作完成后就固定下來,如果要實(shí)現(xiàn)更多或更少聲道重放的上、下變換則需要額外的渲染算法,聲音質(zhì)量和效果必然會(huì)折損。

        4.2.2 基于對(duì)象的方案

        基于對(duì)象的沉浸式音頻打破了傳統(tǒng)的聲道概念,構(gòu)建了一個(gè)虛擬的聲音空間。聲源是每一個(gè)聲音對(duì)象或者事件,例如在現(xiàn)實(shí)生活中的一輛車、一只鳥、一群交談的人等。每個(gè)對(duì)象保存著各自的元數(shù)據(jù),其中記錄了聲音對(duì)象的類型、空間位置、聲壓級(jí)、運(yùn)動(dòng)軌跡、起始和釋放等信息。在制作軟件的三維空間圖示中可以直觀地改變聲源對(duì)象和聽音者所在的空間位置,渲染時(shí)再根據(jù)實(shí)際重放設(shè)備的設(shè)置情況,將每個(gè)聲音對(duì)象渲染至各聲道。從而得到更為靈活的聲音控制、更為明確的空間信息以及更為自由的聽音條件。其中最具代表性的是杜比全景聲(Dolby Atmos)技術(shù),其音頻內(nèi)容的主要構(gòu)成包括音床和聲音對(duì)象兩個(gè)部分。音床采用聲道的方式構(gòu)建,形成虛擬聲場(chǎng)的整體鋪墊,而各種聲音對(duì)象則脫離聲道的束縛單獨(dú)封裝。不論是專業(yè)影院、家庭影院、個(gè)人工作室還是移動(dòng)設(shè)備,都能通過杜比專用的渲染器和算法進(jìn)行重放。但對(duì)基于對(duì)象的數(shù)據(jù)進(jìn)行實(shí)時(shí)解碼需要消耗不菲的運(yùn)算資源,這對(duì)于大多數(shù)場(chǎng)合來說并不是件容易的事。

        4.2.3 基于場(chǎng)景的方案

        基于場(chǎng)景的沉浸式音頻是直接構(gòu)建一個(gè)完整的三維聲場(chǎng)空間。其中最具代表性的是Ambisonics 技術(shù)。Ambisonics 編解碼本質(zhì)上是對(duì)球形聲場(chǎng)求解球諧函數(shù)——隨角度變化的函數(shù),并根據(jù)揚(yáng)聲器布置情況求解饋送信號(hào)的過程。以最簡(jiǎn)單的一階Ambisonics 為例,采用四個(gè)相互獨(dú)立的指向性麥克風(fēng)構(gòu)成球形陣列,采集球形聲場(chǎng)信息得到A 格式數(shù)據(jù),經(jīng)過編碼后得到B 格式數(shù)據(jù)(Ambisonics 信號(hào))W、X、Y、Z。其中W 表示聲場(chǎng)整體強(qiáng)度,X、Y、Z則為三維空間的三個(gè)正交方向。重放時(shí)則根據(jù)重放設(shè)備的設(shè)置,將四個(gè)音軌渲染為對(duì)應(yīng)聲道的信號(hào)。代表性產(chǎn)品如森海塞爾的AMBEO 系列,為錄音、制作到重放提供了配套的完整解決方案。但低階信號(hào)分量較少,空間分辨率有限,會(huì)出現(xiàn)還原聲場(chǎng)精細(xì)度不足的問題,導(dǎo)致出現(xiàn)定位模糊的現(xiàn)象。而高階Ambisonics 編碼能提供更好的音質(zhì)、更精準(zhǔn)的空間分辨率、更高的頻率上限,但需要采集更多的信號(hào),消耗更多傳輸和運(yùn)算成本。Ambisonics 作為三維聲場(chǎng)一體成型的方案在空間音頻領(lǐng)域有著得天獨(dú)厚的優(yōu)勢(shì),但與基于對(duì)象的方法相比,難以對(duì)聲音元素進(jìn)行靈活地再創(chuàng)造。另外,饒丹也指出Ambisonics 對(duì)于近場(chǎng)點(diǎn)聲源的編碼和重放,由于揚(yáng)聲器特性不匹配而容易在低頻產(chǎn)生很大的誤差。

        4.3 應(yīng)用實(shí)例

        虛擬現(xiàn)實(shí)可謂是空間音頻技術(shù)最具代表性的應(yīng)用領(lǐng)域。雖然虛擬現(xiàn)實(shí)的起源可以追溯到1968年,但直到2014 年Facebook 收購(gòu)虛擬現(xiàn)實(shí)技術(shù)廠商Oculus VR,虛擬現(xiàn)實(shí)技術(shù)的發(fā)展才呈現(xiàn)迅猛發(fā)展起來。目前VR 領(lǐng)域比較有代表性的產(chǎn)品有HTC VIVE、Oculus Rift、Play Station VR 等。在VR聲音制作中,音樂和對(duì)白等元素往往基于聲道制作,氛圍、背景聲等穩(wěn)定聲源會(huì)進(jìn)行基于場(chǎng)景的制作,而對(duì)于音效等變化豐富的元素則基于對(duì)象來處理。通常來說VR 系統(tǒng)以耳機(jī)作為聲音的重放設(shè)備,要實(shí)現(xiàn)三維音頻到雙耳聽音的轉(zhuǎn)換往往需要使用頭部相關(guān)傳遞函數(shù)(HRTF)或者雙耳房間脈沖響應(yīng)(BRIR)來對(duì)聲音信號(hào)進(jìn)行雙耳渲染,以模擬聲源傳輸?shù)竭_(dá)聽音者雙耳的過程。Google Resonance SDK 就是比較有代表性的VR 聲音開發(fā)工具包之一,它可以與3D 游戲引擎如Unity、音頻引擎如Wwise、數(shù)字音頻工作站結(jié)合在一起,幫助開發(fā)者創(chuàng)作三維聲內(nèi)容。

        在電影領(lǐng)域,以Dolby、DTS 為代表的廠商們,也已經(jīng)在專業(yè)影院、家庭影院、筆記本電腦外置揚(yáng)聲器、耳機(jī)等終端提供了相應(yīng)的空間音頻解決方案,使得在有限的設(shè)備上也能獲取較好的三維聲效果。2020年蘋果公司也為Airpods pro 耳機(jī)推出了適配杜比全景聲的更新,用戶的頭部運(yùn)動(dòng)可以通過耳機(jī)陀螺儀進(jìn)行跟蹤,從而產(chǎn)生聲音信號(hào)的聽音視角變化。

        SoundBar 是另一種實(shí)現(xiàn)家庭環(huán)繞聲的解決方案,索尼、雅馬哈、JBL、森海塞爾等多個(gè)知名廠商都有推出相應(yīng)的產(chǎn)品。SoundBar 需要利用天花板、墻面的聲反射實(shí)現(xiàn)聲音的包圍感,這相比于傳統(tǒng)的環(huán)繞聲系統(tǒng)大大降低了硬件成本,也更方便布置。但對(duì)于反射聲的依賴也對(duì)聽音環(huán)境的反射特性有較高要求,且甜點(diǎn)區(qū)較小。

        虛擬環(huán)繞聲方面,以Ambidio 公司為代表,則致力于實(shí)現(xiàn)在任何立體聲設(shè)備上創(chuàng)造連續(xù)的聲場(chǎng),為聽眾帶來沉浸式聲音體驗(yàn)。虛擬環(huán)繞聲與上述技術(shù)的不同點(diǎn)在于,該技術(shù)的節(jié)目源并不存在多個(gè)聲道,而是通過算法渲染的手段將立體聲節(jié)目在聽感上進(jìn)行拓展,以實(shí)現(xiàn)近似的三維聲效果。

        由ISO/IEC提出的MPEG-H 3D Audio為空間音頻的制作、傳輸、重放提供了包括基于聲道、基于對(duì)象、基于場(chǎng)景的完整音頻標(biāo)準(zhǔn)。而基于對(duì)象進(jìn)行制作的Sony 360 Reality Audio技術(shù)正是順應(yīng)了以音頻流為核心的MPEG-H 標(biāo)準(zhǔn),與多個(gè)音樂流媒體平臺(tái)達(dá)成了合作,讓聽眾通過耳機(jī)就能享受沉浸式的音樂體驗(yàn),這也為藝術(shù)家的創(chuàng)作提供了更多的可能性。值得一提的是,索尼耳機(jī)的用戶可以對(duì)耳部照片進(jìn)行上傳,通過算法分析為用戶提供個(gè)性化的HRTF,以解決HRTF 不匹配導(dǎo)致的定位失效等問題。

        目前開源的空間音頻制作工具數(shù)量不少。如向海燕等人在面向多平臺(tái)的節(jié)目制作中,使用了阿爾托大學(xué)聲學(xué)實(shí)驗(yàn)室(the Acoustics Lab at Aalto University)開發(fā)并開源的Spatial Audio Real-time Applications(SPARTA)套件,對(duì)現(xiàn)場(chǎng)節(jié)目錄制中的LDK-Cube 話筒編組、點(diǎn)話筒編組的Ambisonics 混響、觀效話筒編組的信號(hào)編碼至高階的Ambisonics,再根據(jù)需求在重放端解碼,以適應(yīng)多平臺(tái)分發(fā)三維聲錄制節(jié)目的需求。類似的插件還有電子音樂與聲學(xué)學(xué)院(Institute of Electronic Music and Acoustics)研究人員開發(fā)的IEM Plug-in Suite,同樣能實(shí)現(xiàn)基于Ambisonics 的各種效果處理,并根據(jù)需求渲染至揚(yáng)聲器或者耳機(jī)。另外,F(xiàn)ranck等人提出的BST(雙耳合成工具包)同時(shí)提供基于對(duì)象的動(dòng)態(tài)HRIR 合成、基于HOA(高階Ambisonics)的合成、虛擬聲學(xué)環(huán)境的揚(yáng)聲器合成三種模式,并且可以實(shí)現(xiàn)聲音對(duì)象到Ambisonics 的數(shù)據(jù)轉(zhuǎn)換。以上提到的工具中,都可以配合頭顯設(shè)備進(jìn)行視角跟蹤,且SPARTA 和BST 可以輸入個(gè)性化的HRIR或BRIR 文件進(jìn)行雙耳渲染。

        Flux公司的SpatRevolution 是商業(yè)領(lǐng)域具有代表性的空間音頻制作軟件,輸入源可以兼容聲道、Ambisonics、MS、Binaural(雙耳)、Transaural(雙耳轉(zhuǎn)揚(yáng)聲器)、UHJ格式。該軟件最大的特點(diǎn)在于可以創(chuàng)建多個(gè)“Room”同時(shí)進(jìn)行多節(jié)目的制作,為每個(gè)Room 設(shè)置不同的聲源擺位、空間效果處理、輸出渲染方式等,從而同時(shí)輸出多種節(jié)目流。另外,Spat Revolution 現(xiàn)在也正準(zhǔn)備引入波場(chǎng)合成技術(shù)來為現(xiàn)場(chǎng)演出帶來沉浸式的體驗(yàn),通過控制電平、相位、延時(shí)和濾波等手段,在較小的擴(kuò)聲揚(yáng)聲器陣列上得到更為寬闊的有效聽音范圍。

        此外,很多音樂制作插件也引入了空間音頻的理念,如Waves的Abbey Road Studio 3對(duì)錄音棚進(jìn)行了HRTF 建模并加入頭部跟蹤,以佩戴耳機(jī)的方式模擬混錄棚的聽覺體驗(yàn)。Inspired Acoustics發(fā)布的沉浸式混響工作站軟件Inspirata,基于廣泛的真實(shí)空間聲學(xué)測(cè)量結(jié)果,讓用戶可以將聲源和聽音點(diǎn)作為對(duì)象布置在空間中的任意位置,通過脈沖響應(yīng)進(jìn)行渲染,且支持實(shí)時(shí)的位置移動(dòng)和聲學(xué)空間改變。

        5 總結(jié)和展望

        本文從聽覺感知出發(fā),討論了聲音的空間屬性以及人對(duì)聲音空間感與生俱來的感知特點(diǎn),并根據(jù)立體聲到空間音頻技術(shù)的演變過程,對(duì)聲音制作的技術(shù)手段進(jìn)行了論述,分析了各種技術(shù)的優(yōu)缺點(diǎn)。

        總的來說,空間音頻技術(shù)正在走向成熟,并且從專業(yè)領(lǐng)域下探至民用領(lǐng)域,但從實(shí)踐的角度來說依然存在不少的問題。例如聽音環(huán)境的不同、聽者的HRTF 相異、重放設(shè)備的限制等因素,都將明顯影響聲音空間的重現(xiàn)質(zhì)量。而Reardon 等人也通過實(shí)驗(yàn)表明,渲染算法在處理不同節(jié)目類型時(shí)的效果優(yōu)劣并不相同,這也對(duì)空間音頻技術(shù)的普適性提出了極大挑戰(zhàn)。除此之外,根據(jù)筆者的體驗(yàn)來看,雙耳渲染的效果對(duì)比揚(yáng)聲器重放來說差異還是十分明顯,這可能是今后空間音頻技術(shù)需要突破的重點(diǎn)之一。

        另外,人的視覺對(duì)空間的感知同樣重要。正如Salmon等人所說,眾多對(duì)三維聲視聽交互的研究表明,在聲源定位、距離感知、聲音外化感等方面,視覺因素都起到了很明顯的引導(dǎo)作用,并且對(duì)聲環(huán)境空間感的感知也有一定的影響。所以在實(shí)踐中,對(duì)空間聲場(chǎng)近似還原的目標(biāo)很多時(shí)候也是通過視覺因素配合來實(shí)現(xiàn)的,例如在聲畫同步、內(nèi)容對(duì)應(yīng)的時(shí)候,聲音的沉浸感就進(jìn)一步加強(qiáng)了。因此我們可以借助如頭顯設(shè)備、頭部跟蹤、人機(jī)交互等手段來進(jìn)一步提高空間音頻的感知質(zhì)量。

        而在未來的發(fā)展中,借由微軟交互3D 技術(shù)團(tuán)隊(duì)開發(fā)的Holoportation 技術(shù)帶來的靈感,筆者認(rèn)為空間音頻技術(shù)在全息視頻領(lǐng)域也可以有所應(yīng)用。Holoportation 通過房間中布置的多組傳感器掃描使用者人體影像,而對(duì)方則可以通過增強(qiáng)現(xiàn)實(shí)眼鏡看到房間里的使用者虛擬人影像。若將該技術(shù)中的環(huán)境信息和聲源空間定位信息傳輸?shù)娇臻g音頻軟件之中,也許能為全息視頻音樂會(huì)的實(shí)現(xiàn)帶來新的契機(jī)和理念。

        隨著空間音頻的研究和實(shí)踐不斷深入,以及通信技術(shù)、計(jì)算機(jī)技術(shù)的進(jìn)一步發(fā)展,在未來各類媒介中聲音元素的存在價(jià)值會(huì)越來越大,并且越來越接近真實(shí)的聲場(chǎng)狀況。同時(shí)也可以看到未來空間音頻實(shí)現(xiàn)的成本將越來越低,設(shè)備更加趨于便攜化和大眾化,現(xiàn)在的三維聲雙耳渲染算法就是一個(gè)很好的例子。

        免费夜色污私人影院在线观看| 国产一区二区精品亚洲| 成视频年人黄网站免费视频| 国产亚洲精品久久久久婷婷瑜伽| 高清无码精品一区二区三区| 亚洲视频在线中文字幕乱码| 森中文字幕一区二区三区免费| 少妇下面好紧好多水真爽播放| 91久久精品国产91久久| 强d乱码中文字幕熟女1000部| 色播视频在线观看麻豆| 国产狂喷潮在线观看| 丰满少妇人妻无码专区| 国产av91在线播放| 国产国拍精品亚洲av在线观看| 精品无码国产自产拍在线观看蜜| 在线视频精品免费| 毛片av在线尤物一区二区| 日本一区二区三区视频免费观看| 亚洲中文字幕成人无码| 国产午夜福利不卡在线观看视频| 亚洲精品二区三区在线观看| 日本人妖熟女另类二区| 国产一区二区内射最近更新| 成年女人A级毛片免| 日本超骚少妇熟妇视频| 亚洲自偷精品视频自拍| 欧美日本国产va高清cabal | 亚洲AV无码成人精品区H| 天堂网日韩av在线播放一区| 人与动牲交av免费| 欧美午夜a级精美理论片| 蜜桃在线观看视频在线观看| 麻豆国产一区二区三区四区| 色婷婷久久一区二区三区麻豆| 国产一起色一起爱| 亚洲视频专区一区二区三区| 玩中年熟妇让你爽视频| 伊人网在线视频观看| 99视频偷拍视频一区二区三区| 亚州国产av一区二区三区伊在|