自動(dòng)混音技術(shù)并不是一項(xiàng)新技術(shù),從上個(gè)世紀(jì)70年代開(kāi)始涌現(xiàn)各種類(lèi)型的自動(dòng)混音器,以及其中的各種專(zhuān)利到現(xiàn)在轉(zhuǎn)變?yōu)镈SP設(shè)備內(nèi)的一個(gè)功能。自動(dòng)混音器的形態(tài)也正逐漸從一臺(tái)獨(dú)立的設(shè)備到虛擬的編程算法。雖然現(xiàn)在各家的軟件算法,并不會(huì)公布,但我們可以通過(guò)了解自動(dòng)混音器內(nèi)的核心技術(shù)和原理來(lái)更好地理解和使用DSP內(nèi)的自動(dòng)混音功能。這也是本文寫(xiě)作的目的。
為什么要用自動(dòng)混音技術(shù)?
要探討這個(gè)問(wèn)題我們將以自動(dòng)混音技術(shù)最常用的場(chǎng)合——會(huì)議室來(lái)談。首先我們看下圖一個(gè)標(biāo)準(zhǔn)的會(huì)議室的照片。
圖中我們可以清晰的得到以下三點(diǎn):
1.話(huà)筒數(shù)量多。一個(gè)幾十平米的會(huì)議室往往需要塞下十幾只甚至更多的話(huà)筒。音響工程師調(diào)試時(shí)都會(huì)遇到一個(gè)現(xiàn)象:一只一只話(huà)筒調(diào)試到不嘯叫,但是開(kāi)啟兩只或更多話(huà)筒時(shí)就莫名其妙的嘯叫起來(lái)。這也是音響人經(jīng)常提的一個(gè)定律:打開(kāi)話(huà)筒數(shù)量增加一倍,系統(tǒng)增益增加3dB,即NOMG(Number of Open Microphone Gain)=10lg(NOM),如右圖 :
為了能夠同時(shí)打開(kāi)足夠多的話(huà)筒和確保系統(tǒng)的穩(wěn)定,越多的話(huà)筒我們得調(diào)越多的系統(tǒng)余量。同時(shí)由于打開(kāi)話(huà)筒越多拾取的環(huán)境噪音也越多,導(dǎo)致系統(tǒng)的信噪比下降,無(wú)法獲得足夠的語(yǔ)言清晰度。
2.不注重聲學(xué)裝修。不論是哪種廳堂更注重肯定是視覺(jué),裝修一定要好看,大氣,莊重等。會(huì)議室也不例外,且很多會(huì)議室甚至是全玻璃結(jié)構(gòu)的根本不考慮擴(kuò)聲的需求。等到真正使用擴(kuò)聲時(shí),才發(fā)現(xiàn)房間反射嚴(yán)重,根本沒(méi)法獲得足夠的語(yǔ)音清晰度和傳聲增益。。
3.話(huà)筒正對(duì)著音箱。會(huì)議室是一個(gè)面對(duì)面交流的地方,聽(tīng)者和說(shuō)話(huà)者都在一個(gè)空間內(nèi),那這樣也就意味著擴(kuò)聲揚(yáng)聲器覆蓋的區(qū)域同時(shí)又需要話(huà)筒進(jìn)行拾音,所以在會(huì)議室內(nèi)幾乎都會(huì)遇到話(huà)筒正對(duì)音箱的情況。這樣直接導(dǎo)致我們無(wú)法獲得足夠的傳聲增益。
通過(guò)以上三個(gè)問(wèn)題我們可以看到一個(gè)矛盾點(diǎn):話(huà)筒多需要為系統(tǒng)留足夠的余量,但建聲環(huán)境和音箱話(huà)筒擺位又無(wú)法為系統(tǒng)提供足夠的余量。如何化解這個(gè)矛盾成為關(guān)鍵。第一個(gè)問(wèn)題,不注重聲學(xué)裝修,反射嚴(yán)重,人們的習(xí)慣很難改正,也正是因?yàn)檫@點(diǎn),現(xiàn)在會(huì)議室越來(lái)越流行采用可調(diào)指向的音柱進(jìn)行擴(kuò)聲,從一定意義上減少了部分反射,當(dāng)然這一部分內(nèi)容并不是本文探討的范疇,總之第一個(gè)問(wèn)題我們幾乎沒(méi)什么可商量的余地,但這卻是最好的解決方法;第二個(gè)問(wèn)題,話(huà)筒正對(duì)音箱可以通過(guò)MIX-MINUS的系統(tǒng)設(shè)計(jì),在一定程度上得到提高,但效果有限。擺在我們面前的只有從第三個(gè)問(wèn)題出發(fā)了,既然打開(kāi)話(huà)筒越多會(huì)增加更多的系統(tǒng)增益,那我們就想辦法控制打開(kāi)的話(huà)筒數(shù)量和減少因開(kāi)啟話(huà)筒增加而增加的增益。那我們來(lái)看一下一般的現(xiàn)在有哪幾種解決方法:
1.調(diào)音師現(xiàn)場(chǎng)調(diào)控。調(diào)音師是最佳的人選來(lái)控制會(huì)場(chǎng)的話(huà)筒和音量。但是問(wèn)題是當(dāng)話(huà)筒超過(guò)6只,甚至幾十只話(huà)筒時(shí),而且會(huì)議持續(xù)幾個(gè)小時(shí)之久時(shí),事情就沒(méi)有那么簡(jiǎn)單了。如何來(lái)判斷某個(gè)參會(huì)人員要發(fā)言也是個(gè)問(wèn)題,有時(shí)調(diào)音師也無(wú)法清楚地看到每一個(gè)參會(huì)者,很容易犯錯(cuò)??v使我們能找來(lái)一個(gè)很厲害的調(diào)音師能解決以上問(wèn)題,但是如果我們有很多的會(huì)議室時(shí),給每一個(gè)會(huì)議室配備一個(gè)如此高水準(zhǔn)的調(diào)音師也是不合理,且其成本是無(wú)法承受的。
2.會(huì)議系統(tǒng)。很多會(huì)議室會(huì)選擇會(huì)議系統(tǒng)進(jìn)行話(huà)筒的管理和限制。通過(guò)限制話(huà)筒開(kāi)啟數(shù)量確實(shí)能一定意義上減少對(duì)余量的需求。但某些會(huì)議中為了限制的數(shù)量可能會(huì)影響會(huì)議的流暢度。會(huì)議系統(tǒng)的音質(zhì),是讓很多使用者和音響工程師所詬病的。同時(shí)會(huì)議系統(tǒng)往往混音一路的輸出到處理設(shè)備,均衡話(huà)筒時(shí)將對(duì)所有話(huà)筒進(jìn)行調(diào)整,然而實(shí)際每個(gè)話(huà)筒的均衡點(diǎn)都是不一樣的,而且還經(jīng)常會(huì)遇到,調(diào)完某個(gè)話(huà)筒,其他某個(gè)某幾個(gè)話(huà)筒嘯叫起來(lái)等現(xiàn)象。最終導(dǎo)致音質(zhì)更差,且浪費(fèi)很多調(diào)音師寶貴的時(shí)間。
3.自動(dòng)混音技術(shù)。自動(dòng)根據(jù)電平開(kāi)啟或關(guān)閉話(huà)筒,能夠自動(dòng)平衡因開(kāi)啟話(huà)筒數(shù)量成倍而增加的系統(tǒng)增益。其實(shí)與第一種方式很相似,只不過(guò)此時(shí)人變成了設(shè)備。那此時(shí)由于能減少對(duì)余量的需求,且話(huà)筒采用的是鵝頸話(huà)筒的形式,最終出來(lái)的聲音會(huì)比會(huì)議系統(tǒng)好很多。但實(shí)際上單臺(tái)的自動(dòng)混音器其實(shí)與會(huì)議系統(tǒng)類(lèi)似,最終也是混音一路到處理設(shè)備進(jìn)行處理。這樣的處理形式其實(shí)與會(huì)議系統(tǒng)一樣存在問(wèn)題。所以我們一般會(huì)推薦給客戶(hù)使用的是帶自動(dòng)混音器功能的DSP設(shè)備每只話(huà)筒都可以得到相應(yīng)精準(zhǔn)的調(diào)試,這樣音質(zhì)最優(yōu)化,同時(shí)某些具備自動(dòng)混音器直接輸出功能,可輕松做到MIX-MINUS,而這一點(diǎn)也是普通自動(dòng)混音器或會(huì)議系統(tǒng)幾乎無(wú)法實(shí)現(xiàn)的。且由于可以結(jié)合DSP自身豐富的功能,實(shí)現(xiàn)諸多會(huì)議系統(tǒng)的功能如主席優(yōu)先,請(qǐng)求發(fā)言,攝像跟蹤等等。
綜上3種解決方案,會(huì)議中多話(huà)筒處理既能達(dá)到較好的音質(zhì),保證系統(tǒng)穩(wěn)定,又能實(shí)現(xiàn)較多會(huì)議管理功能的最好方案是采用DSP設(shè)備的自動(dòng)混音功能。了解完為什么需要使用自動(dòng)混音技術(shù)后下面就自動(dòng)混音技術(shù)的分類(lèi)和技術(shù)進(jìn)行闡述。
自動(dòng)混音技術(shù)分類(lèi)
從前文我們可以得到自動(dòng)混音器需具2個(gè)基本要素:1. 何時(shí)及如何開(kāi)啟和關(guān)閉話(huà)筒;2. 如何平衡NOM增益。從技術(shù)上可以分為兩類(lèi):Gating和Gainsharing自動(dòng)混音器。
Gating
Gating自動(dòng)混音器顧名思義會(huì)有一個(gè)門(mén)限來(lái)控制話(huà)筒的開(kāi)關(guān),聲音超過(guò)門(mén)限則打開(kāi)話(huà)筒,聲音低于門(mén)限則關(guān)閉話(huà)筒。那如何來(lái)獲得最佳的門(mén)限(Threshold)?
固定閾值:最簡(jiǎn)單也是最常見(jiàn)的就是采用一個(gè)語(yǔ)音觸發(fā)開(kāi)關(guān)或噪聲門(mén),設(shè)定一個(gè)固定的值,超過(guò)這個(gè)值則話(huà)筒開(kāi)啟,低于則關(guān)閉。通常這個(gè)值是可以調(diào)整的,但無(wú)法根據(jù)環(huán)境噪音自行調(diào)整,所以得到的效果往往不盡意??蓞⒁?jiàn)下圖:
在很多情況下如果設(shè)置得太小,則環(huán)境噪音、鼓掌和某些音樂(lè)等聲音很容易就可以開(kāi)啟話(huà)筒。設(shè)置得太高則又很容易出現(xiàn)吃字或聲音卡殼等現(xiàn)象。當(dāng)使用噪聲門(mén)等裝置還有另外一個(gè)問(wèn)題就是當(dāng)全體鼓掌的情況出現(xiàn)時(shí),所有話(huà)筒都被打開(kāi),系統(tǒng)極其容易產(chǎn)生嘯叫。由于固定閾值實(shí)現(xiàn)簡(jiǎn)單,成本低,很多自動(dòng)混音器和軟件化的自動(dòng)混音器仍舊采用類(lèi)似的方法來(lái)做決策,其最終的效果往往很差。
自適應(yīng)閾值:由于固定閾值很難得到較好的效果,各家廠(chǎng)商相繼推出了自己的自適應(yīng)閾值電路或算法,可根據(jù)環(huán)境噪音實(shí)時(shí)得到新的閾值,最終效果的好壞也各有差異。基本示意可參見(jiàn)下圖:
自適應(yīng)閾值的工作原理各有差異,但歸結(jié)起來(lái)有一下幾種類(lèi)型:
1. 噪聲感應(yīng)。如給每個(gè)話(huà)筒都加一個(gè)噪聲感應(yīng)的話(huà)筒,作為其環(huán)境噪聲的判斷水平。有些采用一組話(huà)筒或一個(gè)混音器一個(gè)感應(yīng)話(huà)筒的輸入作為參考環(huán)境噪音水平。這種方法是最直接的思考方式,但對(duì)感應(yīng)話(huà)筒的位置擺放要求較高。早期舒爾曾經(jīng)出過(guò)需要匹配相應(yīng)麥克風(fēng)的自動(dòng)混音器。
2. 掃描閾值。由于噪聲感應(yīng)的額外投入,涌現(xiàn)出了各種通過(guò)掃描當(dāng)前每只話(huà)筒的電平然后確定一個(gè)閾值的電路或算法。而這正是體現(xiàn)廠(chǎng)家自動(dòng)混音技術(shù)優(yōu)劣的技術(shù)關(guān)鍵點(diǎn)。簡(jiǎn)單的直接求平均作為閾值,也有不斷向下掃描,當(dāng)遇到最大的電平的通道則在該通道保持一個(gè)很短的時(shí)間,以此往復(fù)。做得不好的閾值電路和算法可能就會(huì)出現(xiàn)常見(jiàn)的“吃字”現(xiàn)象。當(dāng)使用這種方式時(shí)的好處是顯而易見(jiàn)的,調(diào)試人員將不需要去設(shè)置閾值,將節(jié)省大量的調(diào)試時(shí)間。
門(mén)控技術(shù):在解決完閾值的設(shè)定問(wèn)題后,實(shí)際在早期設(shè)計(jì)自動(dòng)混音技術(shù)還遇到一個(gè)問(wèn)題就是開(kāi)關(guān)所帶來(lái)的電子脈沖聲音。這也是早期限制自動(dòng)混音器推廣的原因之一。目前而言主流的廠(chǎng)商都是采用offattenuation的方式來(lái)實(shí)現(xiàn)話(huà)筒的開(kāi)關(guān)。off-attenuation實(shí)際就是將開(kāi)關(guān)變成了通道的衰減。我們知道0dBu的信號(hào)輸出當(dāng)我們衰減-40dBu以后將幾乎聽(tīng)不到任何的聲音。所以通過(guò)這種方式就很好的解決了話(huà)筒開(kāi)關(guān)而帶來(lái)的噪音。
NOMA(Number of Open Microphone Attenuation):前面我們討論的主要是閾值如何確定,以及確定了閾值后話(huà)筒如何開(kāi)關(guān)的技術(shù)手段。我們還有最后一個(gè)問(wèn)題,多個(gè)話(huà)筒開(kāi)啟后增加的增益如何解決?一般而言Gating自動(dòng)混音器都會(huì)采用如下的電路來(lái)實(shí)現(xiàn)總體增益的平衡。采用一個(gè)計(jì)數(shù)器來(lái)記錄當(dāng)前開(kāi)啟話(huà)筒的數(shù)量,然后根據(jù)數(shù)量進(jìn)行相應(yīng)的總增益衰減。如開(kāi)啟兩只衰減3dB,開(kāi)啟四只衰減6dB。
那前面我們談的NOMG=10lg(NOM),這是一個(gè)標(biāo)稱(chēng)上的增益增加。但是我們沒(méi)有將信號(hào)的相干性考慮進(jìn)去。在一個(gè)標(biāo)準(zhǔn)的會(huì)議室,不同的講話(huà)者使用不同的話(huà)筒,信號(hào)進(jìn)入各自的麥克風(fēng)通道,這兩者我們普遍意義上理解為“不相干信號(hào)”。當(dāng)一個(gè)講話(huà)者同時(shí)對(duì)著距離相等的兩個(gè)話(huà)筒,則在話(huà)筒端將接收到兩個(gè)完全一樣的信號(hào),我們稱(chēng)此為“相干信號(hào)”。相干信號(hào)在電平上不一定要相等,但大小相差一定是很小的。另一個(gè)相干的例子就是當(dāng)會(huì)議室的門(mén)被用力的開(kāi)關(guān),書(shū)本掉在地上,或大家的鼓掌聲等很有可能在兩個(gè)或多個(gè)話(huà)筒出產(chǎn)生類(lèi)似大小的信號(hào)。關(guān)于兩個(gè)信號(hào)疊加加入相位的考慮實(shí)際我們開(kāi)啟話(huà)筒數(shù)量的系統(tǒng)增益是:
Et:總聲壓、電流、或電壓
E1:第一個(gè)信號(hào)
E2:第一個(gè)信號(hào)
α:信號(hào)的相位角
由上我們可以得出實(shí)際兩個(gè)信號(hào)的疊加是0~6dB的增益增加?;诖瞬糠謴S(chǎng)商在做NOMA電路時(shí)將此值開(kāi)放作為可調(diào),但是當(dāng)作為可調(diào)時(shí)就增加了工程師調(diào)試時(shí)的調(diào)試參數(shù)和對(duì)技術(shù)的理解,且由于3~6dB的增加往往是較少情況出現(xiàn),如果為了部分極少出現(xiàn)的情況而大大降低我們的系統(tǒng)增益是得不償失的。所以很多廠(chǎng)商會(huì)采用中間默認(rèn)為3dB的衰減。這種方式帶來(lái)的另外一個(gè)問(wèn)題是開(kāi)啟多只話(huà)筒可能多的增益,可能的嘯叫。則為了避免此問(wèn)題我們?cè)谡{(diào)試Gating自動(dòng)混音器時(shí)還需要注意在FSM(反饋穩(wěn)定余量)6dB的基礎(chǔ)上再增加至少3dB的系統(tǒng)余量來(lái)保證系統(tǒng)的穩(wěn)定運(yùn)行。(未完待續(xù))