【摘要】處在信息化時(shí)代,計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)得到了普遍應(yīng)用,數(shù)字音頻這一概念也就隨之出現(xiàn),經(jīng)過(guò)不斷的發(fā)展,在休閑娛樂(lè)、學(xué)習(xí)等領(lǐng)域均發(fā)揮著重要作用,成為現(xiàn)代人休閑活動(dòng)的時(shí)尚大趨勢(shì)。本文主要研究了模擬音頻和數(shù)字音頻之間的轉(zhuǎn)換、數(shù)字音頻錄制與播放及數(shù)字音頻格式等內(nèi)容進(jìn)行研究,闡述了數(shù)字音頻的格式運(yùn)用和發(fā)生原理,堅(jiān)信數(shù)字音頻未來(lái)發(fā)展前景會(huì)更加廣闊。
【關(guān)鍵詞】數(shù)字音頻;發(fā)聲原理;播放格式
數(shù)字音頻是一種全新的數(shù)字技術(shù),其應(yīng)用深入到人們?nèi)粘I钪械亩鄠€(gè)領(lǐng)域,給人們的生活帶來(lái)了很大的變化,像MD、CD、MP3及flash等音頻設(shè)備及軟件均應(yīng)用到了數(shù)字音頻。盡管計(jì)算機(jī)多媒體技術(shù)逐漸完善,具備多項(xiàng)功能,但仍無(wú)法完成對(duì)聲音模擬信號(hào)的處理,處理對(duì)象僅限于數(shù)字信號(hào),而計(jì)算機(jī)之所能發(fā)揮收聽(tīng)、錄制聲音的作用都是建立在數(shù)字音頻的基礎(chǔ)上才實(shí)現(xiàn)的。
一、模擬音頻與數(shù)字音頻的轉(zhuǎn)換
數(shù)字音頻的聲音采樣指的是在電腦中把模擬音頻轉(zhuǎn)化成數(shù)字音頻的過(guò)程,需要借助數(shù)字-模擬轉(zhuǎn)換器(簡(jiǎn)稱(chēng)DAC)。D/A轉(zhuǎn)換器這一器件的任務(wù)就是將模擬信號(hào)以二進(jìn)制碼比特(bit)即0和1的形式表達(dá)出來(lái),數(shù)字音頻文件都是通過(guò)0和1表示出來(lái)的[1]。如圖1所示,原始音頻曲線通過(guò)正弦曲線表現(xiàn)出來(lái),經(jīng)數(shù)字音頻采樣后的結(jié)果通過(guò)深色方格顯示出來(lái),數(shù)字音頻采樣效果同正弦曲線同深色方格吻合程度成正比,即吻合程度越高,采樣效果越好。
圖1 數(shù)字音頻采樣效果圖
圖1中橫、縱坐標(biāo)分別為采樣頻率及采樣分辨率,自左向右縱向分析得知小格子的體積逐漸縮小,密度越來(lái)越大,呈現(xiàn)橫坐標(biāo)先增密,縱坐標(biāo)后增密的現(xiàn)象。這就說(shuō)明:隨著橫坐標(biāo)密度的增大,相鄰采樣時(shí)刻間距縮短,在這種情況下采集的聲音數(shù)據(jù)更加趨向于真實(shí)化,同原始聲音越接近。因此,要想保證良好的音質(zhì)就必須增大采樣的頻率,可以通過(guò)縮小縱坐標(biāo)單位的方式來(lái)達(dá)到提高音質(zhì)的目的。
數(shù)字音頻文件中含有非常龐大的數(shù)據(jù)信息量,一般對(duì)于CD音樂(lè)的音質(zhì),都將聲卡的采樣頻率設(shè)置為44.1kHz,要想達(dá)到這個(gè)標(biāo)準(zhǔn)就要求保證采集頻率為每秒四萬(wàn)次[2]。下面以圖2為例,說(shuō)明規(guī)定采集頻率要求的原因。采樣點(diǎn)通過(guò)圓點(diǎn)來(lái)表示,原始音頻波形顯示在圖的上半部分,錄制后波形顯示在圖的下半部分。
如圖2所示,由于采樣點(diǎn)數(shù)量較少而導(dǎo)致原始音頻波形和錄制后波形吻合程度差,這種現(xiàn)象即為低頻失真。針對(duì)這一問(wèn)題,奈奎斯特定理(Nyquist’s Theorem)中指出:應(yīng)確保采樣頻率大于等于兩倍的錄制音頻頻率最高值,才能有效的避免低頻失真的現(xiàn)象,提高音頻的音質(zhì),該標(biāo)準(zhǔn)即為信道的極限速率。而圖2中的采樣頻率達(dá)不到要求的標(biāo)準(zhǔn),只為3/4倍的錄制頻率,所以會(huì)造成上下波形不吻合的情況。通常在普通的音樂(lè)作品中只要確保最高音符在小于7kHz~8kHz的范圍內(nèi)即可,從理論上來(lái)看采樣頻率只要為16kHz即可,但是這只能說(shuō)明基音音高為7kHz~8kHz,在錄制過(guò)程中還會(huì)出現(xiàn)多種泛音列,所以,僅依靠信道的極限速率的途徑對(duì)采樣頻率進(jìn)行設(shè)置是遠(yuǎn)遠(yuǎn)不夠的,缺乏一定的科學(xué)性[3]。
圖2 數(shù)字音頻采樣頻率圖
數(shù)字音頻采樣過(guò)程中出現(xiàn)的失真的具體含義是,人們?cè)诼?tīng)到的聲音不真實(shí),人類(lèi)實(shí)際的聽(tīng)覺(jué)范圍為20Hz~20kHz,因此為了保證聽(tīng)覺(jué)不失真就必須要求采樣頻率為40kHz。上述CD聲卡44.1kHz的采樣頻率也基于這一要求而制定的,考慮到實(shí)際情況的誤差,保有余地而將其設(shè)置的略大于40kHz。參考奈奎斯特定理,在維持44.1kHz的采樣頻率的情況下,不會(huì)因?yàn)槌霈F(xiàn)頻率為22.05kHz的超聲波而發(fā)生失真的問(wèn)題。48kHz的采樣頻率是目前音頻行業(yè)普遍采用的標(biāo)準(zhǔn),對(duì)信道的極限速的要求更高,要求也更加嚴(yán)格。
計(jì)算機(jī)對(duì)聲音數(shù)據(jù)進(jìn)行處理后,應(yīng)先利用麥克風(fēng)對(duì)錄制的各種聲音進(jìn)行處理,通過(guò)模數(shù)變換器(A/D轉(zhuǎn)換器)的轉(zhuǎn)換后,模擬信號(hào)會(huì)轉(zhuǎn)化為數(shù)字信號(hào),并輸入到計(jì)算機(jī)中進(jìn)行相關(guān)的編輯和修改工作,最后將完工后的音頻作品輸入到D/A轉(zhuǎn)換器中,實(shí)現(xiàn)數(shù)字信號(hào)向模擬信號(hào)的轉(zhuǎn)變,對(duì)錄制的聲音進(jìn)行高質(zhì)量的還原,借助音箱等工具使聲音播放出來(lái)。
二、數(shù)字音頻的錄制與播放
通過(guò)以上研究,可以發(fā)現(xiàn)數(shù)字音頻具有優(yōu)秀的品質(zhì),具體可以通過(guò)以下幾個(gè)方面體現(xiàn)出來(lái):聲音數(shù)據(jù)是通過(guò)數(shù)字的方式對(duì)錄制好音樂(lè)進(jìn)行儲(chǔ)存,這種儲(chǔ)存方式大大降低了傳輸誤差,提高了數(shù)據(jù)傳輸?shù)臏?zhǔn)確性,從根本上提高了音質(zhì),即使在多次播放后,完成錄制的音樂(lè)作品會(huì)依然保持良好的效果,而這些都需要嚴(yán)格控制制作環(huán)節(jié)的質(zhì)量;如果采用模擬信號(hào)的方式進(jìn)行存儲(chǔ),在完成一次的傳輸后就會(huì)發(fā)生不同程度的失真現(xiàn)象,再加上錄音本底噪音過(guò)大,必須要購(gòu)置相當(dāng)貴重的設(shè)備來(lái)符合錄音標(biāo)準(zhǔn),使用操作更加嚴(yán)格和復(fù)雜。同模擬信號(hào)相比,電腦數(shù)字信息處理功能僅依靠顯示器就能完成上述操作,效率明顯提升,具有顯著的優(yōu)勢(shì)[4]。
三、數(shù)字音頻格式的運(yùn)用
目前常用的數(shù)字音頻格式及其使用方式、存在意義主要體現(xiàn)為:
1.MIDI
樂(lè)器數(shù)字接口即MIDI,表示的是對(duì)電聲樂(lè)器間控制參數(shù)及音符等指令的統(tǒng)一描述,這些指令稱(chēng)為MIDI消息。計(jì)算機(jī)中的數(shù)字合成器、音樂(lè)程序和相關(guān)電子設(shè)備均通過(guò)MIDI來(lái)明確音樂(lè)信號(hào)的交換途徑,具有占用存儲(chǔ)空間小的優(yōu)勢(shì),數(shù)據(jù)傳輸要求低。
2.WAV格式
WAV格式別稱(chēng)波形聲音文件,是微軟公司最早開(kāi)發(fā)的數(shù)字音頻格式,其主要功能是對(duì)音頻信息資源進(jìn)行保存,普遍應(yīng)用于Windows 平臺(tái)和相關(guān)應(yīng)用程序中。WAV文件的取樣頻率為44.1K,在不同聲道、音頻位數(shù)中均發(fā)揮重要的作用,可同CD音質(zhì)相媲美,然而也存在存儲(chǔ)空間過(guò)大的問(wèn)題[5]。
3.MP3格式
動(dòng)態(tài)影像專(zhuān)家壓縮標(biāo)準(zhǔn)音頻層面3簡(jiǎn)稱(chēng)為MP3,主要功能是使音頻數(shù)據(jù)量降低,能夠在保證播放音效的前提下,將音樂(lè)作品以極高的壓縮率使文件容量大大縮小。利用MP3格式可以達(dá)到將大型文件大程度壓縮的目的,MP3音樂(lè)則指的就是通過(guò)該形式儲(chǔ)存的音樂(lè)作品。
4.CD格式
CD格式包括多種類(lèi)型,其中在人們生活中應(yīng)用最廣泛的一種就是聲頻CD,采用44.1kHz的采樣頻率。音軌是CD存儲(chǔ)的主要方式,不會(huì)損失音質(zhì),適用于儲(chǔ)存大數(shù)量的數(shù)據(jù),具有便利、耐用的特點(diǎn)[6]。
5.DVD Audio格式
作為新型數(shù)字音頻儲(chǔ)存格式,DVD Audio(DVD-A)格式采用48kHz/96kHz/192kHz或44.1kHz/88.2kHz/176.4kHz的采樣頻率。該格式并不屬于圖像儲(chǔ)存格式,同DVD Video雖然存在容量相同、尺寸相同的共同點(diǎn),但在功能上存在較大的差異。
6.WMA 格式
WMA 格式屬于音頻格式,微軟公司通過(guò)該格式進(jìn)行了大量的音頻創(chuàng)作,其目的是在保證音質(zhì)的同時(shí)最大限度使數(shù)據(jù)流量降到最低,提高壓縮率。同MP3文件相比,WMA格式生成的文件縮小了1/2,還具備阻止盜版的功能。
在科學(xué)技術(shù)不斷進(jìn)步的過(guò)程中,計(jì)算機(jī)技術(shù)日益趨向于成熟化,計(jì)算機(jī)功能越來(lái)越強(qiáng)大,這就為以計(jì)算機(jī)硬件技術(shù)為核心的多媒體處理技術(shù)提供了堅(jiān)實(shí)的發(fā)展基礎(chǔ),音頻處理技術(shù)獲得了突飛猛進(jìn)的發(fā)展。數(shù)字音頻的應(yīng)用,使操作方法大大簡(jiǎn)化,錄制和播放功能更具高效化、快捷性,極大的豐富了人們的娛樂(lè)活動(dòng),具有優(yōu)越的性能,逐漸成為傳輸媒體的主流,應(yīng)用范圍不斷擴(kuò)大,具有非常廣闊的發(fā)展前景。
參考文獻(xiàn)
[1]周玉芳,孫美華.漫談數(shù)字音頻格式及相互轉(zhuǎn)換[J].中國(guó)科技信息,2005(24).
[2]彭陶.淺析數(shù)字音頻轉(zhuǎn)換的意義和應(yīng)用[J].內(nèi)江科技,2010(11).
[3]翁哲.基于TMS320DM6446的音頻系統(tǒng)硬件設(shè)計(jì)的研究[J].黑龍江科技信息,2009(25).
[4]馬艷風(fēng).數(shù)字音頻播控系統(tǒng)在廣播電臺(tái)中的應(yīng)用[J].河南科技,2000(11)
[5]林曉丹.一種基于支持向量機(jī)的數(shù)字音頻認(rèn)證方法[J].華僑大學(xué)學(xué)報(bào)(自然科學(xué)版),2011(02).
[6]張愛(ài)云,盧興亞.淺談數(shù)字音頻文件格式及其轉(zhuǎn)換應(yīng)用[J].電腦知識(shí)與技術(shù),2009(26).