金鑫
【摘要】本文通過對吳江廣播電視臺視音頻的采編播過程中主流音頻的編碼分析及具體應用,重點比較了有損編碼、無損編碼、無壓縮格式中常見的幾種格式特點、區(qū)別、應用。最后,筆者通過分析總結(jié),為各個欄目的編輯記者解決在節(jié)目生產(chǎn)過程中如何選擇合適的音頻編碼格式提供指導。
【關(guān)鍵字】音頻編碼 MP3 AAC WAV FLAC
一.引言
2018年1月,吳江區(qū)廣播電視臺獲得國家新聞初版廣電總局批復,成為全國首個獲批高標清同播電視頻道的縣級廣播電視臺。高畫質(zhì)的視音頻生產(chǎn)需要大量高質(zhì)量的視頻音頻素材,在視音頻的素材選擇中,視頻素材往往因為主觀選擇的便捷性更容易選擇,音頻素材
選擇的科學性恰恰容易忽視也容易出現(xiàn)問題。
二.幾種通用音頻格式的對比
音頻的格式影響了音頻素材最終的質(zhì)量,聯(lián)系到后期編輯軟件的使用,音頻格式又影響到音頻文件的使用效率和存儲占用,其中非編軟件對音頻文件解碼時的效率更會導致非編軟件假死或者意外退出。魚和熊掌是否能夠兼得,音頻格式既能提供一種高質(zhì)量的音頻文件,又能有很高的使用效率?
音頻文件的編碼一般分為無損壓縮、有損壓縮和無壓縮編碼三大類。無損壓縮:原始音頻通過編碼后,原始音頻數(shù)據(jù)沒有任何信息損失,無損音頻文件一般需要專用播放器或者解碼器才能播放或者剪輯,最常見的格式就是FLAC。有損壓縮:音頻壓縮編碼原理主要是利用人類聽力覆蓋聲波頻率范圍較小的特性,采用損失一部分音頻原始信息并采用壓縮音頻比特率的方式換來較大的壓縮比,而壓縮中舍棄的原始音頻部分無法恢復,常見的有損壓縮格式主要有MP3、AAC。無壓縮編碼是相對壓縮編碼而言,最常見的無壓縮編碼就是WAVE(后綴WAV),顧名思義,無壓縮文件一般占用容量比較大。音頻格式有上百種,考慮到廣播電視各個制、編、播系統(tǒng)的兼容性,這里只討論集中最具代表性、廣播電視使用最廣的音頻格式。如下圖1,分別截圖大洋非編和索貝非編常用視音頻素材中音頻部分的編碼,下面筆者會對音頻格式中的MP3、AAC、WAVE、FLAC著重進行比較分析。
1.有損壓縮MP3與AAC的區(qū)別。
MP3具體指的是Moving Picture Experts Group(MPEG)標準中的音頻部分,也就是MPEG標準中的音頻層。在MPEG標準中,音頻編碼方式根據(jù)不同的壓縮質(zhì)量和編碼處理,音頻層可分成MP1、MP2、MP3,其中MP2和MP3在我們廣播電視節(jié)目生產(chǎn)中比較常見。MP3音頻格式是一種有損壓縮,通過舍棄原始音頻文件中12KHz到16KHz這部分高音頻來換取壓縮空間,壓縮后能夠保持低音頻部分不失真,主觀聽覺幾乎無差別。MP3音頻格式支持多種采樣率,既可以用64Kbps或更低的采樣頻率來壓縮空間,也可以用320Kbps的高采樣頻率來達到優(yōu)秀的音質(zhì)。這里特別提到的是,廣播上的播出系統(tǒng)一般采用S48后綴的音頻格式,這種特殊格式是根據(jù)英夫美迪公司的定義,S48音頻格式其實是比特率為256kb/s,采樣頻率為48kHz的MP2格式。如圖2
AAC同樣是屬于有損壓縮的編碼方式,是在MP3基礎(chǔ)上開發(fā)出來的。AAC編碼方式與MP3還存相似性,但是相比MP3,AAC的編碼效率更高,AAC常用的壓縮比為18:1,高于MP3的10:1的常用壓縮比。在擁有高壓縮比的同時,AAC的音頻質(zhì)量反而更好,根據(jù)Dolby Laboratories Inc(杜比實驗室)的實驗結(jié)論,表明碼率為96Kbps AAC音頻格式表現(xiàn)超過了碼率為128Kbps的MP3音頻格式,當兩種音頻編碼同時采用128Kbps碼率時,AAC格式的音質(zhì)明顯好于MP3格式。
盡管AAC各方面優(yōu)于MP3,但是MP3通過流行音樂市場占據(jù)份額是無法被撼動的,事實上除了蘋果的iTunes Store支持AAC以外,互聯(lián)網(wǎng)中音樂網(wǎng)站的音頻文件下載格式以MP3為主,因此,在我們廣播電視專業(yè)領(lǐng)域,往往能拿到的有損壓縮音樂素材以MP3居多。當然,在我們專業(yè)非編領(lǐng)域,高壓縮高清素材H264格式還是封裝了AAC的音頻,見圖1。另外,不管是AAC格式還是MP3格式,與APE、FLAC等無損格式相比音質(zhì)還是存在質(zhì)的差距。
2.WAVE(WAV)格式分析
WAVE音頻格式常見的擴展名為WAV,所以通常我們把WAVE也寫作WAV,它是微軟公司主導開發(fā)的一種音頻文件格式,WAVE打開工具就是我們熟知的WINDOWS自帶媒體播放器MediaPlayer。WAVE音頻格式通常是是PCM或壓縮型,屬于無損音樂,單個文件較大,通常采用的音頻編碼方式是脈沖編碼調(diào)制(PCM)或線性脈沖編碼調(diào)制(LPCM)。音頻編碼格式LPCM是一種無壓縮音頻數(shù)字化技術(shù),能夠?qū)崿F(xiàn)音頻文件的原音重現(xiàn),因此在廣播電視臺非編、媒資系統(tǒng)中廣泛的應用。在非編、媒資等系統(tǒng)的應用中,視音頻中音頻編碼還有一種為PCM,其實PCM和LPCM原理是一樣的,區(qū)別P C M是非線性脈沖編碼調(diào)制,即與LPCM編碼過程中的量化方式不同,不同的軟件服務商采用不同的編碼器及編碼方式,兩種無壓縮編碼方式都普遍存在。如圖3
盡管無壓縮的WAVE音頻文件較大,單個WAVE文件最大能達到4GB,但是在廣播電視領(lǐng)域,音頻文件相對龐大的視頻文件,存儲空間可以相對忽略,我們常見的各類非編軟件的高碼率素材中,音頻部分一般是以LPCM的方式存在,音頻文件也以WAVE作為媒資入庫的首選。
3.FLAC格式分析
FLAC是一種開源的無損音頻壓縮格式,區(qū)別于有損壓縮編碼,它不會破壞任何原有的音頻信息,可以簡單理解為是一種介于WAVE和MP3及AAC之間的音頻格式。相比WAVE的無壓縮(LPCM)產(chǎn)生的大文件,F(xiàn)LAC通過壓縮可以節(jié)省45%左右的空間,F(xiàn)LAC的音質(zhì)反而優(yōu)于MP3和AAC,從互聯(lián)網(wǎng)的應用上來說,發(fā)燒級別的HI-FI播放器普遍支持FLAC。
這里要特地談到另外一個常見的無損音頻壓縮格式APE。通常,APE編碼方式將音頻CD數(shù)據(jù)文件進行壓縮編碼后,可以實現(xiàn)APE格式的文件還原成母盤。但是,APE的音頻格式有一個嚴重的缺點,容錯性很差,部分錯誤就能導致整首APE音樂作廢。所以,互聯(lián)網(wǎng)最主流的無損音頻格式非FLAC莫屬,無所無損音頻壓縮格式我們以FLAC為例。
三.音頻編碼格式選擇策略
1.原始音頻的保存。媒資系統(tǒng)、非編系統(tǒng)有足夠的空間存儲音頻文件,我們應該將音頻質(zhì)量盡可能的還原其原生態(tài),特別是在音樂類,采用無壓縮WAVE格式(LPCM)保存能更好的保留音頻的層次及豐富的內(nèi)容。WAVE格式通常設置為44.1K的取樣頻率,16位量化指標,我們攝像機的同期聲采集、配音間配音、演播室口播都宜采用這樣的格式。我們廣播電臺節(jié)目播出系統(tǒng)采用比特率為256kb/s,采樣頻率為48kHz的S48音頻格式。
2.音頻素材的選擇和非線編輯。非線編輯需要考慮視音頻素材的效率問題,音頻素材過長,勢必會出現(xiàn)預覽效率低、剪輯卡頓等問題。音頻素材的首選是采用有損壓縮MP3、AAC格式,根據(jù)杜比實驗室結(jié)論表明碼率為96Kbps AAC音頻格式表現(xiàn)超過了碼率為128Kbps的MP3音頻格式,當兩種音頻編碼同時采用128Kbps碼率時,AAC格式的音質(zhì)明顯好于MP3格式。那么我們在條件允許的情況下可以選擇128Kbps的AAC音頻格式,使用MP3音頻格式的碼率也不能低于128Kbps。
3.無損壓縮的FLAC格式比較適合于專題類節(jié)目的制作?;ヂ?lián)網(wǎng)和專業(yè)音樂網(wǎng)站能夠找到的最佳音源基本都采用FLAC或者APE的格式,一般可選擇320Kbps或者192Kbps的碼率
四.結(jié)束語
筆者認為,音頻編碼的選擇是節(jié)目生產(chǎn)過程中不容忽視的一個重要環(huán)節(jié),同時不光是音頻,視頻、圖片、文檔的格式也應該全面的進行考慮和分類。作為全國首家高清同播的縣級電視臺更應結(jié)合媒體融合的要求,統(tǒng)籌經(jīng)營,與時俱進,不斷創(chuàng)新,適應媒體發(fā)展的腳步。B&P