王飛飛,孫志遠
(平頂山學(xué)院 河南 平頂山 467000)
隨著便攜式嵌入式系統(tǒng)的發(fā)展,嵌入式多媒體技術(shù)正在影響并改變著人們的日常生活,多媒體音頻編碼解碼技術(shù)也越來越受到關(guān)注和重視[1-2]。筆者提出了一種MP3音頻解碼通過軟件方式在嵌入式系統(tǒng)上實現(xiàn)的解決方案。該方案以目前比較高效的MP3解碼算法為基礎(chǔ),靈活的取代了基于DSP的硬件解碼方案,在低消耗處理器資源的前提下,實現(xiàn)能與硬件解碼相媲美的效果。從而節(jié)省了研發(fā)或購買DSP芯片的費用,還可以方便快捷的兼容MPEG新提出的解碼標準,這是該方案最重要的現(xiàn)實意義。
目前國外在MP3軟解碼方面的研究有兩大成果,一個是開源MP3解碼項目mpg123,一個是開源嵌入式MP3解碼庫libmad。這兩個開源項目中使用的解碼算法參考了很多國際學(xué)術(shù)論文。前者被廣泛用于播放器軟件,例如Mplayer,千千靜聽等;后者則更加適用于嵌入式系統(tǒng),已經(jīng)被成功移植到Symbian手機系統(tǒng)上。
MP3解碼主要包括以下過程:預(yù)處理(Preprocessing)、霍夫曼編碼(Huffman decoding)、反量化(Requantization)、重排列 (Reordering)、立體聲解碼 (Stereo decoding)、混迭消除(Alias reduction)、反離散余弦變換(IMDCT transform)、頻域轉(zhuǎn)換 (Frequency inversion)、子帶合成濾波 (Synthesis filter bank),最后生成聲卡可以直接讀取的PCM采樣[3]。MP3解碼流程具體如圖1所示。
為了在ARM處理器下快速穩(wěn)定的運行解碼器,除了浮點轉(zhuǎn)化為定點的策略,還要根據(jù)硬件特點進一步進行程序優(yōu)化:首先減小運算強度,利用位移操作代替乘除運算,通常需要乘除以2的冪次方都可以用左右移n位來完成,比如3×8等價于 3<<3;利用乘法代替乘方運算,ARM核中內(nèi)建有乘法器,因此可以通過乘法運算來代替調(diào)用C庫函數(shù)乘方運算以節(jié)約函數(shù)調(diào)用開銷;利用與運算代替求余運算。通常and指令比%操作效率要高;使用內(nèi)聯(lián)函數(shù),ARM下支持C語言inline關(guān)鍵字,這時的函數(shù)直接在調(diào)用處代碼展開,省去了函數(shù)調(diào)用開銷,不過它的缺點是代碼量增加;使用寄存器變量,CPU對寄存器的存取要比對內(nèi)存的存取快得多,因此為變量分配一個寄存器,將有助于代碼的優(yōu)化和運行效率的提高。
避免除法,ARM指令集中沒有除法指令,其除法是通過調(diào)用C庫函數(shù)實現(xiàn),一個32位的除法通常需要20~140個時鐘周期。因此,除法是程序效率的瓶頸,應(yīng)盡量避免使用。用查表法代替計算,在CPU資源緊張而內(nèi)存資源富裕的情況下,可以用空間來換取運行速度,例如在反離散余弦變換算法中需要頻繁的計算正弦和余弦函數(shù)值,可以預(yù)先將函數(shù)值計算出來以常量放到內(nèi)存里,需要計算時直接通過內(nèi)存地址提取 需要的值[4-5]。
在對現(xiàn)有算法進行研究的基礎(chǔ)上[6-9],筆者設(shè)計出一個性能優(yōu)良、結(jié)構(gòu)靈活、可移植性強的MP3軟解碼器。解碼器主要包括以下模塊:解碼器引擎初始化,緩沖區(qū)輸入輸出控制,幀解碼模塊,注銷解碼器引擎等。
用MP3文件初始化解碼器,初始化過程中,解碼器讀取每一幀的幀頭信息而不對數(shù)據(jù)進行解碼,快速計算出該文件的播放時間,并根據(jù)文件大小以秒或分鐘為單位內(nèi)建解碼位置索引。解碼位置索引的目的是為了快速的根據(jù)時間定位待解碼數(shù)據(jù)在文件中的位置。
考慮到嵌入式系統(tǒng)內(nèi)存較小的情況,解碼器輸入緩沖區(qū)定義為8 kB,這樣既可以流暢的解碼數(shù)據(jù),又不會暫用很大緩沖區(qū)內(nèi)存,解碼引擎以bit為單位讀取數(shù)據(jù),所以輸入控制應(yīng)該實現(xiàn)快速讀取緩沖區(qū)中1個或多個bit數(shù)據(jù)的操作。
對于文件形式的MP3數(shù)據(jù),在解碼器輸入緩沖區(qū)上層內(nèi)建一個文件緩沖結(jié)構(gòu),減少系統(tǒng)IO操作次數(shù),首先將文件中一部分待解碼數(shù)據(jù)讀入文件緩沖,當解碼引擎發(fā)出數(shù)據(jù)請求時,由文件緩存向解碼器輸入緩沖區(qū)寫入數(shù)據(jù)。
文件緩沖提供以下操作:
文件緩沖創(chuàng)建:以打開的文件指針創(chuàng)建文件緩沖區(qū),返回緩沖結(jié)構(gòu)指針。
緩沖區(qū)注銷:釋放緩沖區(qū)創(chuàng)建時的在堆中申請的內(nèi)存,并關(guān)閉打開的文件指針。
緩沖區(qū)結(jié)束判斷:當緩沖區(qū)讀取指針到達緩沖區(qū)結(jié)尾時,eof被復(fù)制為真,返回eof的值。
獲取緩沖區(qū)操作錯誤:每次操作中,若出現(xiàn)錯誤error被賦值為對應(yīng)的錯誤值,否則賦值為0。返回error的值。
讀取指定大小的內(nèi)容:從緩沖區(qū)當前讀取位置,讀取指定大小的字節(jié),并返回讀取到的數(shù)據(jù)開始位置指針。
對于以流形式的MP3數(shù)據(jù),當解碼引擎發(fā)出數(shù)據(jù)請求時,直接由數(shù)據(jù)流緩存向解碼器輸入?yún)^(qū)寫入數(shù)據(jù)。
數(shù)據(jù)流緩存提供的功能有以下幾點:
初始化:該功能申請堆中的一塊內(nèi)存,用于以后存放緩存數(shù)據(jù)。
注銷:負責(zé)釋放初始化時申請的內(nèi)存。
寫入數(shù)據(jù):向緩存的當前寫入位置后寫入指定大小的數(shù)據(jù)。
跳過指定大小數(shù)據(jù):將當前讀取位置移動到指定位置。
獲取錯誤信息:返回操作過程中產(chǎn)生的錯誤信息。
幀同步:將讀取位置跳轉(zhuǎn)到下一幀開始位置。該操作的主要算法是每次讀取緩存11個比特,若這些比特全為1,則把其當做下一幀的開始位置。通過研究可知,該種算法并不能準確判斷下一幀的開始,但這種算法不進行幀頭解碼,也不會漏掉數(shù)據(jù)。從時間和空間上講,都是一種比較好的選擇。
解碼引擎以幀為解碼單位,每次輸出一幀的解碼輸出結(jié)構(gòu),結(jié)構(gòu)中包括pcm數(shù)據(jù)、長度、采樣率、聲道數(shù),播放時間等信息。
該模塊為解碼引擎核心模塊,按照順序完成預(yù)處理、霍夫曼編碼、反量化、重排列、立體聲解碼、混迭消除、反離散余弦變換、頻域轉(zhuǎn)換、子帶合成濾波,最后生成聲卡可以直接讀取的PCM采樣。
從系統(tǒng)設(shè)計的角度上,該模塊又可以劃分為幾個小模塊:浮點計算模塊、幀預(yù)處理模塊、霍夫曼解碼模塊、層解碼模塊、濾波合成模塊。
該模塊負責(zé)釋放解碼器申請的內(nèi)存,刪除解碼器內(nèi)建的播放索引,復(fù)位緩沖區(qū)。在解碼完成后調(diào)用。
解碼器提供了簡潔而功能強大的調(diào)用接口,主要包括初始化、注銷、單幀解碼、IO控制、解碼時間控制幾個方面,具體如表1所示。
本文根據(jù)MPEG官方文檔,詳細剖析了MP3幀解碼的算法及其優(yōu)化,并在上述基礎(chǔ)上設(shè)計軟件解碼器接口,在ARM平臺上實現(xiàn)了軟件解碼器。本解碼器具有無浮點計算、引入文件緩存機制、內(nèi)建解碼位置索引等優(yōu)點。但是也存在一定的局限性:如時間精度低,解碼器沒有實現(xiàn)網(wǎng)絡(luò)功能,但是提供了流解碼接口,如果需要播放網(wǎng)絡(luò)上的MP3文件,需要在解碼器的上層設(shè)計網(wǎng)絡(luò)引擎。
表1 解碼器外部調(diào)用接口Tab.1 External call interface of decoder
[1]林福宗.多媒體技術(shù)基礎(chǔ)[M].2版.北京:清華大學(xué)出版社,2008.
[2]馬華東.多媒體技術(shù)原理及其應(yīng)用[M].北京:清華大學(xué)出版社,2008.
[3]宋奇剛,魏小義.Huffman解碼器的設(shè)計及在MP3解碼中的應(yīng)用 [EB/OL]. (2007-03-09).http://www.eeworld.com.cn/xfdz/2007/0309/2847.html.
[4]Zurell K.嵌入式系統(tǒng)C程序設(shè)計[M].艾克武,等譯.北京:機械工業(yè)出版社,2002.
[5]周立功.單片機實驗與實踐[M].北京:北京航空航天大學(xué)出版社,2004.
[6]李國輝.基于ARM的MP3播放器設(shè)計與實現(xiàn)[J].現(xiàn)代電子技術(shù), 2011, 34(16):1-2.LI Guo-hui.Design and implementation of MP3 player based on ARM[J].Modern Electronics Technique,2011,34(16):1-2.
[7]汪永好,周延森.基于嵌入式Linux的MP3播放器的設(shè)計與實現(xiàn)[J].計算機工程與設(shè)計,2009,30(17):3948-3949.WANG Yong-hao,ZHOU Yan-sen.Design and implementation of MP3 player based on embedded Linux[J].Computer Engineering and Design,2009,30(17):3948-3949.
[8]石銳,代天然,周雷.基于arm的容損失MP3流媒體終端的設(shè)計與實現(xiàn)[J].重慶工學(xué)院學(xué)報:自然科學(xué)版,2009,23(8):104-107.SHI Rui,DAI Tian-ran,ZHOU Lei.Design and implementation of loss-tolerant MP3 stream player based on ARM[J].Journal of Chongqing Institute of Technology:Natural Science,2009,23(8):104-107.
[9]徐英欣.基于ARM的多通道專業(yè)MP3播放器設(shè)計 [J].微計算機信息,2008,24(14):143-144.XU Ying-xin.Design of multiple channels of professional MP3 player based on ARM[J].Microcomputer Information,2008,24(14):143-144.