亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于DSP的四路H.264視頻編碼器的實(shí)現(xiàn)與優(yōu)化

2010-11-13 07:45:00張新安

湖南科技學(xué)院學(xué)報(bào) 2010年4期

張新安

（湖南科技學(xué)院電子工程系，湖南永州 425100）

0. 言

H.264是ITU-T的視頻編碼專家組（VCEG）和ISO/IEC的活動(dòng)圖像專家組（MPEG）聯(lián)合制定的新一代視頻編碼國際標(biāo)準(zhǔn)[1]。H.264以實(shí)現(xiàn)視頻的高壓縮比、高圖像質(zhì)量和良好的網(wǎng)絡(luò)適應(yīng)性等優(yōu)點(diǎn)，被廣大視頻應(yīng)用產(chǎn)業(yè)接納。相對(duì)于傳統(tǒng)視頻標(biāo)準(zhǔn)MPEG-2，H.264的壓縮比提高了2~3倍，極大地節(jié)省了視頻存儲(chǔ)容量和網(wǎng)絡(luò)帶寬，因此，一直有許多學(xué)者致力于H.264視頻編碼器的設(shè)計(jì)與優(yōu)化研究[2-5]。

H.264編碼系統(tǒng)被廣泛應(yīng)用于當(dāng)今數(shù)字視頻監(jiān)控領(lǐng)域，如銀行和證券集中監(jiān)控、市內(nèi)交通和高速公路集中監(jiān)控、小區(qū)和樓宇安防等。目前市場(chǎng)上大部分商用化的視頻編碼系統(tǒng)產(chǎn)品都采用 ASIC芯片設(shè)計(jì)，通常只能完成一路視頻的實(shí)時(shí)壓縮，在許多實(shí)際應(yīng)用中，常常需要對(duì)多路場(chǎng)景進(jìn)行實(shí)時(shí)監(jiān)控和存儲(chǔ)，使用一片 DSP實(shí)現(xiàn)多路視頻監(jiān)控，能充分利用DSP的運(yùn)算能力，可以降低成本，減少設(shè)備的功耗和體積。

本文設(shè)計(jì)的基于TMS320DM642（以下簡稱DM642）的H.264視頻編碼器，在硬件設(shè)計(jì)上，充分利用了DM642可以輸入多路不同格式音視頻信號(hào)的特點(diǎn)，實(shí)現(xiàn)了 DSP處理與EDMA傳輸并行工作，在編碼器的軟件實(shí)現(xiàn)中，對(duì)運(yùn)動(dòng)估計(jì)、整數(shù)反變換、去塊濾波等關(guān)鍵模塊的算法進(jìn)行了改進(jìn)，并對(duì)資源使用和軟件代碼進(jìn)行了全面優(yōu)化，能對(duì)四路分辨率為CIF352×288的視頻信號(hào)實(shí)現(xiàn)H.264視頻格式的實(shí)時(shí)編碼，具有功能強(qiáng)、可靠性高、體積小、功耗低和易于升級(jí)等特點(diǎn)。

1..264視頻編碼器的硬件實(shí)現(xiàn)與優(yōu)化

1.1..264視頻編碼器的硬件系統(tǒng)設(shè)計(jì)

本系統(tǒng)以DM642DSP為核心，實(shí)現(xiàn)四路CIF352×288視頻格式的H.264標(biāo)準(zhǔn)的實(shí)時(shí)編碼，硬件系統(tǒng)結(jié)構(gòu)如圖1所示。

圖1.路視頻編碼器硬件系統(tǒng)結(jié)構(gòu)圖

TMS320DM642[6]是TI公司開發(fā)研制的一款專門面向多媒體應(yīng)用的專用DSP芯片，548腳BGA封裝，芯片內(nèi)核時(shí)鐘高達(dá)600MHz，處理能力最高可達(dá)4800MIPS，采用VLIW和L1/L2兩級(jí)緩存結(jié)構(gòu)，并且支持EDMA，有專門為多媒體應(yīng)用設(shè)計(jì)的三路視頻輸入、輸出端口（VP口），每個(gè)VP口又分成A和B 兩個(gè)通道，可與兩路10bit或一路20bit視頻A/D轉(zhuǎn)換器直接相連，通過復(fù)用三路VP口最多允許6路視頻輸入。

主機(jī)首先通過PCI初始化DSP并對(duì)其加載程序，DSP開始運(yùn)行H.264編碼程序；輸入的模擬視頻信號(hào)經(jīng)TVP515（0支持PAL和NTSC兩種制式）被數(shù)字化為YUV4∶2∶2的數(shù)字視頻格式，DM642的VP口對(duì)輸入的數(shù)字信號(hào)進(jìn)行格式轉(zhuǎn)換，將采集的YUV分離并按照YUV分量各自連續(xù)存放的格式存放在SDRAM中，DSP通過EDMA完成4∶2∶2到4∶2∶0的視頻格式轉(zhuǎn)換，以適應(yīng)H.264編碼的要求；視頻從VP口采集進(jìn)來之后，采用EDMA方式進(jìn)行數(shù)據(jù)搬移，搬移到緩存（cache）中之后，DM642便對(duì)數(shù)據(jù)進(jìn)行壓縮處理；DSP完成一幀圖像的編碼，通過PCI向主機(jī)發(fā)出中斷，主機(jī)響應(yīng)中斷，從DSP的存儲(chǔ)空間讀取原始圖像數(shù)據(jù)和壓縮后的碼流。主機(jī)程序在 VC++環(huán)境下編寫，提供與用戶交互的界面，可進(jìn)行原始視頻的實(shí)時(shí)播放、壓縮編碼、保存、網(wǎng)絡(luò)傳輸；壓縮碼流的實(shí)時(shí)解壓播放、保存、回放；從網(wǎng)絡(luò)接收壓縮碼流實(shí)時(shí)解壓回放等各種處理。

1.2..264編碼算法的DSP實(shí)現(xiàn)與優(yōu)化

將H.264編碼算法在DSP上實(shí)現(xiàn)與優(yōu)化，需要經(jīng)過PC機(jī)端算法實(shí)現(xiàn)及優(yōu)化、PC機(jī)代碼的DSP化和DSP代碼優(yōu)化等幾個(gè)步驟。

1.2.1.PC機(jī)上實(shí)現(xiàn)H.264算法并進(jìn)行優(yōu)化

選取 ITU-T的 JM6.1e參考軟件作為優(yōu)化對(duì)象，但是JM6.1e代碼復(fù)雜，冗余度很大，需要在PC機(jī)端對(duì)其進(jìn)行較大調(diào)整，涉及工作有：去除冗余代碼、規(guī)范程序結(jié)構(gòu)、全局和局部變量的調(diào)整和重新定義、結(jié)構(gòu)體的調(diào)整等。

1.2.2.C機(jī)H.264代碼的DSP化

ITU-T官方提供的H.264核心算法代碼是用C語言編寫、在PC機(jī)上實(shí)現(xiàn)的。C6000開發(fā)工具Code Composer Studio有自己的 ANSIC編譯器和優(yōu)化器，并有自己的語法規(guī)則和定義，所以在DSP上實(shí)現(xiàn)H.264的算法，要把PC機(jī)上C語言編寫的H.264代碼進(jìn)行改動(dòng)，使其完全符合DSP中C的規(guī)則。

這些改動(dòng)包括：去除所有的文件操作；去除可視化界面的操作；合理安排內(nèi)存空間的預(yù)留和分配；規(guī)范數(shù)據(jù)類型，把浮點(diǎn)數(shù)的運(yùn)算部分近似用定點(diǎn)表示，或用定點(diǎn)實(shí)現(xiàn)浮點(diǎn)運(yùn)算；根據(jù)內(nèi)存的分配定義遠(yuǎn)近程常量和變量；把常用的數(shù)據(jù)在數(shù)據(jù)結(jié)構(gòu)中提取出來，以near型數(shù)據(jù)定義在DSP內(nèi)部存儲(chǔ)空間，以減少對(duì)EMIF端口的讀取，從而提高速度。

1.2.3.SP代碼的優(yōu)化

通過把PC機(jī)H.264代碼DSP化，可以在DSP上實(shí)現(xiàn)H.264的編解碼算法，但是，這樣實(shí)現(xiàn)的算法運(yùn)行效率很低，所以必須結(jié)合DSP本身的特點(diǎn)，對(duì)其進(jìn)一步優(yōu)化，才能實(shí)現(xiàn)H.264視頻編碼器算法對(duì)視頻圖像的實(shí)時(shí)處理。

對(duì)DSP代碼的優(yōu)化分為項(xiàng)目級(jí)優(yōu)化、C程序級(jí)優(yōu)化和匯編程序級(jí)優(yōu)化三個(gè)層次。

（1）項(xiàng)目級(jí)優(yōu)化：主要是通過選擇CCS提供的編譯優(yōu)化參數(shù)，根據(jù)H.264系統(tǒng)的要求進(jìn)行優(yōu)化，通過不斷地對(duì)各個(gè)參數(shù)（-mw -pm -o3 -mt等）的選擇、搭配、調(diào)整，改善循環(huán)、多重循環(huán)體的性能，進(jìn)行軟件流水，從而提高軟件的并行性。

（2）C程序級(jí)優(yōu)化：主要是針對(duì)采用的DSP的具體特點(diǎn)進(jìn)行代碼的功能精簡、數(shù)據(jù)結(jié)構(gòu)的優(yōu)化、循環(huán)的優(yōu)化、代碼的并行化處理。主要工作包括以下部分：去除掉SNR計(jì)算、幀率及其他輔助信息的程序模塊；函數(shù)及數(shù)據(jù)映射區(qū)域的調(diào)整，把經(jīng)常用的數(shù)據(jù)存儲(chǔ)在片內(nèi)存儲(chǔ)器中，頻繁調(diào)用的程序盡可能映射在相鄰或相近的存儲(chǔ)區(qū)域；針對(duì)并行化效果差的函數(shù)，尤其是多重循環(huán)體，要進(jìn)行循環(huán)拆解，將多重循環(huán)拆解為單重循環(huán)；減少存儲(chǔ)區(qū)數(shù)據(jù)的讀取和存儲(chǔ)，尤其是片外存儲(chǔ)區(qū)域數(shù)據(jù)的調(diào)用，以減少時(shí)間；數(shù)據(jù)結(jié)構(gòu)的重新定義和調(diào)整。

（3）匯編程序級(jí)優(yōu)化。匯編級(jí)的優(yōu)化包括兩部分：采用線性匯編語言進(jìn)行優(yōu)化和直接用匯編語言進(jìn)行優(yōu)化。由于系統(tǒng)編譯器的局限性，并不能將全部的函數(shù)都很好地優(yōu)化，這樣就需要統(tǒng)計(jì)比較耗時(shí)的C語言函數(shù)，用匯編語言重新編寫。對(duì)耗時(shí)函數(shù)進(jìn)行匯編語言改寫，涉及的函數(shù)有DCT變換，反DCT變換，整象素運(yùn)動(dòng)估計(jì)，亞象素搜索，幀內(nèi)編碼函數(shù)，插值函數(shù)等。

2..264視頻編碼器的軟件設(shè)計(jì)與優(yōu)化

2.1..264視頻編碼器軟件設(shè)計(jì)

軟件設(shè)計(jì)分為視頻采集、多路視頻處理和視頻壓縮三個(gè)部分。

視頻采集采用并行設(shè)計(jì)，即通過DM642的VP口同時(shí)處理四路視頻源，將數(shù)據(jù)存放到對(duì)應(yīng) VP口的緩存區(qū)。在SDRAM 中，為每一路視頻開辟三個(gè)緩存區(qū)，通過中斷信號(hào)改變緩存區(qū)的指針，將VP口中的數(shù)據(jù)通過EDMA搬移到緩存區(qū)中周期存放。在采集部分，充分使用DM642的VP口資源和片外SDRAM，無須消耗DSP的資源，提高了系統(tǒng)的運(yùn)行效率。

多路視頻的處理采用四路編碼串行執(zhí)行，即通過用戶程序控制DSP，在編碼完第一路的當(dāng)前視頻幀后，再編碼下一路的當(dāng)前視頻幀，依次循環(huán)進(jìn)行。

視頻壓縮部分采用的H.264標(biāo)準(zhǔn)是以宏塊為單位的變換和預(yù)測(cè)的混合編碼技術(shù)，如圖2所示。編碼過程主要包括變換、量化、熵編碼、反量化、反變換、幀內(nèi)預(yù)測(cè)、環(huán)路濾波、圖像重建、運(yùn)動(dòng)估計(jì)及運(yùn)動(dòng)補(bǔ)償。

圖2..264視頻編碼器方框圖

2.2..264視頻編碼器的軟件優(yōu)化

H.264編碼計(jì)算量龐大，而DSP的硬件資源有限，需要結(jié)合DSP的特點(diǎn)進(jìn)行較好的優(yōu)化，才能達(dá)到實(shí)時(shí)編碼的要求。下面給出Cache性能優(yōu)化和存儲(chǔ)的配置優(yōu)化的方法。

2.2.1.ACHE的性能優(yōu)化

DM642的存儲(chǔ)器系統(tǒng)由片內(nèi)內(nèi)存L1、L2和片外外存兩部分組成，L1、L2和片外SDRAM構(gòu)成了整個(gè)存儲(chǔ)器系統(tǒng)的三級(jí)層次結(jié)構(gòu)，如圖3所示。片內(nèi)內(nèi)存采用兩級(jí)緩存結(jié)構(gòu)，第一級(jí)由L1P和L1D組成，L1距離DSP內(nèi)核最近，數(shù)據(jù)訪問速度最快，只需一個(gè)時(shí)鐘周期。第二級(jí)L2是一個(gè)統(tǒng)一的程序/數(shù)據(jù)空間，根據(jù)L2配置為Cache或SRAM的不同選擇，訪問速度需 8個(gè)或 6個(gè)時(shí)鐘周期。第三級(jí)是片外外存，由SDRAM 構(gòu)成，片外存儲(chǔ)器容量很大但訪問速度很慢，遠(yuǎn)遠(yuǎn)大于8個(gè)時(shí)鐘周期。

圖3.級(jí)存儲(chǔ)器系統(tǒng)結(jié)構(gòu)圖

對(duì)CACHE性能優(yōu)化，本設(shè)計(jì)采用了下列一些方法：合理配置L2；合理布置程序代碼段和數(shù)據(jù)段的內(nèi)存布局，為防止有效代碼、數(shù)據(jù)在緩沖存儲(chǔ)器中相互排擠，盡量把順序執(zhí)行的代碼、同時(shí)使用的數(shù)據(jù)放在相互鄰接的物理空間當(dāng)中；若函數(shù)模塊和數(shù)據(jù)包含在一個(gè)循環(huán)中，循環(huán)體的大小應(yīng)與Cache的容量相吻合，以便能把整個(gè)循環(huán)體全部放入 Cache中；為提高Cache中數(shù)據(jù)的重復(fù)利用率，把數(shù)據(jù)操作構(gòu)成一條數(shù)據(jù)處理鏈，鏈中的下一級(jí)操作直接使用上一級(jí)操作留在Cache中的數(shù)據(jù)；根據(jù)Cache行數(shù)據(jù)寬度信息，調(diào)節(jié)數(shù)據(jù)在物理內(nèi)存中的存放位置，從而利用數(shù)據(jù)預(yù)取增加Cache的命中率；通過合理的數(shù)據(jù)填充策略，避免同一時(shí)鐘周期對(duì)相同存儲(chǔ)體的讀寫操作造成存儲(chǔ)器的存取沖突。

2.2.2.儲(chǔ)器的配置優(yōu)化

DSP的程序數(shù)據(jù)存儲(chǔ)空間非常有限。因此，對(duì)于視頻編解碼這種需要處理大量數(shù)據(jù)的程序而言，必須合理安排數(shù)據(jù)和程序的存儲(chǔ)方式，實(shí)現(xiàn)對(duì)存儲(chǔ)器的優(yōu)化，以便提高程序執(zhí)行的效率。否則，大量數(shù)據(jù)的反復(fù)搬移會(huì)阻礙程序運(yùn)行效率的提高。

原程序有很多不適應(yīng)DSP系統(tǒng)的程序流程結(jié)構(gòu)，如內(nèi)存分配和釋放操作頻繁，沒有在一開始就分配好內(nèi)存，而是在一個(gè)個(gè)單獨(dú)的函數(shù)中分配和釋放內(nèi)存，不僅程序運(yùn)行效率低，還產(chǎn)生許多不必要的臨時(shí)存儲(chǔ)空間。為此，要對(duì)原有程序結(jié)構(gòu)進(jìn)行修改，調(diào)整程序運(yùn)行流程，合并部分函數(shù)，使程序結(jié)構(gòu)能充分利用DM642的硬件特點(diǎn)，盡量節(jié)省存儲(chǔ)空間。

根據(jù)片內(nèi)存儲(chǔ)器容量小而存取速度快，片外存儲(chǔ)器容量大但存取速度慢的特點(diǎn)，在分配存儲(chǔ)器的時(shí)候?qū)τ谀切┙?jīng)常使用的變量放在片內(nèi)，如 VLC表、運(yùn)動(dòng)矢量、反量化、反DCT的系數(shù)以及其它中間變量等，而對(duì)于那些執(zhí)行次數(shù)比較少或者比較大的變量如視頻幀參考幀則放在片外。此外由于編譯和分配空間是以文件為單位的，所以把頻繁使用的函數(shù)放在同一文件中，再將這個(gè)文件放入片內(nèi)存儲(chǔ)器以高效地利用有限的片內(nèi)資源。同時(shí)通過Profiler分析代碼調(diào)用頻率，合理安排代碼的存放位置，提高Cache的命中率和數(shù)據(jù)訪問性。為保證數(shù)據(jù)讀取的高效性，在片內(nèi)開辟乒乓結(jié)構(gòu)的雙緩存區(qū)。

編碼過程中要訪問的大量數(shù)據(jù)都放在片外存儲(chǔ)器, 處理時(shí)要進(jìn)行頻繁的數(shù)據(jù)搬移，由于CPU訪問片外的速度通常要比訪問片內(nèi)慢10~20倍，片外數(shù)據(jù)的傳輸通常成為程序運(yùn)行時(shí)的瓶頸，即使代碼效率很高，流水線也會(huì)因?yàn)榈却龜?shù)據(jù)而被嚴(yán)重阻塞，本設(shè)計(jì)采用EDMA傳送數(shù)據(jù)來有效地解決這一問題。在編碼當(dāng)前宏塊的同時(shí)，利用EDMA將下一個(gè)宏塊的數(shù)據(jù)、用到的參考幀數(shù)據(jù)由片外傳送至片內(nèi)，當(dāng)前宏塊做完運(yùn)動(dòng)補(bǔ)償后，EDMA將重建后的宏塊由片內(nèi)傳送至片外。這樣CPU只對(duì)片內(nèi)數(shù)據(jù)進(jìn)行操作，流水線可以順利進(jìn)行。

3..264視頻編碼器關(guān)鍵模塊的算法優(yōu)化

H. 264視頻編碼器的計(jì)算量主要集中在運(yùn)動(dòng)估計(jì)、量化、反量化、DCT與IDCT和去塊濾波幾個(gè)模塊，這些模塊優(yōu)化前的運(yùn)算量占到全部運(yùn)算量的80%以上。下面給出幾個(gè)耗時(shí)較多的關(guān)鍵模塊的優(yōu)化策略。

3.1.動(dòng)估計(jì)優(yōu)化

視頻編碼中，運(yùn)動(dòng)估計(jì)部分是運(yùn)算量最大的一塊，研究顯示，對(duì)于H.264，單幀參考，運(yùn)動(dòng)估計(jì)占總運(yùn)算量的70%，5幀參考，這個(gè)比例能達(dá)到90%，因此，采用有效快速的運(yùn)動(dòng)估計(jì)算法非常有必要，本系統(tǒng)采用基于預(yù)測(cè)和早停止技術(shù)的運(yùn)動(dòng)估計(jì)算法，主要方法是利用周邊鄰塊對(duì)當(dāng)前塊運(yùn)動(dòng)矢量進(jìn)行預(yù)測(cè)，并設(shè)定自適應(yīng)閾值，使搜索提前停止。采用該算法，在搜索窗為32時(shí)，每塊平均搜索點(diǎn)數(shù)3~4個(gè)左右，與全搜索算法的4225余個(gè)點(diǎn)相比，速度提高了1000多倍。

計(jì)算 SAD是整像素運(yùn)動(dòng)估計(jì)中計(jì)算量最大的部分，TI庫函數(shù)中提供了一些函數(shù)，對(duì)于 16×16，16×8，8×8塊的搜索可以直接利用庫函數(shù)。對(duì)于 8×16 的塊不能直接利用，用線性匯編來實(shí)現(xiàn)后，軟件流水一次迭代的周期數(shù)為 3，與三個(gè)匯編庫函數(shù)的迭代周期數(shù)相同。

分像素運(yùn)動(dòng)估計(jì)中，在每個(gè)搜索位置調(diào)用Calcu_Subpixel_Residual()，計(jì)算出 1/4預(yù)測(cè)像素值，求預(yù)測(cè)殘差，將預(yù)測(cè)殘差保存在diff[16*16]中, 并將預(yù)測(cè)值保存。然后調(diào)用SATD_block()對(duì)diff[16*16]中的殘差進(jìn)行哈達(dá)碼變換求 SATD，求 SATD是對(duì)每個(gè) 4×4塊進(jìn)行，之后求和，4×4塊之間的計(jì)算可以軟件流水提高速度。此外，設(shè)兩個(gè)數(shù)組來保存最優(yōu)的預(yù)測(cè)值，若當(dāng)前考察的位置代價(jià)更小，則通過交換指針使pBestPred指向最優(yōu)的預(yù)測(cè)值，避免數(shù)據(jù)拷貝。

3.2.數(shù)反變換的優(yōu)化

對(duì)整數(shù)反變換模塊進(jìn)行運(yùn)算分析，算術(shù)運(yùn)算的比例達(dá)到80%，所以優(yōu)化重點(diǎn)是減少算術(shù)操作。一次反變換需要進(jìn)行128次乘法和96次加法運(yùn)算。當(dāng)反變換進(jìn)行Hadamard變換時(shí)，則需要進(jìn)行256次乘法和192次加法運(yùn)算。這樣即使是QCIF圖像，其逆變換也需要進(jìn)行 50688~101376次乘法和38016~70632次加法運(yùn)算。由于乘除運(yùn)算比加減法運(yùn)算耗時(shí)多，所以整數(shù)反變換的優(yōu)化應(yīng)集中在減少乘法運(yùn)算次數(shù)上。

通過觀察變換矩陣可發(fā)現(xiàn)，該矩陣只包括±1和±1/2這4種系數(shù)，對(duì)于乘以±1的系數(shù)來說，可將其轉(zhuǎn)換為簡單的加減法，而對(duì)于乘以±1/2，則可以先進(jìn)行移位運(yùn)算然后再進(jìn)行加減法運(yùn)算，這樣就完全避免了代價(jià)昂貴的乘法和除法運(yùn)算。另外可利用蝶形變換對(duì)矩陣相乘再做進(jìn)一步改進(jìn)。例如對(duì) 5幀不同格式圖像比較其優(yōu)化前后的整數(shù)反變換過程，其所要的計(jì)算時(shí)間如表1所示。由表1可見，經(jīng)統(tǒng)計(jì)優(yōu)化后的反變換速度能提高21倍左右。

表1.數(shù)反變換優(yōu)化前后時(shí)間對(duì)比

3. 3 去塊濾波的優(yōu)化

由于H.264中最小塊的大小是4×4，所以在每個(gè)4×4塊中的每個(gè)點(diǎn)有相同的邊界門限。依據(jù)這一點(diǎn)，16個(gè)點(diǎn)可以只計(jì)算4次邊界門限,其相應(yīng)的濾波操作也可以4次完成。通過這種優(yōu)化方法可以將去塊濾波函數(shù)的調(diào)用次數(shù)降下來。

4.統(tǒng)性能測(cè)試

測(cè)試在一臺(tái)P4 3.0GHz，1G內(nèi)存，操作系統(tǒng)為Windows XP的 PC機(jī)上進(jìn)行。硬件測(cè)試平臺(tái)為基于本文方案研制的DM642編碼器板，主頻600MHz。對(duì)各種不同的CIF格式的視頻序列進(jìn)行編碼，統(tǒng)計(jì)出優(yōu)化前后的編碼性能如表2所示。

表2.試結(jié)果（一路視頻輸入）

從表2可以看出，在優(yōu)化前系統(tǒng)不能完成一路視頻的實(shí)時(shí)編碼，優(yōu)化后一路視頻的編碼幀率達(dá)到100fps以上，另從表2實(shí)驗(yàn)結(jié)果可知，信噪比下降很少。在實(shí)時(shí)采集和編碼四路視頻時(shí)，即使在視頻內(nèi)容比較復(fù)雜的情況下，總編碼幀率仍可達(dá)到102幀/秒，因此，本文設(shè)計(jì)的H.264編碼器完全能勝任四路CIF格式視頻的實(shí)時(shí)編碼，充分利用了DM642可以接受多路不同格式音視頻信號(hào)和數(shù)據(jù)處理能力強(qiáng)的優(yōu)點(diǎn)，降低了系統(tǒng)得成本。

5. 結(jié)

在TMS320D642 DSP上實(shí)現(xiàn)了四路CIF格式視頻的實(shí)時(shí)H.264軟件編碼器。給出的程序代碼的優(yōu)化方法，對(duì)于所有的C64DSP都具有通用性，提出的關(guān)鍵模塊的優(yōu)化策略，對(duì)采用其它視頻壓縮標(biāo)準(zhǔn)的編碼器的優(yōu)化具有重要的參考和借鑒價(jià)值。該H.264視頻編碼器與網(wǎng)絡(luò)平臺(tái)相連接可以應(yīng)用于多路視頻監(jiān)控、視頻會(huì)議、可視電話、無線流媒體通信等應(yīng)用領(lǐng)域。這種在通用DSP上全軟件實(shí)現(xiàn)的H.264視頻編碼器，具有功能強(qiáng)、使用靈活、便于升級(jí)等特點(diǎn)，有廣泛的應(yīng)用前景。

[1]ITU-T. Recommendation H.264 Advanced video coding for generic audiovisual services[S].2004.

[2]陸璐,周維.適用于H.264的快速模式選擇算法[J].通信學(xué)報(bào),2006 , 27 (7) : 117-121.

[3]張江鑫,馮明.H. 264快速幀內(nèi)預(yù)測(cè)模式選擇算法[J].中國圖象圖形學(xué)報(bào), 2008, 13 (10) : 2023-2036.

[4]劉佳,董金明.一種新的 H.264/AVC快速幀內(nèi)預(yù)測(cè)模式選擇判決算法[J].電子與信息學(xué)報(bào),2009, 31 (5) : 1072～1076.

[5]余成偉,陸建華,鄭君里.H.264 編碼模式選擇快速算法研究[J].清華大學(xué)學(xué)報(bào), 2007, 47(10) : 1677-1680.

[6]Texas Instruments Incorporated. TMS320DM642 Hardware Designer’s Resource Guide[R]. Texas Incorporated 2004.