亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于DSP的四路H.264視頻編碼器的實(shí)現(xiàn)與優(yōu)化

        2010-11-13 07:45:00張新安
        關(guān)鍵詞:編碼器代碼運(yùn)算

        張新安

        (湖南科技學(xué)院 電子工程系,湖南 永州 425100)

        0. 言

        H.264是ITU-T的視頻編碼專家組(VCEG)和ISO/IEC的活動(dòng)圖像專家組(MPEG)聯(lián)合制定的新一代視頻編碼國際標(biāo)準(zhǔn)[1]。H.264以實(shí)現(xiàn)視頻的高壓縮比、高圖像質(zhì)量和良好的網(wǎng)絡(luò)適應(yīng)性等優(yōu)點(diǎn),被廣大視頻應(yīng)用產(chǎn)業(yè)接納。相對(duì)于傳統(tǒng)視頻標(biāo)準(zhǔn)MPEG-2,H.264的壓縮比提高了2~3倍,極大地節(jié)省了視頻存儲(chǔ)容量和網(wǎng)絡(luò)帶寬,因此,一直有許多學(xué)者致力于H.264視頻編碼器的設(shè)計(jì)與優(yōu)化研究[2-5]。

        H.264編碼系統(tǒng)被廣泛應(yīng)用于當(dāng)今數(shù)字視頻監(jiān)控領(lǐng)域,如銀行和證券集中監(jiān)控、市內(nèi)交通和高速公路集中監(jiān)控、小區(qū)和樓宇安防等。目前市場(chǎng)上大部分商用化的視頻編碼系統(tǒng)產(chǎn)品都采用 ASIC芯片設(shè)計(jì),通常只能完成一路視頻的實(shí)時(shí)壓縮,在許多實(shí)際應(yīng)用中,常常需要對(duì)多路場(chǎng)景進(jìn)行實(shí)時(shí)監(jiān)控和存儲(chǔ),使用一片 DSP實(shí)現(xiàn)多路視頻監(jiān)控,能充分利用DSP的運(yùn)算能力,可以降低成本,減少設(shè)備的功耗和體積。

        本文設(shè)計(jì)的基于TMS320DM642(以下簡稱DM642)的H.264視頻編碼器,在硬件設(shè)計(jì)上,充分利用了DM642可以輸入多路不同格式音視頻信號(hào)的特點(diǎn),實(shí)現(xiàn)了 DSP處理與EDMA傳輸并行工作,在編碼器的軟件實(shí)現(xiàn)中,對(duì)運(yùn)動(dòng)估計(jì)、整數(shù)反變換、去塊濾波等關(guān)鍵模塊的算法進(jìn)行了改進(jìn),并對(duì)資源使用和軟件代碼進(jìn)行了全面優(yōu)化,能對(duì)四路分辨率為CIF352×288的視頻信號(hào)實(shí)現(xiàn)H.264視頻格式的實(shí)時(shí)編碼,具有功能強(qiáng)、可靠性高、體積小、功耗低和易于升級(jí)等特點(diǎn)。

        1..264視頻編碼器的硬件實(shí)現(xiàn)與優(yōu)化

        1.1..264視頻編碼器的硬件系統(tǒng)設(shè)計(jì)

        本系統(tǒng)以DM642DSP為核心,實(shí)現(xiàn)四路CIF352×288視頻格式的H.264標(biāo)準(zhǔn)的實(shí)時(shí)編碼,硬件系統(tǒng)結(jié)構(gòu)如圖1所示。

        圖1.路視頻編碼器硬件系統(tǒng)結(jié)構(gòu)圖

        TMS320DM642[6]是TI公司開發(fā)研制的一款專門面向多媒體應(yīng)用的專用DSP芯片,548腳BGA封裝,芯片內(nèi)核時(shí)鐘高達(dá)600MHz,處理能力最高可達(dá)4800MIPS,采用VLIW和L1/L2兩級(jí)緩存結(jié)構(gòu),并且支持EDMA,有專門為多媒體應(yīng)用設(shè)計(jì)的三路視頻輸入、輸出端口(VP口),每個(gè)VP口又分成A和B 兩個(gè)通道,可與兩路10bit或一路20bit視頻A/D轉(zhuǎn)換器直接相連,通過復(fù)用三路VP口最多允許6路視頻輸入。

        主機(jī)首先通過PCI初始化DSP并對(duì)其加載程序,DSP開始運(yùn)行H.264編碼程序;輸入的模擬視頻信號(hào)經(jīng)TVP515(0支持PAL和NTSC兩種制式)被數(shù)字化為YUV4∶2∶2的數(shù)字視頻格式,DM642的VP口對(duì)輸入的數(shù)字信號(hào)進(jìn)行格式轉(zhuǎn)換,將采集的YUV分離并按照YUV分量各自連續(xù)存放的格式存放在SDRAM中,DSP通過EDMA完成4∶2∶2到4∶2∶0的視頻格式轉(zhuǎn)換,以適應(yīng)H.264編碼的要求;視頻從VP口采集進(jìn)來之后,采用EDMA方式進(jìn)行數(shù)據(jù)搬移,搬移到緩存(cache)中之后,DM642便對(duì)數(shù)據(jù)進(jìn)行壓縮處理;DSP完成一幀圖像的編碼,通過PCI向主機(jī)發(fā)出中斷,主機(jī)響應(yīng)中斷,從DSP的存儲(chǔ)空間讀取原始圖像數(shù)據(jù)和壓縮后的碼流。主機(jī)程序在 VC++環(huán)境下編寫,提供與用戶交互的界面,可進(jìn)行原始視頻的實(shí)時(shí)播放、壓縮編碼、保存、網(wǎng)絡(luò)傳輸;壓縮碼流的實(shí)時(shí)解壓播放、保存、回放;從網(wǎng)絡(luò)接收壓縮碼流實(shí)時(shí)解壓回放等各種處理。

        1.2..264編碼算法的DSP實(shí)現(xiàn)與優(yōu)化

        將H.264編碼算法在DSP上實(shí)現(xiàn)與優(yōu)化,需要經(jīng)過PC機(jī)端算法實(shí)現(xiàn)及優(yōu)化、PC機(jī)代碼的DSP化和DSP代碼優(yōu)化等幾個(gè)步驟。

        1.2.1.PC機(jī)上實(shí)現(xiàn)H.264算法并進(jìn)行優(yōu)化

        選取 ITU-T的 JM6.1e參考軟件作為優(yōu)化對(duì)象,但是JM6.1e代碼復(fù)雜,冗余度很大,需要在PC機(jī)端對(duì)其進(jìn)行較大調(diào)整,涉及工作有:去除冗余代碼、規(guī)范程序結(jié)構(gòu)、全局和局部變量的調(diào)整和重新定義、結(jié)構(gòu)體的調(diào)整等。

        1.2.2.C機(jī)H.264代碼的DSP化

        ITU-T官方提供的H.264核心算法代碼是用C語言編寫、在PC機(jī)上實(shí)現(xiàn)的。C6000開發(fā)工具Code Composer Studio有自己的 ANSIC編譯器和優(yōu)化器,并有自己的語法規(guī)則和定義,所以在DSP上實(shí)現(xiàn)H.264的算法,要把PC機(jī)上C語言編寫的H.264代碼進(jìn)行改動(dòng),使其完全符合DSP中C的規(guī)則。

        這些改動(dòng)包括:去除所有的文件操作;去除可視化界面的操作;合理安排內(nèi)存空間的預(yù)留和分配;規(guī)范數(shù)據(jù)類型,把浮點(diǎn)數(shù)的運(yùn)算部分近似用定點(diǎn)表示,或用定點(diǎn)實(shí)現(xiàn)浮點(diǎn)運(yùn)算;根據(jù)內(nèi)存的分配定義遠(yuǎn)近程常量和變量;把常用的數(shù)據(jù)在數(shù)據(jù)結(jié)構(gòu)中提取出來,以near型數(shù)據(jù)定義在DSP內(nèi)部存儲(chǔ)空間,以減少對(duì)EMIF端口的讀取,從而提高速度。

        1.2.3.SP代碼的優(yōu)化

        通過把PC機(jī)H.264代碼DSP化,可以在DSP上實(shí)現(xiàn)H.264的編解碼算法,但是,這樣實(shí)現(xiàn)的算法運(yùn)行效率很低,所以必須結(jié)合DSP本身的特點(diǎn),對(duì)其進(jìn)一步優(yōu)化,才能實(shí)現(xiàn)H.264視頻編碼器算法對(duì)視頻圖像的實(shí)時(shí)處理。

        對(duì)DSP代碼的優(yōu)化分為項(xiàng)目級(jí)優(yōu)化、C程序級(jí)優(yōu)化和匯編程序級(jí)優(yōu)化三個(gè)層次。

        (1)項(xiàng)目級(jí)優(yōu)化:主要是通過選擇CCS提供的編譯優(yōu)化參數(shù),根據(jù)H.264系統(tǒng)的要求進(jìn)行優(yōu)化,通過不斷地對(duì)各個(gè)參數(shù)(-mw -pm -o3 -mt等)的選擇、搭配、調(diào)整,改善循環(huán)、多重循環(huán)體的性能,進(jìn)行軟件流水,從而提高軟件的并行性。

        (2)C程序級(jí)優(yōu)化:主要是針對(duì)采用的DSP的具體特點(diǎn)進(jìn)行代碼的功能精簡、數(shù)據(jù)結(jié)構(gòu)的優(yōu)化、循環(huán)的優(yōu)化、代碼的并行化處理。主要工作包括以下部分:去除掉SNR計(jì)算、幀率及其他輔助信息的程序模塊;函數(shù)及數(shù)據(jù)映射區(qū)域的調(diào)整,把經(jīng)常用的數(shù)據(jù)存儲(chǔ)在片內(nèi)存儲(chǔ)器中,頻繁調(diào)用的程序盡可能映射在相鄰或相近的存儲(chǔ)區(qū)域;針對(duì)并行化效果差的函數(shù),尤其是多重循環(huán)體,要進(jìn)行循環(huán)拆解,將多重循環(huán)拆解為單重循環(huán);減少存儲(chǔ)區(qū)數(shù)據(jù)的讀取和存儲(chǔ),尤其是片外存儲(chǔ)區(qū)域數(shù)據(jù)的調(diào)用,以減少時(shí)間;數(shù)據(jù)結(jié)構(gòu)的重新定義和調(diào)整。

        (3)匯編程序級(jí)優(yōu)化。匯編級(jí)的優(yōu)化包括兩部分:采用線性匯編語言進(jìn)行優(yōu)化和直接用匯編語言進(jìn)行優(yōu)化。由于系統(tǒng)編譯器的局限性,并不能將全部的函數(shù)都很好地優(yōu)化,這樣就需要統(tǒng)計(jì)比較耗時(shí)的C語言函數(shù),用匯編語言重新編寫。對(duì)耗時(shí)函數(shù)進(jìn)行匯編語言改寫,涉及的函數(shù)有DCT變換,反DCT變換,整象素運(yùn)動(dòng)估計(jì),亞象素搜索,幀內(nèi)編碼函數(shù),插值函數(shù)等。

        2..264視頻編碼器的軟件設(shè)計(jì)與優(yōu)化

        2.1..264視頻編碼器軟件設(shè)計(jì)

        軟件設(shè)計(jì)分為視頻采集、多路視頻處理和視頻壓縮三個(gè)部分。

        視頻采集采用并行設(shè)計(jì),即通過DM642的VP口同時(shí)處理四路視頻源,將數(shù)據(jù)存放到對(duì)應(yīng) VP口的緩存區(qū)。在SDRAM 中,為每一路視頻開辟三個(gè)緩存區(qū),通過中斷信號(hào)改變緩存區(qū)的指針,將VP口中的數(shù)據(jù)通過EDMA搬移到緩存區(qū)中周期存放。在采集部分,充分使用DM642的VP口資源和片外SDRAM,無須消耗DSP的資源,提高了系統(tǒng)的運(yùn)行效率。

        多路視頻的處理采用四路編碼串行執(zhí)行,即通過用戶程序控制DSP,在編碼完第一路的當(dāng)前視頻幀后,再編碼下一路的當(dāng)前視頻幀,依次循環(huán)進(jìn)行。

        視頻壓縮部分采用的H.264標(biāo)準(zhǔn)是以宏塊為單位的變換和預(yù)測(cè)的混合編碼技術(shù),如圖2所示。編碼過程主要包括變換、量化、熵編碼、反量化、反變換、幀內(nèi)預(yù)測(cè)、環(huán)路濾波、圖像重建、運(yùn)動(dòng)估計(jì)及運(yùn)動(dòng)補(bǔ)償。

        圖2..264視頻編碼器方框圖

        2.2..264視頻編碼器的軟件優(yōu)化

        H.264編碼計(jì)算量龐大,而DSP的硬件資源有限,需要結(jié)合DSP的特點(diǎn)進(jìn)行較好的優(yōu)化,才能達(dá)到實(shí)時(shí)編碼的要求。下面給出Cache性能優(yōu)化和存儲(chǔ)的配置優(yōu)化的方法。

        2.2.1.ACHE的性能優(yōu)化

        DM642的存儲(chǔ)器系統(tǒng)由片內(nèi)內(nèi)存L1、L2和片外外存兩部分組成,L1、L2和片外SDRAM構(gòu)成了整個(gè)存儲(chǔ)器系統(tǒng)的三級(jí)層次結(jié)構(gòu),如圖3所示。片內(nèi)內(nèi)存采用兩級(jí)緩存結(jié)構(gòu),第一級(jí)由L1P和L1D組成,L1距離DSP內(nèi)核最近,數(shù)據(jù)訪問速度最快,只需一個(gè)時(shí)鐘周期。第二級(jí)L2是一個(gè)統(tǒng)一的程序/數(shù)據(jù)空間,根據(jù)L2配置為Cache或SRAM的不同選擇,訪問速度需 8個(gè)或 6個(gè)時(shí)鐘周期。第三級(jí)是片外外存,由SDRAM 構(gòu)成,片外存儲(chǔ)器容量很大但訪問速度很慢,遠(yuǎn)遠(yuǎn)大于8個(gè)時(shí)鐘周期。

        圖3.級(jí)存儲(chǔ)器系統(tǒng)結(jié)構(gòu)圖

        對(duì)CACHE性能優(yōu)化,本設(shè)計(jì)采用了下列一些方法:合理配置L2;合理布置程序代碼段和數(shù)據(jù)段的內(nèi)存布局,為防止有效代碼、數(shù)據(jù)在緩沖存儲(chǔ)器中相互排擠,盡量把順序執(zhí)行的代碼、同時(shí)使用的數(shù)據(jù)放在相互鄰接的物理空間當(dāng)中;若函數(shù)模塊和數(shù)據(jù)包含在一個(gè)循環(huán)中,循環(huán)體的大小應(yīng)與Cache的容量相吻合,以便能把整個(gè)循環(huán)體全部放入 Cache中;為提高Cache中數(shù)據(jù)的重復(fù)利用率,把數(shù)據(jù)操作構(gòu)成一條數(shù)據(jù)處理鏈,鏈中的下一級(jí)操作直接使用上一級(jí)操作留在Cache中的數(shù)據(jù);根據(jù)Cache行數(shù)據(jù)寬度信息,調(diào)節(jié)數(shù)據(jù)在物理內(nèi)存中的存放位置,從而利用數(shù)據(jù)預(yù)取增加Cache的命中率;通過合理的數(shù)據(jù)填充策略,避免同一時(shí)鐘周期對(duì)相同存儲(chǔ)體的讀寫操作造成存儲(chǔ)器的存取沖突。

        2.2.2.儲(chǔ)器的配置優(yōu)化

        DSP的程序數(shù)據(jù)存儲(chǔ)空間非常有限。因此,對(duì)于視頻編解碼這種需要處理大量數(shù)據(jù)的程序而言,必須合理安排數(shù)據(jù)和程序的存儲(chǔ)方式,實(shí)現(xiàn)對(duì)存儲(chǔ)器的優(yōu)化,以便提高程序執(zhí)行的效率。否則,大量數(shù)據(jù)的反復(fù)搬移會(huì)阻礙程序運(yùn)行效率的提高。

        原程序有很多不適應(yīng)DSP系統(tǒng)的程序流程結(jié)構(gòu),如內(nèi)存分配和釋放操作頻繁,沒有在一開始就分配好內(nèi)存,而是在一個(gè)個(gè)單獨(dú)的函數(shù)中分配和釋放內(nèi)存,不僅程序運(yùn)行效率低,還產(chǎn)生許多不必要的臨時(shí)存儲(chǔ)空間。為此,要對(duì)原有程序結(jié)構(gòu)進(jìn)行修改,調(diào)整程序運(yùn)行流程,合并部分函數(shù),使程序結(jié)構(gòu)能充分利用DM642的硬件特點(diǎn),盡量節(jié)省存儲(chǔ)空間。

        根據(jù)片內(nèi)存儲(chǔ)器容量小而存取速度快,片外存儲(chǔ)器容量大但存取速度慢的特點(diǎn),在分配存儲(chǔ)器的時(shí)候?qū)τ谀切┙?jīng)常使用的變量放在片內(nèi),如 VLC表、運(yùn)動(dòng)矢量、反量化、反DCT的系數(shù)以及其它中間變量等,而對(duì)于那些執(zhí)行次數(shù)比較少或者比較大的變量如視頻幀參考幀則放在片外。此外由于編譯和分配空間是以文件為單位的,所以把頻繁使用的函數(shù)放在同一文件中,再將這個(gè)文件放入片內(nèi)存儲(chǔ)器以高效地利用有限的片內(nèi)資源。同時(shí)通過Profiler分析代碼調(diào)用頻率,合理安排代碼的存放位置,提高Cache的命中率和數(shù)據(jù)訪問性。為保證數(shù)據(jù)讀取的高效性,在片內(nèi)開辟乒乓結(jié)構(gòu)的雙緩存區(qū)。

        編碼過程中要訪問的大量數(shù)據(jù)都放在片外存儲(chǔ)器, 處理時(shí)要進(jìn)行頻繁的數(shù)據(jù)搬移,由于CPU訪問片外的速度通常要比訪問片內(nèi)慢10~20倍,片外數(shù)據(jù)的傳輸通常成為程序運(yùn)行時(shí)的瓶頸,即使代碼效率很高,流水線也會(huì)因?yàn)榈却龜?shù)據(jù)而被嚴(yán)重阻塞,本設(shè)計(jì)采用EDMA傳送數(shù)據(jù)來有效地解決這一問題。在編碼當(dāng)前宏塊的同時(shí),利用EDMA將下一個(gè)宏塊的數(shù)據(jù)、用到的參考幀數(shù)據(jù)由片外傳送至片內(nèi),當(dāng)前宏塊做完運(yùn)動(dòng)補(bǔ)償后,EDMA將重建后的宏塊由片內(nèi)傳送至片外。這樣CPU只對(duì)片內(nèi)數(shù)據(jù)進(jìn)行操作,流水線可以順利進(jìn)行。

        3..264視頻編碼器關(guān)鍵模塊的算法優(yōu)化

        H. 264視頻編碼器的計(jì)算量主要集中在運(yùn)動(dòng)估計(jì)、量化、反量化、DCT與IDCT和去塊濾波幾個(gè)模塊,這些模塊優(yōu)化前的運(yùn)算量占到全部運(yùn)算量的80%以上。下面給出幾個(gè)耗時(shí)較多的關(guān)鍵模塊的優(yōu)化策略。

        3.1.動(dòng)估計(jì)優(yōu)化

        視頻編碼中,運(yùn)動(dòng)估計(jì)部分是運(yùn)算量最大的一塊,研究顯示,對(duì)于H.264,單幀參考,運(yùn)動(dòng)估計(jì)占總運(yùn)算量的70%,5幀參考,這個(gè)比例能達(dá)到90%,因此,采用有效快速的運(yùn)動(dòng)估計(jì)算法非常有必要,本系統(tǒng)采用基于預(yù)測(cè)和早停止技術(shù)的運(yùn)動(dòng)估計(jì)算法,主要方法是利用周邊鄰塊對(duì)當(dāng)前塊運(yùn)動(dòng)矢量進(jìn)行預(yù)測(cè),并設(shè)定自適應(yīng)閾值,使搜索提前停止。采用該算法,在搜索窗為32時(shí),每塊平均搜索點(diǎn)數(shù)3~4個(gè)左右,與全搜索算法的4225余個(gè)點(diǎn)相比,速度提高了1000多倍。

        計(jì)算 SAD是整像素運(yùn)動(dòng)估計(jì)中計(jì)算量最大的部分,TI庫函數(shù)中提供了一些函數(shù),對(duì)于 16×16,16×8,8×8塊的搜索可以直接利用庫函數(shù)。對(duì)于 8×16 的塊不能直接利用,用線性匯編來實(shí)現(xiàn)后,軟件流水一次迭代的周期數(shù)為 3,與三個(gè)匯編庫函數(shù)的迭代周期數(shù)相同。

        分像素運(yùn)動(dòng)估計(jì)中,在每個(gè)搜索位置調(diào)用Calcu_Subpixel_Residual(),計(jì)算出 1/4預(yù)測(cè)像素值,求預(yù)測(cè)殘差,將預(yù)測(cè)殘差保存在diff[16*16]中, 并將預(yù)測(cè)值保存。然后調(diào)用SATD_block()對(duì)diff[16*16]中的殘差進(jìn)行哈達(dá)碼變換求 SATD,求 SATD是對(duì)每個(gè) 4×4塊進(jìn)行,之后求和,4×4塊之間的計(jì)算可以軟件流水提高速度。此外,設(shè)兩個(gè)數(shù)組來保存最優(yōu)的預(yù)測(cè)值,若當(dāng)前考察的位置代價(jià)更小,則通過交換指針使pBestPred指向最優(yōu)的預(yù)測(cè)值,避免數(shù)據(jù)拷貝。

        3.2.數(shù)反變換的優(yōu)化

        對(duì)整數(shù)反變換模塊進(jìn)行運(yùn)算分析,算術(shù)運(yùn)算的比例達(dá)到80%,所以優(yōu)化重點(diǎn)是減少算術(shù)操作。一次反變換需要進(jìn)行128次乘法和96次加法運(yùn)算。當(dāng)反變換進(jìn)行Hadamard變換時(shí),則需要進(jìn)行256次乘法和192次加法運(yùn)算。這樣即使是QCIF圖像,其逆變換也需要進(jìn)行 50688~101376次乘法和38016~70632次加法運(yùn)算。由于乘除運(yùn)算比加減法運(yùn)算耗時(shí)多,所以整數(shù)反變換的優(yōu)化應(yīng)集中在減少乘法運(yùn)算次數(shù)上。

        通過觀察變換矩陣可發(fā)現(xiàn),該矩陣只包括±1和±1/2這4種系數(shù),對(duì)于乘以±1的系數(shù)來說,可將其轉(zhuǎn)換為簡單的加減法,而對(duì)于乘以±1/2,則可以先進(jìn)行移位運(yùn)算然后再進(jìn)行加減法運(yùn)算,這樣就完全避免了代價(jià)昂貴的乘法和除法運(yùn)算。另外可利用蝶形變換對(duì)矩陣相乘再做進(jìn)一步改進(jìn)。例如對(duì) 5幀不同格式圖像比較其優(yōu)化前后的整數(shù)反變換過程,其所要的計(jì)算時(shí)間如表1所示。由表1可見,經(jīng)統(tǒng)計(jì)優(yōu)化后的反變換速度能提高21倍左右。

        表1.數(shù)反變換優(yōu)化前后時(shí)間對(duì)比

        3. 3 去塊濾波的優(yōu)化

        由于H.264中最小塊的大小是4×4,所以在每個(gè)4×4塊中的每個(gè)點(diǎn)有相同的邊界門限。依據(jù)這一點(diǎn),16個(gè)點(diǎn)可以只計(jì)算4次邊界門限,其相應(yīng)的濾波操作也可以4次完成。通過這種優(yōu)化方法可以將去塊濾波函數(shù)的調(diào)用次數(shù)降下來。

        4.統(tǒng)性能測(cè)試

        測(cè)試在一臺(tái)P4 3.0GHz,1G內(nèi)存,操作系統(tǒng)為Windows XP的 PC機(jī)上進(jìn)行。硬件測(cè)試平臺(tái)為基于本文方案研制的DM642編碼器板,主頻600MHz。對(duì)各種不同的CIF格式的視頻序列進(jìn)行編碼,統(tǒng)計(jì)出優(yōu)化前后的編碼性能如表2所示。

        表2.試結(jié)果(一路視頻輸入)

        從表2可以看出,在優(yōu)化前系統(tǒng)不能完成一路視頻的實(shí)時(shí)編碼,優(yōu)化后一路視頻的編碼幀率達(dá)到100fps以上,另從表2實(shí)驗(yàn)結(jié)果可知,信噪比下降很少。在實(shí)時(shí)采集和編碼四路視頻時(shí),即使在視頻內(nèi)容比較復(fù)雜的情況下,總編碼幀率仍可達(dá)到102幀/秒,因此,本文設(shè)計(jì)的H.264編碼器完全能勝任四路CIF格式視頻的實(shí)時(shí)編碼,充分利用了DM642可以接受多路不同格式音視頻信號(hào)和數(shù)據(jù)處理能力強(qiáng)的優(yōu)點(diǎn),降低了系統(tǒng)得成本。

        5. 結(jié)

        在TMS320D642 DSP上實(shí)現(xiàn)了四路CIF格式視頻的實(shí)時(shí)H.264軟件編碼器。給出的程序代碼的優(yōu)化方法,對(duì)于所有的C64DSP都具有通用性,提出的關(guān)鍵模塊的優(yōu)化策略,對(duì)采用其它視頻壓縮標(biāo)準(zhǔn)的編碼器的優(yōu)化具有重要的參考和借鑒價(jià)值。該H.264視頻編碼器與網(wǎng)絡(luò)平臺(tái)相連接可以應(yīng)用于多路視頻監(jiān)控、視頻會(huì)議、可視電話、無線流媒體通信等應(yīng)用領(lǐng)域。這種在通用DSP上全軟件實(shí)現(xiàn)的H.264視頻編碼器,具有功能強(qiáng)、使用靈活、便于升級(jí)等特點(diǎn),有廣泛的應(yīng)用前景。

        [1]ITU-T. Recommendation H.264 Advanced video coding for generic audiovisual services[S].2004.

        [2]陸璐,周維.適用于H.264的快速模式選擇算法[J].通信學(xué)報(bào),2006 , 27 (7) : 117-121.

        [3]張江鑫,馮明.H. 264快速幀內(nèi)預(yù)測(cè)模式選擇算法[J].中國圖象圖形學(xué)報(bào), 2008, 13 (10) : 2023-2036.

        [4]劉佳,董金明.一種新的 H.264/AVC快速幀內(nèi)預(yù)測(cè)模式選擇判決算法[J].電子與信息學(xué)報(bào),2009, 31 (5) : 1072~1076.

        [5]余成偉,陸建華,鄭君里.H.264 編碼模式選擇快速算法研究[J].清華大學(xué)學(xué)報(bào), 2007, 47(10) : 1677-1680.

        [6]Texas Instruments Incorporated. TMS320DM642 Hardware Designer’s Resource Guide[R]. Texas Incorporated 2004.

        猜你喜歡
        編碼器代碼運(yùn)算
        重視運(yùn)算與推理,解決數(shù)列求和題
        有趣的運(yùn)算
        創(chuàng)世代碼
        創(chuàng)世代碼
        創(chuàng)世代碼
        創(chuàng)世代碼
        基于FPGA的同步機(jī)軸角編碼器
        “整式的乘法與因式分解”知識(shí)歸納
        基于PRBS檢測(cè)的8B/IOB編碼器設(shè)計(jì)
        撥云去“誤”學(xué)乘除運(yùn)算
        欧美亚洲国产丝袜在线| 精品亚洲一区二区三区在线观看 | 99久久综合狠狠综合久久| 精品久久综合一区二区| 久久久调教亚洲| 中文字幕av人妻一区二区| 嫩呦国产一区二区三区av| 亚洲精品久久久久一区二区| 欧美内射深喉中文字幕| 欧美日韩亚洲国产千人斩| 日韩av在线不卡一二三区| 日本黄色一区二区三区| 久久久久亚洲av成人人电影| 18禁裸男晨勃露j毛免费观看 | 亚洲av日韩综合一区在线观看| 亚洲AV无码国产永久播放蜜芽| 日韩精品一级在线视频| 日本视频二区在线观看| a级毛片100部免费看| 欧美黑人又粗又大久久久 | 麻豆五月婷婷| 一区二区三区视频偷拍| 久久久久av综合网成人 | 久青草国产在线观看| 一区二区三区精品偷拍av| 91露脸半推半就老熟妇| 国产熟人av一二三区| 精品人妻丰满久久久a| 国产中文字幕亚洲国产| 国产av无码国产av毛片| 最近中文av字幕在线中文| 亚洲青涩在线不卡av| 日韩少妇人妻中文视频| 55夜色66夜色国产精品视频| 午夜短无码| 精品国产乱码久久免费看| 国产白浆在线免费观看| 亚洲国产精品福利片在线观看 | 国产手机在线观看一区二区三区| 久久久久久国产精品免费免费男同| 久久av无码精品人妻糸列|