亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        H.264解碼器的幀內(nèi)預(yù)測(cè)優(yōu)化

        2016-05-10 03:17:07張亞運(yùn)孟李林景博利
        電子科技 2016年4期
        關(guān)鍵詞:優(yōu)化

        張亞運(yùn),孟李林,景博利

        (西安郵電大學(xué) 電子工程學(xué)院,陜西 西安 710061)

        ?

        H.264解碼器的幀內(nèi)預(yù)測(cè)優(yōu)化

        張亞運(yùn),孟李林,景博利

        (西安郵電大學(xué) 電子工程學(xué)院,陜西 西安710061)

        摘要通過(guò)對(duì)H.264幀內(nèi)預(yù)測(cè)加以優(yōu)化,以提高其速度。采用4×4塊級(jí)流水線方式代替串行處理方式,以及自適應(yīng)的流水線協(xié)調(diào)不同種類塊、不同預(yù)測(cè)模式下的幀內(nèi)預(yù)測(cè),用四路并行的多功能處理單元在1個(gè)周期內(nèi)計(jì)算出1列4個(gè)像素點(diǎn)的預(yù)測(cè)值;以“種子”法取代平面預(yù)測(cè)模式的直接計(jì)算方式?;贔PGA開發(fā)平臺(tái)設(shè)計(jì)出優(yōu)化后的預(yù)測(cè)電路,驗(yàn)證結(jié)果表明,優(yōu)化電路處理一個(gè)宏塊平均只需196個(gè)時(shí)鐘周期。

        關(guān)鍵詞H.264;流水線;幀內(nèi)預(yù)測(cè);多功能處理單元

        H.264視頻壓縮編碼標(biāo)準(zhǔn)具有較高的壓縮效率[1],但計(jì)算復(fù)雜度相比于上一代視頻壓縮編碼標(biāo)準(zhǔn)H.263增加了10倍以上,編解碼時(shí)間也成倍增加。另外,H.264視頻壓縮編碼標(biāo)準(zhǔn)所處理的視頻圖像局限在1 920×1 080分辨率之內(nèi),要支持更高分辨率的視頻圖像,就必須提高解碼器的解碼效率。對(duì)H.264幀內(nèi)預(yù)測(cè)算法進(jìn)行優(yōu)化,就是解決此問(wèn)題的途徑之一。

        H.264幀內(nèi)預(yù)測(cè)算法[2]利用空間的相關(guān)性,根據(jù)當(dāng)前宏塊的相鄰已解碼參考像素及幀內(nèi)預(yù)測(cè)模式,對(duì)當(dāng)前宏塊的待預(yù)測(cè)像素點(diǎn)進(jìn)行幀內(nèi)預(yù)測(cè)計(jì)算。

        為提升解碼效率,可考慮以加法器、數(shù)據(jù)選擇器、寄存器為基礎(chǔ),通過(guò)控制接口來(lái)重復(fù)使用H.264幀內(nèi)預(yù)測(cè)硬件結(jié)構(gòu)[3]。也可采用基于4×4子塊的并行方法,找出符合并行計(jì)算的新預(yù)測(cè)順序,以避免數(shù)據(jù)依賴問(wèn)題,提高系統(tǒng)運(yùn)算速度[4],或可采用流水線的辦法對(duì)硬件結(jié)構(gòu)進(jìn)行優(yōu)化,以提高數(shù)據(jù)吞吐量[5]。不過(guò),這些優(yōu)化方法僅局限于對(duì)硬件結(jié)構(gòu)的改變。

        本文擬對(duì)幀內(nèi)預(yù)測(cè)硬件結(jié)構(gòu)及其算法進(jìn)行雙重優(yōu)化,即采用4×4塊級(jí)流水線方式代替串行處理方式,用自適應(yīng)的流水線協(xié)調(diào)不同種類塊及不同預(yù)測(cè)模式下的幀內(nèi)預(yù)測(cè),利用4路并行的多功能處理單元在1個(gè)周期內(nèi)計(jì)算出1列4個(gè)像素點(diǎn)的預(yù)測(cè)值,采用“種子”法取代平面預(yù)測(cè)模式的直接計(jì)算方式,以求提高幀內(nèi)預(yù)測(cè)電路的處理速度。

        1硬件結(jié)構(gòu)優(yōu)化

        對(duì)幀內(nèi)預(yù)測(cè)算法的硬件結(jié)構(gòu)采用4×4塊級(jí)流水線及4×4塊自適應(yīng)流水線兩種不同的流水線設(shè)計(jì)。4×4塊級(jí)流水線設(shè)計(jì)將每個(gè)宏塊拆分為24個(gè)4×4塊,4×4塊作為最小的處理單元。4×4塊自適應(yīng)流水線主要對(duì)幀內(nèi)預(yù)測(cè)的參考像素準(zhǔn)備及計(jì)算進(jìn)行流水線處理,可根據(jù)預(yù)測(cè)模式、塊大小、塊類型的不同選擇相應(yīng)的時(shí)鐘周期,以節(jié)約處理周期。

        設(shè)計(jì)一種多功能處理單元(Multifunction Processing Element,MFPE)實(shí)現(xiàn)全部13種幀內(nèi)預(yù)測(cè)模式下的運(yùn)算,以節(jié)約邏輯單元數(shù)量,避免資源浪費(fèi)。

        1.1流水線

        每個(gè)宏塊可分解為16個(gè)4×4亮度子塊和8個(gè)4×4色度子塊。如圖1所示,通過(guò)每個(gè)亮度、色度4×4子塊的預(yù)測(cè)模式及其相應(yīng)的參考像素完成幀內(nèi)預(yù)測(cè),得到相應(yīng)的幀內(nèi)預(yù)測(cè)結(jié)果。隨后通過(guò)流水線同步器的同步控制將預(yù)測(cè)結(jié)果與殘差塊相加得到當(dāng)前4×4子塊的重建值,重建塊中與下一待預(yù)測(cè)塊相鄰的像素點(diǎn)作為待預(yù)測(cè)塊的參考像素點(diǎn)。

        與16×16宏塊級(jí)流水線相比,4×4塊級(jí)流水線可與H.264標(biāo)準(zhǔn)的最小塊匹配,可迅速完成內(nèi)容切換;需要更少的寄存器用于存儲(chǔ)中間變量。4×4塊級(jí)流水線代替了串行處理方式。

        圖1 幀內(nèi)預(yù)測(cè)4×4塊級(jí)流水線

        1.2多功能處理單元

        4×4亮度塊的幀內(nèi)預(yù)測(cè)模式有9種,16×16亮度宏塊的幀內(nèi)預(yù)測(cè)模式有4種,色度塊的幀內(nèi)預(yù)測(cè)模式也有4種,且與16×16亮度宏塊的幀內(nèi)預(yù)測(cè)模式類似。除垂直、水平、平均預(yù)測(cè)模式類似外,其余預(yù)測(cè)模式間基本沒(méi)有相似點(diǎn),若針對(duì)每種預(yù)測(cè)模式均設(shè)計(jì)與其對(duì)應(yīng)的處理單元,會(huì)造成大量的資源浪費(fèi)。故需設(shè)計(jì)MFPE以處理不同預(yù)測(cè)模式下的幀內(nèi)預(yù)測(cè)。

        如圖2所示,MFPE由4個(gè)數(shù)據(jù)輸入、1個(gè)時(shí)鐘輸入和2個(gè)數(shù)據(jù)輸出組成。輸入的參考像素點(diǎn)經(jīng)過(guò)MFPE中移位器和選擇器等的處理可得到任一預(yù)測(cè)模式下的任一待預(yù)測(cè)像素點(diǎn)的預(yù)測(cè)結(jié)果。MFPE中的內(nèi)部寄存器負(fù)責(zé)暫存一些中間產(chǎn)生的結(jié)果,供其他MFPE在下一時(shí)鐘節(jié)拍使用。

        圖2 MFPE的電路結(jié)構(gòu)設(shè)計(jì)

        1.3自適應(yīng)流水線

        不同的待預(yù)測(cè)塊和幀內(nèi)預(yù)測(cè)模式都需要特定位置的相鄰像素點(diǎn)用于計(jì)算,而一個(gè)固定的流水線無(wú)法有效地協(xié)調(diào)整個(gè)幀內(nèi)預(yù)測(cè)過(guò)程。因此,一種自適應(yīng)的流水線可靈活處理各種情況下的運(yùn)算。通過(guò)自適應(yīng)流水線的處理,可減小平均預(yù)測(cè)延遲,提高工作頻率[6]。如圖3所示,將自適應(yīng)流水線劃分為3個(gè)步驟。加載、預(yù)計(jì)算作為前兩個(gè)步驟,其處理周期是可變的,根據(jù)當(dāng)前待預(yù)測(cè)塊及幀內(nèi)預(yù)測(cè)模式的不同選擇其相應(yīng)的處理周期。計(jì)算作為自適應(yīng)流水線處理的第3步,具有固定的4個(gè)處理周期,每個(gè)周期通過(guò)4路并行的MFPE計(jì)算出1列4個(gè)像素點(diǎn)的預(yù)測(cè)值,通過(guò)4個(gè)周期即可計(jì)算出當(dāng)前4×4塊的幀內(nèi)預(yù)測(cè)結(jié)果。下面詳細(xì)介紹流水線的3個(gè)步驟:

        (1)加載。參考像素由上鄰塊最下一行像素點(diǎn)和左鄰塊最右一列像素點(diǎn)組成。由于選用存儲(chǔ)器的位寬為32位,故存取上方4×4亮度子塊最下一行4個(gè)參考像素點(diǎn)只需1個(gè)周期即可完成,存取8×8色度塊參考像素點(diǎn)在2個(gè)周期內(nèi)可完成,存取16×16亮度宏塊參考像素點(diǎn)在4個(gè)周期內(nèi)可完成。當(dāng)采用水平預(yù)測(cè)模式或上方參考像素?zé)o效時(shí),可直接將加載的周期設(shè)置為0;

        (2)預(yù)計(jì)算。在進(jìn)行平面模式預(yù)測(cè)前,需提前計(jì)算出5個(gè)中間變量用于后續(xù)計(jì)算。根據(jù)當(dāng)前待預(yù)測(cè)像素在宏塊中的位置及5個(gè)中間變量可計(jì)算出預(yù)測(cè)像素值。該步驟只適用于平面預(yù)測(cè)模式,除平面預(yù)測(cè)模式以外的其他預(yù)測(cè)模式均可在流水線處理中跳過(guò)此步;

        (3)計(jì)算。得到當(dāng)前4×4塊的參考像素及預(yù)測(cè)模式后,經(jīng)過(guò)4個(gè)固定的周期可計(jì)算出當(dāng)前塊的預(yù)測(cè)值。

        圖3 幀內(nèi)預(yù)測(cè)自適應(yīng)流水線

        2平面預(yù)測(cè)模式的算法優(yōu)化

        對(duì)計(jì)算復(fù)雜度較高的平面預(yù)測(cè)模式進(jìn)行算法優(yōu)化。

        除平面預(yù)測(cè)模式外,其他幀內(nèi)預(yù)測(cè)模式可直接通過(guò)相鄰像素點(diǎn)計(jì)算出預(yù)測(cè)結(jié)果,而平面預(yù)測(cè)模式需要5個(gè)中間變量H、V、a、b、c用于預(yù)測(cè)。首先計(jì)算中間變量H/V,其余中間變量可通過(guò)H/V計(jì)算得出[7]。若直接計(jì)算H/V會(huì)需要大量的乘法器,必會(huì)增加硬件的負(fù)擔(dān)。故將計(jì)算分解為加法及移位計(jì)算,如乘5可分解為(乘4+乘1),通過(guò)一個(gè)移位器和一個(gè)加法器即可實(shí)現(xiàn)計(jì)算,其余項(xiàng)的計(jì)算方式與之類似。

        為降低計(jì)算復(fù)雜度,提出一種兩級(jí)“種子”法。計(jì)算出1個(gè)一級(jí)種子,通過(guò)該一級(jí)種子計(jì)算7個(gè)確定像素點(diǎn)作為二級(jí)種子。通過(guò)這8個(gè)種子算得當(dāng)前16×16亮度宏塊在平面預(yù)測(cè)模式下的預(yù)測(cè)值。兩級(jí)“種子”法的處理順序如圖4所示。

        圖4 兩級(jí)“種子”法處理順序

        當(dāng)前待預(yù)測(cè)亮度宏塊內(nèi)第0個(gè)4×4子塊可通過(guò)一級(jí)種子與中間變量b,c求和完成預(yù)測(cè),第1個(gè)4×4子塊的預(yù)測(cè)值可通過(guò)其左鄰像素點(diǎn)與中間變量b求和得出,亮度宏塊內(nèi)其余子塊的預(yù)測(cè)方式與之類似。

        若對(duì)平面預(yù)測(cè)模式采用H.264標(biāo)準(zhǔn)中的直接計(jì)算方式,則完成一次平面預(yù)測(cè)操作需要512次乘法操作和1 024次加法操作[8],而兩級(jí)“種子”法只需279次加法操作和13次移位操作。與直接計(jì)算方式相比,兩級(jí)“種子”法去除了所有乘法操作,減少了72.8%的加法操作,使算法得到優(yōu)化。

        3設(shè)計(jì)驗(yàn)證

        經(jīng)流水線、并行化處理后的幀內(nèi)預(yù)測(cè)器采用verilog HDL實(shí)現(xiàn),在Modelsim SE 10.1a下得到仿真波形,以4×4亮度幀內(nèi)預(yù)測(cè)為例對(duì)仿真結(jié)果進(jìn)行說(shuō)明。如圖5所示,位于當(dāng)前圖像幀的第8行,第0列的宏塊采用4×4亮度塊幀內(nèi)預(yù)測(cè)方式,Intra4x4_predmode_CurrMb表示當(dāng)前亮度宏塊的全部16個(gè)亮度子塊的預(yù)測(cè)模式,blk4x4_sum_PE0_out~blk4x4_sum_PE3_out表示用于參考的重建像素值,可在4個(gè)周期內(nèi)得當(dāng)前宏塊第4個(gè)子塊的預(yù)測(cè)值PE0_out~PE3_out。與官方編解碼模型JM18.6的提取結(jié)果進(jìn)行比對(duì),可知該預(yù)測(cè)結(jié)果完全正確。經(jīng)過(guò)驗(yàn)證可知,幀內(nèi)預(yù)測(cè)硬件電路是完全可行的。

        圖5 幀內(nèi)預(yù)測(cè)仿真結(jié)果

        基于Altera公司EP4CGX110DF27C7開發(fā)平臺(tái)實(shí)現(xiàn)了硬件電路設(shè)計(jì),使用Quartus 12.0完成電路綜合,結(jié)果表明:最高工作頻率為53.44 MHz,使用了5 063個(gè)邏輯單元,631個(gè)寄存器。完成一個(gè)宏塊預(yù)測(cè)平均需要196個(gè)時(shí)鐘周期,幀內(nèi)預(yù)測(cè)電路每秒可處理272 653個(gè)宏塊。

        表1為幾種幀內(nèi)預(yù)測(cè)器的性能對(duì)比。本文幀內(nèi)預(yù)測(cè)器的預(yù)測(cè)速度相比文獻(xiàn)[4]經(jīng)并行處理的幀內(nèi)預(yù)測(cè)器的預(yù)測(cè)速度提高了23%,相比文獻(xiàn)[5]經(jīng)流水線處理的幀內(nèi)預(yù)測(cè)器的預(yù)測(cè)速度提高了43%。

        表1 幀內(nèi)預(yù)測(cè)器性能對(duì)比

        4結(jié)束語(yǔ)

        為降低幀內(nèi)預(yù)測(cè)算法的復(fù)雜度,提升預(yù)測(cè)效率,本文采用4×4塊級(jí)流水線與H.264視頻編碼標(biāo)準(zhǔn)的最小處理塊大小相匹配,完成塊級(jí)流水線處理;自適應(yīng)流水線減小了平均預(yù)測(cè)延時(shí),提高了工作頻率;采用4路并行的MFPE在4個(gè)周期內(nèi)即可計(jì)算得出4×4塊的幀內(nèi)預(yù)測(cè)結(jié)果;在進(jìn)行平面預(yù)測(cè)時(shí)采用兩級(jí)“種子”法,去除了乘法操作并減少了72.8%的加法操作。一系列的電路結(jié)構(gòu)及算法優(yōu)化提升了幀內(nèi)預(yù)測(cè)器的運(yùn)算速度。在FPGA開發(fā)平臺(tái)上實(shí)現(xiàn)了幀內(nèi)預(yù)測(cè)器的硬件設(shè)計(jì)及驗(yàn)證,結(jié)果表明:該幀內(nèi)預(yù)測(cè)電路的工作頻率可達(dá)53.44 MHz,完成一個(gè)宏塊平均需要196個(gè)時(shí)鐘周期,每秒可處理272 653個(gè)宏塊。

        參考文獻(xiàn)

        [1]朱立,成衛(wèi),甘羽,等.H.264幀內(nèi)預(yù)測(cè)模式判定快速算法研究[J].電網(wǎng)技術(shù),2012,36(7):275-280.

        [2]宋云,沈燕飛,龍際珍,等.基于方向梯度的H.264幀內(nèi)預(yù)測(cè)模式選擇算法[J].計(jì)算機(jī)學(xué)報(bào),2013,36(8):1757-1764.

        [3]劉西振,楊靜,王威.基于FPGA的H.264幀內(nèi)預(yù)測(cè)實(shí)現(xiàn)和優(yōu)化[J].計(jì)算機(jī)工程,2012,38(7):257-259,262.

        [4]Wu Lagou,Zhang Duoli,Du Gaoming,et al.A 4×4 pipelined intra frame decoder for H.264[C].Hong Kong:Anticounterfeiting,Security,and Identification in Communication,IEEE Press,2009.

        [5]Wang Xi,Cui Xiaoxin,Yu Dunshan.A parallel intra prediction architecture for H.264 video decoding[C].Changsha:IEEE 8th International Conference on ASIC,IEEE Press,2009.

        [6]徐平,余青山,金朝陽(yáng),等.基于時(shí)空預(yù)測(cè)的H.264快速幀內(nèi)預(yù)測(cè)模式選擇算法[J].通信學(xué)報(bào),2010,31(9):139-145.

        [7]唐浩漾,王曙光.一種改進(jìn)的H.264幀內(nèi)預(yù)測(cè)模式選擇算法[J].西安郵電大學(xué)學(xué)報(bào),2014,19(5):46-50.

        [8]汪大勇,孫世新,楊潔淼,等.適合于空間可伸縮編碼的幀內(nèi)快速算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2010,22(11):1959-1965.

        Optimization of Intra-prediction for H.264 Decoder

        ZHANG Yayun,MENG Lilin,JING Boli

        (School of Electronic Engineering,Xi’an University of Posts and Telecommunications,Xi’an 710061,China)

        AbstractTo optimize the intra-prediction of the H.264 coding standard for improving the speed of intra-prediction,a 4×4 block pipeline is adopted instead of serial processing method.A adaptive pipeline is adopted which harmonizes the intra-prediction under different blocks and different prediction modes,using the four-channel parallel multifunction processing element to calculate the prediction values of four pixels in a column in one cycle.The “seed” method is adopted to replace the way of calculate directly in planar prediction mode.The optimized intra-prediction circuit is designed by using FPGA development platform.The verification results show that the optimized intra-prediction circuit only needs 196 clock cycles in average to process a macro block.

        KeywordsH.264;pipeline;intra-prediction;multifunction processing element

        中圖分類號(hào)TN919.81

        文獻(xiàn)標(biāo)識(shí)碼A

        文章編號(hào)1007-7820(2016)04-063-04

        doi:10.16180/j.cnki.issn1007-7820.2016.04.017

        作者簡(jiǎn)介:張亞運(yùn)(1990—),男,碩士研究生。研究方向:專用集成電路設(shè)計(jì)。孟李林(1962—),男,教授。研究方向:計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),嵌入式系統(tǒng)。

        收稿日期:2015- 09- 09

        猜你喜歡
        優(yōu)化
        超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
        PEMFC流道的多目標(biāo)優(yōu)化
        能源工程(2022年1期)2022-03-29 01:06:28
        民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
        關(guān)于優(yōu)化消防安全告知承諾的一些思考
        一道優(yōu)化題的幾何解法
        由“形”啟“數(shù)”優(yōu)化運(yùn)算——以2021年解析幾何高考題為例
        圍繞“地、業(yè)、人”優(yōu)化產(chǎn)業(yè)扶貧
        事業(yè)單位中固定資產(chǎn)會(huì)計(jì)處理的優(yōu)化
        4K HDR性能大幅度優(yōu)化 JVC DLA-X8 18 BC
        幾種常見的負(fù)載均衡算法的優(yōu)化
        電子制作(2017年20期)2017-04-26 06:57:45
        五月婷网站| 国产综合在线观看| 国产在线不卡一区二区三区| 老熟妇Av| 偷拍美女一区二区三区视频| 国产精品亚洲av三区亚洲| 99精品国产一区二区三区| 亚洲色图+国产精品| 国产男女猛烈无遮挡免费视频网址| 人妻精品久久一区二区三区| 亚洲国产成人一区二区精品区 | 国产一区二区三区视频免费在线 | 久久久久成人精品免费播放网站| 亚洲精品成人一区二区三区| 精品无码人妻夜人多侵犯18| 国产在线精品一区二区| 国产精品久久久亚洲第一牛牛| 中文字幕人妻一区二区二区| 亚洲夜夜性无码| 免费a级毛片无码a| 在线你懂| 精品三级国产一区二区三| 国产md视频一区二区三区| 国产在线观看入口| 熟女人妻一区二区中文字幕| 18禁免费无码无遮挡不卡网站| 老熟女高潮一区二区三区| 天堂69亚洲精品中文字幕| 国产午夜精品视频观看| 中国人妻与老外黑人| 久久久精品免费观看国产| 国产小视频一区二区三区| 国产乱码一区二区三区精品| 久久精品麻豆日日躁夜夜躁| 国产一级三级三级在线视| 在线观看一区二区三区国产| 日韩人妻ol丝袜av一二区| 一本久道久久综合婷婷五月| 亚洲av一区二区三区网站| 成人区人妻精品一区二区三区| 亚洲国产精品久久久久秋霞影院|