亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        適用于AVS的高性能整像素運動估計硬件設計

        2013-08-13 08:13:34吳燕秀王法翔
        電子技術應用 2013年1期
        關鍵詞:加法器宏塊處理速度

        吳燕秀,王法翔

        (1.福州大學 物理與信息工程學院,福建 福州 350002;2.福建省集成電路中心,福建 福州 350002)

        AVS整像素運動估計的搜索算法很多,其中全搜索塊匹配算法因數(shù)據(jù)流規(guī)則匹配率高并且沒有復雜的動態(tài)反饋和決策邏輯,最適合可變塊大小運動估計,故本文選擇全搜索塊匹配算法。現(xiàn)有的全搜索塊匹配算法運動估計硬件結構在面積及處理速度上已做了很多努力,如參考文獻[2-5]提出的實現(xiàn)方案:參考文獻[2]利用像素截斷的方法,將像素低位截斷,在保證圖像信噪比降低不多的情況下大大減少了運算量;參考文獻[3]提出了二維intra-Level SAD計算陣列的運動估計結構,在列方向上數(shù)據(jù)重用率可達到100%;參考文獻[4]和[5]提出的結構能夠實現(xiàn)100%的硬件處理器利用率,但是均存在I/O帶寬大的缺點。本文根據(jù)AVS整像素運動估計的特點,采用二維內置SAD加法樹計算陣列,通過合理安排片上存儲,極大地降低了I/O帶寬;運用了加1電路選擇進位加法器,進一步縮小了結構面積,提高了處理速度,實現(xiàn)了適用于AVS的高性能整像素運動估計硬件設計。

        1 AVS運動估計算法

        1.1 可變塊運動估計

        基于塊的運動估計,即找到當前幀的塊在參考幀中一定范圍內最匹配的塊所在的相對位置,這個相對位置稱為運動矢量。AVS標準中規(guī)定將16×16的宏塊進一步劃分為 8×16、16×8、8×8 的子塊,如圖1 所示,這樣能夠提供更加精確的運動矢量預測??勺儔K運動估計需要對每個宏塊的所有子塊進行塊匹配,即進行9次計算。本文采用如圖2所示的加法樹結構,所有的大塊由小塊簡單相加即可,大大減少了計算量[4]。

        1.2 匹配準則

        運動估計需依據(jù)一定的判斷準則,并在選定搜索算法所遍歷的點中尋找最優(yōu)的匹配點。在眾多的匹配準則中,絕對誤差和(SAD)的計算復雜度最低,利于硬件實現(xiàn),故選擇 SAD作為匹配準則。令(-p,p)表示搜索范圍,C(a,b)表示當前幀在相對坐標(a,b)位置的像素值,S(a,b)表示參考幀在相對坐標為(a,b)處的像素值,則:

        其中,M×N為子塊大小,(m,n)表示參考塊相對于當前塊的偏移量,SAD(m,n)表示參考塊在偏移量為(m,n)時與當前塊的偏差值。而塊匹配算法的結果為如下運動向量[5]:

        對全搜索塊匹配算法而言,搜索范圍通常只支持到(-16,16)。對于更大的搜索范圍,則適合快速算法實現(xiàn)。本文選擇(-16,16)作為搜索窗大小,搜索塊一共 47×47個像素。

        2 AVS整像素運動估計硬件設計

        2.1 像素截斷

        [2]可知,適當?shù)貙ο袼氐牡臀粩?shù)據(jù)進行截斷,并不影響整個運動估計的結果。本文采用的方法并不是真正截斷數(shù)據(jù),而是利用“與門”將輸入像素的低3位變?yōu)?,以減少運算量,降低功耗。

        2.2 內置SAD加法樹計算陣列

        要實現(xiàn)高性能全搜索可變塊運動估計的硬件結構,需要滿足資源利用率高、PE個數(shù)少、I/O帶寬低等條件。本文采用參考文獻[3]提出的在計算陣列中內置加法樹的方法。計算陣列由 8×8個處理單元(PE)及二維加法樹組成,如圖3所示。采用二維陣列結構提高了硬件資源的利用率;將當前像素儲存在陣列寄存器中,不需要反復讀入當前像素,PE個數(shù)由宏塊大小決定,不隨著搜索窗大小變化而變化;參考像素存儲在移位寄存器組中,每個移位寄存器存儲9個像素值,配合蛇形移動的數(shù)據(jù)傳輸方式,如圖4所示,參考塊數(shù)據(jù)輸入經(jīng)過初始的8個移動周期后,寄存器組中正好存放著一個參考塊的像素值,之后的每次移動,寄存器組中的數(shù)據(jù)只需更新一行新的數(shù)據(jù),而有7行數(shù)據(jù)是與上一個參考塊共享的,這樣能實現(xiàn)列方向100%的數(shù)據(jù)重用率,有效地減少了I/O帶寬。整個設計結構有4個這樣的計算陣列,只需在開始計算時等待25個周期,以后的每個周期計算陣列都將輸出整個8×8塊的SAD值,保證了數(shù)據(jù)讀入過程中的時鐘不被浪費。

        2.3 進位選擇加法器

        通過上文介紹的結構可知,每個計算陣列需要使用大量的加法器。當計算小塊SAD值時,不僅需要得到當前像素和一個參考像素的差的絕對值,而且需要累加整個塊的絕對差值;當計算大塊SAD值時,又需要將小塊SAD值進行累加。大量的加法器嚴重影響計算陣列的面積和處理速度,故本設計對加法器進行了改進。目前已有設計選擇使用超前進位流水線加法器,其處理速度雖然提高了很多,但是大量并行處理占用了比普通加法器更多的資源。由于進位選擇加法器比普通加法器處理速度快,占用的資源比超前進位加法器少,所以本設計選擇進位選擇加法器。

        傳統(tǒng)的進位選擇加法器使用兩個相同的行波法加法器計算高位的值,兩個行波法加法器分別假設進位為0和1并同時進行計算,等待正確的進位到來時,再選擇正確的結果輸出。這樣雖然可以縮短等待時間,但是占用面積較大。本文采用加1電路的選擇進位加法器,如圖5所示。高位加法器以固定進位為0進行計算。若正確進位為0,則加1電路不必進行計算,直接輸出結果;若正確的進位為1,則將此結果加1,得到進位為1的結果。加1電路如圖6所示,其中CS表示低位進位。如此,計算陣列的面積和功耗將會降低很多,處理速度也較快。

        2.4 存儲器設計

        由于當前像素直接存放在陣列寄存器中,所以不需要設計緩沖器??紤]到參考塊一共有47×47個像素,且每個周期需要配合計算陣列蛇形輸入數(shù)據(jù),因此采用片上RAM來緩存參考數(shù)據(jù)。將參考塊分為6個區(qū)域,每個區(qū)域大小為8×47個像素,用RAM0~RAM5來標識,如圖7所示。設計使用雙端口RAM,利用奇偶地址,讓32 bit雙端口RAM相當于64 bit單端口RAM。由于相鄰宏塊的搜索區(qū)域重疊部分占整個搜索塊的三分之二,按照本文的存儲器設計,當進行下一個宏塊的運動估計時,不需要更新整個參考塊的數(shù)據(jù),只需更新其中兩個區(qū)域的數(shù)據(jù)即可,進一步減少了存儲帶寬,提高了數(shù)據(jù)的重用率。

        各處理水稻各部位鎘/砷含量見表3。施加零價鐵未對稻米鎘含量產(chǎn)生明顯影響;施加腐殖質、復合調理劑則明顯地降低了水稻各部位鎘的含量。與對照相比,施加腐殖質和復合調理劑后,早稻稻米鎘含量分別下降14.3%和35.5%;晚稻稻米中鎘含量分別下降33.3%和57.4%,差異顯著(P<0.05)。施加復合調理劑,早稻稻米鎘含量達到食品安全國家標準(GB 2762—2012)。

        3 仿真和結構分析

        本文提出了一種適用于AVS的高性能整像素運動估計硬件設計,使用了Verilog HDL語言進行RTL級描述,用AVS軟件RM52j的 C程序產(chǎn)生測試碼流,應用了Modelsim 6.5c仿真平臺進行了邏輯功能的仿真驗證。采用 Synopsys的 Design Compiler在 SMIC 0.18 μm CMOS 工藝庫下綜合,在最大頻率為250 MHz時,門數(shù)為102 K(未包括存儲器面積)。表1給出了運動估計硬件設計性能分析,這表明本文所設計的結構具有高性能、低帶寬的優(yōu)勢。表2將本文提出的結構與其他幾種運動估計結構進行了比較,其中引用了效率E作為一個重要的比較參數(shù),E為結構每秒處理的搜索點數(shù)和實際面積的比值,具體公式見參考文獻[5]。通過比較可以看出,本設計與參考文獻[5]的設計均可實現(xiàn)對高清圖像的實時處理,但本設計的最快時鐘頻率提升了25%,面積減小了36.2%,效率提高了98%。

        表1 運動估計硬件設計性能分析

        表2 幾種運動估計結構綜合結果比較

        本文針對AVS視頻標準,提出了一種適用于AVS的高性能整像素運動估計硬件設計。采用二維內置SAD加法樹計算陣列,通過合理的安排片上存儲,優(yōu)化了加法器設計,大大提高了結構的性能。實驗結果表明,本設計電路規(guī)模為102 K門,處理一個宏塊只需要1 051個時鐘周期,能夠以2 388.0搜索點數(shù)/秒門的效率對高清圖像進行運動估計。與同類設計相比,本設計具有電路規(guī)模小、處理速度快、I/O帶寬低等優(yōu)勢。另外,本設計還可以作為IP核嵌入到特定的處理器中,對AVS高清視頻進行實時處理。

        參考文獻

        [1]GB/T20090.2-2006.信息技術先進音視頻編碼第二部分:視頻[S].2006.

        [2]He Zhongli,LIOU M I.Reducing hardware complexity of motion estimation algorithms using truncated pixels[C].Proceedings of IEEE International Symposium on Circuits and Systems,1997,4:2809-2812.

        [3]CHEN C Y,CHIEN S Y,HUANG Y W,et al.Analysis and architecture design of variable block-size motion estimation for H.264/AVC[J].IEEE Transactions on Circuits and Systems,2006,53(3):578-593.

        [4]Deng Lei,Xie Xiaodong,Gao Wen.A real-time full architecture for AVS motion estimation[J].IEEE Transactions on Consumer Electronics,2007,53(4):1744-1751.

        [5]Cao Wei,Hou Hui,Tong Jiarong,et al.A high-performance

        reconfigurable VLSI architecture for VBSME in H.264[J].IEEE Transactions on Consumer Electronics,2008,53(4):1338-1345.

        猜你喜歡
        加法器宏塊處理速度
        分段式高性能近似加法器設計
        大數(shù)據(jù)視角下信息管理與信息系統(tǒng)專業(yè)建設分析
        智富時代(2019年2期)2019-04-18 07:44:42
        一種混合結構的新型近似加法器
        通用加法器的邏輯實現(xiàn)與分析
        電子世界(2018年1期)2018-01-26 04:58:08
        三旋光結構一步無進位加法器的設計
        看電視太多 損害認知功能
        老同志之友(2016年5期)2016-05-14 07:10:19
        基于選擇特征宏塊的快速視頻穩(wěn)像
        基于宏塊合并的H.264模式選擇算法
        一種適合硬件實現(xiàn)的低復雜度MAD預測算法
        一種支持H.264與AVS的高效環(huán)路濾波器設計
        電視技術(2011年11期)2011-03-15 01:22:42
        全免费a级毛片| 成人大片免费观看视频| 国产在线第一区二区三区| 熟女精品视频一区二区三区| 狠狠狠色丁香婷婷综合激情| 国产视频精品一区白白色| 男女视频网站在线观看| 男女性杂交内射妇女bbwxz| 老熟妇高潮喷了╳╳╳| 完整在线视频免费黄片| 美腿丝袜在线观看视频| 亚洲乱码日产精品一二三| 久久AV老司机精品网站导航 | 熟女丝袜美腿亚洲一区二区三区| 国产亚洲av成人噜噜噜他| 亚洲色欲色欲www在线观看| 国产精品久久国产精品99gif| 又色又污又爽又黄的网站| 2020亚洲国产| 国产丝袜美腿在线视频| 日本真人做爰免费视频120秒 | 国内精品一区二区2021在线| 中文片内射在线视频播放| 秋霞在线视频| 亚洲中文无码永久免| 日韩人妻无码精品系列专区无遮 | 成年女人18毛片毛片免费| 久久黄色国产精品一区视频| 国产又黄又爽又色的免费| 亚洲VA不卡一区| 国产一区二区资源在线观看| 国产国产人免费人成免费视频| 成年女人永久免费看片| 国产精品视频免费一区二区三区| 在线精品国产亚洲av蜜桃| 国产成人无码精品久久久露脸| 一本色综合亚洲精品蜜桃冫| 亚洲成av人片在线天堂无| 久久精品免费中文字幕| 午夜不卡av免费| 久久无码中文字幕东京热|