亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進的λ 域碼率估計模型

        2024-02-18 05:49:20毛永芹王向文
        現(xiàn)代電子技術(shù) 2024年3期
        關(guān)鍵詞:特征模型

        毛永芹,王向文

        (上海電力大學(xué),上海 201306)

        0 引言

        在視頻編碼的過程中,編碼壓縮后的碼流信息通常會在帶寬有限且不恒定的信道中傳輸[1],為了使編碼后的視頻流更好地在信道中傳輸,避免發(fā)生接收端因為傳輸?shù)乃矔r碼率過大導(dǎo)致接收端的碼流緩沖溢出,或者是傳輸?shù)拇a率過小而導(dǎo)致接收端視頻的播放質(zhì)量不清晰或者模糊等現(xiàn)象。因此,一個準(zhǔn)確的碼率估計模型對于視頻編碼算法的優(yōu)化是至關(guān)重要的。

        碼率控制技術(shù)一直是眾多學(xué)者的研究熱點,為此國內(nèi)外研究者也提出了較多碼率估計模型。準(zhǔn)確的碼率估計模型對碼率控制中的碼率分配起到?jīng)Q定性作用。在視頻編碼中,常見的碼率估計模型主要有R-Q 模型[2]、R-ρ 模型[3]以及R-λ 模型[4]。碼率R由一組編碼參數(shù)共同決定,R-Q 模型和R-ρ 模型都把Q當(dāng)作可以控制R的重要因素,認(rèn)為可以通過調(diào)節(jié)量化參數(shù)Q達到目標(biāo)碼率R。但是隨著編碼參數(shù)的增加,R和Q之間并不是一一對應(yīng)的關(guān)系,所以用R-Q 模型和R-ρ 模型來估計碼率R并不準(zhǔn)確。R-λ 模型是通過建立率失真優(yōu)化模型來得到拉格朗日乘子λ,利用拉格朗日乘子控制目標(biāo)碼率R。該模型相對于R-Q 模型和Q-ρ 模型在編碼性能和編碼精度上都有所提升。文獻[4]算法中R-λ 模型的參數(shù)α和β是利用已經(jīng)編碼的圖像預(yù)測更新的,并沒有考慮到編碼圖像本身的內(nèi)容特征。當(dāng)視頻序列中存在大量的運動時,運動特征對視頻的預(yù)測誤差有很大的影響[5]。而在靜態(tài)或運動較小的區(qū)域,紋理特征對預(yù)測誤差的影響會比較大。算法的原有模型參數(shù)α和β并不能表示當(dāng)前編碼圖片的參數(shù)特征,若傳輸一段具有劇烈運動或具有復(fù)雜場景變化的視頻,將導(dǎo)致碼率估計不準(zhǔn)確。文獻[6]通過預(yù)編碼確定模型的參數(shù)α和β,使得碼率估計模型的精度以及視頻的編碼質(zhì)量提升,但是該算法大大提高了編碼復(fù)雜度,增加了編碼延遲。

        綜上所述,為了解決因視頻序列劇烈運動或者存在復(fù)雜場景變化導(dǎo)致的模型參數(shù)α和β不準(zhǔn)確,從而導(dǎo)致R-λ 預(yù)測模型準(zhǔn)確度不夠的問題,本文提出了一種改進的λ域碼率估計模型,提高碼率估計模型的精度。將R-λ 模型根據(jù)視頻幀所在的預(yù)測層分類為不同的模型,建立模型參數(shù)α和β與圖像運動特征和紋理特征的關(guān)系,最后實驗數(shù)據(jù)驗證模型的精確度,同時將模型應(yīng)用在HM 編碼器中進行實驗。

        1 R-λ 模型參數(shù)α和β 的更新

        在推導(dǎo)R-λ 模型之前,應(yīng)該先選擇合適的R-D 模型,文獻[7]中推導(dǎo)建立了適用于H.265/HEVC 視頻碼率與失真的雙曲模型關(guān)系:

        式中:C和K是與編碼圖像內(nèi)容特征相關(guān)的模型參數(shù);R-D 曲線切線的斜率是拉格朗日乘子λ,因此λ可以表示為:

        由式(2)得:

        在實際的圖像層中,考慮到比特分配得到的目標(biāo)比特RT以及圖像的長度h和圖像的寬度w,可以計算出平均每像素的目標(biāo)比特數(shù)bpp,其值為通過bpp 可以得到當(dāng)前編碼圖像的拉格朗日乘子λ為:

        與此同時,通過大量的實驗表明量化參數(shù)QP 與拉格朗日乘子λ的對數(shù)之間存在一次線性函數(shù)的關(guān)系[8]:

        通過大量的數(shù)據(jù)測試,選擇a=4.200 5,b=13.712 2是相對準(zhǔn)確的。通過式(4)確定編碼單元的拉格朗日乘子λ,通過式(5)確定編碼時的量化參數(shù)QP。

        為了使得碼率控制模型更加準(zhǔn)確,需要對模型參數(shù)α和β進行實時更新,本文主要研究幀級模型參數(shù)的更新。在HM13.0 中基于R-λ 模型碼率控制算法,采用式(6)、式(7)的參數(shù)更新方法。

        式中:αold、βold、λreal分別為編碼單元層確定量化參數(shù)QP時所使用的α、β、λ;bppreal為編碼單元層完成編碼后得到的實際編碼的比特數(shù);δα、δβ分別設(shè)置為0.1 和0.05;αnew、βnew為更新后的模型參數(shù)。實際編碼使用的拉格朗日乘子λ計算公式如式(8)所示[9]:

        式(6)、式(7)對模型參數(shù)的更新過程可以理解為是使用lnλreal-lnλcomp對模型參數(shù)進行校準(zhǔn)。模型參數(shù)α和β只與當(dāng)前編碼圖片的內(nèi)容特征有關(guān)系,盡管使用lnλreal-lnλcomp進行校準(zhǔn)也還會造成模型精度的損失,利用已編碼圖片的參數(shù)α和β并不能完全表示當(dāng)前圖片的參數(shù)特征。文獻[6]通過對編碼單元預(yù)編碼來確定R-λ 的模型參數(shù)α和β,使得碼率控制的模型精度以及編碼質(zhì)量都提升,但是將會增加編碼的復(fù)雜度,同時將會造成編碼的延遲。

        綜上所述,若可以建立當(dāng)前編碼圖片的內(nèi)容特征與模型參數(shù)α和β的關(guān)系,將會使參數(shù)α和β的值更準(zhǔn)確,進而提升R-λ 模型的精度,提高視頻編碼的質(zhì)量。

        2 改進的λ 域碼率估計模型

        2.1 圖像的內(nèi)容特征

        圖像的內(nèi)容特征是指圖像所展現(xiàn)的物體、背景、運動等方面的特征,在視頻編碼中,它對于視頻壓縮的效果有重要影響。視頻編碼算法通過對這些內(nèi)容特征的分析和利用,最終實現(xiàn)了視頻序列的高效編碼和壓縮。

        圖像特征提取是影響模型精度的重要因素,本文主要研究分層編碼結(jié)構(gòu)下的模型參數(shù)α和β的更新。由第1 節(jié)可知,R-λ 的模型參數(shù)α和β與圖片的運動特征和紋理特征有關(guān)。圖像運動特征的提取是通過比較相鄰幀的像素差異,可以得出每個像素在運動過程中的位移和方向,這樣就可以在編碼過程中只保存差異部分。圖像中的紋理信息描述了像素之間的相對關(guān)系。由于視頻運動是連續(xù)的,本文把視頻前一幀與后一幀對應(yīng)像素點之間的方差定義為運動特征,把當(dāng)前圖片像素點之間的方差定義為圖片的紋理特征,具體表達式如下:

        式中:MOTIONcur為當(dāng)前圖片的運動特征;TEXTUREcur為當(dāng)前圖片的紋理特征;Vdiff等于當(dāng)前幀的像素點減去下一幀的對應(yīng)像素點的絕對值;θ是變量;Npixel表示該圖片像素點的個數(shù)。

        2.2 R-λ 模型參數(shù)α、β 的建模

        由2.1 節(jié)的描述可知,圖像的運動特征和紋理特征對視頻壓縮具有重要的影響,對于R=α·λβ預(yù)測模型來說,模型參數(shù)α和β是影響預(yù)測誤差的系數(shù)。在R-λ模型中,運動特征和紋理特征通過α和β參數(shù)來調(diào)節(jié)預(yù)測誤差。本文考慮建立一個基于R-λ 模型參數(shù)α和β的模型,將參數(shù)α和β建模為圖像運動特征和紋理特征的函數(shù),該模型用于計算視頻編碼時R-λ 模型所需要的參數(shù),根據(jù)本文提出的參數(shù)α和β與圖像運動特征和紋理特征的模型,最終使R-λ 模型更加準(zhǔn)確,提高了視頻編碼的率失真性能。

        在HEVC中,存在兩種非常典型的編碼結(jié)構(gòu),它們的引用關(guān)系非常靈活,一個定義于圖1 所示的低延遲(LD)編碼結(jié)構(gòu)[10],另一個定義于圖2 所示的隨機接入(RA)編碼結(jié)構(gòu)[11]。

        圖1 HEVC 中低延遲(LD)編碼結(jié)構(gòu)

        圖2 HEVC 中隨機接入(RA)編碼結(jié)構(gòu)

        圖1 和圖2 顯示的LD 和RA 配置是早 于HM16.11 的HEVC 參考編碼器的默認(rèn)分層預(yù)測結(jié)構(gòu)。以LD 編碼結(jié)構(gòu)為例,LD 編碼有三種不同的層次,如圖1 所示。直觀地看,圖f4n屬于零層,圖f4n+2屬于一層,圖f4n+1和f4n+3屬于第二層。RA 編碼結(jié)構(gòu)類似,分為4 個層次,如圖2所示。在HM16.11 之后,RA 編碼結(jié)構(gòu)的GOP=16,并且分為5 個不同的層次。從這兩種編碼結(jié)構(gòu)中可以看出,同一個層次視頻序列之間的聯(lián)系相對于不同層次視頻序列之間聯(lián)系更加緊密,由此可以判斷出R-λ 模型中屬于同一層次視頻序列的參數(shù)α和β具有相似的變化規(guī)律。因此,本文根據(jù)使用的編碼結(jié)構(gòu),將視頻序列按照視頻幀所在的預(yù)測層分為不同的模型,則不同層之間的R-λ 模型為:

        式中:Rk、λk、αk和βk分別為第k層的實際編碼比特R、第k層的拉格朗日乘子λ、第k層的模型參數(shù)α和β。

        結(jié)合2.1 節(jié)利用公式得到每個編碼序列的運動特征和紋理特征的值。從實驗中觀察出,同一層次的模型參數(shù)α和β可以分別通過以下模型來計算:

        式中:αk和βk分別表示第k層參數(shù)α和第k層參數(shù)β;γk表示第k層的α和β的模型參數(shù);MOTIONk和TEXTUREk分別表示第k層編碼序列運動特征和紋理特征的值。

        將JCTVC 提供的視頻序列classD 作為測試序列。對同一個序列使用8 個不同的量化參數(shù)QP 編碼,編碼的每一幀圖片有不同的實際編碼比特R和拉格朗日乘子λ,根據(jù)R-λ 模型,使用編碼出的每一幀圖片的比特R和拉格朗日乘子λ擬合出參數(shù)α和β的準(zhǔn)確值,將準(zhǔn)確值與使用式(13)和式(14)的模型計算出的α和β對比,判斷所建關(guān)系的合理性。

        使用R2表示模型的估計誤差,R2是用于測量給定模型數(shù)據(jù)變化程度的量[12],其定義為:

        式中:Xi和分別為數(shù)據(jù)點的實際值和估計值為數(shù)據(jù)點的平均值,使用模型獲得估計值。對于任何合理的模型,期望式(15)右側(cè)的估計值小于1,因此R2取0~1之間的值。R2的值越接近1,模型越好。如表1 所示,所有的測試序列的R2都大約等于0.99,說明提出的模型能夠很好地表示參數(shù)α和β與圖像內(nèi)容特征的關(guān)系。α和β模型的準(zhǔn)確度如表1 所示。

        表1 α和β 模型的準(zhǔn)確度(R2)

        3 實驗結(jié)果

        為了驗證本文所提改進的λ域碼率估計模型的準(zhǔn)確性,將改進的λ域碼率估計模型集成到HEVC 參考軟件HM-16.20 的碼率控制算法中,并與HM-16.20 本身的碼率控制算法進行對比,JCTVC-K1003 中提出的碼率估計模型已經(jīng)集成到了HEVC 參考軟件中,所以在本文的比較實驗中,共有兩種碼率估計模型。

        1)JCTVC-K1003。JCTVC-K1003 中提出的碼率估計模型應(yīng)用在HM-16.20 的碼率控制算法中。

        2)PicAdaRateEst。本文提出的改進λ域碼率估計模型應(yīng)用在HM-16.20 的碼率控制算法中。

        實驗使用的序列來自JCTVC 提供的視頻序列[13]classD,包括 BasketballPass、BlowingBubbles、BQSquare 以及RaceHorses,并且這4 個序列的分辨率均為416×240,其中BasketballPass 和BlowingBubbles 的幀率為50 f/s,BQSquare 為60 f/s,RaceHorses 為30 f/s。基于HEVC 通用測試條件下的LD(Low Delay,低延遲)配置編碼環(huán)境。按照視頻幀所在的預(yù)測層將視頻序列分為三層。實驗中使用的目標(biāo)碼率為HEVC 通用測試條件生成Anchor 碼流的碼率,使用LD 配置下的分層編碼結(jié)構(gòu)進行測試。實驗主要從改進的R-λ模型的碼率相對誤差以及亮度峰值信噪比(PSNR)兩方面進行評估和分析。對比JCTVC-K1003中碼率估計方法和本文改進的λ域碼率估計方法的模型精確度以及編碼的性能。

        使用碼率相對誤差[14]Rerr描述R-λ 模型的精確度,它的計算公式為:

        式中:Rtar和Ract分別表示目標(biāo)碼率和實際編碼的碼率;Rerr越小表示碼率估計的模型越準(zhǔn)確。

        使用編碼輸出的峰值信噪比[15]描述本文所提方法的編碼性能,編碼輸出的峰值信噪比客觀反映了編碼后重建視頻質(zhì)量的好壞問題,編碼輸出峰值信噪比越高,編碼后重建視頻質(zhì)量就越好。

        表2列出了不同測試序列在4個目標(biāo)碼率下JCTVCK1003 和PicAdaRateEst 兩種碼率估計方法準(zhǔn)確度和性能測試的結(jié)果。從表中可以看出,JCTVC-K1003 標(biāo)準(zhǔn)的平均Y-PSNR 為34.35 dB,本文所提碼率估計方法的平均Y-PSNR 為34.50 dB,本文提出的方法相對于JCTVCK1003 標(biāo)準(zhǔn)的Y-PSNR 提高了0.15 dB。JCTVC-K1003碼率估計模型的相對誤差平均為0.718%,本文提出的方法平均為0.068%,本文提出的方法相對于JCTVCK1003 碼率估計模型的平均誤碼率下降了0.65%。

        表2 兩種碼率估計方法的準(zhǔn)確度和性能比較

        4 結(jié)語

        一個準(zhǔn)確的R-λ 模型對于視頻編碼的優(yōu)化是至關(guān)重要的,直接影響到編碼的性能以及視頻編碼的質(zhì)量。本文基于R-λ 模型,將其參數(shù)α和β建立為圖像運動特征和紋理特征的模型,避免了因編碼序列劇烈運動或發(fā)生場景變化而導(dǎo)致的模型不準(zhǔn)確的問題,使R-λ 模型具有圖像自適應(yīng)性。實驗結(jié)果表明,該方法與JCTVCK1003 標(biāo)準(zhǔn)中碼率估計的方法相比,相同條件下平均碼率誤差下降了0.65%,平均亮度峰值信噪比增益提高了0.15 dB。該改進算法能夠提高視頻傳輸?shù)馁|(zhì)量和碼率穩(wěn)定性,在實際應(yīng)用中具有一定的潛力和價值。

        猜你喜歡
        特征模型
        一半模型
        抓住特征巧觀察
        重要模型『一線三等角』
        新型冠狀病毒及其流行病學(xué)特征認(rèn)識
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        如何表達“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        提供最新的在線欧美综合一区| 免费a级毛片在线播放| 又色又爽又高潮免费视频国产| 曰本女人牲交全视频免费播放| av无码一区二区三| 久久精品亚洲一区二区三区画质| 欧美人与善在线com| 精品亚洲成a人在线观看青青| 在线免费欧美| 白白色发布视频在线播放| 无码熟妇人妻av在线网站| 色欲人妻综合网| 日韩精品国产自在欧美| 久久精品伊人久久精品| 国产爆乳美女娇喘呻吟| 国产69精品久久久久9999| 日本中文字幕一区二区高清在线 | 亚洲精品一区网站在线观看| 日本一区二区三区一级片| 99在线精品免费视频| 国产精品久久久久国产a级| 国产丰满乱子伦无码专| 夜夜高潮夜夜爽免费观看| 欧美老熟妇喷水| 欧美在线播放一区二区| 亚洲av第二区国产精品| 人人妻人人添人人爽欧美一区| 色婷婷久久一区二区三区麻豆| 日本中文字幕一区二区高清在线 | 亚洲人成色777777老人头| 亚洲嫩草影院久久精品| 日本视频在线播放一区二区| 宅男666在线永久免费观看 | 国产二区交换配乱婬| 天天天综合网| 亚洲国产免费一区二区| 无遮挡1000部拍拍拍免费| 欧美成a人片在线观看久| 视频二区 无码中出| 一本之道久久一区二区三区| 中国人妻被两个老外三p|