劉 侃
[摘要]H.264編碼多應(yīng)用于移動(dòng)設(shè)備以及移動(dòng)設(shè)備要求低分辨率視頻的特性,要求在MPEG2向H.264轉(zhuǎn)碼的過程中,在保持高效率的同時(shí)對視頻降低分辨率。在MPEG2到H.264的轉(zhuǎn)碼過程進(jìn)行分析基礎(chǔ)上,提出一種可以降低視頻分辨率的快速轉(zhuǎn)碼算法。通過利用決策樹僅對一個(gè)視頻塊進(jìn)行運(yùn)動(dòng)估計(jì)的方法,提高降低分辨率后轉(zhuǎn)碼的效率。能夠在大幅度降低計(jì)算復(fù)雜度的同時(shí),實(shí)現(xiàn)從MPEG2到H.264的降低分辨率轉(zhuǎn)換。實(shí)驗(yàn)結(jié)果表明,在基本保持圖像質(zhì)量的基礎(chǔ)上,轉(zhuǎn)碼的時(shí)間縮短近60%。
[關(guān)鍵詞]MPEG-2H.264轉(zhuǎn)碼分辨率機(jī)器學(xué)習(xí)決策樹
中圖分類號:P391.41文獻(xiàn)標(biāo)識碼:A文章編號:1671-7597(2009)1210075-01
一、引言
H.264編解碼標(biāo)準(zhǔn)在MPEG-2標(biāo)準(zhǔn)基礎(chǔ)上,除了應(yīng)用在像DVD和數(shù)字電視這樣對視頻質(zhì)量要求較高和有較高比特率的領(lǐng)域,同時(shí)也越來越多的應(yīng)用在需要低比特率和低分辨率的移動(dòng)設(shè)備的視頻處理。然而,這樣多領(lǐng)域的應(yīng)用導(dǎo)致同樣編碼的視頻無法在所有平臺上使用,為了能夠兼容移動(dòng)終端的應(yīng)用,視頻必須在低比特率以及低分辨率的條件下編碼。由于應(yīng)用設(shè)備的多樣性以及這些設(shè)備不同的硬件條件,不可能對視頻進(jìn)行預(yù)編碼以應(yīng)用于所有這些設(shè)備。所以為了使這些設(shè)備硬件得到最大利用以及為每一種應(yīng)用輸出適合的視頻碼流,視頻的轉(zhuǎn)碼就成為必要。
本文提出了一種通過應(yīng)用機(jī)器學(xué)習(xí)的方法從而在對MPEG2向H.264轉(zhuǎn)碼的同時(shí)降低分辨率的快速轉(zhuǎn)碼算法。
二、轉(zhuǎn)碼實(shí)現(xiàn)
(一)降低空間分辨率
空間分辨率減少轉(zhuǎn)碼的關(guān)鍵問題是H.264宏塊模式選擇的確定。有別于以前需要評估所有的宏塊選擇方式然后從中選出最優(yōu)的方式,本文提出的算法能夠直接確定宏塊模式。雖然可以降低到任意分辨率,但是以2為因子的降低即降低一半分辨率能使宏塊選擇的信息得到最充分最有效率的應(yīng)用。下文討論了在水平和垂直方向縮小一半分辨率的方法。輸入域里的四個(gè)宏塊對應(yīng)到了輸出域的一個(gè)宏塊。分辨率降低時(shí)的編碼模式可以利用MPEG-2里的所有宏塊信息確定。為了降低分辨率,需要通過之前MPEG-2編碼中的四個(gè)宏塊來確定轉(zhuǎn)碼后的H.264的一個(gè)宏塊。
降低視頻分辨率時(shí)的宏塊模式選擇能通過兩種方式確定:1.利用4個(gè)MPEG-2的宏塊來確定一個(gè)H.264的宏塊模式;2.為每一個(gè)MPEG-2宏塊確定一個(gè)對應(yīng)的H.264宏塊,然后再用這四個(gè)H.264宏塊確定一個(gè)H.264宏塊。前一種方法被稱為輸入域的模式減少轉(zhuǎn)碼,后一種稱為輸出域的模式減少轉(zhuǎn)碼。本文主要在輸入域的轉(zhuǎn)碼上進(jìn)行討論。
(二)輸入域的模式減少轉(zhuǎn)碼
輸入的MPEG-2視頻被解碼并且其中的宏塊信息被記錄下來,然后H.264的編碼過程就可以利用這些信息得到加速和效率的提升。這種方法的關(guān)鍵思想就是減少四個(gè)MPEG-2宏塊中的信息來得到一個(gè)同等的并且是縮小分辨率的H.264宏塊,然后通過減少的輸入信息來快速確定H.264編碼時(shí)的宏塊模式選擇。一系列的信息在解碼時(shí)被記錄下來,這些信息有:宏塊編碼模式、編碼塊類型(CBPC)、宏塊殘差的均值和方差(以4x4的子宏塊分別計(jì)算,共16個(gè)均值和方差)。這些保存下來的信息會(huì)被一種機(jī)器學(xué)習(xí)的方法讀入并且建立起一棵H.264宏塊選擇的決策樹。
決策樹通過分析一系列樣本數(shù)據(jù)生成樹枝和節(jié)點(diǎn)。節(jié)點(diǎn)表示變量,而樹枝表示可能的變量值。當(dāng)決策樹不止一層時(shí),節(jié)點(diǎn)就代表基于不同變量所做出的決策。在數(shù)據(jù)分類過程中,節(jié)點(diǎn)表示分類,樹枝表示判別分類的特征依據(jù)。通過決策樹,可以將輸入的樣本分為其中的一類。訓(xùn)練集由高碼率的MPEG-2序列組成,不包括B幀。決策集由MPEG-2碼流解碼后,H.264重新編碼得到。在H.264編碼過程中,量化參數(shù)為25,使用RD優(yōu)化得到宏塊編碼模式。大量實(shí)驗(yàn)表明,一個(gè)好的訓(xùn)練集的圖像區(qū)域從平坦到高細(xì)節(jié)都有分布,較好的樣本序列如花或乒乓球。最終的目標(biāo)就是生成單一決策樹,可以對任何MPEG-2視頻轉(zhuǎn)碼。
圖1就是一棵利用機(jī)器學(xué)習(xí)建立起來的H.264宏塊模式選擇的決策樹,如圖所示,通過決策樹,H.264的宏塊模式可以通過一些簡單的if-else語句很快的計(jì)算出來,這樣可以極大的減少編碼的時(shí)間。
圖1H.264模式選擇決策樹
三、實(shí)驗(yàn)結(jié)果和分析
論文以DELL 8核服務(wù)器為測試平臺,對標(biāo)準(zhǔn)的測試序列進(jìn)行了轉(zhuǎn)碼。測試序列參數(shù):分辨率704x576,碼率8lVlb/s,幀率25,轉(zhuǎn)碼前后保持參數(shù)不變。
利用本文提出算法的轉(zhuǎn)碼器與參考轉(zhuǎn)碼器的比較,在轉(zhuǎn)碼質(zhì)量沒有明顯降低的情況下,比特率和所用時(shí)間都得到下降。
四、結(jié)論
本文針對目前轉(zhuǎn)碼器的不足,提出一種降低分辨率的MPEG2到H.264的快速轉(zhuǎn)碼算法,利用MPEG-2解碼得到的運(yùn)動(dòng)補(bǔ)償殘差、MB模式、編碼塊模式(CBPC)直接映射成H.264的宏塊模式,大大降低了轉(zhuǎn)碼復(fù)雜度,同時(shí)保證了轉(zhuǎn)碼的靈活性。從實(shí)驗(yàn)結(jié)果可以看出本文算法相對傳統(tǒng)轉(zhuǎn)碼算法效率大大提高,而轉(zhuǎn)碼后圖像質(zhì)量幾乎沒有下降,為轉(zhuǎn)碼工作提供了一種新的思路。
參考文獻(xiàn):
[1](美)T.D.Nguyen等,高效的MPEG-4 to H.264/AVC轉(zhuǎn)碼[J].ETRI Journal,Volume 29,Number 6,December 2007,pp.826-828.
[2](美)A.Vetro等,空間降低分辨率的轉(zhuǎn)碼器復(fù)雜度分析[J].IEEE Tra
nsactions on Consumer Electronics,Vol.48,Issue 3,Aug 2002,pp.515- 521.
[3]陳春雁、王繼成,H.264中基于多分辨率高效幀間預(yù)測算法[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(1):83-85.
[4]孟慶磊、姚春蓮、宋建斌等,一種面向H.264/AVC的快速幀內(nèi)預(yù)測選擇算法[J].北京航空航天大學(xué)學(xué)報(bào),2007,33(2).
[5]陳功、黃祥林、沈蘭蓀,MPEG-2與MPEG-4問轉(zhuǎn)碼的關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[J].電路與系統(tǒng)學(xué)報(bào),2005,10(2):22-26.