亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于眾核平臺的多路超高清視頻編碼系統(tǒng)設(shè)計(jì)

        2016-06-29 01:25:34高志勇張小云
        電視技術(shù) 2016年4期

        姚 佳,高志勇,張小云

        (上海交通大學(xué) 圖像通信與網(wǎng)絡(luò)工程研究所, 上海 200240)

        基于眾核平臺的多路超高清視頻編碼系統(tǒng)設(shè)計(jì)

        姚佳,高志勇,張小云

        (上海交通大學(xué) 圖像通信與網(wǎng)絡(luò)工程研究所, 上海 200240)

        摘要:首次展示一套基于低功耗眾核TILE-36處理器平臺的多路超高清實(shí)時系統(tǒng)。該系統(tǒng)可以同時編碼4路HEVC超高清視頻,并經(jīng)過TS復(fù)用后以常碼率的形式發(fā)送到解碼端。為了保證編碼系統(tǒng)穩(wěn)定運(yùn)行,采取了基于非線性R-Q模型的閉環(huán)碼率控制來調(diào)整編碼器的輸出碼率,同時引入緩存控制機(jī)制來確保系統(tǒng)總延時恒定,最后加入了基于幀數(shù)統(tǒng)計(jì)的時鐘同步機(jī)制來同步系統(tǒng)中各模塊的時鐘。實(shí)驗(yàn)顯示該系統(tǒng)能夠長時間穩(wěn)定運(yùn)行,并具有同時編碼4路HEVC超高清視頻的能力。

        關(guān)鍵詞:多路超高清;眾核;碼率控制;實(shí)時系統(tǒng)

        為了滿足用戶對更高質(zhì)量的視頻服務(wù)的需求,設(shè)備制造商對視頻采集設(shè)備和播放設(shè)備的性能進(jìn)行了大幅提升。然而當(dāng)今主流的視頻編碼器H.264并不能高效地對超高清視頻進(jìn)行壓縮。視頻編碼聯(lián)合組制定了新一代的視頻壓縮標(biāo)準(zhǔn)HEVC。相比于H.264/AVC和HEVC在相同的視頻質(zhì)量下可以大大提高視頻的壓縮率,但實(shí)現(xiàn)復(fù)雜度更高[1]。

        HEVC繼承了H.264/AVC基于塊的混合編碼架構(gòu),并引入了更加靈活的編碼樹塊,自適應(yīng)樣點(diǎn)補(bǔ)償以及Tile等新特征。在這些新特征中更加靈活的編碼樹塊對HEVC編碼性能提升最大,但這也引入了更多的運(yùn)算復(fù)雜度,從而限制了HEVC編碼器在實(shí)時系統(tǒng)中的應(yīng)用。眾核處理器在一個處理器中集成了幾十甚至上百個完整的可獨(dú)立運(yùn)行程序指令的處理內(nèi)核,其并行計(jì)算能力相比單核處理器有大幅提升。眾核處理器為HEVC并行編碼器提供了一個很好的實(shí)現(xiàn)平臺。

        本文在實(shí)現(xiàn)多路超高清HEVC視頻實(shí)時編碼系統(tǒng)過程中,主要解決了幾個關(guān)鍵問題。首先,由于更復(fù)雜的幀間編碼,HEVC編碼器的輸出碼率相比于上一代標(biāo)準(zhǔn)H.264波動更大。而多路碼流復(fù)用后輸出碼率的疊加會使碼率波動加劇。針對這一問題,本文提出了一種閉環(huán)碼率控制算法,實(shí)現(xiàn)了編碼器的恒定碼率輸出。

        其次是系統(tǒng)的端到端延時的問題。端到端延時是直播應(yīng)用中影響消費(fèi)者觀看體驗(yàn)的一個關(guān)鍵因素。

        閉環(huán)碼率控制中引入的緩沖器會增加系統(tǒng)總延時。為了降低總延時,需要盡量減小編碼器輸出緩沖器的大小。這需要對編碼器的碼率控制進(jìn)行優(yōu)化,盡量降低編碼器輸出碼率的波動幅度,從而減小緩沖器的大小。

        最后是系統(tǒng)中各個模塊時鐘同步的問題。本文提出的多路超高清實(shí)時系統(tǒng)由3個模塊構(gòu)成,包括視頻源、編碼器和解碼器。每個模塊有獨(dú)立的本地時鐘。各個模塊之間本地時鐘誤差的累積會造成總延時的偏移,從而影響到系統(tǒng)的穩(wěn)定運(yùn)行。MPEG2-TS標(biāo)準(zhǔn)規(guī)定編碼器必須周期性地發(fā)送本地的節(jié)目時鐘參考(PCR)[2]到解碼端,用來同步編碼端和解碼端的時鐘。在此基礎(chǔ)上,本文提出一種時鐘同步機(jī)制來同步視頻源和解碼器的本地時鐘。

        1實(shí)時系統(tǒng)架構(gòu)

        本文基于Tilera公司提供的搭載有4片眾核處理器TILE-Gx36[3]的低功耗平臺,實(shí)現(xiàn)了多路超高清視頻實(shí)時編碼系統(tǒng)。該平臺配備帶HDMI輸入的FPGA視頻采集卡,用于實(shí)時視頻的采集。每片TILE-Gx36處理器上集成了36個獨(dú)立的核,單核頻率可達(dá)1.2 GHz。每片TILE-Gx36處理器負(fù)責(zé)編碼一路超高清視頻。為了實(shí)現(xiàn)各個處理器之間高效安全可靠的數(shù)據(jù)傳輸,TILE-Gx36集成了高性能眾核可編程智能包引擎(mPIPE)模塊。

        整個系統(tǒng)架構(gòu)如圖1所示。4路視頻輸入源為1路4K超高清攝像機(jī)和3路超高清播放器。首先,F(xiàn)PGA采集卡對輸入的原始視頻進(jìn)行預(yù)處理并轉(zhuǎn)儲至DDR3內(nèi)存中。隨后,運(yùn)行在4片TILE-Gx36處理器的4個HEVC編碼器J265分別對內(nèi)存中的4路視頻序列進(jìn)行編碼。然后,編碼器1,2,3通過mPIPE輸出3路TS流到編碼器4。最后,4路TS流打包復(fù)用成1路TS流,并通過編碼器4的發(fā)送線程,以RTP流方式發(fā)送到解碼端。解碼端通過4個解碼器同時解碼4路超高清碼流并顯示。圖2展示了1個編碼器中主要的線程分配。

        圖1 多路超高清系統(tǒng)框圖

        圖2 線程分配框架

        每片TILE-Gx36處理器中的兩個核分別綁定到采集線程和發(fā)送線程。采集線程負(fù)責(zé)獲取4K 原始視頻序列并將原始序列轉(zhuǎn)存到在內(nèi)存里開辟的緩沖器中。剩下的34個核用來進(jìn)行HEVC并行編碼,其中每個核負(fù)責(zé)編碼一個Tile。當(dāng)一幀圖像的所有Tile都編碼完成后,編碼器將該幀圖像以ES流的形式輸出到編碼器的碼流緩沖器 (ES buffer) 中。編碼開始后,發(fā)送線程開始從ES buffer中讀出數(shù)據(jù)并完成打包發(fā)送工作。該系統(tǒng)中,編碼器輸出碼率不穩(wěn)以及各模塊時鐘不同步等問題會導(dǎo)致ES buffer上下溢的現(xiàn)象,相應(yīng)的解決方案在下文詳細(xì)描述。

        2關(guān)鍵機(jī)制

        2.1碼率控制

        該實(shí)時系統(tǒng)的碼率控制需要實(shí)現(xiàn)兩個目標(biāo),一是控制編碼器的輸出碼率,保證輸出緩沖器不發(fā)生上下溢;二是在此基礎(chǔ)上盡量不損失視頻質(zhì)量。本文采用的碼率控制算法在緩存控制的配合下使編碼器達(dá)到設(shè)定的輸出碼率,畫面質(zhì)量良好,其流程圖如圖3所示。

        圖3 碼率控制流程圖

        在編碼一幀原始圖像之前需要對其進(jìn)行場景檢測。當(dāng)檢測到某一幀圖像為場景切換幀時,對其采用幀內(nèi)編碼。由于一個GOP中幀內(nèi)編碼幀(I幀)的復(fù)雜度無法確定,所以每個I幀的量化參數(shù)是由之前每個I幀的QP取平均得到。幀間編碼幀(P幀)以及P幀中Tile的量化參數(shù)(QP)由非線性R-Q模型[4]計(jì)算得到。R-Q模型是基于模糊復(fù)雜度來實(shí)現(xiàn)的,根據(jù)總的模糊復(fù)雜度與總的目標(biāo)比特來計(jì)算P幀的QP,計(jì)算公式如下

        (1)

        式中:qscale基于模糊復(fù)雜度得到,在一定程度上可以反應(yīng)編碼單元編碼后的比特?cái)?shù)。P幀以及每幀的各Tile的QP通過式(1)得到。qscale的計(jì)算過程為

        (2)

        cplxrSumi=cplxrSumi-1+tilebit

        式中:cplxrSumi表示第i個編碼單元的預(yù)測復(fù)雜度。對于人眼不敏感的高細(xì)節(jié)復(fù)雜度或者高運(yùn)動場景,可以增加QP而不會損失太多的視覺質(zhì)量。因此,對于cplxrSum越大的編碼單元,經(jīng)計(jì)算得到的QP也越大,編碼后生成的比特?cái)?shù)相應(yīng)也越少,反之亦然。wantedBitsi是累計(jì)的總目標(biāo)比特?cái)?shù),qscaleinit為根據(jù)經(jīng)驗(yàn)得到的一個初始值。tilebit為編碼一個tile的實(shí)際比特?cái)?shù),cplxrSumi-1為前一個編碼單元的復(fù)雜度。tile_num為一幀劃分的tile個數(shù),wantedBitsi-1為前面所有編碼單元的預(yù)測復(fù)雜度,framerate為編碼幀率,Bitrate為設(shè)定的編碼器輸出碼率??紤]到圖像質(zhì)量的平滑,一幀圖像中每個Tile的QP必須限制在[frame_QP-2,frame_QP+2]之間。為了保證畫面質(zhì)量的連續(xù)性[5],相鄰兩幀圖像之間的QP差值限制在[-2,2]區(qū)間內(nèi)。

        本文根據(jù)已編碼比特和緩沖區(qū)狀態(tài)動態(tài)的調(diào)整碼率控制中求得的QP值,實(shí)現(xiàn)了閉環(huán)碼率控制。作為閉環(huán)碼率的一部分,本文在緩存控制中設(shè)置了兩個上溢閾值overflow1和overflow2以及下溢閾值underflow來協(xié)助碼率控制,如圖4所示。

        圖4 編碼器輸出緩沖器功能框圖

        當(dāng)ES buffer的占有量達(dá)到overflow2時,編碼單元QP加2。當(dāng)ES buffer的占有量上升到overflow1時,編碼單元的QP加3,從而減小編碼器的輸出比特?cái)?shù)。設(shè)置兩個上溢閾值是為了防止ES buffer的緩存出現(xiàn)較大波動,引起圖像QP波動,從而導(dǎo)致視頻質(zhì)量不穩(wěn)定。ES buffer的占有量降低到underflow時,QP減2。當(dāng)ES buffer出現(xiàn)下溢的時候,通過插入TS填充包來保證ES buffer的輸出碼率恒定。

        2.2延時控制

        在不考慮編碼和解碼時間的前提下,常碼率系統(tǒng)的端到端延時主要是由編碼器輸出緩沖器和解碼緩沖器帶來的。常碼率系統(tǒng)的初始延時delay為

        delay=ES_init_delay+DTS0-PCR0

        (3)

        式中:ES_init_delay為設(shè)定的ES buffer的初始緩存時間;DTS為一幀圖像的解碼時間戳,用來指示解碼器在規(guī)定的時刻解碼該幀;PCR為每路節(jié)目的節(jié)目時鐘參考,用來將解碼器的本地時鐘同步到編碼器的本地時鐘[2];DTS0為視頻流中第一幀的解碼時間戳;PCR0為發(fā)送給解碼器的第一個PCR。因?yàn)镻CR0將解碼器的本地時鐘校正到PCR0,而DTS0指定解碼器要等到DTS0時刻才能開始解碼第一幀,所以當(dāng)二者同時到達(dá)解碼器時,二者的差值代表了解碼緩沖器的初始緩存量。當(dāng)某一幀的DTS小于當(dāng)前解碼器的系統(tǒng)時間時,解碼器會丟棄該幀。此時由于沒有可供解碼的圖像,解碼緩存器處于下溢狀態(tài)。

        實(shí)時系統(tǒng)端到端的總延時計(jì)算如下

        (4)

        式中:ES_occupancy為當(dāng)前編碼器輸出緩沖器中緩存的數(shù)據(jù)量。DTS-PCR表示當(dāng)前幀在解碼緩沖器中需要等待的時間,即解碼緩沖器的緩存大小。當(dāng)實(shí)時系統(tǒng)運(yùn)行過程中延時恒定時,式(6)中的delay等于式(5)的delay,即系統(tǒng)總延時始終等于初始延時。同時為了防止解碼緩沖器出現(xiàn)下溢,PCR須小于DTS,故由式(6)可知

        ES_occupancy≤delay×bitrate

        (5)

        在保證ES buffer不出現(xiàn)上溢的前提下,只要滿足式(8),式(7)則一定成立

        ES_buffer_size=bitrate×delay

        (6)

        將式(8)代入式(6)可以得到

        ES_buffer_size=ES_occupancy+(DTS-PCR)×

        bitrate

        (7)

        由式(5)和(9)可知,當(dāng)設(shè)置ES_init_delay與(DTS0-PCR0)×bitrate之和等于ES buffer的大小時,系統(tǒng)運(yùn)行過程中只要保證ES buffer不發(fā)生上溢,解碼緩沖器就不會發(fā)生下溢。因此兩個buffer的緩存量之和始終等于ES buffer的大小,實(shí)時系統(tǒng)運(yùn)行過程中可以保持延時恒定。

        由式(8)可知,減小ES buffer的大小是降低系統(tǒng)端到端延時的關(guān)鍵。故本文采取閉環(huán)碼率控制方案,通過向碼率控制實(shí)時反饋ES buffer的緩存量來達(dá)到減小輸出碼率波動的目的,從而使ES buffer盡可能小,系統(tǒng)延時也更低。

        2.3系統(tǒng)時鐘同步

        假設(shè)視頻源的輸出幀率為F。編碼器按照本地時鐘接收到的實(shí)際幀率F′可以表示為

        (8)

        式中:camera_clock和encoder_clock分別代表攝像機(jī)(視頻源)和編碼器的本地時鐘頻率;F為攝像機(jī)的輸出幀率即編碼器默認(rèn)的視頻幀率。由式(10)可知,camera_clock低于encoder_clock會導(dǎo)致F′高于F。比如視頻源的輸出幀率為30 f/s(幀/秒),但由于時鐘頻率的差異,編碼器實(shí)際接收到的幀率為30.03 f/s。此時因?yàn)榇a率控制中每幀圖像的目標(biāo)比特?cái)?shù)等于目標(biāo)碼率除以幀率F,所以每幀圖像編碼出來的實(shí)際比特?cái)?shù)偏大,從而導(dǎo)致編碼器的實(shí)際輸出碼率始終高于目標(biāo)碼率。這樣會使ES buffer一直處于上溢狀態(tài)。在這種情況下,閉環(huán)碼率控制會調(diào)整編碼圖像的QP,使其一直處于最大值,圖像質(zhì)量因此不斷惡化。

        為了同步編碼器和視頻源的時鐘,需要得到二者之間的比例關(guān)系。本文通過統(tǒng)計(jì)編碼器每接收100×F幀的時間作為視頻源的一百秒,得到二者時鐘之間的差值,見步驟1)和步驟2),然后利用這個統(tǒng)計(jì)時間調(diào)整PCR,從而使解碼器的時鐘同步到視頻源上。相應(yīng)的PCR校正機(jī)制如下:

        1)編碼器連續(xù)獲取100×F幀圖像,統(tǒng)計(jì)編碼器該時段的系統(tǒng)時間t。

        2)計(jì)算Δt=|t-100|,Δt大于PCR校正閾值轉(zhuǎn)到步驟3),小于則轉(zhuǎn)到步驟4)。

        3)PCR的校正值PCR_adjust_step=Δt/(20×count)。其中count為發(fā)送線程每秒的發(fā)送PCR次數(shù)。每100 s累積的誤差在后續(xù)20 s內(nèi)校正,所以再除以20。然后轉(zhuǎn)至步驟1。

        4)將Δt累加到下100 s的Δt中,然后轉(zhuǎn)至步驟1)。

        因?yàn)榫幋a器的輸出碼率等于數(shù)據(jù)流中相鄰兩個PCR之間的比特?cái)?shù)除以兩個PCR的差值,所以為了匹配編碼器實(shí)際的輸出速率,輸出緩沖器每次輸出的數(shù)據(jù)量也要根據(jù)PCR的調(diào)整幅度作相應(yīng)的調(diào)整。ES buffer每次輸出的數(shù)據(jù)長度應(yīng)為

        (9)

        實(shí)驗(yàn)結(jié)果證明該時鐘同步方案能有效防止編碼器輸出緩沖器的上下溢從而使系統(tǒng)穩(wěn)定運(yùn)行。

        3實(shí)驗(yàn)結(jié)果

        3.1實(shí)驗(yàn)條件

        視頻源為1臺4K超高清攝像機(jī)和1臺多路超高清播放器,通過4根HDMI1.4線連接到眾核平臺上。每路編碼器的配置參數(shù)如表1所示。

        表1單路編碼器配置參數(shù)

        參數(shù)參數(shù)值或說明比特率/(Mbit·s-1)6幀率/(f·s-1)15GOP結(jié)構(gòu)IPPPESBuffer初始緩存/Mbit3DTS-PCR初始值/s0.5ESBuffer大小/Mbit6

        3.2實(shí)驗(yàn)結(jié)果

        解碼器能夠?qū)崟r播放四路超高清節(jié)目,播放過程中沒有發(fā)生卡頓或者卡死的現(xiàn)象,圖像質(zhì)量良好。實(shí)驗(yàn)結(jié)果顯示單路節(jié)目的端到端延時約為1~2 s,4路節(jié)目總的輸出碼率為24 Mbit/s,同時本文提出的碼率控制和時鐘同步機(jī)制能有效避免ES buffer發(fā)生上下溢。整個系統(tǒng)能夠長時間穩(wěn)定運(yùn)行。

        圖5為演示實(shí)物圖。其中1臺4K攝像機(jī)和1臺多路超高清視頻碼流儀作為眾核TILE-Gx36處理器平臺的輸入。眾核平臺通過1根網(wǎng)線連接到解碼器。解碼器通過4路HDMI1.4將解碼后的視頻輸出到顯示器上進(jìn)行播放。

        圖5 演示實(shí)物圖

        4小結(jié)

        本文基于TILE-Gx36眾核平臺實(shí)現(xiàn)了一個多路超高清實(shí)時系統(tǒng),并針對HEVC編碼器輸出碼率波動較大提出了一個有效的應(yīng)用于實(shí)時系統(tǒng)中的碼率控制方案。同時,本文還提出了相應(yīng)的延時控制機(jī)制和時鐘同步機(jī)制,使系統(tǒng)在常碼率信道中能穩(wěn)定運(yùn)行并保證端到端延時恒定。實(shí)驗(yàn)結(jié)果顯示本文提出的系統(tǒng)擁有同時實(shí)時編碼4路4K HEVC視頻的能力,即該系統(tǒng)擁有編碼8K視頻的能力。

        參考文獻(xiàn):

        [1]POURAZAD M T, DOUTRE C, AZIMI M, et al. HEVC: the new gold standard for video compression:how does HEVC compare with H. 264/AVC?[J]. IEEE transations on consumer electronics magazine,2012, 1(3):36-46.

        [2]IEC I S O. 13818-1, Information technology generic coding of moving pictures and associated audio information: systems[S].1996.

        [3]Tilera.[EB/OL].[2015-11-13]. http://www.tilera.com/.

        [4]LIU Y, LI Z G, SOH Y C. A novel rate control scheme for low delay video communication of H.264/AVC standard[J]. IEEE transations on circuits and systems for video technology, 2007, 17(1):68-78.

        [5]WU J, CAI J. Quality-smoothed encoding for real-time video streaming applications[C]//Proc. the Ninth International Symposium on Consumer Electronics, 2005(ISCE 2005). [S.l.]:IEEE,2005:445-449.

        姚佳,碩士生,主要研究視頻編解碼傳輸;

        高志勇,博士生導(dǎo)師,主要研究高速圖像與視頻處理、數(shù)字電視等;

        張小云,碩士生導(dǎo)師,主要研究方向?yàn)橐曨l編解碼、高速視頻處理等。

        責(zé)任編輯:時雯

        Multi-channel UHD video encoding system based on many-core platform

        YAO Jia,GAO Zhiyong,ZHANG Xiaoyun

        (ImageCommunicationandNetworkEngineeringInstitute,ElectronicEngineering,ShanghaiJiaoTongUniversity,Shanghai200240,China)

        Abstract:In this paper, a multi-channel ultra-high definition (UHD) encoding real-time system is presented for the first time, which is based on the many-core TILE-Gx36 processors platform with low-power consumption. This system can simultaneously encode four UHD video inputs in HEVC, and transmit the encoded streams to the decoder after the MPEG transport stream (TS) multiplexing in constant bitrate (CBR). To ensure the system running stable, a closed-loop rate-control mechanism based on nonlinear R-Q model to adjust the output bitrate of encoder is proposed, and a buffer-control mechanism is used to make the system latency constant, in the end a clock synchronization mechanism based on the statistics of frame number is proposed to synchronize the clocks in the real-time system. Experiments show that the proposed system can keep stable running for a long time, and has the capacity of encoding 4-channel UHD video simultaneously.

        Key words:HEVC; multi-channel UHD; many-core; rate control; real-time system

        中圖分類號:TN949.292

        文獻(xiàn)標(biāo)志碼:B

        DOI:10.16280/j.videoe.2016.04.002

        基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(61301116)

        作者簡介:

        收稿日期:2015-11-16

        文獻(xiàn)引用格式:姚佳,高志勇,張小云. 基于眾核平臺的多路超高清視頻編碼系統(tǒng)設(shè)計(jì)[J].電視技術(shù),2016,40(4):7-11.

        YAO J,GAO Z Y,ZHANG X Y. Multi-channel UHD video encoding system based on many-core platform [J].Video engineering,2016,40(4):7-11.

        亚洲欧洲日产国码久在线| 亚洲熟女一区二区三区| 国产内射在线激情一区| 国产精品无码久久久一区蜜臀 | 国产AV高清精品久久| 国产91在线播放九色快色 | 欧美一级在线全免费| av福利资源在线观看| 亚洲高清中文字幕视频| 日韩人妻无码精品久久免费一| 欧美第五页| 亚洲精品无码不卡av| 国产久视频| 国产不卡在线播放一区二区三区| 人妻熟妇乱又伦精品hd| 99精品免费久久久久久久久日本| 国产三级黄色在线观看| 国内自拍偷拍一区二区| 国产亚洲人成在线观看| 免费人成视频xvideos入口| 亚洲成人777| 亚洲国产中文字幕九色| 亚洲狠狠婷婷综合久久久久 | 久久国内精品自在自线| 亚洲综合久久精品无码色欲| 国产丝袜精品不卡| 好看的中文字幕中文在线| 麻豆亚洲av熟女国产一区二| 久久无码专区国产精品s| 狠狠躁夜夜躁AV网站中文字幕 | av网站免费在线浏览| 免费无码中文字幕a级毛片| 国产亚洲欧美在线观看的| 人妻少妇激情久久综合| 免费a级毛片无码a∨蜜芽试看 | 女人被狂躁的高潮免费视频| 亚洲国产av导航第一福利网| 亚洲老熟妇愉情magnet| 亚洲av三级黄色在线观看| 亚洲国产成人片在线观看无码| 女性自慰网站免费看ww|