亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Mask R-CNN的監(jiān)控視頻碼率控制研究

        2022-12-16 09:22:50丁冬冬陳世平
        計(jì)算機(jī)時(shí)代 2022年12期
        關(guān)鍵詞:前景分配

        丁冬冬,陳世平

        (上海理工大學(xué)光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)

        0 引言

        隨著數(shù)字化時(shí)代的到來,監(jiān)控視頻的存儲與傳輸數(shù)據(jù)量越來越大,無壓縮的視頻將會消耗巨大的帶寬和存儲資源,而高效的視頻編碼算法可以解決視頻壓縮問題,碼率控制是視頻編碼中非常重要的技術(shù)模塊。現(xiàn)主流的編碼標(biāo)準(zhǔn)有VP9[1],AVC(H.264)[2],HEVC(H.265)[3]和AV1[4]等系列,均可以對視頻進(jìn)行壓縮編碼,但是沒有考慮到監(jiān)控視頻的特殊性[5],大多數(shù)固定攝像頭安裝后場景基本不變,我們稱固定不變的背景為后景,移動的人或者物稱為前景,就監(jiān)控視頻而言,前景一般為感興趣區(qū)域(ROI)[6]。

        近些年來深度學(xué)習(xí)在很多領(lǐng)域都取得了突破性成果,本文基于兩階段Mask R-CNN 實(shí)例分割算法,將監(jiān)控視頻中的前后景進(jìn)行分離,計(jì)算出前后景占比,為后續(xù)碼率控制模型改進(jìn)做準(zhǔn)備。

        對于監(jiān)控視頻的碼率控制,本文所提算法降低了視頻平均比特率且提高了前景比例高的幀數(shù)圖像的質(zhì)量,視頻比特率平均降低7.59kbps,PSNR 平均提升0.1141dB。

        1 HEVC碼率控制模型

        HEVC采用R-λ碼率控制模型[7]:

        其中,R 為編碼碼率,一般使用每像素比特?cái)?shù)bpp 來表示,D 為失真,一般使用亮度分量的均方誤差MSE,c和k為常數(shù)。

        R-λ碼率控制模型中的λ是RD曲線的斜率,所以對式⑴中R兩邊求導(dǎo):

        其中,α=ck,β=-k-1,α 和β 為編碼參數(shù),一般和視頻序列的內(nèi)容有關(guān)。

        HEVC碼率控制通常分為兩個(gè)步驟:

        1.1 比特率分配

        一般分為三個(gè)等級,分別為畫面組(GOP)級比特分配、幀(Frame)級比特分配、最大編碼單元(LCU)級比特分配。

        一開始先定義視頻序列平均每幀的比特?cái)?shù):

        其中,為視頻序列平均每幀的比特?cái)?shù),Rtg為目標(biāo)比特,F(xiàn)rRate為幀率。

        1.1.1 GOP級比特分配

        視頻在編碼前被劃分為多個(gè)連續(xù)的GOP,其中分配給GOP的目標(biāo)比特?cái)?shù)TGOP為[8]:

        其中,為分配給Frame 的平均比特?cái)?shù),NGOP為一個(gè)GOP所包含的圖像數(shù).。

        1.1.2 Frame級比特分配

        對于每一個(gè)GOP 中,又由多幀圖像組成,分配給每幀圖像的目標(biāo)比特?cái)?shù)TPic為:

        其中,TGOP為分配給GOP 的目標(biāo)比特?cái)?shù),RGOPCoded為當(dāng)前GOP 已消耗比特?cái)?shù),ωPic為當(dāng)前GOP 中每一幀圖像比特分配權(quán)重,ωPicCurr為當(dāng)前幀圖像的比特分配權(quán)重。

        1.1.3 LCU級比特分配

        對于每一幅圖像,HEVC會將其劃分為多個(gè)最大編碼單元為LCU,分配給每個(gè)LCU的目標(biāo)比特?cái)?shù)TLCU為:

        其中,TPic為分配給Frame的目標(biāo)比特?cái)?shù),BitH為所有頭信息編碼所需比特?cái)?shù),RPicCoded為當(dāng)前Frame 已消耗比特?cái)?shù)。

        1.2 碼率控制

        計(jì)算拉格朗日乘數(shù)λ和量化參數(shù)QP。

        1.2.1 拉格朗日乘數(shù)λ的計(jì)算

        根據(jù)式⑵,利用R 來計(jì)算拉格朗日乘數(shù)λ,式⑵中α 和β 為編碼參數(shù),一般和視頻序列的內(nèi)容有關(guān),所以這里每一個(gè)Frame和LCU對應(yīng)的α和β都不相同:

        其中,Rreal為編碼中實(shí)際使用的每像素比特?cái)?shù),λreal為編碼中實(shí)際使用λ,δα和δβ為常數(shù),用于調(diào)節(jié)公式的收斂速度。

        1.2.2 量化參數(shù)QP的確定

        量化參數(shù)QP,體現(xiàn)圖像細(xì)節(jié)壓縮情況。其值越小,量化越精細(xì),圖像質(zhì)量越高。當(dāng)拉格朗日乘數(shù)λ確定以后,就可以進(jìn)一步計(jì)算QP:

        其中,a和b為模型參數(shù),取值為4.2005和13.7122[9]。

        2 MaskR-CNN實(shí)例分割

        對于感興趣區(qū)域(ROI)的圖像分割[10],傳統(tǒng)的圖像分割算法在一些特殊場景分割效果較差,如樹葉搖曳會被識別為前景,且無法指定識別特殊前景,深度學(xué)習(xí)Mask R-CNN[11]算法可以解決這些問題。Mask R-CNN 基于Faster R-CNN[12],是一個(gè)兩階段的實(shí)例分割算法,是在目標(biāo)檢測基礎(chǔ)上再進(jìn)行實(shí)例分割,第一階段先對輸入的圖像進(jìn)行掃描,然后生成建議框,第二階段分類建議框,然后生成邊界框和掩碼。

        圖1 為主干網(wǎng)絡(luò)簡化過程,Mask R-CNN 對輸入進(jìn)來的圖像的有尺寸要求,首先對輸入的圖像進(jìn)行預(yù)處理,將處理后的圖像輸入到一個(gè)預(yù)訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)中(ResNet50,ResNet101[13]等)獲得對應(yīng)的特征圖,對這個(gè)特征圖中的每個(gè)位置都設(shè)置一定數(shù)目不同大小的先驗(yàn)框(Anchor),從而獲得多個(gè)候選先驗(yàn)框,將這些候選的先驗(yàn)框送入?yún)^(qū)域建議網(wǎng)絡(luò)(RPN)進(jìn)行二值分類(前景或后景)以及坐標(biāo)回歸,選出有價(jià)值的先驗(yàn)框。

        圖1 主干網(wǎng)絡(luò)簡化圖

        將上述選出的先驗(yàn)框進(jìn)行ROIAlign 操作,最終對這些先驗(yàn)框進(jìn)行N 類別分類,候選框回歸和引入全卷積網(wǎng)絡(luò)(FCN)[14]生成Mask,完成分割任務(wù)。

        3 碼率控制模型改進(jìn)

        監(jiān)控視頻的前后景劃分較為明顯,前景一般為感興趣區(qū)域,針對這一情況,本文在R-λ 碼率控制模型上進(jìn)行改進(jìn)。

        利用MaskR-CNN 深度學(xué)習(xí)算法將視頻每一幀的前后景進(jìn)行分離,定義前景所占比例Rforground為:

        其中,Sforground為視頻一幀圖像前景所占面積,Sbackground為視頻一幀圖像后景所占面積。

        在Frame 級比特分配算法中,無法根據(jù)監(jiān)控視頻本身特點(diǎn)對每一幀圖像進(jìn)行更合理地分配的目標(biāo)比特,故將式⑸進(jìn)行改進(jìn)。因?yàn)楸O(jiān)控視頻感興趣區(qū)域一般為前景,人們希望前景占比高的圖像更加清晰,將式⑾的計(jì)算結(jié)果引入式⑸,根據(jù)當(dāng)前幀圖像前景比例,調(diào)整分配給當(dāng)前幀的比特?cái)?shù),得到:

        其中,TGOP為分配給GOP 的目標(biāo)比特?cái)?shù),RGOPCoded為當(dāng)前GOP 已消耗比特?cái)?shù),ωPic為當(dāng)前GOP 中每一幀圖像比特分配權(quán)重,ωPicCurr為當(dāng)前幀圖像的比特分配權(quán)重,Rforground為前GOP 中每一幀前景所占比例,RforgroundCurr為當(dāng)前幀前景所占比例,ε為權(quán)重調(diào)節(jié)常數(shù),用于調(diào)整原公式參數(shù)與新引入?yún)?shù)權(quán)重。

        4 實(shí)驗(yàn)與結(jié)果分析

        本文實(shí)驗(yàn)的硬件為Intel Core i7-8750H 處理器,NVIDIA GeForce GTX 1070 顯卡、16GB 內(nèi)存。

        4.1 MaskR-CNN實(shí)例分割實(shí)驗(yàn)

        軟件 環(huán)境為Anaconda-3,CUDA-10.0,Python-3.6,tensorflow-gpu-1.13.1,keras-2.1.5,本文使用在COCO數(shù)據(jù)集上預(yù)訓(xùn)練權(quán)重mask_rcnn_coco.h5,對視頻圖像進(jìn)行前后景分割,將前景用不同顏色標(biāo)記,效果如圖2所示。

        圖2 MaskR-CNN分割效果圖

        再根據(jù)式⑽計(jì)算出每一幀圖像的前景所占比例,為后面計(jì)算做準(zhǔn)備。

        4.2 HEVC碼率控制實(shí)驗(yàn)

        使用HEVC 參考軟件HM-16[15]進(jìn)行實(shí)驗(yàn),測試圖像數(shù)據(jù)為hall_cif.yuv、container_cif.yuv 和bridgeclose_cif.yuv,分別編號1,2,3。將HM-16與本文的改進(jìn)算法視頻編碼結(jié)果作對比。以hall_cif.yuv 為例,圖3 左側(cè)為HM16 算法編碼后的圖像,右側(cè)為本文算法編碼后的圖像。因原始視頻分辨率較低,對局部細(xì)節(jié)進(jìn)行放大后觀察,得到圖4,圖4 左側(cè)為HM16 算法進(jìn)行編碼后的局部放大細(xì)節(jié)圖像,右側(cè)為本文提出的改進(jìn)算法編碼后局部放大細(xì)節(jié)圖像。

        圖3 HM16算法與改進(jìn)算法圖像對比

        圖4 放大細(xì)節(jié)圖像對比

        圖4 左側(cè)和右側(cè)圖像對比,可以看出監(jiān)控視頻中前景人物褲子細(xì)節(jié)圖像質(zhì)量有一定的提升。

        因原始視頻分辨率較低,人眼對結(jié)果圖像主觀感受有所差別。本文再根據(jù)客觀數(shù)據(jù)進(jìn)一步進(jìn)行驗(yàn)證。分別選取量化參數(shù)QP 為22,27,32,37進(jìn)行實(shí)驗(yàn),這里預(yù)設(shè)的QP值越大,編碼后質(zhì)量越低。

        實(shí)驗(yàn)后得到不同QP 下HM16 算法與本文提出的改進(jìn)算法編碼后視頻在比特率分配上和PSNR(Peak Signal to Noise Ratio)方面的對比。表1 為HM16 算法在不同QP 下編碼得到的比特率和PSNR 值,表2 為本文改進(jìn)的算法在不同QP 下編碼得到的比特率和PSNR值,表3是表2數(shù)據(jù)與表1對應(yīng)數(shù)據(jù)相減而得到,用于反映分配比特率的降低和編碼質(zhì)量的提升。

        表1 HM16算法編碼結(jié)果

        表2 本文改進(jìn)算法編碼結(jié)果

        表3 兩種算法的差值

        對于視頻來說,在同等QP 下,一般視頻分配的比特率越低,視頻的最終傳輸及存儲大小就會越低。從表3中可以看出本文提出的算法在比特率分配上有所降低,平均降低7.59kbps。

        PSNR 為峰值信噪比,是一種廣泛運(yùn)用于評價(jià)視頻畫質(zhì)的客觀測量法。PSNR 值越大,代表著視頻圖像質(zhì)量越好,人眼對Y 明亮度分量比U、V 分量要敏感,從表3中可以看出,本文提出的算法在Y-PSNR 和分量上和整體YUV-PSNR 都有一定的提升。整體YUV-PSNR平均提升0.1141dB。

        5 結(jié)束語

        本文針對監(jiān)控視頻特點(diǎn),在HEVC 視頻編碼基礎(chǔ)上,利用Mask R-CNN 對碼率控制算法進(jìn)行改進(jìn),從實(shí)驗(yàn)結(jié)果可見改進(jìn)算法不僅降低了視頻碼率,且在視頻質(zhì)量上也有一定的提升,達(dá)到了目標(biāo)效果。

        實(shí)驗(yàn)中發(fā)現(xiàn),因改進(jìn)算法在原算法基礎(chǔ)上增加了更多參數(shù)和分配指標(biāo),導(dǎo)致改進(jìn)算法的編碼時(shí)間高于HM16 算法編碼時(shí)間,對于視頻編碼技術(shù)而言,編碼時(shí)間也是算法非常重要的一部分,所以未來可以在此方面再做進(jìn)一步優(yōu)化。

        猜你喜歡
        前景分配
        基于可行方向法的水下機(jī)器人推力分配
        我國旅游房地產(chǎn)開發(fā)前景的探討
        法德軸心的重啟及前景
        四種作物 北方種植有前景
        應(yīng)答器THR和TFFR分配及SIL等級探討
        離岸央票:需求與前景
        中國外匯(2019年11期)2019-08-27 02:06:32
        遺產(chǎn)的分配
        一種分配十分不均的財(cái)富
        績效考核分配的實(shí)踐與思考
        量子糾纏的來歷及應(yīng)用前景
        太空探索(2016年10期)2016-07-10 12:07:01
        亚洲精品123区在线观看| 蜜桃日本免费看mv免费版| 少妇放荡的呻吟干柴烈火动漫| 婷婷九月丁香| 亚洲中文有码一区二区| 少妇免费av一区二区三区久久 | 免费观看国产激情视频在线观看| 本道天堂成在人线av无码免费| 日本道精品一区二区三区| 久久久精品国产亚洲AV蜜| 中文亚洲第一av一区二区| 国产成人av一区二区三区不卡| 丰满人妻被黑人猛烈进入| 久久AV中文综合一区二区| 国产精品高清一区二区三区人妖| 人妻少妇中文字幕在线 | 996久久国产精品线观看| 久久久9色精品国产一区二区三区 国产三级黄色片子看曰逼大片 | 久久精品免费一区二区喷潮| 偷拍一区二区三区在线观看| 免费人成视频网站网址| 国产成人无码a区在线观看视频 | 国产午夜av一区二区三区| 亚洲av香蕉一区二区三区av| 成年女人粗暴毛片免费观看| 欧美第五页| 亚洲一区二区在线视频,| 欧美老妇牲交videos| 亚洲日韩精品欧美一区二区| 西西人体大胆视频无码| 亚洲成a人片在线观看中文!!! | 四虎影视国产在线观看精品| 中文字幕中文一区中文字幕| 亚洲乱码中文字幕在线| 99re热视频这里只精品| 亚洲一区二区三区久久蜜桃| 中文字幕一区二三区麻豆| 国精品午夜福利视频不卡| 天堂中文资源在线地址| 久久精品天堂一区二区| 欧美激情在线播放|