辛齊 山東水文水資源局
多媒體視頻文件格式研究與應(yīng)用
辛齊 山東水文水資源局
隨著計(jì)算機(jī)技術(shù)的發(fā)展和互聯(lián)網(wǎng)的普及,多媒體信息也因其強(qiáng)大的直觀可信性、超大的信息存量、方便的存放傳輸、簡(jiǎn)單的操作而越來(lái)越受到人們的重視,進(jìn)而帶動(dòng)了多媒體文件技術(shù)的發(fā)展。
多媒體視頻文件是多媒體的核心組成,它是音頻流和視頻流經(jīng)過(guò)一定的封裝技術(shù)而生成的可以進(jìn)行媒體播放的文件,按照應(yīng)用環(huán)境分影像視頻文件和流式視頻文件。
1.1 影像視頻文件
影像視頻文件是適合本地播放的視頻文件,文件本身包含了大量的圖像和聲音信息,常用的影像視頻文件格式主要有AVI、MPEG等。
AVI是一種獨(dú)立于硬件設(shè)備且運(yùn)動(dòng)圖像和伴音交織存儲(chǔ)的文件,MPEG是運(yùn)動(dòng)圖像壓縮算法的國(guó)際標(biāo)準(zhǔn),包括MPEG視頻、MPEG音頻和MPEG系統(tǒng)三個(gè)部分。
1.2 流式視頻格式
流媒體是指在Internet/Intranet中使用流式傳輸技術(shù)連續(xù)播放的視頻文件,它不需要下載整個(gè)文件,而是隨著數(shù)據(jù)流隨時(shí)傳送隨時(shí)播放。目前Internet上使用較多的流式視頻格式主要有RM格式、MOV格式、ASF格式、WMV格式等。
RM格式,是一種能夠在低速率網(wǎng)上實(shí)時(shí)傳輸視音頻信息的文件格式。它可以根據(jù)網(wǎng)絡(luò)數(shù)據(jù)傳輸速率的不同制定不同的壓縮比率,從而實(shí)現(xiàn)在低速率廣域網(wǎng)上進(jìn)行影像數(shù)據(jù)的實(shí)時(shí)傳送和實(shí)時(shí)播放;MOV是能夠通過(guò)Internet提供實(shí)時(shí)數(shù)字化信息流、工作流與文件回放功能的文件格式;WMV是一種獨(dú)立于編碼方式的在Internet上實(shí)時(shí)傳播多媒體的技術(shù)標(biāo)準(zhǔn),主要特點(diǎn)包括本地或網(wǎng)絡(luò)回放、可擴(kuò)充媒體類型、部件下載、可伸縮媒體類型、流的優(yōu)先級(jí)化、多語(yǔ)言支持、環(huán)境獨(dú)立性、豐富的流間關(guān)系以及擴(kuò)展性等。
采集的原始視頻文件由于數(shù)據(jù)量大,無(wú)法直接播放,因此需要對(duì)其進(jìn)行壓縮編碼,并進(jìn)行數(shù)據(jù)打包后才能進(jìn)行播放,這就是視頻編碼和視頻文件封裝。
2.1 視頻編碼
為了使計(jì)算機(jī)能方便的處理并播放這些視頻文件,通過(guò)壓縮技術(shù),去掉視頻編碼數(shù)據(jù)中的冗余信息,產(chǎn)生一個(gè)其視頻信號(hào)帶寬在計(jì)算機(jī)使用范圍內(nèi)的一個(gè)新的編碼文件,這就是視頻編碼。
傳統(tǒng)的壓縮編碼是以Shannon信息論和集合論為基礎(chǔ),用統(tǒng)計(jì)概率模型來(lái)描述信源的一種編碼技術(shù)標(biāo)準(zhǔn),該標(biāo)準(zhǔn)有兩大系統(tǒng):MPEG和ITU-T。
2.2 視頻封裝
一個(gè)完整的媒體文件由音頻和視頻組成,將視頻編碼和音頻編碼按照一定的格式打包放到一個(gè)文件中,就是封裝。本文將目前常用的幾種視頻文件格式的封裝原理做簡(jiǎn)單介紹。
2.2.1 AVI格式
AVI容器是成熟的老技術(shù),它的視頻編碼格式和音頻編碼格式組合分別為Xvid、mp3或Divx、mp3,它的文件結(jié)構(gòu)分為頭部,主體和索引三部分,主體中圖像數(shù)據(jù)和聲音數(shù)據(jù)交互存放。從尾部的索引可以跳到任意位置;AVI可以實(shí)現(xiàn)同步控制和實(shí)時(shí)播放以及無(wú)硬件視頻回放,實(shí)現(xiàn)硬盤和光盤的高效存儲(chǔ),數(shù)字視頻的文件結(jié)構(gòu)開(kāi)放特點(diǎn),支持多種編碼。
2.2.2 MOV格式
MOV格式文件是媒體描述和媒體數(shù)據(jù)分開(kāi)存放,媒體描述單元包括軌道數(shù)目、視頻壓縮格式和時(shí)間信息,同時(shí)包含媒體數(shù)據(jù)存儲(chǔ)區(qū)域的索引;MOV格式的視頻文件支持領(lǐng)先的集成壓縮技術(shù),提供多種視頻效果,配有多種MIDI兼容音響和設(shè)備的聲音裝置,具有跨平臺(tái)、省空間的特點(diǎn)。
2.2.3 MPEG格式
MPEG格式主要采用運(yùn)動(dòng)補(bǔ)償技術(shù)(預(yù)測(cè)編碼和插補(bǔ)碼)實(shí)現(xiàn)時(shí)間上的壓縮,變換域(離散余弦變換DCT)壓縮技術(shù)實(shí)現(xiàn)空間上的壓縮。該格式具有壓縮率高、圖像和音響的質(zhì)量好,兼容性強(qiáng)的特點(diǎn)。
2.2.4 DivX格式
該格式采用了MPEG4的壓縮算法同時(shí)又綜合了MPEG-4與MP3各方面的技術(shù),畫(huà)質(zhì)逼真體積小。
3.1 影響視頻質(zhì)量的因素
影響視頻質(zhì)量的主要因素有三個(gè),片源、分辨率、碼率、幀速,其中分辨率和碼率影響視頻影像的清晰度,幀速影響視頻播放的流暢度。
片源就是通過(guò)攝像頭錄入的原始視頻文件,它是決定視頻質(zhì)量高低的必要因素,一個(gè)優(yōu)質(zhì)的片源,是做出優(yōu)質(zhì)多媒體基本條件。
碼率就是數(shù)據(jù)傳輸時(shí)單位時(shí)間傳送的數(shù)據(jù)位數(shù),通俗一點(diǎn)的理解就是取樣率,單位時(shí)間內(nèi)取樣率越大,精度就越高,處理出來(lái)的文件就越接近原始文件,
3.1.1 分辨率
分辨率實(shí)際上就是畫(huà)面的大小,以像素點(diǎn)表示,通常由寬乘高像素總點(diǎn)數(shù)來(lái)計(jì)算,分辨率高的視頻,能反映的圖像就越細(xì)致,越清楚。
3.1.2 幀數(shù)
幀數(shù)就是在1秒鐘時(shí)間里傳輸?shù)膱D片的幀數(shù),也可以理解為圖形處理器每秒鐘能夠刷新幾次。高幀率可以得到更流暢、更逼真的動(dòng)畫(huà)。
3.2 影響視頻質(zhì)量因素之間的關(guān)系
3.2.1 分辨率與碼率對(duì)視頻質(zhì)量的影響
分辨率越高,就需要越高的編碼率,所以,在分辨率一定的情況下,碼率越高視頻質(zhì)量越高,在碼率一定的情況下,分辨率越高視頻的質(zhì)量越低,圖像的馬賽克就越明顯。
3.2.2 碼率與幀數(shù)對(duì)視頻質(zhì)量的影響
理論上講,碼率越高視頻質(zhì)量越高,幀數(shù)越高視頻質(zhì)量也越高,但是當(dāng)碼率和幀數(shù)增高到一定數(shù)值后,由于文件體積的增大,較低配置的用戶會(huì)有卡頓現(xiàn)象,因此,一般幀數(shù)在50幀/秒就能滿足絕大多數(shù)用戶的要求了。
視頻文件格式對(duì)多媒體文件質(zhì)量沒(méi)有直接的影響,但是,如何進(jìn)行影像編碼和音頻編碼的組合,從而產(chǎn)生相對(duì)科學(xué)的碼率、分辨率以及幀數(shù)的組合,則是視頻文件格式完全可以做到的,從而對(duì)多媒體的質(zhì)量產(chǎn)生較大影響。
[1]胡曉峰等著,《多媒體技術(shù)教程》(第三版),人民郵電大學(xué)出版社
[2]劉峰編著,《視頻圖像編碼技術(shù)及國(guó)際標(biāo)準(zhǔn)》,北京郵電大學(xué)出版社
[3]高文等著,《數(shù)字視頻編碼技術(shù)原理》,科學(xué)出版社出版