[摘要]JPEG2000是新一代的圖像壓縮標準,具有許多新的特性和更好的性能。介紹了JPEG2000的組成,討論了JPEG2000作為數(shù)字電影圖像壓縮格式的優(yōu)勢,分析了JPEG2000的關(guān)鍵技術(shù),并對實現(xiàn)JPEG2000編解碼的芯片進行了介紹。
[關(guān)鍵詞] 數(shù)字電影 JPEG2000 ADV202
引言
數(shù)字技術(shù)應用到電影制作中始于上世紀80年代,但是真正意義上的數(shù)字電影,則是在近幾年才出現(xiàn)的。數(shù)字電影在電影的制作、發(fā)行、放映等過程都采用數(shù)字技術(shù),不使用膠片作為載體,不需要用拷貝作為發(fā)行方式,可以通過網(wǎng)絡直接傳輸?shù)接霸夯蛴脩艏抑?。與傳統(tǒng)的膠片電影相比,數(shù)字電影具有多方面的優(yōu)勢,例如圖像更加清晰、亮麗,聲音更具感染力,避免了后期制作、發(fā)行中的失真,以及多次放映造成的拷貝磨損等。另外,電影制作中的數(shù)字特技為藝術(shù)家提供了更廣闊的創(chuàng)作空間,而數(shù)字加密技術(shù)也使數(shù)字電影具有更強的防盜版能力。
未經(jīng)壓縮的數(shù)字電影數(shù)據(jù)量十分巨大,以2K大小(2048×1080)的數(shù)字電影為例,一部2小時電影的數(shù)據(jù)量約為712GB。這個數(shù)據(jù)量對于當前的存儲技術(shù)而言顯得過于龐大,因此高質(zhì)量的圖像數(shù)據(jù)壓縮是實現(xiàn)數(shù)字電影的技術(shù)關(guān)鍵之一。數(shù)字電影采用的圖像壓縮算法目前還沒有統(tǒng)一的國際標準,2005年7月DCI(Digital Cinema lnitiatives,LLC)正式發(fā)布了其制定的數(shù)字電影技術(shù)規(guī)范,要求采用JPEG2000作為數(shù)字電影的圖像壓縮格式。由于組成DCI的迪斯尼、福克斯、米高梅等7家電影公司在業(yè)界有巨大的影響力,DCI的技術(shù)規(guī)范對未來數(shù)字電影國際標準的制定將產(chǎn)生重大的影響。
JPEG2000
JPEG 2000是由JPEG(JointPhotographic Experts Group)組織負責制定的國際標準,正式名稱為ISO 15444。其目標是建立一個能夠適用于不同類型、不同性質(zhì)及不同成像模型的統(tǒng)一圖像編碼系統(tǒng)。它采用了很多先進的技術(shù),比它的前一代標準JPEG有了很大的改進。
JPEG2000的組成
JPEG2000由12個部分(Part)組成,分別是:Part 1核心編碼系統(tǒng)、Part 2擴展部分、Part 3 Motion JPEG2000、Part 4-致性、Part 5參考軟件、Part 6復合圖像文件格式、Part 7(已經(jīng)被放棄)、Part 8 JPSEC、Part 9JPIP、Part 10 JP3D、Part 11 JPWL和Part 121SO基本媒體文件格式。
其中,Part 1定義了JPEG2000的核心內(nèi)容,包括碼流的語法、編解碼的必要步驟,還定義了一個基本的文件格式(JP2),已經(jīng)作為國際標準發(fā)布。Part 2-6已經(jīng)完成或接近完成,而Part8-11還在發(fā)展中。
JPEG2000的優(yōu)勢
和以前的壓縮方法相比,JPEG2000具有多方面的優(yōu)勢:
1,JPEG2000具有良好的低比特率壓縮性能,壓縮比超過JPEG,而且能保持良好的率失真性能,這使得用JPEG2000壓縮的圖像在網(wǎng)絡上傳輸時,對網(wǎng)絡帶寬的要求更低,圖像效果更好。
2.JPEG2000既能實現(xiàn)有損壓縮,又能實現(xiàn)無損壓縮,它采用嵌入式可分級碼流,能在同一碼流中提供有損壓縮和無損壓縮,可以適應不同用戶對圖像質(zhì)量的不同要求。
3.JPEG2000可以在一個標準編碼系統(tǒng)中實現(xiàn)對連續(xù)色調(diào)和二值圖像的壓縮,它將彩色靜態(tài)圖像采用的JPEG編碼方式、二值圖像采用的JBIG編碼方式及低壓縮率采用的JPEGLS統(tǒng)一了起來。
4.JPEG2000在傳輸圖像時是漸進傳輸,即先傳輸圖像的輪廓,隨著數(shù)據(jù)的增加,圖像越來越清晰。這樣用戶在只接收到少量數(shù)據(jù)時,就可以看到圖像的輪廓,從而判斷是不是自己需要的圖像。同時,JPEG2000還能實現(xiàn)按質(zhì)量的分級傳輸,用戶能夠根據(jù)需要和帶寬選擇下載不同質(zhì)量的圖像。
5.用戶可以在圖像中指定感興趣區(qū)域(Reglono{Interest,R01),并對該區(qū)域的數(shù)據(jù)優(yōu)先、高清晰度的傳輸。用戶還可以對ROI指定較高的壓縮質(zhì)量,對其他區(qū)域指定較低的壓縮質(zhì)量,這樣能在保留重要細節(jié)的同時,使整個圖像文件的尺寸較小。在傳輸大尺寸圖像時,用戶可以通過指定ROI,優(yōu)先傳輸感興趣部分的數(shù)據(jù),節(jié)省等待時間。
6.JPEG2000的誤差穩(wěn)定性好,抗干擾能力較強。在質(zhì)量較差的信道上傳輸時,也具有較強的抗誤碼能力。
7.JPEG2000能通過水印、沖壓、標簽、指紋、加密和加擾等方式對數(shù)字圖像進行保護,防止非授權(quán)的用戶使用圖片。
8.JPEG2000的文件格式是一個開放的框架結(jié)構(gòu),擴展名為JP2。它由許多不同的Box組成,除一些必須的Box外,用戶可以按照標準中Box的格式定義自己的Box加入到壓縮文件中。使用這一特性,用戶可以根據(jù)需要在文件中添加自己定義的內(nèi)容,擴展文件的使用范圍。
另外,JPEG2000采用幀內(nèi)編碼,便于按幀進行非線性編輯能支持更大范圍的圖像尺寸與顏色深度,允許對圖像從頂?shù)降走B續(xù)編碼,不需緩存;這些特性都使得JPEG2000更適合數(shù)字電影的需要。
JPEG2000的關(guān)鍵技術(shù)
JPEG 2000放棄了JPEG的以DCT(Discrete CosineTransform,離散余弦變換)為主的區(qū)塊編碼方式,改用先進的以DWT(DiscreteWave,etTransform,離散小波變換)為主的多解析編碼方式。它的編碼(壓縮)過程包括預處理、分量變換、灰度移位、小波變換、量化和EBCOT編碼,然后還要把編碼組織成JPEG2000碼流的格式輸出。解碼(解壓縮)是編碼的逆過程。其中采用的關(guān)鍵技術(shù)有DWT和EBCOT編碼。DWT使JPEG2000能實現(xiàn)分辨率可分級,而EBCOT編碼則是JPEG2000實現(xiàn)信噪比可分級的基礎(chǔ)。
離散小波變換
離散小波變換是現(xiàn)代譜分析工具,在圖像處理與圖像分析領(lǐng)域正得到越來越廣泛的應用。它對信號的時域、頻域都采取局部的方式進行考察,對于非平穩(wěn)過程也一樣有效。DWT對圖像中的高頻成分采用漸進的取樣間隔,能夠看清遠近不同的景物,并放大任意細節(jié),是構(gòu)造圖像多分辨率的有力工具。
JPEG2000采用提升算法(LiftingScheme)實現(xiàn)小波變換,與直接用Ma,,at塔式算法相比,這種實現(xiàn)方法有很多優(yōu)越性。包括:(1)能容易地解決邊界問題(2)實現(xiàn)對任意尺寸圖像的小波變換;(3)所涉及的操作都是本位(in-place)運算,節(jié)省存儲空間(4)計算更快速(5)不依賴于傅立葉變換實現(xiàn)小波構(gòu)造(6)可實現(xiàn)整數(shù)小波變換,對圖像進行無損壓縮等等。JPEG2000中的小波變換分為不可逆的實型到實型變換和可逆的整型到整型變換兩種。不可逆變換采用9/7小波,用于有損編碼可逆變換采用5/3小波,既可用于無損編碼,也可用于有損編碼。
EBCOT算法
Taubman提出的EBCOT(EmbeddedBlockCodinq with OptimizedTruncation)算法是JPEG2000的核心算法。EBCOT編碼器分為兩級,第一級編碼將各子帶的小波系數(shù)劃分為彼此獨立的碼塊,然后對各個碼塊獨立進行位平面編碼并輸出一些參數(shù)供第二級編碼器使用。第二級編碼器根據(jù)第一級編碼器輸出的參數(shù)進行率失真優(yōu)化截取、打包,形成輸出碼流。在傳輸圖像或視頻時,必須進行率控制來滿足傳輸帶寬或傳輸時間的需要。JPEG2000采用率失真優(yōu)化截取算法(PCRD)來精確地進行率控制。
實現(xiàn)器件
由于目前通用DSP芯片的速度還不夠快,為了滿足數(shù)字影院實時放映對解碼速度的要求,需要用專用的芯片進行解碼。目前支持JPEG2000實時編解碼的芯片還很少,已有的JPEG2000編解碼系統(tǒng)大多是基于ADI公司的ADV202設計的。
ADV202是單片JPEG2000實時編解碼芯片,實現(xiàn)了JPEG2000標準Part 1所要求的功能。它采用專利的空間超效率回歸濾波(SURF)技術(shù),支持最高6級的9/7和5/3小波變換。具有可編程圖塊/圖像尺寸,在3分量4:2:2隔行掃描中的寬度可達2048像素,單分量模式中的寬度可達4096像素。其視頻接口可直接支持ITU.R-BT656、SMPTEl25M PAL/NTSC、SMPTE274M、SMPTE293M(525p)、ITU.R-BTl358(625p),以及不可逆模式最大輸入速度為65Msps、可逆模式最大輸入速度為40Msps的任何視頻格式。它的靈活異步SRAM類型主機接口能無縫連接到大多數(shù)16/32位微控制器和ASIC。
根據(jù)特殊的應用需求,ADV202可提供JPEG2000壓縮所支持的不同標準,可提供原始的編碼模塊和特征數(shù)據(jù)輸出,而JPEG2000編碼流的產(chǎn)生和其它諸如位速率控制等的壓縮過程則完全由主機軟件來控制。由于單片ADV202的性能有限,在實際設計中通常采用2片或多片ADV202同時工作。
結(jié)束語
JPEG2000是新一代的圖像壓縮算法,它采用了先進的圖像處理技術(shù),具有很多新的特性,并有更好的性能。JPEG2000在被DCI選為數(shù)字電影的圖像壓縮格式后,有望成為數(shù)字電影圖像壓縮格式的國際標準。而JPEG2000實時編解碼芯片的出現(xiàn),對DCI規(guī)范的實用化具有重要意義,必將進一步推動數(shù)字電影的發(fā)展。