徐妮妮,李晨光
(天津工業(yè)大學(xué)電子與信息工程學(xué)院,天津 300387)
基于 JPEG 標準的 16 bit圖像有損壓縮應(yīng)用
徐妮妮,李晨光
(天津工業(yè)大學(xué)電子與信息工程學(xué)院,天津 300387)
給 出 了 16 bit 圖 像 有 損 壓 縮 的 原 理 和 詳 細 流 程 。 由 于 16 bit 圖 像 數(shù) 據(jù) 量 大 而 JPEG 并 不 支 持 16 bit圖像的壓縮,這使得其在存 儲和傳輸方 面有很多不便。 在 JPEG 壓縮方 案的基礎(chǔ)上,對統(tǒng)計模型 進行了擴 展 (分別 對 DC 差分值編碼的統(tǒng)計模型表和 AC 系數(shù)編碼的統(tǒng)計模型表進行了一定的改變和擴充),使其能夠處 理 位深 度 為 16 的 數(shù) 據(jù) , 從 而 實 現(xiàn) 了 16 bit圖 像 的 有 損 壓 縮 。 圖 像 量 化 過 程 中 所 使 用 的 量 化 表 是 基 于 JPEG 默 認的 8 位 亮度 圖 像 量 化 表 生 成 的。 所 采 用的 編 碼 器 為 QM 算 術(shù) 編 碼器 ,解壓 后 的 圖 像 質(zhì) 量 評 價 標 準 采 用 客 觀評價標準 PSNR。
16 bit 圖 像 有 損 壓 縮 ;DC 差 分 值 編 碼 的 統(tǒng) 計 模 型 ;AC 系 數(shù) 編 碼 的 統(tǒng) 計 模 型 ;QM 算 術(shù) 編 碼 器
隨著數(shù)字圖像技術(shù)的發(fā)展以及數(shù)字圖像在各領(lǐng)域應(yīng)用的日益廣泛,在一些領(lǐng)域中人們對圖像質(zhì)量的要求也越來 越 高 。這 時 傳 統(tǒng) 的 8 bit圖 像 已 經(jīng) 不 能 滿 足 要 求 ,使 用16 bit圖 像 能 夠 更 好 地 滿 足 所 需 的 圖 像 質(zhì) 量 要 求 。如 在 醫(yī)學(xué) 成 像 領(lǐng) 域 中 dicom(digital imaging and communications in medicine)格 式[1]的 CT 圖 像 就 是 16 bit灰 度 圖 像 。16 bit圖像在醫(yī)學(xué)領(lǐng)域的廣泛應(yīng)用提高了圖像的精確程度,方便了醫(yī) 生 對 疾 病 的 診 斷 。 然 而 相 比 于 8 bit圖 像 使 用 1 byte 來存 儲 1 個 像 素 ,16 bit圖 像 存 儲 1 個 像 素 時 使 用 2 byte。這使 得 16 bit圖 像 在 能 夠 滿 足 人 們 對 圖 像 質(zhì) 量 要 求 的 同 時也 存 在 著 數(shù) 據(jù) 量 大 的 問 題 。16 bit圖 像 龐 大 的 數(shù) 據(jù) 量 使其 在 存 儲 和 傳 輸 方 面 有 很 大 的 不 便[2]。 通 過 圖 像 壓 縮 技術(shù)可以在一定程度上降低其數(shù)據(jù)量,在壓縮過程中通過對質(zhì)量因子的選擇,可以使解壓后的圖像滿足所需要的質(zhì)量要求。
由于目前的顯示系統(tǒng)通常只能顯示位深度為8的圖像 , 因 此 圖 像 壓 縮 算 法 主 要 是 針 對 8 bit圖 像 ,對 16 bit 圖像 的 壓 縮 研 究 較 少 。孫 中 柏[2]提 出 了 一 種 基 于 霍 夫 曼 編 碼 的16 bit灰 度 圖 像 的 無 損 壓 縮 方 法 ,但 該 方 法 只 能 獲 得 2.5 左右的壓縮比,并不能有效地減少 16 bit圖像的數(shù)據(jù)量。相比于 無 損 壓 縮 ,有 損 壓 縮 的 壓 縮 比 更 高。2014 年 1 月 IJG 組織發(fā) 布 的 JPEG 的 新 版 本 JPEG9a[3]中 給 出 了 8 bit 和 12 bit 圖像 的 有 損 壓 縮 方 法 ,卻 沒 有 給 出 16 bit圖 像 的 有 損 壓 縮 方法 。針 對 16 bit圖 像 的 有 損 壓 縮 ,本 文 在 JPEG 標 準 中 壓 縮方法的基礎(chǔ)上對量化策略和統(tǒng)計模型進行了擴展,提出了新 的 方 案 extend-JPEG。 該 方 法 在 壓 縮 過 程 中 使 用 DCT(discrete Cosine transform,離 散 余 弦 變 換 ),編 碼 器 選 擇 QM算術(shù)編碼器。
2.1 壓縮流程
基 于 JPEG 標 準 的 16 bit 圖 像 壓 縮 方 案 extend-JPEG的 流 程[4,5]主 要 分 為 如 下 3 個 步 驟 :
(1)對原始圖像數(shù)據(jù)進行 DCT;
(2)依據(jù) DCT“能量集中”的特性以及人類視覺的 特性,對變換后數(shù)據(jù)進行量化;
(3)量化后的數(shù)據(jù)經(jīng)掃描后進行熵編碼(本文使用的編碼器為 QM 算術(shù)編碼器)。
圖1 給 出 了 16 bit圖 像 壓 縮 方 案 的 流 程 , 該 方 案 和JPEG 標 準 的 8 bit圖 像 壓 縮 方 案 基 本 相 同 ,只 是 在 量 化 和熵編碼部分進行了一定的擴充和改變。
2.2 DCT
DCT 是 一 種 實 數(shù) 域 變 換 , 是 一 種 簡 化 了 的 Fourier變換。 基于分塊 DCT 的 壓縮編碼 技 術(shù) 是已有圖 像 和視頻壓縮標準的核心 技術(shù) 。這主要是 因 為 DCT 具有 良 好的去相關(guān)性和能量壓縮特性并且 DCT存在快速算法。
由圖 1的編碼過程可知,先將圖像分割成若干個大小為8×8 像塊的集合 MCU。然后對塊內(nèi)的二元數(shù)據(jù)進行 DCT。
DCT的計算式如下:
其 中 ,syx(y,x=0,1,… ,7)為 塊 內(nèi) 像 素 值 ,Suυ(u,υ=0,1,… ,7)為 DCT 后的變換系數(shù)。
對 于 一 個 MCU 經(jīng) 過 DCT 后 得 到 64 個 DCT 系 數(shù) Suυ,其 中 ,S00稱 為 DC(直 流 )系 數(shù) ,剩 下 的 63 個 稱 為 AC(交 流 )系數(shù)。因為變換后圖像的能量主要集中在低頻的直流部分,這使得 DC 系數(shù)往往 很大,為了提 高 壓 縮率在編 碼 DC系數(shù)時并不是直接進行編碼而是采用差分編碼的方法。當(dāng)前 塊 的 DC 系 數(shù)與 相 鄰 的 前 一 個 像 塊的 DC 系 數(shù) 作 差,差值 用 Diff表 示 。得 到 的 差 值 Diff取 絕 對 值 后 減 1 賦 給 變 量Sz,即 :Sz=|Diff|-1。Sz 的 值 是 需 要 編 碼 的 數(shù) 值 。表 1 中 分 別給 出 了 8 bit、12 bit、16 bit圖 像 各 參 數(shù) 的 取 值 范 圍 ,其 中 S代表原始圖像像素值。
由表 1 中數(shù)據(jù)可以看出相比于 8 bit和 12 bit圖像的 Sz,16 bit圖像 Sz參數(shù)的取值范圍要大得多。在對 Sz進行編碼時,JPEG 標準的編碼方案中 的統(tǒng)計模型只能處理取值范圍在0~32 759 的數(shù)據(jù),即 JPEG 最大只能編碼 12 bit圖像。因此需要對統(tǒng)計模型進行擴展才能進行 16 bit圖像的壓縮編碼(本文的統(tǒng)計編碼部分將詳細介紹統(tǒng)計模型的擴展過程)。
圖1 16 bit 圖 像 壓 縮 流 程
2.3 量化
量化是使編碼數(shù)據(jù)量下降的一個有力工具,即將 DCT后的數(shù)據(jù)除以量化矩陣對應(yīng)位置的量化系數(shù)。量化系數(shù)越高,圖像壓縮率越高,但相應(yīng)的圖像質(zhì)量會越差。這就要求選擇合適的量化系數(shù),在滿足圖像質(zhì)量要求的同時達到最好 的 壓 縮 效 果 。JPEG 規(guī) 定 的 Annex K 方 針 中 有 對 于 亮 度分量和色差分量量化表的例子。由于本文所壓縮的圖像主要針對的是灰度圖像,所以只分析亮度分量的量化表。圖2為 JPEG 默 認 的 8 bit亮 度 圖 像 量 化 表 8_Y_Q。通 過 觀 察 量化表中的數(shù)據(jù),可以看出量化表左上角的量化系數(shù)值明顯小于右下角的系數(shù)值。這主要是因為圖像的像素塊經(jīng)過二維 DCT 后,像素塊的 低頻數(shù)據(jù)集中 在 二維矩陣 的 左 上角,高頻數(shù)據(jù)集中在右下角,而人類視覺具有難以感覺高頻率失真的特點,所以在低頻區(qū)域選擇較小的量化系數(shù)以滿足人類視覺對圖像質(zhì)量的要求,而在高頻區(qū)域選擇較大量化系數(shù)來盡可能的提高壓縮率。
表1 參數(shù)取值范圍
圖2 亮度分量用量化表 8_Y_Q
基 于 8 bit亮 度 圖 像 量 化 表 可 以 得 到 16 bit亮 度 圖 像量化表。定義質(zhì)量因子 Q,Q 的取值范圍為 1~100。當(dāng) Q=1時,解壓圖像質(zhì)量最差;當(dāng) Q=100 時,解壓圖像 質(zhì) 量 最好,此時相當(dāng)于沒有量化,解 壓 圖像的 失 真 完全由 DCT 的 精度引起的。定義縮放因子 S_Q,S_Q 與 Q 的關(guān)系為:
最 后 , 由 M_Q 生 成 16 bit亮 度 圖 像 量 化 表 16_Y_Q,16_Y_Q 的每個元素由式(5)計算
可 見 ,當(dāng) Q=50 時 ,16 bit亮 度 圖 像 量 化 表 與 8 bit 亮度 圖 像 量 化 表 相 等 ; 當(dāng) Q=100 時 ,16 bit亮 度 圖 像 量 化 表的值都為 1。
2.4 統(tǒng)計編碼
由于 DC 差分值和 AC 系數(shù)是多值數(shù)據(jù),而本文所使用的 QM 算術(shù)編碼器的輸入數(shù)據(jù)要求是“0”或“1”的二值數(shù)據(jù)。因此在編碼前需要將多值數(shù)據(jù)二值化,在二值化過程 中 ,為 了 提 高 二 進 制 算 術(shù) 編 碼 的 編 碼 效 率 ,對 DC 差 分值和 AC 系數(shù)采取統(tǒng)計編碼的方法(DC 差分值和 AC 系數(shù)所 進行的統(tǒng)計 編 碼 是不同的 )。此 方 法 需要分 別 用 DC 差分 值索引(見表 2)和 AC 分量 索引(見表 3)根 據(jù) 各自不同的判定條件,將“0”或“1”輸入各自對應(yīng)的編號處,生成二進制信號。
表2 DC差分值編碼的統(tǒng)計模型
DC 差 分 值 Diff是 根 據(jù) 表 2(表 2 是 經(jīng) 過 擴 展 后 的 統(tǒng) 計模型)的統(tǒng)計模型來附加條件的。其中,前后關(guān)系索引為區(qū)分二值信號的概率狀態(tài)推斷機的索引,根據(jù)編碼判斷條件輸入“0”或“1”時,進行獨立的 MPS/LPS 出現(xiàn)概率的優(yōu)化。例如 前 后 關(guān) 系 索 引 中 S0,當(dāng) Diff為 零 時 輸 入 “0”,非 零 時 輸 入“1”。并 且 S0、SS、SP、SN 根 據(jù)前一像 塊 的 DC 差 分 值 大 ?。―a)分 為 負 的 大 振 幅 (-L)、負 的 小 振 幅 (-S)、零 附 近 (/0/)、正的 小 振 幅(+S)、正的大振幅(+L)5 種情況。針對這 5 種不同狀態(tài)可以規(guī)定 S0 的索引值分別為 0、4、8、12、16。
Sz(Sz=|Diff|-1)的 值 與 表 3(表 3 是 擴 展 后 的 表 )中的 最 大 邊 界 值 M 由 小 到 大 進 行 順 序 比 較 ,Sz>Mi(i=0,… ,19)時 ,前后關(guān)系索引 Xi為“1”;Sz<Mi時,為“0”。并且各組編號內(nèi)的具體值需要追加補充比特。不同的 Sz會有不 同 的 補 充 比 特 位 數(shù) 與 之 對 應(yīng) ,表 3 列 出 了 Sz 的 所 有可能值,以及 Sz在 不 同 取 值 范 圍時 所 對 應(yīng)的 補 充 比特的 bit數(shù) 。
表3 系數(shù)成組化的大小范疇
相比于表 2,IJG 標準中的 DC 差分值編碼統(tǒng)計模型表中沒有前后關(guān)系索引值為 X16~X19 以及 M16~M19 這 8 行 。這 意 味 著 IJG 標 準 中 只 能 處 理 Sz<32 768 的 數(shù) 據(jù) 。對 比 表1 中 分 別 列 出 的 8 bit、12 bit、16 bit圖 像 Sz 的 取 值 范 圍 0~2 039、0~32 759、0~524 271,可 以 得 出 IJG 標 準 最 大 只 能編 碼 12 bit圖 像 。而 本 文 中 經(jīng) 過 擴 展 的 DC 差 分 值 編 碼 統(tǒng)計 模 型 能 夠 處 理 Sz<524 288 的 數(shù) 據(jù) ,因 此 能 夠 對 16 bit圖像數(shù)據(jù)進行統(tǒng)計編碼。
根 據(jù)該統(tǒng) 計模型 可以將 DC差 分 值 變 換成成對的CX 和 D(其中,CX 為前后關(guān)系索 引,D 為“0”或“1”的二值數(shù)據(jù))。
下 面 列 舉 一 個 DC 差 分 值 Diff為 -20 時 生 成 CX 和 D值的例子。
假 設(shè) Da 的 大 小 在 零 附 近 ,則 S0=8,Diff≠0,所 以D=1;
Diff為 負 數(shù) ,所 以 :
對應(yīng)的補充比特為 M5=38,補充比特數(shù)為 4。19-24= 3,所以 4 位補充比特為 0011。
AC 系數(shù)編碼的統(tǒng)計模型見表 4,該表為擴展之后的表,擴展部分為前后關(guān)系索引值為 X16~X19 和 M16~M19這 8行。它的判斷與 DC差分值相同。表 4中的 k值表示的是二維的 AC 系數(shù)經(jīng)過“之”字 掃描 變?yōu)橐?維數(shù)據(jù) 后的順 序 值 。通 常 規(guī) 定 一 個 固 定 的 k 值 Kx(Kx 的 默 認 值 為 5)來將 AC 系數(shù)分成低頻率 和高頻率兩種情況,因此 X2,…,X19,M2,…,M19 有 兩 種 狀 態(tài) 。EOB 表示 AC 系 數(shù) 段 的 結(jié) 束(即由 AC 系數(shù)末尾開始全為零的段)。
表4 AC系數(shù)編碼的統(tǒng)計模型
2.5 QM 算術(shù)編碼
QM 算術(shù)編碼器如圖 2(a)所示,其輸入 為 上 下文索 引CX 和比特 D,CX 和 D 成對壓入編碼器, 生成以字節(jié) 為單位的壓縮碼流。其中,上下文索引 CX 和比特 D 的產(chǎn) 生是DC 差分值和 AC 系 數(shù) 經(jīng)過上面 的 表“DC 差 分 值 編碼的 統(tǒng)計模型”和表“AC 系數(shù)編碼的統(tǒng)計模型”得到的。
圖2 QM算術(shù)編碼
QM 算術(shù)編碼基本原理:根 據(jù) 輸 入的每個 (CX,D)確 定MPS 編 碼 或 LPS 編 碼 ,按 MPS 或 LPS 編 碼 劃 分 區(qū) 間 寬 度A(A 的取值范圍為 0x8000~0xFFFF),區(qū) 間寬度 A 分 為 Qe和 Pe 兩 部 分 (Qe 為 小 概 率 區(qū) 間 在 上 面 ,Pe 為 大 概 率 區(qū) 間在下面)。MPS 編 碼 后 區(qū) 間 寬 度 A 被 更 新 為 Qe 和 Pe 中 較大的一個。LPS 編 碼 后 區(qū) 間 寬 度 A 被 更 新 為 Qe 和 Pe 中 較小的一個。當(dāng)更新后的區(qū)間寬度 A 小于 0x8000,A 和 C 寄存器需要歸一化處理,保證 A 值不小于 0x8000。因為 C 寄存器的位寬度有限,當(dāng)其值大到一定程度時必須輸出高位比特,高位比特按字節(jié)輸出形成壓縮碼流。
QM算數(shù)解碼的過程是編碼的逆過程這里不再贅述。
仿真實驗中的測試圖像為人體肺部的 CT 圖像,測試圖像如圖 3所示。圖像的壓縮實驗數(shù)據(jù)見表 5。壓縮圖像的質(zhì)量評價標準采用客觀評價準則。最常用的方法為均方誤差(MSE)和 峰 值 信 噪 比 (PSNR)[6]。PSNR 的 值 越 大 ,壓 縮 圖 像質(zhì)量越好,壓縮過程造成的失真越少。二者的定義如下。
給 定 一 幅 原 始 圖 像 ,圖 像 上 的 像 素 點 值 以 S(x,y)(0≤x≤M-1,0≤y≤N-1)表示,而解壓后的圖像像素點值以R(x,y)(0≤x≤M-1,0≤y≤N-1)表 示 ,圖 像 的 尺 寸 為 M×N。
均方差定義如下:
峰值信噪比定義如下:
圖3 16 bit 測 試 圖 像
表5 16 bit測 試 圖 像 壓 縮 數(shù) 據(jù)
其 中 ,Smax=65 535。
分析表5中數(shù)據(jù)可知,壓縮過程中質(zhì)量因子Q值越小,圖像的壓縮比越大,但相應(yīng) 的 PSNR 值 越小,即解壓 后的圖像失真越嚴重。當(dāng) Q=100 時壓縮過程相當(dāng)于不進行量化處理,壓縮與解壓縮過程中的數(shù)據(jù)損失僅發(fā)生在 DCT和反 DCT 時的 計算精度 的損失,解壓 后 的 圖像質(zhì) 量 最 好,然而此時的壓縮比只有 2左右,不能滿足有效降低數(shù)據(jù)量的 要 求 。當(dāng) Q=5 時 雖 然 壓 縮 比 能 夠 達到 20 左 右 ,但 由 于量化步長太大,解壓后圖像失真會比較嚴重。通常情況下,PSNR 值 在 70 dB 左 右 時 解 壓 恢 復(fù) 的 圖 像 不 會 有 太 大 的 失真,足以滿足人們提取圖像中信息的要求。由表 5中的實驗數(shù)據(jù)可以看出在此峰值信噪比時圖像的壓縮比大約在6 左 右 ,已 經(jīng) 能 很 大 程 度 地 減 小 16 bit圖 像 的 數(shù) 據(jù) 量 ,便 于圖像的存儲與傳輸。
本文詳細地介紹了 DCT、量化、QM 算數(shù)編碼的原理,給 出 了 完 整 的 16 bit圖 像 壓 縮 方 案 。本 文 按 照 JPEG 壓 縮方案的流程,對量化和熵編碼部分進行了一定的修改和擴充 ,從 而 實 現(xiàn) 了 16 bit圖 像 的 有 損 壓 縮 。 由 仿 真 實 驗 可 以看 出 ,運 用 本 文 的 壓 縮 方 法 對 16 bit圖 像 進 行 壓 縮 可 以 得到很好的壓縮率。通過選擇不同的質(zhì)量因子 Q可以獲得滿足一定要求的 PSNR 值,從而 保 證解壓后 的 圖 像質(zhì)量能 夠滿足實際的需要。
隨 著 16 bit圖 像 應(yīng) 用 的 日 益 廣 泛 ,關(guān) 于 16 bit圖 像 的壓縮研究也將會日益增多。高壓縮比、低損失永遠是人們在 圖 像 壓 縮 領(lǐng) 域 中 所 追 求 的 。把 在 8 bit圖 像 壓 縮 中 廣 泛使 用 的 小 波 分 析[7]以 及 視 頻 壓 縮 中 幀 內(nèi) 編 碼[8]等 比 較 先 進的 方 法 ,應(yīng) 用 在 16 bit圖 像 壓 縮 中 ,以 提 高 壓 縮 比 ,將 成 為未 來 16 bit圖 像 壓 縮 發(fā) 展 的 趨 勢 。
[1] National Electrical Manufacturers Association(NEMA).Digital imaging and communications in medical(DICOM)[S].2003.
[2] 孫 中 柏. 一 種 16 位 灰 度 圖 像 無 損 壓 縮 和 解 壓 縮 方 法 [D]. 西安:西安電子科技大學(xué),2012. SUN Z B.A method of16-bitgrayscale imagelossless compression and decompression [D].Xi’an:Xidian University, 2012.
[3] CCITT.ISO/IEC 10918-1,T.81(09/92)[Z].FRENCH:CCITT,1992.
[4] 小 野 定 康 ,鈴 木 純 司 .PEG 技 術(shù) [M].葉 明 ,譯 .北 京 :科 學(xué) 出 版社, 2003. ONO JoKang,JUNJI Suzuki.JPEG technology[M].Translated by YE M.Beijing:Science Press,2003.
[5] 小 野 定 康 ,鈴 木 純 司.JPEG2000 技 術(shù) [M]. 增 強 福 ,譯. 北 京 :科學(xué)出版社, 2004. ONO JoKang, JUNJI Suzuki.JPEG2000 technology [M]. Translated by ZENG Q F.Beijing:Science Press,2004.
[6] 徐 世 寅.以 MQ 算 術(shù) 編 碼 器 為 核 心 技 術(shù) 的 靜 態(tài) 圖 像 壓 縮 [D].天津 :天 津 工 業(yè) 大 學(xué) ,2013:55-56. XU S Y.The static image compression based on MQ arithmetic coder as the core technology [D].Tianjin:Tianjin Polytechnic University,2013:55-56.
[7] 鄭 偉 ,崔 躍 利 ,王 芳. 基 于 小 波 變 換 的 圖 像 壓 縮 編 碼 研 究 綜述[J].通信技術(shù),2008,2(41):85-96. ZHENG W,CUI Y L,WANG F.A review of image compression coding based on wavelettransform [J].Communications Technology,2008,2(41):85-96.
[8] 畢 厚 杰 ,王 健 .新 一 代 視 頻 壓 縮 編 碼 標 準 —H.264/AVC[M]. 北京:人民郵電出版社,2009. BI H J,WANG J.A new generation of video compression coding standard-H.264/AVC [M].Beijing:Posts and Telecom Press,2009.
Application of 16 bit image lossy compression based on the JPEG standard
XU Nini,LI Chenguang
School of Electronics and Information Engineering,Tianjin Polytechnic University,Tianjin 300387,China
The principle and detailed process of 16 bit image lossy compression were given.The data of 16 bit image is large and JPEG does not support the 16 bit image compression,which makes it inconvenience in 16 bit image’s storage and transmission.Based on the scheme of JPEG compression,the statistical model was expended(improving the tables of statistical model for DC coefficient coding and statistical model for AC coefficient coding respectively).This made it can deal with the data of 16 bit and realized the ideal of the compression of 16 bit static images.The quantization table used was generated based on the Luminance quantization table in JPEG.The encoder adopted was QM arithmetic encoder.An objective evaluation standard PSNR was chosen to evaluate the quality of the decompressed images.
16 bit image lossy compression,statistical model for DC coefficient coding,statistical model for AC coefficient coding,QM arithmetic encoder
TN911.7
:A
10.11959/j.issn.1000-0801.2016106
徐妮妮(1974-),女,博士,天津工業(yè)大學(xué)副教授、碩士生導(dǎo)師,主要研究方向為靜態(tài)圖像壓縮、視頻編碼等。
李 晨 光 (1990-), 男 , 天 津 工 業(yè) 大 學(xué) 碩 士生,主要研究方向為靜態(tài)圖像壓縮、視頻壓縮編碼。
2015-10-18;
2016-03-11