李永前,張二虎
(西安理工大學印刷包裝與數(shù)字媒體學院,陜西西安710048)
半調(diào)技術被廣泛應用于印刷、出版及電子顯示等領域,它是將連續(xù)調(diào)圖像轉(zhuǎn)換為二值圖像的一項技術,轉(zhuǎn)換后的二值圖像在一定距離觀察下可近似為連續(xù)調(diào)圖像。由于半調(diào)圖像僅包含0或1兩個階調(diào),而現(xiàn)有的圖像處理技術大多是針對連續(xù)調(diào)圖像的,因此,如何實現(xiàn)半調(diào)圖像的連續(xù)調(diào)恢復,即逆半調(diào)技術,成為了數(shù)字印前系統(tǒng)、半調(diào)圖像轉(zhuǎn)換加網(wǎng)、數(shù)字化檔案管理、印刷圖像分類識別等具體應用領域的重要研究課題。
逆半調(diào)技術的研究始于20世紀90年代[1],按照其實現(xiàn)原理,可分為以下幾類:濾波法、反褶積法、迭代法、機器學習法、矢量法等[2]。在現(xiàn)有的方法中,基于查找表(Lookup-table,簡稱LUT)的逆半調(diào)方法屬于機器學習法[3],它通過訓練集建立半調(diào)圖像值與連續(xù)調(diào)圖像值之間的查找表,然后通過查表的方法重構出連續(xù)調(diào)圖像。相對于其它逆半調(diào)方法,該方法充分利用了原有連續(xù)調(diào)圖像特征以及先驗知識,減少了逆半調(diào)圖像信息的損失和信息失真度,而且這個方法可以分區(qū)并行操作,處理速度高于其他方法,所以具有更高的研究價值[4-6]。
基于LUT的逆半調(diào)方法的關鍵在于模板的設計與表中空值項的估計,模板的大小、形狀以及模板中有效像素的相對順序直接影響了圖像的重建質(zhì)量。近幾年,國內(nèi)外學者提出了多種改進的基于LUT的逆半調(diào)方法,如利用圖像紋理信息、神經(jīng)網(wǎng)絡等改進的逆半調(diào)方法,但對直接影響逆半調(diào)圖像質(zhì)量的模板選擇問題卻很少研究。2001 年 Mese等[7,8]提出了一種基于貪心算法的模板選擇方法,此后該模板的選擇一直沿用該方法,但該方法并不能求得全局最優(yōu)模板,存在一定缺陷。在空值項估計方面,提出的方法有低通濾波法、漢明距離法、最佳線性估計法[3]。2007年,孔月萍等[9]采用Elman神經(jīng)網(wǎng)絡方法進行了空值項估計的研究,取得了一定的改進效果,但估計精度仍然有待提高。
針對以上問題,本文提出了相應的改進方法。
首先,針對基于LUT逆半調(diào)方法恢復出的圖像在平緩區(qū)域存在噪聲的問題,提出基于查找表和基于高斯濾波相融合的方法,其框架如圖1(a)所示。
圖1 基于改進查找表和高斯濾波相融合的方法Fig.1 Method based on improved LUT and Gaussian filter fusion
其次,針對最優(yōu)模板的選擇問題,提出了基于粒子群的最優(yōu)模板優(yōu)化方法。
最后,采用超限學習機(Extreme Learning Machine,簡稱ELM)[10,11]作為空值項擬合模型,以提高空值項的擬合精度。
經(jīng)典LUT逆半調(diào)方法的原理如圖2所示,它以多組半調(diào)圖像及其連續(xù)調(diào)圖像作為學習樣本,學習之后形成一張半調(diào)模式值與連續(xù)值之間的映射表,從而可根據(jù)該映射表來估計半調(diào)圖像對應的連續(xù)值,完成半調(diào)圖像的逆半調(diào)處理。在圖2中,對訓練集中的半調(diào)圖像,由任一像素點o′及其周圍像素點a的不同組合可以形成不同的模板T1,典型的模板如圖2(b)所示,其中模板的不同取值形成了圖2(a)中LUT映射表的索引值,其在對應連續(xù)調(diào)圖像中的值o作為LUT映射表的連續(xù)值V。
圖2 經(jīng)典LUT逆半調(diào)方法原理Fig.2 The principle of the classical inverse halftoning method based on LUT
經(jīng)典LUT逆半調(diào)算法由建表和逆半調(diào)值生成兩個階段構成。建表階段需要多組半調(diào)圖像及其對應的連續(xù)調(diào)圖像作為學習樣本,利用模板滑動讀取半調(diào)圖像的模板像素值和對應的連續(xù)調(diào)值,建立初始的查找表。建表階段有兩種情況:一是相同的索引值對應不同的連續(xù)調(diào)值,對此采用這些不同連續(xù)調(diào)值的均值作為該索引值對應的連續(xù)調(diào)值;二是學習樣本有限時,許多索引值沒有其對應的連續(xù)調(diào)值,造成表中出現(xiàn)空值項的現(xiàn)象。對于空值項,提出基于ELM的空值項擬合方法,以提高擬合的精準程度。
超限學習機[10-11]是一種針對單隱藏層前饋神經(jīng)網(wǎng)絡的算法,其網(wǎng)絡結(jié)構如圖3所示,其中輸入層X={x1,x2, …,xl}與隱藏層的連接權值W以及偏置b是隨機產(chǎn)生,在訓練過程中無需調(diào)整,只需要對隱藏層與輸出層Y之間的連接權重β進行訓練學習(可利用廣義逆完成隱藏層與輸出層的連接權重矩陣的求解),故ELM具有較快的學習速度、良好的魯棒性和泛化能力、較高的擬合精度。在所設計的ELM網(wǎng)絡結(jié)構中,以初始建立的LUT中非空值項數(shù)據(jù)訓練ELM模型,其中輸入X為LUT中的索引值,輸出只有一個節(jié)點,為LUT中的連續(xù)調(diào)值y0,隱藏層節(jié)點數(shù)為50 。構建ELM空值項擬合模型:
圖3 ELM 網(wǎng)絡結(jié)構Fig.3 ELM network structure
(1)
式中,“*”代表卷積運算符;g(x)為激活函數(shù),常用硬限幅函數(shù)、Sigmoid函數(shù)或傅里葉函數(shù),通過實驗比較逆半調(diào)圖像的效果,選擇Sigmoid函數(shù)作為激活函數(shù),其計算公式為:
(2)
實驗中,提取初始LUT中非空值項的索引值和對應的連續(xù)值作為輸入層和輸出層樣本,按照訓練樣本和測試樣本數(shù)量比為9:1,對隱藏層與輸出層的連接權重進行學習,完成基于ELM空值項擬合模型參數(shù)的求解。對于LUT表中的空值項,將其索引值作為輸入層,利用訓練好的ELM空值項擬合模型,就可估計出對應的連續(xù)值,從而得到完整的LUT映射表。
在基于LUT的逆半調(diào)方法中,形成索引值的模板設計非常重要,模板的大小和其中有效像素數(shù)目與LUT的長度成正比關系,與模板優(yōu)化運行效率成反比關系,而且直接影響著逆半調(diào)圖像的質(zhì)量[12]。如何求取全局最優(yōu)的模板是當前該領域研究的一個重要問題,文中采用粒子群優(yōu)化方法,構建了一種最優(yōu)模板。
粒子群優(yōu)化算法(Particle Swarm Optimization,簡稱PSO)的基本核心是利用群體中的個體對信息的共享,使整個群體的運動在問題求解空間中產(chǎn)生從無序到有序的演化過程,從而獲得問題的最優(yōu)解?;诹W尤旱淖顑?yōu)模板優(yōu)化方法步驟為:
1) 初始化粒子種群
由于LUT最優(yōu)模板選擇是一個非連續(xù)的問題,因此要先對粒子群算法的初始種群T進行隨機編碼。在編碼時,針對有效像素數(shù)目為M的LUT表中的模板,可看作在N×N的窗口中選取M個位置。首先,模板中心點的目標像素位置選定為“0”;其次,模板的其他位置隨機賦值為1~(N2-1),而數(shù)值為0~(M-1)的位置即為LUT模板的有效像素。對于編碼的順序,從模板左上角開始,按照自左向右、自上而下的順序?qū)UT模板進行掃描,得到種群個體。例如,N為5、M為16時,由于目標像素 “0” 位置不變,所以只需要1~24的位置,就可形成不同的模板,編碼得到粒子個體的過程如圖4所示。
圖4 一個LUT模板編碼過程Fig.4 A LUT template encoding process
2) 計算個體的適應度值
峰值信噪比(PSNR)是評價重建圖像質(zhì)量的最常用的指標。由于逆半調(diào)與圖像壓縮編碼均涉及重建問題,故用峰值信噪比作為計算適應度的函數(shù):
(3)
3) 更新粒子個體
在計算完當前粒子種群T的適應度后,首先比較選出當前種群中的最大適應度作為個體最優(yōu)Pbest和全局最優(yōu)Gbest;然后對當前粒子種群進行交叉和變異操作,產(chǎn)生新的種群T,使種群進化。交叉和變異的具體操作為:
① 交叉操作
交叉操作產(chǎn)生新種群分為兩個階段:一是與個體最優(yōu)進行交叉;二是與全局最優(yōu)進行交叉。首先,在Pbest/Gbest產(chǎn)生交叉位,交叉位的起始位置及長度均為隨機獲得,提取出交叉位上的數(shù)字,如圖5中Pbest/Gbest紅色標記出的14、9、22、3、4;然后對當前粒子個體,刪除與交叉位上相同數(shù)字的元素,如圖5中“粒子個體”中紅色標記出的元素;最后,將剩余的元素按照相對位置不變依次排列,得到新的粒子個體,并將交叉位的元素插入到新的粒子個體最后,保證粒子個體的數(shù)目不變(如圖5中“新的粒子個體”中紅色標記出的元素)。
圖5 交叉過程Fig.5 Cross process
②變異操作
首先,隨機產(chǎn)生變異位c1、c2,其值在1到N2-1之間,而且c1和c2不能相同;然后對變異位c1和c2的元素進行交換,產(chǎn)生新的粒子個體。變異過程如圖6所示。
圖6 變異過程Fig.6 Variation process
對于更新后的粒子種群,計算其中各個個體的適應度,選出當前種群中的最大適應度作為個體最優(yōu)Pbest,比較當前個體最優(yōu)和上代個體最優(yōu),取最大的適應度作為當前全局最優(yōu)Gbest。
4) 終止條件
通過實驗,設定最大進化次數(shù)gMAX,當達到最大進化次數(shù)時,優(yōu)化結(jié)束。
實驗中設置最大進化次數(shù)gMAX=150,種群數(shù)目為20??紤]到LUT的大小及運行效率,選擇模板大小N=5,模板中有效像素點數(shù)目M=16。
基于LUT的逆半調(diào)方法產(chǎn)生的連續(xù)調(diào)圖像具有較好的細節(jié)保留能力,但在圖像平緩區(qū)域容易產(chǎn)生噪聲,而高斯濾波可起到平滑的作用,為此,提出將基于查找表和基于高斯濾波的逆半調(diào)圖像進行融合。
高斯濾波是一種適用于消除高斯噪聲的線性平滑濾波,可以消除數(shù)字半調(diào)圖像中的噪聲,獲得具有較好平滑區(qū)的高斯逆半調(diào)圖像IG(x,y) :
IG(x,y)=(G*IH)(x,y)
(4)
式中,IH為數(shù)字半調(diào)圖像;G表示高斯核函數(shù);(x,y)表示目標像素。
通過基于PSO算法得到的最優(yōu)模板建立初始LUT,由ELM完成空值項擬合,通過查表的方式獲得基于LUT的逆半調(diào)圖像IL(x,y),將其與高斯濾波獲得的逆半調(diào)圖像IG(x,y)進行融合,得到最終的逆半調(diào)圖像I(x,y),該方法簡稱基于融合的算法,其公式為:
I(x,y)=w(x,y)IL(x,y)+[1-w(x,y)]IG(x,y)
(5)
w(x,y)=tanh(vL(x,y)/θ)
(6)
式中,w(x,y)為融合的權值系數(shù);θ為正值參數(shù);vL(x,y)是以目標像素 (x,y)為中心的n×n區(qū)域的方差,取n=5。使用tanh 函數(shù)既可以保證融合的權值系數(shù)在0~1之間,而且可以區(qū)分出圖像的細節(jié)和平滑區(qū)域。
大多數(shù)的彩色圖像半調(diào)處理是對色彩空間內(nèi)圖像所具有的各個顏色通道分別進行處理,然后再將各通道結(jié)果疊加得到彩色半調(diào)圖像。對于彩色圖像逆半調(diào),本文也是將彩色半調(diào)圖像的R、G和B三個顏色通道分別進行逆半調(diào)處理,實現(xiàn)彩色半調(diào)圖像的逆半調(diào)化。
本節(jié)對所提出的基于ELM的空值項擬合、基于PSO的模板優(yōu)化和逆半調(diào)圖像融合進行實驗,實驗全部在Matlab R2014a環(huán)境下完成。
本小節(jié)的實驗圖像均為灰度圖像,首先由15對大小為512×512的誤差擴散半調(diào)圖像和對應的連續(xù)調(diào)圖像集作為訓練樣本,完成初始LUT表的建立及基于ELM的空值項擬合模型的建立,LUT表的模板采用16pels的形式;然后由8對大小為512×512的誤差擴散半色調(diào)圖像和對應的連續(xù)調(diào)圖像集作為測試樣本,采用PSNR對生成的逆半調(diào)圖像質(zhì)量進行評價。
對ELM中采用的不同激活函數(shù)進行實驗,實驗結(jié)果如表1所示,表1給出的是測試樣本的平均PPSNR值。從表1的PPSNR值可以看出,采用Sigmoid激活函數(shù)具有最好的效果。
表1 不同激活函數(shù)得到的PPSNR值
對于空值項的擬合精度,采用平均相對誤差(Average Relative Error,簡稱ARE)進行評價,其計算公式為:
(7)
式中,u表示圖像中空值項數(shù);IZ表示圖像中空值項的真實連續(xù)調(diào)值;IN表示空值項的擬合值。
表2給出了8幅測試圖像的空值項數(shù)和平均相對誤差值。從表2可以看出,每幅測試圖像都有較多的空值項,擬合后的空值項的平均相對誤差都在0.1左右,說明ELM擬合達到了較高的精度。
表2 測試圖像擬合值的平均相對誤差
為了提高訓練與測試的速度,實驗采用灰度圖像。訓練樣本為15對大小為512×512的誤差擴散半調(diào)圖像和對應的連續(xù)調(diào)圖像集,測試樣本為8對大小為512×512的誤差擴散半調(diào)圖像和對應的連續(xù)調(diào)圖像集,訓練樣本和測試樣本互不相同。
為體現(xiàn)PSO算法的優(yōu)勢,同時采用差分進化算法[12](Differential Evolution Algorithm,DE)、精英遺傳算法[13](Elitist Genetic Algorithm,EGA)求取最優(yōu)模板,并對比其結(jié)果。實驗中各種算法的最大進化次數(shù)均為150,種群規(guī)模均為20。
圖7是各算法的收斂速度,可以看出,本文提出的基于PSO算法的收斂速度最快,其次是DE算法和EGA算法。圖8是各算法求得的模板,其中圖8(b)和(c)是實現(xiàn)文獻[12]和[13]算法得到的最優(yōu)模板,圖8(a)是PSO算法求得的最優(yōu)模板,它與另外兩個最優(yōu)模板相近,但是更能體現(xiàn)有效像素相對順序的影響。表3給出的是由不同模板生成的逆半調(diào)圖像的平均PPSNR值,可以看出,本文PSO算法獲得的最優(yōu)模板是最好的。
圖7 各算法進化次數(shù)與PPSNR關系Fig.7 Relationship between the evolution times and PPSNR of each algorithm
圖8 各算法求得最優(yōu)模板Fig.8 The best template of all algorithms
算法PPSNR/dB本文PSO算法30.054DE算法[12]29.294EGA算法[13]29.294
實驗中學習樣本為60對大小為256×256的彩色誤差擴散半調(diào)圖像和相應的連續(xù)調(diào)圖像集,測試樣本為10對大小為256×256的彩色誤差擴散半調(diào)圖象和相應的連續(xù)調(diào)圖像集,學習樣本和測試樣本互不相同。 實驗首先確定相關參數(shù),然后對最終生成的彩色逆半調(diào)圖像質(zhì)量進行評價分析。
圖9是學習樣本數(shù)量對逆半調(diào)圖像質(zhì)量的影響。實驗中學習樣本的數(shù)量S從15變化到60,變化的步長為5,測試樣本數(shù)量為10。從圖9可以看出,當學習樣本數(shù)量逐漸增加到50時,平均PPSNR值是逐漸增大的,超過50時,平均PPSNR值減小,故選擇學習樣本數(shù)量為50。
圖10 是高斯濾波逆半調(diào)處理中參數(shù)σ的選擇實驗。σ值從0.6變化到2.4,變化步長為0.2,計算10對測試樣本的平均PPSNR值作為評價標準。從圖10 可以看出,σ=1.2時平均PPSNR值最大。
圖9 學習樣本數(shù)量與平均PPSNR的關系Fig.9 Relationship between the number of learning samples and the average PPSNR
圖10 σ 與平均PPSNR的關系Fig.10 Relationship between σ and average PPSNR
對于式(6)中θ的取值,圖11給出了參數(shù)θ從100變化到5100,變化步長為100時,10對測試樣本平均PPSNR值隨θ變化的情況??梢钥闯觯S著θ值的增大,平均PPSNR值逐漸增大,當達到5000時基本趨于穩(wěn)定。
根據(jù)以上實驗,最終選擇的參數(shù)為S=50、σ=
1.2、θ=5000。在這組參數(shù)下,實驗對4種方法生成的彩色逆半調(diào)圖像的質(zhì)量進行評價。
表4給出了各種方法的實驗結(jié)果,其中“LUT(空值未補)”表示基于LUT逆半調(diào)方法,空值項未作處理;“LUT(ELM補全空值)”表示基于LUT逆半調(diào)方法,空值項由ELM擬合。表4給出的是10幅彩色逆半調(diào)圖像的平均PPSNR值,從表中可以看出,本文基于融合的算法是最優(yōu)的,取得了最高的PPSNR值。
圖11 θ與平均PPSNR的關系Fig.11 Relationship between θ and average PPSNR
算法PPSNR/dBLUT(空值未補)26.296LUT(ELM補全空值)27.492Gaussian濾波法26.046本文基于融合的算法31.115
圖12給出了一幅用于測試的彩色半調(diào)圖像由不同方法處理的結(jié)果。
圖12 各種不同算法的處理后的彩色圖像比較Fig.12 Comparison of inversed color image restored by different algorithms
從視覺效果來看,圖12(c)LUT(空值未補) 方法恢復出的圖像達到了一定的去噪效果,但是有較明顯的白色斑點;圖12(d)LUT(ELM補全空值)方法恢復出的圖像在眼睛部分的瞳孔和瞳仁處有很高的區(qū)分度,但是仍有較不明顯的白色斑點,且在圖像的平緩區(qū)域存在著均勻分布的噪聲;圖12(e) 基于Gaussian濾波方法恢復出的圖像雖然有較好的平滑效果,但該圖像的細節(jié)部分卻沒有圖12(d)好,眼睛部位較模糊,區(qū)分度不高;圖12(f) 是文中所提基于融合的方法恢復出的圖像,可以看出,其與原連續(xù)調(diào)圖像有較高的相似度,人物的頭發(fā)和眼睛部位等細節(jié)處有較高的還原度,且濾除了平緩區(qū)域的噪聲及其它的斑點,取得了最好的視覺效果。
本文提出了一種改進的基于查找表的彩色逆半調(diào)方法,其改進之處包括:
1) 采用基于粒子群的優(yōu)化方法獲得了最優(yōu)模板,并與差分進化算法、精英遺傳算法進行比較,結(jié)果表明,本文算法求得的最優(yōu)模板對半調(diào)圖象恢復有更好的效果,求得的最優(yōu)模板更加符合數(shù)字圖像像素之間的相關性,而且較其它兩種算法有更快的收斂速度;
2) 提出了基于ELM的空值項擬合方法,有效地消除了恢復圖像中的斑點;
3) 提出了一種融合LUT逆半調(diào)圖像和高斯濾波逆半調(diào)圖像的算法,在保留圖像細節(jié)的同時去除了平緩區(qū)域的噪聲,在客觀評價和主觀評價方面均取得了最好的效果。