熊麗珍,何慧琴,羅文琪,舒忠
(荊楚理工學(xué)院,荊門 448000)
為獲得高質(zhì)量的彩色印刷品,檢測控制印刷圖像的顏色和紋理是非常關(guān)鍵的。
2007年以來,Labate D團隊研究人員陸續(xù)發(fā)表了關(guān)于Shearlet數(shù)學(xué)理論及Shearlet變換在圖像處理中應(yīng)用的系列論文[1],取得一系列重要的基礎(chǔ)性研究成果。在多尺度幾何分析中,只有他們提出的Curvelet能滿足與Shearlet相似的稀疏性[2],通過Shearlet的方向數(shù)目在每一個尺度加倍,使得Shearlet實現(xiàn)了像小波一樣的迭代算法,且推廣到了經(jīng)典的級聯(lián)算法。近幾年來,在Shearlet變換應(yīng)用方面成頗豐,例如:文獻[3-4]提出通過Shearlet變換,利用稀疏最優(yōu)化模型加入迭代閾值進行編碼,實現(xiàn)圖像去噪處理。文獻[5]提出了Shearlet變換耦合頻率特征的多聚焦圖像融合算法,完成高頻子帶的融合。文獻[6]提出了結(jié)合顏色和深度數(shù)據(jù)的邊緣檢測算法,實現(xiàn)了針對兩幅圖像中相同顏色的邊緣提取。文獻[7]提出了基于BP神經(jīng)網(wǎng)絡(luò)的圖像邊緣檢測算法,提高了檢測精度及抗噪聲能力,等等。
圖像識別技術(shù)的研究主要是應(yīng)用于圖像檢索領(lǐng)域,圖像檢索技術(shù)起源于上世紀(jì)60年代。自2010年以來,圖像識別技術(shù)經(jīng)過大規(guī)模集成化[8]向智能化[9]方向發(fā)展。文獻[10]以卷積神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用為基礎(chǔ),提出了采用深度學(xué)習(xí)模型進行圖像檢索;文獻[11]依據(jù)提取圖像中層特征并應(yīng)用訓(xùn)練分類器,提出了局部空間和多特征上下文信息的場景分類技術(shù)進行圖像檢索;有文獻依據(jù)編碼解碼思想提出的“單詞-句子-錯誤分析”模型[12]和依據(jù)計算機翻譯思想提出的“特征提取-句子-單詞”模型[13]的圖像描述檢索技術(shù);文獻[14]提出依據(jù)對收集到的圖像內(nèi)容數(shù)據(jù)集,并采用卷積神經(jīng)網(wǎng)絡(luò)進行分類,以問題文本方式產(chǎn)生答案的視覺問答技術(shù)實現(xiàn)圖像識別;文獻[15]提出依據(jù)機器人環(huán)境認知和圖像匹配(輸入圖像與數(shù)據(jù)庫已有圖像匹配)數(shù)據(jù)集,采用空間一致性認證和投票機制的機器人視覺識別技術(shù)實現(xiàn)圖像檢索。
當(dāng)前,能夠與印刷和包裝行業(yè)現(xiàn)有技術(shù)條件接軌的圖像檢索方式的選擇,應(yīng)以基于內(nèi)容、顏色和形狀等不同特征進行分類的方式為研究基礎(chǔ),畢竟全智能化機器人技術(shù)在印刷設(shè)備上的應(yīng)用并不普及。此類技術(shù)應(yīng)用的突出成果是使用顏色直方圖來描述圖像顏色特征,文獻[16]中對早期和近幾年來多特征融合圖像識別技術(shù)應(yīng)用的主要思想和核心算法進行了論述,同時,提出了一些較為先進的改進算法。選擇顏色直方圖來描述圖像顏色特征的好處還能夠較好地滿足對一些不易進行分割的印刷圖像進行識別。
本文嘗試將圖像邊緣檢測和顏色特征提取運用到圖像識別中,通過形狀與顏色特征結(jié)合的方式實現(xiàn)圖像檢索。在研究中所應(yīng)用到的一些其他支撐技術(shù),如:圖像邊緣提取中需要應(yīng)用到的圖像增強、圖像分割、圖像規(guī)范化、邊緣輪廓描述、圖像對比等算法和顏色特征提取中的印刷圖像去加網(wǎng)、顏色空間轉(zhuǎn)換、顏色矩、顏色熵、顏色聚合向量、顏色相關(guān)圖等算法,將引用一些現(xiàn)有的成熟研究成果。本文研究的關(guān)鍵點是Shearlet變換、顏色直方圖和向量機(SVM)技術(shù)的綜合應(yīng)用方面,研究目標(biāo)是在眾多的印刷圖像中準(zhǔn)確找出所需要的某幅圖像,研究的意義在于為后續(xù)圖像色彩控制中識別某個像素點的亮度和顏色信息奠定基礎(chǔ)。
Shearlet變化的核心是剪切波的引入,剪切波的本質(zhì)是傅里葉變換與連續(xù)小波變換的有機結(jié)合。在剪切波變換中,通過控制剪切參數(shù)和平移參數(shù)可以實現(xiàn)對剪切波的離散,使之具有頻域支撐、空域衰減、方向數(shù)目倍增等特性。本文的研究主要是建立Shearlet模極大值數(shù)學(xué)模型和Ostu最佳閾值選取數(shù)學(xué)模型。
在文獻[17-18]中的相關(guān)數(shù)學(xué)理論研究,形成了小波分析邊緣檢測數(shù)學(xué)模型,依據(jù)小波模極大值的變化規(guī)律(也就是通過模的相位角來確定圖像邊緣曲線梯度方向),可以得到圖像邊緣的灰度變化特征。實際上,由于小波模極大值中可能包含有圖像噪聲信息,在圖像檢測中,圖像邊緣的灰度變化結(jié)果必定會受到噪聲的影響。
由于圖像空域衰減,為圖像準(zhǔn)確地檢測圖像邊緣的幾何信息和方向特征提供了便利,且具有很強的自適應(yīng)性。通過對Shearlet變換中空域衰減造成的方向敏感特性加以應(yīng)用,利用小波模極大值算法原理,本文提出一種改進的Shearlet模極大值邊緣紋理檢測算法。其算法數(shù)學(xué)模型如下:
本文提出的Shearlet模極大值邊緣紋理檢測算法數(shù)學(xué)模型,設(shè)定圖像邊緣分解方向數(shù)為8(正方形像素中以中心點為原點,分別向四個角和四個邊的中心點擴散),求解確定在其中一個方向上的某個點Cn m,j(x,y)是否為模極大值所在的點,可以通過求余函數(shù)加以確定,其中,(x1,y1)為起始點坐標(biāo),r1(x1)和r1(y1)分別為的橫向和縱向開始。
在公式(1)中,x1-r1(x1)、y1-r1(y1),x1-r2(x1),y1-r2(y1)分別表示模極大值所在點的水平和豎直方向的兩組坐標(biāo)偏移量。
以上改進算法,在理論上準(zhǔn)確提取了圖像邊緣方向信息,剔除了噪聲,其檢測結(jié)果準(zhǔn)確性在實驗部分將進行驗證。
Shearlet變換的算法實現(xiàn)需要應(yīng)用圖像分割技術(shù),較早的圖像分割方法通常采用直方圖雙峰法,隨后被Ostu方法所替代,Ostu方法是一種基于類間方差最大的自動閾值選擇方法。本文通過對Ostu方法進行改進,實現(xiàn)Shearlet變換中的圖像分割。
設(shè)定:N為圖像的總像素數(shù),ni為灰度級i的像素數(shù)量,pi為灰度級為i值時的像素概率,則再設(shè)定:t為區(qū)分圖像邊緣與非邊緣的閾值,則整個圖像的灰度級可分為0~t和t+1~L-1兩段,圖像的平均灰度級可定義為,則圖像邊緣與非邊緣段的平均灰度級分別為,其中,
則可定義原圖像灰度級方差為:
(1)輸入圖像后進行銳化處理。
由于Shearlet變換檢測的是圖像的邊緣區(qū)域,因此,首先對輸入圖像進行銳化處理增強圖像的邊緣信息是必不可少的。銳化處理的最佳實現(xiàn)方法就是應(yīng)用Kirsch算子。本文使用的Kirsch算子數(shù)學(xué)模型建立過程如下:
設(shè)定一個以值為I(m,n)的像素點為中心像素點,建立一個3×3鄰域的像素方向分布模版(表1所示),形成一個二維矢量,將其定義為F。
表1 像素I(m,n)的3×3鄰域示意圖
設(shè)定p1,p2,…,p8分別表示Kirsch算子的8個方向上的卷積矩陣,定義每個方向之間的夾角為45°,則有:
根據(jù)Kirsch算子的計算原理,設(shè)定x=-5,y=3,z=3。
(2)對銳化處理后的圖像進行Shearlet變換。
Shearlet變換的核心是使用高斯概率密度函數(shù)建立轉(zhuǎn)換模型,使用ME最大期望算法獲取Shearlet變換系數(shù)集。本文使用的Shearlet變換采用放棄低頻信號、迭代強化高頻信號的方式突出邊緣信息,以確保檢測效果。
(3)使用計算獲取的最佳閾值檢測有效的Shearlet模極大值。
(4)使用Shearlet逆變換對圖像進行分割處理并還原分割后的圖像。
(5)強化圖像邊緣,輸出邊緣檢測結(jié)果。
印刷圖像復(fù)制,其色彩控制是必不可少的環(huán)節(jié)。依據(jù)最新的G7工藝質(zhì)控標(biāo)準(zhǔn),將灰平衡、Lab值和CMYK網(wǎng)點面積率設(shè)定為主要的控制參量,其依據(jù)主要是為了便于企業(yè)實施。由于每一種顏色所具備的獨有特征,本文將依據(jù)顏色直方圖理論,應(yīng)用支持向量機(SVM)的多特征融合識別方法,獲取印刷圖像的顏色特征進行精確檢索,為后序?qū)崿F(xiàn)與印刷原稿進行G7工藝參量比較分析提供技術(shù)支撐。
顏色的數(shù)學(xué)表示可以通過建立顏色空間來實現(xiàn),因此,顏色模型是實現(xiàn)圖像檢索的重要基礎(chǔ),在電子顯色設(shè)備中其主要的顏色參量為色相、飽和度和明度,而印刷圖像的顏色空間為CMYK,通常由CMYK四色油墨還原視覺色彩,且具有半色調(diào)特性,一定會影響電子顯色設(shè)備對顏色的表述。為了在計算機顯示器中準(zhǔn)確地實現(xiàn)印刷圖像的顏色顯示,必然將面對去加網(wǎng)和顏色模型轉(zhuǎn)換等問題。另外,圖像特征提取離不開圖像分割,而顏色量化則是圖像分割的重要組成部分。當(dāng)前使用的顏色量化技術(shù)主要包括均勻量化和非均勻量化兩種。
為了實現(xiàn)在計算機顯示器上的印刷圖像顏色特征提取,首先必須對印刷圖像進行去網(wǎng)化處理和圖像模式向HSV模式的顏色空間轉(zhuǎn)換,其轉(zhuǎn)換過程包括CMYK→Lab→HSV模式,中間加入Lab模式的目的是減少圖像亮度和顏色信息的損失,從而確保通過顏色直方圖獲取的顏色特征數(shù)據(jù)有效。在顏色直方圖中,縱坐標(biāo)表示某種顏色的像素點數(shù)量,橫坐標(biāo)表示該種顏色的顏色值。設(shè)定一幅圖像f(x,y)的大小為M×N,其顏色集為C,則該圖像的顏色直方圖可以表示為:
HSV顏色直方圖提取的關(guān)鍵首先是獲取H、S和V三個分量的直方圖,然后進行圖像主體信息篩選(降低計算量)并實現(xiàn)三分量量化,通過三分量一維化處理后得到圖像的整體直方圖。在分量量化時,應(yīng)考到慮印刷圖像僅為8位這一因素。在一維化處理的加運算中,H分量需要考慮S和V分量的量化級數(shù),S分量需要考慮V分量的量化級數(shù),V分量取自身量化結(jié)果。
SVM分類器的本質(zhì)是使用一種工具在兩種或兩種以上的顏色(或紋理)中將其中的一種最大限度地選出來加以標(biāo)識,當(dāng)然工具的選擇非常重要。在圖像識別中,所選用的工具通常就是一條直線(分割線),當(dāng)然,這條直線是從多條直線中選出的最完美的一條(其選擇依據(jù)是分割線盡可能離所有分割點越遠越好),在對工具進行數(shù)學(xué)描述時,可以將其定義為判別表達式。由于印刷圖像通常為靜止?fàn)顟B(tài)的平面圖像,就必須將圖像定義為一個線性分類面。然而,靜止?fàn)顟B(tài)的平面圖像具有非線性的特征,因此,SVM分類器的應(yīng)用還需要首先將非線性平面映射為線性平面,其實質(zhì)是核函數(shù)轉(zhuǎn)換空間的應(yīng)用。SVM分類器應(yīng)用的目的是實現(xiàn)最低誤差率的圖像顏色(或紋理)識別。其主要數(shù)學(xué)模型如下:
在原告的資格問題上,存在以下三種立法:(1)一元主義的立法。在法國,只有非婚生子女才能提起強制認領(lǐng)之訴。在日本,只有非婚生子女及其直系晚輩血親以及他們的法定代理人(代理人并無固有的權(quán)利)可以提起訴訟。?(2)二元主義的立法。又可分為以下兩類:其一,生父和生母主義的立法。在美國,生父和生母均可提起訴訟。?其二,生母和非婚生子女主義的立法。在我國臺灣地區(qū),非婚生子女本人或其生母或其他法定代理人可以提起認領(lǐng)訴訟(就生母、其他法定代理人的權(quán)利,存在固有權(quán)和代理權(quán)兩種解釋)。?(3)三元主義的立法。在英國,生父、生母、非婚生子女本人均可提起訴訟。
設(shè)定原稿圖像空間是由 (x1,y1),(x2,y2),(x3,y3),…,(xn,yn)組成,xi∈Rn,yi∈{ }+1,-1,其中,+1表示圖像的顏色,-1表示圖像的紋理。
分割線的判別表達式可定義為:
線性分類面可定義為:
圖1 具有二維特性的向量分類示意圖
本文提出的圖像邊緣提取和顏色特征認別機制,首先是對彩色印刷圖像進行灰度處理后,然后進行Shearlet變換提取邊緣特征,再對源圖像利用顏色直方圖提取顏色特征,獲取特征數(shù)據(jù)經(jīng)過SVM分類處理得到彩色印刷圖像的結(jié)果信息。SVM分類認別的實現(xiàn)過程如下:
(1)選取好進過灰度處理的彩色印刷圖像,利用Shearlet的相關(guān)函數(shù)對樣本圖片進行Shearlet,進而進行邊緣紋理特征提?。?/p>
(2)在對印刷圖像進行去網(wǎng)化和顏色空間轉(zhuǎn)換(CMYK→Lab→HSV)的基礎(chǔ)上,通過 H、S、V 分量一維化處理,對其進行直方圖顏色特征提?。?/p>
(4)將第3步中得到的特征和第1步中得到的特征結(jié)合起來,在SVM分類器中進行訓(xùn)練;
(5)輸入待測試的圖像進行比較分析,進而得到彩色印刷圖像的識別結(jié)果。
其實現(xiàn)流程如下:
圖2 用SVM分類器多特征融合識別彩色印刷圖像的流程
為了驗證基于Shearlet變換的圖像邊緣檢測的有效性,選取了六幅目標(biāo)印刷圖像進行仿真實驗。實驗結(jié)果如圖3所示,其中,(a1-a6)為印刷圖像原稿,(b1-b6)是用Canny算子進行邊緣檢測的圖像,(c1-c6)為文獻[7]中提供的邊緣檢測圖像,(d1-d6)是本文法實現(xiàn)的邊緣檢測的圖像。
圖3 不同邊緣檢測算法的實驗對比圖
本文通過主觀和客觀兩種方式對實驗所采用的三種圖像邊緣提取方法進行比較。主觀評判方式是在對提取的圖像邊緣進行放大后,直接通過視覺感受觀察圖像局部邊緣像素點的分布。觀察結(jié)果顯示:Canny算子提供的6幅圖像中邊緣像素點較多,表明噪點沒有被很好地抑制;通過文獻[7]算法提供的6幅圖像中邊緣像素點有所減少,但也較為明顯,表明噪點得到了一定的抑制;通過本文算法提供的6幅圖像中邊緣像素點最少,表明噪點得到了有效抑制。由于本文實驗選擇了花卉類圖像,此類圖像邊緣具有分界清晰的特點,邊緣像素點數(shù)量分布少,因此,采用以視覺感受方式的主觀圖像邊緣強化結(jié)果評判是有效的。
客觀評判方式采用FOM品質(zhì)因數(shù)指標(biāo)對邊緣檢測結(jié)果進行評估,三種算法邊緣檢測通過計算得到的FOM品質(zhì)因數(shù)指標(biāo)見表2所示,F(xiàn)OM品質(zhì)因數(shù)指標(biāo)的取值范圍是0~1,F(xiàn)OM值越趨于1表示質(zhì)量越好。
以上實驗結(jié)果表明:由于Canny算子采用的是一階偏導(dǎo)的有限差分來計算梯度的幅值和方向,受幅值和方向精度控制等因素影響,因此,細節(jié)信息捕捉與邊緣線連接效果并沒有達到最佳狀態(tài);文獻[7]算法是以標(biāo)準(zhǔn)圖像和傳統(tǒng)邊緣檢測算法檢測得到的邊緣信息為依據(jù)構(gòu)建的邊緣檢測BP神經(jīng)網(wǎng)絡(luò),由于受數(shù)據(jù)來源依據(jù)可靠性等因素的存在,從而導(dǎo)致圖像邊緣強化不夠;本文法提出的邊緣檢測方法,結(jié)合了Shearlet模極大值和Ostu閾值優(yōu)化選取數(shù)學(xué)建模,提高了灰度級區(qū)分度并進一步強化了圖像邊緣。
表2 FOM品質(zhì)因數(shù)評估
為了驗證多特征融合識別的有效性,本實驗選取100幅花卉類圖像進行識別,其中包括圖3所示的6幅目標(biāo)圖像。首先對圖像進行了像素值標(biāo)準(zhǔn)化處理,并利用HSV非均勻量化成128bin;然后制定三種本文介紹的圖像邊緣檢測方法與SVM分類器融合的圖像識別算法比較方案,分別對目標(biāo)圖像按照設(shè)計流程進行實驗;每次檢索輸入一幅目標(biāo)圖像,在檢索結(jié)果中統(tǒng)計正確的圖像數(shù)目計算6幅目標(biāo)圖像的平均查全率和平均查準(zhǔn)率。
表3中統(tǒng)計了使用三種圖像識別算法從100幅圖像中檢索6幅目標(biāo)圖像的平均查全率和查準(zhǔn)率,三種算法的主要區(qū)別在于采用了不同的邊緣檢測算法,進一步證實了3.1小節(jié)實驗中結(jié)果的準(zhǔn)確性,且查全率和查準(zhǔn)率是比較高的,說明了本文提出的顏色直方圖SVM分類器識別算法是可靠的。另外,實驗中還專門針對BP神經(jīng)網(wǎng)絡(luò)邊緣檢測技術(shù)進行了相關(guān)實驗,在對常規(guī)數(shù)字圖像邊緣信息收集精確度較高的情況下,使用該技術(shù)進行圖像檢索查全率和查準(zhǔn)率都非常高。
本文提出的算法沒有完全實現(xiàn)將查全率和查準(zhǔn)率誤差控制在10%以內(nèi)的目標(biāo),排除圖像邊緣特征提取因素之外,與SVM分類器的設(shè)計有關(guān),SVM分類器中的顏色分割采用直線工具并沒有最大限度地將目標(biāo)圖像區(qū)分出來。
通過本文的研究發(fā)現(xiàn),Shearlet變換相比于小波變換,具有多方向性和基函數(shù)各向異性的優(yōu)點,所以Shearlet變換不僅可以描述紋理圖像更多的方向信息而且還對圖像具有更強稀疏表示的能力。為了盡量降低算法的復(fù)雜度,從整體算法方面考慮,可以對其中的輔助部分環(huán)節(jié)采用低計算量運算,而對核心環(huán)節(jié)的實現(xiàn)采用高計算量運算。當(dāng)前一些智能化程度較高的圖像識別算法優(yōu)勢的體現(xiàn),必須以準(zhǔn)確的圖像邊緣數(shù)據(jù)精確提取為前提。實驗結(jié)果證明了結(jié)論的正確性,重要的是驗證了本文提出算法的有效性和可靠性。
表3 三種算法的平均查全率和查準(zhǔn)率對比
本文主要圍繞多尺度幾何分析中的Shearlet變換進行研究、分析,并成功地應(yīng)用于印刷圖像識別中,有機融合彩色印刷圖像中的顏色特征信息,取得了非常不錯的識別效果,但仍然有一些問題需要繼續(xù)探討和完善。如算法針對以亮度(或光學(xué)密度)為核心的灰度印刷圖像識別實現(xiàn)沒有準(zhǔn)確性依據(jù)、特征融合識別增加算法復(fù)雜度的缺點、高智能化圖像識別算法應(yīng)用不夠等方面。