李 綠,占 竹,李立輕,b,汪 軍,b
(東華大學(xué) a.紡織學(xué)院,b.紡織面料技術(shù)教育部重點(diǎn)實(shí)驗室, 上海 201620)
目前,傳統(tǒng)的機(jī)織物紋理分析主要依賴于人工視覺,因此存在主觀性較強(qiáng)且效率低等問題。隨著紡織行業(yè)逐步向智能化方向轉(zhuǎn)型,將圖像處理技術(shù)和機(jī)器視覺技術(shù)應(yīng)用于采集和分析織物紋理特征已成為研究熱點(diǎn)。隨著機(jī)器視覺技術(shù)的發(fā)展,紋理分析方法可大致分為2類:傳統(tǒng)紋理分析方法、模式識別與機(jī)器學(xué)習(xí)方法。
傳統(tǒng)紋理分析方法主要利用特征提取算法,包括基于統(tǒng)計、基于信號處理、基于結(jié)構(gòu)分析和基于模型等4類方法。其中表征織物紋理的經(jīng)典模型主要有以下3種: 基于統(tǒng)計的模型,如灰度共生矩陣;基于信號處理的頻域分析模型[1],如小波變換、傅里葉變換和Gabor變換[2];基于場的模型[3],例如高斯馬爾可夫隨機(jī)場。傳統(tǒng)紋理分析方法各有優(yōu)缺點(diǎn):統(tǒng)計模型可以刻畫織物紋理的整體特性,但部分統(tǒng)計特征僅對特定類型紋理的檢測效果較好;頻域分析模型通常采用濾波器分析圖像紋理,計算量大且實(shí)時性較差。然而,即使機(jī)織物紋理圖像具有典型的結(jié)構(gòu)性,實(shí)際的織物紋理還會呈現(xiàn)一定的隨機(jī)性,因此,借助于提取廣義特征值的傳統(tǒng)紋理分析方法存在諸多限制。
字典學(xué)習(xí)屬于模式識別與機(jī)器學(xué)習(xí)方法[4]中的淺層次學(xué)習(xí),能夠按照預(yù)先設(shè)定的目標(biāo)提取最有效的紋理特征。字典的構(gòu)造主要包括固定字典、解析字典和設(shè)計訓(xùn)練算法的自適應(yīng)學(xué)習(xí)字典。Zhou等[5]和周建[6]的研究表明,字典學(xué)習(xí)方法可對機(jī)織物紋理進(jìn)行近似表征。吳瑩等[7]使用過完備解析字典得到穩(wěn)定的機(jī)織物紋理表征效果,但重構(gòu)效果次于K-SVD(singular value decomposition)學(xué)習(xí)字典。與基于先驗知識的固定字典和解析字典相比,學(xué)習(xí)字典能夠更好地適應(yīng)多類別的紋理特征。近十幾年來,研究者將K-SVD算法[8]和MOD(method of optimal direction)算法[9]等自適應(yīng)學(xué)習(xí)字典方法引入機(jī)織物紋理表征,相繼開發(fā)出非負(fù)字典[10]和通用字典[11-12],但這些學(xué)習(xí)字典只能對特定類型的機(jī)織物紋理進(jìn)行有效表征。為了同時表征多類機(jī)織物紋理,本文基于判別共享字典[13]探究機(jī)織物紋理圖像分類方案對字典重構(gòu)和判別性能的影響。
圖1 判別共享字典學(xué)習(xí)的模型示意圖Fig.1 Schematic diagram of the discriminative-shared dictionary learning model
η2‖X‖1+η3‖D0‖*
(3)
判別共享字典的算法流程圖如圖2所示。第一步,將樣本圖像轉(zhuǎn)化為灰度圖像后進(jìn)行子窗口劃分得到數(shù)據(jù)矩陣;第二步,輸入超參數(shù)η1、η2和η3,初始化D0、D、X0和X;第三步,迭代更新編碼系數(shù)和字典;第四步,使用學(xué)習(xí)得到的判別共享字典重構(gòu)紋理圖像。
圖2 判別共享字典的算法流程圖Fig.2 Algorithm flow chart of the discriminative-shared dictionary
本文采用常用的圖像質(zhì)量評價方法和判別性指標(biāo)評價重構(gòu)圖像的質(zhì)量和字典的判別能力,進(jìn)而驗證判別共享字典對多類機(jī)織物紋理的表征效果。
1.3.1 相似性指標(biāo)
峰值信噪比(peak signal to noise ratio,PSNR)[16]是用于客觀衡量原始圖像和重構(gòu)圖像之間相似度的常用指標(biāo)。PSNR值越大,表明重構(gòu)圖像與原始圖像像素點(diǎn)之間的平均距離越小,重構(gòu)效果越好。
結(jié)構(gòu)相似性指數(shù)測度(structural similarity index measure,SSIM)通過亮度、對比度和結(jié)構(gòu)3個方面對重構(gòu)圖像和原始圖像的相似性進(jìn)行評估,提供了與感知圖像失真非常接近的客觀評價方法,相比PSNR,其更符合人類視覺感知系統(tǒng)。SSIM取值范圍為[-1,1],越接近于1,重構(gòu)圖像與原始圖像越相似。
1.3.2 判別性指標(biāo)
為了評估判別字典的判別性能,提出了判別性指標(biāo)。用判別字典重構(gòu)所有類別的樣本,并計算相似性指標(biāo),根據(jù)行字典類和列樣本類將計算結(jié)果重新排列為相似矩陣S,具體運(yùn)算過程示意圖如圖3所示。
圖3 判別性指標(biāo)運(yùn)算過程示意圖Fig.3 Schematic diagram of the calculation process of the discriminative indicator
對相似矩陣S歸一化以消除不同樣本之間或不同指標(biāo)之間的數(shù)值差異,在循環(huán)計算對角線元素與其所在行和所在列的剩余元素之間的差值平方和后再求平均值,計算公式如式(4)所示。
式中:Sij為相似矩陣S的第i行、第j列元素;C為樣本類別數(shù)。
表1 機(jī)織物樣本編號Table 1 Sample number of woven fabrics
基于機(jī)織物紋理特征,為了增加樣本數(shù)量和減小樣本尺寸,判別共享字典學(xué)習(xí)算法需要對圖像樣本以子窗口的形式進(jìn)行劃分和密集取樣,即將每一個子窗口圖像作為一個子樣本。以經(jīng)、緯紗密度均為225根/10 cm的方平織物為樣本,圖像尺寸為256像素×256像素。選取尺寸為64像素×64像素的子窗口,先以32像素的固定步長向右水平移動,直到水平方向的子樣本全部取完,再向下移動32像素的步長,繼續(xù)向右水平取樣,以此類推,直至圖像上所有的子樣本都選取完畢,最終得到49個子樣本。將每個子樣本的每一列首尾相連得到一個列向量樣本,這些列向量組合在一起最終得到一個4 096×49的數(shù)據(jù)矩陣。子窗口的劃分過程如圖5所示。
圖5 子窗口劃分過程Fig.5 Sub-windows partition process
為了提高判別共享字典的學(xué)習(xí)效率,需要在保證機(jī)織物重構(gòu)質(zhì)量的前提下,使判別字典原子數(shù)量kC和共享字典原子數(shù)量k0盡可能小。因此在進(jìn)行字典學(xué)習(xí)前,需要對總字典原子數(shù)量進(jìn)行優(yōu)選。
判別字典原子數(shù)量為10~100,變化步長為10個字典原子,共享字典原子數(shù)量分別設(shè)定為10、20和30個。判別字典原子數(shù)量和共享字典原子數(shù)量對字典重構(gòu)效果的影響如圖6所示。
圖6 判別字典原子數(shù)量和共享字典原子數(shù)量對字典重構(gòu)效果的影響Fig.6 Influence of discriminative-dictionary atoms and shared-dictionary atoms on dictionary reconstruction
由圖6可知,隨著判別字典原子數(shù)量的增加,重構(gòu)圖像和原始圖像的相似性指標(biāo)均越來越高直至趨于平緩,kC增加到一定數(shù)量后,類子字典的空間重疊度已經(jīng)足夠小,SSIM的值接近最大值1,重構(gòu)效果達(dá)到飽和。但在圖6(a)中,當(dāng)kC超過80后,重構(gòu)質(zhì)量反而略微降低,這是由于PSNR根據(jù)重構(gòu)圖像和原始圖像的像素點(diǎn)之間的距離差計算平方和后再求均值,容易受異常值的影響,相對來說SSIM的評價結(jié)果與實(shí)際視覺效果更吻合。共享字典原子數(shù)量對重構(gòu)誤差的影響可忽略不計。由圖6可知,共享字典和判別字典原子數(shù)量分別取20和80較為合適。
本文的試驗基于MATLAB R2016ba(64位)軟件開發(fā)環(huán)境。為了驗證所提出的判別共享字典用于表征多類機(jī)織物紋理,以及分析影響字典的重構(gòu)性能和判別能力的試驗因素的可行性,以8種組織結(jié)構(gòu)的機(jī)織物紋理圖像為樣本,總共設(shè)計了10組試驗方案,詳見表2。根據(jù)字典原子優(yōu)選的結(jié)論,設(shè)置kC=80,k0=10,正則化參數(shù)η1=0.001,η2=0.010,η3=0.100,最大迭代次數(shù)為20次。
方案1的分類依據(jù)為組織結(jié)構(gòu),共包含8類紋理圖像,所有機(jī)織物樣本的經(jīng)、緯紗密度均為225根/10 cm。方案2~5依次在方案1樣本圖像基礎(chǔ)上增加經(jīng)、緯紗密度為250、275、300和350根/10 cm的樣本圖像。方案6按原組織以及由該原組織為基礎(chǔ)組織進(jìn)行變化和組合而成的組織進(jìn)行分類,共分為3類,所有機(jī)織物的經(jīng)、緯紗密度均為225根/10 cm。方案7~10依次在方案6樣本的基礎(chǔ)上分別增加經(jīng)、緯紗密度為250、275、300和350根/10 cm的樣本圖像。使用判別共享字典模型對10組樣本圖像分別進(jìn)行字典學(xué)習(xí)和重構(gòu)。
表2 不同組織結(jié)構(gòu)的紋理圖像分類方案Table 2 Classification schemes of texture images with different weave structures
以方案1為例,使用字典對8類紋理圖像進(jìn)行重構(gòu),得到重構(gòu)圖像與原始圖像的對比圖(見圖7(a))。對角線上的重構(gòu)圖像幾乎包含了原始圖像的所有紋理特征,與原始圖像相似性很高,其余重構(gòu)圖像與原始圖像的相似性均較低,說明判別共享字典對相應(yīng)類別的紋理圖像都有非常好的重構(gòu)效果。根據(jù)上文提及的圖像相似性評價指標(biāo),對重構(gòu)結(jié)果做進(jìn)一步定量分析。兩個指標(biāo)的相似矩陣的熱圖分別如圖7(b)、(c)所示,其中,矩陣熱圖的行和列分別表示判別字典和紋理類別。總體而言,熱圖對角線上的值明顯大于其他值,重構(gòu)效果與圖7(a)的直觀對比結(jié)果一致。由此證明,判別共享字典學(xué)習(xí)模型在同時表征多類織物紋理方面有優(yōu)異的表現(xiàn)。
計算出各組的相似性矩陣,以相似矩陣對角線的平均值和判別性指數(shù)為評價指標(biāo),分別對字典的重構(gòu)性能和判別性能進(jìn)行定量分析。各組試驗結(jié)果的相似性指標(biāo)和判別性指標(biāo)如圖8所示。
由圖8(a)可知,方案1~5的PSNR值呈現(xiàn)明顯的下降趨勢,說明隨著經(jīng)、緯紗密度的增加,特定類別子字典對該類別織物圖像的重構(gòu)質(zhì)量顯著下降。這是因為經(jīng)、緯紗密度的增加將導(dǎo)致紋理信息更加復(fù)雜,改變了圖像灰度值的分布,從而影響字典的重構(gòu)性能。方案6~10的變化趨勢和前5組方案完全一致,進(jìn)一步證實(shí)以織物組織結(jié)構(gòu)作為分類依據(jù)時,經(jīng)、緯紗密度會對圖像的重構(gòu)質(zhì)量產(chǎn)生顯著影響。依次將方案1~5以及方案6~10進(jìn)行兩兩對比,發(fā)現(xiàn)前者的PSNR值明顯高于后者。這說明對于相同規(guī)格的織物圖像,組織結(jié)構(gòu)的劃分依據(jù)也會明顯影響圖像的重構(gòu)質(zhì)量,不恰當(dāng)?shù)膭澐址绞綍?dǎo)致很差的重構(gòu)結(jié)果。
由圖8(b)可知:方案1~5的判別性指標(biāo)接近1.0且沒有明顯波動,即所得字典的判別性能均較高,并不受密度的影響;而方案6~10的判別性指標(biāo)均低于0.8,且隨著經(jīng)、緯紗密度的增加,判別性能越來越差。上述試驗結(jié)果說明,選取合適的分類依據(jù),不僅能提高字典的判別性能,還能顯著消除其余參數(shù)對判別性能的影響。
由上述試驗結(jié)果可知,依據(jù)兩種組織結(jié)構(gòu)的劃分依據(jù)對機(jī)織物圖像進(jìn)行分類,圖像的重構(gòu)質(zhì)量均會隨經(jīng)、緯紗密度的增加而變得越來越差,但字典的判別性能有可能不受影響。由此說明,在判別共享字典模型中,機(jī)織物紋理圖像的分類依據(jù)對字典的重構(gòu)和判別性能都尤為重要。
本文以不同經(jīng)、緯紗密度的平紋、斜紋、經(jīng)面緞紋、緯面緞紋、方平、復(fù)合斜紋、菱形斜紋和蜂巢織物為樣本,基于子窗口劃分的判別共享字典模型對多類機(jī)織物紋理進(jìn)行表征,確定了重構(gòu)紋理圖像所需的判別字典和共享字典的最優(yōu)原子數(shù)量,并比較了10種分類方案對機(jī)織物紋理圖像的重構(gòu)效果的影響,得到以下結(jié)論:
(1)以組織結(jié)構(gòu)作為分類依據(jù)時,隨著經(jīng)、緯紗密度的增加,所學(xué)字典的重構(gòu)性能越來越差,但其判別性能不會受到明顯影響。
(2)以原組織和由該原組織為基礎(chǔ)組織進(jìn)行變化和組合而成的組織進(jìn)行分類時,字典的重構(gòu)性能和判別性能均會隨著經(jīng)、緯紗密度的增加而降低。
(3)經(jīng)、緯紗密度和組織結(jié)構(gòu)均會對字典的重構(gòu)性能產(chǎn)生影響。相比經(jīng)、緯紗密度,組織結(jié)構(gòu)對字典的判別性能影響更加顯著。
上述結(jié)論說明,機(jī)織物紋理圖像的分類結(jié)果會對字典的重構(gòu)結(jié)果造成顯著影響,因此需要根據(jù)具體紋理特征找到適用于判別共享字典的機(jī)織物分類方法,這種分類方法仍需進(jìn)一步的研究。探尋適用于紋理圖像的分類方法成為利用字典學(xué)習(xí)對機(jī)織物紋理進(jìn)行稀疏表征的前提。本文方法對樣本量較大的多類機(jī)織物的紋理表征具有很好的應(yīng)用前景,同時也為分析機(jī)織物紋理圖像的分類方法提供了判斷依據(jù)。