陳 雨 ,陳 桂 雄 ,周 雄 圖 ,2,張 永 愛 ,2,林 志 賢 ,2,吳 朝 興 ,2,郭 太 良 ,2
(1.福州大學(xué) 物理與信息工程學(xué)院,福建 福州350116;2.中國福建光電信息科學(xué)與技術(shù)創(chuàng)新實(shí)驗(yàn)室,福建 福州350116)
市場中假冒產(chǎn)品的存在會對國家、社會和個人帶來巨大經(jīng)濟(jì)損失,防偽成為應(yīng)用廣泛的反制技術(shù)。 由于整個防偽市場不規(guī)范,防偽技術(shù)產(chǎn)品水平偏低,妨礙了市場的健康發(fā)展,公眾對防偽產(chǎn)品的信任度在降低。 目前,許多被開發(fā)的防偽標(biāo)簽具有物理上不可克隆的特征,如散射表面的隨機(jī)圖案、隨機(jī)分布的納米顆粒圖案和液晶紋理等。褶皺圖案是自然界生物體和工程材料領(lǐng)域常見的特殊現(xiàn)象,是一種微觀的隨機(jī)地形,擁有著廣泛而不可復(fù)制的信息,在防偽技術(shù)上有廣泛的應(yīng)用前景。
通常,在聚合物襯底受熱膨脹的狀態(tài)下,在其表面上沉積一層與之熱膨脹系數(shù)差異較大的薄膜,在冷卻過程中,表面上的薄膜受到基底壓縮應(yīng)力作用。 當(dāng)壓縮應(yīng)力超過表面金屬薄膜的承受范圍,會導(dǎo)致薄膜失穩(wěn)產(chǎn)生復(fù)雜隨機(jī)的褶皺圖案[1],如PDMS/Au 褶皺圖案結(jié)構(gòu)[2]。 這種隨機(jī)褶皺結(jié)構(gòu)具有穩(wěn)定、不可克隆的防偽標(biāo)簽特性,引起人們廣泛研究興趣。當(dāng)前國內(nèi)外常用的褶皺類紋理識別方法有局部二值分類器[3]、多光譜精細(xì)紋理提取和識別[4]、K 均值聚類算法[5]、灰度共生矩陣[6]等。這些方法通常需要對防偽標(biāo)簽先進(jìn)行特征提取,基于熱膨脹系數(shù)失配形成的隨機(jī)褶皺圖案特征不夠明顯,往往不利于防偽標(biāo)簽的識別。角度、光線、清晰度等條件會影響部分細(xì)節(jié)特征提取,降低褶皺圖像的正確識別率。同時,現(xiàn)有方法往往存在著檢測時間長、識別率低等缺陷,不能滿足現(xiàn)實(shí)生活中防偽識別的需求。
如今,深度學(xué)習(xí)已在圖像識別、語音識別和自然語言處理等領(lǐng)域獲得了廣泛的應(yīng)用。 其中,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)已成功應(yīng)用于像素級的語義分割技術(shù)中。 在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,LONG J 等人提出了使用卷積層代替全連接層的全卷積神經(jīng)網(wǎng)絡(luò)(Fully Convolution Network,F(xiàn)CN)[7]。 2015 年RONNEBERGER O 等 人 為 解 決 小數(shù)量級樣本的分割,提出了編解碼結(jié)構(gòu)的U-Net網(wǎng)絡(luò)[8]。 隨后,CHEN L C[9]等人提出將空洞卷積代替普通卷積的思想,創(chuàng)建了DeepLab 模型,使用ASPP(Atrous Spatial Pyramid Pooling)模塊解決多尺度信息,分別提出了v2[10]、v3[11]、v3+[12]三個版本,不斷優(yōu)化模型和改進(jìn)訓(xùn)練策略,將語義分割精度提高到新的高度。 本文將DeepLabv3 語義分割模型應(yīng)用于褶皺防偽標(biāo)簽圖案的特征提取, 并對DeepLabv3 模型進(jìn)行改寫, 使優(yōu)化后的DeepLabv3 網(wǎng)絡(luò)能夠很好地適用于褶皺紋理防偽圖案分類識別。
如圖1 所示,利用人眼可初步在宏觀尺度上辨別標(biāo)簽圖案的真假;采用搭配放大鏡的手機(jī)對雙重防偽標(biāo)識“笑臉”點(diǎn)陣中的特定點(diǎn)的褶皺圖案進(jìn)行圖像獲取,采用深度學(xué)習(xí)圖像識別方法,對比商品上的防偽標(biāo)識褶皺特征信息與數(shù)據(jù)庫中真實(shí)褶皺特征信息,實(shí)現(xiàn)高級防偽功能。
隨機(jī)褶皺紋理圖案呈個性化條形卷曲迷宮狀,細(xì)節(jié)信息豐富具有不可重復(fù)性,但由于不同類別圖案均由同一機(jī)理制備,會增加識別難度。 K 均值聚類算法對選取初始聚類中心的敏感性較高,會直接影響結(jié)果的準(zhǔn)確性和穩(wěn)定性。 灰度共生矩陣法提取紋理圖像特征可以獲得理想的識別結(jié)果,但是計算工作量大。 對比多種方法后本文選擇DeepLabv3 語義分割網(wǎng)絡(luò)提取出細(xì)膩的圖像特征,結(jié)合后端的全連接層進(jìn)行圖像分類,匹配已有的防偽褶皺紋理圖案實(shí)現(xiàn)高級防偽識別。
卷積神經(jīng)網(wǎng)絡(luò)是一種基于感受野概念的針對二維圖像的多層神經(jīng)認(rèn)知器。 網(wǎng)絡(luò)結(jié)構(gòu)包括數(shù)據(jù)輸入層、卷積層、池化層和全連接層,其中卷積層和池化層是卷積神經(jīng)網(wǎng)絡(luò)的核心功能層,用來自動提取目標(biāo)特征信息。 邏輯回歸分類器進(jìn)而處理特征圖的結(jié)構(gòu),使用全連接層將提取到的圖像特征綜合以獲得最終的圖像分類。 采用卷積神經(jīng)網(wǎng)絡(luò)算法對褶皺紋理圖像進(jìn)行分類,避免了復(fù)雜的數(shù)據(jù)重建,有效減少了自由參數(shù)的數(shù)量,分類精度得到了顯著提高的同時,還避免了過擬合現(xiàn)象。
理論上神經(jīng)網(wǎng)絡(luò)的深度與性能之間成正比,然而實(shí)際中會造成梯度爆炸和梯度消失的問題。權(quán)重參數(shù)更新困難, 導(dǎo)致準(zhǔn)確率飽和甚至下降。深度殘差網(wǎng)絡(luò)(Residual Neural Network,ResNet)最早由HE K 等人提出[13],利用殘差學(xué)習(xí)原理實(shí)現(xiàn)網(wǎng)絡(luò)的加深以對抗梯度退化問題,將基本的網(wǎng)絡(luò)單元增加了一個恒等的快捷連接(shortcut connections),把原始輸入信息引到輸出層,通過直接學(xué)習(xí)上層網(wǎng)絡(luò)輸出的殘差,有效地簡化了學(xué)習(xí)難度和目標(biāo)。
圖1 雙重防偽標(biāo)識識別方法示意圖
Deeplabv3 是以ResNet 為骨干構(gòu)建的語義分割網(wǎng)絡(luò)。 在使用FCN 實(shí)現(xiàn)圖像分割后,引入了空洞卷積以獲得多尺度的特征信息,通過金字塔結(jié)構(gòu)挖掘更多語義特征信息以提升分類效果。
空洞卷積(Atrous convolution)是指通過設(shè)置膨脹率(rate)來對原圖進(jìn)行采樣,如圖2 所示。 當(dāng)rate=1時,它的作用與標(biāo)準(zhǔn)卷積無異,即全部像素采樣。當(dāng)rate >1 時,它將通過膨脹率對卷積核進(jìn)行擴(kuò)張,在原圖上每隔(rate-1)個像素點(diǎn)進(jìn)行采樣,用零來填充空白,擴(kuò)大了感受野的范圍,在不增加參數(shù)量和計算量的條件下提取到更大范圍的語義特征。
圖2 空洞卷積
空洞空間卷積池化金字塔(Atrous Spatial Pyramid Pooling,ASPP)是指采用不同膨脹率的空洞卷積并行來學(xué)習(xí)多尺度特征,可以對任意尺度的區(qū)域進(jìn)行更為準(zhǔn)確的分類。
DeepLabv3 以ResNet 為網(wǎng)絡(luò)基礎(chǔ)。ResNet 網(wǎng)絡(luò)共有四個殘差塊,將第四個殘差塊復(fù)制三次后以級聯(lián)的方式連接在在殘差單元后,殘差塊4 ~7 采用不同膨脹率的空洞卷積,當(dāng)輸出步長為16 時,殘差塊4~7 的膨脹率分別為2、4、8、16 來進(jìn)行采樣,保證在卷積過程中圖像大小保持不變。 同時,采用一個并行的ASPP 結(jié)構(gòu)處理前面輸出的特征圖,在feature map 的頂部采用4 個不同膨脹率(6、12、18、24)的空洞卷積核,通過全局平均池化層來捕獲上下文信息,再將ASPP 結(jié)構(gòu)分支處理好的特征使用1×1 的卷積實(shí)現(xiàn)融合。
DeepLabv3 網(wǎng)絡(luò)模型中采用了編碼器-解碼器模塊(Enconder-Decoder),其中解碼器模塊使用了16倍的雙線性上采樣, 恢復(fù)圖像特征的細(xì)節(jié)和空間維度,以得到分割結(jié)果。 本文基于褶皺紋理圖案的防偽分類目的,將用于分割的此解碼器模塊更換為全連接層結(jié)構(gòu),softmax 為輸出層,將每一個神經(jīng)元都與輸出相連,實(shí)現(xiàn)對輸入圖像的分類。 本文所用網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。
實(shí)驗(yàn)方法采用兩種熱膨脹系數(shù)不同的材料,在冷卻過程中產(chǎn)生壓縮應(yīng)力形成隨機(jī)褶皺防偽標(biāo)識圖案。 首先,將PDMS 原液與固化劑以10:1 的比例混合攪拌均勻, 放置于負(fù)壓環(huán)境30 min 消除氣泡。取干凈的玻璃基板,利用酒精、丙酮和去離子水分別超聲清洗15 min,通過絲網(wǎng)印刷將PDMS 印刷于玻璃基片上形成宏觀防偽標(biāo)簽圖案。
采用原子層沉積技術(shù),在PDMS 襯底表面上生長一層Al2O3無機(jī)膜層。 制備Al2O3的前驅(qū)體是三甲基鋁(Trimethylaluminum,TMA)和水(H2O),反應(yīng)過程中高純氮?dú)?N2,99.999%)作為載氣,沉積溫度為90 ℃。 單個氧化鋁制備循環(huán)過程包括:TMA 脈沖0.2 s、N2吹掃6 s、H2O 脈沖0.15 s、N2吹掃10 s。
圖3 網(wǎng)絡(luò)結(jié)構(gòu)圖
圖4所示為實(shí)驗(yàn)制備的具有不同亮度的隨機(jī)褶皺防偽標(biāo)識圖案。 隨機(jī)選擇六個防偽褶皺紋理圖案來建立防偽“真”圖類數(shù)據(jù)集,在手動采集過程中通過對同一張相同褶皺紋理圖案隨機(jī)移動和改變光照強(qiáng)度,獲得每個圖案的120 張圖像,共720 張“真”圖類圖像。同時用相同方法隨機(jī)采集了各不相同的200 張褶皺紋理圖案作為“偽”圖類數(shù)據(jù)集。 為了降低訓(xùn)練過程中因數(shù)據(jù)樣本過少導(dǎo)致的欠擬合問題,并增強(qiáng)模型的泛化能力和分類精度,本文采用了旋轉(zhuǎn)、翻轉(zhuǎn)的數(shù)據(jù)增強(qiáng)方法豐富數(shù)據(jù)集,最終由720 張“真”圖類原始數(shù)據(jù)集擴(kuò)充至2 800 張,200張“偽”圖類原始數(shù)據(jù)集擴(kuò)充至800 張。 擴(kuò)增后共獲得3 600 張圖像作為數(shù)據(jù)集。
圖4 具有不同亮度褶皺圖案示例
數(shù)據(jù)集中3 600 張圖像80%作為訓(xùn)練集,20%作為驗(yàn)證集。 實(shí)驗(yàn)于Linux(Ubuntu18.04)系統(tǒng)上進(jìn)行,CPU 型號為i7-9700,GPU 為型號GTX1080,基于Pytorch 深度學(xué)習(xí)框架實(shí)現(xiàn),數(shù)據(jù)集圖像為1 318 像素×1 132 像素大小的防偽褶皺紋理圖案。 為了保證網(wǎng)絡(luò)學(xué)習(xí)效率,防止過擬合,本文網(wǎng)絡(luò)采用帶動量隨機(jī)梯度下降方法進(jìn)行訓(xùn)練實(shí)驗(yàn),動量因子為0.9,學(xué)習(xí)率初始值為0.001,batch_size 為16, 權(quán)重衰減為0.000 2。
為了實(shí)現(xiàn)對褶皺紋理圖案的防偽分類識別,本文將DeepLabv3 語義分割結(jié)構(gòu)的解碼器部分更替為全連接層結(jié)構(gòu),最后使用softmax 激活函數(shù)作為分類訓(xùn)練。 為了提高網(wǎng)絡(luò)的識別準(zhǔn)確率和實(shí)時性,且減少冗余現(xiàn)象,簡化模型復(fù)雜度,實(shí)驗(yàn)將全連接層數(shù)量分別設(shè)置為一層、二層、三層,神經(jīng)節(jié)點(diǎn)數(shù)為1 024,結(jié)果如圖5、圖6 所示。
圖5 全連接層數(shù)對準(zhǔn)確率的影響
圖6 全連接層數(shù)對損失值的影響
由圖5、圖6 可知,當(dāng)全連接層為三層時,識別準(zhǔn)確率最高;全連接層數(shù)減少為兩層時,識別準(zhǔn)確率略有降低,但并沒有明顯變化;當(dāng)全連接層數(shù)繼續(xù)減少至一層時,識別準(zhǔn)確率明顯下降。 這可能是因?yàn)閮蓪踊騼蓪右陨系娜B接層能夠有效地解決非線性問題。 從穩(wěn)定性分析,三層全連接層的變化幅度最為明顯,當(dāng)全連接層數(shù)為一層時,識別性能多展現(xiàn)出小幅度攀升趨勢,從網(wǎng)絡(luò)整體的變化趨勢觀察與比較可知,二層全連接層表現(xiàn)出的穩(wěn)定性最為突出。 說明由于全連接層產(chǎn)生大量的參數(shù),容易產(chǎn)生過擬合問題,但全連接層起到的是將學(xué)到的“分布式特征表示”映射到樣本標(biāo)記空間的作用[14],層數(shù)過少時導(dǎo)致模型性能下降。 所以本文網(wǎng)絡(luò)選擇二層全連接層。
為了進(jìn)一步提高網(wǎng)絡(luò)識別準(zhǔn)確率,減少網(wǎng)絡(luò)參數(shù),構(gòu)建輕量級網(wǎng)絡(luò)模型,通過調(diào)整全連接層神經(jīng)節(jié)點(diǎn)數(shù)來確定網(wǎng)絡(luò)模型最優(yōu)值。 不同神經(jīng)節(jié)點(diǎn)數(shù)對網(wǎng)絡(luò)模型性能影響如表1 所示。
表1 神經(jīng)節(jié)點(diǎn)數(shù)對模型訓(xùn)練效果的影響
由表1 可知,神經(jīng)元節(jié)點(diǎn)數(shù)過多時可能會造成過擬合現(xiàn)象,空間語義信息丟失,減少全連接層神經(jīng)元節(jié)點(diǎn)數(shù)可以精簡網(wǎng)絡(luò)模型結(jié)構(gòu),在降低計算消耗的提前下提高分類準(zhǔn)確率和運(yùn)算速度。 當(dāng)全連接層神經(jīng)節(jié)點(diǎn)數(shù)由4 096 減少至512 時, 訓(xùn)練識別準(zhǔn)確率提高了0.92%;神經(jīng)節(jié)點(diǎn)數(shù)為128 時,比4 096個神經(jīng)節(jié)點(diǎn)的訓(xùn)練耗時節(jié)省了0.77 h。 盡管全連接層權(quán)重值個數(shù)占比較大,但由于網(wǎng)絡(luò)訓(xùn)練的時間開銷主要來自于卷積運(yùn)算,因此減少全連接層神經(jīng)節(jié)點(diǎn)數(shù)對網(wǎng)絡(luò)運(yùn)算速度的提高是有限的。 神經(jīng)節(jié)點(diǎn)數(shù)繼續(xù)減少至64 時, 訓(xùn)練耗時不減反增,16 個神經(jīng)節(jié)點(diǎn)時所需的訓(xùn)練時間比128 個神經(jīng)節(jié)點(diǎn)訓(xùn)練所獲得的最短耗時4.69 h 增加了0.45 h。 綜合對比網(wǎng)絡(luò)識別準(zhǔn)確率、穩(wěn)定性和訓(xùn)練耗時,本文最終采用二層全連接層,將神經(jīng)節(jié)點(diǎn)數(shù)確定在256。
為了驗(yàn)證本文所提出的隨機(jī)褶皺防偽圖案識別分類模型的有效性,本文與三種經(jīng)典方法進(jìn)行了對比試驗(yàn),分類效果精度對比如表2 所示。 在其他的經(jīng)典方法中,ResNet 獲得較高的識別準(zhǔn)確率91.77% ,VGGNet 和 AlexNet 分 別 獲 得 85.23% 和83.96%的識別準(zhǔn)確率,本文的分類識別模型效果是有效的。
表2 與經(jīng)典方法的對比
綜上所述,本文提出一種利用PDMS 聚合物上AL2O3薄膜形成規(guī)則有序的褶皺圖案來制備宏觀及微觀雙重防偽標(biāo)識,并構(gòu)建相應(yīng)網(wǎng)絡(luò)的特征提取和識別模塊證明其可行性。 本文所提供的PDMS/AL2O3 防偽褶皺圖案制備方法具有多重防偽、難以偽造、工藝簡單和成本低等優(yōu)勢,通過對DeepLabv3網(wǎng)絡(luò)改進(jìn)優(yōu)化,使本實(shí)驗(yàn)網(wǎng)絡(luò)的更好地權(quán)衡了運(yùn)行時間和識別準(zhǔn)確率,訓(xùn)練耗時明顯縮短,獲得了96.58%的訓(xùn)練準(zhǔn)確率。 試驗(yàn)證明,相較于其他傳統(tǒng)的經(jīng)典方法,本文方法取得了更高的識別準(zhǔn)確率,具有一定的實(shí)際應(yīng)用價值。