王福斌,劉 洋,霍曉彤,李占賢,潘興辰
(1.華北理工大學(xué)電氣工程學(xué)院自動(dòng)化系,河北 唐山 063210;2.河北省工業(yè)機(jī)器人產(chǎn)業(yè)技術(shù)研究院,河北 唐山 063200;3.中石油北京天然氣管道有限公司,北京 100101)
飛秒激光功率和加工方向影響等離子體光斑的亮度和幾何形狀,可通過(guò)分割光斑圖像并對(duì)光斑的亮度特征和幾何特征進(jìn)行提取。飛秒激光等離子體光斑目標(biāo)弱小,灰度變換后使得部分像素變得不易識(shí)別,影響分割效果。經(jīng)典的Otsu分割方法[1]用來(lái)分割光斑圖像時(shí)會(huì)產(chǎn)生過(guò)分割或分割不足,無(wú)法滿足光斑圖像精確分割需求。Niblack算法是一種經(jīng)典的動(dòng)態(tài)局部閾值算法,可以很好地保留圖像細(xì)節(jié),在低對(duì)比度圖像分割上相比單一固定全局閾值分割有著明顯的優(yōu)勢(shì)。對(duì)比分析表明:采用Niblack對(duì)光斑分割后,提取的光斑幾何特征參數(shù)間的關(guān)聯(lián)度及特征變化的一致性較高。
本文通過(guò)提取光斑圖像的幾何特征參數(shù)及亮度特征參數(shù)獲得一個(gè)6維特征矩陣,構(gòu)建基于特征矩陣的光斑圖像分類識(shí)別模型。Huang[2]等提出結(jié)構(gòu)簡(jiǎn)單、學(xué)習(xí)速度快和泛化性能良好的極限學(xué)習(xí)機(jī)ELM(Extreme Learning Machine),采用隨機(jī)設(shè)置的輸入層權(quán)值,一旦確定就不需調(diào)整,輸出層權(quán)值則通過(guò)求解最小二乘范數(shù)來(lái)獲得,其學(xué)習(xí)能力只與隱含層節(jié)點(diǎn)數(shù)有關(guān)。
等離子光斑微弱且與背景對(duì)比度低。在分割前對(duì)圖像進(jìn)行定位、裁剪,圖像區(qū)域限定為225×225的方形區(qū)域。光斑實(shí)際由光斑燒蝕區(qū)、燒蝕過(guò)渡區(qū)及光暈三部分組成,為選擇適合光斑圖像的分割方法,對(duì)Otsu分割、Niblack局部分割效果進(jìn)行了對(duì)比研究。傳統(tǒng)的Otsu圖像分割方法通過(guò)計(jì)算最大類間方差,使背景與前景差別最大[3]。Niblack局部分割是依據(jù)局部像素點(diǎn)的均值和標(biāo)準(zhǔn)差來(lái)決定中心閾值的局部特征二值化算法,利于避免激光光斑的過(guò)分割現(xiàn)象[4]??紤]到光斑核心燒蝕區(qū)易分割,光斑拖尾區(qū)域較難識(shí)別的特點(diǎn),可借助局部閾值分割算法將部分有效的光斑拖尾過(guò)渡區(qū)保留下來(lái),增強(qiáng)光斑特征。Niblack局部閾值T(x,y)求取公式為:
T(x,y)=m(x,y)+σ×(x,y)
(1)
其中,m(x,y)分別表示中心點(diǎn)(x,y)在鄰域r×r內(nèi)所有像素點(diǎn)的均值和標(biāo)準(zhǔn)差;σ為修正系數(shù),用來(lái)限定判斷同一類像素的偏移范圍。進(jìn)一步計(jì)算如下:
(2)
σ(x,y)=
(3)
式中,灰度值f(x,y)取值遵循如下條件:
(4)
Niblack算法通過(guò)動(dòng)態(tài)確定各區(qū)域閾值,可較好的處理亮度不均的圖像[5],若窗口中心像素點(diǎn)的灰度值小于當(dāng)前窗口的閾值,則將當(dāng)前點(diǎn)賦值為0,否則,賦值為255。
圖1為采用Otsu方法及Niblack方法對(duì)50 mW光斑圖像分割的效果。圖1中(a)為光斑原始圖像;圖1(b)對(duì)應(yīng)的三維圖像;圖1(c)為Otsu方法進(jìn)行二值化分割結(jié)果,Otsu分割方法得到的圖像受光斑光暈影響較大,分割后保留較大面積的無(wú)效信息,光斑目標(biāo)分割效果不理想,降低了圖像特征提取精度。通過(guò)調(diào)整k值得到圖1(d)所示的分割結(jié)果,該圖形不但包含核心燒蝕區(qū)還包括部分有效的燒蝕過(guò)渡區(qū),分割后光暈以小面積塊的形式存在,再通過(guò)面積篩選剔除干擾因素,最終得到圖1(e)的光斑分割結(jié)果。
圖1 光斑圖像的Niblack局部閾值分割
采用Otsu方法對(duì)微弱光斑圖像分割時(shí),易造成過(guò)少或過(guò)多的去除光暈的影響,影響光斑目標(biāo)圖像特征信息提取精度,而采用Niblack方法分割結(jié)果能客觀的反映燒蝕區(qū)變化,分割精度更高。分別采用Otsu和Niblack方法對(duì)50 mW、20 mW及10 mW燒蝕功率的光斑圖像進(jìn)行分割,Otsu方法得到的分割結(jié)果保留了大部分光暈,導(dǎo)致光斑的幾何特征精度降低。Niblack方法分割后圖像更能反映光斑燒蝕區(qū)特征,有助于光斑圖像的特征提取及分析。通過(guò)提取光斑圖像的像素面積、周長(zhǎng)、長(zhǎng)軸、短軸及長(zhǎng)短軸比,得到兩種分割方法獲得的5種幾何特征參數(shù),如表1所示。
表1 不同分割方法分割后的光斑圖像特征
依據(jù)光斑圖像的特點(diǎn)本文提出基于Niblack光斑分割后,疊加在原始圖像上獲得光斑目標(biāo)區(qū)域,在剩余光斑目標(biāo)區(qū)域內(nèi)對(duì)圖像進(jìn)行亮度特征提取。圖2為通過(guò)疊加去除光暈影響的光斑圖像。圖2(a)為原始光斑的亮度特征區(qū)域,傳統(tǒng)求亮度平均值的思想是從全圖考慮,包括所有的像素,引入了光暈亮度的干擾。圖2(b)為通過(guò)分割、疊加后保留的亮度區(qū)域,從圖中可以發(fā)現(xiàn),該方法剔除了光暈部分,可實(shí)現(xiàn)對(duì)特定光斑目標(biāo)區(qū)域的亮度特征提取。
圖2 基于分割的圖像亮度信息
采用神經(jīng)網(wǎng)絡(luò)可將多種光斑特征數(shù)據(jù),如亮度特征、幾何特征有效的應(yīng)用在光斑燒蝕功率分類中。本文采用BP神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)對(duì)光斑圖像燒蝕功率進(jìn)行分類性能進(jìn)行對(duì)比研究,網(wǎng)絡(luò)輸入向量為:像素面積、光斑周長(zhǎng)、長(zhǎng)軸、短軸、長(zhǎng)軸與短軸的比及光斑圖像亮度六個(gè)特征向量;網(wǎng)絡(luò)輸出為50 mW、20 mW、10 mW三類燒蝕功率。BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元個(gè)數(shù)選取按如下經(jīng)驗(yàn)公式確定:
(5)
其中,h為隱層節(jié)點(diǎn)數(shù);m為輸入層節(jié)點(diǎn)數(shù);n為輸出層節(jié)點(diǎn)數(shù)目;a為1~10間的調(diào)節(jié)常數(shù)[6-7]。
選取50 mW、20 mW及10 mW燒蝕功率光斑圖像各300幅,提取亮度和幾何特征得到900×6的特征矩陣,矩陣的每一行表示一個(gè)樣本特征。隨機(jī)抽選840個(gè)特征作為訓(xùn)練樣本,60個(gè)為測(cè)試樣本,隱含層節(jié)點(diǎn)為7的BP神經(jīng)網(wǎng)絡(luò)對(duì)其預(yù)測(cè),迭代次數(shù)為13,預(yù)測(cè)分類結(jié)果如圖3所示。
圖3 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果
圖3中可以看出,有一個(gè)圓圈標(biāo)記的實(shí)際值和星號(hào)標(biāo)記的預(yù)測(cè)值沒(méi)有重合,表明有一個(gè)測(cè)試樣本沒(méi)有被正確預(yù)測(cè)。經(jīng)多次試驗(yàn)統(tǒng)計(jì),BP算法分類預(yù)測(cè)正確率最優(yōu)為98.33 %,平均訓(xùn)練時(shí)間為0.30624 s,預(yù)測(cè)時(shí)間在0.01 s左右,有較好的分類效果。進(jìn)一步擴(kuò)大數(shù)據(jù)集,減少特殊樣本的干擾,將每種圖像的特征擴(kuò)大到1000個(gè),總計(jì)3000個(gè)樣本,從中隨機(jī)選出2940個(gè)樣本做訓(xùn)練集,剩余60個(gè)做測(cè)試集,預(yù)測(cè)結(jié)果如圖4所示。
圖4 大樣本BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果
2940個(gè)樣本的平均訓(xùn)練時(shí)間約1.1133 s,預(yù)測(cè)時(shí)間0.01 s。由于20 mW和10 mW兩者功率相差不大,光斑幾何特征較接近,也導(dǎo)致了類別誤判產(chǎn)生的預(yù)測(cè)誤差加大。
為縮短神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間,進(jìn)一步構(gòu)建線性局部切空間排列LLTSA-BP(Linear Local Tangent Space Alignment)模型[8]和局部保持投影LPP-BP(Locality Preserving Projection)模型[9-10],采用流形學(xué)習(xí)降維方法將3000×6的特征矩陣降維到3000×3新矩陣,每個(gè)樣本的維數(shù)由6維降低到3維,減小運(yùn)算量。此時(shí)選取的隱含層節(jié)點(diǎn)數(shù)為5,預(yù)測(cè)效果如圖5所示。
(a)LLTSA-BP預(yù)測(cè)結(jié)果
(b)LPP-BP預(yù)測(cè)結(jié)果
實(shí)驗(yàn)發(fā)現(xiàn),降維后的數(shù)據(jù)有著很好預(yù)測(cè)效果。兩者所需要的訓(xùn)練時(shí)間均在0.9031 s左右,比未降維數(shù)據(jù)訓(xùn)練時(shí)間節(jié)約了0.2 s。上述實(shí)驗(yàn)表明,基于構(gòu)建的光斑亮度特征、幾何特征輸入向量數(shù)據(jù),BP神經(jīng)網(wǎng)絡(luò)、LLTSA-BP及LPP-BP模型算法均可實(shí)現(xiàn)激光光斑功率識(shí)別。
極限學(xué)習(xí)機(jī)ELM神經(jīng)網(wǎng)絡(luò)內(nèi)部連接方式與BP算法類似,其輸入層、隱含層、輸出層的神經(jīng)元數(shù)目分別為n,l,m[11]。
其中,a為輸入層節(jié)點(diǎn)到隱含層節(jié)點(diǎn)的輸入權(quán)值,β為隱含層節(jié)點(diǎn)到輸出層節(jié)點(diǎn)的輸出權(quán)值,b為隱含層閾值,設(shè):
(6)
激活函數(shù)為g(x),輸出Y∈Rm×N包含N個(gè)樣本,那么:
Y=Hβ
(7)
(7)式中,H為隱含層輸出矩陣:
(8)
(9)
式中,H+為H的Moore-Penrose廣義逆。
通過(guò)求解方程的形式,將復(fù)雜的神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程簡(jiǎn)化為矩陣求逆問(wèn)題,與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法相比效率較高。ELM訓(xùn)練過(guò)程如下:
(1)將部分標(biāo)明類別的特征作為訓(xùn)練集輸入ELM訓(xùn)練模型,選擇一個(gè)合適的隱含層層數(shù)和激活函數(shù),經(jīng)訓(xùn)練得到a,b,β。其中a,b是隨機(jī)數(shù)矩陣;
(2)測(cè)試集和a,b,β輸入ELM預(yù)測(cè)模型,比較輸出的預(yù)測(cè)和實(shí)際類別,得預(yù)測(cè)正確率。
為了和傳統(tǒng)的BP算法作比較,隨機(jī)抽取840個(gè)訓(xùn)練樣本,60個(gè)測(cè)試樣本,選用隱含層節(jié)點(diǎn)數(shù)為1100,激活函數(shù)為sig的ELM預(yù)測(cè)模型,20 mW燒蝕功率光斑分類結(jié)果如圖6(a)所示。ELM分類預(yù)測(cè)正確率在93.33 %上下波動(dòng),分類效果尚可。平均訓(xùn)練時(shí)間為0.5812 s,預(yù)測(cè)時(shí)間在0.01 s左右。再隨機(jī)選擇2940個(gè)特征樣本訓(xùn)練集,60個(gè)樣本測(cè)試集,構(gòu)建更大的樣本集,觀察預(yù)測(cè)結(jié)果如圖6(b)所示。
圖6 不同樣本ELM預(yù)測(cè)結(jié)果
2940個(gè)樣本的ELM平均訓(xùn)練時(shí)間約2.5653 s,預(yù)測(cè)時(shí)間0.01 s。為了達(dá)到90 %以上的正確率需要隱含層的個(gè)數(shù)至少為1000。表明增大其隱含層神經(jīng)元個(gè)數(shù),正確率的提高與運(yùn)行時(shí)間亦增加。為縮短多隱含層ELM模型的訓(xùn)練時(shí)間,構(gòu)建LLTSA-ELM和LPP-ELM降維模型,此時(shí)ELM隱含層層數(shù)為100,預(yù)測(cè)效果如圖7所示。
圖7 LLTSA-ELM和LPP-ELM預(yù)測(cè)結(jié)果對(duì)比
二者對(duì)降維后的數(shù)據(jù)有著很好預(yù)測(cè)效果。LLTSA-ELM模型的預(yù)測(cè)時(shí)間在0.0495 s左右,正確率在93.33 %上下浮動(dòng)。LPP-ELM模型的預(yù)測(cè)時(shí)間約為0.0409 s,正確率約為96.67 %。由此可見(jiàn)LPP-ELM模型有著更好的預(yù)測(cè)效果。
對(duì)比研究隱含層節(jié)點(diǎn)數(shù)不同的各種模型的預(yù)測(cè)結(jié)果,期望選擇一種較好的分類模型。首先對(duì)比模型取不同隱含層的分類效果,訓(xùn)練集2940×6,測(cè)試集60×6。對(duì)隱含層不同的網(wǎng)絡(luò)訓(xùn)練五次取平均值,結(jié)果如圖8所示。圖8中,通過(guò)對(duì)比正確率和訓(xùn)練時(shí)間得到以下結(jié)論:BP和ELM隨著隱含層神經(jīng)元個(gè)數(shù)的增多所需訓(xùn)練時(shí)間逐步增加??梢钥吹紹P神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度穩(wěn)定在0.96之上,最短訓(xùn)練時(shí)間為0.7 s,最優(yōu)分類效果所用時(shí)間約為1.8 s。ELM對(duì)該樣本集的預(yù)測(cè)效果最大正確率為0.94,此時(shí)隱含層神經(jīng)節(jié)點(diǎn)數(shù)為1900,所用時(shí)間為8.586 s。很明顯,ELM對(duì)原始特征矩陣的分類效果不如BP神經(jīng)網(wǎng)絡(luò),因此需要對(duì)數(shù)據(jù)集進(jìn)行優(yōu)化。通過(guò)流形學(xué)習(xí)算法降低樣本維度,優(yōu)化數(shù)據(jù)集,減少運(yùn)算量。
圖8 BP和ELM預(yù)測(cè)結(jié)果對(duì)比
進(jìn)而構(gòu)建LLTSA-BP、LPP-BP、LLTSA-ELM、LPP-ELM四種模型觀察分類效果,如圖9所示。
綜合考慮正確率和訓(xùn)練時(shí)間,選擇各個(gè)模型可以得到最優(yōu)分類效果的隱含層數(shù),如表2所示。
表2 不同模型的分類結(jié)果
由表2可以看出,LPP-ELM模型的分類速度最快,且分類正確率在0.95以上。
圖9 四種分類模型預(yù)測(cè)結(jié)果對(duì)比
通過(guò)圖像分割、特征提取、模型分類實(shí)現(xiàn)了對(duì)飛秒激光等離子體光斑燒蝕功率的分類。針對(duì)光斑目標(biāo)弱小,亮度不均勻的特點(diǎn),采用Niblack局部分割方法對(duì)光斑目標(biāo)圖像分割,得到了較好的分割結(jié)果。在分割的基礎(chǔ)上對(duì)目標(biāo)亮度區(qū)域進(jìn)行掩膜覆蓋,得到精確分割的光斑目標(biāo)區(qū)域的亮度特征。采用不同模型,基于亮度特征和幾何特征組成的特征輸入矩陣向量進(jìn)行燒蝕功率分類,發(fā)現(xiàn)LPP-ELM的分類較精確,速度更快,更適用于飛秒激光燒蝕光斑功率的快速分類。為發(fā)揮LPP-ELM模型速度快的優(yōu)勢(shì),下一步將對(duì)LPP-ELM模型做進(jìn)一步改進(jìn)研究,提高算法分類準(zhǔn)確率,使其達(dá)到平均正確率0.98的精度。