林 斌,范永弘
(信息工程大學(xué) 測(cè)繪學(xué)院,河南 鄭州 450052)
對(duì)于理想的紅外焦平面陣列,有相同的入射輻射就該有一致的響應(yīng)輸出。但是在實(shí)際過(guò)程中由于材料質(zhì)量和制作工藝等因素的影響,每個(gè)探測(cè)器在阻抗、容抗、熱敏面積、電阻溫度等方面都存在微小差別,使得實(shí)際響應(yīng)輸出并不一致,這就是IRFPA響應(yīng)的非均勻性[1]。非均勻性的直接結(jié)果就是使紅外圖像產(chǎn)生不同程度的噪聲,影響成像質(zhì)量,這種情況下就要對(duì)紅外焦平面陣列進(jìn)行非均勻校正[2]。紅外圖像的非均勻性校正方法很多,但是總的來(lái)講分為兩大類(lèi):第一類(lèi)是基于定標(biāo)技術(shù)的,第二類(lèi)是基于場(chǎng)景技術(shù)的[3]?;诙?biāo)技術(shù)的算法主要應(yīng)用于噪聲不變的非均勻校正中,但是在實(shí)際過(guò)程中卻不能避免噪聲漂移帶來(lái)的問(wèn)題,因此需要一種能夠解決這一問(wèn)題的算法,即基于場(chǎng)景技術(shù)的非均勻校正算法。
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)校正法是基于場(chǎng)景技術(shù)的非均勻校正方法,由于它是一個(gè)反饋模型,根據(jù)誤差調(diào)整閾值和權(quán)值,所以在理論上它完全不需要對(duì)IFPRA進(jìn)行定標(biāo),對(duì)探測(cè)器參數(shù)的線性和穩(wěn)定性要求也不高,但是其存在收斂速度慢[4]、校正精度低、邊緣模糊和迭代步長(zhǎng)不易選擇等缺點(diǎn)。基于這些問(wèn)題,文獻(xiàn)[5]提出了利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行非均勻校正,而且選用不同的步長(zhǎng)達(dá)到快速收斂的效果。此算法效果良好,但是圖像容易出現(xiàn)邊緣模糊。本文在其基礎(chǔ)上進(jìn)行改進(jìn),提出基于中值濾波和添加動(dòng)量項(xiàng)的BP神經(jīng)網(wǎng)絡(luò)非均勻校正算法。結(jié)果表明,改進(jìn)的算法可以有效保留圖像邊緣細(xì)節(jié)。
人工神經(jīng)網(wǎng)絡(luò)是在精神病學(xué)家和神經(jīng)解剖學(xué)家McCulloch與數(shù)學(xué)家Pitts于1943年提出的神經(jīng)元生物學(xué)模型基礎(chǔ)上發(fā)展起來(lái)的模擬人腦信息處理的人工智能技術(shù)[6]。人工神經(jīng)網(wǎng)絡(luò)集合了大量簡(jiǎn)單神經(jīng)元,并將其進(jìn)行互聯(lián)組成一個(gè)復(fù)雜網(wǎng)絡(luò),因此,它是一種典型的多元輸入、單元輸出模型。其數(shù)學(xué)模型為
式中:w為輸入值與神經(jīng)元連接的權(quán)值,x為網(wǎng)絡(luò)的輸入值,b為閾值,u為神經(jīng)元的凈輸入值,z為調(diào)整后的值,同時(shí)稱(chēng)為神經(jīng)元的局部感應(yīng)區(qū),f(.)為激勵(lì)函數(shù)。
BP神經(jīng)網(wǎng)絡(luò)是一種多層次前饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)的主要特點(diǎn)是信號(hào)前向傳遞,誤差反向傳遞。在前者傳遞中,輸入信號(hào)從輸入層經(jīng)隱含層逐層處理,直至輸出層,每一層的神經(jīng)元狀態(tài)值影響下一層神經(jīng)元狀態(tài)。如果輸出層得不到期望輸出,則轉(zhuǎn)向反向傳播,根據(jù)預(yù)測(cè)誤差調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,從而使BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出不斷逼近期望輸出。BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)
根據(jù)圖1,在某種程度上可以把BP神經(jīng)網(wǎng)絡(luò)比作一個(gè)非線性函數(shù),該函數(shù)的自變量和因變量即是網(wǎng)絡(luò)的輸入值和預(yù)測(cè)值。利用非線性可微分函數(shù)進(jìn)行權(quán)值訓(xùn)練,具有自適應(yīng)、自學(xué)習(xí)能力,在自動(dòng)控制、飛行軌道模擬、噪聲抑制、模式識(shí)別等眾多領(lǐng)域得到了廣泛的應(yīng)用。
[5]可以得到BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行焦平面陣列非均勻性的具體實(shí)現(xiàn)形式。此算法包含輸入層、隱含層和輸出層三層網(wǎng)絡(luò)結(jié)構(gòu),其中有5個(gè)輸入、3個(gè)隱含層輸入、1個(gè)輸出。網(wǎng)絡(luò)輸入值是探測(cè)元D(i,j)及其相鄰上下左右探測(cè)元第n幀的圖像輸出,用X(n)表示。輸入層X(jué)和隱含層yi之間的權(quán)值矩陣及其閾值用Wi(n),bi(n)表示,隱含層和輸出層之間的權(quán)值矩陣和閾值用Vn,bn表示。隱含層的激勵(lì)函數(shù)為
輸出層的激勵(lì)函數(shù)是f2(x)=x。
圖2 BP神經(jīng)網(wǎng)絡(luò)非均勻校正網(wǎng)絡(luò)結(jié)構(gòu)
探測(cè)元(i,j)第n幀的期望輸出為其相鄰4個(gè)探測(cè)元的平均值,誤差函數(shù)分別為
控制量根據(jù)梯度修正法修正權(quán)值和閾值,使得不斷接近期望值。
式中l(wèi)r為學(xué)習(xí)速率。通過(guò)反復(fù)迭代,最終得出逼近的期望值。
在較弱的空間噪聲下,神經(jīng)網(wǎng)絡(luò)算法具有較好的校正效果;但是在較強(qiáng)的空間噪聲下,該算法的校正效果較差。因此控制強(qiáng)噪聲是發(fā)揮神經(jīng)網(wǎng)絡(luò)校正算法性能好壞的直接因素之一。由于中值濾波器在消除椒鹽噪聲和保護(hù)圖像細(xì)節(jié)方面具有良好的效果,所以本文采用了中值濾波器對(duì)紅外圖像的噪聲進(jìn)行預(yù)處理。中值濾波器的表達(dá)式為
該中值濾波器實(shí)現(xiàn)了將像元D(i,j)及其四鄰域的輸出值進(jìn)行中值處理,最后將處理后的輸出值H(i,j)作為D(i,j)的值。
對(duì)文獻(xiàn)[5]提出的BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行改進(jìn),主要在以下兩方面:
1)對(duì)中值濾波后的圖像灰度值進(jìn)行歸一化處理。
2)采用增加動(dòng)量項(xiàng)的方法提高學(xué)習(xí)效率,防止陷入局部最優(yōu)產(chǎn)生邊緣模糊。
數(shù)據(jù)歸一化是指神經(jīng)網(wǎng)絡(luò)在進(jìn)行結(jié)果預(yù)測(cè)前對(duì)輸入數(shù)據(jù)的一種處理方法,其目的就是將輸入數(shù)據(jù)都轉(zhuǎn)換到[-1,1],這樣可以避免各維數(shù)間因數(shù)量級(jí)差別而造成網(wǎng)絡(luò)預(yù)測(cè)誤差增大的情況發(fā)生。
上節(jié)中神經(jīng)網(wǎng)絡(luò)權(quán)值迭代采用梯度學(xué)習(xí)算法,網(wǎng)絡(luò)權(quán)值修正較慢且容易陷入局部最優(yōu),故本文采用了通過(guò)增加動(dòng)量項(xiàng)的方法提高網(wǎng)絡(luò)學(xué)習(xí)效率。增加動(dòng)量項(xiàng)的權(quán)值和閾值學(xué)習(xí)公式為
式中:lr1,lr2為學(xué)習(xí)速率。通過(guò)式(8)~式(11)對(duì)權(quán)值和閾值進(jìn)行迭代,可以改善局部最優(yōu)。
本文選用128*128的模擬紅外焦平面陣列響應(yīng)圖像作為實(shí)驗(yàn)仿真圖,并采用matlab進(jìn)行算法的仿真。圖3(a)表示紅外焦平面理論輸出圖像,圖3(b)表示噪聲強(qiáng)度很大的圖像。
圖3 焦平面理想圖像和含有非均勻性的圖像
首先對(duì)圖像采用中值濾波器進(jìn)行預(yù)處理,然后利用matlab進(jìn)行BP神經(jīng)網(wǎng)絡(luò)非均勻校正實(shí)驗(yàn)仿真。該BP神經(jīng)網(wǎng)絡(luò)采用5個(gè)輸入、3個(gè)隱含層和1個(gè)輸出的模型。圖4表示實(shí)驗(yàn)結(jié)果,其中圖4(a)表示采用上述中值濾波器進(jìn)行中值濾波的的實(shí)驗(yàn)圖;圖4(b)表示在圖4(a)的基礎(chǔ)上進(jìn)行BP神經(jīng)網(wǎng)絡(luò)運(yùn)算的實(shí)驗(yàn)結(jié)果(epoch=200)。最后隨機(jī)選取一個(gè)探測(cè)元D(i,j),將其輸出以及相鄰的上下左右4個(gè)探測(cè)元的輸出作為BP神經(jīng)網(wǎng)絡(luò)的輸入,在原來(lái)和改進(jìn)算法上進(jìn)行實(shí)驗(yàn)驗(yàn)證,并選用不同的學(xué)習(xí)速率分別進(jìn)行仿真。圖5和圖6分別表示在不同的學(xué)習(xí)速率下未添加動(dòng)量項(xiàng)時(shí)的誤差曲線和添加動(dòng)量后的誤差曲線。
圖4 實(shí)驗(yàn)仿真結(jié)果
從實(shí)驗(yàn)結(jié)果看,經(jīng)過(guò)中值濾波器進(jìn)行中值濾波預(yù)處理后,圖像(圖4(a))已明顯去除了大量噪聲,再采用添加動(dòng)量項(xiàng)的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像的非均勻校正,圖像在第200幀的結(jié)果如圖4(b)所示。從實(shí)驗(yàn)結(jié)果看,圖像在預(yù)處理后的基礎(chǔ)上非均勻性校正效果明顯,而且圖像的邊緣細(xì)節(jié)保留較好。從圖5和圖6的誤差曲線走勢(shì)看,當(dāng)采用較大的學(xué)習(xí)速率時(shí)(Lr1=0.5,Lr2=0.5),網(wǎng)絡(luò)的收斂速度快(見(jiàn)圖6)。當(dāng)設(shè)定期望輸出與隨機(jī)選取探測(cè)元輸出值的均方誤差為1%時(shí),未添加動(dòng)量項(xiàng)的BP神經(jīng)網(wǎng)絡(luò)方法比添加動(dòng)量項(xiàng)的速度提高一倍。同樣設(shè)定均方誤差為1%,當(dāng)采用較小的學(xué)習(xí)速率時(shí),發(fā)現(xiàn)兩者的收斂速度都變慢,尤其以添加動(dòng)量項(xiàng)的更為顯著。
根據(jù)以上的實(shí)驗(yàn)分析可知,對(duì)于本文提出的添加動(dòng)量項(xiàng)的BP神經(jīng)網(wǎng)絡(luò)算法,在非均勻性很大的情況下,可以先采用中值濾波器進(jìn)行圖像預(yù)處理,這樣可以去除一些椒鹽噪聲而且能夠保留一些圖形細(xì)節(jié),然后可以根據(jù)圖像的邊緣細(xì)節(jié)情況選用是否添加動(dòng)量項(xiàng)。若圖像邊緣細(xì)節(jié)豐富,則選用添加動(dòng)量項(xiàng)的BP神經(jīng)網(wǎng)絡(luò),并選用較小的學(xué)習(xí)速率,雖然耗費(fèi)的時(shí)間長(zhǎng)一點(diǎn),但這樣可以保證圖像較好的保留邊緣細(xì)節(jié);相反,則選取未添加動(dòng)量項(xiàng)的BP神經(jīng)網(wǎng)絡(luò)方法。
參考文獻(xiàn):
[1]常本康,蔡毅.紅外成像陣列與系統(tǒng)[M].修訂版.北京:科學(xué)出版社,2006:229.
[2]吳傳璽,代少升.基于中值濾波的紅外焦平面陣列非均勻性神經(jīng)網(wǎng)絡(luò)校正[J].紅外,2010,31(8):14-18.
[3]Xing Su-xia,Zhang Jun-Jv,et al.Two-point Nonuniformity Correction based on LMS[J].SPIE,2005,5640:130-136.
[4]張科,趙桂芳,崔瑞青,等.神經(jīng)網(wǎng)絡(luò)非均勻性校正算法中初始權(quán)值選取方法[J].激光與紅外,2007,37(3):248-251.
[5]朱杰,麻芃,宋利權(quán),等.焦平面陣列BP神經(jīng)網(wǎng)絡(luò)非均勻性校正及其算法改進(jìn)[J].紅外技術(shù),2010,32(7):377-380.
[6]Scribner D A,Sarkady K A,Gaulfield J T,et al.Nonuniformity correction for stating IR focal plane arrays using scene-based techniques[C]//Proceddings of SPIE,Infrared Detectors and Focal Plane Arrays,1990,1308:224-233.
[7]樓波,張峰,宋利權(quán),等.改進(jìn)的神經(jīng)網(wǎng)絡(luò)非均勻性校正方法[J].紅外與激光工程,2008,37(2):300-303.