王立剛, 定 翔, 洪寶玉, 李 飛
(中國計量科學研究院,北京100029)
自動調焦系統(tǒng)廣泛用于光學元件的曲率半徑、焦距測量以及影像類長度計量儀器中,調焦誤差會造成定位偏差,進而影響計量儀器的計量結果[1]。十字分劃板是調焦系統(tǒng)中的常用目標,為了滿足測量精度要求,在測量過程中需要保證經過被測系統(tǒng)后的圖像成像于測量透鏡的焦平面上。
用人工的方法進行調焦往往會由于主觀因素的影響,不能保證良好的調焦重復性[2]。隨著數(shù)字成像技術向自動化和智能化方向發(fā)展[3],基于調焦算法的自動調焦技術在精度、穩(wěn)定性等方面取得了很大的進展。
采用數(shù)字圖像處理法實現(xiàn)自動調焦的關鍵在于圖像清晰度評價函數(shù)的選取[4,5],理想的清晰度評價函數(shù)具有無偏性、單峰性、信噪比高、實時性好、靈敏度高的特點。清晰度評價函數(shù)通過計算不同圖像的某個特性得到的數(shù)值描述光學系統(tǒng)的離焦程度,這些特性的獲取基于離焦圖像和正焦圖像在CCD上成像結果的差別;當經過光學系統(tǒng)成像后的目標圖像恰好處于測量頭的焦平面時,所成圖像最清晰[6,7]。
清晰度評價函數(shù)主要有3類:
(1) 梯度函數(shù)。梯度函數(shù)常被用來獲取圖像邊緣信息,對焦良好圖像的邊緣更尖銳,梯度函數(shù)值更大。常見的算子有方差算子、Laplace算子、能量梯度算子等。
(2) 熵函數(shù)。信息熵是圖像灰度值多樣性的反映,對焦良好圖像的熵大于失焦圖像的熵。
(3) 頻譜函數(shù)。清晰的圖像有豐富的圖像細節(jié)和邊緣信息[8],通過將圖像空域中的細節(jié)及邊緣信息用頻域的高頻分量表示出來,選取高頻分量信息作為清晰度判斷的依據(jù)。
然而,基于梯度函數(shù)、熵函數(shù)、頻譜函數(shù)的算法不具有針對性,不能完全滿足十字線分劃板的調焦要求[9]。
調制傳遞函數(shù)(modulation transfer function,MTF)作為國際公認的光學系統(tǒng)標準評價指標,對圖像清晰度的變化很敏感[10,11]?;贛TF的自動調焦算法以光學系統(tǒng)MTF值作為調焦依據(jù),通過求取正焦和離焦多幅圖像在固定頻率下的MTF值繪制調焦曲線,可以實現(xiàn)更準確、更快速地調焦,且具有很高的信噪比。
數(shù)字傅里葉分析法利用CCD獲得十字分劃板的圖像灰度值分布,由計算機進行數(shù)字圖像處理得到線擴散函數(shù)(line spread function,LSF),對LSF進行相應處理后,再進行傅里葉變換即可得到圖像的MTF圖像。
該方法的原理為:光學成像系統(tǒng)中,像面的光強分布為物面上的光強分布和點擴散函數(shù)的卷積[12],用式(1)表示:
g(x,y)=h(x,y)*f(x,y)
(1)
式中:g(x,y)為經過光學系統(tǒng)后的輸出圖像;(x,y)為像素空間坐標;h(x,y)為系統(tǒng)響應函數(shù);f(x,y)為輸入圖像;*表示卷積操作。
對式(1)進行傅里葉變換,得到:
G(u,v)=H(u,v)F(u,v)
(2)
式中:G(u,v),H(u,v),F(u,v)分別為輸出圖像、響應函數(shù)、輸入圖像的傅里葉變換。H(u,v)就是光學傳遞函數(shù)。
OTF=H(u,v)=|H(u,v)|e-iθ(u,v)
(3)
OTF的幅值|H(u,v)|就是光學系統(tǒng)的調制傳遞函數(shù)MTF。
對于點光源,用二維的delta函數(shù)δ(x,y)作為理想輸入,經過光學系統(tǒng)成像后,得到的輸出圖像就是點擴散函數(shù)PSF(x,y):
PSF(x,y)=h(x,y)
=δ(x,y)*h(x,y)
=g(x,y)
(4)
對PSF進行傅里葉變換,得到OTF:
(5)
相對于針孔像、狹縫像能夠提供更多的能量,而且沿同一個方向進行多次平均就可以降低噪聲,所以狹縫像更適合做MTF計算。
設光源在y方向延伸形成線光源,各發(fā)光點不相干,則線光源可以看成在y方向為常量,以x為變量的delta函數(shù)[13],寬度無限窄的狹縫的二維函數(shù)可以表示為:
f(x,y)=δ(x)l(y)
(6)
式中:l(y)表示y方向的像素灰度值分布函數(shù),此處為常數(shù)。該線光源的輸出圖像就是線擴散函數(shù):
LSF(x,y)=f(x,y)*h(x,y)
=PSF(x,y)*[δ(x)l(y)]
(7)
由此可得:
(8)
所以,狹縫像的MTF是線擴散函數(shù)經過傅里葉變換后的幅值[10]:
MTF(u)=MTF(u,0)=|F[LSF(x)]|
(9)
實驗采用的軟件為Matlab2015b,程序運行環(huán)境為Windows 7旗艦版,64位操作系統(tǒng),處理器為Intel Core i5-3230M,主頻2.60 GHz,內存為4.00 GB。
本實驗采用的程序流程如圖1所示。
圖1 調焦算法程序流程圖Fig.1 Flow chart of focusing function algorithm
實驗采集圖片所用的CCD像元大小為4.65 μm,選用十字分劃板作為成像目標,以10倍的成像放大倍率進行自動調焦算法實驗。被測鏡頭的焦距為48 mm,F(xiàn)/#(即F數(shù)為鏡頭參數(shù),等于鏡頭直徑與焦距的比值)為5.6,CCD曝光時間為128 000 μs。
在正焦位置前后以0.05 mm為間隔等距截取9幅圖片,得到如圖2所示的序列。其中,圖2(e)處于正焦位置,清晰度最高。
圖2 圖片序列Fig.2 Image sequence to be processed
為了方便做快速傅里葉變換,本實驗的線擴散函數(shù)采樣區(qū)域大小為256個像素點。雖然采樣在暗室中進行,但由于CCD對環(huán)境光比較敏感,仍然存在背景噪聲,會對測量結果的精度產生較大影響;CCD的隨機噪聲也會對測量精度產生較大影響,所以在進行傅里葉變換前,這里分兩步對十字線圖像進行去噪處理:(1) 選取20條采樣行,對各列像素的灰度值求平均值得到LSF; (2) 通過直方圖統(tǒng)計圖像中的像素灰度值,找到出現(xiàn)頻次最多的灰度值即為背景噪聲,將整幅圖像減去背景噪聲灰度值即可得到正常圖像[14]。噪聲去除前后的MTF對比如圖3所示。
圖3 噪聲去除前后的MTF對比Fig.3 Comparison of MTF drawings before and after removing noise
3.2.1 調焦函數(shù)性能要求
無偏性。無偏性好的調焦函數(shù)系統(tǒng)誤差更小,得到的焦點位置更準確。
半寬度。半寬度是函數(shù)值等于最大值50%時的寬度范圍,反映了曲線的尖銳程度。半寬度小表示函數(shù)在較大離焦時的斜率更大,意味著調焦靈敏度更高。
單峰性。單峰性要求曲線只有一個極值點,在測量量程內正確反映調焦過程及結果。
信噪比。反映了調焦函數(shù)的抗干擾能力。信噪比高的調焦函數(shù)在受到外界參數(shù)影響時仍然能夠得到準確的結果,穩(wěn)定性和可靠性更高。
實時性。實時性由調焦函數(shù)的計算量來確定。實時性越好,調焦速度越快[15]。
3.2.2 不同調焦算法的結果對比
本實驗與兩類調焦函數(shù)進行對比。
(1) 梯度函數(shù):Brenner梯度函數(shù)通過計算相鄰2個像素灰度差的平方得到清晰度評價值;Tenegrad函數(shù)和Laplace函數(shù)分別用不同的算子獲取圖像梯度值得到清晰度評價值;灰度方差函數(shù)(SMD)通過計算相鄰像素的灰度差進行清晰度評價;灰度方差乘積(SMD2)修正了SMD算法焦點附近靈敏度過低的問題,對每一個像素領域2個灰度差相乘后再逐個像素累加得到清晰度評價值;方差函數(shù)(standdeviation)通過計算整體圖像的灰度值差異評估圖像清晰度。
(2) 頻譜函數(shù):傅里葉變換法(FFT)求取圖像在傅里葉變換域的幅值和計算圖像清晰度值。
為了找到本算法的合理頻率范圍,針對MTF曲線的不同空間頻率繪制的調焦曲線[16],如圖4所示。
圖4 不同空間頻率下的調焦曲線Fig4 The focusing curves at different spatial frequencies
由圖可得:空間頻率為200 線對/mm(截止頻率)的調焦曲線因為高頻噪聲影響,不能達到單峰性及無偏性要求;在10 線對/mm(低頻段)的調焦曲線靈敏度較低,也不符合要求。為了滿足靈敏度及單峰性要求,選取中頻段空間頻率來繪制調焦曲線,本實驗中選取的頻率為130 線對/mm。
為了對不同調焦函數(shù)的實時性進行評估,做出不同調焦函數(shù)對單張圖片清晰度計算的時間對比如表1所示。由此可得:基于數(shù)字圖像MTF的調焦函數(shù)運行時間最短,單張圖片清晰度計算僅用0.01 s。本算法實時性更好的原因在于選取十字線圖像的部分區(qū)域進行采樣,跟其它算法的整體采樣相比,計算量更小。
圖5是對不同調焦函數(shù)的性能評估。對于這個圖像序列,這8個評價函數(shù)得到的調焦位置是一致的,因此它們的無偏性能夠滿足要求。SMD、SMD2兩個評價函數(shù)雖然能夠得到正確的結果,但是它們的靈敏度比較低,不適合作為調焦函數(shù);Laplace函數(shù)由于單峰性較差,影響正焦位置的獲取,也排除在外。在圖中列舉的這些函數(shù)中,基于MTF的自動調焦函數(shù)的半寬度、靈敏度均是最佳選擇。
圖5 不同評價函數(shù)得到的調焦曲線Fig.5 The focusing curves obtained using different evaluation functions
表1 不同調焦函數(shù)的單張圖片計算時間Tab.1 Running time of single picture using different focusing functions
本文針對十字線目標的調焦需求,提出基于數(shù)字圖像MTF的清晰度算法,該算法通過數(shù)字圖像計算光學系統(tǒng)MTF,利用特征頻率下的MTF值繪制調焦曲線進行調焦。通過仿真分析,得到適合該算法的空間頻率范圍位于中頻段,截止頻率的1/2附近。
與傳統(tǒng)的調焦算法相比,新的算法實時性更強,單張圖片的清晰度值計算僅用0.01 s,能夠更快地實現(xiàn)正焦位置的搜索;調焦曲線的半寬度窄,靈敏度高,定位更準確。