張 馳,韓冬艷,冉 迪,胡楷鈺
(1 陸軍裝備部駐西安地區(qū)軍事代表局駐西安地區(qū)第七軍事代表室,西安 710065;2 西安現(xiàn)代控制技術(shù)研究所,西安 710065;3 陸軍裝備部駐西安地區(qū)軍事代表局駐南陽地區(qū)第一軍事代表室,河南南陽 710032)
基于圖像處理的自動調(diào)焦技術(shù)可高效、準確對主體目標進行聚焦,在軍事、民用領(lǐng)域有著廣泛應用。其核心為采用某種評價函數(shù)對圖像清晰度進行量化,再通過調(diào)焦搜索算法及動力機構(gòu)驅(qū)動可變鏡頭組對物距或像距進行調(diào)整,最終實現(xiàn)成像系統(tǒng)準確聚焦[1-6]。
由于求解圖像全局清晰度評價函數(shù)所需計算量較大,故實際應用中常采用適當?shù)恼{(diào)焦窗口來縮減求解范圍,以減少計算時間[7-9]。常見調(diào)焦窗口構(gòu)建算法有中心區(qū)域法、非均勻采樣法、多區(qū)域選擇法等,其共同特點是選取包含成像主體的局部區(qū)域作為求解范圍,在保持清晰度函數(shù)趨勢與全局計算一致的前提下以更少的計算量搜索到最佳聚焦位置。
文中提出一種基于多尺度窗口的分段式自動調(diào)焦算法,第一階段利用小尺寸調(diào)焦窗口,在清晰度函數(shù)與全局近似的情況下,快速尋找到局部聚焦位置;以該位置作為第二階段調(diào)焦的起點,增大窗口范圍,再以少量步數(shù)搜索到全局聚焦位置。實驗表明,該方法可有效降低圖像清晰度計算量,提升自動調(diào)焦的實時性。
清晰度評價函數(shù)是衡量聚焦是否準確的核心。理想的清晰度曲線要求滿足單峰性、無偏性[10-12]。
現(xiàn)有的評價函數(shù)主要分為空域、頻域、信息學三類。其中頻域評價函數(shù)的計算復雜度較高,實時性不易滿足;基于信息學的評價函數(shù)對圖像聚焦點的分辨力相對較弱;而空域類函數(shù)一般采用求解灰度梯度、提取邊緣等,可以相對低的復雜度取得較好的清晰度分辨力,在實際工程中使用較為廣泛。
基于全局求解評價函數(shù)的計算量較大,不利于整個調(diào)焦系統(tǒng)的實時性,一般構(gòu)建某種調(diào)焦窗口,對圖像的局部區(qū)域求取清晰度曲線,在確保成像主體準確聚焦的同時降低計算量。對于成像主體靜止且位于畫面中心的場合,常見的調(diào)焦窗口構(gòu)建算法包括中心區(qū)域法、非均勻采樣法、多區(qū)域選擇法等。
選擇圖像中心區(qū)域作為調(diào)焦窗口是最直接的策略, 如圖1(a)所示。其清晰度評價函數(shù)為:
(1)
圖1 不同調(diào)焦窗口示意圖
非均勻采樣法考慮了背景部分對成像清晰度的影響,以較低的采樣率采集圖像的邊緣部分,以較高的采樣率采集中心主體部分,兩者共同構(gòu)成調(diào)焦窗口。其調(diào)焦窗口如圖1(b)所示。采用矩形非均勻采樣法的清晰度評價函數(shù)為:
(2)
式中:2k-1為采樣間隔;k=1,Ak=A1;k=2,Ak=A2-A1;k=3,Ak=A3-A2;k=4,Ak=A4-A3。而且
A4={(X,Y)|X∈(0,W),Y∈(0,H)}。
圖2為對一組聚焦程度不同圖像序列采用中央?yún)^(qū)域法、非均勻采樣法、多區(qū)域法得到的清晰度評價曲線;采用常見的Laplace算子,此時:
(3)
式中:Gxy為以(x,y)為中心的3×3灰度矩陣;“*”表示二維卷積;L為加權(quán)矩陣,可表示為:
(4)
圖2 不同調(diào)焦窗口的清晰度評價曲線
從圖2可以看出,上述算法保證了窗口內(nèi)清晰度曲線與全局圖像趨勢一致。
以中心區(qū)域法為例,考察進一步減小調(diào)焦窗口范圍得到的清晰度曲線,如圖3所示。
可以看出當窗口范圍減小為原圖的1/8時(指中心區(qū)域的邊長為原圖的1/8),雖然清晰度曲線出現(xiàn)了多個局部最優(yōu)點,但峰值點與原圖保持一致;當窗口范圍減小為原圖的1/16時,局部最優(yōu)點的數(shù)量進一步增加,函數(shù)峰值已輕微偏離了原圖計算的結(jié)果;當窗口減小到原圖的1/32時,曲線已無法反應出原圖清晰度函數(shù)的走勢。雖然減小窗口可降低計算量,但當窗口范圍過小,甚至無法有效覆蓋成像主體時,得到的清晰度評價曲線將無法指導聚焦過程。
考慮采用一種分段式調(diào)焦算法:第一階段在清晰度曲線不嚴重偏離原圖趨勢的前提下適當減小調(diào)焦窗口,以降低求解清晰度值的計算量,相對快速地尋找到局部清晰度函數(shù)峰值p1(調(diào)焦窗口范圍內(nèi));之后增大窗口,保證調(diào)整后窗口的清晰度曲線峰值p2與全局聚焦位置一致,當p1臨近p2時,從p1出發(fā),第二階段可以少量步數(shù)聚焦。算法流程圖如圖4所示。
圖3 不同尺度窗口清晰度曲線
兩個階段調(diào)焦窗口均采用中心區(qū)域法,其清晰度評價函數(shù)類型如式(1)。為了在清晰度曲線不嚴重偏離原圖趨勢的前提下適當減小調(diào)焦窗口范圍,第一階段采用原圖中心的1/9區(qū)域作為調(diào)焦窗口;第二階段為保證調(diào)焦窗口清晰度曲線峰值與原圖一致,采用原圖中心的1/4區(qū)域作為調(diào)焦窗口。兩個階段調(diào)焦窗口如圖1(c)所示,表達式為:
(5)
(6)
圖4 多尺度窗口分段式調(diào)焦流程圖
調(diào)焦采用一種改進的爬山算法[2]。第一階段調(diào)焦時,選擇較大初始步長,以避免過早陷入局部最優(yōu)點;第二階段調(diào)焦時選擇較小初始步長,避免在最優(yōu)點附近過度調(diào)整。
利用某型光學系統(tǒng)采集一組(共95張)離焦程度不同的圖像序列(分辨率為768像素×576像素),相鄰序列號圖像之間近似認為調(diào)焦機構(gòu)步長為1,選取序列中部分圖像如圖5所示,完整的清晰度函數(shù)如圖2所示。
圖5 不同離焦程度圖像
表1 中心區(qū)域法聚焦過程
表2 非均勻采樣法聚焦過程
表3 多尺度法一階段聚焦過程
表1~表4列出了每種調(diào)焦窗口的一次典型聚焦過程,其中清晰度取歸一化值。由于使用中心區(qū)域法和非均勻采樣法時清晰度曲線較為平滑,為平衡調(diào)焦效率與精度,將初始步長設置為8。對于多尺度法,根據(jù)前文所述,第一階段調(diào)焦初始步長設置為16,如表3所示,其中第11步既是第一階段調(diào)焦的終點也是第二階段的起點;第二階段初始步長設置為2,如表4所示。每改變一次搜索方向則調(diào)焦步長減半,最小步長為1。
表4 多尺度法第二階段聚焦過程
任意選取10個不同起點進行調(diào)焦實驗,表5統(tǒng)計了每種算法聚焦的步數(shù)。中心區(qū)域法、非均勻采樣法的平均調(diào)焦步數(shù)為11;多尺度法第一階段調(diào)焦的平均步數(shù)為11,第二階段平均步數(shù)為3。
表5 調(diào)焦步數(shù)統(tǒng)計
一次典型聚焦過程獲取清晰度值所需的計算量θ=λσN,其中λ為平均調(diào)焦步數(shù),N為窗口內(nèi)像素數(shù),σ為單位像素Laplace算子的計算量,對于不同調(diào)焦窗口構(gòu)建算法σ相同。
對于中心區(qū)域選擇法,N=0.062 5WH(其中W,H為圖像的寬和高),λ=11,θ=0.688σWH;對于非均勻采樣法N=0.267WH,λ=11,θ=2.937σWH;對于多尺度法,第一階段N1=0.012WH,λ1=11,θ1=0.132σWH,第二階段N2=0.062 5WH,λ2=3,θ2=0.188σWH,θ=θ1+θ2=0.32σWH。可以看出在相同條件下,多尺度法計算量為中心區(qū)域選擇法的47%,為非均勻采樣法的11%,具有更強的實時性。
文中提出了一種多尺度調(diào)焦窗口構(gòu)建算法,采用分段式調(diào)焦,第一階段使用小尺寸調(diào)焦窗口降低單幅圖像清晰度值計算量,相對快速地尋找到局部聚焦位置,之后再適當增大調(diào)焦窗口范圍,在第二階段以少量步數(shù)準確搜索到全局聚焦位置,實驗結(jié)果表明該算法可有效提升自動調(diào)焦的實時性。