張寅,丁鵬遠(yuǎn),朱桂熠,時(shí)萌瑋,閆鈞華
(南京航空航天大學(xué) 空間光電探測與感知工業(yè)和信息化部重點(diǎn)實(shí)驗(yàn)室,南京 211106)
光學(xué)偽裝技術(shù)可大幅減少高價(jià)值目標(biāo)的可探測性與被發(fā)現(xiàn)概率,提高目標(biāo)生存能力,被廣泛應(yīng)用。如何全面有效評估偽裝效果的優(yōu)劣,是目前的研究重點(diǎn)之一,直接影響偽裝策略的設(shè)計(jì)與選擇。傳統(tǒng)評估模型主要從背景匹配策略出發(fā),重點(diǎn)關(guān)注目標(biāo)與背景在顏色、亮度以及紋理等特征上的相似度。LIN C J等先后提出了質(zhì)量指數(shù)(Q index)[1]、偽裝相似指數(shù)(Camouflage Similarity Index, CSI)[2]和通用圖像質(zhì)量指數(shù)(Universal Image Quality Index, UIQI)[3]等相似度評價(jià)指標(biāo),并通過眼動(dòng)實(shí)驗(yàn)驗(yàn)證了這些指標(biāo)值和主觀評價(jià)的一致性。其中,Q-index和UIQI比較灰度圖像之間的相關(guān)性,CSI比較圖像顏色之間的相似程度。YANG X等提出了多特征偽裝圖案評價(jià)指標(biāo)(Multi-Feature Camouflage Fused Index, MF-CFI),進(jìn)一步增加了對迷彩圖案紋理和形狀的分析,該指標(biāo)在改進(jìn)的UIQI算法基礎(chǔ)上,結(jié)合人類對顏色、紋理、形狀和結(jié)構(gòu)的視覺感知過程,經(jīng)過綜合計(jì)算進(jìn)行評價(jià)[4]。喻鈞等發(fā)現(xiàn)目標(biāo)偽裝前后輪廓發(fā)生的形變對偽裝效果有重要影響,因此提出了二值化統(tǒng)計(jì)矩方法提取目標(biāo)的輪廓特征,計(jì)算目標(biāo)輪廓形變度[5]。上述偽裝評估方法能夠有效度量目標(biāo)和背景在視覺上的匹配程度,但未能綜合考慮目標(biāo)表面的完整程度、邊緣的連貫程度以及場景對目標(biāo)造成的影響,不能準(zhǔn)確評估目標(biāo)在復(fù)雜多變的野外環(huán)境中的偽裝效果。
近年來,學(xué)者們通過探討飛蛾、螃蟹等動(dòng)物在自然環(huán)境中的偽裝和生存狀況,提出了混隱色偽裝策略的概念?;祀[色定義為破壞目標(biāo)輪廓或者在目標(biāo)內(nèi)部形成的虛假邊緣圖案[6],針對此類的評估模型以邊緣融合程度為重點(diǎn)。LOVELL P G等提出可見度比率(Visibility Ratio, VisRat),通過Canny邊緣檢測器估計(jì)目標(biāo)輪廓與周圍環(huán)境邊緣數(shù)量之比,以此表示目標(biāo)輪廓的破壞程度[7]。KANG C等計(jì)算目標(biāo)輪廓與目標(biāo)中心邊緣數(shù)量之比,表示輪廓相對于內(nèi)部圖案的隱藏效果[8]。TROSCIANKO J等提出的Gabor邊緣破壞率(Gabor Edge Disruption Ratio, GabRat)是現(xiàn)階段最為成功的算法,其利用Gabor濾波器計(jì)算了偽裝目標(biāo)虛假邊緣和真實(shí)邊緣的比值,估計(jì)了目標(biāo)邊緣被分割、扭曲的程度[9]。目前,混隱色的研究多停留在仿真合成圖片中,研究對象局限于動(dòng)物,但該概念的提出為偽裝效能評估提供了新的理論依據(jù)。
背景匹配和混隱色對視覺搜索機(jī)制的影響作用尚未有定論[10-12],但存在階段性的結(jié)論提供指導(dǎo)。研究表明,偽裝效果的表達(dá)依賴于視覺環(huán)境[13-14]。PRICE N等研究了巖石潭(背景較復(fù)雜)和泥潭(背景顏色單一)兩種背景下的螃蟹外表特征,證明了在復(fù)雜環(huán)境下混隱色占據(jù)主導(dǎo)地位,簡單背景下則是背景匹配[14]。同時(shí),根據(jù)注意力特征融合理論,視覺系統(tǒng)在對目標(biāo)特征進(jìn)行融合時(shí),會(huì)受到場景整體復(fù)雜度和過去知識(shí)經(jīng)驗(yàn)的共同作用[15]。因此,在進(jìn)行目標(biāo)偽裝效能評估時(shí),必須考慮場景自身的特性情況。
本文將偽裝效能評估視為視覺搜索與目標(biāo)偽裝策略的對抗過程,在傳統(tǒng)背景匹配特征中引入混隱色特征,對目標(biāo)偽裝效果進(jìn)行綜合評估;針對混隱色特征中的表面完整性難以計(jì)算的問題,提出基于多重分形理論的目標(biāo)表面破壞度表征模型;在兩類特征的融合階段,根據(jù)背景引導(dǎo)理論,利用特征擁塞指數(shù)計(jì)算背景復(fù)雜度,通過邏輯斯蒂方程模擬人眼對各偽裝特征的敏感性,實(shí)現(xiàn)評估權(quán)重自適應(yīng)優(yōu)化。該模型增強(qiáng)了對環(huán)境的適應(yīng)性,提高了與主觀評價(jià)結(jié)果的一致性,能夠有效地對復(fù)雜環(huán)境下的偽裝效能進(jìn)行定量評估。
基于混隱色特征背景引導(dǎo)融合的偽裝效能評估模型整體框架如圖1所示,分為特征登記和特征融合兩部分,與視覺搜索過程保持一致。在特征登記階段,模擬視覺系統(tǒng)對多維特征的獨(dú)立提取與加工能力。在顏色相似度、結(jié)構(gòu)相似度等經(jīng)典背景匹配特征基礎(chǔ)上,引入目標(biāo)表面破壞度和邊緣破壞度表征混隱色特征。在特征融合階段,充分考慮背景自身特性對注意力的影響,利用背景復(fù)雜度引導(dǎo)特征融合權(quán)重自適應(yīng)調(diào)節(jié),實(shí)現(xiàn)不同變化場景下目標(biāo)偽裝效能有效評估。
圖1 偽裝效能評估整體流程圖Fig.1 Flow chart of Camouflage effectiveness evaluation
1.1.1 混隱色特征
特征登記階段主要模擬視覺系統(tǒng)對場景信息的匯集。當(dāng)場景較為混亂時(shí),顏色、結(jié)構(gòu)、紋理等特征信息紛亂復(fù)雜,視覺系統(tǒng)被大量此類特征擾亂而無法找到重點(diǎn),與之相對,代表目標(biāo)整體性和連貫度的混隱色特征更易被察覺。
1) 表面破壞度
在視覺系統(tǒng)中,當(dāng)觀察者對搜索目標(biāo)的結(jié)構(gòu)和形狀較為熟悉時(shí)(如人體、車輛等),目標(biāo)表面的完整程度成為檢測識(shí)別的關(guān)鍵信息。隨著觀測角度和目標(biāo)姿態(tài)的相對變化,目標(biāo)表面在圖像中往往呈現(xiàn)出不規(guī)則變化,其表面完整性無法通過常規(guī)手段度量,而分形理論在描述不規(guī)則圖形時(shí)具有獨(dú)特優(yōu)勢。
本文提出一種基于多重分形譜理論的目標(biāo)表面破壞程度(Surface Disruption)表征模型,其原理示意如圖2所示。根據(jù)混隱色作用機(jī)制,將暴露狀態(tài)下無內(nèi)部虛假邊緣的表面平滑完整目標(biāo)作為參考標(biāo)準(zhǔn)(后文簡稱平滑目標(biāo),可通過實(shí)際目標(biāo)掩模獲?。瑐窝b目標(biāo)與平滑目標(biāo)內(nèi)部虛假邊緣的差異程度越大,目標(biāo)自身表面破壞程度越高,偽裝效果越好。模型具體表達(dá)式為
圖2 表面破壞度表征模型原理示意圖Fig.2 Schematic diagram of surface disruption characterization model
式中,S為表面破壞程度;corr表示偽裝目標(biāo)與平滑目標(biāo)表面虛假邊緣的接近程度,可利用二者內(nèi)部邊緣多重分形譜ftar(α)和fmask(α)間的皮爾遜相關(guān)系數(shù)估計(jì);α為分形函數(shù)的奇異性指數(shù)。在計(jì)算ftar(α)和fmask(α)時(shí),以二值化掩模目標(biāo)表示參考平滑目標(biāo),對包含偽裝目標(biāo)和平滑目標(biāo)的局部圖像進(jìn)行Sobel算子邊緣分布檢測,凸顯偽裝手段導(dǎo)致的破壞性邊緣。
多重分形譜f(α)可以根據(jù)勒讓德變換和直接計(jì)算法進(jìn)行確定[16]
式中,多重分形譜f(α)和奇異指數(shù)α是q的隱函數(shù),對每個(gè)給定的q值,通過擬合斜率計(jì)算f(α)和α,在實(shí)際計(jì)算中q的取值范圍通常為(?1,1);μi(q,ε)為概率Pi(ε)的q階矩歸一化測度;將圖像視為三維空間中的曲面,利用大小為ε×ε×ε的正方體盒子進(jìn)行分割,ε=2,4,8,…,最大值受限于曲面大?。籔i(ε)為第i個(gè)盒子中的灰度之和ni(ε)與圖像總灰度的比值,即質(zhì)量概率,i=1,2,3,…,1/ε2。
2) 邊緣破壞度
邊緣的連貫程度和表面的完整程度相輔相成,共同決定了目標(biāo)的完整性。本文依據(jù)TROSCIANKO J等提出的GabRat算法計(jì)算邊緣破壞度[9],其值越大,目標(biāo)虛假邊緣的連貫性越好,目標(biāo)偽裝效果越好。計(jì)算方法為以一定角度將Gabor濾波器應(yīng)用于目標(biāo)邊緣的每個(gè)像素上,角度與目標(biāo)輪廓平行的濾波器得到的值為|Ep|,相當(dāng)于連貫邊緣的連續(xù)程度,而垂直方向?yàn)V波器得到的|Eo|,相當(dāng)于虛假邊緣的連續(xù)程度。然后,在整個(gè)身體輪廓上計(jì)算二者比率的平均值,得出最終結(jié)果G,具體公式為
1.1.2 背景匹配特征
在場景規(guī)則較少、色彩較為均勻的環(huán)境中,顏色、紋理和結(jié)構(gòu)信息決定了目標(biāo)能否與背景融為一體,是最易被視覺系統(tǒng)匯集的信息。這類特征統(tǒng)稱為背景匹配特征,在經(jīng)典偽裝評估方法中已得到廣泛應(yīng)用。
1) 顏色相似度
S-CIELAB顏色空間同時(shí)考慮了人類視覺系統(tǒng)的空間和顏色感知,對顏色相似性分析比其它顏色空間更加準(zhǔn)確,本文根據(jù)BAI X等提出的圖像顏色相似性指數(shù)(Image Color Similarity Index, ICSI)算法計(jì)算顏色相似度[17]。在S-CIELAB空間中,偽裝目標(biāo)tar與背景圖像bac的ICS計(jì)算方式如下,(u,v)代表像素位置,背景區(qū)域定義為兩倍的目標(biāo)區(qū)域。
式中,L?代表亮度;a?代表從綠色到紅色的分量,即正數(shù)代表紅色,負(fù)數(shù)代表綠色;b?代表從藍(lán)色到黃色的分量,即正數(shù)代表黃色,負(fù)數(shù)代表藍(lán)色。最后計(jì)算I(u,v)的標(biāo)準(zhǔn)差,作為偽裝圖像和背景圖像之間的顏色相似性指數(shù)。
2) 紋理相似度
本文根據(jù)XUE W等提出的梯度幅相似性偏差(Gradient Magnitude Similarity Deviation, GMSD)算法進(jìn)行紋理相似度分析[18]。首先,利用Sobel算子在水平和垂直方向上獲得偽裝圖像和背景圖像的紋理信息Star(u,v)和Sbac(u,v)
式中,Itar和Itar分別為偽裝圖像和背景圖像;sh和sv為不同方向的Sobel算子。
然后計(jì)算偽裝目標(biāo)tar與背景圖像bac的梯度幅值相似性(GMS)為
最后計(jì)算GMS的標(biāo)準(zhǔn)差,作為偽裝圖像和背景圖像之間的紋理相似性指數(shù)。
3) 結(jié)構(gòu)相似度
SSIM(Structural Similarity)是目前最為公認(rèn)的圖像結(jié)構(gòu)相似度度量指標(biāo)。
式中,μtar、μbac分別為目標(biāo)和背景灰度圖像的均值,σtar、σbac分別為目標(biāo)和背景灰度圖像的標(biāo)準(zhǔn)差,σtb則是協(xié)方差。
特征融合階段視覺系統(tǒng)將獲取的多維特征進(jìn)行有效關(guān)聯(lián),形成對目標(biāo)的深層認(rèn)知。特征融合時(shí)受到場景整體復(fù)雜度和過去知識(shí)經(jīng)驗(yàn)的共同作用。當(dāng)場景較復(fù)雜時(shí),混隱色特征占據(jù)主導(dǎo)地位,場景較簡單時(shí)則背景匹配特征更加顯著。因此,可建立模型利用背景復(fù)雜度引導(dǎo)混隱色特征和背景匹配特征的類間融合
式中,Ri為第i幅圖像最終偽裝評估結(jié)果,取值范圍為(0,1),其值越接近1則偽裝效能越高;Bi為背景匹配特征;Di為混隱色特征;Ni為線性融合權(quán)重,其值正比于背景復(fù)雜度,即背景越復(fù)雜,混隱色特征權(quán)重越大。
背景匹配特征Bi由顏色、紋理、結(jié)構(gòu)三種特征融合,混隱色特征Di則是邊緣、表面破壞度特征融合。由于特征的變化程度代表的物理意義各不相同,為了充分利用特征數(shù)據(jù),本文采用熵權(quán)法進(jìn)行特征之間的初步融合[19]
式(12)中線性系數(shù)Ni取決于背景復(fù)雜度,采用邏輯斯蒂方程建立背景復(fù)雜度與混隱色特征和背景匹配特征的關(guān)聯(lián)聯(lián)系。邏輯斯蒂方程具有以下特點(diǎn):1)單調(diào)增加趨勢,符合在復(fù)雜度變化的情況下,人眼對偽裝策略特征的敏感性逐漸變化的趨勢;2)曲線具有的潛伏期,增長期和穩(wěn)定期,有利于根據(jù)圖像復(fù)雜度區(qū)間調(diào)節(jié)曲線變化趨勢,自適應(yīng)給予權(quán)重。具體表達(dá)式為
在本文模型中,t為對應(yīng)圖像的特征擁塞指數(shù)[20],用于度量場景的復(fù)雜度,場景越復(fù)雜特征擁塞指數(shù)越高。N0、K和r為常數(shù),共同決定了曲線形狀,具體大小需考慮數(shù)據(jù)集復(fù)雜度分布和模型需求。實(shí)驗(yàn)和經(jīng)驗(yàn)表明,N0=5,K=375,r=1條件下,可以較好模擬人眼對混隱色特征和背景匹配特征的感知特性。
為了驗(yàn)證評估模型在不同偽裝目標(biāo)和不同復(fù)雜度背景下的有效性,選擇兩類實(shí)驗(yàn)數(shù)據(jù)集,一類為場景復(fù)雜程度相對較低的公開數(shù)據(jù)集Search_2,另一類為場景較為復(fù)雜的自建數(shù)據(jù)集CamData。如圖3所示,Search_2數(shù)據(jù)集的特征擁塞指數(shù)在2附近,區(qū)間寬度為0.372,區(qū)間較??;而CamData數(shù)據(jù)集圖像受到光影、樹木大小和數(shù)量、低矮植物等因素影響,特征擁塞指數(shù)最小值為4.325 2,最大值為8.344,區(qū)間大小為4.019。兩個(gè)數(shù)據(jù)集的復(fù)雜度分布截然不同,滿足評估模型測試需求。
圖3 數(shù)據(jù)集圖像復(fù)雜度分布圖Fig.3 Image complexity distribution of the dataset
Search_2數(shù)據(jù)集是由TNO人類因素研究所提供的公開數(shù)據(jù)集[21],廣泛應(yīng)用于目標(biāo)搜索探測性能研究和偽裝效果評估領(lǐng)域[22-23]。數(shù)據(jù)集包含44幅不同場景的數(shù)字彩色圖像,每幅圖像含1~2個(gè)目標(biāo)。主觀評估結(jié)果由64名專業(yè)觀察者給出,他們對每幅圖像進(jìn)行觀測并搜索目標(biāo)。本文實(shí)驗(yàn)中,去掉了目標(biāo)過小等問題圖像5幅,最終有效數(shù)據(jù)為39幅圖像[22],見圖4。
圖4 Search_2數(shù)據(jù)集第30幅圖像Fig.4 The 30th image of the Search_2 dataset
目前包含偽裝目標(biāo)和專業(yè)主觀評估結(jié)果的公開數(shù)據(jù)集極少,為了驗(yàn)證本文提出的算法在不同復(fù)雜背景下的有效性,本文建立了數(shù)據(jù)集CamData。數(shù)據(jù)集來源為網(wǎng)絡(luò)上搜集到的16個(gè)視頻,拍攝地點(diǎn)位于美國北德克薩斯森林,視頻記錄了身穿軍事迷彩服裝的人員在森林中隱藏的畫面,見圖5。將視頻逐幀提取為多幅圖像,選擇其中部分圖像構(gòu)建數(shù)據(jù)集。選擇標(biāo)準(zhǔn)為①背景顏色眾多,紋理復(fù)雜;②偽裝人員在叢林中有意隱藏,具備較大的搜索難度。視頻地址為https://www.youtube.com/user/Brent0331。
圖5 CamData數(shù)據(jù)集第42幅圖像Fig.5 The 42th image of the CamData dataset
數(shù)據(jù)集圖像共39幅圖像,每幅圖像均包含1個(gè)偽裝目標(biāo),偽裝目標(biāo)身穿四種軍事迷彩:德國迷彩Concamo,為美國陸軍狙擊手設(shè)計(jì)的DEPSOC,德國迷彩PHANTOMLEAF WASP以及中國07迷彩。數(shù)據(jù)集中目標(biāo)的暴露面積不同,但均存在頭盔、非天然圖案等足夠的特征供受試者發(fā)現(xiàn)并確認(rèn)目標(biāo)。
為了獲取專業(yè)可信的偽裝目標(biāo)主觀評估結(jié)果,以文獻(xiàn)[17,21]為基礎(chǔ)組織15名專業(yè)觀測者參與主觀評估實(shí)驗(yàn),要求參與者色覺正常(通過石原氏色盲檢測),裸眼或矯正視力1.2以上,年齡在20至30歲之間,熟悉實(shí)驗(yàn)的基本步驟,避免誤判。參與者坐在液晶顯示器前,調(diào)整屏幕確保水平視角。眼睛和屏幕之間的距離被設(shè)置為45 cm。圖像顯示在屏幕上,圖像的分辨率為1 920×1 080(與屏幕分辨率相同),屏幕長38.7 cm,寬25.9 cm。
在開始實(shí)際的搜索實(shí)驗(yàn)之前,首先向受試者展示偽裝人員的四個(gè)特寫鏡頭。展示偽裝人員的特寫只是為了讓受試者熟悉搜索目標(biāo),提醒受試者目標(biāo)是人造物體,與自然物體(巖石、灌木叢)形成鮮明對比。之后進(jìn)行5次搜索實(shí)驗(yàn)的試運(yùn)行,使受試者熟悉視覺搜索過程。搜索實(shí)驗(yàn)從呈現(xiàn)一個(gè)新場景圖像開始,受試者的任務(wù)是在圖像中搜索偽裝人員,并在檢測到目標(biāo)時(shí)立即按下鼠標(biāo)左鍵。計(jì)算機(jī)記錄從圖像顯示開始到受試者發(fā)出檢測到目標(biāo)信號(hào)的時(shí)間間隔,記為搜索時(shí)間。在受試者做出響應(yīng)后,為了檢查響應(yīng)的正確性,受試者被要求點(diǎn)擊的位置位于目標(biāo)內(nèi)部。如果指示的位置位于目標(biāo)內(nèi)部或者與目標(biāo)邊界相差極小,則認(rèn)為檢測是正確的。同時(shí),若受試者認(rèn)為本場景中不包含目標(biāo),則按下鼠標(biāo)右鍵,表示無法尋找到目標(biāo)。
正式的搜索實(shí)驗(yàn)在試運(yùn)行后開始。受試者可以自由選擇搜索方式,不被要求以特定的順序搜索圖像或在特定位置開始。在實(shí)驗(yàn)過程中每5幅圖像均有一個(gè)休息時(shí)間,以減少視覺疲勞的可能性。
衡量偽裝評估模型優(yōu)劣時(shí),通常采用主客觀一致性指標(biāo),即比較評估模型與專家評估結(jié)果之間的相關(guān)程度,相關(guān)程度越高模型性能越好[22,24-25]。本文選擇均方根誤差(Root Mean Square Error, RMSE)、皮爾遜相關(guān)系數(shù)(Pearson Correlation Coefficient, PLCC)和斯皮爾曼秩相關(guān)系數(shù)(Spearman's Rank Correlation Coefficient, SRCC)作為評價(jià)指標(biāo),RMSE越小,PLCC和SRCC值越接近1,模型性能越好。
由于模型評估值與專家評估結(jié)果間物理含義和尺度不同,相關(guān)性難以直接表征,因此需要利用函數(shù)模型進(jìn)行估計(jì)轉(zhuǎn)換。探測概率估計(jì)模型采用靜態(tài)目標(biāo)探測性能模型[26]
式中,Ppred表示探測概率估計(jì)值;X表示模型評估值;X50表示探測概率為50%時(shí)的模型評估值,指數(shù)E和X50通過最小二乘法確定。搜索時(shí)間估計(jì)模型采用多項(xiàng)式擬合模型[22]
式中,MPred表示搜索時(shí)間估計(jì),參數(shù)a,b,c通過最小二乘法擬合確定。
為驗(yàn)證本文偽裝評估模型性能,選擇三種目前認(rèn)可度較高、性能領(lǐng)先的評估方法作為比較對象,分別是基于感知色差和梯度的偽裝效能評估方法(Camouflage Effectiveness Based on Perceived Color Difference and Gradient Magnitude, PCDGM)[17]、計(jì)算目標(biāo)和背景相似性的通用圖像質(zhì)量指標(biāo)(UIQI)以及基于Gabor濾波器的邊緣破壞度(GabRat)方法。
表1和表2為各算法在Search_2數(shù)據(jù)集上的主客觀一致性比較結(jié)果,其中每個(gè)性能指標(biāo)排名前三的值已加粗,Ours(Back)和Ours(Dis)分別表示使用本文模型時(shí)只考慮背景匹配特征和只考慮混隱色特征,用于消融實(shí)驗(yàn)。
表1 Search_2數(shù)據(jù)集各方法探測概率主客觀一致性比較結(jié)果Table 1 Comparison results of subjective and objective consistency of detection probability of different methods in Search_2 dataset
表2 Search_2數(shù)據(jù)各方法集搜索時(shí)間主客觀一致性比較結(jié)果Table 2 Comparison results of subjective and objective consistency of search time of different methods in Search_2 dataset
與其它方法相比,本文模型Ours(Back+Dis)的PLCC、SCC和RMSE均為最優(yōu)值,具有最高的主客觀一致性,圖6為評估值與主觀結(jié)果對應(yīng)的擬合曲線。以背景匹配特征為核心的PCDGM和UIQI也均取得了較好的結(jié)果,而以混隱色特征為核心的GabRat結(jié)果較差。消融實(shí)驗(yàn)結(jié)果表明,Ours(Back)和Ours(Back+Dis)性能相近,而Ours(Dis)結(jié)果較差,說明在復(fù)雜度較低的Search_2數(shù)據(jù)集上背景匹配特征起主導(dǎo)作用,混隱色特征權(quán)重較低。
表3和表4為各算法在CamData數(shù)據(jù)集上的主客觀一致性比較結(jié)果,其中每個(gè)性能指標(biāo)排名前三的值已加粗。
表3 CamData數(shù)據(jù)集各方法探測概率主客觀一致性比較結(jié)果Table 3 Comparison results of subjective and objective consistency of detection probability of different methods in CamData dataset
表4 CamData數(shù)據(jù)集各方法搜索時(shí)間主客觀一致性比較結(jié)果Table 4 Comparison results of subjective and objective consistency of search time of different methods in CamData dataset
CamData數(shù)據(jù)集場景復(fù)雜度較高且變化區(qū)間較大,此時(shí)背景匹配特征對人眼的刺激性降低,Ours(Back)、PCDGM和UIQI均無法對偽裝效果進(jìn)行有效評價(jià)。另一方面,混隱色特征作用開始顯現(xiàn),本文模型Ours(Back+Dis)結(jié)果最優(yōu),Ours(Dis)性能與其接近。而GabRat雖然也考慮了混隱色特征,但只考慮了目標(biāo)邊緣的連貫性,未考慮目標(biāo)表面的完整性,只能在一定程度上評估偽裝效果。
在CamData數(shù)據(jù)集上,本文模型法得到的評估值與主觀結(jié)果對應(yīng)的擬合曲線如圖7所示,表明本文模型的預(yù)測曲線與主觀數(shù)據(jù)仍然具有較好地一致性;相比圖6,本數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果更多地分布在預(yù)測曲線上下兩側(cè),偏離點(diǎn)數(shù)量更多,主要原因是CamData數(shù)據(jù)集的主觀結(jié)果分布均勻,范圍更廣。
圖6 Search_2數(shù)據(jù)集本文方法與主觀結(jié)果擬合曲線Fig.6 Fitting curves of our method and subjective results in Search_2 dataset
圖7 CamData數(shù)據(jù)集本文方法與主觀結(jié)果擬合曲線Fig.7 Fitting curves of our method and subjective results in CamData dataset
為了進(jìn)一步驗(yàn)證本文算法的合理性和有效性,選取數(shù)據(jù)集中4幅典型圖像,如圖8所示,對其評估結(jié)果進(jìn)行分析。
圖8 數(shù)據(jù)集典型圖像Fig.8 The typical images of the dataset
評估數(shù)據(jù)見表5,其中評估結(jié)果和探測概率已加粗。
表5 典型圖像評估結(jié)果Table 5 Typical image evaluation results
表5為本文算法計(jì)算得到的各個(gè)特征值和主觀實(shí)驗(yàn)得到的探測概率,從左至右分別為:邊緣破壞度、表面破壞度、紋理相似度、結(jié)構(gòu)相似度、顏色相似度、權(quán)重N、評估結(jié)果和探測概率。由表5可知,本方法對上述4個(gè)目標(biāo)的偽裝評價(jià)結(jié)果由優(yōu)至劣為:Fig.8(a)> Fig.8(c)> Fig.8(e)> Fig.8(g);而探測概率的順序從低到高依次為:Fig.8(a)< Fig.8(c)< Fig.8(e)< Fig.8(g)。即偽裝效果越好,探測概率越低,符合主觀實(shí)驗(yàn)結(jié)果。
偽裝效果最好的Fig.8(a)中,偽裝目標(biāo)潛伏在低矮植物背后,目標(biāo)姿勢符合植物生長方向,極具迷惑性。計(jì)算結(jié)果中邊緣破壞度和表面破壞度為4幅圖像中的最大值,表明偽裝手段導(dǎo)致目標(biāo)邊緣和表面的完整性被破壞,因此難以被視覺系統(tǒng)察覺。而紋理、顏色、結(jié)構(gòu)三個(gè)相似度與主觀實(shí)驗(yàn)結(jié)果存在偏差,正如前文分析,在圖像整體較為復(fù)雜的情況下,依靠目標(biāo)在圖像中的紋理、顏色等特征的相似度難以穩(wěn)定評估偽裝效果。權(quán)重N最大,表明模型中邊緣破壞度和表面破壞度對評估結(jié)果的影響最大,符合模型建立的初衷。
Fig.8(c)中,偽裝目標(biāo)露出上半身趴倒在坡上手持槍械瞄準(zhǔn),目標(biāo)頭部和手臂比較突出,表面相對完整。表5中數(shù)據(jù)顯示,F(xiàn)ig.8(c)中偽裝目標(biāo)具有較高的邊緣破壞度和表面破壞度,表明偽裝手段較好地破壞了目標(biāo)表面和邊緣的完整性,使目標(biāo)不易被發(fā)現(xiàn)。Fig.8(e)中,目標(biāo)在曠野上行駛,依靠迷彩圖案融入局部環(huán)境。數(shù)據(jù)顯示,此目標(biāo)紋理、結(jié)構(gòu)和顏色相似度較高,而邊緣破壞度和表面破壞度較低,與圖像表現(xiàn)出的特征相符,具有一定的偽裝效果。而Fig.8(g)則是目標(biāo)基本不能融入環(huán)境,特征明顯,偽裝效果最差。
實(shí)際應(yīng)用中,不同標(biāo)注人員對同一目標(biāo)的掩模標(biāo)注存在一定誤差,本文通過對比實(shí)驗(yàn)分析了掩模誤差對評估結(jié)果的影響。如表6所示,表中第一列為精確標(biāo)注的真值掩模和對比掩模,第二列為掩模中目標(biāo)所占像素?cái)?shù)量,第三列為偽裝效能評估結(jié)果,第四列為掩模精度導(dǎo)致的評估誤差。結(jié)果表明,掩模誤差對評估結(jié)果的影響很小,相對誤差在3.5%以下。究其原因是本文模型主要基于目標(biāo)與背景的特征級(jí)差異而非像素級(jí),對掩模標(biāo)注誤差有較強(qiáng)的容忍度。
表6 掩模誤差影響對比實(shí)驗(yàn)結(jié)果Table 6 Results of mask error comparison experiments
兩個(gè)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,本文模型利用場景復(fù)雜度引導(dǎo)背景匹配特征與混隱色特征進(jìn)行自適應(yīng)融合,與視覺搜索機(jī)制符合性更優(yōu),能夠?qū)δ繕?biāo)偽裝狀態(tài)和背景環(huán)境的變化給予準(zhǔn)確的反映,適用于不同場景下目標(biāo)的高可靠性偽裝效能評估。
本文從視覺搜索機(jī)制與目標(biāo)偽裝策略的對抗角度出發(fā),綜合混隱色和背景匹配特征,建立了混隱色特征背景引導(dǎo)融合的偽裝評估模型,克服了傳統(tǒng)模型在復(fù)雜環(huán)境下可靠性較低的缺點(diǎn),實(shí)現(xiàn)了不同復(fù)雜環(huán)境下目標(biāo)偽裝效果的綜合性評估。理論分析和實(shí)驗(yàn)證明,本文方法在兩個(gè)不同復(fù)雜程度場景中具有較好的主客觀一致性,并且可操作性和穩(wěn)定性高,具有一定的應(yīng)用推廣價(jià)值。