李康達(dá),劉 浩,王 冰,孫曉帆,張?chǎng)紊?/p>
東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海 201620
近年來(lái),隨著新型無(wú)人機(jī)的迅速發(fā)展,航拍成像技術(shù)受到了日益廣泛的關(guān)注。基于無(wú)人機(jī)的航拍圖像具有目標(biāo)變化快、圖像細(xì)節(jié)豐富、資源消耗大等特點(diǎn)。傳統(tǒng)的航拍圖像處理系統(tǒng)通?;谀慰固夭蓸佣?,以至少兩倍于信號(hào)最高頻率的速率進(jìn)行采樣,然后通過(guò)JPEG或JPEG2000等編碼器實(shí)現(xiàn)有效的壓縮存儲(chǔ)。近期的研究表明,壓縮感知(Compressive Sensing,CS)理論[1-3]突破了奈奎斯特采樣定律[4]的局限,以欠奈奎斯特速率采樣的CS測(cè)量值仍然可以有效恢復(fù),大大降低了圖像采集成本,為航拍圖像的處理提供了新的選擇。
根據(jù)CS理論,若原始信號(hào)是稀疏的,則能夠在采樣的同時(shí)對(duì)信號(hào)進(jìn)行壓縮,且只需要少量的測(cè)量值就能對(duì)信號(hào)進(jìn)行高概率的無(wú)失真重構(gòu)。如果原始信號(hào)X在變換域是K階稀疏的,那么就可以構(gòu)造一個(gè)與變換基ΨN×N不相關(guān)的測(cè)量矩陣 ΦM×N={φ1,φ2,…,φM}T,對(duì)信號(hào)X進(jìn)行線性測(cè)量,方式如下:Y=ΦX=ΦΨs=θs,其中Y(長(zhǎng)度M)是信號(hào)X(長(zhǎng)度N,M<<N)通過(guò)測(cè)量獲得的測(cè)量值,將η=M/N定義為采樣率,θM×N=Φ×Ψ稱為觀測(cè)矩陣。對(duì)于所得的測(cè)量值,只要測(cè)量矩陣滿足約束等距性(Restricted Isometry Property,RIP)條件[5],則最少只需通過(guò)K lg(N/K)個(gè)測(cè)量值可將N維信號(hào)的K個(gè)最大值穩(wěn)定地重建出來(lái),即根據(jù)求解l1范數(shù)約束最優(yōu)化問(wèn)題,由測(cè)量值Y和觀測(cè)矩陣反推出原始信號(hào)X的估計(jì)值,再通過(guò)OMP(Orthogonal Matching Pursuit)、GPSR(Gradient Projection for Sparse Reconstruction)等重構(gòu)算法精確地恢復(fù)原始信號(hào)。從上述過(guò)程可以看出,壓縮感知系統(tǒng)的測(cè)量端比較簡(jiǎn)單,重構(gòu)端則較為復(fù)雜,這樣的特性契合航拍成像分析的需求。因此如何將壓縮感知與航拍系統(tǒng)結(jié)合起來(lái)是一個(gè)新興的課題。面向航拍成像的CS應(yīng)用也面臨著挑戰(zhàn),當(dāng)處理大尺寸圖像時(shí),測(cè)量矩陣的存儲(chǔ)就需要巨大的內(nèi)存,且解碼時(shí)間也會(huì)隨著圖像尺寸的增加呈現(xiàn)冪指數(shù)的增長(zhǎng)。為了解決此類問(wèn)題,Candes等人[6]提出了分塊壓縮感知(Block Compressive Sensing,BCS)框架:對(duì)原始圖像分塊進(jìn)行測(cè)量,并構(gòu)造相同的測(cè)量矩陣對(duì)圖像塊進(jìn)行單獨(dú)測(cè)量及聯(lián)合重構(gòu)。因?yàn)閳D像塊的尺寸比較小,所以可以解決內(nèi)存消耗大以及計(jì)算復(fù)雜度高等問(wèn)題。
一些學(xué)者在分塊測(cè)量方面對(duì)BCS算法進(jìn)行了改進(jìn)。Zhu等人在文獻(xiàn)[7]中提出了基于聯(lián)合重建加權(quán)的BCS算法,首先用一個(gè)較低的采樣率去預(yù)恢復(fù)圖像,根據(jù)預(yù)恢復(fù)后圖像的統(tǒng)計(jì)參數(shù),再對(duì)圖像塊進(jìn)行采樣率的自適應(yīng)分配,重新進(jìn)行壓縮感知編碼,最終提高圖像質(zhì)量。Wang等人在文獻(xiàn)[8]中設(shè)計(jì)了一種基于紋理特征的塊分割圖像采樣算法,首先提取圖像塊的紋理信息,在此基礎(chǔ)上將圖像劃分為平滑塊和紋理塊,并以此分配采樣率以提高圖像的整體質(zhì)量。進(jìn)一步地,李然等人[9]提出在保證圖像質(zhì)量的前提下,利用隨機(jī)測(cè)量矩陣的統(tǒng)計(jì)特性,將圖像塊方差計(jì)算由像素域轉(zhuǎn)移到測(cè)量域中進(jìn)行,避免了在采集端對(duì)原始圖像的依賴。此外,Zheng等人[10]提出了一種基于邊緣檢測(cè)的自適應(yīng)塊壓縮感知算法,利用分塊壓縮感知的特性,根據(jù)塊紋理梯度來(lái)分配采樣率,在圖像塊復(fù)雜度差別較大的情況下具有一定優(yōu)勢(shì)。Sun等人在文獻(xiàn)[11]中,利用每個(gè)像素與其8連通區(qū)域的最大梯度,測(cè)量像素的紋理變化,然后根據(jù)紋理變化分布進(jìn)行采樣率的自適應(yīng)分配,在低速率采樣狀態(tài)下較好地抑制了失真。
上述BCS算法沒(méi)有考慮如何在不同圖像之間進(jìn)行測(cè)量資源的分配?,F(xiàn)有的測(cè)量機(jī)制主要利用在一幅圖像內(nèi)各分塊的空域相關(guān)性,而不同圖像之間缺少這種相關(guān)性,因此難以提升圖像集的整體重構(gòu)質(zhì)量。在獲取航拍圖像集時(shí),現(xiàn)有系統(tǒng)通常只使用固定的平均采樣率對(duì)目標(biāo)圖像進(jìn)行拍攝,這樣獲得的圖像集常常由于不同圖像的質(zhì)量差距較大,無(wú)法符合后續(xù)的應(yīng)用需求。Wang等人[12]提出了基于塊類型的壓縮采樣(Type-based Compressive Sampling,TCS)算法,其核心思想可以從塊層次推廣到圖像層次:先將圖像分成三種類型,再為各類型的圖像設(shè)定固定比例的采樣率。實(shí)際上,采樣率自適應(yīng)的思想除了用于提高單幅圖像的成像質(zhì)量外,在其他圖像處理領(lǐng)域也有應(yīng)用。文獻(xiàn)[13]將自適應(yīng)采樣算法應(yīng)用于單探測(cè)器毫米波合成孔徑成像,與傳統(tǒng)算法相比,具有收斂速度快,生成目標(biāo)可靠等特點(diǎn)。
綜上所述,采樣率分配的思想運(yùn)用到圖像集這一層面上也具有實(shí)際意義。為了評(píng)估航拍圖像集的整體重構(gòu)質(zhì)量,本文首先建立了一個(gè)圖像集復(fù)合質(zhì)量的評(píng)價(jià)指標(biāo),并提出了一個(gè)基于圖像方差模型的壓縮采樣分配(Variation-based Sampling Allocation,VSA)算法,使航拍圖像集的整體重構(gòu)質(zhì)量得到普遍提升。
每個(gè)航拍圖像集通常需要執(zhí)行特定的目標(biāo)識(shí)別任務(wù),宜將圖像集的所有圖像進(jìn)行整體考慮。根據(jù)航拍圖像集的通用需求,首先應(yīng)明確如何評(píng)估一個(gè)圖像集的整體重構(gòu)質(zhì)量。在圖像處理中,峰值信噪比(Peak Signal to Noise Ratio,PSNR)一般用來(lái)評(píng)價(jià)經(jīng)過(guò)處理后的圖像質(zhì)量。在航拍圖像集中,對(duì)于多幅圖像的不同PSNR,并不適合直接進(jìn)行平均運(yùn)算,需要進(jìn)行一定的擴(kuò)展。對(duì)于同一圖像集,為了便于后續(xù)的整體處理,本文強(qiáng)調(diào)兩種圖像質(zhì)量的疊加:第一種是平均失真“PSNRa”,用于測(cè)量同一個(gè)圖像集中所有圖像的平均質(zhì)量;第二種是最差圖像質(zhì)量“PSNRm”,用于測(cè)量一個(gè)圖像集中質(zhì)量最差的圖像。若圖像集中總共有I幅圖像,將各個(gè)圖像設(shè)定成統(tǒng)一的大小,MSEi表示第i幅原始圖像與其重構(gòu)圖像之間的均方誤差。圖像集的均方誤差表示為:
其中,n為表示像素點(diǎn)的比特位數(shù);PNSR(i)表示第i幅原始圖像與其重構(gòu)圖像之間的峰值信噪比。在本文中,圖像集的最差圖像質(zhì)量“PSNRm”定義如下:
為了保證所有圖像的平均質(zhì)量,需要增加PSNRa,以提高資源的利用效率[14];為了讓質(zhì)量最差的圖像也能夠得到一定的資源,需要提高PSNRm,以提高資源利用的公平性[15]。在有限的采樣資源約束下,PSNRa高但PSNRm低,或者PSNRa低但PSNRm高,都不適合后續(xù)的目標(biāo)識(shí)別任務(wù),有必要對(duì)兩種質(zhì)量進(jìn)行加權(quán)平均。作為PSNRa和PSNRm的一個(gè)線性組合,圖像集的復(fù)合質(zhì)量“Ph”定義如下:
其中,加權(quán)因子“λ∈[0,1]”表示PSNRa分量的相對(duì)重要性。為了兼顧采樣資源使用的效率和公平,PSNRa和PSNRm應(yīng)具有類似的重要性。雖然λ的合理選擇是開放性的,實(shí)用的策略是將加權(quán)因子設(shè)置為一個(gè)固定值。由于PSNRa和PSNRm具有一個(gè)類似的量級(jí),一般而言,“λ=0.5”是一個(gè)簡(jiǎn)單而合理的折衷點(diǎn)。假定η是每個(gè)測(cè)量集的平均采樣率,總的采樣資源等于各采樣率的總和,即“I×η”。該優(yōu)化問(wèn)題是如何尋求總采樣資源的分配策略,最大程度地增加復(fù)合質(zhì)量Ph。若η(i)表示第i幅圖像的采樣率,上述優(yōu)化問(wèn)題可以表述為:
下面將研究如何在一個(gè)圖像集中為不同的圖像合理地分配采樣率,從而找出能使復(fù)合質(zhì)量Ph最大化的分配策略,即。
在對(duì)圖像集的每幅圖像逐一進(jìn)行壓縮感知編碼時(shí),傳統(tǒng)方法一般會(huì)采用一個(gè)固定的平均采樣率η,本文將其命名為Baseline算法,即:
假設(shè)X1,X2,…,Xi,…,XI表示圖像集中的不同圖像,Baseline算法的基本流程如圖1所示。
圖1 Baseline算法的流程圖
基于無(wú)人機(jī)的航拍圖像具有目標(biāo)變化快的特點(diǎn),那么同一個(gè)圖像集中就容易產(chǎn)生信息量差距較大的圖像,此時(shí)若使用Baseline算法,對(duì)所有圖像采取相同采樣率,就容易使獲得的圖像在重構(gòu)之后質(zhì)量相差較大,使得部分質(zhì)量太低的圖像無(wú)法使用,造成圖像集的整體重構(gòu)質(zhì)量較低。
為改善上述問(wèn)題,引言中提到的TCS算法可以將一個(gè)圖像集的圖像分成三類,對(duì)不同類型的圖像分配固定的采樣率。在保持總采樣率不變的前提下,為了提高整體圖像的恢復(fù)質(zhì)量,圖像集中相對(duì)較平滑的圖像只需要分配較低的采樣率就能較好地恢復(fù),而紋理圖像由于包含的細(xì)節(jié)較多,需要較高的測(cè)量率才能滿足要求,其余的圖像則分配一個(gè)相對(duì)中等的采樣率。在實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn),若單純按照TCS算法對(duì)圖像進(jìn)行壓縮采樣,重構(gòu)圖像集的復(fù)合質(zhì)量并未得到明顯的提升。實(shí)際上,一個(gè)圖像集中的圖像可以看作一種在某個(gè)區(qū)間內(nèi)的隨機(jī)變量,而TCS算法只將圖像類型限定在三種,造成過(guò)于粗糙的采樣資源分配結(jié)果。
本文通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)圖像的復(fù)雜程度與圖像方差之間呈現(xiàn)一定的線性關(guān)系,VSA算法可以用于解決采樣率分配過(guò)大或過(guò)小的問(wèn)題。若將圖像集中的圖像按照相對(duì)復(fù)雜程度進(jìn)行更加均勻的劃分,則可以更加有效地提升圖像集的復(fù)合質(zhì)量。若pj表示圖像像素 j,N表示圖像尺寸,VSA算法的圖像方差模型采用如下公式計(jì)算某一圖像i的相對(duì)復(fù)雜度:
式中,Di表示圖像集中當(dāng)前采樣圖像i的方差。Dmin和Dmax由預(yù)測(cè)量過(guò)程獲得,在進(jìn)行壓縮采樣之前,預(yù)先從圖像集中隨機(jī)選取I′=10幅圖像組成預(yù)測(cè)量圖像集,分別計(jì)算其中各個(gè)圖像方差。Dmin表示預(yù)測(cè)量圖像集中圖像的最小方差;Dmax表示預(yù)測(cè)量圖像集中圖像的最大方差;β是為了將圖像集方差信息映射成圖像復(fù)雜程度的一個(gè)參數(shù),其值通過(guò)預(yù)測(cè)量圖像集獲得:
其中,D′i表示預(yù)測(cè)量圖像集中圖像的方差;δi表示當(dāng)前圖像i在圖像集中的相對(duì)復(fù)雜程度。再根據(jù)如下的壓縮采樣分配算法為圖像集的不同圖像分配相應(yīng)的采樣率:
其中,η是平均采樣率。為了防止較大的誤差以及補(bǔ)償誤差能量,此處引入了系數(shù)α,對(duì)不同圖像集,系數(shù)需要根據(jù)相應(yīng)的預(yù)測(cè)量圖像集進(jìn)行確定。整個(gè)VSA算法的運(yùn)行過(guò)程如圖2所示。
圖2 VSA算法的流程圖
采樣率的改變,實(shí)際上是對(duì)測(cè)量矩陣的大小進(jìn)行了調(diào)整[16],在測(cè)量矩陣中原本的 M=N×η,經(jīng)過(guò)VSA算法調(diào)整為新的測(cè)量矩陣,M'=N×η',即壓縮采樣過(guò)程可以通過(guò)如下公式進(jìn)行描述:
后續(xù)實(shí)驗(yàn)將表明,采用VSA算法重構(gòu)的航拍圖像集能夠獲得更高的復(fù)合質(zhì)量。
為了測(cè)試所提VSA算法的性能,在BCS框架下,本文分別采用Baseline、TCS、VSA算法對(duì)航拍圖像進(jìn)行壓縮感知編碼,并采用圖像集復(fù)合質(zhì)量的評(píng)估準(zhǔn)則對(duì)整體圖像質(zhì)量進(jìn)行比較分析。待測(cè)的航拍圖像選自NWPURESISC45圖像數(shù)據(jù)庫(kù)[17],該數(shù)據(jù)庫(kù)包含的圖像集高達(dá)45個(gè),根據(jù)拍攝圖像的主體對(duì)象進(jìn)行圖像集的劃分。BCS框架的分塊尺寸選取性能較為均衡的32×32像素,稀疏變換基選取目前在圖像重構(gòu)上性能較優(yōu)的雙樹復(fù)小波變換基(DDWT),測(cè)量矩陣采用高斯隨機(jī)矩陣,恢復(fù)時(shí)均采用通用的平滑蘭德韋伯投影算法[18],由于測(cè)量矩陣的隨機(jī)性,對(duì)每種采樣率重復(fù)實(shí)驗(yàn)5次,取平均值作為最終的實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)仿真的硬件平臺(tái)為主頻3.3 GHz的Intel i5 CPU,軟件平臺(tái)為64位的Windows 7操作系統(tǒng)和Matlab 2016b仿真軟件。
實(shí)驗(yàn)在NWPU-RESISC45圖像數(shù)據(jù)庫(kù)中選取了Bridge、Island和Forest三個(gè)航拍圖像集作為待測(cè)圖像集,每個(gè)圖像集內(nèi)包含700幅大小統(tǒng)一為256×256的圖像,本文使用這三個(gè)圖像集來(lái)測(cè)試所提VSA算法的性能,評(píng)測(cè)指標(biāo)是重構(gòu)圖像集的復(fù)合質(zhì)量Ph。算法首先確定模型參數(shù),α通常應(yīng)小于0.8,以防止測(cè)量率的溢出。實(shí)驗(yàn)隨機(jī)選取各個(gè)圖像集中的10幅圖像進(jìn)行預(yù)測(cè)量,獲得不同α參數(shù)對(duì)于VSA算法性能的影響,如表1~表3所示。
表1 Bridge圖像集不同α參數(shù)的復(fù)合質(zhì)量P h對(duì)比
表2 Island圖像集不同α參數(shù)的復(fù)合質(zhì)量P h對(duì)比
表3 Forest圖像集不同α參數(shù)的復(fù)合質(zhì)量P h對(duì)比
從上述表中可以得出,Bridge和Forest圖像集中α取0.1時(shí)可以得到最佳的圖像集復(fù)合質(zhì)量,而對(duì)Island來(lái)說(shuō),α取0.7時(shí)獲得最佳的圖像集復(fù)合質(zhì)量。VSA算法針對(duì)相應(yīng)航拍圖像集的模型參數(shù)結(jié)果如表4所示。
表4 VSA算法的模型參數(shù)
實(shí)驗(yàn)選取Bridge、Island和Forest航拍圖像集作為待測(cè)圖像集,性能指標(biāo)是重構(gòu)圖像集的復(fù)合質(zhì)量Ph,采用上文所述的三種測(cè)量分配算法進(jìn)行實(shí)驗(yàn),結(jié)果如表5所示。從表中可以看出,與固定采樣率的Baseline算法相比,TCS算法和VSA算法在不同平均采樣率下均獲得了一定的質(zhì)量提升。由于VSA算法分配采樣率時(shí)采用了更加精細(xì)的圖像分類策略,能更好地針對(duì)圖像集的特征調(diào)整采樣率,與TCS算法相比,其復(fù)合質(zhì)量Ph進(jìn)一步增加了0.1~0.4 dB,獲得了實(shí)驗(yàn)中最佳的算法性能。
表5 不同算法的復(fù)合質(zhì)量P h對(duì)比
圖3 不同算法的PSNR m(Bridge圖像集)
圖4 不同算法的PSNR m(Island圖像集)
圖5 不同算法的PSNR m(Forest圖像集)
圖6 不同算法的PSNR a(Bridge圖像集)
圖7 不同算法的PSNR a(Island圖像集)
圖8 不同算法的PSNR a(Forest圖像集)
圖3 ~圖8展示了Baseline、TCS、VSA算法對(duì)于三個(gè)測(cè)試圖像集的PSNRm、PNSRa隨平均采樣率變化的情況。從圖中可以看到,在不同的平均采樣率下,PSNRm、PNSRa均獲得了不同程度的提升,結(jié)合表5,說(shuō)明所提算法通過(guò)更加精細(xì)的壓縮測(cè)量分配策略,在提升復(fù)合質(zhì)量Ph的基礎(chǔ)上,也提升了性能指標(biāo)PSNRm、PNSRa的值。
本文針對(duì)航拍圖像集的壓縮采樣分配算法進(jìn)行了研究,首先提出了圖像集復(fù)合質(zhì)量的評(píng)價(jià)標(biāo)準(zhǔn),通過(guò)實(shí)驗(yàn)建立了基于圖像方差模型的壓縮采樣分配算法,并與傳統(tǒng)算法進(jìn)行了對(duì)比。實(shí)驗(yàn)表明,相比于傳統(tǒng)算法,所提算法通過(guò)為圖像集中的不同圖像分配相應(yīng)的采樣率,能夠更有效地提升航拍圖像集的整體重構(gòu)質(zhì)量,具有一定的應(yīng)用價(jià)值。