韋順軍,蒲 羚,張曉玲,師 君
復(fù)雜軌跡合成孔徑雷達(dá)后向投影算法圖像流GPU成像*
韋順軍**,蒲 羚,張曉玲,師 君
(電子科技大學(xué)電子工程學(xué)院,成都 611731)
相對于基于傅里葉變換的頻域成像算法,后向投影(BP)算法因采用時域逐點相干積累,更適合于復(fù)雜軌跡合成孔徑雷達(dá)(SAR)高精度成像。但BP算法計算量巨大,限制了其應(yīng)用于SAR大場景大數(shù)據(jù)量快速成像。圖形處理器(GPU)具有強大浮點運算和并行處理能力,為大場景BP算法快速成像實現(xiàn)提供了途徑。結(jié)合GPU并行處理,提出了一種基于圖像流的復(fù)雜運動SAR大場景BP快速成像處理方法。該方法借助BP算法中圖像像素點相互獨立處理的特性,采用圖像像素點并行及圖像流程處理,設(shè)計了孔徑與圖像緩存調(diào)度方案,提高SAR大場景大數(shù)據(jù)BP算法成像效率。仿真和機載實測數(shù)據(jù)結(jié)果驗證了方法的有效性,在有限GPU顯存條件下實現(xiàn)了8 192×8 192大場景快速成像,并且成像加速比相對于傳統(tǒng)CPU單線程處理可達(dá)300倍以上。
SAR;復(fù)雜軌跡;后向投影算法;GPU加速;大場景成像
合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)作為一種全天時、全天候、信息量豐富的遙感成像技術(shù),已成為對地觀測的重要手段,在地形圖像生成、目標(biāo)探測與偵察、軍事打擊、國土資源勘查和自然災(zāi)害監(jiān)測等國民經(jīng)濟與軍事領(lǐng)域發(fā)揮著重要作用[1-2]。近幾年來,隨著SAR載荷及任務(wù)多樣化,如利用導(dǎo)彈、無人機等載荷實現(xiàn)戰(zhàn)場監(jiān)測、精確打擊等任務(wù),成像觀測中已難以滿足傳統(tǒng)SAR線性軌跡要求[3]。另外,隨著雷達(dá)硬件飛速發(fā)展和信息化應(yīng)用不斷深化,獲取大場景豐富信息已成為SAR應(yīng)用的迫切需求。因此,復(fù)雜軌跡下大場景高精度成像技術(shù)成為了當(dāng)前SAR領(lǐng)域的研究熱點,其中如何實現(xiàn)大場景高精度快速或?qū)崟r成像,更是制約其成功應(yīng)用的關(guān)鍵問題。
與光學(xué)遙感相比,SAR成像需對原始回波數(shù)據(jù)進行相干聚焦處理。目前,常用SAR成像算法主要分成兩類:一類是以距離多普勒(Range Doppler,RD)算法、尺度變換(Chirp Scaling,CS)算法、波束域(Wavenumber Domain,W-K)算法等為代表的頻域處理算法[4],該類算法利用快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)完成數(shù)據(jù)頻域相干聚焦,故運算量少,處理效率高,但算法實現(xiàn)復(fù)雜且要求平臺軌跡線性變化;另一類是以后向投影(Back Projection,BP)算法等為代表的時域成像算法[5],該類算法采用時域逐點相干聚焦,故運算量極大,處理效率低,但算法實現(xiàn)簡單且適用于任意平臺運軌跡。因此,較頻域成像算法,BP算法更適合于復(fù)雜運動SAR高精度成像。但BP算法運算量巨大,使其在一些實際應(yīng)用中受限。
近年來,隨著計算機硬件的飛速發(fā)展,英偉達(dá)公司開發(fā)的適用于通用并行計算的圖形處理器(Graphics Processing Unit,GPU)在運算、傳輸速度和存儲方面也得到迅速提升,其配套的統(tǒng)一計算設(shè)備架構(gòu)(Compute Unified Device Architecture,CUDA)開發(fā)平臺經(jīng)過多次升級和完善,已推出了大量的并行編程模型和指令,為高性能計算、大數(shù)據(jù)處理技術(shù)帶來了重要突破[6]。目前,GPU加速已在SAR成像與應(yīng)用領(lǐng)域引起高度關(guān)注。例如:文獻[7]結(jié)合RD算法與GPU并行,提出一種高并行度機載SAR實時并行成像處理方案;文獻[8]提出一種方位時域分割GPU處理的W-K算法,減少主機內(nèi)存與GPU顯存間冗余數(shù)據(jù)傳輸,成倍縮減GPU處理時間;文獻[9]提出BP算法GPU實現(xiàn),使原本極其耗時的處理過程可在較短時間內(nèi)完成;文獻[10]分析了BP算法并行化,提出了一種GPU加速的BP成像方案,并給出BP成像的GPU優(yōu)化成像方案;文獻[11 -15]介紹了其他SAR數(shù)據(jù)處理在GPU上的并行實現(xiàn)方法。因此,結(jié)合GPU并行可使得SAR數(shù)據(jù)處理速度大幅度提升,為復(fù)雜運動SAR大場景BP算法快速成像提供了一種有效途徑。然而,由于目前GPU顯存容量有限,現(xiàn)有BP-GPU方法通常需將SAR全部回波數(shù)據(jù)或整個成像空間分辨單元讀入GPU顯存,在SAR大場景成像時可能會造成GPU顯存不足而難以適用。
為了提高復(fù)雜軌跡SAR大場景BP算法成像效率,本文結(jié)合GPU并行技術(shù),提出了一種基于圖像流的BP算法GPU實現(xiàn),簡稱圖像流BP-GPU方法。該方法借助BP算法中成像分辨單元處理的獨立性,采用圖像流對平臺軌跡、回波數(shù)據(jù)、成像空間等實現(xiàn)GPU并行處理,從而在有限GPU顯存容量下實現(xiàn)復(fù)雜運動SAR大場景BP算法快速成像。
2.1算法原理
在SAR成像中,BP算法基本思路是將成像空間分辨單元的回波信號進行距離壓縮并補償多普勒相位,然后將方位向信號相干疊加得到該散射點幅度信息,從而獲得成像空間SAR成像結(jié)果。以機載為例,SAR成像典型幾何模型如圖1所示,假設(shè)其采用正側(cè)視成像模式,其中飛機以速度v沿Y方向運動,虛線為理想線性運動軌跡,實線為真實復(fù)雜運動軌跡,場景中某散射點位置為Pw,散射系數(shù)為σ(Pw),雷達(dá)在第n個慢時刻位置為P(n),此時Pw到雷達(dá)距離為R(n;Pw)=‖Pw-P(n)‖2。
圖1 機載SAR成像幾何模型Fig.1 The imaging geometric model of airborne SAR
假設(shè)雷達(dá)發(fā)射線性調(diào)頻(Linear Frequency Modulation,LFM)信號,表達(dá)式為
式中:fc為雷達(dá)載頻;fdr為信號調(diào)頻斜率;T為脈沖周期。則點目標(biāo)Pw回波信號可表示為
式中:λ為雷達(dá)載波波長。若給定一個離散化觀測場景Ω,SAR回波數(shù)據(jù)可表示為
式中:第1項相位對應(yīng)場景方位向信息;第2項對應(yīng)場景距離向信息。
對于SAR數(shù)據(jù)距離向成像,BP算法采用脈沖壓縮技術(shù)進行聚焦處理。式(3)脈壓后,可表示為
式中:sr(r,n)為第n慢時刻場景r處的脈壓后回波;γ(r,n)為場景r位置處的距離模糊函數(shù)。
對于SAR數(shù)據(jù)方位向成像,BP算法采用相干積累進行聚焦處理。對于點Pw,式(4)相干積累后為
式中:I(Pw)為Pw的BP算法成像結(jié)果;sr(rPw,n)為第n慢時刻Pw對應(yīng)的脈壓回波。在BP算法中通常需對sr(r,n)進行插值重采樣估計sr(rPw,n)。
因此,BP算法是脈壓數(shù)據(jù)與成像空間分辨單元點對點的圖像重建過程,其主要步驟詳見文獻[16]。BP算法成像是逐個方位向慢時刻(對應(yīng)于脈沖重復(fù)周期PRI)數(shù)據(jù)和逐個成像分辨單元相干積累的過程,算法原理簡單且成像過程沒有任何近似誤差,故適用于復(fù)雜運動SAR高精度成像。
2.2BP算法并行化
由BP算法流程可知,其主要包括距離壓縮和后向投影兩個部分,其中后向投影包括計算斜距、插值與重采樣、相干積累等3個過程。因BP算法距離壓縮和傳統(tǒng)RD算法相同,相關(guān)GPU并行實現(xiàn)可參見文獻[7],本文不再贅述?;诜轿幌蛎}壓數(shù)據(jù)處理與成像空間分辨單元處理的獨立性,目前BP算法GPU并行實現(xiàn)方法主要有方位向PRI并行和成像分辨單元并行兩種方式。
(1)方法1:方位向PRI并行
在該并行方法中,GPU線程對應(yīng)于SAR方位向每一個PRI脈壓數(shù)據(jù),針對成像空間中一個分辨單元,GPU中每個線程計算該單元到對應(yīng)PRI距離歷史和延時,然后完成該慢時刻后向投影處理,并將所有線程處理結(jié)果累加到該單元的存儲位置,然后遍歷成像空間中所有分辨單元,最終實現(xiàn)BP算法GPU并行成像。對于一塊大小為Na×Nr的SAR回波數(shù)據(jù),其中Na為數(shù)據(jù)方位向點數(shù),Nr為數(shù)據(jù)距離向點數(shù),該方法可采用Na個線程并行,故具有O(Na)并行度。該方法并行實現(xiàn)的基本流程如圖2(a)所示。
(2)方法2:成像分辨單元并行
在該并行方法中,GPU線程對應(yīng)于成像空間中分辨單元,針對方位向某PRI,GPU中每個線程計算該PRI到成像空間所有分辨單元的距離歷史和時延,然后完成后向投影處理,得到所有網(wǎng)格點在當(dāng)前PRI的后向投影結(jié)果,并將其累加到對應(yīng)網(wǎng)格點的存儲單元,然后逐次遍歷RPI數(shù)據(jù),最終實現(xiàn)BP算法GPU并行成像。對于一塊大小為Ma×Mr的成像圖像,其中Ma為空間方位向點數(shù),Mr為空間距離向點數(shù),該算法可采用Ma×Mr個線程并行,故具有O(Ma·Mr)并行度。該方法并行實現(xiàn)基本流程如圖2(b)所示。
圖2 傳統(tǒng)BP算法并行處理框圖Fig.2 The parallel processing block diagram of conventional BP algorithm
以上兩種BP并行方法各有優(yōu)劣,但由于分辨單元數(shù)Ma×Mr通常大于方位向點數(shù)Na,因此方法2并行度往往要優(yōu)于方法1。但是,兩種BP并行方法只是針對BP算法中滿足并行條件的部分實現(xiàn)并行化,未考慮實際成像過程中SAR系統(tǒng)觀測、偵查時可能會持續(xù)好幾個小時,覆蓋幾百里區(qū)域,因此所獲回波數(shù)據(jù)量是非常大的(通常有幾十GB以上)。然而,目前GPU顯存容量非常有限(顯存通常為6 GB左右),無法同時存儲大回波數(shù)據(jù)和成像結(jié)果。針對這種情況,傳統(tǒng)方法采用分塊處理辦法,但分塊處理方法會產(chǎn)生大量冗余操作、數(shù)據(jù)拼接等問題,極大地影響成像效率。例如:對一塊場景進行成像時,待成像數(shù)據(jù)在方位向總長度為合成孔徑長度與所成像場景的長度之和,故在兩個毗鄰子塊間會存在半個孔徑長度的重合區(qū),進而產(chǎn)生冗余操作。因此,面對SAR大場景GPU并行成像,需要在成像過程中進行恰當(dāng)?shù)臄?shù)據(jù)調(diào)度和存儲管理。
3.1并行方法原理
為了實現(xiàn)復(fù)雜運動SAR大場景成像快速,本文結(jié)合BP算法成像空間并行處理,提出基于圖像流的BP成像算法GPU并行實現(xiàn),簡稱圖像流BPGPU方法。在SAR數(shù)據(jù)采集過程中,觀測空間可劃分為已觀測空間、當(dāng)前觀測空間和待觀測空間3部分,如圖3所示。已觀測空間中目標(biāo)場景回波信號已被全部接收且可進行全空間成像;當(dāng)前照射空間長度恰好等于SAR合成孔徑長度,其只接收到部分目標(biāo)場景回波,故無法實現(xiàn)全空間成像,但可進行部分?jǐn)?shù)據(jù)成像;待觀測空間是SAR系統(tǒng)尚未照射區(qū)域,沒有回波數(shù)據(jù),無法進行任何成像操作。因此,BP算法可逐個對PRI數(shù)據(jù)與其對應(yīng)觀測空間進行成像處理,使成像過程中隨著PRI變化,待觀測空間逐漸進入到當(dāng)前觀測空間,當(dāng)前觀測空間則逐漸轉(zhuǎn)換成具有成像條件的已觀測空間,從而實現(xiàn)大場景沿PRI序號逐個圖像流生成。
圖3 圖像流GPU-BP算法成像示意圖Fig.3 The sketch of the image streams GPU-BP algorithm
圖像流BP-GPU方法基本思路是按PRI序號讀取一個或多個脈壓數(shù)據(jù),將其投影到當(dāng)前觀測空間進行方法2后向投影GPU并行處理,再依據(jù)下一個PRI平臺軌跡,滑動當(dāng)前觀測空間并將處理結(jié)果累加,然后將已滑入已觀測空間的數(shù)據(jù)進行成像與存儲,直至處理完所有SAR回波數(shù)據(jù)或成像空間。
在數(shù)據(jù)調(diào)度策略上,圖像流BP-GPU方法采用雙緩存結(jié)構(gòu):孔徑緩存和圖像緩存??讖骄彺媸侵肝挥贕PU端的用于存放“當(dāng)前照射區(qū)域”中各像素點數(shù)據(jù)及數(shù)據(jù)傳輸所需的顯存空間。圖像緩存是指位于CPU端的用于存放GPU已處理完成像結(jié)果的內(nèi)存空間。圖像流BP-GPU方法成像中采用主機硬盤作為輸入和輸出存儲介質(zhì),而CPU內(nèi)存和GPU顯存作為數(shù)據(jù)緩存,大大降低了SAR成像過程對內(nèi)存和顯存的需求。此外,若硬件性能足夠好,流圖像處理在天線波束滑出場景區(qū)域時即可完成該區(qū)域成像,實現(xiàn)SAR快速或?qū)崟r成像處理。
在數(shù)據(jù)成像策略上,圖像流BP-GPU算法與方法2中BP-GPU實現(xiàn)相似,均基于成像空間分辨單元并行,但GPU線程不再對應(yīng)整個成像區(qū)域,而是對應(yīng)于子圖像分辨單元。因此,相對于傳統(tǒng)GPUBP方法,圖像流BP-GPU方法能有效避免孔徑拼接過程中冗余操作,減小存儲器要求,較好地解決由有限GPU顯存條件下SAR大場景成像問題。
3.2并行算法流程
圖像流BP-GPU方法主要步驟如下:
(1)初始化成像方法和GPU參數(shù),包括BP算法成像空間、子圖像參數(shù)、GPU顯存分配等;
(2)根據(jù)GPU顯存分配,按照PRI序號將一組SAR平臺運動軌跡和對應(yīng)原始回波數(shù)據(jù)讀入GPU顯存,并完成回波數(shù)據(jù)距離脈沖壓縮和頻域插值GPU并行處理;
(3)編寫一個GPU內(nèi)核(Kernel)處理函數(shù),根據(jù)步驟2中PRI時刻雷達(dá)天線位置,計算此PRI時刻天線波束照射初始位置相對于BP算法成像空間初始位置的分辨單元偏差;
(4)在GPU內(nèi)核函數(shù)中利用步驟3得到的分辨單元偏差計算各GPU線程所對應(yīng)的孔徑緩存位置;
(5)采用分辨單元并行方法,利用當(dāng)前PRI脈壓數(shù)據(jù)、平臺運動軌跡和當(dāng)前觀測空間,對孔徑緩存內(nèi)各分辨單元分配GPU線程,完成后向投影處理;
(6)在GPU內(nèi)核函數(shù)中重復(fù)步驟3~5,直到處理完本批次數(shù)據(jù),至此本次GPU內(nèi)核函數(shù)調(diào)用完畢,得到步驟2中本組數(shù)據(jù)觀測空間子圖像;
(7)將步驟6子圖像結(jié)果從GPU孔徑緩存讀入CPU圖像緩存,若此時CPU圖像緩存已滿,則將圖像緩存數(shù)據(jù)寫入硬盤,并將CPU圖像緩存置零;
(8)將下一次調(diào)用GPU核函數(shù)所需要用到的新增GPU孔徑緩存置零;
(9)重復(fù)步驟2~8,直至處理完全部成像區(qū)域空間或PRI回波數(shù)據(jù),最后將所得多個子圖像依次合并,獲得大場景最終成像結(jié)果。
圖像流BP-GPU方法流程框圖如圖4所示,可知其主要包含3個功能模塊,即程序調(diào)度模塊(包含參數(shù)和GPU初始化、軌跡數(shù)據(jù)和原始數(shù)據(jù)配準(zhǔn)、數(shù)據(jù)傳輸?shù)龋?、脈壓及插值模塊、后向投影內(nèi)核模塊。
圖4 圖像流BP-GPU方法流程圖Fig.4 The flowchart of the image streams GPU-BP algorithm
為了驗證本文方法有效性,本文分別利用仿真數(shù)據(jù)和機載SAR實測數(shù)據(jù)進行成像處理,并對比傳統(tǒng)BP-CPU、BP-GPU方法進行分析。在成像中,傳統(tǒng)BP-CPU方法采用雙精度運算,而BP-GPU和圖像流BP-GPU方法均采用單/雙精度聯(lián)合運算。實驗中采用軟硬件環(huán)境如下:系統(tǒng)為Win7-64位;GPU型號為NVIDIA GTX680,顯存容量為4 GB;CPU型號Inter(R)-Corei5,CPU主頻為2.80 GHz,內(nèi)存容量為16 GB;CUDA版本為Toolkits 7.0。
4.1仿真數(shù)據(jù)
仿真實驗中SAR系統(tǒng)主要參數(shù)為:雷達(dá)載頻35 GHz,發(fā)射信號帶寬0.9 GHz,天線方位真實孔徑長度0.3 m,平臺高度6 000 m,信號脈沖寬度2 ms,脈沖重復(fù)頻率3 000 Hz,雷達(dá)入射角45°。為了獲取非線性復(fù)雜平臺軌跡,平臺運動速度服從均值為[0,100,0]m/s、方差為[1,1,4]m/s的隨機分布。原始回波中方位向點數(shù)為8 192,距離向點數(shù)為2 048。
首先,利用點目標(biāo)仿真對比傳統(tǒng)BP-CPU、圖像流BP-GPU方法性能,其中原始場景包含3個點目標(biāo),其在X軸上間距為1 m且散射系數(shù)相同。圖5為點目標(biāo)成像結(jié)果,圖5(a)為點目標(biāo)成像圖像,圖像大小為2 048×2 048且顯示門限為-35 dB;圖5(b)為3個點目標(biāo)沿X軸剖面的幅度。從圖5可知,BP-CPU和圖像流BP-GPU方法在點目標(biāo)二維圖像成像質(zhì)量和峰值旁瓣水平基本相同,在復(fù)雜軌跡下點目標(biāo)良好聚焦,說明圖像流BP-GPU方法可對復(fù)雜軌跡SAR進行高精度成像。
圖5 點目標(biāo)仿真成像結(jié)果Fig.5 The simulation results of point targets
其次,為了不失一般性,利用面目標(biāo)仿真對比傳統(tǒng)BP-CPU、BP-GPU、圖像流BP-GPU方法性能,其中原始場景包含一個圓錐,場景大小為4 096×4 096。圖6(a)~(c)分別為3種方法圓錐目標(biāo)成像結(jié)果,其中圖像大小為4 096×4 096,BPCPU運算時間為44 392.35 s,BP-GPU運算時間為236.73 s,圖像流BP-GPU運算時間為148.22 s。從圖6可知,圖像流BP-GPU方法與BP-CPU、傳統(tǒng)BP-GPU面目標(biāo)成像質(zhì)量差異很小,均實現(xiàn)了圓錐目標(biāo)良好聚焦成像,但圖像流BP-GPU方法較傳統(tǒng)BP-GPU方法提高了成像處理效率。
圖6 面目標(biāo)仿真成像結(jié)果Fig.6 The simulation results of the plane scene
另外,給定回波方位向點數(shù)為8 192、距離向點數(shù)為2 048時,表1給出了不同成像圖像尺寸條件下傳統(tǒng)BP-CPU、BP-GPU、圖像流BP-GPU方法成像處理運行時間。表1中,傳統(tǒng)BP-GPU和圖像流BP -GPU方法中子圖像均設(shè)置為2 048×2 048。當(dāng)成像圖像大于子圖像時,傳統(tǒng)BP-GPU方法采用圖像分塊處理,為了克服子圖像邊緣精度下降其相鄰子圖像在方位向上存在半個子圖像重疊。由表1可知,圖像流BP-GPU運算時間相對于BP-CPU提高了約300倍,如在成像圖像為2 048×2 048時,BP-CPU耗時約11 655 s,而圖像流BP-GPU僅耗時36.54 s。相對于傳統(tǒng)BP-GPU,圖像流BP-GPU在成像圖像不大于子圖像尺寸時運算時間基本相近,但當(dāng)成像圖像大于子圖像尺寸時運算時間優(yōu)勢逐漸增強,如成像圖像為8 192×8 192時圖像流BP-GPU運算時間相對于傳統(tǒng)BP-GPU提高了約2倍,且加速比隨著成像圖像增大而增大。此時,若分辨單元間隔為0.2 m,圖像流BP-GPU對1.5 km×1.5 km觀測場景成像只需幾分鐘,基本實現(xiàn)了SAR大場景高精度快速成像。該仿真結(jié)果驗證了本文圖像流BP-GPU方法的有效性和優(yōu)勢,相對于傳統(tǒng)BP-CPU及BPGPU成像處理,提高了SAR大場景高精度成像運算效率。
表1 3種BP算法成像處理運算時間Tab.1 The imaging operation time of three BP algorithms
4.2機載實測數(shù)據(jù)
本節(jié)利用某機載SAR實測數(shù)據(jù)進行成像處理,該雷達(dá)系統(tǒng)工作于Ka頻段,成像分辨率(方位向×距離向)約為0.15 m×0.15 m,回波數(shù)據(jù)方位向點數(shù)為16 384,距離向點數(shù)為4 096,平臺速度分量如圖7所示,可知機載SAR平臺并非理想線性軌跡。
圖7 機載SAR平臺運動速度Fig.7 The speed of the airborne SAR
圖8為傳統(tǒng)BP-CPU、傳統(tǒng)BP-GPU和圖像流BP-GPU方法成像處理結(jié)果,其中圖像大小為4 096 ×16 384,分辨單元間隔為0.1 m×0.1 m,傳統(tǒng)BPGPU方法和圖像流BP-GPU方法子圖像大小設(shè)置為4 096×4 096。
圖8 復(fù)雜軌跡機載SAR成像結(jié)果Fig.8 The imaging results of the complex trajectory airborne SAR
由圖8可知:在成像質(zhì)量方面,圖像流BP-GPU與BP-CPU和傳統(tǒng)BP-GPU方法成像質(zhì)量相似,對觀測場景中農(nóng)田、道路等目標(biāo)均聚焦良好,說明圖像流BP-GPU與BP-CPU和傳統(tǒng)BP-GPU方法成像精度相當(dāng),可實現(xiàn)復(fù)雜軌跡SAR大場景高精度成像;在成像運算時間方面,傳統(tǒng)BP-CPU方法需762 402 s(約8.8 d),傳統(tǒng)BP-CPU方法需6 284 s(約1.7 h),而圖像流BP-GPU方法僅需2 139 s(約35 min),故在圖像大小為4 096×16 384條件下圖像流BP-GPU運算時間比傳統(tǒng)BP-CPU方法提高約350倍,比傳統(tǒng)BP-GPU方法提高約2.9倍。實測數(shù)據(jù)結(jié)果進一步驗證了圖像流BP-GPU方法在復(fù)雜軌跡SAR成像的有效性,可大大提高SAR大場景高精度成像處理運算效率。
針對傳統(tǒng)BP算法在復(fù)雜運動SAR大場景成像時運算時間多的問題,本文結(jié)合BP算法數(shù)據(jù)處理獨立特性和GPU并行計算能力,提出了一種基于圖像流的SAR大場景BP-GPU成像方法。相對于傳統(tǒng)BP-GPU方法,圖像流處理可以減少數(shù)據(jù)處理冗余,從而提高BP算法并行處理效率。仿真數(shù)據(jù)和機載實測雙基SAR數(shù)據(jù)驗證了本文方法的有效性,說明本文圖像流BP-GPU方法可以實現(xiàn)輔助運動SAR大場景高精度快速成像。本文方法對實際中復(fù)雜軌跡大場景SAR快速成像應(yīng)用具有一定意義。下一步研究方向是對BP算法進程及GPU顯存優(yōu)化分配。
[1] JAKOWATZ C V J,WAHL D E,EICHEL P H,et al. Spotlight-mode synthetic aperture radar:a signal processing approach:a signal processing approach[M].Berlin:Springer Science&Business Media,2012.
[2] MOREIRA A,PRATS-IRAOLA P,YOUNIS M,et al.A tutorial on synthetic aperture radar[J].IEEE Geoscience and Remote Sensing Magazine,2013,1(1):6-43.
[3] 張直中.機載和星載合成孔徑雷達(dá)導(dǎo)論[M].北京:電子工業(yè)出版社,2004.
ZHANG Zhizhong.Introduction to airborne and spaceborne synthetic aperture radar[M].Beijing:Publishing House of Electronics Industry,2004.(in Chinese)
[4] CUMMING I G,WONG F H.Digital processing of synthetic aperture radar data:algorithms and implementation[M].New York:Artech House,2005.
[5] UIANDER L M H,HELLSTEN H,STENSTROM G.Syn-thetic-aperture radar processing using fast factorized back -projection[J].IEEE Transactions on Aerospace and E-lectronic Systems,2003,39(3):760-776.
[6] SANDERS J,KANDROT E.CUDA by example:an introduction to general-purpose GPU programming,portable documents[M].New Jersey:Addison-Wesley Professional,2010.
[7] 趙敬亮,雷萬明,黃銀和.基于GPU的SAR實時并行成像處理[J].信息化研究,2010,36(2):28-30.
ZHAO Jingliang,LEI Wanming,HUANG Yinhe.Real time parallel imaging processing of SAR based on GPU[J].Informatization Research,2010,36(2):28-30.(in Chinese)
[8] 孟大地,胡玉新,丁赤飚.一種基于GPU的SAR高效成像處理算法[J].雷達(dá)學(xué)報,2013(2):210-217.
MENG Dadi,HU Yuxin,DING Chibiao.An efficient algorithm to processing SAR data on GPU[J].Journal of Radars,2013(2):210-217.(in Chinese)
[9] 姜曉龍,王建,宋千,等.基于GPU的后向投影SAR成像算法[J].雷達(dá)科學(xué)與技術(shù),2014(4):350-357.
JIANG Xiaolong,WANG Jian,SONG Qian,et al.Backprojection algorithm for SAR imaging with GPU[J].Radar Science and Technology,2014(4):350-357.(in Chinese)
[10] 班陽陽,張勁東,陳家瑞,等.后向投影成像算法的GPU優(yōu)化方法研究[J].雷達(dá)科學(xué)與技術(shù),2014(6):659-665.
BAN Yangyang,ZHANG Jindong,CHEN Jiarui,et al. GPU optimization method for back projection imaging algorithm[J].Radar Science and Technology,2014(6):659-665.(in Chinese)
[11] ZHANG F,HU C,LI W,et al.Accelerating time-domain SAR raw data simulation for large areas using multi-GPUs[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(9):3956-3966.
[12] 吳錚,張磊,李寧.基于GPU的機載高分SAR運動補償和自聚焦[J].國外電子測量技術(shù),2015(8):94-99.
WU Zheng,ZHANG Lei,LI Ning.Motion compensation and autofocus issues for airborne high resolution SAR based on GPU architecture[J].Foreign Electronic Measurement Technology,2015(8):94-99.(in Chinese)
[13] 田宵駿,梁媚蓉,毛新華.超高分辨率機載SAR成像算法及其GPU實現(xiàn)[J].南京航空航天大學(xué)學(xué)報,2015,47(3):384-391.
TIAN Xiaojun,LIANG Meirong,MAO Xinhua.Imaging algorithm and its implementation on GPU for ultra-high resolution airborne SAR[J].Journal of Nanjing University of Aeronautics and Astronautics,2015,47(3):384-391.(in Chinese)
[14] FASIH A,HARTLEY T.GPU-accelerated synthetic aperture radar backprojection in CUDA[C]//Proceedings of 2010 IEEE Radar Conference.Washington DC:IEEE,2010:1408-1413.
[15] WU Z,LIU Y,ZHANG L,et al.Highly efficient synthetic aperture radar processing systemfor airborne sensors using CPU+GPU architecture[J].Journal of Applied Remote Sensing,2015,9(1):293-297.
[16] 韋順軍,張曉玲,師君,等.同空間后向投影InSAR成像及干涉相位提取方法[J].宇航學(xué)報,2015,36(3):336-343.
WEI Shunjun,ZHANG Xiaoling,SHI Jun,et al.InSAR imaging and interferogram extraction-based the same space back-projection[J].Journal of Astronautics,2015,36(3):336-343.(in Chinese)
韋順軍(1983—),男,廣西柳州人,2006年于電子科技大學(xué)獲電子信息科學(xué)與技術(shù)專業(yè)理學(xué)學(xué)士學(xué)位,2009年和2013年分別于電子科技大學(xué)獲信號與信息處理專業(yè)工學(xué)碩士學(xué)位和博士學(xué)位,現(xiàn)為講師,主要研究方向為雷達(dá)成像技術(shù)、雷達(dá)信號處理等;
WEI Shunjun was born in Liuzhou,Guangxi Zhuangzu Autonomous Region,in 1983.He received the B.S. degree,the M.S.degree and the Ph.D.degree from University of Electronic Science and Technology of China in 2006,2009 and 2013,respectively.He is now a lecturer.His research concerns radar imaging technique and radar signal processing.
Email:weishunjun@uestc.edu.cn
蒲 羚(1991—),男,四川成都人,2014年于電子科技大學(xué)獲工學(xué)學(xué)士學(xué)位,主要研究方向為雷達(dá)成像處理;
PU Ling was born in Chengdu,Sichuan Province,in 1991. He received the B.S.degree from University of Electronic Science and Technology of China in 2016.His research concerns radar imaging processing.
張曉玲(1964—),女,四川成都人,分別于1985年、1988年和2000年獲電子科技大學(xué)工學(xué)學(xué)士學(xué)位、碩士學(xué)位和博士學(xué)位,現(xiàn)為教授、博士生導(dǎo)師,主要研究方向為雷達(dá)成像技術(shù)、雷達(dá)信號處理等;
ZHANG Xiaoling was born in Chengdu,Sichuan Province,in 1964.She received the B.S.degree,the M.S.degree and the Ph.D.degree from University of Electronic Science and Technology of China in 1985,1988 and 2000,respectively.She is now a professor and also the Ph.D.supervisor.Her research concerns radar imaging technique and radar signal processing.
師 君(1979—),男,河南南陽人,分別于2003年、2006年和2009年獲電子科技大學(xué)工學(xué)學(xué)士學(xué)位、碩士學(xué)位和博士學(xué)位,現(xiàn)為副教授、博士生導(dǎo)師,主要研究方向為雷達(dá)成像技術(shù)、雷達(dá)信號處理等。
SHI Jun was born in Nanyang,Henan Province,in 1979.He received the B.S.degree,the M.S.degree and the Ph.D.degree from University of Electronic Science and Technology of China in 2003,2006 and 2009,respectively.He is now an associate professor and also the Ph.D.supervisor.His research concerns radar imaging technique and radar signal processing.
Image Streams GPU-based Back Projection for Complex Trajectory Synthetic Aperture Radar Imaging
WEI Shunjun,PU Ling,ZHANG Xiaoling,SHI Jun
(School of Electronic Engineering,University of Electronic Science and Technology of China,Chengdu 611731,China)
Compared with the frequency domain algorithms based on Fourier transform,back projection(BP)algorithm is more applicable for high-precision synthetic aperture radar(SAR)imaging with complex trajectory because of its time-domain coherent integration point by point.However,BP algorithm has a problem of huge calculation quantity,which restricts its application to fast SAR imaging with large scene and big data.Graphics processing unit(GPU)has a strong ability in floating-point calculation and parallel processing,and provides an effective approach for large-scene fast imaging with BP algorithm.According to GPU parallel processing,this paper proposes a new processing method of large-scene SAR fast imaging with BP algorithm,based on complex motion of image flow.Depending on the character that the image pixels in BP algorithm are processed independently,this method uses the parallelization of image pixels and image-flow processing to design a scheduling scheme between apertures and image caches to improve the imaging efficiency of SAR with large scene and big data.Simulation and airborne experimental results demonstrate the effectiveness of the method,and fast imaging with the large scene of 8 192×8 192 has been realized in the condition of limited GPU memory,and the speed-up ratio can be improved 300 times compared with the traditional CPU single-thread processing.
SAR;complex trajectory;BP algorithm;GPU acceleration;large scene imaging
The National Natural Science Foundation of China(No.61501098);The China Postdoctoral Science Foundation(2015M570778);The Aeronautical Science Foundation of China(No.20142080007)
TN958.3
A
1001-893X(2016)08-0879-08
10.3969/j.issn.1001-893x.2016.08.009
2016-04-06;
2016-05-31
date:2016-04-06;Revised date:2016-05-31
國家自然科學(xué)基金資助項目(61501098);中國博士后科學(xué)基金項目(2015M570778);航空科學(xué)基金與航空電子系統(tǒng)射頻綜合仿真航空科技重點實驗室聯(lián)合資助項目(20142080007)
**通信作者:weishunjun@uestc.edu.cn
weishunjun@uestc.edu.cn
引用格式:韋順軍,蒲羚,張曉玲,等.復(fù)雜軌跡合成孔徑雷達(dá)后向投影算法圖像流GPU成像[J].電訊技術(shù),2016,56(8):879-886.[WEI Shunjun,PU Ling,ZHANG Xiaoling,et al.Image streams GPU-based back projection for complex trajectory synthetic aperture radar imaging[J].Telecommunication Engineering,2016,56(8):879-886.]