劉靜寒 胡 虹
(中國(guó)電子科技集團(tuán)公司第三十八研究所 合肥 230088)
合成孔徑雷達(dá)[1](synthetic aperture radar,SAR)成像技術(shù),具有全天候、全天時(shí)的工作能力,作用距離遠(yuǎn),抗干擾能力強(qiáng),使其在軍事目標(biāo)探測(cè)和識(shí)別方面發(fā)揮著巨大的作用。SAR和慣導(dǎo)的組合即可用于導(dǎo)彈的末段制導(dǎo),也可為導(dǎo)彈的中段導(dǎo)引控制提供信息。SAR成像過程中,雷達(dá)平臺(tái)與成像區(qū)域的相對(duì)高度是影響斜地幾何校正精度的重要參數(shù),高度誤差會(huì)引起明顯的幾何形變并影響景象匹配過程[2]。彈載雷達(dá)測(cè)得高度值來確定導(dǎo)彈的空間高度,結(jié)合景象匹配提供的導(dǎo)彈平面二維坐標(biāo),來進(jìn)行彈目位置定位完成對(duì)慣導(dǎo)數(shù)據(jù)的修正。因此導(dǎo)引頭系統(tǒng)相對(duì)地面目標(biāo)的精確高度獲取對(duì)導(dǎo)彈中末段制導(dǎo)精度有著重要意義。彈載雷達(dá)受到空間和重量等因素的限制,對(duì)雷達(dá)設(shè)備量的限制極為苛刻,高集成度的雷達(dá)信號(hào)處理系統(tǒng)顯得極為重要。實(shí)際工作中,對(duì)于大帶寬、高精度及高實(shí)時(shí)性的信號(hào)處理系統(tǒng)的需求,基于單核DSP器件已不能滿足其系統(tǒng)性能要求,多核DSP已經(jīng)成為數(shù)字信號(hào)處理發(fā)展的必然選擇?;诿绹?guó)德州儀器(Texas Instrument)推出的TMS320C6678八核DSP平臺(tái),在其KeyStone[3-5]架構(gòu)下,分析和研究了彈下點(diǎn)OCOG測(cè)高算法及其實(shí)現(xiàn)方法,然后對(duì)測(cè)高回波數(shù)據(jù)在多核DSP上進(jìn)行算法實(shí)現(xiàn)以驗(yàn)證算法并行實(shí)現(xiàn)的可行性,最后對(duì)該方法的準(zhǔn)確性和實(shí)時(shí)性進(jìn)行了驗(yàn)證,結(jié)果表明能夠滿足系統(tǒng)指標(biāo)的要求。
彈下點(diǎn)測(cè)高幾何關(guān)系如圖1所示。
圖1 彈下點(diǎn)測(cè)高幾何關(guān)系
導(dǎo)彈沿AC方向飛行,AC方向即合速度方向V方向,天線波束中心指向AO方向,波束中心指向和合速度的夾角為θ。
彈下點(diǎn)測(cè)高采用線性調(diào)頻信號(hào)能夠提高測(cè)高精度并且保證作用距離,發(fā)射信號(hào)模型為
(1)
其中t為快時(shí)間,Tp為脈沖寬度,Kr>0為調(diào)頻率,“rect[·]”為矩形窗函數(shù)
(2)
雷達(dá)接收到彈下點(diǎn)所在距離單元回波之后,將其進(jìn)行混頻和正交相干檢波成為正交雙通道信號(hào),其回波信號(hào)為
(3)
其中,A為與天線增益、地面垂直散射系數(shù)和距離分辨單元面積有關(guān)的常數(shù),c為自由空間中的電磁波傳播速度,R(ta)為ta時(shí)刻雷達(dá)到該點(diǎn)目標(biāo)的高度信息。
雷達(dá)以一定脈沖重復(fù)頻率發(fā)射線性調(diào)頻信號(hào),收到回波后處理流程如圖2所示。
圖2 測(cè)高算法處理流程
1)距離向匹配濾波:距離向參考匹配濾波函數(shù)H(t)為
(4)
2)方位匹配濾波:方位匹配濾波在時(shí)域表達(dá)式為
(5)
其中fdc=2vcosθ/λ為該距離單元對(duì)應(yīng)的多普勒中心頻率,Ka=-2v2sinθ/(λR)為多普勒調(diào)頻率,R為距離單元,fdc,Ka可以從慣導(dǎo)參數(shù)和幾何關(guān)系中進(jìn)行估計(jì)。
3)OCOG法估計(jì)回波半功率點(diǎn):
方位向匹配濾波后提取零頻附近的回波,即圖中O點(diǎn)對(duì)應(yīng)多普勒的回波進(jìn)行前沿估計(jì);其中OCOG回波前沿[6]提取方法為:計(jì)算波束中心點(diǎn)方位波束寬度覆蓋范圍內(nèi)斜距差對(duì)應(yīng)距離窗寬,在重心基礎(chǔ)上向前取該窗寬一半的位置用于計(jì)算實(shí)際斜距。重心計(jì)算公式為
(6)
(7)
其中,G為回波重心,n為采樣點(diǎn)序號(hào),pn為回波信號(hào)幅度,W為等效矩形脈沖寬度;回波前沿半功率點(diǎn)為ΔN=G-W/2,H為估計(jì)高度,Rτ為距離單元長(zhǎng)度,ΔN為回波半功率點(diǎn),Rmin為距離波門。
H=(Rmin+ΔN·Rτ)
(8)
隨著作用距離、分辨率等系統(tǒng)指標(biāo)要求越來越高,系統(tǒng)運(yùn)算量也越來越大,同時(shí)彈上系統(tǒng)受到體積和重量的限制,傳統(tǒng)信號(hào)處理器ADSPTS201已經(jīng)不能滿足系統(tǒng)實(shí)時(shí)性要求,該測(cè)高算法主要采用TI公司提供的多核DSP芯片TMS320C6678實(shí)現(xiàn)。該DSP芯片擁有八核處理器,運(yùn)算能力非常強(qiáng)。
1)一片C6678擁有8個(gè)CPU核,每個(gè)核內(nèi)部有32KB L1D、32KB L1P、512KB L2RAM,共享4MB L3SRAM,每塊板卡外掛4GB DDR3 SDRAM。
2)C6678單片處理能力:內(nèi)核主頻1.25GHz,浮點(diǎn)運(yùn)算能力達(dá)到160GFlops。
3)C6678具有豐富的外設(shè)接口,支持1×、2×、4×模式的SRIO接口,2×模式的PCIe接口,芯片之間通過HyperLink接口互聯(lián),支持千兆以太網(wǎng)GbE等接口,具備大帶寬數(shù)據(jù)傳輸能力[7]。
針對(duì)OCOG測(cè)高算法,硬件單板設(shè)計(jì)如圖3所示,該板卡由兩片TMS320C6678和一片XCVX7690T組成的運(yùn)算處理核心,DSP和FPGA之間通過高速SRIO實(shí)現(xiàn)高速互聯(lián)。
圖3 硬件平臺(tái)架構(gòu)
導(dǎo)彈在飛行過程中速度非???,要求沿航向每25m網(wǎng)格出一次測(cè)高結(jié)果,因此對(duì)系統(tǒng)的實(shí)時(shí)性要求非常高。本系統(tǒng)采用兩塊板卡,四塊DSP 的架構(gòu),每片DSP處理一個(gè)CPI的回波數(shù)據(jù),四片DSP乒乓操作,處理不同CPI的回波數(shù)據(jù)。在一個(gè)CPI內(nèi)方位處理脈沖數(shù)為Azmlength,每片DSP八個(gè)核按照方位脈沖處理數(shù)分配任務(wù),每個(gè)核都處理1/8Azmlength的回波數(shù)據(jù)。
實(shí)時(shí)回波數(shù)據(jù)本身比較大,先存放在DDR3上,再通過EDMA把回波數(shù)據(jù)從DDR3搬到L3上,其他計(jì)算變量和緩沖都放在片內(nèi)的RAM上。
L3有4MB,待處理的回波和一些共用的變量存放在L3地址上,內(nèi)存分配如表1所示。
表1 L3內(nèi)存分配
L2有512KB,主要存儲(chǔ)處理過程中的緩存數(shù)據(jù),由于L2是每個(gè)核獨(dú)有的,每個(gè)L2可以處理一個(gè)方位脈沖的回波數(shù)據(jù),內(nèi)存分配如表2所示。
在本設(shè)計(jì)中,將內(nèi)部的L1存儲(chǔ)器作為Cache使用,用以加速程序執(zhí)行效率,程序和內(nèi)部數(shù)據(jù)緩沖區(qū)放置在每個(gè)核的L2存儲(chǔ)器中,將接收到的回波數(shù)據(jù)按矩陣格式放置在外部存儲(chǔ)器DDR3中。具體處理流程如圖4所示。
圖4 OCOG測(cè)高算法在C6678上處理流程
1)0核通過SRIO接收到一幀回波,進(jìn)行系統(tǒng)參數(shù)解析;
2)0核每次通過EDMA將FPGA通過SRIO發(fā)送過來的回波搬移到DDR3上進(jìn)行存儲(chǔ),同時(shí)進(jìn)行慣導(dǎo)參數(shù)的解析;
3)0核在L3地址上構(gòu)造匹配濾波函數(shù),并通過FFT將匹配濾波函數(shù)從時(shí)域轉(zhuǎn)換到頻域;
4)0核再通過EDMA將DDR3上的回波數(shù)據(jù)搬移到L3地址上,通過將回波數(shù)據(jù)格式轉(zhuǎn)換浮點(diǎn)數(shù)形式的函數(shù)可以將回波從L3地址搬移到L2地址上,此時(shí)八核可以同時(shí)進(jìn)行距離向匹配濾波處理,即每個(gè)核處理一條方位脈沖的回波,回波通過FFT從時(shí)域轉(zhuǎn)到頻域,然后跟匹配函數(shù)相乘再通過IFFT轉(zhuǎn)到時(shí)域,完成匹配濾波;濾波處理完成以后,八核之間進(jìn)行同步操作,八條距離線數(shù)據(jù)通過存儲(chǔ)方案存儲(chǔ)在DDR3矩陣?yán)锩妫?/p>
5)0核在L3地址上構(gòu)造方位向匹配濾波函數(shù),0核從DDR3矩陣中一次讀出八條方位線數(shù)據(jù),八核同時(shí)進(jìn)行解交織操作將方位線數(shù)據(jù)存在L2地址上,然后進(jìn)行方位向匹配濾波;
6)方位向數(shù)據(jù)匹配濾波結(jié)束以后,0核抽取零頻附近的脈沖數(shù)據(jù)進(jìn)行回波前沿估計(jì);
7)0核利用OCOG法估回波的半功率點(diǎn),進(jìn)行高度的解算。
利用某型號(hào)的實(shí)測(cè)數(shù)據(jù)進(jìn)行分析,輸入的距離向點(diǎn)數(shù)為4096點(diǎn),方位向點(diǎn)數(shù)為128點(diǎn);完成方位向匹配濾波后的結(jié)果如圖5所示,零頻的數(shù)據(jù)如圖6所示,測(cè)高結(jié)果的誤差如圖7所示;八核并行處理的情況下,TMS320C6678運(yùn)行頻率為1.25GHz,收數(shù)和距離向脈沖壓縮消耗18447777個(gè)時(shí)鐘周期,測(cè)高模塊消耗1145452個(gè)時(shí)鐘周期,則整個(gè)測(cè)高處理時(shí)間為10.67ms,傳統(tǒng)的ADSPT201處理同樣大小的回波數(shù)據(jù)則需要45.6ms,對(duì)于測(cè)高模式,系統(tǒng)要求每個(gè)CPI處理流程應(yīng)小于20ms,因此本文提出的八核并行處理方法能夠大大節(jié)約時(shí)間滿足實(shí)時(shí)性要求,并且測(cè)高結(jié)果與實(shí)際高度一致。
圖5 實(shí)測(cè)數(shù)據(jù)斜距多普勒?qǐng)D
圖6 零通道的剖面圖
圖7 測(cè)高結(jié)果和實(shí)際高度的差值
本文首先介紹OCOG測(cè)高算法和C6678的基本特征,接著分析OCOG測(cè)高算法的任務(wù)規(guī)劃和具體實(shí)現(xiàn)過程,并給出了DSP處理的流程圖,最后通過實(shí)測(cè)數(shù)據(jù)處理說明,本文提出的OCOG測(cè)高算法并行處理方案的并行處理效率符合期望,能夠滿足系統(tǒng)的指標(biāo)要求。