亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多核DSP激光成像雷達(dá)數(shù)據(jù)處理系統(tǒng)

        2015-03-23 06:07:34張文廣郭裕蘭滕書(shū)華
        激光與紅外 2015年11期
        關(guān)鍵詞:激光雷達(dá)圖像處理處理器

        張文廣,魯 敏,郭裕蘭,滕書(shū)華,張 軍

        (國(guó)防科技大學(xué)自動(dòng)目標(biāo)識(shí)別重點(diǎn)實(shí)驗(yàn)室,湖南長(zhǎng)沙410073)

        1 引言

        激光雷達(dá)以其獨(dú)特的技術(shù)優(yōu)勢(shì),在航天器對(duì)接、坦克目標(biāo)識(shí)別、地形地貌分析等應(yīng)用領(lǐng)域中均有著廣闊的前景,被世界各主要科技強(qiáng)國(guó)所關(guān)注。20世紀(jì)70年代以來(lái),激光成像雷達(dá)逐步應(yīng)用于軍事、工業(yè)控制、地形測(cè)繪、宇宙飛船導(dǎo)航、港口交通管理以及水下定位等方面[1]。國(guó)內(nèi)對(duì)激光成像雷達(dá)的研究始于20世紀(jì)90年代,雖然對(duì)激光雷達(dá)數(shù)據(jù)處理算法方面的研究較多,但關(guān)于激光雷達(dá)數(shù)據(jù)處理系統(tǒng)的文獻(xiàn)卻依然較少。由于激光雷達(dá)既不同于微波雷達(dá)也有別于可見(jiàn)光,因此其數(shù)據(jù)處理系統(tǒng)也有別于現(xiàn)有的雷達(dá)信息處理機(jī)。基于此,本文設(shè)計(jì)了一套可靠、高效的激光雷達(dá)實(shí)時(shí)圖像處理系統(tǒng)。

        2 系統(tǒng)硬件設(shè)計(jì)

        2.1 信息處理機(jī)結(jié)構(gòu)

        硬件設(shè)計(jì)是激光雷達(dá)圖像信息處理系統(tǒng)的基礎(chǔ)[2]。根據(jù)激光雷達(dá)圖像系統(tǒng)信息處理的需求,對(duì)信息智能處理系統(tǒng)的硬件資源進(jìn)行分析。整個(gè)信息處理系統(tǒng)可分為五個(gè)模塊:數(shù)據(jù)接收模塊、數(shù)據(jù)處理模塊、接口控制模塊、顯示模塊和通信模塊。處理機(jī)硬件框圖如圖1所示。

        圖1 信息處理機(jī)硬件框圖Fig.1 Block diagram for the signal processing hardware

        數(shù)據(jù)接收模塊用于接收激光雷達(dá)獲取的原始距離圖像,在本系統(tǒng)中采用網(wǎng)絡(luò)接口實(shí)現(xiàn)前端與處理模塊的通信。網(wǎng)絡(luò)通信協(xié)議分為T(mén)CP和UDP兩種,為滿(mǎn)足較高的實(shí)時(shí)性要求,系統(tǒng)采用易于實(shí)現(xiàn)的UDP協(xié)議。UDP協(xié)議是面向無(wú)連接通信的協(xié)議,由于沒(méi)有TCP中三次握手的需求,網(wǎng)絡(luò)設(shè)備在通信時(shí),UDP數(shù)據(jù)的優(yōu)先級(jí)高于TCP數(shù)據(jù),因此實(shí)時(shí)性要求高的系統(tǒng)均采用UDP協(xié)議。為保證網(wǎng)口數(shù)據(jù)接收的實(shí)時(shí)性,以太網(wǎng)PHY芯片選用Marvell公司的88E1111芯片,該芯片接口傳輸速率理論上可達(dá)到千兆每秒。

        由于激光雷達(dá)圖像數(shù)據(jù)為浮點(diǎn)型的距離圖像且處理算法中涉及大量的乘法操作,因此數(shù)據(jù)處理模塊選用一片擁有硬件乘法器的八核DSP浮點(diǎn)型芯片TMS320C6678作為主處理器。TMS320C6678有專(zhuān)用64位DDR3接口,最大外掛存儲(chǔ)容量為8G。選用Micron公司的MT41K256M16的DDR3存儲(chǔ)芯片用于存儲(chǔ)圖像數(shù)據(jù),該芯片單片位寬為16位,存儲(chǔ)容量為2G。選用128M的N25Q128 FLASH芯片用于存儲(chǔ)DSP程序。

        核心處理單元FPGA主要實(shí)現(xiàn)圖像數(shù)據(jù)預(yù)處理、接口芯片控制以及與DSP進(jìn)行SRIO和EMIF通信等功能。因此,F(xiàn)PGA選用性?xún)r(jià)比較高的XilinxK7系列XC7K70TFBG676芯片。該型芯片包括10250個(gè)Slices,135個(gè) 36k的 Block RAM,240個(gè) DSP48 Slices,最多400個(gè)I/O,8lane GTX。其最高速度可達(dá) 12.5Gbps/lane。

        對(duì)于圖像處理系統(tǒng),傳統(tǒng)硬件實(shí)現(xiàn)、調(diào)試過(guò)程中,通常對(duì)硬件內(nèi)部圖像處理過(guò)程不可知、系統(tǒng)中間狀態(tài)不能及時(shí)反饋,只有系統(tǒng)處理最終結(jié)果,用戶(hù)只能通過(guò)經(jīng)驗(yàn)對(duì)系統(tǒng)進(jìn)行測(cè)試、修改,這給系統(tǒng)的實(shí)現(xiàn)、維護(hù)等帶來(lái)了極大的不便。為實(shí)現(xiàn)在系統(tǒng)實(shí)現(xiàn)與維護(hù)過(guò)程中的實(shí)時(shí)觀測(cè)和在線(xiàn)調(diào)試,實(shí)時(shí)獲取激光雷達(dá)數(shù)據(jù)處理的中間結(jié)果就顯得尤為重要。本系統(tǒng)采用FPGA控制各接口與PC及主控機(jī)進(jìn)行數(shù)據(jù)通信,并將圖像處理結(jié)果通過(guò)VGA接口分屏顯示在液晶屏幕上。

        綜上,本文采用FPGA+DSP的硬件系統(tǒng)框架,通過(guò)內(nèi)部高速互聯(lián)以及可測(cè)可試的內(nèi)部狀態(tài)顯控方式來(lái)滿(mǎn)足相應(yīng)的數(shù)據(jù)處理需求。

        2.2 信息處理機(jī)特點(diǎn)

        2.2.1 強(qiáng)大的處理能力

        DSP處理器選用TI公司新一代KeyStone架構(gòu)的TMS320C6678芯片。該芯片擁有4M共享內(nèi)存,以及8個(gè)最高可達(dá)1.25GHz的DSP內(nèi)核,每個(gè)內(nèi)核擁有512KB L2內(nèi)存,可在10W功耗下實(shí)現(xiàn)160GFLOP的運(yùn)算。此外,該芯片外部接口豐富,共包含 4xSRIO、16位 EMIF總線(xiàn)、DDR3總線(xiàn)、2路PCIe接口、1路Heyperlink接口以及1路千兆以太網(wǎng)接口。TI公司提供了強(qiáng)大的與DSP結(jié)構(gòu)相適應(yīng)的內(nèi)聯(lián)函數(shù)、匯編指令和大量的開(kāi)發(fā)例程,大大降低了圖像處理系統(tǒng)的開(kāi)發(fā)。

        2.2.2 FPGA+多核 DSP 的并行架構(gòu)

        由于激光三維成像數(shù)據(jù)量大、算法復(fù)雜度高,為實(shí)現(xiàn)高速實(shí)時(shí)的激光雷達(dá)圖像信息智能處理,硬件實(shí)現(xiàn)中運(yùn)用了FPGA+多核DSP的并行架構(gòu)。以FPGA為主要功能芯片的圖像預(yù)處理子系統(tǒng),主要實(shí)現(xiàn)對(duì)高速圖像數(shù)據(jù)的預(yù)處理等功能,同時(shí)承擔(dān)總線(xiàn)控制、幀存控制等任務(wù)?;诙嗪薉SP并行處理結(jié)構(gòu)的圖像信息智能處理子系統(tǒng)主要實(shí)現(xiàn)對(duì)激光雷達(dá)數(shù)據(jù)處理算法的復(fù)雜運(yùn)算功能。此外,多核DSP的并行處理結(jié)構(gòu)通過(guò)總線(xiàn)連接容量較大的DDR3作為全局外部存儲(chǔ)器用于存儲(chǔ)圖像處理過(guò)程中的圖像數(shù)據(jù)。FPGA與DSP之間通過(guò)高速總線(xiàn)進(jìn)行數(shù)據(jù)傳輸,實(shí)現(xiàn)系統(tǒng)的分布式并行運(yùn)算。

        2.2.3 內(nèi)部狀態(tài)顯控及可擴(kuò)展性

        相比于其他傳統(tǒng)的圖像處理系統(tǒng)[3],本系統(tǒng)的一大優(yōu)勢(shì)在于內(nèi)部狀態(tài)顯控模塊。該模塊可將處理的中間結(jié)果和最終結(jié)果通過(guò)分屏方式進(jìn)行顯示,實(shí)現(xiàn)了在系統(tǒng)實(shí)現(xiàn)與維護(hù)過(guò)程中的狀態(tài)實(shí)時(shí)觀測(cè)和在線(xiàn)調(diào)試,大大縮短了算法調(diào)試驗(yàn)證所需的時(shí)間,并且能快速直觀地得到處理結(jié)果。

        其次,無(wú)論是FPGA模塊還是DSP模塊,均能反復(fù)燒寫(xiě)不同的工程,對(duì)軟件稍作修改即能用于二維圖像處理等其他應(yīng)用場(chǎng)合,因此本系統(tǒng)可移植性強(qiáng)。

        3 系統(tǒng)軟件設(shè)計(jì)

        3.1 DSP并行結(jié)構(gòu)設(shè)計(jì)

        在多核DSP開(kāi)發(fā)中,多核并行的架構(gòu)主要分為主輔拓?fù)浣Y(jié)構(gòu)(Master Slave)和數(shù)據(jù)流拓?fù)浣Y(jié)構(gòu)(Data Flow)兩種。本文選用主輔拓?fù)浣Y(jié)構(gòu),由此DSP內(nèi)核將分為主核與輔核兩種,主核起到控制作用,由主核向各輔核發(fā)送核間中斷來(lái)控制輔核的狀態(tài),而輔核之間沒(méi)有任何核間通信,只負(fù)責(zé)計(jì)算任務(wù)。主核(控制核)與輔核的數(shù)據(jù)通信則通過(guò)EDMA與外部存儲(chǔ)器DDR3進(jìn)行數(shù)據(jù)交換來(lái)完成。

        TMS320C6678芯片共有8個(gè)內(nèi)核,不失一般性,本文以4核并行系統(tǒng)設(shè)計(jì)為例進(jìn)行分析。以下圖表中,若無(wú)特別說(shuō)明,均為4核并行系統(tǒng)。本文核間通信結(jié)構(gòu)如圖2所示,核0作為主核,核1至核4作為輔核,主核負(fù)責(zé)與各種接口進(jìn)行數(shù)據(jù)通信以及控制輔核進(jìn)行并行處理,輔核只負(fù)責(zé)算法處理,并將計(jì)算結(jié)果存入DDR3指定的存儲(chǔ)段中。

        圖2 DSP核間數(shù)據(jù)通信框圖Fig.2 Block diagram for the data communication between DSP cores

        核間通信主要分為數(shù)據(jù)通信和狀態(tài)通信。狀態(tài)通信主要用于傳輸狀態(tài)量和控制信息,因此通信時(shí)間短、實(shí)時(shí)性要求高。相比較而言,數(shù)據(jù)通信是大量數(shù)據(jù)的搬移,通信時(shí)間長(zhǎng)、實(shí)時(shí)性要求較低。不論哪種數(shù)據(jù)通信方式,都需要采用相應(yīng)的狀態(tài)機(jī)制進(jìn)行管理,狀態(tài)機(jī)制可以由中斷或者消息產(chǎn)生。由于本系統(tǒng)涉及到大量的圖像處理和數(shù)據(jù)存儲(chǔ),數(shù)據(jù)通信的時(shí)間在很大程度上決定了系統(tǒng)圖像處理的效率。因此,采用何種機(jī)制來(lái)管理核間通信是本系統(tǒng)設(shè)計(jì)的關(guān)鍵。

        3.2 算法流程分析

        目標(biāo)通常被置于一定的背景環(huán)境之中,與背景圖像融為一體[4]。因而,若需對(duì)目標(biāo)進(jìn)行后續(xù)處理(如跟蹤、分類(lèi)、識(shí)別),則不僅需要能檢測(cè)到目標(biāo),同時(shí)還應(yīng)能感知目標(biāo)在環(huán)境中的相對(duì)位置以及目標(biāo)大小等信息。在激光雷達(dá)探測(cè)過(guò)程中,由于視角、背景等原因,目標(biāo)時(shí)常被遮擋,在距離像中可能難以很好地實(shí)現(xiàn)檢測(cè)與分割[5]。如圖3所示,目標(biāo)部分被樹(shù)木遮擋,難以完整地將目標(biāo)與背景分離。

        圖3 目標(biāo)被樹(shù)木遮擋示意圖Fig.3 An illustration of a target under trees

        此時(shí),通過(guò)從距離像中恢復(fù)三維點(diǎn)云場(chǎng)景則能較好地實(shí)現(xiàn)目標(biāo)與背景的分割[6]。由于距離像是三維場(chǎng)景在二維平面的投影像,在某一觀測(cè)視點(diǎn)上目標(biāo)被物體遮擋,則相應(yīng)的成像結(jié)果中目標(biāo)也會(huì)被遮擋[7]。然而,在真實(shí)場(chǎng)景中目標(biāo)實(shí)際與背景是分離的,因此通過(guò)三維點(diǎn)云可以從不同的角度進(jìn)行觀測(cè),從而較好地分離背景與目標(biāo)[8]。

        綜上,本文檢測(cè)算法的具體步驟為:首先對(duì)距離像進(jìn)行去噪、分塊以及轉(zhuǎn)換成點(diǎn)云等預(yù)處理操作,其次進(jìn)行地面估計(jì),然后進(jìn)行高程濾波,最后根據(jù)目標(biāo)大小等先驗(yàn)信息分割出目標(biāo)。算法流程如圖4所示。

        圖4 地面目標(biāo)檢測(cè)算法流程Fig.4 The flow chart for the ground target detection algorithm

        3.3 任務(wù)分配及Semaphore硬件仲裁

        Semaphore[10]模塊是 TI-C6678 的內(nèi)部硬件模塊,完成對(duì)共享資源互斥訪(fǎng)問(wèn)的硬件仲裁,保證同時(shí)刻片上資源只被一個(gè)內(nèi)核訪(fǎng)問(wèn)。Semaphore模塊最多支持64個(gè)獨(dú)立的旗語(yǔ)信號(hào)用于表征資源的訪(fǎng)問(wèn)狀態(tài)。Semaphore模塊提供共享資源申請(qǐng)、釋放和狀態(tài)查看等管理操作庫(kù)函數(shù)。資源申請(qǐng)是獲取資源訪(fǎng)問(wèn)權(quán)的過(guò)程,資源被閘式保護(hù)以保證互斥訪(fǎng)問(wèn)。資源釋放是放棄所有權(quán)的過(guò)程,狀態(tài)查看函數(shù)提供了確認(rèn)資源當(dāng)前狀態(tài)的功能,內(nèi)核一旦放棄資源所有權(quán),再次使用仍需重新申請(qǐng)。Semaphore硬件仲裁模塊實(shí)現(xiàn)了對(duì)資源共享的協(xié)調(diào)化管理,避免多核環(huán)境下可能產(chǎn)生多個(gè)核同時(shí)競(jìng)爭(zhēng)使用共享資源等錯(cuò)誤。其次,該模塊和其他功能模塊有良好的事件交互,增強(qiáng)了多核開(kāi)發(fā)的靈活性。最后,由于硬件信號(hào)量訪(fǎng)問(wèn)時(shí)間幾近零開(kāi)銷(xiāo),因而大大減少了多核調(diào)用資源的延時(shí)等待。

        Semaphore模塊申請(qǐng)資源分為以下三種方式:

        (1)直接申請(qǐng)(Direct request);

        (2)間接申請(qǐng)(Indirect request);

        (3)合并申請(qǐng)(Combined request)。

        本系統(tǒng)采用信號(hào)量直接申請(qǐng)的方式進(jìn)行多核控制。此種方式是獲取資源訪(fǎng)問(wèn)權(quán)的最簡(jiǎn)單方法,申請(qǐng)結(jié)果只有應(yīng)允和否決兩種。申請(qǐng)被應(yīng)允,表明資源當(dāng)前可用,申請(qǐng)內(nèi)核獲得所有權(quán)。否決狀態(tài)說(shuō)明資源被占用,內(nèi)核不能獲得訪(fǎng)問(wèn)權(quán),硬件模塊持續(xù)嘗試直到被應(yīng)允。本系統(tǒng)基于信號(hào)量多核調(diào)度工作流程框圖如圖5所示。如2.1節(jié)所述,本文多核系統(tǒng)采用主輔拓?fù)浣Y(jié)構(gòu),其中0核作為主核負(fù)責(zé)接收數(shù)據(jù)與任務(wù)調(diào)度,1~4核作為輔核進(jìn)行并行處理。

        馬蘭把衣服放在搓衣板上反復(fù)地揉搓著,不大會(huì)兒洗衣盆里就堆起了五顏六色的泡沫。再過(guò)一陣,她的兩只手以及小半截手臂也淹沒(méi)在泡沫里了。好幾次我都想提醒她,你不要再搓了小蘭,再搓下去會(huì)把衣服搓壞的??晌胰套](méi)敢開(kāi)口。當(dāng)我給馬蘭轉(zhuǎn)述那天事情的經(jīng)過(guò)時(shí),她就這樣一直低著頭搓洗衣服,我說(shuō)完半天了,她還沒(méi)有停手的意思。那件衣服被馬蘭搓得撲哧撲哧響,人一樣急促地喘息。

        首先各工作核開(kāi)始進(jìn)行各自的信號(hào)量初始化,釋放信號(hào)量即釋放所占用的資源。主核與輔核不同的是,主核在信號(hào)量初始化時(shí)占用了輔核在處理時(shí)所需的資源并進(jìn)行了一系列的接口初始化,而后等待網(wǎng)口發(fā)數(shù)據(jù)。輔核在信號(hào)量初始化完畢后,開(kāi)始申請(qǐng)各自的信號(hào)量,直到獲得該資源的所有權(quán)時(shí)才開(kāi)始后續(xù)的處理。當(dāng)從網(wǎng)口接收到一幅激光雷達(dá)圖像數(shù)據(jù)時(shí),主核開(kāi)始釋放其所占用的資源,隨即進(jìn)入等待,直到輔核釋放各自的資源時(shí)再處理下一幀激光雷達(dá)圖像。而此時(shí),輔核在主核釋放了資源后,立即獲得各核對(duì)應(yīng)資源的所有權(quán),從而進(jìn)行檢測(cè)算法處理。處理完畢后釋放各自的資源,并將處理結(jié)果存入DDR3內(nèi)。自此,處理機(jī)完成了一幀圖像的處理。

        圖5 基于信號(hào)量的多核交互流程圖Fig.5 Diagram of the multi-core scheduling based on Semaphore

        多核并行系統(tǒng)的處理效率由各核處理時(shí)間的最大值決定[11],也就是說(shuō),如何合理的分配任務(wù)以使各核承載的運(yùn)算量處于同一個(gè)量級(jí)是多核任務(wù)分配的關(guān)鍵。以本系統(tǒng)為例,對(duì)同一個(gè)檢測(cè)算法,處理所需的計(jì)算量與激光雷達(dá)圖像的大小成正比。要想各輔核的計(jì)算量處于同一個(gè)量級(jí)只需將激光雷達(dá)圖像合理地分成多份,各個(gè)輔核只需對(duì)各自對(duì)應(yīng)的圖像區(qū)間進(jìn)行處理即可。然而如果目標(biāo)處于兩個(gè)或多個(gè)圖像區(qū)間的邊界時(shí),目標(biāo)會(huì)被分割開(kāi),因而不利于目標(biāo)檢測(cè)。本文采用適當(dāng)擴(kuò)大各圖像區(qū)間大小的方法,使得各個(gè)區(qū)間有一定的重合部分。由于激光雷達(dá)圖像不同于二維圖像,其圖像中的每個(gè)點(diǎn)之間的距離是物體在真實(shí)世界的實(shí)際距離,因此,可根據(jù)待檢測(cè)目標(biāo)的大小等一系列先驗(yàn)知識(shí)決定重合部分的大小。

        4 實(shí)驗(yàn)結(jié)果

        4.1 系統(tǒng)加速比理論分析

        在多核操作系統(tǒng)上進(jìn)行并行計(jì)算的主要目的是減少整個(gè)計(jì)算過(guò)程中所耗費(fèi)的時(shí)間,為此加速比被提出用于衡量并行系統(tǒng)的加速性能。加速比的定義為在某個(gè)特定的應(yīng)用下,并行執(zhí)行程序相對(duì)于串行執(zhí)行程序在運(yùn)算速度方面提高的倍數(shù)。

        隨著計(jì)算機(jī)技術(shù)的發(fā)展,先后有三個(gè)計(jì)算并行加速比的定律被提出,即Amdahl定律、Gustafson定律以及Sun和Ni定律。由于本文為激光雷達(dá)圖像處理系統(tǒng),對(duì)于同一檢測(cè)算法,計(jì)算負(fù)載是不變的,所以衡量加速比采用適用于固定計(jì)算負(fù)載的Amdahl定律。

        1967年,IBM公司的計(jì)算機(jī)結(jié)構(gòu)師Amdahl在其論文中提出了計(jì)算機(jī)科學(xué)中著名的Amdahl定律[12]。Amdahl定律的出發(fā)點(diǎn)主要基于以下幾點(diǎn):

        (1)對(duì)實(shí)時(shí)性要求很高的處理系統(tǒng),在計(jì)算負(fù)載(計(jì)算量)不變的情況下,可以通過(guò)采用多核處理器,增加并行處理器的數(shù)量的方法來(lái)提高整體計(jì)算速度以達(dá)到實(shí)時(shí)性要求。

        (2)計(jì)算負(fù)載(計(jì)算量)是固定不變的,通過(guò)增加處理器數(shù)目,可以將計(jì)算任務(wù)均勻地分成幾個(gè)子任務(wù),然后分配到各個(gè)處理器并行執(zhí)行。由于每個(gè)處理器的任務(wù)量減小,并行執(zhí)行時(shí)總的時(shí)間縮短,從而達(dá)到了加速計(jì)算的目的。Amdahl推導(dǎo)出的加速公式如下:

        式中,p表示處理器個(gè)數(shù);f為可串行執(zhí)行的負(fù)載占總負(fù)載的比例,加速比用S表示。當(dāng)p→∞ 時(shí),S→1/f。

        上式表明,即使處理器數(shù)目無(wú)限增大,并行系統(tǒng)所能達(dá)到的最大加速比也不超過(guò)1/f。以本系統(tǒng)為例,假如串行執(zhí)行的計(jì)算負(fù)載占整個(gè)負(fù)載的1/4,并行執(zhí)行的計(jì)算負(fù)載占整個(gè)負(fù)載的3/4,則1/f。因此,不論增加多少處理器,它所能達(dá)到的最大加速比為4倍。這是因?yàn)椋绦虻膱?zhí)行時(shí)間等于串行部分執(zhí)行時(shí)間與并行部分執(zhí)行時(shí)間之和。處理器的增加縮短了并行執(zhí)行的時(shí)間,從而減少了整體的執(zhí)行時(shí)間。然而串行執(zhí)行時(shí)間與處理器數(shù)目p無(wú)關(guān),增加處理器的數(shù)量無(wú)法加速串行部分,因此,串行部分執(zhí)行時(shí)間過(guò)長(zhǎng)而導(dǎo)致的處理時(shí)間過(guò)長(zhǎng)問(wèn)題不能通過(guò)增加系統(tǒng)處理器的數(shù)量來(lái)解決。

        4.2 系統(tǒng)加速比性能測(cè)試

        本系統(tǒng)的DSP編譯環(huán)境為CCS5.1,每個(gè)核均工作在1 GHz頻率。本實(shí)驗(yàn)采用面陣激光雷達(dá)仿真軟件獲取1500 m外的地面場(chǎng)景距離圖像。為仿真場(chǎng)景內(nèi)包含樹(shù)木和坦克等目標(biāo),圖像分辨率分別設(shè)置為32×32、64×64、128×128。

        圖6 系統(tǒng)實(shí)物圖Fig.6 A photo of the LiADR data processing system

        系統(tǒng)實(shí)物圖如圖6所示。圖7中的左圖為分辨率為128×128以偽灰度形式表示的原始距離圖像,圖7中的右圖為檢測(cè)到的地面目標(biāo)(即坦克)。

        本文將并行處理系統(tǒng)擴(kuò)展至雙核和六核,利用TI自帶的TSCL計(jì)時(shí)函數(shù)分別對(duì)三種分辨率下的距離圖像進(jìn)行測(cè)試,采用計(jì)時(shí)函數(shù)得到處理一幀圖像所用的DSP時(shí)鐘周期數(shù),并將該時(shí)鐘周期數(shù)除以工作頻率(1 GHz)即可得到處理一幀圖像所消耗的時(shí)間。由于目前國(guó)內(nèi)面陣激光雷達(dá)所能達(dá)到的分辨率為32×32,處理機(jī)四核并行時(shí)處理一幀圖像需要50 ms左右,因此滿(mǎn)足實(shí)時(shí)性要求。

        圖7 分辨率為128×128的激光雷達(dá)距離圖像處理結(jié)果Fig.7 The processing results of 128 ×128 LiDAR range image

        圖8為采用不同的工作核數(shù)處理不同分辨率激光雷達(dá)圖像時(shí)的性能。需要注意的是,由于本系統(tǒng)采用的多核模式是主從模式,主核用于和外部接口通信,只有輔核承擔(dān)算法的運(yùn)算任務(wù),所以圖中的核數(shù)表示的是承擔(dān)算法運(yùn)算的輔核個(gè)數(shù)。其次,本文處理的圖像數(shù)據(jù)均存儲(chǔ)于DDR3中,因此處理速度比存儲(chǔ)于L2或者共享內(nèi)存中要稍慢。

        圖8 多核的性能比較Fig.8 Performance comparison with multiple cores

        從圖8可看出,當(dāng)工作核數(shù)較少時(shí),通過(guò)增加工作核數(shù)(即對(duì)圖像進(jìn)行多次分區(qū)處理)會(huì)大幅減少處理時(shí)間。然而當(dāng)核數(shù)較多時(shí),核數(shù)增加帶來(lái)的加速效益逐步下降。本文所設(shè)計(jì)的處理系統(tǒng)是將圖像分區(qū),每個(gè)區(qū)塊交給單獨(dú)核進(jìn)行處理,即每一個(gè)核對(duì)應(yīng)一個(gè)區(qū)塊的圖像,增加的并行工作的DSP核數(shù),也就是增加圖像分區(qū)后的區(qū)塊數(shù)。由于分區(qū)后的相鄰的區(qū)塊之間重疊部分要大于待檢測(cè)目標(biāo),以及每一區(qū)塊的點(diǎn)數(shù)要足夠多以保證地面擬合的精確度。因此即使分區(qū)的區(qū)塊數(shù)增多,也并不代表每個(gè)區(qū)塊的點(diǎn)云個(gè)數(shù)成比例減少。因此,每個(gè)核分擔(dān)的計(jì)算負(fù)載沒(méi)有成比例的減少。正如圖8的時(shí)間曲線(xiàn)所示,隨著核數(shù)的增加,加速效益逐步減小。

        4.3 系統(tǒng)可擴(kuò)展性分析

        對(duì)本系統(tǒng)稍作修改即可實(shí)現(xiàn)可見(jiàn)光圖像處理,本系統(tǒng)以對(duì)含噪聲圖像進(jìn)行平滑及銳化處理為例演示本系統(tǒng)的良好擴(kuò)展性。測(cè)試圖像采用含椒鹽噪聲的lena圖像以及原始的lena圖像。實(shí)驗(yàn)結(jié)果如圖9所示。

        以上處理均是比較經(jīng)典的濾波處理,圖9中的平滑是以3×3的窗口對(duì)圖像進(jìn)行中值濾波;銳化則是以拉普拉斯算子對(duì)圖像進(jìn)行濾波。以上實(shí)驗(yàn)表明,該系統(tǒng)對(duì)于可見(jiàn)光圖像處理有一定的適應(yīng)性,為后續(xù)實(shí)現(xiàn)可見(jiàn)光與激光融合圖像處理提供了有效途徑。

        圖9 可見(jiàn)光圖像處理結(jié)果Fig.9 Processing results for a visible image

        5 結(jié)論

        DSP+FPGA架構(gòu)已成為大數(shù)據(jù)高速處理系統(tǒng)的典型構(gòu)架,本文采用該構(gòu)架以及DSP多核處理技術(shù),實(shí)現(xiàn)了完整的激光成像雷達(dá)數(shù)據(jù)處理系統(tǒng)設(shè)計(jì)。測(cè)試結(jié)果表明,本文設(shè)計(jì)的系統(tǒng)工作穩(wěn)定、可靠、擴(kuò)展性強(qiáng)且處理一幀圖像僅需50ms,達(dá)到了實(shí)時(shí)性要求。此外,本文還進(jìn)一步分析了多核系統(tǒng)的并行加速比。理論分析和實(shí)驗(yàn)結(jié)果均表明,對(duì)于固定負(fù)載的處理系統(tǒng),單純通過(guò)增加并行核數(shù)來(lái)提高加速比的作用是有限的。當(dāng)增加并行核數(shù)已經(jīng)不能明顯提高計(jì)算速度時(shí),系統(tǒng)應(yīng)從減少每個(gè)核串行執(zhí)行的負(fù)載著手。即通過(guò)算法優(yōu)化及減少核間通信所需的時(shí)間開(kāi)銷(xiāo)來(lái)提高總的運(yùn)算速度。最后,本文還對(duì)該處理系統(tǒng)的可擴(kuò)展性開(kāi)展了一系列的實(shí)驗(yàn)。實(shí)驗(yàn)表明,該系統(tǒng)稍作修改同樣適用于可見(jiàn)光圖像的處理,為激光與紅外融合圖像處理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)提供了重要的參考。

        [1] GUO Yulan,LU Min,TAN Zhiguo,et al.Survey of local feature extraction on rang images[J].Pattern Recognition and Artificial Intelligence,2012,25(5):783-791.(in Chinese)郭裕蘭,魯敏,譚志國(guó),等.距離圖像局部特征提取方法綜述[J].模式識(shí)別與人工智能,2012,25(5):783-791.

        [2] GUO Fumin,DING Mingyue,ZHANG Xuming.Fast image matching based on multi-core DSP[J].International Conference on Intelligent Computation and Bio-Medical Instrumentat-ion(ICBMI),2011:68-70.

        [3] HUANG Zongfu,WANG Weihua,XIONG Yunsheng,et al.Design and implementation of a real-time signal processor for astronomical opto-electronic observation system[J].Infrared and Laser Engineering,2012,41(3):671-675.(in Chinese)黃宗福,王衛(wèi)華,熊運(yùn)生,等.天文光電觀測(cè)系統(tǒng)實(shí)時(shí)信息處理機(jī)的設(shè)計(jì)與實(shí)現(xiàn)[J].紅外與激光工程,2012,41(3):671-675.

        [4] M Himmelsbach,F(xiàn)elix V Hundelshausen,H-J Wuensche.Fast segmentation of 3D point clouds for ground vehicles[C].IEEE Intelligent Vehicles Symposium(IV),2010.USA:Institute of Electrical and Electronics Engineers Inc,2010,560-565.

        [5] Wei Yao,Stefan Hinz,Uwe Stilla.Automa-tic vehicle extraction from airborne LiDAR data of urban areas using Morphological Reconstruction[J].Pattern Recognition Letters,2010,(31):1100-1108.

        [6] Matthias R Schmid,Mirko Maehlisch,Juergen Dickmann,et al.Dynamic level of detail 3D occupancy grids for automotive use[C].IEEE Intelligent Vehicles Symposium(IV).USA:Institute of Electrical and Electronics Engineers Inc,2010:269-274.

        [7] Wei Yao,Uwe Stilla.Comparison of two methods for vehicle extraction from airbor-ne LiDAR data toward motion analysis[J].IEEE Geoscience and Remote Sensing Letters,2011,(8):607-611.

        [8] Yani Ioannou,Babak Taati,Robin Harrap,et al.Difference of Normals as a Multi-scale Operator in Unorganized Point Clouds[J].IEEE Conference on 3D Imaging,Modeling,Processing,Visualization and Transmission(3DIMPVT).USA,2012:501-508.

        [9] Wei Yao,Stefan Hinz,Uwe Stilla.3D object-based classification for vehicle extract-ion from airborne LiDAR data by combining point shape information with spatial edge[C].6th IAPR Workshop PRRS.USA:IEEE,2010,1-4.

        [10] Texas Instruments.KeyStone Architecture Semaphore2 Hardware Module User Guide[M].USA:Texas,2012:10-20.

        [11] Pawel Gepner,Michal F Kowalik.Multi-Core Processors:New Way to Achieve High Systems Performance[C].International Sym-posium on Parallel Computing in Electrical Engineering,2006:9-13.

        [12] Gene M Amdahl.Validity of the Single-processor Approach to Achieving Large Scale Computing Capabilities[C].AFIPS Spring Joint Computer Conference,1967:483-485.

        猜你喜歡
        激光雷達(dá)圖像處理處理器
        手持激光雷達(dá)應(yīng)用解決方案
        法雷奧第二代SCALA?激光雷達(dá)
        基于激光雷達(dá)通信的地面特征識(shí)別技術(shù)
        機(jī)器學(xué)習(xí)在圖像處理中的應(yīng)用
        電子制作(2018年18期)2018-11-14 01:48:20
        基于激光雷達(dá)的多旋翼無(wú)人機(jī)室內(nèi)定位與避障研究
        電子制作(2018年16期)2018-09-26 03:27:00
        模糊圖像處理,刑事偵查利器
        圖像處理技術(shù)的實(shí)戰(zhàn)應(yīng)用
        Imagination的ClearCallTM VoIP應(yīng)用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
        ADI推出新一代SigmaDSP處理器
        呼嚕處理器
        蜜臀av一区二区| 最新69国产精品视频| 亚洲一区二区三区码精品色| 少妇人妻偷人精品视频| 亚洲av无码一区二区三区人| 中文无码av一区二区三区| 亚洲熟女一区二区三区250p| 国产精品又爽又粗又猛又黄| 亚洲男人的天堂色偷偷| 国产精品农村妇女一区二区三区| 日本在线中文字幕一区二区| 国内精品女同一区二区三区| 亚洲精品国产一区二区免费视频| 国语对白精品在线观看| 妃光莉中文字幕一区二区| 国产人妻鲁鲁一区二区| 美女扒开大腿让男人桶| 亚洲av国产av综合av卡| 成人性生交大片免费| 卡一卡二卡三无人区| 超碰97资源站| 国产精品无码成人午夜电影| 中文亚洲av片在线观看不卡| 97成人精品| 2021国内精品久久久久精免费| 国产成人丝袜网站在线看| 亚洲精品中文字幕乱码二区| 日本成人在线不卡一区二区三区| 日韩极品在线观看视频| 在线观看亚洲av每日更新影片 | 蜜桃视频在线观看免费亚洲| 欲香欲色天天天综合和网| 国产精品亚洲lv粉色| 久久精品人人做人人综合| 国产亚洲AV无码一区二区二三区| 国产剧情无码中文字幕在线观看不卡视频 | 两个人看的www中文在线观看| 国产精品亚洲A∨天堂| 久久久精品久久久国产| 久久精品国产字幕高潮| 人妻少妇久久中文字幕一区二区 |